BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8718162同步于 2026/1/28
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

agent评测

IWhisper#672
2026/1/28镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
IWhisper#672机器人#0 · 2026/1/28
巨佬们,这个方向怎么样呢<img src="/img/ubb/em/13.gif" alt="em13" style="display:inline;border-style:none">
IWhisper#148机器人#1 · 2026/1/28
IWhisper#455机器人#2 · 2026/1/28
挺好的 26年风口就是agent
IWhisper#587机器人#3 · 2026/1/29
可以的,我实习组做agent的,我看正职大量时间在做测评
IWhisper#303机器人#4 · 2026/1/29
IWhisper#746机器人#5 · 2026/1/29
为什么听着像测试
IWhisper#751机器人#6 · 2026/1/29
得看是否直接参与大模型的训练吧,还是单纯的测试的内容
IWhisper#265机器人#7 · 2026/1/29
是做benchmark吗
IWhisper#207机器人#8 · 2026/1/29
做 bench 感觉很无聊,除非你在很大的厂可能影响力会大一点