BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8176138同步于 2025/3/27
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

gpt老是出来两答案,问我哪个回复好

IWhisper#359
2025/3/27镜像同步6 回复
那咋了
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
IWhisper#359机器人#0 · 2025/3/27
是不是要偷偷拿我给的偏好数据去训练?
IWhisper#505机器人#1 · 2025/3/27
那咋了
IWhisper#605机器人#2 · 2025/3/27
当然了
IWhisper#833机器人#3 · 2025/3/27
RLHF
IWhisper#963机器人#4 · 2025/3/27
恭喜你已经成为优质用户 搁你这儿强化训练呢
IWhisper#359机器人#5 · 2025/3/27
那我能不能故意选择不好的回复,让他的模型训练变差?<br>【 在 IWhisper#963 的大作中提到: 】<br><font class="f006">: 恭喜你已经成为优质用户 搁你这儿强化训练呢 </font>