返回信息流傻b<img src="/img/ubb/em/4.gif" alt="em4" style="display:inline;border-style:none">
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8775698同步于 2026/3/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
关于加强实验室管理纪律的通知
IWhisper#95
2026/3/19镜像同步99 回复
订阅后,新回复会通过你的通知中心匿名送达。
99 条回复
02 别来 今天刚被gank<br>【 在 IWhisper#336 的大作中提到: 】<br><font class="f006">: 这是ai院01方向的组吗<img src="/img/ubb/em/4.gif" alt="em4" style="display:inline;border-style:none"> </font>
够牛的<br>【 在 IWhisper#95 的大作中提到: 】<br><font class="f006">: 傻b<img src="/img/ubb/em/4.gif" alt="em4" style="display:inline;border-style:none"> </font>
01学硕也有这个组里的几个老师<img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><img src="/img/ubb/ema/1.gif" alt="ema1" style="display:inline;border-style:none"><br>【 在 IWhisper#53 的大作中提到: 】<br><font class="f006">: 02 别来 今天刚被gank </font>
66<br>【 在 IWhisper#759 的大作中提到: 】<br><font class="f006">: 打乒乓球是对的 </font>
我超 盒<img src="/img/ubb/em/24.gif" alt="em24" style="display:inline;border-style:none"><br>【 在 IWhisper#736 的大作中提到: 】<br><font class="f006">: <a target="_blank" href="https://ai.bupt.edu.cn/xygk/zzjg/znxxgcx.htm">https://ai.bupt.edu.cn/xygk/zzjg/znxxgcx.htm</a> </font>
为了维护实验室公平、严谨的学术氛围 改成横向氛围就对了 学术 没怎么看到 北邮都变成横向大学了<span class="emoji" style="font-size: 16px">😂</span>
经典为你好<img src="/img/ubb/em/21.gif" alt="em21" style="display:inline;border-style:none"><br>【 在 IWhisper#423 的大作中提到: 】<br><font class="f006">: “也给学生自身安全管理带来了极大隐患” </font>
最近在学 rl 然后这个组里给我的感觉就是不经过 sft 冷启动 直接使用结果奖励来进行 rl 基座模型不强一直拿不到奖励还一直训练的话 然后模型 confuse 最终熵崩溃 拿到奖励了也是训练效率很低 甚至不如随意的正确的 sft 哦 对了这里是不给算力的 rl 采样很低 所以就是抽奖 没法组内优势偏好学习了 很多现象用 ai 理论来解释竟然意外的合理<br>【 在 IWhisper#234 的大作中提到: 】<br><font class="f006">: 发这个的老师,自己研二的学生都出去实习了,笑嘻了<img src="/img/ubb/ema/4.gif" alt="ema4" style="display:inline;border-style:none"> </font>
说错了 不是 q 老师组的 q 老师还是搞科研的 把学生弄到大厂去实习发论文还是很厉害的 就是邮件不太好评价 自己把学生都送去实习了 要求中心学生不实习 何意味<br>【 在 IWhisper#117 的大作中提到: 】<br><font class="f006">: 最近在学 rl 然后这个组里给我的感觉就是不经过 sft 冷启动 直接使用结果奖励来进行 rl 基座模型不强一直拿不到奖励还一直训练的话 然后模型 confuse 最终熵崩溃 拿到奖励了也是训练效率很低 甚至不如随意的正确的 sft 哦 对了这里是不给算力的 rl 采样很低 所以就是抽奖 没法组内优势偏好学习了 很多现象用 ai 理论来解释竟然意外的合理 </font>