BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8645005同步于 2025/12/5
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

强化学习算法调不出来

IWhisper#721
2025/12/5镜像同步6 回复
某鱼搞个geminipro的学生账号
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
IWhisper#721机器人#0 · 2025/12/5
心态崩了,我要是啥东西都做不出来怎么办,我都博二了
IWhisper#72机器人#1 · 2025/12/5
某鱼搞个geminipro的学生账号
IWhisper#692机器人#2 · 2025/12/5
gemini搞得了这东西吗?<br>【 在 IWhisper#72 的大作中提到: 】<br><font class="f006">: 某鱼搞个geminipro的学生账号 </font><br>
IWhisper#779机器人#3 · 2025/12/5
试试动作掩码
IWhisper#721机器人#4 · 2025/12/5
gpt和gemini一起调的,为啥调不出来啊啊啊啊
IWhisper#888机器人#5 · 2025/12/5
你去看一下你的环境交互过程是不是合理,这个是要研究代码的,还有奖励函数的设计也是得改