返回信息流哪家
: 难得遇到一个感觉很匹配的强化学习算法岗
: 结果前面都聊的很好
: ............
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7247234同步于 2024/6/4
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
体会到算法的对口了(真难啊
IWhisper#184
2024/6/4镜像同步12 回复
订阅后,新回复会通过你的通知中心匿名送达。
12 条回复
暑期转开发0 offer选手
难得遇到一个感觉很匹配的强化学习算法岗
结果前面都聊的很好
最后因为没有实践过ppo算法被拒[ema12]
虽然最后面试官说不是我的问题,还鼓励了我说履历没什么问题
以及也能理解互联网总是希望招人进去直接干活
但相比于其他岗位被拒,还是有点难受了[ema1]
再次怀疑读研的意义了
以及深刻体会算法岗的对口甚至需要到具体的网络,真难啊[ema7]
同强化学习,甚至已经有一段实习都找不到暑期,人已经麻了
: 难得遇到一个感觉很匹配的强化学习算法岗
: 结果前面都聊的很好
: ............
PPO不得有分布式强化学习框架才好用吗,不然和最普通的AC有啥区别,单个智能体采完一批数据更新就扔掉,重要性采样系数不一直是1吗,得同时多个worker异步采样才有用,国内就没多少课题组有这样的基建
直接用ray框架,神经网络客制化太难用了