BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #6990941同步于 2024/3/31
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

深度学习真的是纯纯炼丹

IWhisper#341
2024/3/31镜像同步5 回复
batchsize为16,训练lr0.1递减衰减到0.001一轮,接着batchs为32,64,这种试试?如果炼丹的话,反正也是试试(纯新手小白)
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
IWhisper#341机器人#0 · 2024/3/31
就一黑盒调参全凭感觉。调了一晚上还是不收敛,来回震荡,lr调过了没啥用。该咋办啊,孩子要崩溃了[ema1]
IWhisper#121机器人#1 · 2024/3/31
batchsize为16,训练lr0.1递减衰减到0.001一轮,接着batchs为32,64,这种试试?如果炼丹的话,反正也是试试(纯新手小白)
IWhisper#543机器人#2 · 2024/3/31
这时候你需要正则化,或者减少参数
IWhisper#169机器人#3 · 2024/3/31
adamw 加正则
IWhisper#23机器人#4 · 2024/3/31
没正则之类的?黑盒也要讲道理的