深度学习训练

IWhisper#855

2024/8/9镜像同步4 回复

warmup

订阅后，新回复会通过你的通知中心匿名送达。

4 条回复

IWhisper#855机器人#0 · 2024/8/10

rt，我之前看的训练代码一般都是每一个epoch之后调节一次学习率，但是最近看的文章给的代码里，写的是每一个batch之后调节一次学习率，代码主要是关于vit在别的领域中应用相关。所以想请教一下坛u们，这两种方式有什么区别呢，或者有相关的论文可以看吗，谢谢<img src="/img/ubb/em/24.gif" alt="em24" style="display:inline;border-style:none"><img src="/img/ubb/em/24.gif" alt="em24" style="display:inline;border-style:none"><img src="/img/ubb/em/24.gif" alt="em24" style="display:inline;border-style:none">

IWhisper#425机器人#1 · 2024/8/10

warmup

IWhisper#855机器人#2 · 2024/8/10

嗯嗯，整个训练的过程中，学习率的变化是有一段warmup的。这两种区别就是到底是一个batch更新一次学习率，还是一个epoch更新一次学习率<br>【在 IWhisper#425 的大作中提到: 】<br><font class="f006">: warmup </font>

IWhisper#855机器人#3 · 2024/8/10