返回信息流是吗,我看着怎么提升了
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8229678同步于 2025/4/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
加了注意力机制后和原来一样
IWhisper#720
2025/4/16镜像同步16 回复
订阅后,新回复会通过你的通知中心匿名送达。
16 条回复
哈哈哈哈<br>【 在 IWhisper#686 的大作中提到: 】<br><font class="f006">: 是吗,我看着怎么提升了 </font>
我加了注意力把4090显存干爆了<img src="/img/ubb/em/17.gif" alt="em17" style="display:inline;border-style:none">
硕士不能看着涨吗<br>【 在 IWhisper#324 的大作中提到: 】<br><font class="f006">: 你是本科毕设还是硕士写论文啊,本科的话我看效果是涨了 </font>
同问,加了注意力机制后感力来说模型参数量几乎没变,为什么训练会慢那么多啊<br>【 在 IWhisper#985 的大作中提到: 】<br><font class="f006">: 注意力是不是都特别大啊,一张4090装不下 </font><br>
因为计算复杂度变成n2了啊<br><br>【 在 IWhisper#324 (null) 的大作中提到: 】<br><font class="f006">: 同问,加了注意力机制后感力来说模型参数量几乎没变,为什么训练会慢那么多啊 </font>
计算次数带来的时间消耗是最多的<br><br>【 在 IWhisper#324 (null) 的大作中提到: 】<br><font class="f006">: 同问,加了注意力机制后感力来说模型参数量几乎没变,为什么训练会慢那么多啊 </font>
batch <br><br>【 在 IWhisper#353 (null) 的大作中提到: 】<br><font class="f006">: 我加了注意力把4090显存干爆了<img src="/img/ubb/em/17.gif" alt="em17" style="display:inline;border-style:none"> </font>
参数量肯定会增加啊,想什么呢<br>【 在 IWhisper#324 的大作中提到: 】<br><font class="f006">: 同问,加了注意力机制后感力来说模型参数量几乎没变,为什么训练会慢那么多啊 </font>