返回信息流不能重新训练以适应不同的c
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7988457同步于 2025/1/9
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
请教一下各位大佬关于深度学习的一个问题
IWhisper#574
2025/1/9镜像同步10 回复
订阅后,新回复会通过你的通知中心匿名送达。
10 条回复
深度学习中,对于一个输入tensor的shape为[h,w,c],输出为[h,w,1],其中c是变化的,这种功能可以通过什么方法来实现呢<img src="/img/ubb/ema/0.gif" alt="ema0" style="display:inline;border-style:none">
希望是可以学习到的参数,并非是求轮值这种<img src="/img/ubb/em/15.gif" alt="em15" style="display:inline;border-style:none"><br>【 在 IWhisper#574 的大作中提到: 】<br><font class="f006">: 不能重新训练以适应不同的c </font>
均<br>【 在 IWhisper#574 的大作中提到: 】<br><font class="f006">: 希望是可以学习到的参数,并非是求轮值这种<img src="/img/ubb/em/15.gif" alt="em15" style="display:inline;border-style:none"> </font>
可以试试把c放到token length 维度上,变成[c,h*w]<br>【 在 IWhisper#574 的大作中提到: 】<br><font class="f006">: 均 </font>
和[1,hw]算crossattention<br>【 在 IWhisper#151 的大作中提到: 】<br><font class="f006">: 可以试试把c放到token length 维度上,变成[c,h*w] </font>