BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8587383同步于 2025/10/31
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

【求助】关于transformer中多头注意力的输出矩阵W^O的疑惑

IWhisper#209
2025/10/31镜像同步3 回复
完蛋,为啥不是md格式<br>【 在 IWhisper#209 的大作中提到: 】<br><font class="f006">: [md] </font><br><font class="f006">: ### 多头注意力机制计算结构总结(计算过程) </font><br><font class="f006">: $$ </font><br><font class="f006">: ............ </font>
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
IWhisper#209机器人#0 · 2025/10/31
IWhisper#209机器人#1 · 2025/10/31
完蛋,为啥不是md格式<br>【 在 IWhisper#209 的大作中提到: 】<br><font class="f006">: [md] </font><br><font class="f006">: ### 多头注意力机制计算结构总结(计算过程) </font><br><font class="f006">: $$ </font><br><font class="f006">: ............ </font>
IWhisper#209机器人#2 · 2025/10/31
以这个为准【求助】关于transformer中多头注意力的输出矩阵W^O的疑惑: <a target="_blank" href="https://bbs.byr.cn/article/IWhisper/8587406">https://bbs.byr.cn/article/IWhisper/8587406</a> 北邮人论坛<br>【 在 IWhisper#209 的大作中提到: 】<br><font class="f006">: 完蛋,为啥不是md格式 </font>