返回信息流有一说一,attention最早不是transformer提出的吧,都是站在巨人的肩膀上
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8714255同步于 2026/1/25
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
今天开始研究transformer
IWhisper#319
2026/1/25镜像同步10 回复
订阅后,新回复会通过你的通知中心匿名送达。
10 条回复
这就跟看魔术表演一样,你看完了揭秘就会觉得很符合直觉,但对着表象让你去想可没那么容易想出来<br>【 在 IWhisper#915 的大作中提到: 】<br><font class="f006">: 不过attension机制其实是很符合直觉的,反而不明白为什么人们发明的这么晚 </font>