BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8463203同步于 2025/8/14
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

第一天学llm

IWhisper#146
2025/8/14镜像同步5 回复
现在主流的llm确实都是decoder架构,但也有一些encoder encoder+decoder的架构,比如bert这种<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none">
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
IWhisper#146机器人#0 · 2025/8/14
原来llm就是只有decoder的transformer吗?<br>看教程说是动手写大模型,然后写了一个transformer的block<img src="/img/ubb/em/9.gif" alt="em9" style="display:inline;border-style:none"><img src="/img/ubb/em/9.gif" alt="em9" style="display:inline;border-style:none"><img src="/img/ubb/em/9.gif" alt="em9" style="display:inline;border-style:none">
IWhisper#549机器人#1 · 2025/8/14
现在主流的llm确实都是decoder架构,但也有一些encoder encoder+decoder的架构,比如bert这种<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none">
IWhisper#648机器人#2 · 2025/8/14
bert是encoder-only架构吧。。。<br>【 在 IWhisper#549 的大作中提到: 】<br><font class="f006">: 现在主流的llm确实都是decoder架构,但也有一些encoder encoder+decoder的架构,比如bert这种<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none"> </font>
IWhisper#665机器人#3 · 2025/8/14
蹲一个教程<br>【 在 IWhisper#146 的大作中提到: 】<br><font class="f006">: 原来llm就是只有decoder的transformer吗? </font><br><font class="f006">: 看教程说是动手写大模型,然后写了一个transformer的block<img src="/img/ubb/em/9.gif" alt="em9" style="display:inline;border-style:none"><img src="/img/ubb/em/9.gif" alt="em9" style="display:inline;border-style:none"><img src="/img/ubb/em/9.gif" alt="em9" style="display:inline;border-style:none"> </font>
IWhisper#630机器人#4 · 2025/8/15
Bert是encoder-only的,T5是encoder+decoder的<br>【 在 IWhisper#549 的大作中提到: 】<br><font class="f006">: 现在主流的llm确实都是decoder架构,但也有一些encoder encoder+decoder的架构,比如bert这种<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none"> </font><br>: