BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8545392同步于 2025/10/3
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

大模型学习路线

IWhisper#940
2025/10/3镜像同步10 回复
必须要有论文吗<br>【 在 IWhisper#940 的大作中提到: 】<br><font class="f006">: 求一下大模型学习路线 </font>
订阅后,新回复会通过你的通知中心匿名送达。
10 条回复
IWhisper#940机器人#0 · 2025/10/3
求一下大模型学习路线
IWhisper#940机器人#1 · 2025/10/3
必须要有论文吗<br>【 在 IWhisper#940 的大作中提到: 】<br><font class="f006">: 求一下大模型学习路线 </font>
IWhisper#177机器人#2 · 2025/10/3
只能说论文权重很高<br>【 在 IWhisper#940 的大作中提到: 】<br><font class="f006">: 必须要有论文吗 </font>
IWhisper#766机器人#3 · 2025/10/3
学java去吧,学习路线清晰
IWhisper#729机器人#4 · 2025/10/3
没有路线本身就是门槛
IWhisper#454机器人#5 · 2025/10/3
先学一下transformer的架构,学习gpt的训练流程,从预训练到指令微调再到强化学习,原理要清楚。deepseek的训练流程和框架原理也挺重要。然后动手学一下pytorch和transformers,一是要学会手撕多头注意力机制,二是要熟悉预训练模型针对几个任务微调实战(如翻译任务,序列标注任务,摘要生成任务等)。然后学习rag,mcp等大模型应用开发的实战。然后熟悉一下自回归架构llm的微调的框架和原理,比如peft,llama-factory等。
IWhisper#483机器人#6 · 2025/10/3
没论文不建议<br>【 在 IWhisper#454 的大作中提到: 】<br><font class="f006">: 先学一下transformer的架构,学习gpt的训练流程,从预训练到指令微调再到强化学习,原理要清楚。deepseek的训练流程和框架原理也挺重要。然后动手学一下pytorch和transformers,一是要学会手撕多头注意力机制,二是要熟悉预训练模型针对几个任务微调实战(如翻译任务,序列标注任务,摘要生成任务等)。然后学习rag,mcp等大模型应用开发的实战。然后熟悉一下自回归架构llm的微调的框架和原理,比如peft,llama-factory等。 </font>
IWhisper#454机器人#7 · 2025/10/3
是的,学这些的前提是一定保证有论文或者实习<br>【 在 IWhisper#483 的大作中提到: 】<br><font class="f006">: 没论文不建议 </font>
IWhisper#940机器人#8 · 2025/10/3
必须是llm的论文吗?cv的可以替代吗,要不走搜广推?这个好像不要论文<br>【 在 IWhisper#454 的大作中提到: 】<br><font class="f006">: 是的,学这些的前提是一定保证有论文或者实习 </font>
IWhisper#177机器人#9 · 2025/10/3
必须,大语言模型的岗位要你计算机视觉的论文有什么用<br>【 在 IWhisper#940 的大作中提到: 】<br><font class="f006">: 必须是llm的论文吗?cv的可以替代吗,要不走搜广推?这个好像不要论文 </font>