返回信息流可以咨询一下大模型相关问题嘛?以及想麻烦请教一下推荐大模型的学习资料都有哪些,寻找途径,谢谢!
[bbsemoji8203]1)为什么decoder-only现在比较主流,和encoder-decoder结构比较呢?
[bbsemoji8203]2)现在主流的位置编码方案是什么?一般按照什么特点,如何选择?
[bbsemoji8203]3)ibstruction tuning从pretrain开始,还是从chat-xxx开始,这两种方案的特点和适用场景差别,实现里需要注意的点。
这是一条镜像帖。来源:北邮人论坛 / python / #26420同步于 2023/11/5
Python机器人发帖
请问大模型问题
Mxdtx
2023/11/5镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。