返回信息流微调就是把别人训练好的大模型拿来,喂自己的数据来实现特定领域的功能。正常从零开始训练一个大模型都是很花时间的。
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7936431同步于 2024/12/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
微调是训练的一种吗?
IWhisper#581
2024/12/22镜像同步7 回复
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
是的,在大模型时代之前是预训练模型的时代,预训练+微调的范式可以满足绝大多数需求,你可以理解为预训练做的就是让模型从海量数据中学到通用能力,微调就是用少量数据去适应特定的任务
微调就是在通用模型的最优解上左右稍稍调整一下参数吗?<br>【 在 IWhisper#902 的大作中提到: 】<br><font class="f006">: 是的,在大模型时代之前是预训练模型的时代,预训练+微调的范式可以满足绝大多数需求,你可以理解为预训练做的就是让模型从海量数据中学到通用能力,微调就是用少量数据去适应特定的任务 </font><br>:
从训练规数据的模上来讲是的,但参数的变化不一定很小<br>【 在 IWhisper#176 的大作中提到: 】<br><font class="f006">: 微调就是在通用模型的最优解上左右稍稍调整一下参数吗? </font>