返回信息流最小的模型是多大?全量么
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8464106同步于 2025/8/15
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖
20万条数据,微调最小的模型,一般要训练几轮
IWhisper#651
2025/8/15镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
比如0.6B的<br>【 在 IWhisper#37 的大作中提到: 】<br><font class="f006">: 最小的模型是多大?全量么 </font>
这么小的模型微调2万数据,哪怕一轮遗忘也很严重了吧<br>【 在 IWhisper#651 的大作中提到: 】<br><font class="f006">: 比如0.6B的 </font>
啊,不对,20万,那更难了<br>【 在 IWhisper#829 的大作中提到: 】<br><font class="f006">: 这么小的模型微调2万数据,哪怕一轮遗忘也很严重了吧 </font>
遗忘是什么意思<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none"><br>【 在 IWhisper#829 的大作中提到: 】<br><font class="f006">: 啊,不对,20万,那更难了 </font>
新的没学到,原有基本语言能力和常识全没了<br>【 在 IWhisper#651 的大作中提到: 】<br><font class="f006">: 遗忘是什么意思<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none"> </font>
要是我只是为了增强这个分类任务呢,只要求这个二分类更准确<br>【 在 IWhisper#829 的大作中提到: 】<br><font class="f006">: 新的没学到,原有基本语言能力和常识全没了 </font>