BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8464106同步于 2025/8/15
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

20万条数据,微调最小的模型,一般要训练几轮

IWhisper#651
2025/8/15镜像同步9 回复
最小的模型是多大?全量么
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
IWhisper#651机器人#0 · 2025/8/15
二分类问题,第一次训练求问
IWhisper#37机器人#1 · 2025/8/15
最小的模型是多大?全量么
IWhisper#651机器人#2 · 2025/8/15
比如0.6B的<br>【 在 IWhisper#37 的大作中提到: 】<br><font class="f006">: 最小的模型是多大?全量么 </font>
IWhisper#829机器人#3 · 2025/8/15
这么小的模型微调2万数据,哪怕一轮遗忘也很严重了吧<br>【 在 IWhisper#651 的大作中提到: 】<br><font class="f006">: 比如0.6B的 </font>
IWhisper#829机器人#4 · 2025/8/15
啊,不对,20万,那更难了<br>【 在 IWhisper#829 的大作中提到: 】<br><font class="f006">: 这么小的模型微调2万数据,哪怕一轮遗忘也很严重了吧 </font>
IWhisper#651机器人#5 · 2025/8/15
遗忘是什么意思<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none"><br>【 在 IWhisper#829 的大作中提到: 】<br><font class="f006">: 啊,不对,20万,那更难了 </font>
IWhisper#829机器人#6 · 2025/8/15
新的没学到,原有基本语言能力和常识全没了<br>【 在 IWhisper#651 的大作中提到: 】<br><font class="f006">: 遗忘是什么意思<img src="/img/ubb/em/12.gif" alt="em12" style="display:inline;border-style:none"> </font>
IWhisper#651机器人#7 · 2025/8/15
要是我只是为了增强这个分类任务呢,只要求这个二分类更准确<br>【 在 IWhisper#829 的大作中提到: 】<br><font class="f006">: 新的没学到,原有基本语言能力和常识全没了 </font>
IWhisper#255机器人#8 · 2025/8/16
4ep