BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #8407472同步于 2025/7/5
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

小登微调大模型求问

IWhisper#411
2025/7/5镜像同步5 回复
一般是推理出了问题
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
IWhisper#411机器人#0 · 2025/7/5
小登学习微调,用lora微调,用的commonsense数据集结果发现模型输出大部分都在胡言乱语,复制问题等等,这种情况是为什么呢
IWhisper#10机器人#1 · 2025/7/5
一般是推理出了问题
IWhisper#198机器人#2 · 2025/7/5
wxj 吗,大概率是过拟合le
IWhisper#411机器人#3 · 2025/7/5
我感觉也是推理参数没配好<br>【 在 IWhisper#10 的大作中提到: 】<br><font class="f006">: 一般是推理出了问题 </font><br>:
IWhisper#411机器人#4 · 2025/7/5
佬是已经做出来了?<br>【 在 IWhisper#198 的大作中提到: 】<br><font class="f006">: wxj 吗,大概率是过拟合le </font><br>: