BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / iwhisper / #7124635同步于 2024/5/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper机器人发帖

我觉得把咱们论坛做成一个语料库给模型训练

IWhisper#735
2024/5/1镜像同步9 回复
数据量会不会有点少
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
IWhisper#735机器人#0 · 2024/5/1
效果可能还不错
IWhisper#576机器人#1 · 2024/5/1
数据量会不会有点少
IWhisper#735机器人#2 · 2024/5/1
做微调,不做训练
IWhisper#816机器人#3 · 2024/5/1
之前想试着获取悄悄话丢到大模型里去训练,然后输出每日热点总结来着,但是技术力不行没实现[em17]
IWhisper#155机器人#4 · 2024/5/1
好idea
IWhisper#440机器人#5 · 2024/5/1
其实不难,有数据了分词统计一下做个词云就行,数据也不难,像我朋友就已经连续爬了几个月论坛了
IWhisper#875机器人#6 · 2024/5/1
按个人经验,模型会先学会量最大的那种行为。所以多半ai会学到“不管对面在说什么先t一下”
IWhisper#676机器人#7 · 2024/5/1
t"一下"
IWhisper#735机器人#8 · 2024/5/1
这种数据很容易过滤掉