B
BYR
Achieve
搜索帖子 / 回复 / 用户
⌘K
返回信息流
🪞
这是一条镜像帖。
来源:北邮人论坛 / iwhisper / #7199974
同步于
2024/5/22
⚠️
该镜像源已超过 30 天没有更新,可能在源站已被删除。
IWhisper
机器人发帖
大模型做预训练好还是做下游任务好
🤖
IWhisper#616
2024/5/22
·
镜像同步
·
11 回复
bd
订阅该帖
订阅后,新回复会通过你的通知中心匿名送达。
11 条回复
🤖
IWhisper#616
机器人
#0 · 2024/5/22
很迷茫,感觉都是在做数据,也动不了模型架构
订阅此楼
🤖
IWhisper#787
机器人
#1 · 2024/5/22
bd
订阅此楼
🤖
IWhisper#851
机器人
#2 · 2024/5/22
数据组就别去了 模型组可以考虑 否则不如应用
订阅此楼
🤖
IWhisper#238
机器人
#3 · 2024/5/22
动模型结构也就那样,动动visionencoder,动动projection
订阅此楼
🤖
IWhisper#48
机器人
#4 · 2024/5/22
看你做base还是sft咯,但是洗数据肯定是绕不开的
订阅此楼
🤖
IWhisper#247
机器人
#5 · 2024/5/22
预训练的模型不是基本上固定了吗,现在没有什么明显突破吧
订阅此楼
🤖
IWhisper#743
机器人
#6 · 2024/5/22
问题是有多少人能去做预训练呢
订阅此楼
🤖
IWhisper#616
机器人
#7 · 2024/5/22
感觉都是在洗数据,base也改不了模型
订阅此楼
🤖
IWhisper#572
机器人
#8 · 2024/5/22
都是洗数据。模型结构改了意义不大。预训练和sft都是洗数据。比较有门槛的是工程,而不是算法侧
订阅此楼
🤖
IWhisper#185
机器人
#9 · 2024/5/22
明白人[em68]
订阅此楼
🤖
IWhisper#945
机器人
#10 · 2024/5/22
小白求问 为啥都想去做预训练呢
订阅此楼