返回信息流举个例子,做文本分类任务的时候,输入是文本,最后得到的是分类
中间实际是一个语言模型+一个特征划分的层(也可能是几层),去得到分类
model = hub.Module(name='ernie_tiny', task='seq-cls', num_classes=2)
我表示直接调用paddlehub现成代码的时候,微调调的是后面这个特征划分的层,还是连着语言模型的权重一起调了?我个人理解是后者,想确定一下。
还是说都可以,想调哪调哪,有设置的地,求推个讲这个的博文。
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #39301同步于 2024/12/27
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
(paddlehub)请问模型微调进行下游任务的时候微调的是啥?
jing369
2024/12/27镜像同步6 回复
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
ernie是在加载不了,bert加载成了,所以问bert吧。
paddlehub停止更新了是吗?各种不兼容的问题啊。。。
【 在 paopjian1 的大作中提到: 】
: 旧版的ernie还是bert技术,微调主要是训练权重重调加输出类数量修改
paddle版本乱了,你查下他对应功能版本的最老版本应该能运行
【 在 jing369 的大作中提到: 】
: ernie是在加载不了,bert加载成了,所以问bert吧。
: paddlehub停止更新了是吗?各种不兼容的问题啊。。。
我的理解是训练比较靠后的层。我的理解是,靠前的层,主要用来做特征提取,后面的层做概论分类。但是微调也会修改靠前的层,导致其他类型问题正确率下降。我建了个群,欢迎加群讨论。
求群~
【 在 hitch 的大作中提到: 】
: 我的理解是训练比较靠后的层。我的理解是,靠前的层,主要用来做特征提取,后面的层做概论分类。但是微调也会修改靠前的层,导致其他类型问题正确率下降。我建了个群,欢迎加群讨论。