BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #37134同步于 2020/10/5
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

【问题】有哪些训练句向量的好方法?

finn23
2020/10/5镜像同步7 回复
求助!最近在做文本分类的任务,只不过使用的不是自然语言文本。 目前看了一些文章,由于文本序列一般比较长,常规做法是将长序列文本切成若干个等长的段落,用embedding后的段落和段落token对应的one-hot编码去训练一个encoder-decoder,之后使用训练好的 encoder 对段落进行编码。 求助下各位大佬,除了训练encoder,还有什么好方法可以对一段文本进行向量编码化吗[ema1]
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
yanty0214机器人#1 · 2020/10/5
直接用bert不香吗
finn23机器人#2 · 2020/10/5
实验室就一块在役 2080Ti 【 在 yanty0214 的大作中提到: 】 : 直接用bert不香吗
createMoMo机器人#3 · 2020/10/5
Bert-tiny试试?
createMoMo机器人#4 · 2020/10/5
其实也有一些预训练的 sentence embedding模型要是没记错的话
finn23机器人#5 · 2020/10/5
救救孩子,本质上是把长序列压缩表示,doc2vec和把序列分段送encoder都有人做过了,这可咋找创新点啊[ema1]
yanty0214机器人#6 · 2020/10/5
直接用预训练模型呀 不需要自己训练 【 在 finn23 的大作中提到: 】 : 实验室就一块在役 2080Ti : ............
flasher03机器人#7 · 2020/10/9
skipthought可以吧