返回信息流如果我有两个很大的语料库A和B,因为内存问题,我想先用A来训练出一个模型,然后再在这个模型的基础上用B进行训练,这种增量训练的方式怎么在gensim doc2vec下实现呢?或者有什么别的方法可以实现这种paragraph to vector的增量式训练呢?
这是一条镜像帖。来源:北邮人论坛 / python / #16625同步于 2016/11/23
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
【问题】gensim doc2vec如何实现增量训练?
LiuAiting
2016/11/23镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
可以看看gensim.model.Word2Vec类下的train方法。Doc2Vec是继承的Word2Vec,也有train一样的方法,可以看是不是能用来做Doc2Vec的增量训练。Word2Vec下的train是可以做增量训练的,Doc2Vec没有用过。[ema5]
我试了 train方法可以做Doc2Vec的增量训练 thank u!!!!
【 在 l11x0m7 的大作中提到: 】
: 可以看看gensim.model.Word2Vec类下的train方法。Doc2Vec是继承的Word2Vec,也有train一样的方法,可以看是不是能用来做Doc2Vec的增量训练。Word2Vec下的train是可以做增量训练的,Doc2Vec没有用过。
哈哈,有用就好,不用客气[ema3]
【 在 LiuAiting 的大作中提到: 】
: 我试了 train方法可以做Doc2Vec的增量训练 thank u!!!!
想问一下,这个增量学习是只改变已有词的权重吗?比如原本模型中没有A这个词,我继续训练想把A这个词添加进去,看网上说是加不进去。只能更新已有词的权重??不知道是不是这样?