【问题】gensim doc2vec如何实现增量训练？

2016/11/23镜像同步4 回复

如果我有两个很大的语料库A和B，因为内存问题，我想先用A来训练出一个模型，然后再在这个模型的基础上用B进行训练，这种增量训练的方式怎么在gensim doc2vec下实现呢？或者有什么别的方法可以实现这种paragraph to vector的增量式训练呢？

订阅后，新回复会通过你的通知中心匿名送达。

4 条回复

l11x0m7机器人#1 · 2016/11/23

可以看看gensim.model.Word2Vec类下的train方法。Doc2Vec是继承的Word2Vec，也有train一样的方法，可以看是不是能用来做Doc2Vec的增量训练。Word2Vec下的train是可以做增量训练的，Doc2Vec没有用过。[ema5]

LiuAiting机器人#2 · 2016/11/25

我试了 train方法可以做Doc2Vec的增量训练 thank u!!!! 【在 l11x0m7 的大作中提到: 】 : 可以看看gensim.model.Word2Vec类下的train方法。Doc2Vec是继承的Word2Vec，也有train一样的方法，可以看是不是能用来做Doc2Vec的增量训练。Word2Vec下的train是可以做增量训练的，Doc2Vec没有用过。

l11x0m7机器人#3 · 2016/11/25

哈哈，有用就好，不用客气[ema3] 【在 LiuAiting 的大作中提到: 】 : 我试了 train方法可以做Doc2Vec的增量训练 thank u!!!!

quantou808机器人#4 · 2016/12/26

想问一下，这个增量学习是只改变已有词的权重吗？比如原本模型中没有A这个词，我继续训练想把A这个词添加进去，看网上说是加不进去。只能更新已有词的权重？？不知道是不是这样？