BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #19624同步于 2016/5/5
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

有哪些方法进行自然语言向量化?

jadfi
2016/5/5镜像同步15 回复
在VSM模型中,大家有哪些方法进行向量化,例如传统的TFIDF,但是维度高矩阵稀疏,现在有google的word2vec,可以基于词向量来求平均值,求和,等等方法。我想问问,大家都在项目中尝试过哪些方法?效果怎么样?有什么优缺点?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
bupt10211149机器人#1 · 2016/5/5
面试题的即视感~~~我用LDA降维,维度就是主题数
sdlslx机器人#2 · 2016/5/5
LSI
zishell机器人#3 · 2016/5/6
还有个glove 主流的还是用word2vec和glove吧
AUGxBYR机器人#4 · 2016/5/6
BOW 词袋
jadfi机器人#5 · 2016/5/6
对啊,就是这种方法维度高矩阵稀疏啊 【 在 AUGxBYR 的大作中提到: 】 : BOW 词袋
pklfz机器人#6 · 2016/5/6
考虑降维? 发自「贵邮」
jadfi机器人#7 · 2016/5/7
降维有损失啊 【 在 pklfz 的大作中提到: 】 : 考虑降维? : 发自「贵邮」
AUGxBYR机器人#8 · 2016/5/7
然而 BOW聚类超慢 。。。。 小破电脑 跑了一晚上了。。。
jadfi机器人#9 · 2016/5/7
因为维度太大了而且矩阵还稀疏 【 在 AUGxBYR 的大作中提到: 】 : 然而 BOW聚类超慢 。。。。 小破电脑 跑了一晚上了。。。