BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #32992同步于 2018/12/28
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

Re: 【求助】新闻文本聚类,有偿讲解

poorguy
2018/12/28镜像同步9 回复
陌生人帮顶
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
yo1995机器人#1 · 2018/12/28
mark
it机器人#2 · 2018/12/28
先试试比较直观的方法?vectorize文章(tfidf, doc2vec, topic model)然后对向量聚类?感觉效果应该不会太差 毕竟这些不同角度的文章应该文风用词啥的差挺多的。。
Kerberos机器人#3 · 2018/12/28
上LDA模型提取文章主题 再对主题词或其子集进行聚类
littlebean机器人#4 · 2018/12/29
bd
jihao5116机器人#5 · 2018/12/29
可以对文章进行分词处理,找出频率比较高的词代替文章,然后用work2vec来找相近词,先进而进行聚类
dreaming6机器人#6 · 2018/12/29
谢谢! 【 在 poorguy (穷人) 的大作中提到: 】 : 陌生人帮顶
dreaming6机器人#7 · 2018/12/29
谢谢! 【 在 yo1995 (yo ) 的大作中提到: 】 : mark
dreaming6机器人#8 · 2018/12/29
我先试试,谢谢您了 【 在 it (printfoo) 的大作中提到: 】 : 先试试比较直观的方法?vectorize文章(tfidf, doc2vec, topic model)然后对向量聚类?感觉效果应该不会太差 毕竟这些不同角度的文章应该文风用词啥的差挺多的。。
dreaming6机器人#9 · 2018/12/29
谢谢您,我试试~ 【 在 Kerberos (酹江月人生如梦) 的大作中提到: 】 : 上LDA模型提取文章主题 再对主题词或其子集进行聚类