返回信息流从新浪微博上获得了很多tag,已经去重得到很多个中文字符串,如图所示:
这堆数据很分散的。。有没有一个比较好的聚类的方法把它们聚类一下,不需要很精细的粒度。。
开源软件或者算法都可以
多谢多谢
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #11915同步于 2013/11/26
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
中文单词聚类求助
whatsname
2013/11/26镜像同步14 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
帮顶shandong BM
【 在 whatsname (臭臭猫|齐鲁大地|头像搞基党|天佑我邮) 的大作中提到: 】
: 从新浪微博上获得了很多tag,已经去重得到很多个中文字符串,如图所示:
: [upload=1][/upload]
: 这堆数据很分散的。。有没有一个比较好的聚类的方法把它们聚类一下,不需要很精细的粒度。。
: ...................
word2vec试试?
【 在 whatsname 的大作中提到: 】
: 从新浪微博上获得了很多tag,已经去重得到很多个中文字符串,如图所示:
:
: [upload=1][/upload]
: ...................
发自「贵邮」
切词后丢进去
【 在 xiaohao (少年,从良啦~) 的大作中提到: 】
: 没有context,word2vec能训练么?
通过『我邮』发布