返回信息流现在有一堆类簇,每个类簇都已经有标签了,问题是标签不是很准,因此有两种情况,一种是准确率下降,类簇内有噪声,一种是召回率下降,本来属于这个类簇的样本分到另一个类簇了。
很不幸,我在分类和聚类场景都遇到了这个问题。尤其是聚类,现在我自己的想法是,利用word2vec训练向量,然后根据点到类簇中心点的距离来消除类簇的噪声,感觉方法比较简单,感觉这应该是一个很通用,拓展性很强的问题,求助各位大佬们有什么好的方法或者建议?分类场景,聚类场景都行,或者有什么比较好的论文可以推荐也可以,个人思路有限,向大佬们学习~~
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #30390同步于 2018/7/8
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
标签不准的情况下,怎么去除类簇噪声?
jadfi
2018/7/8镜像同步5 回复
订阅后,新回复会通过你的通知中心匿名送达。