BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #7641同步于 2010/12/24
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

请教高维聚类的问题~

xibeijiji
2010/12/24镜像同步4 回复
大家好 现在有个问题非常棘手,我原来没有做过高维数据的处理,不知道该怎么做,请大牛们指导~ 我现在有一批样本数据,要进行聚类,每个样本为5000多维,大概有2万多条。 然后归一化为5000多维的矩阵,值分别是每一维的权重。 现在要对这批样本进行聚类。我试过kmeans了,因为维数太高,然后数据又比较稀疏,所以基本聚不出来结果,都聚到一类去了。 然后我查了一些专门的高维聚类的算法,网上找不到开源的代码。 这种情况要研究降维么?有什么好的方法么?急啊!!
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
xieys机器人#1 · 2010/12/24
呵呵,这个维度不算高啊,你可以用cluto试试 【 在 xibeijiji 的大作中提到: 】 : 大家好 : 现在有个问题非常棘手,我原来没有做过高维数据的处理,不知道该怎么做,请大牛们指导~ : 我现在有一批样本数据,要进行聚类,每个样本为5000多维,大概有2万多条。 : ...................
jasonchi机器人#2 · 2010/12/25
【 在 xieys 的大作中提到: 】 : 呵呵,这个维度不算高啊,你可以用cluto试试 : 【 在 xibeijiji 的大作中提到: 】 : : 大家好 : ................... 大哥,这个维度还不高,在这个维度10000个点什么相似性都不对,感觉这个问题有face recogntion的问题相关。。
liyus机器人#3 · 2010/12/25
5000也不算高啦
xibeijiji机器人#4 · 2010/12/28
cluto试过了,可以聚类。多谢!~