返回信息流大家好
现在有个问题非常棘手,我原来没有做过高维数据的处理,不知道该怎么做,请大牛们指导~
我现在有一批样本数据,要进行聚类,每个样本为5000多维,大概有2万多条。
然后归一化为5000多维的矩阵,值分别是每一维的权重。
现在要对这批样本进行聚类。我试过kmeans了,因为维数太高,然后数据又比较稀疏,所以基本聚不出来结果,都聚到一类去了。
然后我查了一些专门的高维聚类的算法,网上找不到开源的代码。
这种情况要研究降维么?有什么好的方法么?急啊!!
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #7641同步于 2010/12/24
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
请教高维聚类的问题~
xibeijiji
2010/12/24镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
呵呵,这个维度不算高啊,你可以用cluto试试
【 在 xibeijiji 的大作中提到: 】
: 大家好
: 现在有个问题非常棘手,我原来没有做过高维数据的处理,不知道该怎么做,请大牛们指导~
: 我现在有一批样本数据,要进行聚类,每个样本为5000多维,大概有2万多条。
: ...................
【 在 xieys 的大作中提到: 】
: 呵呵,这个维度不算高啊,你可以用cluto试试
: 【 在 xibeijiji 的大作中提到: 】
: : 大家好
: ...................
大哥,这个维度还不高,在这个维度10000个点什么相似性都不对,感觉这个问题有face recogntion的问题相关。。