返回信息流from sklearn.cluster import KMeans
clf = KMeans(n_clusters=41)
s = clf.fit(weight)
print s
print(clf.cluster_centers_)
print(clf.labels_)
i = 1
while i <= len(clf.labels_):
print i, clf.labels_[i - 1]
i = i + 1
print(clf.inertia_)
用sklearn的k-means函数进行聚类,输出labels的时候每次类的编号值不一样
例如:第一次:
[29 29 21 21 21 21 21 21 21 21 21 21 21 21 25 25 25 25 25 25 25 25 25 25 25
25 25 25 25 25 25 5 5 29 5 29 5 5 10 5 5 5 5 5 5 5 5 5 5 5
5 5 14 14 5 5 5 5 5 5 5 5 5 5 5 5 14 14 14 14 3 14 27 27 6
6 6 6 6 27 6 6 17 27 6 27 27 27 6 27 27 27 6 6 6 6 29 6 6 27
6 27 27 6 27 6 27 17 6 6 6 6 22 22 22 22 22 22 22 22 22 28 28 28 28
28 28 28 28 28 28 16 16 16 16 21 21 4 4 4 4 4 4 4 4 4 4 4 4 4
4 4 4 4 4 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15 15
15 7 7 7 7 7 7 7 26 7 7 26 26 26 7 7 7 26 7 7 26 7 7 7 16
7 7 26 7 7 7 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8
8 16 16 16 16 16 16 16 17 12 1 12 18 18 18 18 18 12 12 18 18 1 18 12 18
18 18 18 18 1 1 12 12 12 17 18 12 12 12 12 12 18 1 18 18 12 17 17 1 18
12 12 12 12 18 12 12 12 12 12 12 21 21 16 16 16 16 16 16 16 16 16 16 16 16
16 30 30 14 30 30 30 14 30 30 14 30 30 30 14 14 14 14 30 30 14 9 3 3 9
9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9
9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 32 0 0 2 2
0 0 0 0 0 0 0 0 0 0 32 32 32 32 0 2 32 2 2 2 32 2 2 32 2
2 32 32 32 0 0 0 0 0 0 2 0 2 2 2 2 2 2 2 2 2 2 2 2 2
2 2 2 2 2 0 0 0 0 0 0 0 0 2 0 16 16 16 2 18 18 0 2 19 19
19 19 19 19 19 19 19 16 16 31 31 31 31 31 31 31 31 31 11 11 11 11 11 11 11
11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11
11 11 11 20 24 24 20 22 22 24 24 24 24 24 24 24 24 24 24 24 24 24 19 23 23
23 23 23 23 23 23 23 23 23 10 20 20 20 10 24 20 20 20 20 20 10 10 13 13 13
29 13 13 13 13 13 13 13 13 29 29 13 13 13 29 13 13 13 29 13 13 13 29 13 13
13 16 16]
数字代表对应的类,第一个文件对应第29类
第二次运行时,这个值会改变,比如
[13 13 21 21 21 21 21 21 21 21 21 21 21 21 11 11 11 11 11 11 11 11 11 11 11
11 11 11 11 11 11 14 14 14 14 14 14 14 6 14 14 14 14 14 14 14 14 14 14 14
14 14 12 12 14 14 14 14 14 14 14 14 14 14 14 14 12 12 12 12 12 12 23 23 23
23 23 23 23 23 23 23 23 23 23 23 23 23 23 23 23 23 15 15 23 23 15 23 15 23
23 23 15 23 23 23 23 23 23 23 23 23 18 18 18 18 18 18 18 18 18 26 26 26 26
26 26 26 26 26 8 10 10 10 10 21 21 27 27 27 27 27 27 27 16 27 27 27 27 27
16 16 16 27 27 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3
3 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20 20
20 20 20 20 20 20 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4
4 10 10 10 10 10 10 10 24 24 24 24 24 24 5 24 5 24 5 5 24 5 5 24 24
5 5 24 5 0 5 5 24 5 5 5 5 5 5 5 5 24 24 5 24 5 24 5 24 24
5 5 5 5 24 24 24 24 1 1 24 21 21 8 30 8 10 8 10 10 10 10 10 10 10
13 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 7 25 25 25 25
25 25 25 25 25 25 8 25 3 8 8 25 8 8 25 8 8 25 8 25 8 25 25 25 25
25 25 25 8 8 25 25 25 8 25 25 8 8 8 25 25 25 8 8 8 19 22 22 2 2
22 22 22 22 22 22 22 22 22 22 19 19 19 19 19 2 19 2 2 2 19 2 2 19 29
29 19 19 19 22 22 22 22 22 22 2 22 2 2 29 2 2 2 2 2 2 2 2 2 2
29 2 2 2 2 22 22 22 22 22 22 22 22 29 28 28 28 28 29 28 28 28 29 31 31
31 31 31 31 31 31 31 8 8 33 33 33 33 33 33 33 33 33 9 9 9 9 9 9 9
9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9 9
9 9 9 30 30 30 30 18 18 6 6 6 6 6 6 6 6 6 6 6 6 6 31 17 17
17 17 17 17 17 17 17 17 17 32 32 32 32 32 6 32 32 32 32 32 32 32 13 13 13
13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13 13
13 33 8]
怎样让每次的输出类的标号从一开始,就像[1,1,2,2,2,2,3,3,3.............]这样,求解决,请吃饭
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #24147同步于 2017/5/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
python sklearn k-mean函数 label值问题
cty8580789
2017/5/19镜像同步13 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
我现在需要让他按照顺序输出,能不能办到,消消气,别打人
【 在 hytcyz (hytcyz) 的大作中提到: 】
: kmeans的k个初始簇心是随机选择的,标签不同很正常,但最后的聚类结果差别非常小。
通过『我邮2.0』发布
我最终的目的是要进行F值得分析,每次输出类的序号不一样,没办法和标准分类进行对比.......
【 在 hytcyz (hytcyz) 的大作中提到: 】
: kmeans的k个初始簇心是随机选择的,标签不同很正常,但最后的聚类结果差别非常小。
通过『我邮2.0』发布