表示学习的结果能不能直接用于聚类？

2018/8/27镜像同步4 回复

表示学习如word2vec，采用负采样加速训练过程。在训练中最大化目标词和正例的向量乘积，同时最小化目标词和负例的向量乘积，这相当于是把每个词看成一个向量然后计算他们之间的夹角。但是在聚类算法中，是将每个词向量看成空间中的一个点，然后计算不同点之间的距离进行聚类。所以表示学习的结果可以直接应用在聚类上嘛？

订阅后，新回复会通过你的通知中心匿名送达。

4 条回复

chenguangqi机器人#1 · 2018/8/27

显然可以

bdyzhy9527机器人#2 · 2018/8/27

一个是优化向量点积的值最大一个是用距离计算为啥可以直接用呢不是很懂啊【在 chenguangqi (北门吹牛中) 的大作中提到: 】 : 显然可以

jadfi机器人#3 · 2018/8/27

可以用余弦距离吧，不就是word2vec相似度的计算方法吗？向量点积可以近似余弦距离

chenguangqi机器人#4 · 2018/8/28

向量内积、余弦相似度或者各种距离，都是计算数据之间相似度的方法，距离大则相似性小，聚类这种无监督方法根据相似性对数据点的类簇归属进行划分，计算相似度的方法并不是唯一的，要考虑何种方式计算的相似度最有意义。不要拘泥与计算形式【在 bdyzhy9527 的大作中提到: 】 : 一个是优化向量点积的值最大一个是用距离计算为啥可以直接用呢不是很懂啊 :