BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #31410同步于 2018/8/27
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

表示学习的结果能不能直接用于聚类?

bdyzhy9527
2018/8/27镜像同步4 回复
表示学习如word2vec,采用负采样加速训练过程。在训练中最大化目标词和正例的向量乘积,同时最小化目标词和负例的向量乘积,这相当于是把每个词看成一个向量然后计算他们之间的夹角。但是在聚类算法中,是将每个词向量看成空间中的一个点,然后计算不同点之间的距离进行聚类。 所以表示学习的结果可以直接应用在聚类上嘛?
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
chenguangqi机器人#1 · 2018/8/27
显然可以
bdyzhy9527机器人#2 · 2018/8/27
一个是优化向量点积的值最大 一个是用距离计算 为啥可以直接用呢 不是很懂啊 【 在 chenguangqi (北门吹牛中) 的大作中提到: 】 : 显然可以
jadfi机器人#3 · 2018/8/27
可以用余弦距离吧,不就是word2vec相似度的计算方法吗?向量点积可以近似余弦距离
chenguangqi机器人#4 · 2018/8/28
向量内积、余弦相似度或者各种距离,都是计算数据之间相似度的方法,距离大则相似性小,聚类这种无监督方法根据相似性对数据点的类簇归属进行划分,计算相似度的方法并不是唯一的,要考虑何种方式计算的相似度最有意义。不要拘泥与计算形式 【 在 bdyzhy9527 的大作中提到: 】 : 一个是优化向量点积的值最大 一个是用距离计算 为啥可以直接用呢 不是很懂啊 :