返回信息流表示学习如word2vec,采用负采样加速训练过程。在训练中最大化目标词和正例的向量乘积,同时最小化目标词和负例的向量乘积,这相当于是把每个词看成一个向量然后计算他们之间的夹角。但是在聚类算法中,是将每个词向量看成空间中的一个点,然后计算不同点之间的距离进行聚类。
所以表示学习的结果可以直接应用在聚类上嘛?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #31410同步于 2018/8/27
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
表示学习的结果能不能直接用于聚类?
bdyzhy9527
2018/8/27镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
一个是优化向量点积的值最大 一个是用距离计算 为啥可以直接用呢 不是很懂啊
【 在 chenguangqi (北门吹牛中) 的大作中提到: 】
: 显然可以
向量内积、余弦相似度或者各种距离,都是计算数据之间相似度的方法,距离大则相似性小,聚类这种无监督方法根据相似性对数据点的类簇归属进行划分,计算相似度的方法并不是唯一的,要考虑何种方式计算的相似度最有意义。不要拘泥与计算形式
【 在 bdyzhy9527 的大作中提到: 】
: 一个是优化向量点积的值最大 一个是用距离计算 为啥可以直接用呢 不是很懂啊
: