bdyzhy9527@bdyzhy9527
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“因为我的原始语料是没有监督信息的,所以没法直接去调整embedding的维度让loss最小,要是想证明聚类效果只能用pca降维去看,我是这么想的[ema12] 【 在 Vesauza 的大作中提到: 】 : 为啥embedding之后还要再做降维?embedding到合适的维度不是更好?PCA是有信息损失的”
“t-SNE的效果和这个差不多[ema12] 【 在 fuxuemingzhu 的大作中提到: 】 : 你PCA降维到二维了? : 大家对word2vec训练结果的可视化不都是用的t-SNE嘛”
“OK,多谢提供的思路[ema11] 【 在 a940100079 的大作中提到: 】 : pca降维的原理 : W是由数据协方差矩阵前k个最大的特征值对应的特征向量作为列向量构成的。这些特征向量形成一组正交基并且最好地保留了数据中的信息。 : 所以可能造成word2vec的结果恰巧被舍弃掉的虽然不是重要的维度,但是对最…”
“bd”
“bd,可轮到我说这句话了[ema9]”
“666 bd”
“哇,十分感谢,今天没怎么看论坛回复晚了,我认真看看[ema11] 【 在 unimit 的大作中提到: 】 : 如果精确度可以放宽,可以考虑采样,将两个数组采样成为500*500=250000,求top500,先排除(500-23)*(500-23)个数据,剩余23*500*2-23*23大概2万数据,做堆排或者部分快…”
“http://blog.csdn.net/shouwangzhelv/article/details/52944929 列表乘法所生成的大列表中小列表之间的关系是引用 f[0] = [1,2]就可以啦”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。