BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #19674同步于 2016/5/10
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

【问题】聚类问题,某一维变量如果是数组怎么办?

jiangzhuo11
2016/5/10镜像同步12 回复
本人小白一枚,求助各位大神。 现在要做一个简单的用户聚类分析,变量假设有十维,用来描述用户的喜好。其中某一维为用户查看过的商品类型,是个数组,比如[1,2,3],1代表化妆品,2代表护肤品,3代表体育用品。 了解到一般的聚类方法处理的都是连续变量或者分类变量,对于含有这种数组类型变量的数据怎么进行聚类呢?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
pklfz机器人#1 · 2016/5/10
1 = [0 0 1] 2 = [0 1 0] 3 = [1 0 0] 发自「贵邮」
jiangzhuo11机器人#2 · 2016/5/10
额,这么说有点看不懂呀,能不能说详细点? 【 在 pklfz 的大作中提到: 】 : 1 = [0 0 1] : 2 = [0 1 0] : 3 = [1 0 0] : ...................
prison机器人#3 · 2016/5/10
抽出来再多2个维度不行吗
pklfz机器人#4 · 2016/5/10
做独热编码,再聚类试试? 【 在 jiangzhuo11 的大作中提到: 】 : 额,这么说有点看不懂呀,能不能说详细点? : 【 在 pklfz 的大作中提到: 】 : : 1 = [0 0 1] : : 2 = [0 1 0] : : 3 = [1 0 0] : : ......... 发自「贵邮」
jiangzhuo11机器人#5 · 2016/5/10
好!我去搜搜看! 【 在 pklfz 的大作中提到: 】 : 做独热编码,再聚类试试? : : 发自「贵邮」
jiangzhuo11机器人#6 · 2016/5/10
这样可能不行啊,因为有的用户可能对3种商品类感兴趣,有的只对2种感兴趣。数组的长度可能就不一样。 【 在 prison 的大作中提到: 】 : 抽出来再多2个维度不行吗
zbl807484514机器人#7 · 2016/5/10
所以写成沙发那种形式啊 【 在 jiangzhuo11 的大作中提到: 】 : 这样可能不行啊,因为有的用户可能对3种商品类感兴趣,有的只对2种感兴趣。数组的长度可能就不一样。 : 【 在 prison 的大作中提到: 】 : : 抽出来再多2个维度不行吗 : : 发自「贵邮」
jiangzhuo11机器人#8 · 2016/5/10
噢,貌似懂了! 【 在 zbl807484514 的大作中提到: 】 : 所以写成沙发那种形式啊 : : 发自「贵邮」
prison机器人#9 · 2016/5/10
o.o不感兴趣不能直接设0吗 【 在 jiangzhuo11 的大作中提到: 】 : 这样可能不行啊,因为有的用户可能对3种商品类感兴趣,有的只对2种感兴趣。数组的长度可能就不一样。