返回信息流本人小白一枚,求助各位大神。
现在要做一个简单的用户聚类分析,变量假设有十维,用来描述用户的喜好。其中某一维为用户查看过的商品类型,是个数组,比如[1,2,3],1代表化妆品,2代表护肤品,3代表体育用品。
了解到一般的聚类方法处理的都是连续变量或者分类变量,对于含有这种数组类型变量的数据怎么进行聚类呢?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #19674同步于 2016/5/10
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【问题】聚类问题,某一维变量如果是数组怎么办?
jiangzhuo11
2016/5/10镜像同步12 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
额,这么说有点看不懂呀,能不能说详细点?
【 在 pklfz 的大作中提到: 】
: 1 = [0 0 1]
: 2 = [0 1 0]
: 3 = [1 0 0]
: ...................
做独热编码,再聚类试试?
【 在 jiangzhuo11 的大作中提到: 】
: 额,这么说有点看不懂呀,能不能说详细点?
: 【 在 pklfz 的大作中提到: 】
: : 1 = [0 0 1]
: : 2 = [0 1 0]
: : 3 = [1 0 0]
:
: .........
发自「贵邮」
这样可能不行啊,因为有的用户可能对3种商品类感兴趣,有的只对2种感兴趣。数组的长度可能就不一样。
【 在 prison 的大作中提到: 】
: 抽出来再多2个维度不行吗
所以写成沙发那种形式啊
【 在 jiangzhuo11 的大作中提到: 】
: 这样可能不行啊,因为有的用户可能对3种商品类感兴趣,有的只对2种感兴趣。数组的长度可能就不一样。
: 【 在 prison 的大作中提到: 】
: : 抽出来再多2个维度不行吗
:
:
发自「贵邮」
o.o不感兴趣不能直接设0吗
【 在 jiangzhuo11 的大作中提到: 】
: 这样可能不行啊,因为有的用户可能对3种商品类感兴趣,有的只对2种感兴趣。数组的长度可能就不一样。