BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #18219同步于 2016/1/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

[求助]“基于网络日志的用户行为分析”可以分析点啥?

zx711
2016/1/19镜像同步17 回复
数据挖掘24k纯小白一枚,研究生毕设题目是《基于网络日志的用户行为分析》,看了一些论文,发现大家做的大都是预处理和统计方面的工作,挖掘算法常用的是聚类。也有写序列模式挖掘的,但是感觉算法部分和应用场景完全不在一个频道啊。 想请教各种大神,基于日志还能分析点啥?用哪些基础的挖掘算法?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
icybee机器人#1 · 2016/1/19
推荐算法,摸摸头,聚类都被某些实验室用烂了,什么问题上来先聚个类,没有调研没有评估,为大数据而大数据
justbb机器人#2 · 2016/1/20
这个的确没啥可以做的了额。试试推荐吧,再加点并行?
LJ10211289机器人#3 · 2016/1/20
如果日志数据很全的话,可以进行用户画像(预测性别,预测年龄段,统计上下班时间段,空闲时间段,兴趣特征(书,音乐,电影,运动,饮食),专业背景,收入水平等等)。如果以上都做得比较好了,那可以做推荐,例如书,音乐,电影,运动器材,美食商户,公开课或讲座等等。当然以上是我自己YY的
zx711机器人#4 · 2016/1/20
确实是,看到有论文把用户在线时间做了聚类,也是醉了。推荐算法的话,比较大的问题是没有数据集啊,movielens都被用烂了。 【 在 icybee 的大作中提到: 】 : 推荐算法,摸摸头,聚类都被某些实验室用烂了,什么问题上来先聚个类,没有调研没有评估,为大数据而大数据
zx711机器人#5 · 2016/1/20
谢谢你~看了你的回复有启发。请问有没有好的日志数据集推荐? 【 在 LJ10211289 的大作中提到: 】 : 如果日志数据很全的话,可以进行用户画像(预测性别,预测年龄段,统计上下班时间段,空闲时间段,兴趣特征(书,音乐,电影,运动,饮食),专业背景,收入水平等等)。如果以上都做得比较好了,那可以做推荐,例如书,音乐,电影,运动器材,美食商户,公开课或讲座等等。当然以上是我自己YY的
zx711机器人#6 · 2016/1/20
并行就是基于spark和storm做的吗? 【 在 justbb 的大作中提到: 】 : 这个的确没啥可以做的了额。试试推荐吧,再加点并行?
icybee机器人#7 · 2016/1/20
阿里天池里全是数据,我还奇怪了这么多真实数据居然不收费 【 在 zx711 的大作中提到: 】 : 确实是,看到有论文把用户在线时间做了聚类,也是醉了。推荐算法的话,比较大的问题是没有数据集啊,movielens都被用烂了。
LJ10211289机器人#8 · 2016/1/20
[ema17]我还以为你已经有数据了呢 【 在 zx711 的大作中提到: 】 : 谢谢你~看了你的回复有启发。请问有没有好的日志数据集推荐?
zx711机器人#9 · 2016/1/20
哇塞,感谢感谢 【 在 icybee 的大作中提到: 】 : 阿里天池里全是数据,我还奇怪了这么多真实数据居然不收费