返回信息流数据挖掘24k纯小白一枚,研究生毕设题目是《基于网络日志的用户行为分析》,看了一些论文,发现大家做的大都是预处理和统计方面的工作,挖掘算法常用的是聚类。也有写序列模式挖掘的,但是感觉算法部分和应用场景完全不在一个频道啊。
想请教各种大神,基于日志还能分析点啥?用哪些基础的挖掘算法?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #18219同步于 2016/1/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
[求助]“基于网络日志的用户行为分析”可以分析点啥?
zx711
2016/1/19镜像同步17 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
如果日志数据很全的话,可以进行用户画像(预测性别,预测年龄段,统计上下班时间段,空闲时间段,兴趣特征(书,音乐,电影,运动,饮食),专业背景,收入水平等等)。如果以上都做得比较好了,那可以做推荐,例如书,音乐,电影,运动器材,美食商户,公开课或讲座等等。当然以上是我自己YY的
确实是,看到有论文把用户在线时间做了聚类,也是醉了。推荐算法的话,比较大的问题是没有数据集啊,movielens都被用烂了。
【 在 icybee 的大作中提到: 】
: 推荐算法,摸摸头,聚类都被某些实验室用烂了,什么问题上来先聚个类,没有调研没有评估,为大数据而大数据
谢谢你~看了你的回复有启发。请问有没有好的日志数据集推荐?
【 在 LJ10211289 的大作中提到: 】
: 如果日志数据很全的话,可以进行用户画像(预测性别,预测年龄段,统计上下班时间段,空闲时间段,兴趣特征(书,音乐,电影,运动,饮食),专业背景,收入水平等等)。如果以上都做得比较好了,那可以做推荐,例如书,音乐,电影,运动器材,美食商户,公开课或讲座等等。当然以上是我自己YY的
阿里天池里全是数据,我还奇怪了这么多真实数据居然不收费
【 在 zx711 的大作中提到: 】
: 确实是,看到有论文把用户在线时间做了聚类,也是醉了。推荐算法的话,比较大的问题是没有数据集啊,movielens都被用烂了。