返回信息流初学hadoop,目前就是会wordcount的水平,看了一篇博文:
http://blog.fens.me/hadoop-mapreduce-recommend/
不是很理解HdfsDAO这个类,可以不用这个直接构建mapreduce程序不
这是一条镜像帖。来源:北邮人论坛 / java / #40179同步于 2015/4/26
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖
hadoop-mapreduce求助
redlip77rose
2015/4/26镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
可以不带HdfsDAO,
按原文推断HdfsDAO,不过是HDFS上的一些基本操作的类,提供方法如put上传文件,mkdir新建文件夹这样的方法。
写Mapreduce程序只要驱动程序(见run函数中代码)写好、Mapper、Reducer写好就行了
谢谢
【 在 pain 的大作中提到: 】
: 可以不带HdfsDAO,
: 按原文推断HdfsDAO,不过是HDFS上的一些基本操作的类,提供方法如put上传文件,mkdir新建文件夹这样的方法。
: 写Mapreduce程序只要驱动程序(见run函数中代码)写好、Mapper、Reducer写好就行了
又有问题请教,这个文章中的相似度采用一种近似方法,把对两个Item共同评价过的用户人数作为相似度,
再计算推荐分数,这个分值已经远远超过了评分范围,如果需要验证推荐结果的话,可以采用哪些指标度量,MAE肯定远远超过一般水准了。。
【 在 pain 的大作中提到: 】
: 可以不带HdfsDAO,
: 按原文推断HdfsDAO,不过是HDFS上的一些基本操作的类,提供方法如put上传文件,mkdir新建文件夹这样的方法。
: 写Mapreduce程序只要驱动程序(见run函数中代码)写好、Mapper、Reducer写好就行了
我本身并不做推荐系统,推荐准确度方面的指标除了RMSE平均方差、MAE平均绝对误差,再有就是分类中常用的准确率和召回率
感觉这篇文章写的很清楚http://blog.csdn.net/u012078682/article/details/26294233
【 在 redlip77rose 的大作中提到: 】
: 又有问题请教,这个文章中的相似度采用一种近似方法,把对两个Item共同评价过的用户人数作为相似度,
: 再计算推荐分数,这个分值已经远远超过了评分范围,如果需要验证推荐结果的话,可以采用哪些指标度量,MAE肯定远远超过一般水准了。。
非常感谢
【 在 pain 的大作中提到: 】
: 我本身并不做推荐系统,推荐准确度方面的指标除了RMSE平均方差、MAE平均绝对误差,再有就是分类中常用的准确率和召回率
: 感觉这篇文章写的很清楚http://blog.csdn.net/u012078682/article/details/26294233