hadoop-mapreduce求助

2015/4/26镜像同步9 回复

初学hadoop，目前就是会wordcount的水平，看了一篇博文： http://blog.fens.me/hadoop-mapreduce-recommend/ 不是很理解HdfsDAO这个类，可以不用这个直接构建mapreduce程序不

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

agapple机器人#1 · 2015/4/27

进楼学习，有没有大神顺便讲讲mapreduce实现k-means的坑

redlip77rose机器人#2 · 2015/4/27

等大神出现

justbb机器人#3 · 2015/5/1

推荐spark+scala

liuminyt机器人#4 · 2015/5/7

大部分公司还是hadoop 【在 justbb 的大作中提到: 】 : 推荐spark+scala

pain机器人#5 · 2015/5/10

可以不带HdfsDAO, 按原文推断HdfsDAO，不过是HDFS上的一些基本操作的类，提供方法如put上传文件,mkdir新建文件夹这样的方法。写Mapreduce程序只要驱动程序（见run函数中代码）写好、Mapper、Reducer写好就行了

redlip77rose机器人#6 · 2015/5/14

谢谢【在 pain 的大作中提到: 】 : 可以不带HdfsDAO, : 按原文推断HdfsDAO，不过是HDFS上的一些基本操作的类，提供方法如put上传文件,mkdir新建文件夹这样的方法。 : 写Mapreduce程序只要驱动程序（见run函数中代码）写好、Mapper、Reducer写好就行了

redlip77rose机器人#7 · 2015/5/14

又有问题请教，这个文章中的相似度采用一种近似方法，把对两个Item共同评价过的用户人数作为相似度，再计算推荐分数，这个分值已经远远超过了评分范围，如果需要验证推荐结果的话，可以采用哪些指标度量，MAE肯定远远超过一般水准了。。【在 pain 的大作中提到: 】 : 可以不带HdfsDAO, : 按原文推断HdfsDAO，不过是HDFS上的一些基本操作的类，提供方法如put上传文件,mkdir新建文件夹这样的方法。 : 写Mapreduce程序只要驱动程序（见run函数中代码）写好、Mapper、Reducer写好就行了

pain机器人#8 · 2015/5/14

我本身并不做推荐系统，推荐准确度方面的指标除了RMSE平均方差、MAE平均绝对误差，再有就是分类中常用的准确率和召回率感觉这篇文章写的很清楚http://blog.csdn.net/u012078682/article/details/26294233 【在 redlip77rose 的大作中提到: 】 : 又有问题请教，这个文章中的相似度采用一种近似方法，把对两个Item共同评价过的用户人数作为相似度， : 再计算推荐分数，这个分值已经远远超过了评分范围，如果需要验证推荐结果的话，可以采用哪些指标度量，MAE肯定远远超过一般水准了。。

redlip77rose机器人#9 · 2015/5/14

非常感谢【在 pain 的大作中提到: 】 : 我本身并不做推荐系统，推荐准确度方面的指标除了RMSE平均方差、MAE平均绝对误差，再有就是分类中常用的准确率和召回率 : 感觉这篇文章写的很清楚http://blog.csdn.net/u012078682/article/details/26294233