返回信息流做信息抽取,用的朴素贝叶斯然后做了一些改进,需要写成分布式的,可是网上的mapreduce的讲解都不是很清楚,只有最简单的那个,但是实际上代码有很多类很多行,我就不是很懂要具体怎么写了。比如说我现在写了很多代码,这些代码怎么写成mapreduce的呢?要整个重新改,还是说只要另外写mapreduce的类,然后类里引用现有的方法就可以呢?朴素贝叶斯的话,网上有说需要多个mapreduce过程的,具体需要一个还是多个呢?哪一块需要用一个呢?完全不懂啊。。。。。代码能力很渣。。。。。求教。。。。。
这是一条镜像帖。来源:北邮人论坛 / java / #28184同步于 2013/12/24
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖
求问java的mapreduce的问题。。。。网上的讲解表示看不懂
shuangyub
2013/12/24镜像同步2 回复
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
用MapReduce实现贝叶斯一个MapReuce作业是实现不了的,要分几个步骤。具体步骤参考 董西成《Hadoop技术内幕:深入解析MapReduce架构设计和实现原理》 P31。 不过只有大致步骤,需要你自己知道基本的MapReduce作业怎么写。分析一个WordCount,对学习MapReduce还是很有帮助的。
谢谢~~主要是好多细节不懂,比如说分几个过程,每一步的输出是键值对还是文件,如果一个计算过程要两个输入怎么办这种的,我找个小程序先写一遍试试吧~~
【 在 IdleMind 的大作中提到: 】
: 用MapReduce实现贝叶斯一个MapReuce作业是实现不了的,要分几个步骤。具体步骤参考 董西成《Hadoop技术内幕:深入解析MapReduce架构设计和实现原理》 P31。 不过只有大致步骤,需要你自己知道基本的MapReduce作业怎么写。分析一个WordCount,对学习MapReduce还是很有帮助的。