mapreduce能不能mapper后输出到不同的多个reducer中

chenxiansf

2018/6/7镜像同步13 回复

原始数据是一些日志文件，现在希望按日志中不同字段进行统计，即对应多个不同key的reducer。现在想mapper中过一遍日志后直接投递到不同的reducer中，这个可以搞不？

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

lu1017222931机器人#1 · 2018/6/7

没看懂~ 不同字段？有没有具体实例呀？

Blachat机器人#2 · 2018/6/7

不懂帮顶，不过为啥要这样啊，按字段来确定reducer数目了吗这是

chenxiansf机器人#3 · 2018/6/7

比如日志每一行包含三个字段r1, r2, r3，记录如下 abc, 123, 5wfsxfa 现在希望日志输入到mapper后按r1不同投递到类reducer1中继续处理，按r2不同投递到类reducer2中继续处理。这个可以一次性搞定不【在 lu1017222931 的大作中提到: 】 : 没看懂~ 不同字段？有没有具体实例呀？

chenxiansf机器人#4 · 2018/6/7

没有确定reducer数目啊，我是指不同的reducer类【在 Blachat 的大作中提到: 】 : 不懂帮顶，不过为啥要这样啊，按字段来确定reducer数目了吗这是

Blachat机器人#5 · 2018/6/7

好像懂你意思了，我能想到的是用一个新的reducer类做逻辑跳转，不知道mapper的输出怎么指定reducer文件【在 chenxiansf (影自南飞) 的大作中提到: 】 : 没有确定reducer数目啊，我是指不同的reducer类

chenxiansf机器人#6 · 2018/6/7

是啊，mapper在输出到reducer时用的是context.write()，这个不知道怎么指定到不同的reducer。你说的用新的reducer类做逻辑跳转是什么意思【在 Blachat 的大作中提到: 】 : 好像懂你意思了，我能想到的是用一个新的reducer类做逻辑跳转，不知道mapper的输出怎么指定reducer文件

lu1017222931机器人#7 · 2018/6/7

这个就不是很清楚了，用mapReduce做。用Spark可以做，但是我猜可能会跑成多个job。【在 chenxiansf 的大作中提到: 】 : 比如日志每一行包含三个字段r1, r2, r3，记录如下 : abc, 123, 5wfsxfa : 现在希望日志输入到mapper后按r1不同投递到类reducer1中继续处理，按r2不同投递到类reducer2中继续处理。 : ...................

taiyangdixia机器人#8 · 2018/6/11

1个mapper类 1个reducer类，reducer里面两个处理函数？判断后走函数？通过『我邮2.0』发布

damcy机器人#9 · 2018/6/16

可以在一个reduce里面进行处理，再多路输出到不同的后缀文件中。