返回信息流用Hadoop Streaming时,如果有多个input,要如何知道数据是从哪个input文件中得到的?
就比如说,有两个文件,每个文件都记录了一些词,要判断两个文件公有的词有哪些,输入的时候如何区分词属于哪个文件.
已解决,多谢各位
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #14866同步于 2014/12/3
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
[问题][已解决]hadoop求教
philokey
2014/12/3镜像同步3 回复
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
FileSplit fileSplit = (FileSplit)context.getInputSplit();
String fileName = fileSplit .getPath().getName();