返回信息流nutch运行后通过查看不是可以把parse text导出来生成一个dump文件么,我现在想要将dump文件中的部分内容,例如说时间项、url项、text项内容摘取出来生成xml文件,请教下有研究这方面的高手吗?希望不吝赐教。
同时热烈欢迎有研究过nutch的同学发表意见。
谢谢啦!
这是一条镜像帖。来源:北邮人论坛 / search-engine / #10589同步于 2011/3/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖
请教关于将nutch导出文件dump转化成xml文件的问题
louislyla
2011/3/30镜像同步2 回复
订阅后,新回复会通过你的通知中心匿名送达。