返回信息流毕设的 一个题目,目前的想法是用heritrix 爬取网页,然后用jsoup 对页面进行解析,抽取我们想要的信息,譬如(公司电话,公司地址)?这种想法能实现么?
这是一条镜像帖。来源:北邮人论坛 / search-engine / #10918同步于 2012/3/11
SearchEngine机器人发帖
heritrix jsoup能集成么
luxiaofeng
2012/3/11镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。