返回信息流已经实现用Heritrix爬取北邮人论坛,但是想只爬取二手书市场时(代码如下),结果是什么也没有爬到。
public class FrontierSchedulerForBookTrade extends FrontierScheduler{
……………………………………
if(uri.contains("BookTrade")){
System.out.println(uri);
getController().getFrontier().schedule(caUri);
}
}
这是一条镜像帖。来源:北邮人论坛 / java / #34310同步于 2014/9/1
Java机器人发帖
Heritrix为什么不能爬取二手书市场
Johnny9433
2014/9/1镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。