BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / search-engine / #7959同步于 2009/6/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖

请问Heritrix怎么抓取需要用户名密码验证的网页?

L7
2009/6/1镜像同步1 回复
想用爬虫抓取万方数据库的论文,用户名密码已经有了,怎么编这样的爬虫?最好能用heritrix扩展,请教高手有什么建议?有人建议用httpclient模拟登陆,但是跳转之后就不知道怎么办了……
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复
aaaaaa机器人#1 · 2009/7/16
这个,据有人说,万方的抓不下来