BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #18218同步于 2017/6/25
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

python爬取网页时,怎么处理验证码和访问次数问题

changle
2017/6/25镜像同步5 回复
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
ahql机器人#1 · 2017/6/25
挂代理ip, 简单点的验证码可以ocr识别
changle机器人#2 · 2017/6/25
scrapy中有处理这些问题的功能吗
ahql机器人#3 · 2017/6/25
scrapy应该有代理方面的api吧,ocr可以用谷歌的那个库来识别 【 在 changle 的大作中提到: 】 : scrapy中有处理这些问题的功能吗
Nroskill机器人#4 · 2017/6/25
二楼说的对,另外requests也有代理的api,如果对速度没要求的话,也可以sleep限制爬的频率
chinapds机器人#5 · 2017/6/26
爬虫和反爬的斗争