python爬取网页时，怎么处理验证码和访问次数问题

2017/6/25镜像同步5 回复

订阅后，新回复会通过你的通知中心匿名送达。

5 条回复

ahql机器人#1 · 2017/6/25

挂代理ip，简单点的验证码可以ocr识别

changle机器人#2 · 2017/6/25

scrapy中有处理这些问题的功能吗

ahql机器人#3 · 2017/6/25

scrapy应该有代理方面的api吧，ocr可以用谷歌的那个库来识别【在 changle 的大作中提到: 】 : scrapy中有处理这些问题的功能吗

Nroskill机器人#4 · 2017/6/25

二楼说的对，另外requests也有代理的api，如果对速度没要求的话，也可以sleep限制爬的频率

chinapds机器人#5 · 2017/6/26

爬虫和反爬的斗争