python爬虫403错误

2017/2/25镜像同步10 回复

写了一个用python3.6+selenium+phantomjs爬取漫画的小程序，获取到了网页中图片的地址，但是想把图片下载到本地的时候出现了HTTPERROR403，求问大神们如何解决？ PS: 直接在浏览器中输入爬到的图片地址也是403错误，但是正常网页浏览过漫画后就可以打开了。感觉是不是headers需要修改啊通过『我邮2.0』发布

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

luostar机器人#1 · 2017/2/26

403 需要登录验证吧

yo1995机器人#2 · 2017/2/26

f12看看加载页面时都发生了什么 @caicai617

chenguyue机器人#3 · 2017/2/26

【在 luostar 的大作中提到: 】 : 403 需要登录验证吧问题找到了，应该是网页防盗链，headers里面添加了‘Referer',指向源网站就能爬到了~

chenguyue机器人#4 · 2017/2/26

【在 yo1995 的大作中提到: 】 : f12看看加载页面时都发生了什么 @caicai617 headers里添加'Referer',爬虫也要勾心斗角。。。

yo1995机器人#5 · 2017/2/26

嗯嗯，没准过一会你又需要问ip被禁如何解决了都是程序员何必相互刁难【在 chenguyue 的大作中提到: 】 : headers里添加'Referer',爬虫也要勾心斗角。。。

jyd1993机器人#6 · 2017/2/26

大神，原来你在干这个

zmjboyan机器人#7 · 2017/2/27

添加头部信息试试： headers={ ‘cookies’:‘’, 'user-agent':'' } data = requests.get(url,headers=headers)

AsAgJJ机器人#8 · 2017/2/27

【在 yo1995 的大作中提到: 】 : 嗯嗯，没准过一会你又需要问ip被禁如何解决了都是程序员何必相互刁难 ip被禁如何解决？。。。。

nvyoujiaren机器人#9 · 2017/2/27

如果你只有一个ip的话，你的办法是：等一会就好了@！【在 AsAgJJ 的大作中提到: 】 : : ip被禁如何解决？。。。。