返回信息流http://tech.sina.com.cn/mobile/n/g/2016-09-21/doc-ifxvyqvy6842805.shtml
要爬新浪的这个网站,下载网页源代码就挂了。。。
一开始不加请求头直接用urlopen,大概四五次能成功下载一次源代码
加了请求头之后就再也没下载成功过
求大神给看看这用的啥反爬虫机制,该咋破[ema1]
这是一条镜像帖。来源:北邮人论坛 / python / #16138同步于 2016/9/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
新浪的网站真是爬不动。。。
bdyzhy9527
2016/9/22镜像同步1 回复
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复