返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #12665同步于 2016/3/10
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
如何将爬虫伪装成浏览器的请求呢
songshuqie
2016/3/10镜像同步18 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
我觉得这种问题要自己多思考,你可以想想爬虫和浏览器发出的请求在服务器端有什么差异,然后再着手修改你的爬虫。
就我知道的:1.ua 2.请求间隔和请求频率 3.访问特征,比如只有动态页面请求,而没有静态资源请求。 4.有些网站会在页面中嵌入js脚本,捕捉用户行为特征,然后发出ajax请求,这类情况就针对性分析吧。
感谢大神回答~
【 在 asm 的大作中提到: 】
: 我觉得这种问题要自己多思考,你可以想想爬虫和浏览器发出的请求在服务器端有什么差异,然后再着手修改你的爬虫。
: 就我知道的:1.ua 2.请求间隔和请求频率 3.访问特征,比如只有动态页面请求,而没有静态资源请求。 4.有些网站会在页面中嵌入js脚本,捕捉用户行为特征,然后发出ajax请求,这类情况就针对性分析吧。