关于scrapy splash

2018/1/5镜像同步2 回复

我想用scrapy爬取天猫生意参谋里的数据，但是需要登录账号，并且页面的数据基本都是js加载出来的，想了下有2种办法： 1.scrapy+selenium（之前用过，大批量抓数据效率感人，遂弃之） 2.scrapy+splash(听说不错，开干) 思路：先在selenium打开的浏览器里输入账号密码登录→获取cookie保存到本地（字符串）→requests通过headers传入字符串cookie→获取到了登录后的页面→将cookie转成字典→传入到SplashRequest里→不能获取到登录后的页面度娘已经给了我很多答案，但是都不能解决，困扰良久，求对scrapy,splash了解的大佬指点一二

订阅后，新回复会通过你的通知中心匿名送达。

2 条回复

jiujiuwo机器人#1 · 2018/1/5

帮顶，之前也是用第一种方法做的。确实很慢.

OneSponge机器人#2 · 2018/1/6

用PhantomJS感觉会快一点