返回信息流我想用scrapy爬取天猫生意参谋里的数据,但是需要登录账号,并且页面的数据基本都是js加载出来的,想了下有2种办法:
1.scrapy+selenium(之前用过,大批量抓数据效率感人,遂弃之)
2.scrapy+splash(听说不错,开干)
思路:
先在selenium打开的浏览器里输入账号密码登录→获取cookie保存到本地(字符串)→requests通过headers传入字符串cookie→获取到了登录后的页面→将cookie转成字典→传入到SplashRequest里→不能获取到登录后的页面
度娘已经给了我很多答案,但是都不能解决,困扰良久,求对scrapy,splash了解的大佬指点一二
这是一条镜像帖。来源:北邮人论坛 / python / #20397同步于 2018/1/5
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
关于scrapy splash
tangsong
2018/1/5镜像同步2 回复
订阅后,新回复会通过你的通知中心匿名送达。