python的模拟登录北邮BBS

2015/9/17镜像同步11 回复

可以模拟登录成功了，但是为什么用cookiejar没法保持登录状态呢？ class byrSpider(CrawlSpider): name="byr" allowed_domains=["bbs.byr.cn"] start_urls = ["http://bbs.byr.cn"] headers={ 'User-Agent' : 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:38.0) Gecko/20100101 Firefox/38.0', 'HOST':'bbs.byr.cn', 'X-Requested-With':'XMLHttpRequest', 'Referer': 'http://bbs.byr.cn/index' } formdata = { 'id':'xxxxxx', 'passwd':'xxxxxx', 'mode':'0', 'CookieDate':'0' } def start_requests(self): return [scrapy.FormRequest("http://bbs.byr.cn/user/ajax_login.json", meta={'cookiejar':1}, headers=self.headers, formdata=self.formdata, callback=self.logged_in)] def logged_in(self,response): print response.body_as_unicode() for url in self.start_urls: yield Request(url,meta={'cookiejar':response.meta['cookiejar']},callback=self.parse_start_url) def parse_start_url(self,response): print response.url sel=Selector(response) print response.body_as_unicode()

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

kuangfengwin机器人#1 · 2015/9/17

真的没人理我么。。。

trouvan机器人#2 · 2015/9/17

如果你是抓网页版，请求头应该带上x-requested-with。觉得麻烦还是抓手机端好了通过『我邮2.0』发布

kuangfengwin机器人#3 · 2015/9/18

真的是哎。。。。。。谢谢啦! 网上教程好坑啊，都没说要加这个属性。。。【在 trouvan 的大作中提到: 】 : 如果你是抓网页版，请求头应该带上x-requested-with。觉得麻烦还是抓手机端好了 : 通过『我邮2.0』发布

Cheetach机器人#4 · 2015/9/18

然后下一步就是暴力试密码了？论坛登录密码错误10次就会被禁IP

kuangfengwin机器人#5 · 2015/9/18

....逗我吧。。。十几位呢。。我就是写个爬虫程序。。不过说到这个，是不是上网的密码如果没改，还真可以暴力解出来。。。。【在 Cheetach 的大作中提到: 】 : 然后下一步就是暴力试密码了？ : 论坛登录密码错误10次就会被禁IP

kuangfengwin机器人#6 · 2015/9/23

大神你好，可以再帮忙看一下我的帖子吗？我更新了代码，可以模拟登录成功，但是保存不了登录状态啊【在 trouvan 的大作中提到: 】 : 如果你是抓网页版，请求头应该带上x-requested-with。觉得麻烦还是抓手机端好了 : 通过『我邮2.0』发布

heamon7机器人#7 · 2015/9/23

上网密码暴力破解速度很慢，一晚上可能一个都破解不了

kuangfengwin机器人#8 · 2015/9/23

我没打算暴力破密码。。。帮我看看代码有啥问题不= = 【在 heamon7 的大作中提到: 】 : 上网密码暴力破解速度很慢，一晚上可能一个都破解不了

kuangfengwin机器人#9 · 2015/9/23

@nuanyangyang