BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #8632同步于 2015/9/17
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

python的模拟登录北邮BBS

kuangfengwin
2015/9/17镜像同步11 回复
可以模拟登录成功了,但是为什么用cookiejar没法保持登录状态呢? class byrSpider(CrawlSpider): name="byr" allowed_domains=["bbs.byr.cn"] start_urls = ["http://bbs.byr.cn"] headers={ 'User-Agent' : 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:38.0) Gecko/20100101 Firefox/38.0', 'HOST':'bbs.byr.cn', 'X-Requested-With':'XMLHttpRequest', 'Referer': 'http://bbs.byr.cn/index' } formdata = { 'id':'xxxxxx', 'passwd':'xxxxxx', 'mode':'0', 'CookieDate':'0' } def start_requests(self): return [scrapy.FormRequest("http://bbs.byr.cn/user/ajax_login.json", meta={'cookiejar':1}, headers=self.headers, formdata=self.formdata, callback=self.logged_in)] def logged_in(self,response): print response.body_as_unicode() for url in self.start_urls: yield Request(url,meta={'cookiejar':response.meta['cookiejar']},callback=self.parse_start_url) def parse_start_url(self,response): print response.url sel=Selector(response) print response.body_as_unicode()
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
kuangfengwin机器人#1 · 2015/9/17
真的没人理我么。。。
trouvan机器人#2 · 2015/9/17
如果你是抓网页版,请求头应该带上x-requested-with。觉得麻烦还是抓手机端好了 通过『我邮2.0』发布
kuangfengwin机器人#3 · 2015/9/18
真的是哎。。。。。。谢谢啦! 网上教程好坑啊,都没说要加这个属性。。。 【 在 trouvan 的大作中提到: 】 : 如果你是抓网页版,请求头应该带上x-requested-with。觉得麻烦还是抓手机端好了 : 通过『我邮2.0』发布
Cheetach机器人#4 · 2015/9/18
然后下一步就是暴力试密码了? 论坛登录密码错误10次就会被禁IP
kuangfengwin机器人#5 · 2015/9/18
....逗我吧。。。十几位呢。。我就是写个爬虫程序。。 不过说到这个,是不是上网的密码如果没改,还真可以暴力解出来。。。。 【 在 Cheetach 的大作中提到: 】 : 然后下一步就是暴力试密码了? : 论坛登录密码错误10次就会被禁IP
kuangfengwin机器人#6 · 2015/9/23
大神你好,可以再帮忙看一下我的帖子吗? 我更新了代码,可以模拟登录成功,但是保存不了登录状态啊 【 在 trouvan 的大作中提到: 】 : 如果你是抓网页版,请求头应该带上x-requested-with。觉得麻烦还是抓手机端好了 : 通过『我邮2.0』发布
heamon7机器人#7 · 2015/9/23
上网密码暴力破解速度很慢,一晚上可能一个都破解不了
kuangfengwin机器人#8 · 2015/9/23
我没打算暴力破密码。。。帮我看看代码有啥问题不= = 【 在 heamon7 的大作中提到: 】 : 上网密码暴力破解速度很慢,一晚上可能一个都破解不了
kuangfengwin机器人#9 · 2015/9/23
@nuanyangyang