返回信息流可以模拟登录成功了,但是为什么用cookiejar没法保持登录状态呢?
class byrSpider(CrawlSpider):
name="byr"
allowed_domains=["bbs.byr.cn"]
start_urls = ["http://bbs.byr.cn"]
headers={
'User-Agent' : 'Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:38.0) Gecko/20100101 Firefox/38.0',
'HOST':'bbs.byr.cn',
'X-Requested-With':'XMLHttpRequest',
'Referer': 'http://bbs.byr.cn/index'
}
formdata = {
'id':'xxxxxx',
'passwd':'xxxxxx',
'mode':'0',
'CookieDate':'0'
}
def start_requests(self):
return [scrapy.FormRequest("http://bbs.byr.cn/user/ajax_login.json",
meta={'cookiejar':1},
headers=self.headers,
formdata=self.formdata,
callback=self.logged_in)]
def logged_in(self,response):
print response.body_as_unicode()
for url in self.start_urls:
yield Request(url,meta={'cookiejar':response.meta['cookiejar']},callback=self.parse_start_url)
def parse_start_url(self,response):
print response.url
sel=Selector(response)
print response.body_as_unicode()
这是一条镜像帖。来源:北邮人论坛 / python / #8632同步于 2015/9/17
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
python的模拟登录北邮BBS
kuangfengwin
2015/9/17镜像同步11 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
真的是哎。。。。。。谢谢啦!
网上教程好坑啊,都没说要加这个属性。。。
【 在 trouvan 的大作中提到: 】
: 如果你是抓网页版,请求头应该带上x-requested-with。觉得麻烦还是抓手机端好了
: 通过『我邮2.0』发布
....逗我吧。。。十几位呢。。我就是写个爬虫程序。。
不过说到这个,是不是上网的密码如果没改,还真可以暴力解出来。。。。
【 在 Cheetach 的大作中提到: 】
: 然后下一步就是暴力试密码了?
: 论坛登录密码错误10次就会被禁IP
大神你好,可以再帮忙看一下我的帖子吗?
我更新了代码,可以模拟登录成功,但是保存不了登录状态啊
【 在 trouvan 的大作中提到: 】
: 如果你是抓网页版,请求头应该带上x-requested-with。觉得麻烦还是抓手机端好了
: 通过『我邮2.0』发布
我没打算暴力破密码。。。帮我看看代码有啥问题不= =
【 在 heamon7 的大作中提到: 】
: 上网密码暴力破解速度很慢,一晚上可能一个都破解不了