python爬虫问题！{"success":false,"msg":"系统错误！"}

2018/5/26镜像同步22 回复

之前的帖子，热心的同学说我没有放爬取的url。我现在就把url和代码全部放上来~~请各位大神帮忙咩~~（卖哥萌）爬取的url为“http://110.249.223.75:9090/onlinemonitor/” 以下是代码： #coding=utf-8 import urllib2 import zlib import cookielib import urllib import re import sys reload(sys) sys.setdefaultencoding("utf-8") CaptchaUrl = "http://110.249.223.75:9090/onlinemonitor/login/getCaptCha.do" PostUrl="http://110.249.223.75:9090/onlinemonitor/login/login.do" cookie = cookielib.CookieJar() handler = urllib2.HTTPCookieProcessor(cookie) opener = urllib2.build_opener(handler) username = 'public' password = '123' picture = opener.open(CaptchaUrl).read() local = open('/home/msh/Desktop/msh/bfbl/image.jpg', 'wb') local.write(picture) local.close() SecretCode = raw_input('输入验证码： ') postData = { 'suLoginid':username, 'suPasswd':password, 'captCha':SecretCode, } headers = { 'Accept':'*/*', 'Accept-Encoding':'gzip, deflate', 'Accept-Language':'zh-CN,zh;q=0.9', 'Cache-Control':'no-cache', 'Connection':'keep-alive', 'Content-Length':'49', 'Content-Type':'application/x-www-form-urlencoded; charset=UTF-8', 'Cookie':'JSESSIONID=66E219DA9B704841F638F2E73EF3E224', 'Host':'110.249.223.75:9090', 'Origin':'http://110.249.223.75:9090', 'Pragma':'no-cache', 'Referer':'http://110.249.223.75:9090/onlinemonitor/login.jsp', 'User-Agent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/64.0.3282.140 Safari/537.36', 'X-Requested-With':'XMLHttpRequest', } data = urllib.urlencode(postData) request = urllib2.Request(PostUrl, data, headers) try: response = opener.open(request) result = response.read().decode("utf-8") # decompressed_data = zlib.decompress(result ,16+zlib.MAX_WBITS) # result1=decompressed_data.decode("utf-8") # print result1 print result except urllib2.HTTPError, e: print e.code 这里解释一下： *local = open('/home/msh/Desktop/msh/bfbl/image.jpg', 'wb') 因为这个网中总是有验证码，这里是把验证码下载下来放到这个地方，命名为一个image.jpg的文件。，比如放这些代码的文件叫做bfbl.py.我是在linux下面运行的，就输入python bfbl.py,然后就会让你输入验证码，我此时就是打开另外一个终端，到放image.jpg的位置，然后打开图片，记住验证码内容，然后回到原来的终端，输入验证码然后回车。 * # decompressed_data = zlib.decompress(result ,16+zlib.MAX_WBITS) # result1=decompressed_data.decode("utf-8") # print result1 这几行是特殊情况要用的，暂时不用管~~ 求各位大神帮忙啊啊啊~~~~~~~北邮python学渣求帮忙~~

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

wslyh123机器人#1 · 2018/5/26

【在 mushroom233 的大作中提到: 】 : 之前的帖子，热心的同学说我没有放爬取的url。我现在就把url和代码全部放上来~~请各位大神帮忙咩~~（卖哥萌） : 爬取的url为“http://110.249.223.75:9090/onlinemonitor/” : 以下是代码： : ................... 我用postman跑到能通，我猜的啊是Content-Type格式的问题，我用的是.application/x-www-form-urlencoded。

mushroom233机器人#2 · 2018/5/26

postman是个专门用来爬虫的软件吗？你可以把登录以后源代码下载下来吗？【在 wslyh123 (wslyh123) 的大作中提到: 】 : [upload=1][/upload] : 我用postman跑到能通，我猜的啊是Content-Type格式的问题，我用的是.application/x-www-form-urlencoded。

fuxuemingzhu机器人#3 · 2018/5/26

不是的。只是模拟请求的chrome插件【在 mushroom233 的大作中提到: 】 : postman是个专门用来爬虫的软件吗？你可以把登录以后源代码下载下来吗？

fuxuemingzhu机器人#4 · 2018/5/26

咦，不知道你的这个验证码是通过什么操作弄的【在 wslyh123 的大作中提到: 】 : [upload=1][/upload] : 我用postman跑到能通，我猜的啊是Content-Type格式的问题，我用的是.application/x-www-form-urlencoded。

mushroom233机器人#5 · 2018/5/26

我按照你的换了，结果还是一模一样 {"success":false,"msg":"系统错误！"}，我就不贴图片了。【在 wslyh123 的大作中提到: 】 : [upload=1][/upload] : 我用postman跑到能通，我猜的啊是Content-Type格式的问题，我用的是.application/x-www-form-urlencoded。

fuxuemingzhu机器人#6 · 2018/5/26

唉，我也是闲得慌，你上了代码之后我帮你搞定了。希望你以后多多思考吧～删除headers里面的两行即可： 'Cookie':'JSESSIONID=66E219DA9B704841F638F2E73EF3E224', 'Content-Length':'49', 登陆成功的返回是： {"success":true,"msg":"登录成功!"}

mushroom233机器人#7 · 2018/5/26

为什么要删除!!!求告知. 【在 fuxuemingzhu (意涵团·负雪明烛 http://fuxuemingzhu.me) 的大作中提到: 】 : 唉，我也是闲得慌，你上了代码之后我帮你搞定了。希望你以后多多思考吧～ : 删除headers里面的两行即可： : ...................

fuxuemingzhu机器人#8 · 2018/5/26

自己试出来的【在 mushroom233 的大作中提到: 】 : 为什么要删除!!!求告知.

mushroom233机器人#9 · 2018/5/26

握草.怎么想到的。。。。【在 fuxuemingzhu (意涵团·负雪明烛 http://fuxuemingzhu.me) 的大作中提到: 】 : 自己试出来的