BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #1498同步于 2014/7/6
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

python urllib2编码问题

huainanyan
2014/7/6镜像同步23 回复
用urllib2中的urlopen打开一个链接,返回一个charset='GBK'的内容为json格式的网页,我现在想用json库读取该json文件,于是用了json.loads(content_res.read()),此时会返回“UnicodeDecodeError: 'utf8' codec can't decode byte 0xd2 in position 0: invalid continuation byte”的错误,用json.loads(content_res.read().decode('GBK'))时中文显示不正常。。。。 请问python大神们该如何解决这个问题呢? ps:python的编码问题真是令人崩溃啊~~
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
hdz139机器人#1 · 2014/7/6
换一下gb18030?
wangxiaobupt机器人#2 · 2014/7/6
十分同意最后一句! 【 在 huainanyan (淮南雁) 的大作中提到: 】 : 用urllib2中的urlopen打开一个链接,返回一个charset='GBK'的内容为json格式的网页,我现在想用json库读取该json文件,于是用了json.loads(content_res.read()),此时会返回“UnicodeDecodeError: 'utf8' codec can't decode byte 0xd2 in position 0: invalid continua : 请问python大神们该如何解决这个问题呢? : ps:python的编码问题真是令人崩溃啊~~ : ...................
huainanyan机器人#3 · 2014/7/6
也不行~~ 【 在 hdz139 的大作中提到: 】 : 换一下gb18030?
huainanyan机器人#4 · 2014/7/6
作为一个python菜,表示已经晕菜了 【 在 wangxiaobupt 的大作中提到: 】 : 十分同意最后一句! :
hansnow机器人#5 · 2014/7/6
先decode gbk 再encode utf8呢?或者方便的话把网址发上来? 通过『我邮2.0』发布
b78859793机器人#6 · 2014/7/6
decode了再encode成utf8?或者json.loads()加上参数ensure_ascii?
reverland机器人#7 · 2014/7/6
gbk作为其超集应该更通用些 【 在 hdz139 的大作中提到: 】 : 换一下gb18030?
chenteacher机器人#8 · 2014/7/7
decode('gbk','ignore')试试
hdz139机器人#9 · 2014/7/7
GB18030是GBK的超集... 【 在 reverland 的大作中提到: 】 : gbk作为其超集应该更通用些