返回信息流抓去了一个网页,用正则表达式提取出了其中的一些汉字,但是最后输出的结果是Unicode编码,例如\xb0\\xa2\\xc0\\xef\\xd1\\xfc\\xd5\\xb6\\xb1\\xb3\\xba\\xf3\\xb1\\xa9\\xc2\\xb6\\xc4\\xc4\\xd0\\xa9\\xc8\\xf5\\xb5\\xe3
这样的,怎么把这些编码转化成汉字啊!?我用的是python3.求大神帮忙。
这是一条镜像帖。来源:北邮人论坛 / python / #9694同步于 2015/11/10
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
[问题]抓取网页的汉字变成了Unicode码?
helloe
2015/11/10镜像同步2 回复
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
【 在 nuanyangyang 的大作中提到: 】
: 你怎么知道是unicode码?要不要先去了解一下字符、字节、编码、unicode这四个概念呢?
确实不太懂哎,我先去了解了解,谢谢暖洋洋大神的指点!