[问题]抓取网页的汉字变成了Unicode码？

2015/11/10镜像同步2 回复

抓去了一个网页，用正则表达式提取出了其中的一些汉字，但是最后输出的结果是Unicode编码，例如\xb0\\xa2\\xc0\\xef\\xd1\\xfc\\xd5\\xb6\\xb1\\xb3\\xba\\xf3\\xb1\\xa9\\xc2\\xb6\\xc4\\xc4\\xd0\\xa9\\xc8\\xf5\\xb5\\xe3 这样的，怎么把这些编码转化成汉字啊！？我用的是python3.求大神帮忙。

订阅后，新回复会通过你的通知中心匿名送达。

2 条回复

nuanyangyang机器人#1 · 2015/11/10

你怎么知道是unicode码？要不要先去了解一下字符、字节、编码、unicode这四个概念呢？

helloe机器人#2 · 2015/11/11

【在 nuanyangyang 的大作中提到: 】 : 你怎么知道是unicode码？要不要先去了解一下字符、字节、编码、unicode这四个概念呢？确实不太懂哎，我先去了解了解，谢谢暖洋洋大神的指点！