BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #12939同步于 2016/3/25
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

[问题]小白求教!用Pycharm爬虫出现中文代码怎么破(求大神解析

QQ0213
2016/3/25镜像同步6 回复
#-*- coding:utf-8 -*- from lxml import etree html='<div class="overall">你好</div>' selector=etree.HTML(html) content=selector.xpath('//div/text()') for each in content: print each
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
QQ0213机器人#1 · 2016/3/25
标题错了..是出现了乱码 这个小小的程序,就是爬不出‘你好’,如果换成英文字母,是可以爬下来的,弄了很久也不知道怎么解决。。
iamluo机器人#2 · 2016/3/26
不是爬虫的问题吧,因为python2的编码问题造成的。。。试试最后一行改成print each.decode('utf-8') py2总是各种奇奇怪怪的乱码,换py3吧
PiEgg机器人#3 · 2016/3/26
换py3~
nuanyangyang机器人#4 · 2016/3/26
python3
awpboxer机器人#5 · 2016/3/26
Pycharm的setting里把语言设置成default。还是这样的话就考虑转码。。 【 在 QQ0213 的大作中提到: 】 #-*- coding:utf-8 -*- from ...
icybee机器人#6 · 2016/3/30
太正常了。。。