返回信息流#-*- coding:utf-8 -*-
from lxml import etree
html='<div class="overall">你好</div>'
selector=etree.HTML(html)
content=selector.xpath('//div/text()')
for each in content:
print each
这是一条镜像帖。来源:北邮人论坛 / python / #12939同步于 2016/3/25
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
[问题]小白求教!用Pycharm爬虫出现中文代码怎么破(求大神解析
QQ0213
2016/3/25镜像同步6 回复
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
不是爬虫的问题吧,因为python2的编码问题造成的。。。试试最后一行改成print each.decode('utf-8')
py2总是各种奇奇怪怪的乱码,换py3吧
Pycharm的setting里把语言设置成default。还是这样的话就考虑转码。。
【 在 QQ0213 的大作中提到: 】
#-*- coding:utf-8 -*-
from ...