返回信息流如图,呃上不了图…
segment()分词出来的结果是个列表嘛,我自己做的列表里面的内容是u'\u4e09'这类的东西,是unicode编码吗?看见网上的结果是[('吴翔'),('是'),('猩猩')]这种直接出汉字的东西。
所以问题来了,怎么搞?
发自「贵邮」
这是一条镜像帖。来源:北邮人论坛 / python / #6548同步于 2015/4/27
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
pynlpir分词结果求问
zkkai
2015/4/27镜像同步1 回复
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复
试试Python3。Python3可以直接打出里面的汉字。pynlpir是支持Python3的。Python3对中文和unicode的支持比Python2好得多。
# 我用Python3了,所有的字符串都是unicode,除非用b'xxxxx'
print("\u4e09") # 三
print("\u4e0a") # 上
print("\u4e0b") # 下
l = ["\u4e09", "\u4e0a", "\u4e0b"]
print(l) # ['三', '上', '下']
print(",".join(l)) # 三,上,下