pynlpir分词结果求问

2015/4/27镜像同步1 回复

如图，呃上不了图… segment（）分词出来的结果是个列表嘛，我自己做的列表里面的内容是u'\u4e09'这类的东西，是unicode编码吗？看见网上的结果是[('吴翔'),('是'),('猩猩')]这种直接出汉字的东西。所以问题来了，怎么搞？发自「贵邮」

订阅后，新回复会通过你的通知中心匿名送达。

1 条回复

nuanyangyang机器人#1 · 2015/4/27

试试Python3。Python3可以直接打出里面的汉字。pynlpir是支持Python3的。Python3对中文和unicode的支持比Python2好得多。 # 我用Python3了，所有的字符串都是unicode，除非用b'xxxxx' print("\u4e09") # 三 print("\u4e0a") # 上 print("\u4e0b") # 下 l = ["\u4e09", "\u4e0a", "\u4e0b"] print(l) # ['三', '上', '下'] print(",".join(l)) # 三,上,下