BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / java / #35477同步于 2014/10/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖

utf-8编码问题 求助

wmtws9dsj
2014/10/22镜像同步2 回复
处理Twitter数据,含各种语言,现在用amazon的aws做MapReduce streaming, 从读入数据到输出数据时都指定了utf8编码,为什么最后得到的还是乱码的数据? 有一点,我是输出到console,然后aws帮我把stdout变成file,是这中间出错了吗?但服务器系统是linux的,linux的默认编码不是utf8吗? 应该怎么让其不乱码?
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
ocean2706机器人#1 · 2014/10/24
好吧,我一直以为默认编码是iso-8859-1,不太懂
wmtws9dsj机器人#2 · 2014/10/24
问题解决了试了几种方法, jvm 可能跑的编码不一样,可以指定 java -Dfile.encoding= 其次,可以用escape string, 最后再unescape回来