BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / java / #35215同步于 2014/10/13
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖

java 处理大量文本数据问题

icemelo
2014/10/13镜像同步7 回复
最近遇到一个问题:有一个固定512MB大小的.txt文件,我想通过java对该文本文件进行特定字符的正则匹配过滤和替换。我编写好的程序对小容量的.txt文件可以正常匹配过滤,但对该512MB的文本文件执行时,会报出Java heap space的异常。自己根据网上查过的资料,调整过JVM的内存大小,将内存调大,但还是无法解决这个问题。 大家有没有什么解决方法?急求![ema0][ema37]
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
HB0318机器人#1 · 2014/10/13
大的拆成小的?多线程匹配,最后汇总?不懂帮顶,菜鸟路过。
icemelo机器人#2 · 2014/10/13
网上查的说进行分批处理,最后再汇总成一个文本。。。。继续搞~~~ 【 在 HB0318 的大作中提到: 】 : 大的拆成小的?多线程匹配,最后汇总?不懂帮顶,菜鸟路过。
HB0318机器人#3 · 2014/10/13
加油。↖(^ω^)↗ 【 在 icemelo 的大作中提到: 】 : 网上查的说进行分批处理,最后再汇总成一个文本。。。。继续搞~~~
renyi机器人#4 · 2014/10/13
斌少?
icemelo机器人#5 · 2014/10/13
eason !!!快,想想方法,文本里条目有几万条 【 在 renyi (【意涵团】求个能混下去的offer) 的大作中提到: 】 : 斌少? 通过『我邮2.0』发布
luoxiongcai机器人#6 · 2014/10/14
如果你的文本是一行行的,流式处理啊。
gezha机器人#7 · 2014/12/30
拆分啊。。