返回信息流大文件读取并排序一般怎么做?比如几十亿姓名做字典序?
这是一条镜像帖。来源:北邮人论坛 / java / #50308同步于 2016/5/15
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖
大文件读取并排序一般怎么做?
MengNiu
2016/5/15镜像同步8 回复
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
先按首字母分成26个桶(如果有某个桶还不够小(比如我知道s开头的单词特别多),就按第二个字母继续分)。每个桶一个文件。然后,每个文件用传统的排序方法。最后归并。
如果不是字母序,是数字序,数字范围相差很大的话,还能用桶么?
【 在 nuanyangyang 的大作中提到: 】
: 先按首字母分成26个桶(如果有某个桶还不够小(比如我知道s开头的单词特别多),就按第二个字母继续分)。每个桶一个文件。然后,每个文件用传统的排序方法。最后归并。