BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / acm-icpc / #90862同步于 2016/8/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ACM_ICPC机器人发帖

内存有限,数据量很大的这类月经题该如何解决?

tastier
2016/8/20镜像同步6 回复
不是纯算法题,但是不知道发在哪个版,故来此 这类题在面试过程中经常出现,总结共性:内存很小(可能就几百M),要操作的数据量确很大(T级别),所做的操作可能是查找(kv查找,查找不重复的数等等)、排序、交并集等等 每次遇到都感觉很无力,这类题要如何思考解决?或者有好的文章博客也请推荐下,谢谢!
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
aquamarine机器人#1 · 2016/8/20
加机器
nuanyangyang机器人#2 · 2016/8/20
查找:哈希表分桶、目录文件……看看ext2文件系统。 排序:这个话题叫“外部排序”。 交并集:哈希吧,把每条数据哈希,分散到不同的文件里,或者不同的机器上。交并集的判断相等只在同一个桶里进行。
GraceXiao机器人#3 · 2016/9/20
请搜 海量数据处理算法 比如下面这个 https://zm12.sm-tc.cn/?src=http%3A%2F%2Fwww.cnblogs.com%2Fccdc%2Fp%2F3075101.html&uid=d41ce2f31e2edebe9d0961695d397c9b&hid=a676467463a5566a64c27e8e8cc962f4&pos=8&cid=9&time=1474332718527&from=click&restype=1&pagetype=0000004000000402&bu=structure_web_info&query=%E6%B5%B7%E9%87%8F%E6%95%B0%E6%8D%AE%E7%AE%97%E6%B3%95&mode=&uc_param_str=dnntnwvepffrgibijbprsvdsei 【 在 tastier 的大作中提到: 】 : 不是纯算法题,但是不知道发在哪个版,故来此 : 这类题在面试过程中经常出现,总结共性:内存很小(可能就几百M),要操作的数据量确很大(T级别),所做的操作可能是查找(kv查找,查找不重复的数等等)、排序、交并集等等 : 每次遇到都感觉很无力,这类题要如何思考解决?或者有好的文章博客也请推荐下,谢谢! : ...................
tastier机器人#4 · 2016/9/20
赞! 【 在 GraceXiao 的大作中提到: 】 : 请搜 海量数据处理算法 : 比如下面这个 : https://zm12.sm-tc.cn/?src=http%3A%2F%2Fwww.cnblogs.com%2Fccdc%2Fp%2F3075101.html&uid=d41ce2f31e2edebe9d0961695d397c9b&hid=a676467463a5566a64c27e8e8cc962f4&pos=8&cid=9&time=1474332718527&from=click&restype=1&pagetype=0000004000000402&bu=structure_web_info&query=%E6%B5%B7%E9%87%8F%E6%95%B0%E6%8D%AE%E7%AE%97%E6%B3%95&mode=&uc_param_str=dnntnwvepffrgibijbprsvdsei
GraceXiao机器人#5 · 2016/9/22
^ _ ^ 【 在 tastier 的大作中提到: 】 : 赞!
ykprocess机器人#6 · 2016/9/23
存不下的放到硬盘上,算法的目标应该是尽量减少硬盘访问的开销