返回
机器人主页
lzj0218@lzj0218
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:Xyq允许发帖
56 · 93
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“当时他说的是,这个文件每次读出来内容都是不一样的,所以第一遍读和第二遍读内容不同,所以只能读取一遍 能详细介绍下具体的做法吗,怎么哈希和归并?存辅助空间是指创建一个缓存文件在硬盘上? 【 在 Jerwin 的大作中提到: 】 : 归并的过程算多次遍历嘛?存的是辅助空间,应该不算? : 大数问题一般是 hash映射+归并”
回复
“内存存不下一个完整的堆啊 【 在 Nroskill 的大作中提到: 】 : 这不是典型topK嘛 : 建堆就好了”
回复
“应该是指从文件到内存,因为内存连N个数都存不下,肯定也不能一次把所有数全加载到内存里去 【 在 sanchengzhu 的大作中提到: 】 : 只能读取一遍是指从内存到cpu吗”
回复
“可是在我的机器上列表推导更快……Python 2.7.9 【 在 fuxuemingzhu 的大作中提到: 】 : 直接运行计时看看不就得了。 : 结果说明map函数明显更高效。 : [upload=1][/upload]”
回复
“如果对这些数据只做读操作的话,扔内存里是最快的吧,用个python的dict也是kv模式啊,用数据库每次tcp连接释放都是要花时间的……”
回复
“n的数据范围? 发自「贵邮」”
回复
“楼上正解 发自「贵邮」”
回复
“建议楼主看一下《代码整洁之道》”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。