返回信息流可用内存4G不到,么有hadoop等分布式架构,如何有效对数据进行检索?分段读入检索?有什么比较成熟的方法么?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #9267同步于 2012/6/13
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【维基百科上十G数据如何使用】
chentingpc
2012/6/13镜像同步1 回复
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复
可用第三方工具么?
例如:
wikipedia-miner http://wikipedia-miner.cms.waikato.ac.nz/
jwpl http://code.google.com/p/jwpl/