yingxinghuan@yingxinghuan
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“深入理解计算机系统”
“恩。多谢。 【 在 Dave 的大作中提到: 】 : : 如果双方都是 端口受限NAT(Port Restricted Cone)类型stun如何进行穿洞? : : 还有一个疑问,同一端口能绑定多个套接字吗?如果可以如何判断消息来自哪个套接字? : 第一个问题,需要外部帮助,就是两个都在nat后,没法直接建连接 : .…”
“恩,刚刚开始接触,有什么关于hbase的好点的资料不? 目前的问题,存储策略是问题的一部分,如何设计存储的结构也是比较紧要。 多谢大家提供思路。 【 在 heartofsea 的大作中提到: 】 : hbase吧,也是hadoop的一部分。这个软件的原型是google内部用来存储爬虫数据的。 : --”
“现在只有千万级的数量(url数),由于需要不断的重复请求已存的url记录url内容的更新,数量肯定会上升。 对存储的url不同版本也许会做一些操作,比如:历史趋势的比较计算;找出更新频率最快的url等。 【 在 coolfantasy 的大作中提到: 】 : 先评估一下数据量 : -- : Quicksort in H…”
“1.要抓什么样的网页 2.要存什么东西”
“在hash策略上有什么技巧? 如何能设计一个比较好的测试用例? 【 在 sunmoonstar 的大作中提到: 】 : Bloom Filter就可以了。搜一下”
“我们想请人来给我们小组做个报告样式的。有没有人能找到人啊? 【 在 yingxinghuan 的大作中提到: 】 : 如题:”
“谢谢。下了两个小时终于装上了。 【 在 cussyou 的大作中提到: 】 : 下载 安装工具包吧 看主页的get started 里有介绍 : 选择自己的编译器 选好各种线程动态或静态库的版本 选好要安的库 : 就自动下载安装了 可以”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。