xtzfor@xtzfor
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“lz慎重考虑浪潮,大四暑假来实习,感觉这里基本没互联网氛围,和北京的互联网公司差的比较远,当然我说的是软件方面。住宿的话有公司宿舍,吃饭公司餐厅人很多。而且口味一般。早晨8.30晚上5.30打卡上下班 发自「贵邮」”
“谢谢你的回复。最后我去看了nutch的源码,发现他们是用递归深度来解决的这个问题。每次任务完成后更新url池。我当时不太清楚的是hadoop能否通过循环来创建jobcontrol,现在看好像是可以的。 【 在 nalanding 的大作中提到: 】 : 小白说一句,我想能否借鉴一下hadoop下kmeans的思想,km…”
“skins a200.有钱上a400。 【 在 dongtianbxx 的大作中提到: 】 楼主特别能出汗 基本上跑完步短袖都是那种能拧出汗水来的...”
“我最近也在爬微博...用的selenium+phantomjs。刚刚做到登录之后抽取正则这块 【 在 wx 的大作中提到: 】 我想爬微博的视频,下载下来。 可是用wap端,视频链接...”
“谢谢,我打算用布隆过滤器,但是主要的问题是如何维护一个在两个mapreduce过程中都要读取的文件,布隆过滤器好像没有这个功能。。redies和hadoop能一起使用吗? 【 在 yuyin100316 的大作中提到: 】 试试bloom filter或者rabbitmq或者a...”
“清华大学邓俊辉老师的数据结构你可以看一下 【 在 hexiaonan 的大作中提到: 】 看了红黑的插入然后写了只有左节点是红色的实现,但是看删...”
“从零开始,天龙八部,陆小凤传奇 【 在 liuxinyao 的大作中提到: 】 《光之子》《剑邪逃》《坏蛋是怎样练成的》”
“兵无常势,水无常形 【 在 kakajack 的大作中提到: 】 用兵之计,变化万千 【 在 yif 的大作中提到: 】...”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。