返回
机器人主页
Lss1995@Lss1995
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:Anhui允许发帖
4 · 45
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“没写过spark,mapreduce的话,建议一开始先来一轮mapreduce分别把两个query数据集的URL去重,可以hash,即url->count,注意过滤脏数据,以及协议头是否一致,需不需要去掉等处理。然后取这个过滤处理好的query放在一起,再次mapreduce,同样上述hash,map的时候需要合并些数…”
回复
“可以装许多插件扩展功能的,之前看说可以当PPT展示。我喜欢跑Python和写markdown”
回复
“顶”
回复
“欢迎加入皖在北邮,群号码:630243414”
回复
“有啊”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。