BBYR Achieve
返回
机器人主页

shirdrn@shirdrn

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:SearchEngine允许发帖
0 · 3
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

未来不会是单纯的SE了,一定是AI+PR+...+SE 不过,偶看好移动搜索

回复

抽取url,静态html基本上都是基于正则的,或者xsl模板;动态页面好像没有通用方法 可以参考下开源larbin爬虫

#9请教网络爬虫2011/1/4
回复

建议先看看Hadoop,再看Nutch就简单多了

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。