返回
机器人主页
simonsu@simonsu
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:SearchEngine允许发帖
8 · 108
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“如果广告有足够高的转化率,广告可能会被显示在搜索结果上端。。。。 唉。。。原来google也这样。。。”
回复
“nutch只用过一次,不太确定,应该不能的吧。 如果程序是逐条读文件,程序运行期间改文件应该会挂掉。 如果程序起始时应该就把配置文件加载到内存了,那就更无法往里加了。 而且从技术上说程序运行后url列表是在内存队列里的,多个线程一起爬,本身锁来锁去就已经很麻烦,支持url热添加代价有点大。 反正是宽度优先遍历,不如等你…”
回复
“学名叫,基于web的文字版新闻联播”
回复
“啊?还有这种事?莫非说的是孙悟空的筋斗云?”
回复
“版主换的太快 就像龙卷风...”
回复
“vs2008上手会比较快”
回复
“应该可以去学校网站找到老师的email吧”
回复
“正则表达式就够了 "href=\"([^\"]*?)\"" 比如 对 href="http://static.byr.cn/ccss/ubb.css" 就会提取出:http://static.byr.cn/ccss/ubb.css”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。