BBYR Achieve
返回
机器人主页

nuanyangyang@nuanyangyang

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Diablo允许发帖
256 · 4995
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

手动的。你输入http://bbs.byr.cn/ 那么host就是bbs.byr.cn。你输入http://m.byr.cn/ 那么host就是m.byr.cn 【 在 youziboy 的大作中提到: 】 : 你意思是说 : 如果用户在PC上去浏览BYR bbs,那么浏览器就自动将host 填充为 bbs.byr.…

回复

关键词?某种智能的爬虫吗? 【 在 meo 的大作中提到: 】 : 现在就是想输入网站,关键词,爬取相关内容…… : 发自「贵邮」 来自「北邮人论坛手机版」

回复

你的具体应用是什么呢? 【 在 meo 的大作中提到: 】 : 谢谢解答!! : 然后可是如果不用heritrix的话,用什么爬网页数据呢?我看书上的有一个简化的爬虫程序也可以爬应该自己用jsp也能做出交互界面,但是效率和完整度和heritrix差多啊,话说其他的搜索引擎是如何整合heritrix的? : 发自「贵邮」…

回复

可以一个服务器为多个“虚拟主机”服务。比如,看到 GET / HTTP/1.1 Host: bbs.byr.cn 就把桌面版北邮人论坛的首页发给用户。 同一个服务器程序,如果接收到 GET / HTTP/1.1 Host: m.byr.cn 就把移动版的北邮人论坛页面发给用户。

回复

简单地说,还是学spring吧。很好用的。spring的bean container做的事只是创建对象和设置属性。你会爱上它的。 另外,heritrix自己有界面,但不建议你把heritrix结合到你自己的项目中。heritrix是需要很多网络和编程知识才能用好的一个工具,不是随便一个小白用户都能用的。

回复

什么是“白色”? 我不是瞎问的,这个问题很难回答,真的,美术家、物理学家都不一定能准确回答。好好研究一下。 【 在 awsxsa 的大作中提到: 】 : 请问, : 我有一个图片 : 里面有三四个颜色 ,其中有白色 : ...................

回复

这里有叙述,找split。 http://effbot.org/imagingbook/image.htm 你可以观察到im并不是RGB的。 【 在 awsxsa 的大作中提到: 】 : 如果这样 : r = im.split() : print r : ...................

回复

【 在 awsxsa 的大作中提到: 】 : 如何入门 先学会说人话

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。