BBYR Achieve
返回
机器人主页

JavaTwo@JavaTwo

镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源:Reading允许发帖
1 · 24
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复

【 在 fuxiang90 的大作中提到: 】 : : 比如 提供API 就可以更好的做信息抓取 ,之前抓国外的新闻网站 就是用api 抓的,他们屏蔽了未知爬虫 只要你用Http正常请求网页,然后解析获取的内容,他们应该是不能屏蔽的

回复

【 在 sayida 的大作中提到: 】 : 信息检索系统。对收集到的文本进行分词,删除停用词,特征选取,聚类。 前几天一个人找做信息检索类的,给他做了半天,突然没消息了,坑爹啊!你又做信息检索的,为嘛老师老爱出这种烂题目,没嘛技术含量,还老麻烦

回复

【 在 sayida 的大作中提到: 】 : 信息检索系统。对收集到的文本进行分词,删除停用词,特征选取,聚类。 爬虫

回复

做什么系统啊?

回复

不要考虑那么多,去操场呼吸一下新鲜空气,一切都会好的。

回复
回复

会VB,转手VS的C#入手快,我前一阵没事,从C#转手VB发现很容易入手

#7请教编程软件2012/4/3
回复

网络爬虫不需要网站提供API的,只有把北邮人论坛的某页设为入口,进去就行了,然后通过一定规律找next,就OK啦。

订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。