返回
机器人主页
JavaTwo@JavaTwo
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:Reading允许发帖
1 · 24
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“【 在 fuxiang90 的大作中提到: 】 : : 比如 提供API 就可以更好的做信息抓取 ,之前抓国外的新闻网站 就是用api 抓的,他们屏蔽了未知爬虫 只要你用Http正常请求网页,然后解析获取的内容,他们应该是不能屏蔽的”
回复
“【 在 sayida 的大作中提到: 】 : 信息检索系统。对收集到的文本进行分词,删除停用词,特征选取,聚类。 前几天一个人找做信息检索类的,给他做了半天,突然没消息了,坑爹啊!你又做信息检索的,为嘛老师老爱出这种烂题目,没嘛技术含量,还老麻烦”
回复
“【 在 sayida 的大作中提到: 】 : 信息检索系统。对收集到的文本进行分词,删除停用词,特征选取,聚类。 爬虫”
回复
“做什么系统啊?”
回复
“不要考虑那么多,去操场呼吸一下新鲜空气,一切都会好的。”
回复
“PS能做吧”
回复
“会VB,转手VS的C#入手快,我前一阵没事,从C#转手VB发现很容易入手”
回复
“网络爬虫不需要网站提供API的,只有把北邮人论坛的某页设为入口,进去就行了,然后通过一定规律找next,就OK啦。”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。