heamon7@heamon7
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“负载太高是什么意思啊?你的机器还是服务器? 被修改。。。 【 在 Chon (葱先森) 的大作中提到: 】 : 我曾经试过把每天的十大帖及其回复都定时抓取下来,并且保存各个历史版本,这样就不用担心帖子被修改之后看不到内容了。。。 : 结果负载太高,只好停止抓取。 通过『我邮2.0』发布”
“【 在 wangxiaobupt 的大作中提到: 】 : 可以再做个抓某个版的精华帖 把所有加蓝钻的 黄钻的 金钻的 抓出来,保存到本地。 : 从 技术版 、学习交流、 考研版 抓来的精华帖 能得到很多有用的消息哦。 : 哇塞,才发现,蓝钻了,谢了哦![ema25]”
“【 在 wangxiaobupt 的大作中提到: 】 : 可以再做个抓某个版的精华帖 把所有加蓝钻的 黄钻的 金钻的 抓出来,保存到本地。 : 从 技术版 、学习交流、 考研版 抓来的精华帖 能得到很多有用的消息哦。 : 恩恩,想法很好,试试!”
“还是小白,共同进步[ema4] 【 在 wangxiaobupt (XJ|学习考研|热点公告屯田日久,当建奇功) 的大作中提到: 】 : 感谢分享 通过『我邮2.0』发布”
“【 在 wangxiaobupt 的大作中提到: 】 : 成功了没 : 就是这段代码 import requests header = {'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8', 'Accept-Encodi…”
“【 在 wangxiaobupt 的大作中提到: 】 : 成功了没 : 刚正在试,用你的方法,加上'X-Requested-With': 'XMLHttpRequest'之后,确实可以登录,但是还是不能得到主页面的HTML代码啊”
“【 在 wangxiaobupt 的大作中提到: 】 : 我当时写的 : req=urllib2.Request(url='http://bbs.byr.cn/user/ajax_login.json',headers={"X-Requested-With": "XMLHttpRequest"},data=login_…”
“【 在 wangxiaobupt 的大作中提到: 】 : 你把headers加上我那块试试 ok,好的,试试”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。