heamon7@heamon7
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“github搜zhihu,很多 【 在 betough 的大作中提到: 】 : 求给个暗示。。 : 【 在 heamon7 的大作中提到: 】 : : github上已有人做了 : : 发自「贵邮」 : : 发自「贵邮」”
“嗯 【 在 makegccgdb 的大作中提到: 】 : : 【 在 heamon7 的大作中提到: 】 : : Python源码剖析 在向你招手,基于Python2.5 : : 发自「贵邮」 : 是陈儒写的那本吗? : : 发自「贵邮」”
“github上已有人做了 发自「贵邮」”
“Python源码剖析 在向你招手,基于Python2.5 发自「贵邮」”
“呜呜呜呜~~~~(>_<)~~~~ ,HTTP的貌似也是没事确实不会去装哈,可是前两天貌似看到版上有人要贡献端口的”
“【 在 WTF 的大作中提到: 】 : ip池行不通? : 需要登录不要紧,你登录后把cookies存下来,然后下次换个ip,然后set cookies 结果会怎样? cookies失效? : 如果不失效就行的通 嗯,已经尝试更换user-agent不行,还是600p/min,正在尝试用cookie和ip池做,之前用账…”
“【 在 asif12 的大作中提到: 】 : 真的是限制IP访问量吗?难道不是限制单个登陆账号的访问量? : 来自「北邮人论坛手机版」 有试过在单台主机上用几个账号同时爬取,但是几个账号加在一起的爬取速度正好是 600p/min”
“【 在 Chon 的大作中提到: 】 : 并不能。。。 目前分析该网站是利用的Nginx的 HttpLimitReqModul和HttpLimitZoneModule配置 来实现限制IP访问的,这个真的不能突破吗? 那么也就是说全北邮所有人访问该网站只能达到10页/s么? 感觉不科学啊?”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。