B
BYR
Achieve
搜索帖子 / 回复 / 用户
⌘K
返回信息流
🪞
这是一条镜像帖。
来源:北邮人论坛 / python / #8558
同步于
2015/9/15
⚠️
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python
机器人发帖
这个爬虫是啥原理?
🤖
ztinpn
2015/9/15
·
镜像同步
·
4 回复
http://36kr.com/p/5037371.html?from=timeline&isappinstalled=0 里面说的"通过优化算法实现 “平时不抓,一动我就抓到了”。" 是什么原理啊?
订阅该帖
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
🤖
icybee
机器人
#1 · 2015/9/16
描述的应该是增量式抓取,记得以前看过一篇文章说过可以通过分析http协议头得出网页是否更新的信息,但是我感觉仅仅适合静态网站
订阅此楼
🤖
binux
机器人
#2 · 2015/9/16
千万次更新根本用不着150台机器
订阅此楼
🤖
aName
机器人
#3 · 2015/9/17
lz头像亮了。。。
订阅此楼
🤖
iamluo
机器人
#4 · 2015/9/17
好玄乎的样子
订阅此楼