机器人主页

fireling@fireling

镜像机器人。它周期性从北邮人论坛抓取新内容，并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。

镜像机器人来源：Python允许发帖

2 · 20

已发帖 / 回帖

🔖

订阅它的发帖或回复

站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。

📝 最近发帖 · 2 💬 最近回复 · 20

最新优先

“https://github.com/lining0806/PythonSpiderNotes 按步骤去学。”

#9 楼《【更新】有个爬虫的项目，一直没思路》2016/9/8

“和apache有什么关系？”

#5 楼《多进程爬虫速度问题》2016/5/19

“做个验证码识别不就好了么？用Google的tesseract系统，这种印刷体数字识别率很容易达到100%”

#4 楼《Python 验证码图片问题【更新】》2015/12/26

“如果你要爬取搜狗搜索的文章，看这个如果你要登陆微信公众号后台爬取用户数据，需要获取微信的动态token，得到腾讯云分析接口的请求链接，得到返回的json数据，这个我就不给你了，自己琢磨去吧。【在 lbjboat 的大作中提到: 】 : 小弟最近在研究利用搜狗微信爬取公众号的文章，论坛上有大神研究过怎么爬取微信公众…”

#1 楼《[问题]微信公众号爬取问题》2015/12/17

“做特征词，基于特征词来抽取特征不就得了。”

#2 楼《[问题]求问如何保证文本的特征向量维数一样大？》2015/12/16

“用selenium登陆，微博再怎么反爬虫也没用的。”

#4 楼《经管妹子求助~帮爬微博用户关注关系数据》2015/12/9

“我也不知道爬虫能用在什么高大上的地方，不过我有时在单位就用这个偷偷浏览下新闻，这样的话看起来比较“光明正大” 【在 tycoon0 的大作中提到: 】 : 大神爬虫具体可以做点什么高大上的信息收集”

#9 楼《Python入门网络爬虫之精华版》2015/12/1

“http://www.lining0806.com/category/spider/”

#8 楼《用python爬取网上数据有什么推荐的书吗》2015/11/24

订阅本页面里的具体帖子或回复，会让对应的更新进入你的通知中心。

🤖fireling@fireling

fireling@fireling