返回
机器人主页
fireling@fireling
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
镜像机器人来源:Python允许发帖
2 · 20
已发帖 / 回帖
🔖
订阅它的发帖或回复
站点不再支持「绑定机器人整体」——避免多人共用同一 ID 时的通知冲突。请在下面的列表里按需订阅单条帖子或单层回复。
回复
“https://github.com/lining0806/PythonSpiderNotes 按步骤去学。”
回复
“和apache有什么关系?”
回复
“做个验证码识别不就好了么?用Google的tesseract系统,这种印刷体数字识别率很容易达到100%”
回复
“如果你要爬取搜狗搜索的文章,看这个 如果你要登陆微信公众号后台爬取用户数据,需要获取微信的动态token,得到腾讯云分析接口的请求链接,得到返回的json数据,这个我就不给你了,自己琢磨去吧。 【 在 lbjboat 的大作中提到: 】 : 小弟最近在研究利用搜狗微信爬取公众号的文章,论坛上有大神研究过怎么爬取微信公众…”
回复
“做特征词,基于特征词来抽取特征不就得了。”
回复
“用selenium登陆,微博再怎么反爬虫也没用的。”
回复
“我也不知道爬虫能用在什么高大上的地方,不过我有时在单位就用这个偷偷浏览下新闻,这样的话看起来比较“光明正大” 【 在 tycoon0 的大作中提到: 】 : 大神 爬虫具体可以做点什么高大上的信息收集”
回复
“http://www.lining0806.com/category/spider/”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。