返回信息流想做一个爬虫网站给不懂技术的人用,这样通过在网站上点一个按钮,后台就可以开启爬虫。但是点击按钮到爬虫自动启动这个过程不知道该怎么实现?有大神给我指点一下吗?
我的爬虫用的是scrapy框架,爬虫部分已写好。就是不知道该怎么和网站连接起来。
[ema23]
这是一条镜像帖。来源:北邮人论坛 / python / #16360同步于 2016/10/21
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
做一个scrapy爬虫网站
quantou808
2016/10/21镜像同步13 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
不需要适应所有网站,一个网站就好,就是想通过网站远程控制爬虫
【 在 a1019866208 的大作中提到: 】
: 每个网站结构不一样,你的爬虫能适应所有么……还是我理解错了
: 发自「贵邮」
简单点的直接在后端执行爬虫脚本的运行命令
复杂点的需要考虑这么几个问题(暂时想到的):
主要是任务管理机制。比如我按钮点了两次,发送了二次相同的请求,所以得判断上一个爬虫是否结束吧?如果爬虫结束你得告诉前端吧?然后爬虫结束后结果你想怎么返回?