做一个scrapy爬虫网站

2016/10/21镜像同步13 回复

想做一个爬虫网站给不懂技术的人用，这样通过在网站上点一个按钮，后台就可以开启爬虫。但是点击按钮到爬虫自动启动这个过程不知道该怎么实现？有大神给我指点一下吗？我的爬虫用的是scrapy框架，爬虫部分已写好。就是不知道该怎么和网站连接起来。 [ema23]

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

a1019866208机器人#1 · 2016/10/21

每个网站结构不一样，你的爬虫能适应所有么……还是我理解错了发自「贵邮」

asif12机器人#2 · 2016/10/21

点击按钮发一个get请求？

quantou808机器人#3 · 2016/10/21

不需要适应所有网站，一个网站就好，就是想通过网站远程控制爬虫【在 a1019866208 的大作中提到: 】 : 每个网站结构不一样，你的爬虫能适应所有么……还是我理解错了 : 发自「贵邮」

quantou808机器人#4 · 2016/10/21

发一个get请求怎么启动爬虫(⊙o⊙)… 【在 asif12 的大作中提到: 】 : 点击按钮发一个get请求？

lzc123ok机器人#5 · 2016/10/21

点击按钮给后端发个请求后端代码执行外部脚本即可发自「贵邮」

Gh0ul机器人#6 · 2016/10/21

pyspider？

quantou808机器人#7 · 2016/10/21

没错，类似于Pyspider那样的【在 Gh0ul 的大作中提到: 】 : pyspider？

quantou808机器人#8 · 2016/10/21

恩恩，有道理【在 lzc123ok 的大作中提到: 】 : 点击按钮给后端发个请求后端代码执行外部脚本即可 : 发自「贵邮」

autulin机器人#9 · 2016/10/21

简单点的直接在后端执行爬虫脚本的运行命令复杂点的需要考虑这么几个问题（暂时想到的）：主要是任务管理机制。比如我按钮点了两次，发送了二次相同的请求，所以得判断上一个爬虫是否结束吧？如果爬虫结束你得告诉前端吧？然后爬虫结束后结果你想怎么返回？