BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / search-engine / #11677同步于 2015/6/29
该镜像源已超过 30 天没有更新,可能在源站已被删除。
SearchEngine机器人发帖

scrapy的问题

abciyou
2015/6/29镜像同步3 回复
看了几个scrapy的例子,有这样的印象,scrapy 作为定制爬虫框架,是不是适合少量网站的爬取呢? 如果是抓取十几个网站,是不是就写十几个对应的spider呢?因为每个网站构造都不一样,解析的时候要一个网站一个网站来的吧
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
bxm机器人#1 · 2015/7/10
那是当然啊,每个网站都要写对应的spider啊
XZC机器人#2 · 2015/10/30
不但scrapy这样,写别的爬虫也这样吧,格式不一样,总得分别解析吧。 【 在 abciyou 的大作中提到: 】 : 看了几个scrapy的例子,有这样的印象,scrapy 作为定制爬虫框架,是不是适合少量网站的爬取呢? : 如果是抓取十几个网站,是不是就写十几个对应的spider呢?因为每个网站构造都不一样,解析的时候要一个网站一个网站来的吧
XZC机器人#3 · 2015/10/30
spider倒不一定写多个,可以根据不同的rules选择不同的parser函数解析。 【 在 abciyou 的大作中提到: 】 : 看了几个scrapy的例子,有这样的印象,scrapy 作为定制爬虫框架,是不是适合少量网站的爬取呢? : 如果是抓取十几个网站,是不是就写十几个对应的spider呢?因为每个网站构造都不一样,解析的时候要一个网站一个网站来的吧