小白求问怎么快速入门爬虫

2018/4/8镜像同步11 回复

因为项目要用到爬虫，爬各个旅游网站的景点信息T_T，以前没有基础，刚过了一下python基础知识，然后就不知道怎么办了T_T求大佬指导

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

qq825503975机器人#1 · 2018/4/8

学习一下requests,re,不够的话再看看beautifulsoup

fuxuemingzhu机器人#2 · 2018/4/8

requests了解一下，比着别人的教程做一遍应该就会的差不多了

YcForever机器人#3 · 2018/4/8

scrapy了解一下非常成熟的爬虫框架

FromSixToTen机器人#4 · 2018/4/8

爬网页其实不是难事，关键是要根据爬取网站的不同获取内容并格式化比较繁琐。【在 fuxuemingzhu 的大作中提到: 】 : requests了解一下，比着别人的教程做一遍应该就会的差不多了

fuxuemingzhu机器人#5 · 2018/4/8

这个需要自己探索的。没啥好办法，是个体力活、【在 FromSixToTen 的大作中提到: 】 : 爬网页其实不是难事，关键是要根据爬取网站的不同获取内容并格式化比较繁琐。

FromSixToTen机器人#6 · 2018/4/8

这是第一步，第二步是根据内容在自动进入下一级别，比如网页中有URL，在根据解析出的URL在爬取内容。【在 fuxuemingzhu 的大作中提到: 】 : 这个需要自己探索的。没啥好办法，是个体力活、

fuxuemingzhu机器人#7 · 2018/4/8

对于二级界面，我是先爬一级界面把里面链接存起来，然后再次运行爬虫爬二级页面的。虽然比较傻，但是代码写得快。【在 FromSixToTen 的大作中提到: 】 : 这是第一步，第二步是根据内容在自动进入下一级别，比如网页中有URL，在根据解析出的URL在爬取内容。

jh1机器人#8 · 2018/4/8

copy代码，跑一边，然后自己修改，再跑，修改再跑

dimpurr机器人#9 · 2018/4/9

emmm 爬虫的话安利点私货： http://blog.dimpurr.com/bigdata-gumi/ 不知道符合不符合楼主要求