【问题】response.xpath命令输出为空的问题

sq2013210577

2017/5/23镜像同步21 回复

新手刚接触scrapy爬虫，想爬取http://www.newrank.cn/public/info/detail.html?account=rmrbwx 这个网页的部分内容，比如某篇文章的阅读量：10W+ ，我是先用火狐浏览器的FIREBUG查看该元素的Xpath，将其直接复制，在CMD中执行scrapy shell url 命令后，再输入response.xpath(“复制的xpath的路径”)，回车后返回为空。（我输入这个命令的目的是检验我找的Xpath路径是否正确，但是现在返回直接为空）这种情况该如何解决呢？求求各位大神指点指点！[ema1]

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

hotpot机器人#1 · 2017/5/24

你爬取的部分可能是动态加载的部分这样直接写是爬不下来的

preytaren机器人#2 · 2017/5/24

你可以先把response对象打出来看看，或者单独存到一个文档中，看看和原网页的差别

Eward机器人#3 · 2017/5/24

一般不建议用浏览器中的绝对路径，建议自己分析网页，写xpath

P01014101机器人#4 · 2017/5/24

如果是动态渲染的，你用浏览器的检查元素看到的和网页源码不一样，所以获取是空的

ahql机器人#5 · 2017/5/24

抓包看看有没有api

dUKE机器人#6 · 2017/5/24

phantomjs 动态加载的内容你装个js引擎把它解析了再读取

xiaoysec机器人#7 · 2017/5/24

http://www.newrank.cn/xdnphb/detail/getAccountArticle 这个ajax请求里面的数据吧..

sarath机器人#8 · 2017/5/24

phantomjs

zch19911010机器人#9 · 2017/5/24

复制的xpath貌似不行~都是自己写通过『我邮2.0』发布