返回信息流本人小白,利用xpath helper插件,导演、主演都可以抓取到,为什么电影类型是错误呢?望大神们解救~
x = html.parse('http://www.mtime.com/top/movie/top100_south_korea/')
titles = x.xpath("//h2[@class='px14 pb6']/a/text()")
director = x.xpath("//div[@class='mov_con']/p[1]/a//text()")
actors = x.xpath("//div[@class='mov_con']/p[2]/a//text()")
types=x.xpath("//div[@class='mov_con']/p[3]/a/test()")
XPathEvalError Traceback (most recent call last)<ipython-input-42-a06f0841b19b> in <module>()
6 director = x.xpath("//div[@class='mov_con']/p[1]/a//text()")
7 actors = x.xpath("//div[@class='mov_con']/p[2]/a//text()")
----> 8 types=x.xpath("//div[@class='mov_con']/p[3]/a/test()")
9 print "We got %s titles. Here are the first 5:" % len(titles)
10 for i in range(5):
C:\Python27\lib\site-packages\lxml\etree.pyd in lxml.etree._ElementTree.xpath (src\lxml\lxml.etree.c:57669)()
C:\Python27\lib\site-packages\lxml\etree.pyd in lxml.etree.XPathDocumentEvaluator.__call__ (src\lxml\lxml.etree.c:146579)()
C:\Python27\lib\site-packages\lxml\etree.pyd in lxml.etree._XPathEvaluatorBase._handle_result (src\lxml\lxml.etree.c:144977)()
C:\Python27\lib\site-packages\lxml\etree.pyd in lxml.etree._XPathEvaluatorBase._raise_eval_error (src\lxml\lxml.etree.c:144832)()
XPathEvalError: Invalid expression
改为
types=x.xpath("//div[@class='mov_con']/p[3]")
结果又是没有
[影片1]: 爱,回家 The Way Home (2002)
导演: 李廷香
主演: 金相庆 俞承豪
类型: <Element p at 0x669e1b0>
这是一条镜像帖。来源:北邮人论坛 / python / #8892同步于 2015/10/3
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
利用xpath helper插件,导演、主演都可以抓取到,为什么类型错
HenryBigD
2015/10/3镜像同步7 回复
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
//div[@class='mov_con']/p[3]/span[@class='c_fff']/a[@class='c_fff'] 我把你的xpath 输入到我的插件里面也是 null 这是我的 你试试看
还是一样的
[影片1]: 爱,回家 The Way Home (2002)
导演: 李廷香
主演: 金相庆 俞承豪
类型: <Element a at 0x669e990>
[影片2]: 熔炉 Silenced (2011)
导演: 黄东赫
主演: 俞承豪 金艺芬
类型: <Element a at 0x669ea20>
[影片3]: 老男孩 Old Boy (2003)
导演: 朴赞郁
主演: 金艺芬 孔侑
类型: <Element a at 0x669eea0>
[影片4]: 阳光姐妹淘 Sunny (2011)
导演: 姜炯哲
主演: 孔侑 郑有美
类型: <Element a at 0x669eed0>
【 在 adobereader 的大作中提到: 】
: //div[@class='mov_con']/p[3]/span[@class='c_fff']/a[@class='c_fff'] 我把你的xpath 输入到我的插件里面也是 null 这是我的 你试试看
我建议你用ide单步调试
【 在 HenryBigD (HenryBigD) 的大作中提到: 】
: 本人小白,利用xpath helper插件,导演、主演都可以抓取到,为什么电影类型是错误呢?望大神们解救~
: x = html.parse('http://www.mtime.com/top/movie/top100_south_korea/')
: titles = x.xpath("//h2[@class='px14 pb6']/a/text()")
: ...................
通过『我邮2.0』发布
最好加个/text()啊亲
【 在 adobereader 的大作中提到: 】
: //div[@class='mov_con']/p[3]/span[@class='c_fff']/a[@class='c_fff'] 我把你的xpath 输入到我的插件里面也是 null 这是我的 你试试看
我也是小白 请问楼主 你抓取了titles,director,actors,types这四个量,怎么让这四个量显示在同一部电影里,而不是这四个量分开显示
我是简单的for循环数组显示
【 在 huangxin1993 (岛是海的眼泪) 的大作中提到: 】
: 我也是小白 请问楼主 你抓取了titles,director,actors,types这四个量,怎么让这四个量显示在同一部电影里,而不是这四个量分开显示
发自〖iBYR-iOS客户端〗