BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #8871同步于 2015/9/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

Python抓取局部页面的内容

inxa
2015/9/30镜像同步9 回复
我想要爬的网站是这个http://guide.qyer.com/,就是右下角的那一坨东西。 但是现在的问题就是点了翻页之后页面本身的HTML并没有刷新,所以就无从得到翻页之后的内容了。 我看了一眼这几行的源码,大概是这样的: <a data-bn-ipg="pages-3" href="javascript:jncomment.ajax_update_page(5)" class='ui_page_item'>5</a> <a data-bn-ipg="pages-4" href="javascript:jncomment.ajax_update_page(14)" class='ui_page_item' title="...14">...14</a> <a data-bn-ipg="pages-5" href="javascript:jncomment.ajax_update_page(2)" class='ui_page_item ui_page_next' title="下一页">下一页</a> 所以问题来了,我之前也没接触过jsp,查了一早上也没有找到什么入手点,所以还请大神来点播一些这个情况应该从哪里入手去找那些内容?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
gx92512机器人#1 · 2015/9/30
selenium + Phantomjs
binux机器人#2 · 2015/9/30
你查了一早上还不知道这个东西和 jsp 没关系?
trouvan机器人#3 · 2015/10/1
手动分析ajax请求呗 【 在 inxa (黄黄) 的大作中提到: 】 : 我想要爬的网站是这个http://guide.qyer.com/,就是右下角的那一坨东西。 : 但是现在的问题就是点了翻页之后页面本身的HTML并没有刷新,所以就无从得到翻页之后的内容了。 : 我看了一眼这几行的源码,大概是这样的: : ................... 通过『我邮2.0』发布
kuangfengwin机器人#4 · 2015/10/1
动态网页,selenuim吧。。虽然我也不会
fanzhidiao机器人#5 · 2015/10/1
firebug分析一下,不懂 发自「贵邮」
Alyyyyyy机器人#6 · 2015/10/1
我赌五毛楼主是在做网络搜索引擎的作业。我爬的bilibili的局部,也失败了。现在准备深入的研究下这个问题
inxa机器人#7 · 2015/10/1
是啊。。。头大,好烦 【 在 Alyyyyyy 的大作中提到: 】 : 我赌五毛楼主是在做网络搜索引擎的作业。我爬的bilibili的局部,也失败了。现在准备深入的研究下这个问题 : 发自「贵邮」
icybee机器人#8 · 2015/10/1
FormData: action:ajaxgpage page:3 orderway:
Alyyyyyy机器人#9 · 2015/10/1
【 在 inxa 的大作中提到: 】 : 是啊。。。头大,好烦 : : 发自「贵邮」 那我赢了,五毛拿来。[ema0]