返回信息流我想要爬的网站是这个http://guide.qyer.com/,就是右下角的那一坨东西。
但是现在的问题就是点了翻页之后页面本身的HTML并没有刷新,所以就无从得到翻页之后的内容了。
我看了一眼这几行的源码,大概是这样的:
<a data-bn-ipg="pages-3" href="javascript:jncomment.ajax_update_page(5)" class='ui_page_item'>5</a>
<a data-bn-ipg="pages-4" href="javascript:jncomment.ajax_update_page(14)" class='ui_page_item' title="...14">...14</a>
<a data-bn-ipg="pages-5" href="javascript:jncomment.ajax_update_page(2)" class='ui_page_item ui_page_next' title="下一页">下一页</a>
所以问题来了,我之前也没接触过jsp,查了一早上也没有找到什么入手点,所以还请大神来点播一些这个情况应该从哪里入手去找那些内容?
这是一条镜像帖。来源:北邮人论坛 / python / #8871同步于 2015/9/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
Python抓取局部页面的内容
inxa
2015/9/30镜像同步9 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
手动分析ajax请求呗
【 在 inxa (黄黄) 的大作中提到: 】
: 我想要爬的网站是这个http://guide.qyer.com/,就是右下角的那一坨东西。
: 但是现在的问题就是点了翻页之后页面本身的HTML并没有刷新,所以就无从得到翻页之后的内容了。
: 我看了一眼这几行的源码,大概是这样的:
: ...................
通过『我邮2.0』发布
是啊。。。头大,好烦
【 在 Alyyyyyy 的大作中提到: 】
: 我赌五毛楼主是在做网络搜索引擎的作业。我爬的bilibili的局部,也失败了。现在准备深入的研究下这个问题
:
发自「贵邮」