返回信息流大牛们好,想请教个小问题~
比如说这个网址里(http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed&cmd=link&linkname=pubmed_pubmed&uid=15988478),它显示的是相关的102条记录里的前20条记录,最下面有"Next>"和"Last>>"两个超链接,我以前接触过一点HTML的皮毛,想编个程序抓取网页,可是看了以下的代码之后发现还是找不到点了next以后到底转到哪个网址去了[em23]
(我看到这样一句话:“href="#" ,以及其他的一些代码,请问这些是数据库?PHP?还是什么,为什么点了NEXT之后会切换到新的网页去?)
</div>
<div class="title_and_pager">
<div class="pagination"><span title="Inactive first page of results" class="inactive page_link"><< First</span><span title="Inactive previous page of results" class="inactive page_link prev">< Prev</span><h3 class="page">Page 1</h3><a name="EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Entrez_Pager.Page" title="Next page of results" class="active page_link next" href="#" sid="3" page="2" id="EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Entrez_Pager.Page">Next ></a><a name="EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Entrez_Pager.Page" title="Last page of results" class="active page_link" href="#" sid="4" page="8" id="EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Entrez_Pager.Page">Last >></a><input name="EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Entrez_Pager.CurrPage" sid="1" type="hidden" value="1" /></div>
<div><h2 class="result_count">Results: 1 to 20 of 143</h2><span id="result_sel" class="nowrap"></span><input name="EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Pubmed_ResultsController.ResultCount" sid="1" type="hidden" value="143" /><input name="EntrezSystem2.PEntrez.Pubmed.Pubmed_ResultsPanel.Pubmed_ResultsController.RunLastQuery" sid="1" type="hidden" /></div>
</div>
这是一条镜像帖。来源:北邮人论坛 / www-technology / #11850同步于 2010/12/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
WWWTechnology机器人发帖
请教:这个next和last的超链接是怎样实现的?
firegun
2010/12/11镜像同步8 回复
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
【 在 firegun 的大作中提到: 】
: 大牛们好,想请教个小问题~
: 比如说这个网址里(http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed&cmd=link&linkname=pubmed_pubmed&uid=15988478),它显示的是相关的102条记录里的前20条记录,最下面有"Next>"和"Last>>"两个超链接,我以前接触过一点HTML的皮毛,想编个程序抓取网页,可是看了以下的代码之后发现还是找不到点了next以后到底转到哪个网址去了
: (我看到这样一句话:“href="#" ,以及其他的一些代码,请问这些是数据库?PHP?还是什么,为什么点了NEXT之后会切换到新的网页去?)
: ...................
这个是楼上所说的数据源分页。
根据你的点击的次数,给服务器端一个当前页数的请求变量,服务器端在进行重新改变SQL,取出新纪录,生成新的HTML,然后返回给浏览器。
【 在 ericyosho 的大作中提到: 】
: 你每一次按一下next或者prev,就会提交一个表单,整个页面里面那么多hidden 的 <input> 呢。
: --
多谢楼上各位指导~还想问一下~有没有可能通过自己编程生成这个提交的表单呢,这些hidden的发送给服务器端的<input>在源代码里都能找的到吧?
【 在 wangjianzhou 的大作中提到: 】
: 有些页数的请求变量是通过查询字符串传递的,直接改URL的相应位置即可,你这个也是,仔细看下,貌似可以。
: --
哦,我后来看了下这个网站的使用手册,发现确实可以~
只是对于到底给网站提交了什么表单比较感兴趣,这个不知道能不能通过改URL以外的办法实现,用SOCKET?
抓网页用curl不就好了么?
【 在 firegun 的大作中提到: 】
: 大牛们好,想请教个小问题~
: 比如说这个网址里(http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed&cmd=link&linkname=pubmed_pubmed&uid=15988478),它显示的是相关的102条记录里的前20条记录,最下面有"Next>"和"Last>>"两个超链接,我以前接触过一点HTML的皮毛,想编个程序抓取网页,可是看了以下的代码之后发现还是找不到点了next以后到底转到哪个网址去了
: (我看到这样一句话:“href="#" ,以及其他的一些代码,请问这些是数据库?PHP?还是什么,为什么点了NEXT之后会切换到新的网页去?)
: ...................