BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / www-technology / #12093同步于 2011/1/9
该镜像源已超过 30 天没有更新,可能在源站已被删除。
WWWTechnology机器人发帖

求大牛赐教关于HTTP协议的问题

poplin
2011/1/9镜像同步16 回复
我知道http协议中get是获取资源的开始,但是我怎么才能知道这个get是获取一个网页开始还是某个网页中的资源的,我知道解析URL可以看出来是获取js,css,图片之类的东西,但是看看网页缓存的时候也能看到一些资源是以网页形式保存(所谓的html格式)的,那我应该如何辨别哪些资源是一个网页的开始? 不知道我表述清楚没,希望大牛们赐教啊
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
wks机器人#1 · 2011/1/9
什么是“开始”呢?用英文怎么说?怎么定义? (昨天刚看过HTTP……) 如果说开始是指“top level”,那么,没办法吧。因为从HTTP的角度,一个图片并不是一个网页的一部分,只是获取一个网页(html),然后发现里面引用了一个jpg,然后再发个GET去获取那个jpg图片而已吧。注意到一个图片、js、css可以被很多html共享。
poplin机器人#2 · 2011/1/10
【 在 wks 的大作中提到: 】 : 什么是“开始”呢?用英文怎么说?怎么定义? : (昨天刚看过HTTP……) : 如果说开始是指“top level”,那么,没办法吧。因为从HTTP的角度,一个图片并不是一个网页的一部分,只是获取一个网页(html),然后发现里面引用了一个jpg,然后再发个GET去获取那个jpg图片而已吧。注意到一个图片、js、css可以被很多html共享。 感谢你的回复,我在解包的时候遇到的问题,我发现打开一个网页,里面的数据包含有很多html这我就纳闷了,对于解包的人来说我并不知道这些html是一个独立的页面还是只是一个某个页面的资源的?我应该如何区别?
xw2423机器人#3 · 2011/1/10
解析http响应头的Content-Type就知道是什么了 【 在 poplin (pop) 的大作中提到: 】 : 感谢你的回复,我在解包的时候遇到的问题,我发现打开一个网页,里面的数据包含有很多html这我就纳闷了,对于解包的人来说我并不知道这些html是一个独立的页面还是只是一个某个页面的资源的?我应该如何区别?
poplin机器人#4 · 2011/1/10
【 在 xw2423 的大作中提到: 】 : 解析http响应头的Content-Type就知道是什么了 可是很多页面资源都是Content-Type:text/html,这些资源并不能作为一个网页的起始资源啊。一个网页首先传过来的资源是text/html吧,但是text/html并不能作为一个网页起始的标志,我觉得应该还有别的条件,请大牛们赐教啊!!
liaowang11机器人#5 · 2011/1/10
我没看懂, LZ举个例子来看看吧.
poplin机器人#6 · 2011/1/10
【 在 liaowang11 的大作中提到: 】 : 我没看懂, LZ举个例子来看看吧. 比如,点击某个网页的链接时,游览器会打开一个新的网页,此时用get命令回传的第一组数据包是一个该网页的html(也就是我说的起始资源),接着游览器解析该网页的html发现里面需要一个资源,该资源存在形式也是html,于是游览器又向服务器发出get请求。问题是第一个get命令获取的是该网页的第一个资源(html),而第二个get命令则是该网页数的第N个资源(html)。从解包的角度来看两种数据包的HTTP头是一样的,就是URL不一样。怎么区分这两类数据包呢?或者直接点,如何才能从HTTP包中得知游览器正在打开一个新的网页?
xw2423机器人#7 · 2011/1/10
什么叫起始资源 【 在 poplin (pop) 的大作中提到: 】 : 可是很多页面资源都是Content-Type:text/html,这些资源并不能作为一个网页的起始资源啊。一个网页首先传过来的资源是text/html吧,但是text/html并不能作为一个网页起始的标志,我觉得应该还有别的条件,请大牛们赐教啊!!
BookMoth机器人#8 · 2011/1/10
比如我用google搜byr,设置的是在当前页面打开链接。那么点击byr的链接就会替换google的搜索结果页。 Q:哪个是你所谓的第一个页面?google.com,搜索结果页,还是byr的首页? 【 在 poplin (pop) 的大作中提到: 】 : 比如,点击某个网页的链接时,游览器会打开一个新的网页,此时用get命令回传的第一组数据包是一个该网页的html(也就是我说的起始资源),接着游览器解析该网页的html发现里面需要一个资源,该资源存在形式也是html,于是游览器又向服务器发出get请求。问题是第一个get�
poplin机器人#9 · 2011/1/10
【 在 BookMoth 的大作中提到: 】 : 比如我用google搜byr,设置的是在当前页面打开链接。那么点击byr的链接就会替换google的搜索结果页。 : Q:哪个是你所谓的第一个页面?google.com,搜索结果页,还是? 可能我没表述清楚,我说的是如何从数据包中判断一个网页数据包的起始问题。搜索结果页的起始数据包,和byr首页的起始数据包。这些是怎么判断的?