求大牛赐教关于HTTP协议的问题

2011/1/9镜像同步16 回复

我知道http协议中get是获取资源的开始，但是我怎么才能知道这个get是获取一个网页开始还是某个网页中的资源的，我知道解析URL可以看出来是获取js,css,图片之类的东西，但是看看网页缓存的时候也能看到一些资源是以网页形式保存（所谓的html格式）的，那我应该如何辨别哪些资源是一个网页的开始？不知道我表述清楚没，希望大牛们赐教啊

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

wks机器人#1 · 2011/1/9

什么是“开始”呢？用英文怎么说？怎么定义？（昨天刚看过HTTP……）如果说开始是指“top level”，那么，没办法吧。因为从HTTP的角度，一个图片并不是一个网页的一部分，只是获取一个网页（html），然后发现里面引用了一个jpg，然后再发个GET去获取那个jpg图片而已吧。注意到一个图片、js、css可以被很多html共享。

poplin机器人#2 · 2011/1/10

【在 wks 的大作中提到: 】 : 什么是“开始”呢？用英文怎么说？怎么定义？ : （昨天刚看过HTTP……） : 如果说开始是指“top level”，那么，没办法吧。因为从HTTP的角度，一个图片并不是一个网页的一部分，只是获取一个网页（html），然后发现里面引用了一个jpg，然后再发个GET去获取那个jpg图片而已吧。注意到一个图片、js、css可以被很多html共享。感谢你的回复，我在解包的时候遇到的问题，我发现打开一个网页，里面的数据包含有很多html这我就纳闷了，对于解包的人来说我并不知道这些html是一个独立的页面还是只是一个某个页面的资源的？我应该如何区别？

xw2423机器人#3 · 2011/1/10

解析http响应头的Content-Type就知道是什么了【在 poplin (pop) 的大作中提到: 】 : 感谢你的回复，我在解包的时候遇到的问题，我发现打开一个网页，里面的数据包含有很多html这我就纳闷了，对于解包的人来说我并不知道这些html是一个独立的页面还是只是一个某个页面的资源的？我应该如何区别？

poplin机器人#4 · 2011/1/10

【在 xw2423 的大作中提到: 】 : 解析http响应头的Content-Type就知道是什么了可是很多页面资源都是Content-Type：text/html,这些资源并不能作为一个网页的起始资源啊。一个网页首先传过来的资源是text/html吧，但是text/html并不能作为一个网页起始的标志，我觉得应该还有别的条件，请大牛们赐教啊！！

liaowang11机器人#5 · 2011/1/10

我没看懂, LZ举个例子来看看吧.

poplin机器人#6 · 2011/1/10

【在 liaowang11 的大作中提到: 】 : 我没看懂, LZ举个例子来看看吧. 比如，点击某个网页的链接时，游览器会打开一个新的网页，此时用get命令回传的第一组数据包是一个该网页的html（也就是我说的起始资源），接着游览器解析该网页的html发现里面需要一个资源，该资源存在形式也是html，于是游览器又向服务器发出get请求。问题是第一个get命令获取的是该网页的第一个资源（html），而第二个get命令则是该网页数的第N个资源（html）。从解包的角度来看两种数据包的HTTP头是一样的，就是URL不一样。怎么区分这两类数据包呢？或者直接点，如何才能从HTTP包中得知游览器正在打开一个新的网页？

xw2423机器人#7 · 2011/1/10

什么叫起始资源【在 poplin (pop) 的大作中提到: 】 : 可是很多页面资源都是Content-Type：text/html,这些资源并不能作为一个网页的起始资源啊。一个网页首先传过来的资源是text/html吧，但是text/html并不能作为一个网页起始的标志，我觉得应该还有别的条件，请大牛们赐教啊！！

BookMoth机器人#8 · 2011/1/10

比如我用google搜byr，设置的是在当前页面打开链接。那么点击byr的链接就会替换google的搜索结果页。 Q：哪个是你所谓的第一个页面？google.com,搜索结果页，还是byr的首页？【在 poplin (pop) 的大作中提到: 】 : 比如，点击某个网页的链接时，游览器会打开一个新的网页，此时用get命令回传的第一组数据包是一个该网页的html（也就是我说的起始资源），接着游览器解析该网页的html发现里面需要一个资源，该资源存在形式也是html，于是游览器又向服务器发出get请求。问题是第一个get�

poplin机器人#9 · 2011/1/10

【在 BookMoth 的大作中提到: 】 : 比如我用google搜byr，设置的是在当前页面打开链接。那么点击byr的链接就会替换google的搜索结果页。 : Q：哪个是你所谓的第一个页面？google.com,搜索结果页，还是？可能我没表述清楚，我说的是如何从数据包中判断一个网页数据包的起始问题。搜索结果页的起始数据包，和byr首页的起始数据包。这些是怎么判断的？