求推荐一款方便的下载工具

kingstone

2012/11/7镜像同步10 回复

想把一个网站的全部资源按照网站原本的目录结构完整下载，如果是ftp服务器的话我知道可以用很多工具实现，我遇到的是HTTP服务器，迅雷貌似只能从下载一个目录下的全部文件，若目录下还有目录就不行了。请问大家有什么好的办法或工具推荐么？

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

binux机器人#1 · 2012/11/7

wget

kingstone机器人#2 · 2012/11/7

多谢binux！我发帖前就在想找你的话肯定知道，迅雷那么多资源都被你搞定了[em21] 【在 binux 的大作中提到: 】 : wget

wks机器人#3 · 2012/11/9

[wget] (http://www.gnu.org/software/wget/) Think: - What is a directory? - Are there any directories on any HTTP servers? - How do you know if there is a directory? - We are on http://bbs.byr.cn/article/WWWTechnology/18051 . So, is /article/WWWTechnology *really* a directory? Ask @xw2423 if unsure. - If you are sure /foo/bar *is* a directory, how do you *list* that directory? Can you do "ls" or "dir" using HTTP as you can do with FTP? - If you cannot list a directory, how do you know what files are available there, or are there any files at all? - How a typical Web browser load a page? If you use Google Chrome, try pressing F12, then press the "network" tab, then open a web page.

kingstone机器人#4 · 2012/11/9

谢谢@wks wget我用过了很好用这几个问题我之前没有很好的想过用chrome看了下没看出什么端倪之前我一直以为HTTP的路径跟实际目录结构是对应的关系 wordpress里好像也确实是这样的请问这样理解的问题在哪里？【在 wks 的大作中提到: 】 : [wget] (http://www.gnu.org/software/wget/) : Think: : - What is a directory? : ...................

xw2423机器人#5 · 2012/11/9

http的请求和服务器的实际目录没有太大关系。。。【在 kingstone (柯南) 的大作中提到: 】 : 谢谢@wks wget我用过了很好用这几个问题我之前没有很好的想过用chrome看了下没看出什么端倪之前我一直以为HTTP的路径跟实际目录结构是对应的关系 wordpress里好像也确实是这样的请问这样理解的问题在哪里？

kingstone机器人#6 · 2012/11/10

额看来我之前的理解有问题是不是说这个帖子上的WWWTechnology和类似于18079这些其实是对应的后台数据库的两个字段不知道这样理解对不对？【在 xw2423 的大作中提到: 】 : http的请求和服务器的实际目录没有太大关系。。。 :

sutar机器人#7 · 2012/11/10

WWWTechnology 和 18079 对于后端来说只是 uri segment 罢了至于后端的资源怎么安排那就是 router 的事情了，跟数据库的字段没什么关系【在 kingstone 的大作中提到: 】 : 额看来我之前的理解有问题是不是说这个帖子上的WWWTechnology和类似于18079这些其实是对应的后台数据库的两个字段不知道这样理解对不对？

kingstone机器人#8 · 2012/11/10

这里的router指的不是传统的路由器吧？想了解这方面技术的话看哪类资料好呢？【在 sutar 的大作中提到: 】 : WWWTechnology 和 18079 对于后端来说只是 uri segment 罢了 : 至于后端的资源怎么安排那就是 router 的事情了，跟数据库的字段没什么关系 :

wks机器人#9 · 2012/11/10

其实URL只是浏览器发送给服务器的一个字符串而已。服务器看到的其实只是这样： GET /article/WWWTechnology/post/18080 HTTP/1.1 Host: bbs.byr.cn User-Agent: Mozilla/5.0 (X11; Linux x86_64; rv:16.0) Gecko/20100101 Firefox/16.0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: en-US,en;q=0.5 Accept-Encoding: gzip, deflate Connection: keep-alive 然后，服务器向客户端发什么，客户端就以为article/WWWTechnology/post/18080这个所谓的“文件”的内容是什么。所以，结论：服务器展现给客户端的可能是真的文件系统（比如提供静态文件），也可能完全是虚构的。【在 kingstone 的大作中提到: 】 : 额看来我之前的理解有问题是不是说这个帖子上的WWWTechnology和类似于18079这些其实是对应的后台数据库的两个字段不知道这样理解对不对？