BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / cpp / #31403同步于 2009/11/15
该镜像源已超过 30 天没有更新,可能在源站已被删除。
CPP机器人发帖

求助:关于抓取网页信息,http命令的写法

yangxiao
2009/11/15镜像同步7 回复
我现在想用socket获取某网站一些网页的信息,比如sina 在网上查了一下,获取命令可以直接这样写: char* request = "GET / HTTP/1.0\r\nHost: www.sina.com.cn\r\nConnection: Close\r\n\r\n" 但是得到的反馈如下: HTTP/1.0 301 Moved Permanently Date: Sun, 15 Nov 2009 13:52:31 GMT Server: Apache/2.0.63 (Unix) Location: http://www.sina.com.cn/ Cache-Control: max-age=3600 Expires: Sun, 15 Nov 2009 14:52:31 GMT Vary: Accept-Encoding Content-Length: 231 Content-Type: text/html; charset=iso-8859-1 Age: 3486 X-Cache: HIT from cernet-210.sina.com.cn Connection: close <!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN"> <html><head> <title>301 Moved Permanently</title> </head><body> <h1>Moved Permanently</h1> <p>The document has moved <a href="http://www.sina.com.cn/">here</a>.</p> </body></html> 好像是说1.0已经不用了?能不能解释一下1.0是什么意思,以及如何修改。 (2) 我现在想访问的是国外的网站,connect总不能成功,我现在用北邮的代理可以在浏览器上上外网,connect不成功的原因是什么?如果在request中加上使用代理的命令? 第一次做这个东西,问的比较弱,大牛指点~
订阅后,新回复会通过你的通知中心匿名送达。
7 条回复
jmpesp机器人#1 · 2009/11/15
【 在 yangxiao 的大作中提到: 】 : 我现在想用socket获取某网站一些网页的信息,比如sina : 在网上查了一下,获取命令可以直接这样写: : char* request = "GET / HTTP/1.0\r\nHost: www.sina.com.cn\r\nConnection: Close\r\n\r\n" : ................... 1.0 是版本号。 你不能connect外国网站是因为网络连接不到外国去。
yangxiao机器人#2 · 2009/11/15
【 在 jmpesp 的大作中提到: 】 : 1.0 是版本号。 : 你不能connect外国网站是因为网络连接不到外国去。 那可以在命令中加入代理么?
jmpesp机器人#3 · 2009/11/15
【 在 yangxiao 的大作中提到: 】 : 那可以在命令中加入代理么? 当然可以,你可以看下代理协议的怎么封包就ok了
yegle机器人#4 · 2009/11/15
301 去查http respond code的含义 这种工作你重造轮子干嘛?居然从socket开始写… 【 在 yangxiao (木水年华) 的大作中提到: 】 : 我现在想用socket获取某网站一些网页的信息,比如sina : 在网上查了一下,获取命令可以直接这样写: : char* request = "GET / HTTP/1.0\r\nHost: www.sina.com.cn\r\nConnection: Close\r\n\r\n" : ...................
yangxiao机器人#5 · 2009/11/15
【 在 yegle 的大作中提到: 】 : 301 : 去查http respond code的含义 : 这种工作你重造轮子干嘛?居然从socket开始写… 好的,谢了。 没学过VC,C#不够熟悉。。。python、php通通还没来得及学。。。呃 学一门语言的时间还不如用会的写=。=
yegle机器人#6 · 2009/11/15
我告诉你你这个问题在PHP里怎么写 <?php $str = file_get_contents("http://www.sina.com.cn"); ?> 很多东西学之前不要想当然 【 在 yangxiao (木水年华) 的大作中提到: 】 : 好的,谢了。 : 没学过VC,C#不够熟悉。。。python、php通通还没来得及学。。。呃 : 学一门语言的时间还不如用会的写=。= : ...................
yangxiao机器人#7 · 2009/11/15
【 在 yegle 的大作中提到: 】 : 我告诉你你这个问题在PHP里怎么写 : <?php : $str = file_get_contents("http://www.sina.com.cn"); : ................... =。=,谢谢啦~~