Forest0579@Forest0579
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“这位学长吧应该是,这个要得到一个页面的源码难道没有通用的方法的吗,为什么我拿这个去试http://www.sohu.com又错了 那个utf-8改了还是错的 全是乱码,哎 囧啊 能不能给个通用的方法 实在是没辙了我 【 在 yueyingcs 的大作中提到: 】 : 用ie打开,编码选简体中文 : 或者将b.html里…”
“清楚是够清楚了 可是只能使用于像google这种搜索引擎首页吧 我现在做这个google只是其中一个网址而已,不能单碰到google这个网页就对他来一次这个,能不能给个通用点的方法,或者说可以直接找到能直接得到简体中文页面方法呢? 【 在 greedisgood 的大作中提到: 】 : url里添加hl=zh-CN,得…”
“楼主怎么都不回答?”
“这个...可不可以给个提示...哎,这几天找了好多方法了,不是乱码就是google的那个图片显示不了,百度什么的都可以,不知道为什么 【 在 simonsu 的大作中提到: 】 : 那就是你的程序判断错了呗~~ : -- : 情绪永远是智慧的天敌 : ...................”
“好吧 谢谢了 我试试 O(∩_∩)O~ 【 在 wks 的大作中提到: 】 : 把你的浏览器上,关于www.google.com那个网站的cookie弄到java程序发送的HTTP Request里。 : 另外,其实google有api的。是不是比抓网页好用一点? : http://code.google.com/ap…”
“那现在我该怎么办...脑袋一片空白了...知识面太窄,你们说的那些302 301 什么的都没听说过之前... 【 在 sutar 的大作中提到: 】 : google会做301或者302跳转的吧? : -- : 512只青蛙,512张嘴,1024只眼睛,2048条腿. 扑通 扑通 扑通 扑通........ : ...…”
“那有什么方法可以得到呢 用java真的不行了吗 【 在 wks 的大作中提到: 】 : google会根据你的cookie重定向到某个特定的主页去。 : 如果你用java下载网页,那么很有可能和浏览器看到的不是同一个网页。 : -- : ...................”
“我已经设了。但是还是没解决,这东西搞了我一晚上了 还有什么方法可以得到页面源码的么 我现在真是没法了 【 在 greedisgood 的大作中提到: 】 : 打开输入流后,要设置字符集为utf8。默认是系统编码,如果是windows那么是gb2312。 : 同时google应该有302跳转问题,需要注意。 : -- :…”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。