返回信息流java小白一枚,跪求各位大神一个问题:如何用java抓取需要用户登录的网页信息?跪谢!
这是一条镜像帖。来源:北邮人论坛 / java / #38265同步于 2015/1/21
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖
求大神指导!——关于java爬虫的问题
laoxinmelo
2015/1/21镜像同步14 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
先用httpclient取得HTML页面,再用jsoup解析它就可以了啊,最好先熟悉一下http协议,如果需要模拟网页动作,比如登陆的话可以用selenium,网上有很多博客,看看就会了
【 在 laoxinmelo (Melon) 的大作中提到: 】
: java小白一枚,跪求各位大神一个问题:如何用java抓取需要用户登录的网页信息?跪谢!
通过『我邮2.0』发布
想着先把java学好再接触python..
【 在 nuanyangyang 的大作中提到: 】
: 楼主学学Python?或者shell script
表示不hi用jsoup啊!大神能够稍微指点一下吗?感谢!
【 在 shuian0930 的大作中提到: 】
: 先用httpclient取得HTML页面,再用jsoup解析它就可以了啊,最好先熟悉一下http协议,如果需要模拟网页动作,比如登陆的话可以用selenium,网上有很多博客,看看就会了
:
: 通过『我邮2.0』发布
分析登录的请求原理,用HTTPClient构造请求提交表单,然后保存Cookie
【 在 laoxinmelo (Melon) 的大作中提到: 】
: java小白一枚,跪求各位大神一个问题:如何用java抓取需要用户登录的网页信息?跪谢!
【 在 laoxinmelo 的大作中提到: 】
: java小白一枚,跪求各位大神一个问题:如何用java抓取需要用户登录的网页信息?跪谢!
我现在也在搞这方面的内容,一起啊。。。可以用jsoup来抓取网页并分析,但是我不知道LZ是想要先模拟网关登录后,来抓取呢?还是直接就抓取网页信息?