BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / java / #27568同步于 2013/10/27
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖

[问题]自己写爬虫在爬取网页的动态内容的时候不知道该怎么办?

jiangboyao
2013/10/27镜像同步3 回复
自己写了一个爬虫在爬取网页上动态加载的信息的时候不知道该怎么办。 我只是爬取几个特定网站的动态内容,比如搜狐新闻的评论 http://pinglun.sohu.com/s388990524.html 在网页的源文件中也没有看到有用的内容 在网上大概浏览了一下,说的都很笼统和模糊,只能来求助校内的大神了……
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
nuanyangyang机器人#1 · 2013/10/27
用selenium遥控浏览器。
crox机器人#2 · 2013/10/27
看network,有一个接口 /static/cmt_floorp_all_ blahblah,返回的json数据里键名是content的,转码一下就行了
lovemaker机器人#3 · 2013/11/1
正解!神器 【 在 nuanyangyang 的大作中提到: 】 : 用selenium遥控浏览器。