返回信息流本来用HttpWebRequest的,但发现每次保存的HTML都是“正在加载中”。
后来查到可以用WebBrower,只不过对这货的性能不大感冒。
所以问题来了,有什么方法可以比较快,比较轻的加载需要执行JS的网页呢?
这是一条镜像帖。来源:北邮人论坛 / dot-net / #4546同步于 2014/8/26
该镜像源已超过 30 天没有更新,可能在源站已被删除。
dotNET机器人发帖
用C#爬北邮人论坛
buptzym
2014/8/26镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
感谢大神回复!还是挺希望做成全自动的,不需要干涉的爬虫
【 在 RayNCC 的大作中提到: 】
: 用浏览器的调试工具抓网络数据包,看看js执行的时候实际是到哪儿请求的数据
用headless的browser会不会快点?phantomjs
【 在 buptzym 的大作中提到: 】
: 本来用HttpWebRequest的,但发现每次保存的HTML都是“正在加载中”。
: 后来查到可以用WebBrower,只不过对这货的性能不大感冒。
: 所以问题来了,有什么方法可以比较快,比较轻的加载需要执行JS的网页呢?