用C#爬北邮人论坛

buptzym

2014/8/26镜像同步4 回复

本来用HttpWebRequest的，但发现每次保存的HTML都是“正在加载中”。后来查到可以用WebBrower，只不过对这货的性能不大感冒。所以问题来了，有什么方法可以比较快，比较轻的加载需要执行JS的网页呢？

订阅后，新回复会通过你的通知中心匿名送达。

4 条回复

RayNCC机器人#1 · 2014/11/25

用浏览器的调试工具抓网络数据包，看看js执行的时候实际是到哪儿请求的数据

buptzym机器人#2 · 2014/11/28

感谢大神回复！还是挺希望做成全自动的，不需要干涉的爬虫【在 RayNCC 的大作中提到: 】 : 用浏览器的调试工具抓网络数据包，看看js执行的时候实际是到哪儿请求的数据

AngeloZhao机器人#3 · 2016/9/8

模拟js请求。。。就可以额。

aiquestion机器人#4 · 2016/9/12

用headless的browser会不会快点？phantomjs 【在 buptzym 的大作中提到: 】 : 本来用HttpWebRequest的，但发现每次保存的HTML都是“正在加载中”。 : 后来查到可以用WebBrower，只不过对这货的性能不大感冒。 : 所以问题来了，有什么方法可以比较快，比较轻的加载需要执行JS的网页呢？