BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / cpp / #88730同步于 2015/9/22
该镜像源已超过 30 天没有更新,可能在源站已被删除。
CPP机器人发帖

c语言获取网页内容怎么得到动态加载后的

chenxiansf
2015/9/22镜像同步20 回复
新手求教 我在程序里发送http请求获得了源码,如果想获得js什么的改变后的网页实际显示的内容,怎么搞? 只用c行不行
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
FromSixToTen机器人#1 · 2015/9/23
你想干嘛?
chenxiansf机器人#2 · 2015/9/23
只是好奇啊。之前有同学要复制多个网页内容, 然后我查资料后写了获取网页源码的程序,但是我又试了其他一些网页,比如论坛这种,那些动态生成的文本我就不知道怎么搞出来了 【 在 FromSixToTen 的大作中提到: 】 : 你想干嘛?
FromSixToTen机器人#3 · 2015/9/23
什么意思? 【 在 chenxiansf 的大作中提到: 】 : 只是好奇啊。之前有同学要复制多个网页内容, 然后我查资料后写了获取网页源码的程序,但是我又试了其他一些网页,比如论坛这种,那些动态生成的文本我就不知道怎么搞出来了
chenxiansf机器人#4 · 2015/9/23
我是新手啊,不知道有的地方有没有说错。我的意思是我想把一个网页打开后可见文本全部搞下来,但是直接查看源代码的话有的文本没有,我觉得可能是js动态生成的。所以我想能不能直接获取网页完全加载后的内容,而不是简单的网页源代码 【 在 FromSixToTen 的大作中提到: 】 : 什么意思?
FromSixToTen机器人#5 · 2015/9/23
有些东西是用文字难以描述清楚的。你要清楚什么是动态网页,什么是静态网页。动态网页的初始化过程、交互过程。 【 在 chenxiansf 的大作中提到: 】 : 我是新手啊,不知道有的地方有没有说错。我的意思是我想把一个网页打开后可见文本全部搞下来,但是直接查看源代码的话有的文本没有,我觉得可能是js动态生成的。所以我想能不能直接获取网页完全加载后的内容,而不是简单的网页源代码
chenxiansf机器人#6 · 2015/9/23
这个我不怎么清楚,那就像论坛首页这样的网页呢,查看源代码的话只能得到边上的文本,对于首页上各个版面的标题文本能不能直接获取呢 【 在 FromSixToTen 的大作中提到: 】 : 有些东西是用文字难以描述清楚的。你要清楚什么是动态网页,什么是静态网页。动态网页的初始化过程、交互过程。 发自「贵邮」
FromSixToTen机器人#7 · 2015/9/23
你可以右键保存一下网页源码,然后查看一下跟你获取的网页源码的差别。其实你想做的东西类似于一个浏览器。 【 在 chenxiansf 的大作中提到: 】 : 这个我不怎么清楚,那就像论坛首页这样的网页呢,查看源代码的话只能得到边上的文本,对于首页上各个版面的标题文本能不能直接获取呢 : 发自「贵邮」
nuanyangyang机器人#8 · 2015/9/23
如果懒的话,请抓m.byr.cn,不含javascript。而且,试试w3m这个工具,可以直接把正文打印出来,而不是html代码。
nuanyangyang机器人#9 · 2015/9/23
演示一下: $ w3m -dump m.byr.cn 北邮人论坛手机版 北邮人论坛 o 用户名: [ ] o 密码: [ ] o [ ]记住我 [登录] o 十大热门话题 o 1|93年研一gg征女友,期待缘来如此。(有王道!!)(74) o 2|【短跑队招新】北京邮电大学校短跑队招新啦!(53) o 3|7年感情,翻越千山万水,眼看修成正果,没有败给时间,没有败给(30) o 4|古月歌欠,一直很喜欢他(29) o 5|[手机]小米4c 有人打算买吗(24) o 6|快结婚了,却高兴不起来(23) o 7|[问题]求问工程硕士和工学硕士的区别。。。希望详细些(20) o 8|你们玩的最多的英雄是啥(17) o 9|【求问】浴室快递点如此猖狂,究竟是谁在背后给他撑腰(13) o 10|Frozen Memory 定格,稍纵即逝的瞬间(10) 选择讨论区 [ ] [GO] 首页|分区|热推 BYR-Team(C)2010