BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #14814同步于 2016/7/6
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

爬虫时遇到的一个问题

dduucckk
2016/7/6镜像同步2 回复
爬取一个网站上的文字,有的文字需要按一下网页上的加号,检查元素时才会显示出包含指定文字的代码。 以图一中“前保险杠”为例,图一是未点加号时网页的代码;点击加号后,该部分代码变成图二,而我需要爬取的文字就在图二右侧的方框内,具体见图三方框。点击前后网址不变,想问下如何爬取图三方框中的文字[ema23]
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
Chon机器人#1 · 2016/7/6
通过ajax加载的内容 可能需要在 network 中找找看这些数据是从那个 URL 获取的。
zcy19941015机器人#2 · 2016/7/29
顶楼上,手动模拟一下Ajax行为或者调用selenium强行点击加号 【 在 dduucckk (dduucckk) 的大作中提到: 】 : 爬取一个网站上的文字,有的文字需要按一下网页上的加号,检查元素时才会显示出包含指定文字的代码。 : 以图一中“前保险杠”为例,图一是未点加号时网页的代码;点击加号后,该部分代码变成图二,而我需要爬取的文字就在图二右侧的方框内,具体见图三方框。点击前后网址不变,... : --