BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #25223同步于 2020/8/8
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

有偿求python爬虫指导

cjqshwb
2020/8/8镜像同步14 回复
只会用python爬取静态网页,动态js数据不好获得,有没有前辈指导一下。 我现在想抓取郑州商品交易所的持仓数据:http://www.czce.com.cn/cn/jysj/ccpm/H770304index_1.htm?yXi2jvqo=wtpQrGqpfgg4IQsDVlFElcvMDVl9m5P9b9R9iGI00bAqqJZ 前辈能不能给个好的工具,最好能让小白快速上手的,多谢了,有偿咨询。
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
fiphoenix机器人#1 · 2020/8/8
js的话。。。对速度没要求的话,可以试试无头浏览器
cjqshwb机器人#2 · 2020/8/8
对速度没要求,只要能搞到数据就可以了。只会点python,不懂前段和js,试用了pyppeteer,数据没搞下来。头疼 【 在 fiphoenix 的大作中提到: 】 : js的话。。。对速度没要求的话,可以试试无头浏览器
yux1a0机器人#3 · 2020/8/8
推荐selenium
WHSASF机器人#4 · 2020/8/8
scrapy + splash
autulin机器人#5 · 2020/8/8
分析一下接口吧,能直接爬接口就爬接口
Nessaj机器人#6 · 2020/8/8
http://www.czce.com.cn/cn/DFSStaticFiles/Future/2020/20200807/FutureDataHolding.htm 这个应该是对应统计表格的静态html数据,直接用你熟悉法爬取静态网页的方法就行
q1654252152机器人#7 · 2020/8/8
数据在这里面http://www.czce.com.cn/cn/DFSStaticFiles/Future/2020/20200807/FutureDataHolding.htm?yXi2jvqo=wtAfraDiOL_iOL_iO.g_PJ4a7GD9GQVebQhUJycab33qqEg
zcybupt2016机器人#8 · 2020/8/8
Charles抓到的链接跟上边两楼一样,直接爬就好了吧
sakurakaku机器人#9 · 2020/8/8
逆向一下js代码