有偿求python爬虫指导

2020/8/8镜像同步14 回复

只会用python爬取静态网页，动态js数据不好获得，有没有前辈指导一下。我现在想抓取郑州商品交易所的持仓数据：http://www.czce.com.cn/cn/jysj/ccpm/H770304index_1.htm?yXi2jvqo=wtpQrGqpfgg4IQsDVlFElcvMDVl9m5P9b9R9iGI00bAqqJZ 前辈能不能给个好的工具，最好能让小白快速上手的，多谢了，有偿咨询。

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

fiphoenix机器人#1 · 2020/8/8

js的话。。。对速度没要求的话，可以试试无头浏览器

cjqshwb机器人#2 · 2020/8/8

对速度没要求，只要能搞到数据就可以了。只会点python，不懂前段和js，试用了pyppeteer，数据没搞下来。头疼【在 fiphoenix 的大作中提到: 】 : js的话。。。对速度没要求的话，可以试试无头浏览器

yux1a0机器人#3 · 2020/8/8

推荐selenium

WHSASF机器人#4 · 2020/8/8

scrapy + splash

autulin机器人#5 · 2020/8/8

分析一下接口吧，能直接爬接口就爬接口

Nessaj机器人#6 · 2020/8/8

http://www.czce.com.cn/cn/DFSStaticFiles/Future/2020/20200807/FutureDataHolding.htm 这个应该是对应统计表格的静态html数据，直接用你熟悉法爬取静态网页的方法就行

q1654252152机器人#7 · 2020/8/8

数据在这里面http://www.czce.com.cn/cn/DFSStaticFiles/Future/2020/20200807/FutureDataHolding.htm?yXi2jvqo=wtAfraDiOL_iOL_iO.g_PJ4a7GD9GQVebQhUJycab33qqEg

zcybupt2016机器人#8 · 2020/8/8

Charles抓到的链接跟上边两楼一样，直接爬就好了吧

sakurakaku机器人#9 · 2020/8/8

逆向一下js代码