【问题】爬虫数据读取

2017/2/19镜像同步8 回复

我想爬一下数据，但是对于层次分明的表格如何读取是个问题，如： http://www.ccb.com/cn/personal/interest/20150825_1440515878.html 比如一年期的利率，如何获知是对应整存整取一年期，还是对应零存整取一年期？另外求助对于这种表结构的数据，应该如何在mysql中建表呢？非常感谢

订阅后，新回复会通过你的通知中心匿名送达。

8 条回复

sweater机器人#1 · 2017/2/19

能不能转成json格式啥的直接解析。。这个表控制缩进好像是用空格控制的。。

HB0318机器人#2 · 2017/2/20

xpath

sweater机器人#3 · 2017/2/20

Xpath解决不了这种非代码结构的层级问题吧。【在 HB0318 的大作中提到: 】 : xpath

asif12机器人#4 · 2017/2/20

按照缩进判断层级吧

sweater机器人#5 · 2017/2/20

【在 asif12 的大作中提到: 】 : 按照缩进判断层级吧额，老司机有没有更好的方法。。这样好麻烦。。

wojing机器人#6 · 2017/2/20

【在 asif12 的大作中提到: 】 : 按照缩进判断层级吧是啊，不同业务，分开来读

sweater机器人#7 · 2017/2/20

【在 wojing 的大作中提到: 】 : 是啊，不同业务，分开来读没想明白。。

preytaren机器人#8 · 2017/2/21

可以考虑用Xpath分别定位到整存整取和零存整取，再定位到它们后面的兄弟节点