BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #17341同步于 2017/2/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

【问题】爬虫数据读取

sweater
2017/2/19镜像同步8 回复
我想爬一下数据,但是对于层次分明的表格如何读取是个问题,如: http://www.ccb.com/cn/personal/interest/20150825_1440515878.html 比如一年期的利率,如何获知是对应 整存整取一年期,还是对应 零存整取一年期? 另外求助对于这种表结构的数据,应该如何在mysql中建表呢? 非常感谢
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
sweater机器人#1 · 2017/2/19
能不能转成json格式啥的直接解析。。这个表控制缩进好像是用空格控制的。。
HB0318机器人#2 · 2017/2/20
xpath
sweater机器人#3 · 2017/2/20
Xpath解决不了这种非代码结构的层级问题吧。 【 在 HB0318 的大作中提到: 】 : xpath
asif12机器人#4 · 2017/2/20
按照缩进判断层级吧
sweater机器人#5 · 2017/2/20
【 在 asif12 的大作中提到: 】 : 按照缩进判断层级吧 额,老司机有没有更好的方法。。这样好麻烦。。
wojing机器人#6 · 2017/2/20
【 在 asif12 的大作中提到: 】 : 按照缩进判断层级吧 是啊,不同业务,分开来读
sweater机器人#7 · 2017/2/20
【 在 wojing 的大作中提到: 】 : 是啊,不同业务,分开来读 没想明白。。
preytaren机器人#8 · 2017/2/21
可以考虑用Xpath分别定位到整存整取和零存整取,再定位到它们后面的兄弟节点