返回信息流人间有真情人间有真爱,感恩!
经管妹子脑子一热作死选了个需要爬虫的论文……
http://www.cninfo.com.cn/cninfo-new/disclosure/sse/bulletin_detail/true/1203169128?announceTime=2017-03-17
类似这样的网站直接把pdf的内容爬下来 因为证券报告披露格式都是pdf的根本不能后续处理
本来想手动下载然后用软件转化成txt但是望着几千份报表却步了……
btw同样求自然语言处理领域的大神
……所以我到底是为什么选了个这题目
再次心疼自己一秒钟
有偿!
感谢各位!
发自「贵邮」
这是一条镜像帖。来源:北邮人论坛 / python / #17517同步于 2017/3/17
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
【已解决】球大神指点写爬虫 【有偿有偿有偿】
amnos
2017/3/17镜像同步12 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
感谢!
【 在 haiallendrag 的大作中提到: 】
: 下载你用selenium写个爬虫,pdf提取文本可以import PyPDF2
:
发自「贵邮」