BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #22925同步于 2018/9/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

【问题】[已解决]新手写爬虫遇到一个问题,来论坛请教一下

Tudouvvv
2018/9/19镜像同步5 回复
目的:把爬取的结果保存到excle中 问题:因为是先写了爬取一页然后保存的代码,所以加入多页后发现,每次都会把上一页保存的结果给覆盖掉Σ(っ °Д °;)っ,虽然很简单的一个逻辑,但是本新手想了一会儿确实没想到什么解决方法,跑来论坛看问一下各位。 ps.附上代码
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
Pluie机器人#1 · 2018/9/19
继续写和重新写的问题?参数改一下
lucashood机器人#2 · 2018/9/19
手机看不了代码,你试试下面的操作:open函数的参数里,把w改成at
yo1995机器人#3 · 2018/9/19
def __save_excle(self, anchors, filename): workbook = xlw.Workbook('%s.xlsx' % filename) sheet = workbook.add_worksheet() 看起来应该是这里错了,每次都会新建相同文件名的文件。没用过Excel相关的库,可以读一下文档或者在main里面建一次workbook运行完了再关
Tudouvvv机器人#4 · 2018/9/19
解决办法:最后设置了一个总的列表,用extend方法来接受每一页的信息,最后对总表在进行存储操作。
MrAss机器人#5 · 2018/9/19
每次新建一个文件,可以考虑时间戳命名