返回信息流读取大数据的文件进行模型训练的时候16G的服务器有时都够呛,同样的数据听说有人通过改进程序可以实现在8个G的笔记本上跑模型,求问是如何实现的
这是一条镜像帖。来源:北邮人论坛 / python / #20767同步于 2018/1/14
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖
跑模型怎么减少内存占用
mingjunbaaa
2018/1/14镜像同步13 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
【 在 mingjunbaaa 的大作中提到: 】
: 读取大数据的文件进行模型训练的时候16G的服务器有时都够呛,同样的数据听说有人通过改进程序可以实现在8个G的笔记本上跑模型,求问是如何实现的
16g的服务器?当然是加内存条了,哈哈,可以试试搞搞hadoop之类的
请教过人家据说是存成其他数据格式,取样时隔行隔列取?反正当时没听懂
【 在 dxy1 (【意涵团】dxy) 的大作中提到: 】
: 16g的服务器?当然是加内存条了,哈哈,可以试试搞搞hadoop之类的
但是训练模型的时候不还是整个数据集进去训练吗
【 在 day1224 (dawner) 的大作中提到: 】
: 1. batch_size 小一点
: 2. 有预训练的话,先把数据丢进预训练的特征层跑一遍把特征存起来
: 以上仅是深度调参的经验
谢谢指导
【 在 jackling (谷西决) 的大作中提到: 】
: 训练反正是一个 batch 进行的, 你不要把所有文件读进来才开始训练模型, 写一个省内存的 dataloader ?