返回信息流假设我有5000万道路目标检测的数据集,如果使用5000万数据训练的模型和用2000万数据训练的同一模型,精度没有进一步提升,那么是不是说,2000万数据集就超过了该特定任务下此模型的数据集需求上限?
如何定义是否达到数据集需求的上限,以及进一步采集数据的策略?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #29871同步于 2018/6/5
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
【问题】计算机视觉任务的数据集有没有需求的上限?
day1224
2018/6/5镜像同步33 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
一般来讲,数据量越大精度上限应该越高,没有见过数据需求上限的分析,楼主提到的情况,会否是5000w要求更强大的学习能力,或者至少需要更多学习步长?
拙见拙见,抛砖引玉了
自动驾驶场景,采集标注数据集比较困难,如果量级上亿,就需要考虑是否进一步采集标注
【 在 chuanshanjia (csj007) 的大作中提到: 】
: 一般来讲,数据量越大精度上限应该越高,没有见过数据需求上限的分析,楼主提到的情况,会否是5000w要求更强大的学习能力,或者至少需要更多学习步长?
: 拙见拙见,抛砖引玉了
哈哈 之前想换的
【 在 Cap (【毕剑团】二护法 https://rocketeer.tk/) 的大作中提到: 】
: 楼主的头像论坛里能抓出来10个?
感谢 对于深度学习来说,一般网络越深,需求数据量越大,但是就想知道有没有个上限
【 在 BYD21 (陪你去浪漫的远古遗迹) 的大作中提到: 】
: PAC学习理论了解一下,不过讲的是机器学习的模型容量和需要的样本量的关系,你用的应该是深度学习的模型吧,对于深度学习感觉PAC不够用,解释起来比较困难。
是log关系,不过还是想知道有没有上限,如果能有理论分析就好了,不过没找到这样的文章
【 在 jaegerstar (jaegerstar) 的大作中提到: 】
: 应该说2000w够用了,记得在哪里看过数据集的大小和效果是一个log关系