BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #29871同步于 2018/6/5
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

【问题】计算机视觉任务的数据集有没有需求的上限?

day1224
2018/6/5镜像同步33 回复
假设我有5000万道路目标检测的数据集,如果使用5000万数据训练的模型和用2000万数据训练的同一模型,精度没有进一步提升,那么是不是说,2000万数据集就超过了该特定任务下此模型的数据集需求上限? 如何定义是否达到数据集需求的上限,以及进一步采集数据的策略?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
chuanshanjia机器人#1 · 2018/6/5
一般来讲,数据量越大精度上限应该越高,没有见过数据需求上限的分析,楼主提到的情况,会否是5000w要求更强大的学习能力,或者至少需要更多学习步长? 拙见拙见,抛砖引玉了
jaegerstar机器人#2 · 2018/6/5
应该说2000w够用了,记得在哪里看过数据集的大小和效果是一个log关系
Cap机器人#3 · 2018/6/5
楼主的头像论坛里能抓出来10个?
BYD21机器人#4 · 2018/6/5
PAC学习理论了解一下,不过讲的是机器学习的模型容量和需要的样本量的关系,你用的应该是深度学习的模型吧,对于深度学习感觉PAC不够用,解释起来比较困难。
day1224机器人#5 · 2018/6/6
自动驾驶场景,采集标注数据集比较困难,如果量级上亿,就需要考虑是否进一步采集标注 【 在 chuanshanjia (csj007) 的大作中提到: 】 : 一般来讲,数据量越大精度上限应该越高,没有见过数据需求上限的分析,楼主提到的情况,会否是5000w要求更强大的学习能力,或者至少需要更多学习步长? : 拙见拙见,抛砖引玉了
day1224机器人#6 · 2018/6/6
哈哈 之前想换的 【 在 Cap (【毕剑团】二护法 https://rocketeer.tk/) 的大作中提到: 】 : 楼主的头像论坛里能抓出来10个?
day1224机器人#7 · 2018/6/6
感谢 对于深度学习来说,一般网络越深,需求数据量越大,但是就想知道有没有个上限 【 在 BYD21 (陪你去浪漫的远古遗迹) 的大作中提到: 】 : PAC学习理论了解一下,不过讲的是机器学习的模型容量和需要的样本量的关系,你用的应该是深度学习的模型吧,对于深度学习感觉PAC不够用,解释起来比较困难。
day1224机器人#8 · 2018/6/6
是log关系,不过还是想知道有没有上限,如果能有理论分析就好了,不过没找到这样的文章 【 在 jaegerstar (jaegerstar) 的大作中提到: 】 : 应该说2000w够用了,记得在哪里看过数据集的大小和效果是一个log关系
andy9999678机器人#9 · 2018/6/6
怎么知道是你模型不够用呢?