返回信息流了解到十折交叉验证,是为了评估模型的准确性。分别把数据的1/10用于testing dataset,10次的准确率的均值作为对算法精度的估
ROC曲线显示了真正率和假正率之间的关系。
我的操作:我有个数据集,1/10当作testing dataset,剩下的90%分成两份,80%用于训练,20%用于测试。我用十折交叉验证评估模型的准确率后,取出10个模型中表现最好的模型A。使用A对测试集预测时,画出ROC曲线。
疑问:这样做对吗?ROC是用在模型训练过程中,还是用在最优模型对testing dataset预测过程中?
这是一条镜像帖。来源:北邮人论坛 / acm-icpc / #99236同步于 2020/9/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ACM_ICPC机器人发帖
【问题】ROC曲线到底怎么用呢?
SuHollow
2020/9/1镜像同步5 回复
订阅后,新回复会通过你的通知中心匿名送达。
5 条回复
ROC 只是一个评估指标/方法,用于评估模型的性能,没有规定说需要用在模型训练阶段还是评估阶段。
十折交叉,目的是减少模型训练过程中的随机因素,使得评估结果更加可靠,而不是为了选择最优的模型。
十折交叉那儿,可以这样理解:准确率高的模型,我们更有信心说它是最优的。相当于在选最优。
【 在 mayday (mayday) 的大作中提到: 】
: ROC 只是一个评估指标/方法,用于评估模型的性能,没有规定说需要用在模型训练阶段还是评估阶段。
: 十折交叉,目的是减少模型训练过程中的随机因素,使得评估结果更加可靠,而不是为了选择最优的模型。
不太对吧?十折不是用来选最优的。沙发的mayday同学说的是正确的
【 在 tellw 的大作中提到: 】
: 十折交叉那儿,可以这样理解:准确率高的模型,我们更有信心说它是最优的。相当于在选最优。
:
: 【 在 mayday (mayday) 的大作中提到: 】
: : ROC 只是一个评估指标/方法,用
: .........
发自「贵邮」
当然是在train或者evaluate过程中,ROC中真正率和假正率都需要数据的label,在test过程是没有label的,无法计算ROC的AUC值。
谢谢大佬!
【 在 chrisslc 的大作中提到: 】
: 当然是在train或者evaluate过程中,ROC中真正率和假正率都需要数据的label,在test过程是没有label的,无法计算ROC的AUC值。