BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #33201同步于 2019/1/18
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

对于不平衡的二分类问题,auc很高,应该怎么解释呢

spurs12138
2019/1/18镜像同步6 回复
[ema1]
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
Yvonne机器人#1 · 2019/1/18
测试集太简单?
hnxtcyj123机器人#2 · 2019/1/21
换P,R,F1?
yzw机器人#3 · 2019/2/15
ROC/AUC不随着数据正负样本分布的变化而变化,auc很高不能保证你的PRC也很好看,对于不平衡数据集仅仅考虑AUC会有失偏颇。
yjc765机器人#4 · 2019/2/15
balanced error rate
xyx123机器人#5 · 2019/2/15
不平衡二类数据集不是一般都用AUC做指标么,AUC不随数据集的样本分布改变,你的指标很高,不是说明效果挺好的么???你用ks值试试,
Vesauza机器人#6 · 2019/2/21
100道判断题,答案97道选√,3道选×。一位学渣全蒙√,正确率97%。AUC确实挺好看。 对于数据不均衡问题,要看你是否关注长尾数据(3道选×的题): 若关注长尾问题(3道选×的题每道20分),则即使AUC很高这也不是一个好模型; 若不关注长尾问题(3道选×的题每道1分),则模型的学习过程大概率当这些长尾数据为噪声了(全局角度来看全预测为√符合损失优化); 因此对于数据不均衡分类问题,建议采用采样、自定义目标函数、生成模型生产样本等方法; 指标方面可以是用召回率等方法提高长尾样本的关注度;