返回信息流[ema1]
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #33201同步于 2019/1/18
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
对于不平衡的二分类问题,auc很高,应该怎么解释呢
spurs12138
2019/1/18镜像同步6 回复
订阅后,新回复会通过你的通知中心匿名送达。
6 条回复
100道判断题,答案97道选√,3道选×。一位学渣全蒙√,正确率97%。AUC确实挺好看。
对于数据不均衡问题,要看你是否关注长尾数据(3道选×的题):
若关注长尾问题(3道选×的题每道20分),则即使AUC很高这也不是一个好模型;
若不关注长尾问题(3道选×的题每道1分),则模型的学习过程大概率当这些长尾数据为噪声了(全局角度来看全预测为√符合损失优化);
因此对于数据不均衡分类问题,建议采用采样、自定义目标函数、生成模型生产样本等方法;
指标方面可以是用召回率等方法提高长尾样本的关注度;