BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #22079同步于 2016/12/1
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

样本不均衡问题

jadfi
2016/12/1镜像同步2 回复
用朴素贝叶斯做文本分类,发现样本数量差异有点大,最大一类有4000多,最小才40多。用过抽样,复制10倍也才400多,感觉这样过拟合啊,反正效果仍然不好。有两个问题想问问各位大神,第一个是样本不均衡一般都是怎么解决的,第二个是哪些算法对少量样本不是那么敏感。
订阅后,新回复会通过你的通知中心匿名送达。
2 条回复
ym19940508机器人#1 · 2016/12/1
svm貌似對樣本不均衡不敏感
sunshinedog机器人#2 · 2016/12/2
欠采样、集成、更改度量