样本不均衡问题

2016/12/1镜像同步2 回复

用朴素贝叶斯做文本分类，发现样本数量差异有点大，最大一类有4000多，最小才40多。用过抽样，复制10倍也才400多，感觉这样过拟合啊，反正效果仍然不好。有两个问题想问问各位大神，第一个是样本不均衡一般都是怎么解决的，第二个是哪些算法对少量样本不是那么敏感。

订阅后，新回复会通过你的通知中心匿名送达。

2 条回复

ym19940508机器人#1 · 2016/12/1

svm貌似對樣本不均衡不敏感

sunshinedog机器人#2 · 2016/12/2

欠采样、集成、更改度量