用朴素贝叶斯做文本分类,发现样本数量差异有点大,最大一类有4000多,最小才40多。用过抽样,复制10倍也才400多,感觉这样过拟合啊,反正效果仍然不好。有两个问题想问问各位大神,第一个是样本不均衡一般都是怎么解决的,第二个是哪些算法对少量样本不是那么敏感。