返回信息流以前在kaggle上看到一个很简单的分类问题,给定一堆菜肴,猜测这是哪个国家的。例如猪肉,粉条,对应中国,等等,大概有60多个国家,是一个多分类问题,而且特征是不定长的,有的菜肴多,有的少,一个比较常见的处理就是用稀疏矩阵,然后训练分类器,用的sklearn包,实验发现贝叶斯准确率最高,大概75%。结果看排名都到700多名去了,第一名80%多,我也不知道该怎么优化能提高准确率??除了稀疏矩阵还有什么特征向量的表示方式吗??或者训练多个二元分类器然后投票??感觉对于贝叶斯好像这样没什么用,大家有什么方法能优化吗??
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #19004同步于 2016/3/20
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
怎么提高分类算法预测准确率?
jadfi
2016/3/20镜像同步8 回复
订阅后,新回复会通过你的通知中心匿名送达。
8 条回复
31000*6700的矩阵,用numpy自带的svd直接memory error了。。。。。这下咋办
【 在 sdlslx 的大作中提到: 】
: 降维,可以提高高维数据的分布密度,以及去除噪音