返回信息流我已经准备好了训练集的特征向量,请问如何对数据进行预处理,看的资料有的说要离散化属性,不知道具体怎么个规则,求好心人解答
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #12245同步于 2013/12/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
weka菜鸟求教
mengqi
2013/12/19镜像同步3 回复
订阅后,新回复会通过你的通知中心匿名送达。
3 条回复
得把你的数据整理成weka的数据格式少年
http://weka.wikispaces.com/ARFF+%28stable+version%29
然后训练数据的话,我上次找个一个ppt,你参考一下
http://www.unal.edu.co/diracad/einternacional/Weka.pdf
【 在 mengqi 的大作中提到: 】
: 我已经准备好了训练集的特征向量,请问如何对数据进行预处理,看的资料有的说要离散化属性,不知道具体怎么个规则,求好心人解答
arff文件已经生成了,只是分类的准确率比别人的低点,我想是不是数据预处理的问题啊;还有我想用生成的分类模型去检测未知的数据,测试方法是选择supplied test set那一项吗,然后再选择带检测文件是吗?多谢你啦!
【 在 wugh 的大作中提到: 】
: 得把你的数据整理成weka的数据格式少年
: http://weka.wikispaces.com/ARFF+%28stable+version%29
: 然后训练数据的话,我上次找个一个ppt,你参考一下
: ...................
准确率低是不是你的分类方法选择问题呢?
还有可能是特征选取的问题
测试什么的没用过呢。得自己去看官方文档
【 在 mengqi 的大作中提到: 】
: arff文件已经生成了,只是分类的准确率比别人的低点,我想是不是数据预处理的问题啊;还有我想用生成的分类模型去检测未知的数据,测试方法是选择supplied test set那一项吗,然后再选择带检测文件是吗?多谢你啦!