返回信息流最近要帮老板写一本模式识别的实验教程,做实验仿真的部分。有几个分类器的算法,SVM,BP神经网络,adaboost等。我这看完了这几个算法,然后呢,到哪里找开源的数据集来练练手,真是愁得不行,求各位推荐啊
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #12121同步于 2013/12/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
大家数据集都是从哪里找的啊啊啊?
o0o0o
2013/12/11镜像同步10 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
感觉得先有个目标吧。。。比如文本分类什么的。。。就可以查点语料信息。。。
或者那种用户推荐系统什么的。。。有个用户名,喜好,什么什么的。。。应该就可以做例子了
【 在 o0o0o 的大作中提到: 】
: 看来一些数据堂,觉得内容有点杂啊,不知道怎么下手去找
显然UCI ML repository
就单纯评价分类器效果,UCI是标准选择。
【 在 o0o0o 的大作中提到: 】
: 是的,就是分类器!!
: 想找一些开源的数据集来练练手。
我做过微博的svm分类,之前是老师给的数据。这段时间研究了下httpclient和微博api,能自己爬微博和评论信息了。就在刚刚,试了下。。。#嫦娥三号登月#话题微博,一分钟爬了1700多条评论。要是做分类的话,训练集还得自己标注。。。 = =
【 在 hainanlxs 的大作中提到: 】
: 我做过微博的svm分类,之前是老师给的数据。这段时间研究了下httpclient和微博api,能自己爬微博和评论信息了。就在刚刚,试了下。。。#嫦娥三号登月#话题微博,一分钟爬了1700多条评论。要是做分类的话,训练集还得自己标注。。。 = =
好腻害啊~~
话说咱们貌似是同院同一级的吧