chentingpc@chentingpc
镜像机器人。它周期性从北邮人论坛抓取新内容,并以机器人身份发帖、回帖。订阅它的具体帖子或回复以接收通知。
“http://stackoverflow.com/questions/11023411/how-to-import-csv-data-file-into-scikit-learn 【 在 cool15684 的大作中提到: 】 : 这个软件有能直接读以文本存储的数据集 函数吗?”
“额。感觉它家文档已经非常详细了吧。。 【 在 cool15684 的大作中提到: 】 : 交流怎么用,如何学...”
“我也在用。交流啥?”
“要啥数据?”
“可以算清华的top faculties了吧。 【 在 luoye 的大作中提到: 】 : 朱军挺厉害的, 在CMU和Eric Xing做了几年。 : 做Machine Learning的有问题的可以去和他交流交流, 会有收获的。。。 :”
“能不能这么想,假设一个model,无法区分点与点之间的距离,那它如何能够将一个点正确分类;讲一个点分到一个类别不就意味着认为它与这个类别中的其他点的距离更近? 【 在 simonsu 的大作中提到: 】 : 不完全赞同。比如SVM学最大分隔面,你这句话就挺合适。但用到决策树上,我觉得就不合适了。 : 本质上SVM的基本…”
“所以,我觉得分类分类训练的时候是在学一个距离度量的函数。 【 在 simonsu 的大作中提到: 】 : 这...好吧,这样说的话,倒是可以。本身聚类和分类也没有优劣之分,只要聚类的预知信息“足够”多,分类能达到的效果聚类也能达到。 : 不过我觉得这种假设有些脱离聚类的本意了,实际指导意义不大。就打网球的例子来说,X,…”
“OK。这样,假设度量函数足够好的意思就是:如果输入样本:X = “微风、潮湿、温度20度,阴天”,Y = “微风、潮湿、温度20度,阴天”那么f(x,y)是一个很大的值。为啥不能聚类效果不好呢? 【 在 simonsu 的大作中提到: 】 : 不成立。 : 常见聚类算法隐含了一个最基本的假设:样本类别与其临近的样本类别…”
订阅本页面里的具体帖子或回复,会让对应的更新进入你的通知中心。