返回信息流Supervised Learning
Unsupervised Learning
Semi-supervised learning
这三个的区别,各自优缺点,还有性能
虽然能google到,但是我看了下感觉google的解释让我有点懵懵懂懂,理解不清晰。
请问哪位大牛能够解释一下他们, 并且举一些三种learning 的model的例子呢?
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #12567同步于 2014/3/4
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
Supervised, Unsupervised and semi-supervised 区别
mbym
2014/3/4镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。
4 条回复
假设要做手写数字识别,x是图像,y是label(数字)。
SL:给定{(x,y)},也就是给定数字图像都是有label的。
UL:只给定{(x)},也就是所有数字图像都是没有label的。由于没有给定任何{y},一般其直接学习目标就不是做prediction,可能是个聚类,或者学习潜在表示。
SSL:给定{(x,y)}与{x},也就是有一部分数字图像是有labele的,还有一部分数字图像没有label。可以把这个理解成SL的一个扩展,由于label一般都要用代价获取,所以,对于大数据,一般只会有部分数据有label,可以用SL,但是如何利用没有label的那部分来进一步增强预测效果就是SSL的目标了。
ssl是不是会根据以前的y分类,然后有一个阈值,出现新的y?
【 在 chentingpc 的大作中提到: 】
: 假设要做手写数字识别,x是图像,y是label(数字)。
: SL:给定{(x,y)},也就是给定数字图像都是有label的。
: UL:只给定{(x)},也就是所有数字图像都是没有label的。由于没有给定任何{y},一般其直接学习目标就不是做prediction,可能是个聚类,或者学习潜在表示。
: ...................
简单说来,
监督学习就是你在有标准答案的卷子上做题,然后校对答案,并提高成绩。好处是,准确,结果可信。坏处是,需要付出一定成本(购买参考答案)
无监督学习就是你在没有标准答案的卷子上做题,然后直接判卷。好处是,代价小。坏处是,不够准确,结果可能很好或者很坏,通常不稳定。
半监督学习就是你在语文考试卷上做题,然后校对选择填空答案,最后判卷。好处是,只需要购买选择填空题答案,而不需要购买作文答案(因为没有)比方法1节省代价,比方法2简单。
这里的标准答案就是标注数据集,做题就是判断(如分类等),判卷就是验证准确率和召回率。