BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #22912同步于 2017/3/10
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖

研究机器学习到底在研究什么?

hwz2311245
2017/3/10镜像同步20 回复
LZ自觉未入门机器学习,有点想不通,可能观点偏激,勿喷。。。。 就个人举例而言,最近老板说要在项目中引入机器学习功能,于是我学习了一下Scikit的使用方式,然后把常见算法的原理了解了一遍(只是直觉上理解了,比如LR大概是通过梯度下降找出一条分割曲线,SVM大概是在高阶找出分割平面,至于后面的数学原理,Who cares?!),然后就选了一种算法应用到项目中,调了一段时间的参数,包括属性选择之类的,最后性能准确率啥的都还不错。。。于是我就成了老板眼中的机器学习高手(Execuse Me?) 说到底,现在关于机器学习的开源框架,算法库满天飞,一直想不明白那些说研究机器学习的到底在研究什么?找出新的算法嘛?还是想着怎么提高性能? 或者再具体一点,假如说我想进一步深入学习的话,是把各个算法后面的数学原理全部搞通弄懂?但是然后呢,应用的时候其实别人都已经实现了不是嘛?重要的还是怎么选取合适的特征和参数吧,但是这个除了实践,也没有什么可以理论学习的吧。。。
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
melot机器人#1 · 2017/3/10
当应用一个模型到实际项目中时,可能你把参数调到最优效果也不好,而当前模型是已知此种情况下的最优模型,所以你之后可能就要对模型加以少许修改,使其适应你的项目,如果改得好,使也适应其他场景,基本上整理一下,可以发篇很好的paper了,当然,以上都是我瞎说的,如果有什么意见,你TM来打我呀
Mrxiaobai机器人#2 · 2017/3/10
同疑惑。进楼学习。
HB0318机器人#3 · 2017/3/10
所以你需要去互联网企业感受一下真正的机器学习前沿方向。
hx0502001机器人#4 · 2017/3/10
需要看论文, 通过『我邮2.0』发布
hwz2311245机器人#5 · 2017/3/10
嗯。。。并不打算转机器学习方向。。。所以会有局外人的困惑吧。。 【 在 HB0318 的大作中提到: 】 : 所以你需要去互联网企业感受一下真正的机器学习前沿方向。
simonsu机器人#6 · 2017/3/10
lZ的这套逻辑其实套用到任何一个应用型技术都适用,可以尝试一下把“机器学习”替换为“C++”,“JAVA”,“数据库”,“NLP”;远一点还可以用在“机械”,“电子”,“医学”。。。 LZ有疑惑本质上还是实验室对于效果的要求严格程度不够高,遇到的实际问题不够多,所以会有种感觉:有了工具,这个事情并不难,至少并不需要深究细节。而如果LZ需要对一个百分点,甚至0.1个百分点去提升时,研究机器学习的意义才会显露出来。 比如说,“然后就选了一种算法应用到项目中,调了一段时间的参数,包括属性选择之类的,最后性能准确率啥的都还不错”,其实这里面是有很多待完善的东西的。 -- 为什么选择了这种算法,这种算法有没有问题,有其他更适合的算法吗?如果没有,可以自己设计一个算法吗? -- 调了什么参数会有什么影响,用什么方法调参数,在多大的数据集上调参数,最终的参数是否合理? -- 选择了什么属性,是否适合已选择的模型,根据模型特点和数据规模是否考虑增加更细粒度/更高阶的属性? -- 性能准确率怎么再继续提升?怎么在当前准确率限制下做出可以实用的系统? 研究机器学习,本质上研究的就是上述问题。研究的过程中理论和实践是缺一不可的。 【 在 hwz2311245 的大作中提到: 】 : LZ自觉未入门机器学习,有点想不通,可能观点偏激,勿喷。。。。 : 就个人举例而言,最近老板说要在项目中引入机器学习功能,于是我学习了一下Scikit的使用方式,然后把常见算法的原理了解了一遍(只是直觉上理解了,比如LR大概是通过梯度下降找出一条分割曲线,SVM大概是在高阶找出分割平面,至于后面的数学原理,Who cares?!),然后就选了一种算法应用到项目中,调了一段时间的参数,包括属性选择之类的,最后性能准确率啥的都还不错。。。于是我就成了老板眼中的机器学习高手(Execuse Me?) : 说到底,现在关于机器学习的开源框架,算法库满天飞,一直想不明白那些说研究机器学习的到底在研究什么?找出新的算法嘛?还是想着怎么提高性能? : ...................
tygxy001机器人#7 · 2017/3/10
那企业是什么样子的呢 【 在 HB0318 的大作中提到: 】 : 所以你需要去互联网企业感受一下真正的机器学习前沿方向。
lzj0218机器人#8 · 2017/3/10
进楼学习
CherryBlake机器人#9 · 2017/3/10
666 【 在 simonsu 的大作中提到: 】 : lZ的这套逻辑其实套用到任何一个应用型技术都适用,可以尝试一下把“机器学习”替换为“C++”,“JAVA”,“数据库”,“NLP”;远一点还可以用在“机械”,“电子”,“医学”。。。 : LZ有疑惑本质上还是实验室对于效果的要求严格程度不够高,遇到的实际问题不够多,所以会有种感觉:有了工具,这个事情并不难,至少并不需要深究细节。而如果LZ需要对一个百分点,甚至0.1个百分点去提升时,研究机器学习的意义才会显露出来。 : 比如说,“然后就选了一种算法应用到项目中,调了一段时间的参数,包括属性选择之类的,最后性能准确率啥的都还不错”,其实这里面是有很多待完善的东西的。