研究机器学习到底在研究什么？

2017/3/10镜像同步20 回复

LZ自觉未入门机器学习，有点想不通，可能观点偏激，勿喷。。。。就个人举例而言，最近老板说要在项目中引入机器学习功能，于是我学习了一下Scikit的使用方式，然后把常见算法的原理了解了一遍（只是直觉上理解了，比如LR大概是通过梯度下降找出一条分割曲线，SVM大概是在高阶找出分割平面，至于后面的数学原理，Who cares?!），然后就选了一种算法应用到项目中，调了一段时间的参数，包括属性选择之类的，最后性能准确率啥的都还不错。。。于是我就成了老板眼中的机器学习高手（Execuse Me？）说到底，现在关于机器学习的开源框架，算法库满天飞，一直想不明白那些说研究机器学习的到底在研究什么？找出新的算法嘛？还是想着怎么提高性能？或者再具体一点，假如说我想进一步深入学习的话，是把各个算法后面的数学原理全部搞通弄懂？但是然后呢，应用的时候其实别人都已经实现了不是嘛？重要的还是怎么选取合适的特征和参数吧，但是这个除了实践，也没有什么可以理论学习的吧。。。

订阅后，新回复会通过你的通知中心匿名送达。

9 条回复

melot机器人#1 · 2017/3/10

当应用一个模型到实际项目中时，可能你把参数调到最优效果也不好，而当前模型是已知此种情况下的最优模型，所以你之后可能就要对模型加以少许修改，使其适应你的项目，如果改得好，使也适应其他场景，基本上整理一下，可以发篇很好的paper了，当然，以上都是我瞎说的，如果有什么意见，你TM来打我呀

Mrxiaobai机器人#2 · 2017/3/10

同疑惑。进楼学习。

HB0318机器人#3 · 2017/3/10

所以你需要去互联网企业感受一下真正的机器学习前沿方向。

hx0502001机器人#4 · 2017/3/10

需要看论文，通过『我邮2.0』发布

hwz2311245机器人#5 · 2017/3/10

嗯。。。并不打算转机器学习方向。。。所以会有局外人的困惑吧。。【在 HB0318 的大作中提到: 】 : 所以你需要去互联网企业感受一下真正的机器学习前沿方向。

simonsu机器人#6 · 2017/3/10

lZ的这套逻辑其实套用到任何一个应用型技术都适用，可以尝试一下把“机器学习”替换为“C++”,“JAVA”，“数据库”，“NLP”；远一点还可以用在“机械”，“电子”，“医学”。。。 LZ有疑惑本质上还是实验室对于效果的要求严格程度不够高，遇到的实际问题不够多，所以会有种感觉：有了工具，这个事情并不难，至少并不需要深究细节。而如果LZ需要对一个百分点，甚至0.1个百分点去提升时，研究机器学习的意义才会显露出来。比如说，“然后就选了一种算法应用到项目中，调了一段时间的参数，包括属性选择之类的，最后性能准确率啥的都还不错”，其实这里面是有很多待完善的东西的。 -- 为什么选择了这种算法，这种算法有没有问题，有其他更适合的算法吗？如果没有，可以自己设计一个算法吗？ -- 调了什么参数会有什么影响，用什么方法调参数，在多大的数据集上调参数，最终的参数是否合理？ -- 选择了什么属性，是否适合已选择的模型，根据模型特点和数据规模是否考虑增加更细粒度/更高阶的属性？ -- 性能准确率怎么再继续提升？怎么在当前准确率限制下做出可以实用的系统？研究机器学习，本质上研究的就是上述问题。研究的过程中理论和实践是缺一不可的。【在 hwz2311245 的大作中提到: 】 : LZ自觉未入门机器学习，有点想不通，可能观点偏激，勿喷。。。。 : 就个人举例而言，最近老板说要在项目中引入机器学习功能，于是我学习了一下Scikit的使用方式，然后把常见算法的原理了解了一遍（只是直觉上理解了，比如LR大概是通过梯度下降找出一条分割曲线，SVM大概是在高阶找出分割平面，至于后面的数学原理，Who cares?!），然后就选了一种算法应用到项目中，调了一段时间的参数，包括属性选择之类的，最后性能准确率啥的都还不错。。。于是我就成了老板眼中的机器学习高手（Execuse Me？） : 说到底，现在关于机器学习的开源框架，算法库满天飞，一直想不明白那些说研究机器学习的到底在研究什么？找出新的算法嘛？还是想着怎么提高性能？ : ...................

tygxy001机器人#7 · 2017/3/10

那企业是什么样子的呢【在 HB0318 的大作中提到: 】 : 所以你需要去互联网企业感受一下真正的机器学习前沿方向。

lzj0218机器人#8 · 2017/3/10

进楼学习

CherryBlake机器人#9 · 2017/3/10

666 【在 simonsu 的大作中提到: 】 : lZ的这套逻辑其实套用到任何一个应用型技术都适用，可以尝试一下把“机器学习”替换为“C++”,“JAVA”，“数据库”，“NLP”；远一点还可以用在“机械”，“电子”，“医学”。。。 : LZ有疑惑本质上还是实验室对于效果的要求严格程度不够高，遇到的实际问题不够多，所以会有种感觉：有了工具，这个事情并不难，至少并不需要深究细节。而如果LZ需要对一个百分点，甚至0.1个百分点去提升时，研究机器学习的意义才会显露出来。 : 比如说，“然后就选了一种算法应用到项目中，调了一段时间的参数，包括属性选择之类的，最后性能准确率啥的都还不错”，其实这里面是有很多待完善的东西的。