返回信息流刚刚研二,研究生的方向是机器学习。研一出去实习了一段时间,发现实际上大部分工作都在做数据挖掘,找feature 的工作,和想象中的不大一样。加上老板给的任务也是分布式的机器学习平台相关的东西,所以想明年找工作时去做分布式机器学习平台的开发。虽然还有一年时间,但是扣掉实验室的活还有刷题什么的,剩下的时间也不多了。所以想问下如果希望找这样的工作(比如度厂的基础架构部),现在需要准备什么?
这是一条镜像帖。来源:北邮人论坛 / java / #52692同步于 2016/8/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖
想做分布式机器学习平台的相关工作,应该怎么准备?
hyx2011
2016/8/30镜像同步11 回复
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
【 在 libenchao 的大作中提到: 】
: 看一下MapReduce、Spark、HDFS实现原理,最好能深入到代码级别。
语言方面需要细看么?我看好像大部分都是 c++ 或者 java ,但是感觉深入看语言也需要很长时间
如果做分布式相关的开发的话,那选择会多一点。
如果只指定分布式计算,靠谱的就是百度的INF和阿里的阿里云(ODPS等)这种部门,其他公司也多多少少有些,但是与前2家还是有明显差距的。
因为是计算,一般对实时性要求会比较高,所以编程语言基本上是C++。准备的话,就是C++过关,计算机基础过关(操作系统,网络等),Unix环境编程之类的也要折腾下,有一些自己的产出,如果没时间,分布式系统有些概念即可,有时间可以去MIT找些教程(比如 MIT 6.824 ,编程语言Go语言)看看。再找一份大厂的基础架构相关的实习,到时候找人内推指定的部门,运气不太差的话,应该可以拿到百度或阿里这些部门的Offer了。
一直在往这个方向努力。但是好难。
【 在 libenchao 的大作中提到: 】
: 看一下MapReduce、Spark、HDFS实现原理,最好能深入到代码级别。
找实习之前一直想做跟分布式相关的基础架构研发,后来拿到了OceanBase的实习offer并没有去。。。
实习之后,现在更想做java方向了,感觉想找个方向宽一些的。。。
【 在 limingji0503 的大作中提到: 】
: 一直在往这个方向努力。但是好难。
:
其实语言还好吧。
不过并不建议直接看很高版本的代码,核心功能低版本的也都有。
【 在 hyx2011 的大作中提到: 】
:
: 语言方面需要细看么?我看好像大部分都是 c++ 或者 java ,但是感觉深入看语言也需要很长时间
【 在 YouXia 的大作中提到: 】
: 如果做分布式相关的开发的话,那选择会多一点。
: 如果只指定分布式计算,靠谱的就是百度的INF和阿里的阿里云(ODPS等)这种部门,其他公司也多多少少有些,但是与前2家还是有明显差距的。
: 因为是计算,一般对实时性要求会比较高,所以编程语言基本上是C++。准备的话,就是C++过关,计算机基础过关(操作系统,网络等),Unix环境编程之类的也要折腾下,有一些自己的产出,如果没时间,分布式系统有些概念即可,有时间可以去MIT找些教程(比如 MIT 6.824 ,编程语言Go语言)看看。再找一份大厂的基础架构相关的实习,到时候找人内推指定的部门,运气不太差的话,应该可以拿到百度或阿里这些部门的Offer了。
: ...................
半年的时间准备好像有点困难[ema1][ema1]而且想做只是机器学习的计算平台,虽然也不知道和分布式计算有没有什么区别[ema13]
【 在 inaadversity 的大作中提到: 】
: 花几周时间搞定rpc框架,io模型,一致性算法,存储子系统等等
额,只做计算的也要看存储子系统么?