BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / java / #52692同步于 2016/8/30
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Java机器人发帖

想做分布式机器学习平台的相关工作,应该怎么准备?

hyx2011
2016/8/30镜像同步11 回复
刚刚研二,研究生的方向是机器学习。研一出去实习了一段时间,发现实际上大部分工作都在做数据挖掘,找feature 的工作,和想象中的不大一样。加上老板给的任务也是分布式的机器学习平台相关的东西,所以想明年找工作时去做分布式机器学习平台的开发。虽然还有一年时间,但是扣掉实验室的活还有刷题什么的,剩下的时间也不多了。所以想问下如果希望找这样的工作(比如度厂的基础架构部),现在需要准备什么?
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
libenchao机器人#1 · 2016/8/30
看一下MapReduce、Spark、HDFS实现原理,最好能深入到代码级别。
hyx2011机器人#2 · 2016/8/31
【 在 libenchao 的大作中提到: 】 : 看一下MapReduce、Spark、HDFS实现原理,最好能深入到代码级别。 语言方面需要细看么?我看好像大部分都是 c++ 或者 java ,但是感觉深入看语言也需要很长时间
YouXia机器人#3 · 2016/8/31
如果做分布式相关的开发的话,那选择会多一点。 如果只指定分布式计算,靠谱的就是百度的INF和阿里的阿里云(ODPS等)这种部门,其他公司也多多少少有些,但是与前2家还是有明显差距的。 因为是计算,一般对实时性要求会比较高,所以编程语言基本上是C++。准备的话,就是C++过关,计算机基础过关(操作系统,网络等),Unix环境编程之类的也要折腾下,有一些自己的产出,如果没时间,分布式系统有些概念即可,有时间可以去MIT找些教程(比如 MIT 6.824 ,编程语言Go语言)看看。再找一份大厂的基础架构相关的实习,到时候找人内推指定的部门,运气不太差的话,应该可以拿到百度或阿里这些部门的Offer了。
limingji0503机器人#4 · 2016/8/31
一直在往这个方向努力。但是好难。 【 在 libenchao 的大作中提到: 】 : 看一下MapReduce、Spark、HDFS实现原理,最好能深入到代码级别。
libenchao机器人#5 · 2016/8/31
找实习之前一直想做跟分布式相关的基础架构研发,后来拿到了OceanBase的实习offer并没有去。。。 实习之后,现在更想做java方向了,感觉想找个方向宽一些的。。。 【 在 limingji0503 的大作中提到: 】 : 一直在往这个方向努力。但是好难。 :
libenchao机器人#6 · 2016/8/31
其实语言还好吧。 不过并不建议直接看很高版本的代码,核心功能低版本的也都有。 【 在 hyx2011 的大作中提到: 】 : : 语言方面需要细看么?我看好像大部分都是 c++ 或者 java ,但是感觉深入看语言也需要很长时间
hyx2011机器人#7 · 2016/8/31
【 在 YouXia 的大作中提到: 】 : 如果做分布式相关的开发的话,那选择会多一点。 : 如果只指定分布式计算,靠谱的就是百度的INF和阿里的阿里云(ODPS等)这种部门,其他公司也多多少少有些,但是与前2家还是有明显差距的。 : 因为是计算,一般对实时性要求会比较高,所以编程语言基本上是C++。准备的话,就是C++过关,计算机基础过关(操作系统,网络等),Unix环境编程之类的也要折腾下,有一些自己的产出,如果没时间,分布式系统有些概念即可,有时间可以去MIT找些教程(比如 MIT 6.824 ,编程语言Go语言)看看。再找一份大厂的基础架构相关的实习,到时候找人内推指定的部门,运气不太差的话,应该可以拿到百度或阿里这些部门的Offer了。 : ................... 半年的时间准备好像有点困难[ema1][ema1]而且想做只是机器学习的计算平台,虽然也不知道和分布式计算有没有什么区别[ema13]
inaadversity机器人#8 · 2016/8/31
花几周时间搞定rpc框架,io模型,一致性算法,存储子系统等等
hyx2011机器人#9 · 2016/8/31
【 在 inaadversity 的大作中提到: 】 : 花几周时间搞定rpc框架,io模型,一致性算法,存储子系统等等 额,只做计算的也要看存储子系统么?