返回信息流我是2020年暑假在这个团队实习的,然后顺利转正,之后在2021年毕业后入职,现在已经工作9个月了,整体的工作体验还是非常好的~
如需内推,可以加我微信 13041019260,随时都可以 催/问 笔面试进度~
这是当时实习结束后在知乎的分享贴:
如何看待2021年秋招算法岗灰飞烟灭? - FnLee的回答 - 知乎
https://www.zhihu.com/question/406974583/answer/1504162754
我们团队已经开始春招实习生了,职位是Java开发(不强制要求会Java,只要掌握任意一门编程语言都可以,我之前在学校就是写python做深度学习的,在去公司实习之前没有写过任何一行java代码),工作地点在杭州/北京,今年我们团队预计是有3个名额(去年也是预计招3个同学,实际最后招了4个:2个实习生全部顺利转正留下了,秋招又招了2个同学,其中一个是后来突然多了一个名额)
先不说专业方面的内容,我认为作为一个校招生,团队、主管比实际的业务方向(当然业务方向也不能太差)对于个人的成长更重要。
我们团队的氛围还是非常好的,大家在工作上合作得很好,遇到技术问题时技术比较强的几个同事也会热心帮助,每个月都会有聚餐/出去玩(不占用休息日),去年被我内推的几个同学都反应面试官很nice。工作时间大概是10-9-5,当然偶尔有事情也会在休息时间加个班,不过之后会安排调休。
团队氛围这方面我自己感觉主管的作用还是非常大的,我们主管是个老阿里了,在淘宝、聚划算、虾米都干过,但是并没有那种不好的所谓“阿里味儿”(PUA、满口各种土话...),他是非常务实的风格,还在写业务代码,对技术、架构的理解还是非常深刻的。各种会议力求简洁(周会只是有必要的时候才开,年度述职每人也只有最多十分钟,述职PPT也只是要求做两三页),不会像一些团队开个会还要每个人分享近期的感悟这种有的没的的东西、述职每个人一个小时,加上各种刁钻的提问一个团队的述职要搞好几天... 他看到其他团队花很长时间开会或者开规模特别大的会都会吐槽一下;我们虽然还是要写周报的,但是也是力求简洁,把手头上事情的进展写清楚就好(我刚来的时候有一次周报写的字数多了一点还被他提醒不用写这么多,一两百字就够了)。
好了,转回到专业方面,我们招的是Java开发岗,我们团队的业务是混合云的云管平台。
阿里云-混合云的前身是阿里云的专有云,是一个to B的业务部门。大家平时能接触到或者用到的是公有云,而政府、央企国企等对数据安全要求比较高的客户是不敢用公有云的,所以专有云是他们的必然选择,而专有云由于规模的限制,在业务量陡增或者出现灾难的情况下难以保持稳定性,所以就有了专有云+公有云的混合云形态,也就是客户可以把一些不敏感的数据放到公有云上去处理或者备份,以享受弹性的云计算服务。我们目前的客户有:很多部委和地方政府、两张电网、两桶油、部分头部银行、几乎全部的头部保险公司、基金公司、运营商、很多制造业企业...
而云管平台,就是在客户买下我们的混合云之后,需要有一个统一的平台去运营(给各部门、各业务分配资源,授予不同的部门、不同的员工不同的权限,使用/查看混合云中的各个产品「计算、存储、网络、数据库、人工智能... 目前我们的平台上有大几十款阿里云的产品」)和运维(自动巡检发现软硬件设备存在的问题,发现问题后自动修复或告警,提供白屏页面供运维人员查看各资源的健康状况或进行运维操作),我们团队是做运营业务的
我们对于校招生的要求大概就是聪明努力、有潜力,而不强制要求你必须熟练掌握Java编程,我们在笔面试时的考察内容主要是你在学校期间的经历(论文、项目、比赛...)、计算机方面的基础知识、算法题的掌握程度
附我主管在去年7月他进阿里11周年时的总结帖:
原计划月初写总结,但一直被各种事情打断,快到月底了,趁着周末“烟花”的陪伴,终于可以宅起来写总结了。
说是总结,但写起来直接变回忆录了,有点流水账,先这么记录吧,省得以后忘了。
时间好快,自己都不敢相信从毕业后来到阿里现在已经11周年了,我其实更喜欢年轻的自己,我也想表达我还年轻,所以一段时间我还是戴的红色的工牌,一直用到带子断了。
在阿里的经历可以为4个主要的阶段
第一阶段做了6年电商,淘宝3年聚划算3年;
第二阶段在虾米音乐(主动转岗),做了2年多;
第三阶段在创新事业群(组织调整),做了1年创新产品;
第四阶段在阿里云(主动转岗),做混合云云管平台;
淘宝时光-初生牛犊不怕虎
毕业入职后分到了淘宝店铺导购团队,做了大概1年的时间。后面癫总启动了做垂直市场的战略,我被分到了美妆市场项目组,当时按大类目分了好多个市场,例如服饰、美妆、母婴、数码等等,那时市场上逐渐兴起了一些垂直电商,而我们的垂直市场正是要去正面阻击或者叫防御。
美妆市场第一版即将做完的时候,一天主管突然找我说有一个新的大项目要搞,所以就调整到了新项目,当时叫淘宝电影,现在叫淘票票,最开始我们项目室只有3个开发,很欣慰淘宝电影能有现在的规模。
一个比赛埋伏笔
中间有一个很有意思的插曲,做美妆项目时公司组织了淘宝labs创意赛马活动,我抱着玩玩儿的态度也参加了,自己设计开发了一个简易的尺码工具,插到淘宝详情页面(内网可见),方便买东西的时候查看。主要功能就是记录自己或家人的身形尺码信息,选尺码的时候方便查看。工具听起来很小,但我还是花了很多精力在上面。起初这个工具仅仅是我个人的需求,我当时把妈妈和自己的三围记录到电脑里,每次买服饰都要找下,特别麻烦。为了调研这是不是一个普遍的痛点,我调研了一些身边的同事还有我的同学,基本上验证了我的假设。于是乎就自己用PS画了个丑丑的原型,自己写了它的前后端代码就参赛了。
居然顺利的进了决赛,决赛时我讲了我为什么做这个,如何做的调研,以及比赛期间在公司的用户数据,还有未来畅想。评委对我提了一些问题,大致是我如何理解思考的,没想到这次比赛也差点是职业生涯的转折。
差点转行做PD
经过决赛和大众投票,最终获得了那次比赛的第二名(第一名是淘宝二手转卖,类闲鱼),本想到到一段落了,没想到接下来发生的事儿差点转行。
首先是淘宝服饰运营大老板找到我说想让这个工具落地到服饰类目,沉淀为产品,这和他们的业务诉求和目标是一致的。
还有一个最重要的,比赛结束后,阿姐(优昙找到我让我去她那边做PD,要让我培养成为一名优秀的产品经理,我一开始很吃惊,经过和她几轮沟通,我居然快被她说动了。
接下来我纠结了一个星期的时间,我一直在问我自己,自己到底喜欢什么,擅长什么。我确实喜欢去亲自设计工具或是产品,我在上学时就喜欢鼓捣一些东西,我也追求完美,喜欢理性和感性碰撞。但这些真的足以成为优秀产品经理的潜质吗 。代码我也喜欢,我喜欢写代码的成就感和充实感,放弃了技术等于废掉了一只手,很难拿回来。但是阿姐的诚意很大,给我的想象空间很大,错过了也很难会有类似机会,所以我就答应了。
决定之后我就找了主管,主管也很吃惊,让我再考虑考虑。第二天主管和大主管找我聊,说可以满足我一个条件,就是我可以担任这个产品落地的PD和研发,这一下子说到了我的痛点,刚好满足我的诉求,还有业务方和我对接落地。我当即答应了,留下来,自己当爹当妈孵化它。
说到这里很对不起阿姐,记得当时旺旺和她讲的时候编辑了很久,写了改改了写,很对不住她百忙之中和我这个小P讲那么多,而我现在却要放鸽子了。
兼职PD研发PM
后面的孵化过程非常有意思,为了赶时间,我白天写PRD 或去推合作方晚上写代码,为了节省时间就早餐多买两个饼,中午不去餐厅,晚上经常洗澡的时候想到一个优化点或一个方向,早上一睁眼赶紧洗洗骑车就去公司,巴不得晚上就写完。那段时间我的二手自行车也不给力,经常掉链子,我索性背包里直接装一把钳子,随时快修。这样的状态大概持续了两个多月的时间终于熬出了第一版,第一版上线后又兼职了一把BI,自己的产品自己分析,对着数据不停的改造优化。后面持续迭代了几个版本后早已经不是最开始仅仅记录尺码数据的功能了,后面衍生出了身形尺码推荐、同身形尺码评价 、身形搭配等功能。
当然中间也遇到了很多麻烦,我要去推动淘宝detail 产品改造,这个页面的改动就必须经过癫总认可,当时因为方案的争议不能定夺,还给癫总发了邮件,甚至还到办公室给癫总讲了我写的PRD,现在想想胆儿太肥了,现在我是不敢了。
排期也是相当的难,因为要改造淘宝详情页和卖家端,需要不停去刷脸皮,找UED 刷完找前端刷,前端刷完刷后端,淘宝前台detail 刷完找卖家后台刷,甚至我等不急还去他们系统里改了一些代码。UED 资源不够,我就自己画了商家后台的原型,前台买家端要是敢放给我搞当时肯定我也敢画。
主管也提供了不少支持,给我分了一个师妹,还有对口前端。运营方也很给力,协助我做营销做评审,大家目标一致,一起努力。这样PD兼开发大概持续了1年多后,直到后来分配了一个专业的PD后妈,合作下来很有默契,后面我也放心交给她来搞,当然我基本也是全程参与每个像素每个逻辑的评审。
突然一天早上,主管叫我到会议室和我讲他要去聚划算了,问我要不要过去,我记得有点懵,没怎么思考直接回答说好的。阿里的第一次“闪”岗就来了,后面过来几个月就转岗去了聚划算。
总结
在淘宝的3年,这三年是我从毕业生到职场角色的彻底蜕变,也是我不留遗憾的3年,遇到了几任不错的主管,对我职业生涯发展起到很大作用。
最欣慰和自豪的要数我当初做的尺码库产品到现在还在淘宝详情页活着,到现在已经有9年时间了,应该属于淘宝为数不多的长寿产品之一。
聚划算时光-差点搞个PDD
从单兵作战向成熟TL转变
其实我到聚划算后才知道做哪块,不是我傻而是我知道前主管对我足够了解,他知道我适合做什么。到那边我打了几个杂,后面又自己设计研发了一套建站平台,主要是给运营来自助搭建聚划算每天各式各样的活动和大促页面。最开始是每次搭建一个页面都要开发写代码开发测试,后面主管问能不能让运营自己来自助搞。顺着这个思路,我就又开始了双角色并行的生涯,建站平台越做越大,到后面成熟期 基本上聚划算90%的PC无线活动或频道页面都是它搭建配置的,每次大促值班都压力山大,好在都有惊无险。后来有了自己的团队,负责整个导购业务以及站外营销引流,慢慢的承担的事情更多了,自己也变得更成熟了,带团队不仅要考虑自身的发展,还要考虑团队的成长。
差点搞个PDD
在聚划算不得不提的一件事是站外引流,2015年入口流量开始内卷,需要着眼于外面的流量增量了,6月聚划算大促时我们首次开始尝试在微信端引流,66大促我先做了一个简单的页面站外分享试了试水。
试水通了之后,我再想如何能把微信流量像滚雪球一样爆发起来,2014年春节记得高德做过一次帮我“加油”的微信活动,这个活动给高德带来了巨大的流量和新装,虽然最后兑换环节被喷的很厉害。但是我非常看好这种引流的模式,所以找了高德同学了解了大概的数据和可行性。调研完之后我确定要大搞一场,于是乎开始脑暴如何结合聚划算业务来引流拉新,最后定了一个方案,
就是类似高德加油的,帮我挖宝(比砍一刀趣味强),经过多轮的讨论和设计,终于上线了第一版挖宝游戏,上线之后效果还不错,为年度最大的99大促趟开了一条路。到99大促时有了专职的PD 和项目组来做,结合之前挖宝的数据分析,大家讨论达成一致,游戏模式趣味性强,但帮忙成本较高,大促时建议设计一套低成本的玩法,拉的助力的人越多,折扣越大,玩法叫《聚人气》,99大促当天在微信端访问PV超过了1KW,当然随后域名就被封了,好在我们已经有预案,后面几天虽然不停的被封,但是我们通过这次大促基本上积累沉淀了一套站外引流的玩法和应对策略。话说拼多多也是2015年9月成立的,还蛮有意思的。
当然后面聚划算管理层并没有太重视这个产品玩法,当时的战略是消费升级,这个玩法明显和消费升级不够一致甚至还有点low。
乐队工作两不误
除了做业务,在这里我还组建了我毕业后的第一支乐队,当时我从人数有限的开发里找了吉他手、鼓手(现学)、贝斯手、口琴手,就这么滴组建了大余杭人气乐团《聚疯》乐队,当然接了不少HR 的红活儿。乐队演出我基本也是按产品设计,我会制定详细的排练计划,迟到惩罚,自己录视频review, 自测差不多了会找其他同事来看看,提建议,然后不停迭代。虽然上台还是会掉链子,但至少努力了。
原地踏步开始慌
后面随着聚划算消费升级战略的推进,我感觉和当初的聚划算的味道越来越不一样,有些地方的数据也掉的厉害(整点购,秒杀),为此我还专门发了邮件贴数据给大老板,当然邮件并没起什么作用。
随着后面业务瓶颈期的到来,我被卷的有些迷茫了,经常换一个PD 换一个设计师换一个老板就要改页面改频道,方的改圆的圆的改方的,我虽然已经做过并沉淀了很多ABtest 分析,但是改版的时候总有一堆理由,实在是太没劲儿。我也感受到了自己发展的瓶颈,那段时间我感受不到成长,也看不到更大的空间,虽然工作还算顺心安逸,团队氛围也很好,但原地踏步是我最心慌最不踏实的。
于是乎我在想自己已经做了6年电商了,是不是可以换一个行业看看,也看了外面的机会,恰巧当年阿里收购了虾米,而我自己也本身喜欢音乐,我想试试看业余爱好和工作结合会是什么效果。主动提转岗到了虾米,其实当时很舍不得自己的团队,主管和组员都非常舍不得,还有自己的乐队,做了很久思想斗争。
总结
在聚划算的3年,是我感觉大部门氛围(技术欢乐)最好的几年,是我飞速成长的几年,这三年从一线研发成长到TL ,看问题的视角慢慢从一个小产品到一个大平台。认识了很多不错的同事,很多年以后还是很亲切。
虾米时光-再见了青春
重燃激情
到虾米后,整个文化氛围工作氛围和电商那边差别还蛮大的,但具体的又说不出来。大家都很单纯和热心,我很快就融入了进去。
在这里我把我之前的技术经验和业务经验都发挥了出来,对一些系统架构做了优化。也主动发起了几个项目,比如邀请拉新、导入歌单(这个项目技术攻防很刺激,不适合公开讲)、点歌台等。这些项目现在回想起来还是很有价值的,当然不解决根本的版权问题,无力挽救后面虾米的关停。
孵化产品《点歌台》
在虾米除了做一些支持业务的事情,不得不讲下我孵化的一个产品《点歌台》,和大老板讲过之后,他半信半疑,于是乎到班委会上讲了下,这个IDEA得到了语嫣姐的支持,有幸我就开始了这个项目的孵化《虾米点歌台》。
当然,我还是他的PD兼技术负责人 ,不同的是我有自己团队了,能动性更大。可惜的是前端团队不听我的,迟迟排不给资源,而我已经和运营方制定好了520营销方案,520这个日子一定不能错过,错过会遗憾一年的。没办法就自己上。我和团队一名开发,我俩现学vue.js ,现学现写。虽然我写过很多PC 端页面,但是手机里的H5 第一次写,所以很费力,五一节也没休息,加班加点赶。
客户端团队也是资源问题,遇到和客户端交互的时候我只能绕着走,当然体验会下降很多,很遗憾但没办法。终于产品还是如期上线了。
产品上线的时候还是很鸡冻的,我几乎每天都会看用户点的歌,写的寄语。然后分析用户数据,快速迭代。也有同事不看好这个产品,认为没什么意思,我认为他不是目标群体。我始终相信,点歌台这种心灵表达的诉求是一直都有的,只是平台变了,传统电台变成了流媒体,形式变了,可能不是单纯的广播式的点歌了,可以加入很多互动,打榜。顺便说下有意思的数据,喜欢用点歌台的用户群体主要是四五十岁的中老年和不到20岁左右的小年轻群体,有很多学生,尤其高考时。虾米关停那月有很多热心用户给虾米点歌惜别,看着还是很感动很暖心的。
总结
在虾米的2年,自己近距离的接触参与了创业公司被收购后的种种变化,感受到了集团战略在文娱领域的无奈,感受了被收购公司融入阿里文化的过程。
创新时光-创业从0-1再到0
从0-1团队组建
又突然有一天,大老板找到我,说是集团要成立创业事业群,虾米抽人组建一个项目组,去搞创新,让我组建技术团队,还得低调。于是乎偷偷选人拉人方案脑暴,半年多的时间做出来了一款说唱小视频APP,至于为什么要做这个方向,这个有很多因素,当然老板拍的因素更多。第一版的方案我说实话我是有异议的,会上我也明确表达了用户动机我不看好,甚至我的反对意见太多了导致主管受不了了,找我单独做了沟通。当然异议归异议,既然老板拍了就要坚决执行。第一版出来后马上又重做了,后面陆续迭代了几个版本。
APP上线后经过半年时间的打磨,数据依然不乐观。我当时有预感可能会调整方向,因为kickoff 时大大老板说让我们放心干,给我们三次机会,三发子弹。
未雨绸缪
当然也不是坐等上面让换方向,主管也鼓励我们脑暴其他idea, idea 通过内部讨论后可以小范围研发。我自己想了3个IDEA,一个是押韵小程序,这个纯属工具,小众产品,但是我敢保证我做的是业界最好用的,不过这个仅仅是为了给我们的小视频APP引流。第二个是掰头大会(battle),看过嘻哈rap 的同学应该能懂,就是通过rap 的形式相互battle。这个IDEA对设计要求比较高,但设计师都投在主业务上无暇分身,为了能早一点发布(我担心留给我们的时间不多了)我又一次被迫去学了Sketch ,自己画设计稿,好在有设计师可以请教,虽然累但我感觉这样反而效率更高,更能表达我的想法。遗憾的是这个IDEA 在研发完成的前两周拥抱变化了。
第三个是母婴类的产品晒呗,调研了好多宝妈们,这个也是自己用Sketch画的原型图,可惜的是仅写了策划书,没等到开发就发生了下面的事情。
从1-0 团队解散
变化还是来了,但是没想到这么惨烈。一天下午核心TL突然被HR、老板叫到办公室,说我们要解散了,当天下午就要通知团队所有成员。能走的自己找地方,不能走的留下来调整到另外团队,deadline 到10月底。
我自己还没消化好下午就硬着头皮和团队同学一一沟通了,沟通前我没有那么的失落,因为这些年见惯了变化。但当和每位同学聊完,看到大家的反应,大家失望迷茫的表情,我才意识到这对大家打击来说是多么的大,可能我不愁地方,但是很多同学很慌。即便我答应了能带他们就会带上。接下来就是国庆假期,整个假期我都在思考,说好的三次机会呢,组织温度在哪里,这不像是我之前感知的阿里。虽然隔壁团队让我过去,但是我对这里失望了,我不会留下。
总结
做创新的1年,虽然产品失败,但是收获还是很多。体验了一把创业团队的艰难,见证了创业团队的产品的从0到1,创业团队技术架构的从0-1,参与了产品脑暴的整个过程,也见到了创业团队的人心向背。
阿里云时光
团队要解散的消息传开后,集团各个部门的同学开始抛过来橄榄枝,认识的不认识的都找过来了。一番思考后后面选择了阿里云,这也是我曾经想去的地方,至于之前为什么想来这里,一个是我比较看好阿里云,还有一个主要原因是我认为不去阿里云看看以后可能会遗憾,我不能只坐在云上写代码,我想去下面看看。
到了阿里云后分到了云管平台团队,云管平台简单讲就是把云卖给客户后,客户用来管理这朵云的平台,按使用角色分主要分为运营平台和运维平台。和之前转岗聚划算一样,来之前我还也知道具体会分到哪块,原因和去聚划算时类似。
进来后适应了一个多月,这边的研发平台流程什么的和集团有很大差别,架构理念甚至也有一些差别。最大的不同是同时支持很多个版本,有很多套环境,而且应用占用的资源必须精简到极致,因为那最终都是客户买单的钱,不像集团有大把的机器可以申请。
打杂半年
在这边前几个月基本处于打杂状态,哪里有问题就去哪里看看,我想都了解一下。更多的精力是在搞一个叫xxx的产品,这是从公有云拿过来的产品管控页面托管渲染平台,面对专有云的业务场景水土不服,一个主要问题是多版本并发导致的开发发布复杂度急剧上升,有一段时间大家都不敢发布了,因为一不小心就改错了,太多云产品太多版本,交叉起来变成网状,代码分支里各种特殊处理。后面我们针对当前的问题开了几次讨论会,决定做多版本改造,聊了几次方案终于聊清楚了。最大的阻力是xxx代码和公有云是一套,我们不能动,只能小改,但要完成多版本的目标显然是不可能的。xxx复用公有云的架构还有一个问题是这架构在专有云里会占用更多的资源以及架构更复杂。所以结合多版本和应用瘦身的目标,我们和公有云xxx团队做了几轮沟通,大家最终达成一致,在保证底层模型协议兼容的基础之上,专有云可以对xxx做架构改造。1年之后现在看这个决定是非常有意义和价值的,不然以现在的版本和云产品数量来看,绝对是一团麻。(贴主:这段中的xxx产品之后一直跟着我主管,也是目前我在做的)
一腔热血,东山再起
2020年年初部门组织架构调整,我负责混合云的云管运维平台,虽然在云管大团队,但是运维平台并没有怎么接触,所以刚接手的时候一头雾水,而且只有一个有经验的原厂开发。我花了大概1个月的时间了解前因后果。后面记忆比较犹新,所以可以总结详细点。
因为各种原因,这个系统千疮百孔,烂到客户现场GTS直接不用了,感觉好像接了个大坑。
我经过和各个团队部门的人聊,发现没人用不是它没价值,而是没做好,之前兵力都投入到另外一个产品了,这块越是没人投入越没人用,越没人用越不被重视,恶性循环。甚至因为不好用,GTS团队不得已自己自研了很多类似的工具。所以当时有一种白手起家,东山再起的感觉。
自己定了接下来2年的目标:客户自运维(客户泛指外部客户或GTS同学),第一年完成60分的基本能力,第二年主攻核心竞争力。拆下来几个目标:
1: 招聘;
2: 客户当下局点问题修复根治;
3: 建设平台基本运维能力;
4: 开放云产品的运维能力,交给专业的人来做,我只提供平台,例如console托管,API 管理,标准制定;
5: 重构老的运维平台工程架构和设计, 为后面的平台级功能开发做铺垫;
6: 基本能力做好后,打造业界领先智能运维核心竞争力,如根因定位,故障自愈。
接下来团队经过半年时间的努力,到2020年10月份的时候,团队从两三个同学迅速扩充到10个以上(贴主:我是6月份中旬过去实习的,当时团队算上我只有5个人,我在团队中也算是个“老员工”了),初成规模。按照年初定的规划,基本上距离目标越来越近了。
基于xx版本做了系统重构,系统做了大瘦身,统一了技术栈和框架;
和GTS一起合作设计了几个平台核心能力,重新设计开发了监控告警模块,打通了告警->产品->系统->容器->物理机->网络各层的基本CMDB数据,可以根据告警信息关联到全链路的机器和应用情况;
自动化运维编排可以帮助一线使用脚本编排的方式来自动化执行变更,相比传统的黑屏更安全更可控;
和兄弟团队合作研发了一套黑屏terminal工具,相比原有terminal,可以做到高危命令拦截、远程授权、录像审计等功能;
自动化日志清理可以按照预先配置的规则,自动清理磁盘日志,防止磁盘爆满的隐患,自动化掉驻场一半以上的变更;
设计了一套远程运维平台,可以做到在内网就可以远程运维客户局点;
巡检平台和GTS、L2合作,集成了他们沉淀的一些能力,这块我确实没有足够资源投入;
在智能运维领域也做了简单的探索,不过仅仅是探索,试水而已;
下半年我打算把这些能力全面推广铺开并迭代优化,把打造的x高质量版本也全面铺开到客户局点,升级历史遗留版本到稳定版。
拥抱变化,火坑救火
激情满满的时候变化又来了,主管突然找到我让我去负责云管运营平台(贴主:运营平台和运维平台是两个兄弟团队分别做,当时我已经实习结束了,运营平台的主管跳槽了,可能是我主管的主管觉得运营平台的重要性更高,我主管就被安排带着原团队的大部分同事包括还没入职的我来了目前所在的运营平台,这也导致之前的运维平台有几个月缺兵少将,直到去年年底他们的人手才又多了起来),当时我有些不知所措,因为我对运维平台下半年的规划都已经做好,上半年我做的很多东西就等着落地推广开了,我都幻想了运维平台重见天日的那刻,停下来真的不甘心也不放心。和主管商量能不能给我三个月的缓冲期,这三个月同时负责两边,三个月后交接出运维平台,但没能说服主管。就这样一周后就去负责了云管运营平台。至于为什么突然让我去负责云管运营平台,主要原因是当时这个产品当时被客户以及GTS吐槽的严重,问题较多,经常出问题,我应该是救火的角色,烂草莓提名都已经给我准备好了。
虽然知道是火坑,但是跳进来了就没退路。我之前没负责这块,但我也基本上了解大致的问题所在,接手后根据当前的问题优先级很快我制定了两个大目标,第一个提升应用稳定性、性能、全链路诊断能力;第二个是提升产品的质量。第一个我有自信在财年底前能有较大的改善,第二个我也有信心,但是这个是长期的过程,因为很多因素不在我能力之内,只能推进想办法。
集团待过的研发同学可能好奇,为什么我还要提升全链路诊断能力,三个原因,一个是云管运营平台处于云平台的最上面属于总集成,他打交道的云产品有几十款,打交道的接口上千上万个,从最上层pass到下层iaas再到云底座,链路特别长。第二个在混合云环境是没有集团那一套鹰眼之类的工具的,这边的机器可不是想部什么就部什么,都是客户的钱。另外云产品很多系统鹰眼ID都没有,日志格式也乱七八糟,排查问题非常困难;第三个在客户现场后网络是隔离的,极少能远程,只能让现场拍照片拍日志,所以排查效率极低。
经过半年时间的努力,主链路的性能基本上提升了有几倍,某些超慢接口性能有10倍提升,这也是在我预期之内,我不能接受自己负责的应用稳定性和性能不好,毕竟咱也是代表阿里的技术。但性能优化也有我头疼的硬骨头,部分阿里云云产品的接口有十几秒甚至几十秒,导致我们上游跟着慢,推也推不动,我只能让抄送他们大老板邮件,虽然也没啥效果。甚至还有云产品同学问我为什么客户要求这么高,10秒可真不高,我团队规定是内部接口不能超过300毫秒,超过报备review。其实我的理想状态是均值不能超过80ms;
质量我的策略是集中打造一个稳定版高质量版本,因为版本太多,bug遍地开花,战线拉太长肯定吃不消。和GTS成立专项质量提升,持续了几个月,目前从GTS统计的数据来看,质量提升很明显。不过后面挑战也很大,后面几个版本有架构改造,还有进很多需求,需要重新选择一个稳定版本,集中打磨。另外测试用例的覆盖度也是一个难啃的骨头,因为HC总是有限的。
总结
在阿里云这两年,有欣慰也有遗憾。欣慰的是来到了我曾经向往的阿里云成为一份子,我的加入给团队给业务系统带来了正向的提升。遗憾的是我去年做的一些事情因中途组织架构调整后没能全部落地。还有一个遗憾不适合讲就放在心里了。
大总结
整个阿里11年的历程回想起来非常精彩,经历过电商从小到大,也见证了集团上市。经历了很多业务从无到有,也有几个业务从有到无。从0-1设计开发过几款产品,从0-1建过几个团队,也被解散过团队。
很多同学问过我一个问题,你怎么坚持了这么久。其实说坚持到不至于,坚持的话我早就离开了。主要我还是很幸运遇到了好几个不错的主管,不错的团队,给了我不错的机会和空间,同时我打心里认同阿里的文化价值观,所以以上都是我一直在这里的关键原因。
以后的路还有多长,喊口号没什么用,且走且看吧。
这是一条镜像帖。来源:北邮人论坛 / job-info / #940520同步于 2022/4/6
JobInfo机器人发帖
【内推】【校招】阿里云-混合云-云管平台 JAVA开发 可0基础
lfn19960131
2022/4/6镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。