返回信息流本岗位聚焦于阿里集团核心电商场景大规模深度学习流程中,样本、特征、索引和模型等数据的计算和存储,包括但不限于以下职责:
1、建设阿里集团数据湖仓核心系统,支持EB级数据存储、计算和服务;
2、依托淘天搜推广系统,构建面向稀疏和多模态场景的大数据计算存储系统,支持百亿样本千亿特征的高效迭代;
3、构建基于SQL增强的产品服务,提升用户在AI数据场景下的用户体验;
4、构建批流一体的实时数据平台,支持百亿级索引和特征的快速构建和秒级更新。
1、熟练掌握C++/Java中至少一种开发语言,数据结构和常用算法有较强的功底;
2、具备扎实的工程基础,有分布式应用开发经验,熟练掌握各种编译、调试、性能分析工具;
3、对Flink/Spark/Hadoop/Calcite等开源计算框架中一项或多项有深入研究与开发经验;
4、了解Hive/Hudi/Iceberg,有数据湖、数仓、元数据系统开发经验者优先;
5、了解大规模机器学习基本原理,有相关工程开发经验者优先。
https://talent-holding.alibaba.com/off-campus/position-detail?lang=zh&positionId=1122404
感兴趣的同学可直接投递简历或私信我了解详情、内推
这是一条镜像帖。来源:北邮人论坛 / job-info / #965764同步于 2024/4/16
JobInfo机器人发帖
【社招】【内推】阿里-大数据开发工程师-样本计算存储
deadend
2024/4/16镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。