返回信息流base 主要在广州
职位描述
1、参与自动驾驶海量数据的采集、管理、处理与高效调度,设计与开发自动驾驶全链路数据平台,包括但不限于数据湖、数据仓库、分布式存储、流批一体计算与智能数据标注、数据治理等;
2、研发大规模分布式计算与训练平台,基于Spark、Flink、Ray、PyTorch等技术实现自动驾驶大模型的数据清洗、预处理、并行训练与推理,支持多GPU/多集群高性能任务编排与资源调度;
3、 优化存储与检索架构,探索和实现包括OSS、CPFS、Iceberg、Delta Lake、Hudi、StarRocks、ClickHouse、ElasticSearch、Milvus等新一代高性能存储与检索方案,提升数据读写、索引、管理效率,赋能AI训练和推理;
4、 参与团队架构设计与技术攻关,跟进学术前沿与业界动态,解决自动驾驶场景下数据一致性、扩展性、高可用、智能调度等核心难题;
5、推进工程实践落地与持续优化,深度参与端到端系统开发、自动化测试、上线发布与持续运维,推动数据与AI平台的稳定迭代和性能进化;
职位要求
1、教育背景:计算机、软件工程、人工智能、数据科学等相关专业,本科及以上学历,硕博优先。
2、 理论基础扎实: 精通分布式系统原理、并行计算、存储系统、数据库原理、数据湖/数据仓库理论、大规模机器学习等学科知识,有相关顶会/顶刊论文经历者优先;
3、技术能力突出:
(1)熟练掌握至少一种主流分布式计算框架(如Spark、Flink、Ray等)和一种深度学习框架(如PyTorch、TensorFlow等);
(2)具备大数据存储与处理系统(如OSS、CPFS、Iceberg、Delta Lake、Hudi、StarRocks、ClickHouse、ElasticSearch、Milvus等)实操经验;
(3)具备高性能数据检索、索引优化、海量数据管理等工程经验;
4、 编程与工程能力强
(1) 熟练掌握Python/Java/Scala/C++/Rust等主流开发语言中的至少一种,具备良好的工程实践和代码规范;
(2)有高并发、大规模分布式系统、流式/批式混合计算平台相关项目经验者优先;
5、创新与解决问题能力:具备独立分析复杂系统、定位瓶颈、提出创新性解决方案的能力,对技术钻研有热情,善于跨界学习;
6 、沟通协作与主动学习:良好的团队协作能力、沟通表达能力及自驱力,乐于分享、敢于挑战难题;
7、加分项:
(1) 在数据库、分布式系统、云原生计算、向量数据库、机器学习系统等领域有顶会(SIGMOD、VLDB、ICDE、NeurIPS、ICML等)论文、竞赛获奖或开源项目贡献;
(2)有阿里云、腾讯云、AWS、GCP等云平台大数据相关实习、项目或竞赛经历;
(3) 具备自动驾驶、机器人、智能感知领域大规模数据处理或AI应用落地经验;
(4)英语或技术写作能力优秀,有技术博客、专利、文档经验。
发送简历到 wulf12@xiaopeng.com 注明投递岗位。其它岗位也可以帮忙内推
这是一条镜像帖。来源:北邮人论坛 / job-info / #975929同步于 2025/8/26
JobInfo机器人发帖
【校招】【小鹏】分布式存储与计算工程师招聘
chwlfg
2025/8/26镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。