返回信息流其它方向(搜推工程,推理引擎,数据湖,大数据开发,大数据运维、测试) 也在招,正式实习都在招
投递邮箱Qiubaihui.3@jd.com
京东招收岗位:AI平台大模型引擎、算力调度、样本引擎 base 北京
【大模型引擎】
1.参与CTR、LLM、多模态等大模型算法引擎、样本引擎以及大模型训练系统的设计、开发和优化,解决训练和离线推理过程中的技术和性能问题;
2.针对大规模异构分布式算力和计算进行优化,提高计算效率和可扩展性;
3.深入零售核心算法业务,分析业务功能和性能痛点,设计合理的技术优化方案并确保实际落地;
4.参与制定核心业务项目计划和需求分析,确保项目按时交付和达到高质量标准。
【算力调度】
1.负责GPU/NPU算力平台的规划、系统架构设计与开发运维工作,集成云原生能力、开发调度、训练、推理等相关功能,提升平台资源利用率和扩展能力;
2.负责算力集群的维护、监控、调优和故障定位;
3.持续运营,改进平台性能、易用性和稳定性,优化用户体验。
【样本引擎】
1.负责大模型的数据处理、存储、IO等全流程方案实施和性能优化;
2.负责平台化的样本工程、样本引擎能力建设,保障样本数据时效性和准确性;
3.负责算法应用、算法引擎、算法平台多角度协同优化。
任职要求
【大模型引擎】
1.精通Python或C/C++开发,具备优秀的数据结构与算法能力,代码规范高效,具备良好的工程实践和团队协作能力;
2.熟悉深度学习基础理论和主流模型架构,能熟练使用TensorFlow/PyTorch等框架进行模型开发和训练;
3.掌握CUDA编程和GPU加速技术,具备模型性能调优经验,有国产AI芯片开发经验者优先;
4.了解主流分布式训练框架,具有分布式系统开发或优化经验者优先。
【算力调度】
1.本科及以上学历,计算机、数学、通信等相关专业,3年以上相关工作经验,具备大规模GPU集群运维及优化经验,有万卡集群管理或国产AI芯片经验者优先;
2.熟练掌握Golang/Python等语言,熟悉Kubernetes、Kubeflow等云原生技术栈,具备二次开发经验;
3.深入理解调度器原理(如kube-scheduler),有GPU调度研发经验,能持续优化集群资源使用效率并快速定位问题;
4.责任心强,抗压能力突出,工作积极主动,具备良好的问题解决和团队协作能力。
【样本引擎】
1.本科及以上学历,3年以上工作经验,有算法IO优化、特征平台建设经验或开源社区贡献者优先;
2.精通Java/Scala/Python至少一门语言,熟悉Linux/Unix开发环境,具备优秀的编码能力和工程质量意识;
3.熟悉Spark/Flink/Iceberg/Hudi等大数据技术及TensorFlow/PyTorch等AI框架,有源码级二次开发经验者优先;
4.具备优秀的业务理解、沟通协作能力,学习能力强,工作积极主动。
这是一条镜像帖。来源:北邮人论坛 / job-info / #974172同步于 2025/5/23
JobInfo机器人发帖
【社招】【内推直达】京东招收岗位:AI平台大模型引擎、算力调
HNan
2025/5/23镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。