BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #974875同步于 2025/7/17
JobInfo机器人发帖

【社招内推】【百度】混合云异构计算工程师( 急招! 多hc)

bupt2012ji
2025/7/17镜像同步0 回复
工作职责: -建设业界领先的AI异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持AIGC、智算中心、金融、 -结合 SOTA 模型训练推理优化原理,深入模型结构与设计思路,将训练推理优化手段工程实践化,为客户提供系统性加速方案,提升训推效率 -在自研芯片上适配常见大模型,结合深度学习训推框架特性,开发或调优相关算子,提升模型在芯片上的性能和精度表现,辅助客户进行芯片选型和应用 -针对大规模异构集群场景下,探索训推任务管理、异构资源调度、虚拟化混布、容器存储、高性能网络、分布式训练和推理等技术的创新和应用 -探索业界最新技术方向,参与机器学习框架等开源社区,提升百度混合云AI核心竞争力 职位要求: -本科及以上学历,有一定程度的计算机相关专业知识背景 -优秀的编码能力,熟悉Golang/Python/Java/C/C++至少一项,有扎实的算法及数据结构基础,有良好的编程习惯。 -熟悉PyTorch,了解Megatron、DeepSpeed、vLLM、SGLang等大模型训推框架,做过测试、开发等工作。 -对GPU芯片架构有一定了解者优先,熟悉CUDA、OpenCL等高性能计算编程经验优先,有大规模训练推理实践经验者优先 -具备推理优化的深度实践经验优先:FlashAttention、PD分离、专家并行、负载均衡、模型压缩(蒸馏/量化)、缓存策略、异构计算加速 -具备训练优化的深度实践经验优先:分布式训练、显存优化(如Zero/Offload)、计算通信Overlap、混合精度、MoE架构调优 - 熟悉Kubernetes工作原理,熟悉调度器、资源扩展机制、容器运行时、容器网络等技术,有Kubernetes开发和维护经验优先 -有独立的分析问题和解决问题的能力,有强烈的责任心,较强的学习能力和沟通能力 简历发送到: chenshanqing@baidu.com
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。