BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #977583同步于 2025/11/17
JobInfo机器人发帖

大模型推理框架研发工程师【滴滴社招】

epoch98
2025/11/17镜像同步0 回复
职位描述 1. 主导大模型推理引擎的架构设计与核心模块开发,支撑千亿参数模型的高效分布式推理。 2. 研发面向GPU/NPU等异构计算平台的高性能算子,提升硬件利用效率。 3. 参与模型低精度量化,图优化,编译优化等性能优化工作。 4. 攻克分布式推理中的动态负载均衡、通信优化、显存管理等核心技术难题。 5. 跟踪学术界与工业界前沿技术(如vLLM、TGI、TensorRT-LLM等),推进框架迭代。 任职要求 1. 计算机、数学、电子工程、通信等相关专业本科及以上学历. 2. 熟练掌握C++/Python,具备大型项目代码架构设计能力. 3. 熟悉Transformer架构及大模型推理相关技术(如FlashAttention、PagedAttention、Continuous Batching). 4. 有实际大模型部署及调优经验,熟悉量化(INT8/FP8)等优化手段. 5. 有GPU/NPU 算子优化经验,有并行计算相关背景者优先. 感兴趣可投递简历或交流,chaojiang@didiglobal.com
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。