BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #979884同步于 2026/4/28
JobInfo机器人发帖

【社招】【AMD】LLM Infra推理加速工程师(北京/上海)

Arthuryj
2026/4/28镜像同步0 回复
本人团队直招LLM Infra推理加速工程师,JD要求如下,联系邮箱yajhuang@amd.com AI推理加速研发工程师/HPC高性能优化架构师 岗位职责: 1. 设计、开发和实现高效的大型模型推理系统,以提高计算性能,提升算力利用率; 2. 进行模型性能分析和调优,识别和解决瓶颈问题,提高模型推理速度; 3. 跟踪最新的研究进展和技术趋势,提出改进和创新的想法,推动团队的技术发展; 岗位要求: 1. 具有1-5年大模型or自然语言处理方向相关工作经验; 2. 深入理解大模型算法原理,熟悉模型结构,包括常见的GPT系列、llama系列、deepseek系列等模型; 3. 熟悉至少一种LLM主流推理引擎,如vllm、sglang等,掌握其底层技术原理,如如FlashAtention、PageAttention、Continuous Batching、Speculative Decoding等,具备开发优化经验; 4. 了解分布式推理框架原理,如pd分离、Expert Parallel等; 5. 熟悉python/C/C++编程,熟练掌握pytorch等至少一种深度学习框架 加分项: 1. 熟悉TensorRT/Triton/Cutlass经验者优先; 2. 有大模型推理加速落地经验者优先; 3. 熟悉分布式推理加速框架,有超大模型分布式加速经验优先 福利: 1. 每周2天work from home 2. 相对大厂work life balance,工作氛围轻松
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。