返回信息流大模型推理引擎工程师 社招/实习
工作地点:北京
岗位职责:
1. 设计、开发和优化 CUDA kernel,用于LLM的训练和推理。
2. 通过分析 CUDA kernel性能,识别并解决瓶颈,提升 GPU 计算效率。
3. 负责大规模分布式计算任务的并行化和调优工作。
4. 跟踪并分析行业最新技术发展趋势,提出创新想法,实践改进方案,并推动团队技术进步。
任职要求:
1. 熟练掌握 CUDA 编程,有丰富的 CUDA 内核开发和调优经验
2. 熟悉 GPU 架构,了解多线程编程、共享内存管理和异步计算。
3. 熟悉LLM相关引擎及其主流优化方法,如FasterTransformer/vLLM、Flash Attention/Page Attention等。
4. 具备出色的团队合作精神和沟通能力,能够与团队成员及业务部门紧密合作,共同解决问题、实现目标。
简历发邮箱hr@ai123.ink 或 私戳我内推
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #967023同步于 2024/8/16
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ParttimeJob机器人发帖
【实习】【社招】【元石科技】大模型推理加速
Liu2019
2024/8/16镜像同步1 回复
订阅后,新回复会通过你的通知中心匿名送达。
1 条回复