返回信息流创始人具备公司上市成功经验。
清华大学背景。
核心团队由百度、华为、微软、字节、腾讯等知名大厂组成,业界技术大牛,科学家。
估值超12亿美金独角兽,有商业化落地产品。
微信&电话:15210750729
邮箱:jxiao@hiringby.com
地点:北京/上海
大模型算法专家
岗位职责
1.负责基于海量数据的NLP/视觉/多模态大模型关键技术突破,研发面向计算基座的大模型。
2.深入调研和关注大模型/多模态等方向的前沿技术
职位要求
1.参与或者领导过大规模预训练模型落地项目。
2.对预训练大模型充满热情,信仰AGI。
3.有自然语言处理和多模态的研发背景,对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。
分布式训练工程师
职位描述
1. 负责分布式机器学习大模型的训练加速,包括但不限于优化常见框架(如Megatron,DeepSpeed),数据读取、网络通信、计算算子等方面。
2. 主导新一代机器学习大规模计算平台的架构设计和实现,以满足业务对高效算力的需求。
职位要求
1. 熟悉数据并行、模型并行、分布式数据并行等训练模式,具备深入的理论和实践经验。
2. 具备大规模机器学习平台的架构设计经验,熟悉分布式系统和网络架构。
3. 精通常见深度学习框架,包括但不限于TensorFlow、PyTorch、Horovod等,能够快速实现并调试相关算法。
4. 对大规模预训练模型有较好的了解,了解常见预训练模型(如GPT、BERT等)的训练方法和优化技巧。
大模型推理工程师 岗位职责:
1. 负责推理加速算法的研发和实现,包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。
2. 负责深度学习模型的量化和蒸馏,实现高效的模型压缩和部署,提高模型的运行效率和推理速度。
3. 负责LLM模型的端到端部署,包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。
要求:
1. 具有深度学习推理加速和优化的经验,熟悉常见的加速技术,如剪枝、量化、分布式推理等,并能够根据不同场景和硬件平台进行针对性的优化。
2. 熟悉常见的模型量化技术,如低精度量化、动态量化等,并能够进行模型的量化优化。
3. 熟悉常见的深度学习框架,如TensorFlow、PyTorch等,并能够根据业务需求进行算法实现和调试。
4. 熟悉LLM相关的算法技术以及推理加速方法。
5. 具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。
对齐算法工程师
1.负责大模型对齐算法相关技术研究,不断提升模型逻辑推理、数学、指令跟随、代码、Planning、多轮对话等能力;
2.持续跟进业界最新的大模型对齐算法,参与大模型对齐算法的设计、训练、调优工作;
职位要求
1.硕士及以上学历,计算机、数学或统计学等相关专业,两年及以上NLP相关经验;
2.熟练使用pytorch/tensorflow深度学习框架,熟练掌握Transformer框架;
3.对 LLM 有深入理解和实践,有SFT、RLHF相关经验者优先;
4.较强的工程实现能力,熟练掌握C/C++, JAVA,Python等至少一种语言;
这是一条镜像帖。来源:北邮人论坛 / job-info / #962681同步于 2023/12/11
JobInfo机器人发帖
【社招】大模型独角兽 大模型算法/训练/推理/SFT算法对齐
hrjack
2023/12/11镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。