BYR Achieve · 镜像论坛

创始人具备公司上市成功经验。清华大学背景。核心团队由百度、华为、微软、字节、腾讯等知名大厂组成，业界技术大牛，科学家。估值超12亿美金独角兽，有商业化落地产品。微信&电话：15210750729 邮箱：jxiao@hiringby.com 地点：北京/上海大模型算法专家岗位职责 1.负责基于海量数据的NLP/视觉/多模态大模型关键技术突破，研发面向计算基座的大模型。 2.深入调研和关注大模型/多模态等方向的前沿技术职位要求 1.参与或者领导过大规模预训练模型落地项目。 2.对预训练大模型充满热情，信仰AGI。 3.有自然语言处理和多模态的研发背景，对搜索/对话/机器翻译/图像生成等相关领域有深入理解优先。分布式训练工程师职位描述 1. 负责分布式机器学习大模型的训练加速，包括但不限于优化常见框架（如Megatron，DeepSpeed），数据读取、网络通信、计算算子等方面。 2. 主导新一代机器学习大规模计算平台的架构设计和实现，以满足业务对高效算力的需求。职位要求 1. 熟悉数据并行、模型并行、分布式数据并行等训练模式，具备深入的理论和实践经验。 2. 具备大规模机器学习平台的架构设计经验，熟悉分布式系统和网络架构。 3. 精通常见深度学习框架，包括但不限于TensorFlow、PyTorch、Horovod等，能够快速实现并调试相关算法。 4. 对大规模预训练模型有较好的了解，了解常见预训练模型（如GPT、BERT等）的训练方法和优化技巧。大模型推理工程师岗位职责： 1. 负责推理加速算法的研发和实现，包括但不限于模型剪枝、模型量化、模型蒸馏、模型压缩等。 2. 负责深度学习模型的量化和蒸馏，实现高效的模型压缩和部署，提高模型的运行效率和推理速度。 3. 负责LLM模型的端到端部署，包括但不限于推理引擎的开发、模型优化和压缩、模型部署的端到端流程设计等。要求： 1. 具有深度学习推理加速和优化的经验，熟悉常见的加速技术，如剪枝、量化、分布式推理等，并能够根据不同场景和硬件平台进行针对性的优化。 2. 熟悉常见的模型量化技术，如低精度量化、动态量化等，并能够进行模型的量化优化。 3. 熟悉常见的深度学习框架，如TensorFlow、PyTorch等，并能够根据业务需求进行算法实现和调试。 4. 熟悉LLM相关的算法技术以及推理加速方法。 5. 具备较强的团队合作和沟通能力，能够与团队成员、业务部门紧密协作，完成项目交付和技术创新。对齐算法工程师 1.负责大模型对齐算法相关技术研究，不断提升模型逻辑推理、数学、指令跟随、代码、Planning、多轮对话等能力； 2.持续跟进业界最新的大模型对齐算法，参与大模型对齐算法的设计、训练、调优工作；职位要求 1.硕士及以上学历，计算机、数学或统计学等相关专业，两年及以上NLP相关经验； 2.熟练使用pytorch/tensorflow深度学习框架，熟练掌握Transformer框架； 3.对 LLM 有深入理解和实践，有SFT、RLHF相关经验者优先； 4.较强的工程实现能力，熟练掌握C/C++, JAVA,Python等至少一种语言；

【社招】大模型独角兽 大模型算法/训练/推理/SFT算法对齐

【社招】大模型独角兽大模型算法/训练/推理/SFT算法对齐