BYR Achieve · 镜像论坛

国内知名量化私募基金管理公司，管理资金百亿以上。技术团队 90%毕业于美国常青藤、清北复交等知名院校，核心团队包括海外知名对冲基金优质人才，数学、物理、计算机等领域资深专家，国际顶会论文作者，国际知名数学及计算机竞赛如 CMO、NOI、ACM-ICPC、CPhO、APhO、Kaggle 竞赛高手等。公司地址：北京、上海、深圳感兴趣邮件至：jxiao@hiringby.com 微信：15210750729 大模型预训练算法研究员职位描述 1、大语言模型预训练与迭代：主导/参与千亿至万亿级参数LLM的预训练工作。深入探索Scaling Law，指导模型结构设计与超参调优，并针对复杂代码和逻辑推理等能力进行专项提升； 2、数据迭代与训练策略优化：协同构建并持续优化预训练数据 Pipeline 与 Training Recipe。深入剖析数据清洗策略及高质量合成数据对模型上限的增益，探索并落地高效的 Data Mixing 方案； 3、前沿架构跟进及探索：跟踪并验证大模型前沿架构进展，研究并实现能够在不同规模模型上通用的优化方法（包括但不限于训练范式、正则化、模型架构改进、优化器、loss设计、超参优化），验证其在大中小模型上的迁移性与效果； 4、训练框架与计算效率优化：与系统/平台团队深度合作，针对超大规模模型，进行系统级性能优化，包括分布式训练策略、访存优化、通信优化和推理加速；参与探索底层算子的优化开发（基于CUDA、Triton或FlashAttention），保障极端规模分布式训练的稳定性与极致的模型算力利用率（MFU）。职位要求 1、计算机、人工智能、数学、物理等相关专业，国内外顶尖高校硕士及以上学历（博士优先）； 2、具备扎实的代码能力，在ACM/ICPC、NOI/IOI、TopCoder、Kaggle等顶级编程或AI赛事中获奖者优先； 3、熟练掌握PyTorch及至少一种主流大规模分布式训练框架（Megatron-LM / DeepSpeed 等）；具备底层算子（Triton/CUDA）的高效实现能力，或拥有高并发分布式系统优化经验者具有极高加分； 4、在NeurIPS、ICLR、ICML、ACL等人工智能顶级会议发表过有影响力的一作论文，或主导/深度参与过业界具有高影响力的开源大语言模型及框架项目；大模型后训练/Agent算法研究员岗位职责 1、后训练全流程迭代：深入参与千亿/万亿级参数大模型的后训练全流程迭代。主导并优化 SFT、RL、Reward Modeling 的算法设计与训练，攻克模型在长文本理解、深度逻辑推理以及多轮交互中的幻觉问题，显著提升复杂指令跟随能力； 2、Agent 核心能力研发：构建复杂智能体系统（如 Deep Research、交互式 Agent、Coding Agent等方向）。深入优化 Agent 的任务拆解与规划（Planning）、自我反思与纠错（Reflection）、工具动态调用（Tool-use）及长效记忆机制，保障模型在多步骤、长程任务（Long-horizon tasks）中的极致稳定性与执行效果； 3、数据工程与评测体系：设计并构建高质量的评测集，探索基于合成数据的自我进化（Self-improvement）与高效数据清洗方案；针对 Agent 复杂任务与深度推理，构建科学、自动化的评测 Benchmark，驱动模型优化。任职要求 1、计算机、人工智能、数学等相关专业，国内外顶尖高校硕士及以上学历（博士优先）； 2、具备极强的代码落地能力，精通主流深度学习及大模型训练/微调框架；在 ACM/ICPC、NOI/IOI、TopCoder、Kaggle 等顶级编程或 AI 赛事中取得优异成绩者优先； 3、在 NeurIPS、ICLR、ICML、ACL 等 AI 顶会发表过高质量一作论文，或作为核心贡献者参与过业界高影响力开源大模型/大模型框架项目者优先；多模态agent算法专家职位描述 1、基于通用大模型，结合垂类应用场景，进行相关的数据建设、指令微调、偏好对齐、模型优化，升数据合成、模型推理&规划能力，构建全面客观准确的评测体系，探索提升垂类大模型能力； 2、探索突破包括而不限于多模态RAG，VLA模型、GUI Agent等在内的多模态AI Agent，推动相关的新技术落地； 3、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术。职位要求 1、熟悉多模态大模型（VLM）、大语言模型（LLM）相关的算法技术，有AI Agent应用经验、熟悉RAG全链路优化、Multi-Agent技术、Prompt/Context Engineering工程技术的优先 2、了解LLM架构，熟悉RL算法（GRPO、PPO、DPO、判别式及生成式RM）、在相关领域有过良好的项目经验或研究经验，熟悉大模型相关的数据构造方法、Post Training算法 AI Agent算法工程师/专家岗位职责： 1.从业务场景出发，识别 AI Agent 能发挥价值的关键方向，探索可行的技术路径与实现机制； 2.结合主流大模型能力，构建具备任务感知、信息处理与多轮交互能力的智能体系统； 3.负责模型的选型与优化，提升其在具体场景下的适应性与稳定性； 4.推动系统在真实环境中的集成与落地，评估效果并持续演进技术方案； 5.沉淀通用方法论与工程架构，支持后续能力在更多场景中的扩展。任职要求： 1.熟悉多模态大模型（VLM）、大语言模型（LLM）相关的算法技术，有AI Agent应用经验、熟悉RAG全链路优化、Multi-Agent技术、Prompt/Context Engineering工程技术的优先。 2.了解LLM架构，熟悉RL算法（GRPO、PPO、DPO、判别式及生成式RM）、在相关领域有过良好的项目经验或研究经验，熟悉大模型相关的数据构造方法、Post Training算法。 AI infra工程师岗位职责 1、负责超大规模机器学习系统的架构设计与实现，直面高并发、低延迟、高可靠性与可扩展性等核心工程问题； 2、覆盖系统多个关键子领域：资源调度、分布式模型训练、数据管理与高性能计算等，能在不同岗位边界间灵活切换与贡献； 3、与算法团队紧密协作，推动算法与系统的协同优化 4、主动跟踪并引入前沿技术，把最新硬件、异构计算、编译优化、以及RL/Agent型交互等新方向落地到工程实践中。岗位要求 1、在工程实现或机器学习算法上有扎实基础与丰富实践经验； 2、有解决棘手问题的经历，愿意钻研根源、追查底层问题，具备敏锐观察力和清晰的逻辑思维； 3、热爱技术、有责任感、学习能力强、沟通顺畅并能自驱推进工作； 4、善于团队协作，积极创新，乐于挑战，具有自我驱动和自我管理能力。

【社招】头部私募高薪招聘 预训练/后训练/agent算法专家/infra

【社招】头部私募高薪招聘预训练/后训练/agent算法专家/infra