BYR Achieve · 镜像论坛

顶级vc 投资，全球知名AI 科学院带队AGI 创业公司。团队均来自大厂和ai 头部公司核心团队，精英文化，扁平做事。创始人具备成功的 ai 产品研究和落地经验。地点：北、上、深邮箱：jxiao@hiringby.com wexin:15210750729 Agent基模预训练算法专家 / 研究员岗位职责职位要求我们希望你是什么样的人： 1. 有大规模模型训练或调优的实践经验，熟悉分布式训练环境，至少熟练掌握 mcore、torchtune 或 transformers Trainer 等主流训练框架中的某一个； 2. 有模型结构设计相关研究背景或实践经验，熟悉高效注意力、Gated Attention、mHC、MoE 等相关工作； 3. 有面向大模型通用能力、Deep Research 或者 Vibe Coding 能力的训练数据合成/构建/清洗的研究背景或实践经验，熟悉数据管线的设计思路，能够熟练使用基于 OpenAI / SGLang / vLLM 等接口部署的模型大批量构建/清洗数据； 4. 参与/复现过 Scaling Law 的拟合过程，能根据实验结果对模型各项指标进行分析，优化模型训练设置及策略； 5. 在 ICLR、CVPR、TPAMI、ACL 等顶级会议/期刊发表过论文； 6. 参与过有影响力的大模型项目，并在该项目中做出实际贡献； Agent基模后训练算法专家 / 研究员职责： . 开展 Agent 场景下的后训练算法研究：围绕多步推理、任务拆解、工具调用、代码执行、检索增强、复杂指令遵循等典型 Agent 场景，研究模型能力提升的后训练方法，提升任务完成率、稳定性与泛化能力； 2. 设计与优化面向 Agent 的训练数据：结合实际场景和模型短板，构建适用于后训练的数据体系，包括指令数据、过程监督数据、偏好数据、轨迹数据等，不断提升训练信号的质量、密度和覆盖度； 3. 探索模型能力提升方法：研究并实践 SFT、拒绝采样、偏好学习、过程监督等方法，推动模型在复杂推理、工具使用、代码任务和长链路任务中的能力优化；职位要求我们希望你是什么样的人： - 有大模型后训练、专项能力优化、数据合成、过程监督、偏好数据构造等方向的研究或项目经验。 - 有 Code Agent、Search Agent、Tool Use、检索增强、复杂推理等相关研究或实践背景。 - 有较强的实验分析能力，能够从评测结果中定位问题，并提出可执行的优化方案。 - 熟悉分布式训练、并行训练或多机多卡实验环境，有大规模模型训练或微调经验。 - 在 NeurIPS、ICML、ICLR、ACL 等顶级会议发表过论文。 - 参与过有影响力的开源项目，或在 GitHub 上有持续活跃贡献。 - 深度使用过 Cursor、Claude Code 等 AI 工具，对模型在真实 Agent 场景中的能力边界有实践认知。 AI Infra推理系统专家岗位职责： 1. 参与服务业务场景的llm大模型部署优化开发等相关工作； 2. 负责推理加速方法的工程实现和落地，包括但不限于模型算子优化、模型剪枝、模型量化、动态batch等方法； 3. 调研前沿技术，推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。任职要求： 1. 熟练掌握 C++/Python/Go语言，有大模型推理优化经验； 2. 有TRT-LLM/sglang/vllm等推理框架的实际使用经验及二次开发经验； 3. 具备基础的GPU编程能力，包括但不限于Cuda、OpenCL；熟悉至少一种GPU加速库，如cublas、cudnn等；加分项: 4. 熟悉分布式推理常用加速方法，有超大模型分布式部署经验优先； 5. 熟悉量化、剪枝、动态Shape、算子融合等优化方法的基本原理和适用场景。通用后训练算法专家 / 研究员职位要求我们希望你是什么样的人： 1. 有大模型后训练、专项能力优化、数据合成、过程监督、偏好数据构造等方向的研究或项目经验； 2. 有 reasoning、math、code、instruction following或复杂问答等相关研究或实践背景； 3. 有较强的实验分析能力，能够从评测结果中定位问题，并提出可执行的优化方案； 4. 熟悉分布式训练、并行训练或多机多卡实验环境，有大规模模型训练或微调经验； 5. 在 NeurIPS、ICML、ICLR、ACL 等顶级会议发表过论文； 6. 参与过有影响力的开源项目，或在 GitHub 上有持续活跃贡献； 7. 深度使用过 ChatGPT、Claude、Gemini、Cursor 等 AI 工具，对模型在通用推理、数学和代码场景中的能力边界有实践认知。 Code & Search Agent 算法研究员你将负责什么： - 研究并提升 agent 在真实任务中的能力，包括： - 代码理解、代码生成、代码编辑、自动调试、测试生成、仓库级任务求解 - 搜索、检索、网页/文档浏览、证据聚合、多跳问答、长链路任务完成 - 工具调用、环境交互、任务分解、反思/重试、记忆与上下文管理 - 设计并实现 agent 训练与后训练方法我们希望你是什么样的人： 1. 扎实的机器学习基础，理解 LLM、post-training、reasoning、tool use、evaluation 的核心问题； 2. 很强的编程能力，能高质量使用 Python；熟悉至少一种系统语言或高性能语言更佳，如 C++ / Rust / Go ； 3. 能独立完成从“问题定义 → 实验设计 → 实现 → 分析 → 迭代”的完整研究闭环； 4. 对复杂、开放、模糊的问题有判断力，知道什么值得做，什么只是忙碌； 5. 对代码质量、可复现性、测试、benchmark hygiene 有高标准； 6. 能在较大规模实验或分布式系统中工作，熟悉训练、推理或评测基础设施中的至少一类；大模型评测算法专家你将负责什么： 1. 构建通用大模型端到端能力评测体系：围绕 reasoning、math、code、instruction following、知识问答、长上下文、多轮对话与工具调用等典型任务，构建端到端评测体系。 2. 开展模型行为与智能体轨迹监控研究：面向具备工具调用、代码执行、网页浏览、多轮规划等能力的模型，分析其任务分解、计划生成、工具选择、上下文管理、错误恢复与目标偏移等过程信号，识别仅依赖最终答案难以发现的行为问题。我们希望你是什么样的人： 1. 有大模型相关方向的研究或项目经验； 2. 了解 OpenAI 及 Anthropic 关于模型轨迹等相关工作； 3. 有较强的实验分析能力，能够从评测结果中定位问题，并提出可执行的优化方案； 4. 在 NeurIPS、ICML、ICLR、ACL 等顶级会议发表过论文； 5. 参与过有影响力的开源项目，或在 GitHub 上有持续活跃贡献； 6. 深度使用过 ChatGPT、Claude、Gemini、Cursor 等 AI 工具，对模型在通用推理、数学和代码场景中的能力边界有实践认知。大模型训练系统专家岗位职责： 1. 负责大规模分布式训练系统的设计与研发，围绕 Data / Tensor / Pipeline / Expert 等并行策略进行实现与优化，提升大模型训练在多机多卡环境下的扩展能力与执行效率，支持百亿至万亿参数规模模型的训练需求。 2. 负责训练系统的性能分析与优化工作，系统性定位通信、计算、I/O、内存等关键路径瓶颈，并在算子融合、通信调度、精度策略及显存管理等方面进行优化，持续提升训练吞吐与资源利用率。 3. 参与训练框架及执行引擎的设计与能力建设，推动混合并行、MoE、量化训练等机制在工程系统中的落地，同时完善训练稳定性相关能力，包括异常检测、容错恢复及长时间训练稳定性保障。任职要求： 1. 本科及以上学历，计算机、软件工程或相关专业，具备扎实的编程基础，熟悉至少一门主流编程语言（Python / C++ / Go 等），并掌握数据结构、操作系统及并行计算相关基础知识。 2. 熟悉至少一种主流深度学习训练框架或工具，如 PyTorch、DeepSpeed、Megatron-LM，对其原理或使用方式有体系化理解。 3. 在以下任一方向具备经验或能力：包括分布式训练并行策略（DP / TP / PP / MoE）、GPU 或多机通信优化（如 NCCL、RDMA 等）、训练框架或执行引擎开发、大模型训练性能或稳定性优化等。 4. 对训练效率优化或前沿训练机制有一定理解或兴趣，包括混合并行策略、显存优化、优化器设计，或训练与推理协同优化（如量化训练、KV cache、speculative training 等）。 5. 有大规模模型训练经验（千卡及以上规模）或相关工程实践经验者优先，有开源项目、论文或工程成果可体现技术能力者优先。 AI Infra后端开发工程师岗位职责： 1. 负责基于 Kubernetes 的云原生基础设施与大模型应用平台的设计与开发； 2. 构建和维护高可用、高扩展性的容器化后端服务及平台能力； 3. 设计并实现基于微服务架构的系统，支持大规模模型服务部署与调度； 4. 参与构建和优化 CI/CD 流程，推动容器化部署与自动化运维体系建设；职位要求任职要求： 1. 本科及以上学历，计算机等相关专业优先； 2. 后端代码设计、开发经验，包括但不限于Go/Python/C++/Rust，熟悉其最佳实践和设计模式。 3. 熟悉 Kubernetes 核心机制（Pod、Deployment、Service、Ingress、CRD 等）及其工作原理，有 Kubernetes 二次开发经验（如 Operator、Controller），或使用 Kubebuilder / client-go 经验优先； 4. 能够处理并发编程，具备在高并发场景中优化系统的能力。 5. 理解 CI/CD 流程，能够推动自动化构建和部署。加分项: 6. 有在线模型推理服务开发经验/Rust开发经验优先。全栈软件开发工程师（AI 应用方向）职位描述 1. 负责 AI 应用产品的全栈开发，涵盖前端界面、后端服务、业务逻辑与线上系统建设； 2. 围绕实际用户需求，快速完成功能设计、开发、迭代和上线，持续打磨产品体验； 3. 将深度搜索、代码智能体能力等技术集成到产品中，支撑核心场景落地； 4. 负责产品相关的工程体系建设，包括可观测性、实验平台、评测体系、调试工具和研发效率工具； 5. 与产品、设计、算法团队协同，推动产品在体验、性能、稳定性和增长指标上的持续提升。职位要求 1. 本科及以上学历，计算机等相关专业优先，1年及以上相关工作经验者优先； 2. 熟悉 TypeScript / React / Next.js 等前端技术栈； 3. 熟悉 Node.js / Python / Go 之一，具备完整后端开发经验； 4. 有 AI Agent、LLM 应用、RAG 或代码生成类产品经验优先； 5. 具备较强的工程能力、复杂系统设计能力和产品意识； 6. 有强自驱力，对 AI Native 产品有热情，能在高迭代环境中快速交付。加分项： 1. 有 Sandbox、容器、K8s、任务调度经验优先； 2. 有开源贡献或个人 AI 产品优先； 3. 深度使用过 Claude Code / Codex 等 AI 编程工具优先。

【社招】顶级vc+大牛初创招聘大模型/agent研究员、infra、后端