返回信息流顶级vc 投资,全球知名AI 科学院带队AGI 创业公司。
团队均来自大厂和ai 头部公司核心团队,精英文化,扁平做事。
创始人具备成功的 ai 产品研究和落地经验。
地点:北、上、深
邮箱:jxiao@hiringby.com wexin:15210750729
Agent基模预训练算法专家 / 研究员
岗位职责
职位要求
我们希望你是什么样的人:
1. 有大规模模型训练或调优的实践经验,熟悉分布式训练环境,至少熟练掌握 mcore、torchtune 或 transformers Trainer 等主流训练框架中的某一个;
2. 有模型结构设计相关研究背景或实践经验,熟悉高效注意力、Gated Attention、mHC、MoE 等相关工作;
3. 有面向大模型通用能力、Deep Research 或者 Vibe Coding 能力的训练数据合成/构建/清洗的研究背景或实践经验,熟悉数据管线的设计思路,能够熟练使用基于 OpenAI / SGLang / vLLM 等接口部署的模型大批量构建/清洗数据;
4. 参与/复现过 Scaling Law 的拟合过程,能根据实验结果对模型各项指标进行分析,优化模型训练设置及策略;
5. 在 ICLR、CVPR、TPAMI、ACL 等顶级会议/期刊发表过论文;
6. 参与过有影响力的大模型项目,并在该项目中做出实际贡献;
Agent基模后训练算法专家 / 研究员
职责:
. 开展 Agent 场景下的后训练算法研究:围绕多步推理、任务拆解、工具调用、代码执行、检索增强、复杂指令遵循等典型 Agent 场景,研究模型能力提升的后训练方法,提升任务完成率、稳定性与泛化能力;
2. 设计与优化面向 Agent 的训练数据:结合实际场景和模型短板,构建适用于后训练的数据体系,包括指令数据、过程监督数据、偏好数据、轨迹数据等,不断提升训练信号的质量、密度和覆盖度;
3. 探索模型能力提升方法:研究并实践 SFT、拒绝采样、偏好学习、过程监督等方法,推动模型在复杂推理、工具使用、代码任务和长链路任务中的能力优化;
职位要求
我们希望你是什么样的人:
- 有大模型后训练、专项能力优化、数据合成、过程监督、偏好数据构造等方向的研究或项目经验。
- 有 Code Agent、Search Agent、Tool Use、检索增强、复杂推理等相关研究或实践背景。
- 有较强的实验分析能力,能够从评测结果中定位问题,并提出可执行的优化方案。
- 熟悉分布式训练、并行训练或多机多卡实验环境,有大规模模型训练或微调经验。
- 在 NeurIPS、ICML、ICLR、ACL 等顶级会议发表过论文。
- 参与过有影响力的开源项目,或在 GitHub 上有持续活跃贡献。
- 深度使用过 Cursor、Claude Code 等 AI 工具,对模型在真实 Agent 场景中的能力边界有实践认知。
AI Infra推理系统专家
岗位职责:
1. 参与服务业务场景的llm大模型部署优化开发等相关工作;
2. 负责推理加速方法的工程实现和落地,包括但不限于模型算子优化、模型剪枝、模型量化、动态batch等方法;
3. 调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。
任职要求:
1. 熟练掌握 C++/Python/Go语言,有大模型推理优化经验;
2. 有TRT-LLM/sglang/vllm等推理框架的实际使用经验及二次开发经验;
3. 具备基础的GPU编程能力,包括但不限于Cuda、OpenCL;熟悉至少一种GPU加速库,如cublas、cudnn等;
加分项:
4. 熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先;
5. 熟悉量化、剪枝、动态Shape、算子融合等优化方法的基本原理和适用场景。
通用后训练算法专家 / 研究员
职位要求
我们希望你是什么样的人:
1. 有大模型后训练、专项能力优化、数据合成、过程监督、偏好数据构造等方向的研究或项目经验;
2. 有 reasoning、math、code、instruction following或复杂问答等相关研究或实践背景;
3. 有较强的实验分析能力,能够从评测结果中定位问题,并提出可执行的优化方案;
4. 熟悉分布式训练、并行训练或多机多卡实验环境,有大规模模型训练或微调经验;
5. 在 NeurIPS、ICML、ICLR、ACL 等顶级会议发表过论文;
6. 参与过有影响力的开源项目,或在 GitHub 上有持续活跃贡献;
7. 深度使用过 ChatGPT、Claude、Gemini、Cursor 等 AI 工具,对模型在通用推理、数学和代码场景中的能力边界有实践认知。
Code & Search Agent 算法研究员
你将负责什么:
- 研究并提升 agent 在真实任务中的能力,包括:
- 代码理解、代码生成、代码编辑、自动调试、测试生成、仓库级任务求解
- 搜索、检索、网页/文档浏览、证据聚合、多跳问答、长链路任务完成
- 工具调用、环境交互、任务分解、反思/重试、记忆与上下文管理
- 设计并实现 agent 训练与后训练方法
我们希望你是什么样的人:
1. 扎实的机器学习基础,理解 LLM、post-training、reasoning、tool use、evaluation 的核心问题 ;
2. 很强的编程能力,能高质量使用 Python;熟悉至少一种系统语言或高性能语言更佳,如 C++ / Rust / Go ;
3. 能独立完成从“问题定义 → 实验设计 → 实现 → 分析 → 迭代”的完整研究闭环 ;
4. 对复杂、开放、模糊的问题有判断力,知道什么值得做,什么只是忙碌 ;
5. 对代码质量、可复现性、测试、benchmark hygiene 有高标准 ;
6. 能在较大规模实验或分布式系统中工作,熟悉训练、推理或评测基础设施中的至少一类 ;
大模型评测算法专家
你将负责什么:
1. 构建通用大模型端到端能力评测体系: 围绕 reasoning、math、code、instruction following、知识问答、长上下文、多轮对话与工具调用等典型任务,构建端到端评测体系。
2. 开展模型行为与智能体轨迹监控研究: 面向具备工具调用、代码执行、网页浏览、多轮规划等能力的模型,分析其任务分解、计划生成、工具选择、上下文管理、错误恢复与目标偏移等过程信号,识别仅依赖最终答案难以发现的行为问题。
我们希望你是什么样的人:
1. 有大模型相关方向的研究或项目经验;
2. 了解 OpenAI 及 Anthropic 关于模型轨迹等相关工作;
3. 有较强的实验分析能力,能够从评测结果中定位问题,并提出可执行的优化方案;
4. 在 NeurIPS、ICML、ICLR、ACL 等顶级会议发表过论文;
5. 参与过有影响力的开源项目,或在 GitHub 上有持续活跃贡献;
6. 深度使用过 ChatGPT、Claude、Gemini、Cursor 等 AI 工具,对模型在通用推理、数学和代码场景中的能力边界有实践认知。
大模型训练系统专家
岗位职责:
1. 负责大规模分布式训练系统的设计与研发,围绕 Data / Tensor / Pipeline / Expert 等并行策略进行实现与优化,提升大模型训练在多机多卡环境下的扩展能力与执行效率,支持百亿至万亿参数规模模型的训练需求。
2. 负责训练系统的性能分析与优化工作,系统性定位通信、计算、I/O、内存等关键路径瓶颈,并在算子融合、通信调度、精度策略及显存管理等方面进行优化,持续提升训练吞吐与资源利用率。
3. 参与训练框架及执行引擎的设计与能力建设,推动混合并行、MoE、量化训练等机制在工程系统中的落地,同时完善训练稳定性相关能力,包括异常检测、容错恢复及长时间训练稳定性保障。
任职要求:
1. 本科及以上学历,计算机、软件工程或相关专业,具备扎实的编程基础,熟悉至少一门主流编程语言(Python / C++ / Go 等),并掌握数据结构、操作系统及并行计算相关基础知识。
2. 熟悉至少一种主流深度学习训练框架或工具,如 PyTorch、DeepSpeed、Megatron-LM,对其原理或使用方式有体系化理解。
3. 在以下任一方向具备经验或能力:包括分布式训练并行策略(DP / TP / PP / MoE)、GPU 或多机通信优化(如 NCCL、RDMA 等)、训练框架或执行引擎开发、大模型训练性能或稳定性优化等。
4. 对训练效率优化或前沿训练机制有一定理解或兴趣,包括混合并行策略、显存优化、优化器设计,或训练与推理协同优化(如量化训练、KV cache、speculative training 等)。
5. 有大规模模型训练经验(千卡及以上规模)或相关工程实践经验者优先,有开源项目、论文或工程成果可体现技术能力者优先。
AI Infra后端开发工程师
岗位职责:
1. 负责基于 Kubernetes 的云原生基础设施与大模型应用平台的设计与开发;
2. 构建和维护高可用、高扩展性的容器化后端服务及平台能力;
3. 设计并实现基于微服务架构的系统,支持大规模模型服务部署与调度;
4. 参与构建和优化 CI/CD 流程,推动容器化部署与自动化运维体系建设;
职位要求
任职要求:
1. 本科及以上学历,计算机等相关专业优先;
2. 后端代码设计、开发经验,包括但不限于Go/Python/C++/Rust,熟悉其最佳实践和设计模式。
3. 熟悉 Kubernetes 核心机制(Pod、Deployment、Service、Ingress、CRD 等)及其工作原理,有 Kubernetes 二次开发经验(如 Operator、Controller),或使用 Kubebuilder / client-go 经验优先;
4. 能够处理并发编程,具备在高并发场景中优化系统的能力。
5. 理解 CI/CD 流程,能够推动自动化构建和部署。
加分项:
6. 有在线模型推理服务开发经验/Rust开发经验优先。
全栈软件开发工程师(AI 应用方向)
职位描述
1. 负责 AI 应用产品的全栈开发,涵盖前端界面、后端服务、业务逻辑与线上系统建设;
2. 围绕实际用户需求,快速完成功能设计、开发、迭代和上线,持续打磨产品体验;
3. 将深度搜索、代码智能体能力等技术集成到产品中,支撑核心场景落地;
4. 负责产品相关的工程体系建设,包括可观测性、实验平台、评测体系、调试工具和研发效率工具;
5. 与产品、设计、算法团队协同,推动产品在体验、性能、稳定性和增长指标上的持续提升。
职位要求
1. 本科及以上学历,计算机等相关专业优先,1年及以上相关工作经验者优先;
2. 熟悉 TypeScript / React / Next.js 等前端技术栈;
3. 熟悉 Node.js / Python / Go 之一,具备完整后端开发经验;
4. 有 AI Agent、LLM 应用、RAG 或代码生成类产品经验优先;
5. 具备较强的工程能力、复杂系统设计能力和产品意识;
6. 有强自驱力,对 AI Native 产品有热情,能在高迭代环境中快速交付。
加分项:
1. 有 Sandbox、容器、K8s、任务调度经验优先;
2. 有开源贡献或个人 AI 产品优先;
3. 深度使用过 Claude Code / Codex 等 AI 编程工具优先。
这是一条镜像帖。来源:北邮人论坛 / jump / #88379同步于 2026/5/15
Jump机器人发帖
【社招】顶级vc+大牛初创招聘大模型/agent研究员、infra、后端
hrjack
2026/5/15镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。