BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #980237同步于 2 周前
JobInfo机器人发帖

【社招】头部私募高薪招聘 预训练/后训练/agent算法专家/infra

hrjack
2 周前镜像同步0 回复
国内知名量化私募基金管理公司,管理资金百亿以上。 技术团队 90%毕业于美国常青藤、清北复交等知名院校,核心团队包括海外知名对冲基金优质人才,数学、物理、计算机等领域资深专家,国际顶会论文作者,国际知名数学及计算机竞赛如 CMO、NOI、ACM-ICPC、CPhO、APhO、Kaggle 竞赛高手等。 公司地址:北京、上海、深圳 感兴趣邮件至:jxiao@hiringby.com 微信:15210750729 大模型预训练算法研究员 职位描述 1、大语言模型预训练与迭代:主导/参与千亿至万亿级参数LLM的预训练工作。深入探索Scaling Law,指导模型结构设计与超参调优,并针对复杂代码和逻辑推理等能力进行专项提升; 2、数据迭代与训练策略优化:协同构建并持续优化预训练数据 Pipeline 与 Training Recipe。深入剖析数据清洗策略及高质量合成数据对模型上限的增益,探索并落地高效的 Data Mixing 方案; 3、前沿架构跟进及探索:跟踪并验证大模型前沿架构进展,研究并实现能够在不同规模模型上通用的优化方法(包括但不限于训练范式、正则化、模型架构改进、优化器、loss设计、超参优化),验证其在大中小模型上的迁移性与效果; 4、训练框架与计算效率优化:与系统/平台团队深度合作,针对超大规模模型,进行系统级性能优化,包括分布式训练策略、访存优化、通信优化和推理加速;参与探索底层算子的优化开发(基于CUDA、Triton或FlashAttention),保障极端规模分布式训练的稳定性与极致的模型算力利用率(MFU)。 职位要求 1、计算机、人工智能、数学、物理等相关专业,国内外顶尖高校硕士及以上学历(博士优先); 2、具备扎实的代码能力,在ACM/ICPC、NOI/IOI、TopCoder、Kaggle等顶级编程或AI赛事中获奖者优先; 3、熟练掌握PyTorch及至少一种主流大规模分布式训练框架(Megatron-LM / DeepSpeed 等);具备底层算子(Triton/CUDA)的高效实现能力,或拥有高并发分布式系统优化经验者具有极高加分; 4、在NeurIPS、ICLR、ICML、ACL等人工智能顶级会议发表过有影响力的一作论文,或主导/深度参与过业界具有高影响力的开源大语言模型及框架项目; 大模型后训练/Agent算法研究员 岗位职责 1、后训练全流程迭代: 深入参与千亿/万亿级参数大模型的后训练全流程迭代。主导并优化 SFT、RL、Reward Modeling 的算法设计与训练,攻克模型在长文本理解、深度逻辑推理以及多轮交互中的幻觉问题,显著提升复杂指令跟随能力; 2、Agent 核心能力研发: 构建复杂智能体系统(如 Deep Research、交互式 Agent、Coding Agent等方向)。深入优化 Agent 的任务拆解与规划(Planning)、自我反思与纠错(Reflection)、工具动态调用(Tool-use)及长效记忆机制,保障模型在多步骤、长程任务(Long-horizon tasks)中的极致稳定性与执行效果; 3、数据工程与评测体系: 设计并构建高质量的评测集,探索基于合成数据的自我进化(Self-improvement)与高效数据清洗方案;针对 Agent 复杂任务与深度推理,构建科学、自动化的评测 Benchmark,驱动模型优化。 任职要求 1、计算机、人工智能、数学等相关专业,国内外顶尖高校硕士及以上学历(博士优先); 2、具备极强的代码落地能力,精通主流深度学习及大模型训练/微调框架;在 ACM/ICPC、NOI/IOI、TopCoder、Kaggle 等顶级编程或 AI 赛事中取得优异成绩者优先; 3、在 NeurIPS、ICLR、ICML、ACL 等 AI 顶会发表过高质量一作论文,或作为核心贡献者参与过业界高影响力开源大模型/大模型框架项目者优先; 多模态agent算法专家 职位描述 1、基于通用大模型,结合垂类应用场景,进行相关的数据建设、指令微调、偏好对齐、模型优化,升数据合成、模型推理&规划能力,构建全面客观准确的评测体系,探索提升垂类大模型能力; 2、探索突破包括而不限于多模态RAG,VLA模型、GUI Agent等在内的多模态AI Agent,推动相关的新技术落地; 3、探索研究多模态理解、生成式、机器学习、强化学习、AIGC、计算机视觉、人工智能等前沿技术。 职位要求 1、熟悉多模态大模型(VLM)、大语言模型(LLM)相关的算法技术,有AI Agent应用经验、熟悉RAG全链路优化、Multi-Agent技术、Prompt/Context Engineering工程技术的优先 2、了解LLM架构,熟悉RL算法(GRPO、PPO、DPO、判别式及生成式RM)、在相关领域有过良好的项目经验或研究经验,熟悉大模型相关的数据构造方法、Post Training算法 AI Agent算法工程师/专家 岗位职责: 1.从业务场景出发,识别 AI Agent 能发挥价值的关键方向,探索可行的技术路径与实现机制; 2.结合主流大模型能力,构建具备任务感知、信息处理与多轮交互能力的智能体系统; 3.负责模型的选型与优化,提升其在具体场景下的适应性与稳定性; 4.推动系统在真实环境中的集成与落地,评估效果并持续演进技术方案; 5.沉淀通用方法论与工程架构,支持后续能力在更多场景中的扩展。 任职要求: 1.熟悉多模态大模型(VLM)、大语言模型(LLM)相关的算法技术,有AI Agent应用经验、熟悉RAG全链路优化、Multi-Agent技术、Prompt/Context Engineering工程技术的优先。 2.了解LLM架构,熟悉RL算法(GRPO、PPO、DPO、判别式及生成式RM)、在相关领域有过良好的项目经验或研究经验,熟悉大模型相关的数据构造方法、Post Training算法。 AI infra工程师 岗位职责 1、负责超大规模机器学习系统的架构设计与实现,直面高并发、低延迟、高可靠性与可扩展性等核心工程问题; 2、覆盖系统多个关键子领域:资源调度、分布式模型训练、数据管理与高性能计算等,能在不同岗位边界间灵活切换与贡献; 3、与算法团队紧密协作,推动算法与系统的协同优化 4、主动跟踪并引入前沿技术,把最新硬件、异构计算、编译优化、以及RL/Agent型交互等新方向落地到工程实践中。 岗位要求 1、在工程实现或机器学习算法上有扎实基础与丰富实践经验; 2、有解决棘手问题的经历,愿意钻研根源、追查底层问题,具备敏锐观察力和清晰的逻辑思维; 3、热爱技术、有责任感、学习能力强、沟通顺畅并能自驱推进工作; 4、善于团队协作,积极创新,乐于挑战,具有自我驱动和自我管理能力。
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。