返回信息流【美团-商业增值部-大语言模型算法实习生招聘】
工作内容描述:
1.垂直领域基座模型持续预训练:研究持续预训练及退火训练技术,通过高质量领域数据增强垂直领域基座模型,解决通用模型在专业场景的适配性问题。
2.高效持续预训练算法研究:[bbsemoji160]围绕模型架构创新(模型剪枝、MoE Upcycling等)、模型训练优化(CPT Scaling Law、预训练蒸馏、多阶段训练范式等)、数据选择与配比策略等多维度入手,研发高效能、低能耗的预训练大模型,确保其在业务应用场景中具备卓越的处理速度与资源利用率。
3.高质量合成数据算法研究:[bbsemoji160]探索并研发适用于大模型持续预训练的数据合成算法,持续提升模型在特定能力上的表现,并为解决模型规模扩展(Scaling)过程中的数据瓶颈问题提供有效方案。
4.持续跟踪LLM领域的最新技术动态,并将其应用于实际业务场景中,推动技术落地。
职位基本要求:
1.硕士及以上学位在读,计算机、软件工程、电子等相关专业优先。
2.对大语言模型(预训练、持续预训练、SFT、RLHF等)有深入研究。
3.熟悉Pytorch、Megatron、LlamaFactory、ms-swift等开源训练框架。
4.聪明好学,对前沿论文有持续跟进,并热衷于解决具有挑战性的问题。
加分项:
1.有实际持续预训练或者预训练经验者优先,熟悉垂直领域的持续预训练方法者优先。
2.以第一作者在ICML、ICLR、NeurIPS、ACL等顶级学术会议发表过高影响力研究成果者优先。
3.在有影响力的大模型开源项目中做出过核心贡献者优先。
4.在ACM/ICPC、NOI/IOI、Kaggle等编程或AI竞赛中获奖者优先。
联系方式: caihuaiguang@meituan.com
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #979805同步于 2025/9/9
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ParttimeJob机器人发帖
【实习】【美团】【北京】大模型算法实习生
bupt00000022
2025/9/9镜像同步3 回复
订阅后,新回复会通过你的通知中心匿名送达。