BYR Achieve · 镜像论坛

岗位类型：日常实习生（非 26 年毕业生限定）部门：腾讯 · 微信事业群（WXG）工作地点：北京 / 广州 / 深圳（可选） 1. 岗位描述我们正在招募对对话模型与音乐生成大模型（Audio Foundation Model）方向有浓厚兴趣的同学，参与新一代端到端音频大模型的研究与产品落地工作。团队聚焦音乐生成及多模态对话等方向，依托大规模算力与海量真实数据，将前沿研究成果应用到亿级用户的实际业务场景中。 2. 工作职责（研究导向 &项目导向可选）参与语音或音乐生成大模型的核心算法研究，包括模型结构设计、训练目标与优化策略探索基于大规模真实音频数据，参与模型的预训练、微调与系统性消融实验，分析模型能力、泛化性与稳定性针对语音生成、音乐生成及多模态对话等任务，设计并实现评测方案与指标体系跟进并复现前沿语音 / 音频 / 生成式模型相关研究（论文与开源工作），并结合实际数据与业务场景进行改进与工程团队协作，在真实产品环境中验证研究结论并推动模型迭代 3.任职要求计算机、电子工程、人工智能或相关专业本科及以上在读熟练使用 Python，熟悉 TensorFlow / PyTorch 等深度学习框架具备扎实的机器学习与深度学习基础，良好的实验设计与结果分析能力具备良好的沟通与协作能力，可稳定、长期实习者优先 4.加分项（满足其一即可）有大模型（预训练 / 微调 / 推理优化）相关研究或实践经验有语音或音乐生成方向经验，包括但不限于：语音识别（ASR） / 语音合成（TTS）说话人相关任务（Diarization / Speaker Verification）音乐生成、音频生成、音频理解熟悉音频信号处理、声学建模或多模态建模方法有论文、算法竞赛或高质量开源项目经验 5.我们能提供数万张 GPU 规模的计算资源，支持大模型训练与大规模实验非常丰富的真实业务级语音与音频数据资源浓厚的研究与工程结合氛围，与一线研究员与核心工程团队深度协作多样化的产品落地场景，研究成果可直接影响真实用户体验对表现优秀的实习生提供长期合作或转正机会 6.应聘方式请将简历 + 项目 / 研究经验发送至： [bbsemoji55357,56558] athenazhao@tencent.com 邮件标题：日常实习生申请 - 姓名

对话模型 / 音乐生成大模型方向｜日常实习生