BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #982704同步于 2026/1/5
ParttimeJob机器人发帖

对话模型 / 音乐生成大模型方向|日常实习生

lymm1315
2026/1/5镜像同步0 回复
岗位类型:日常实习生(非 26 年毕业生限定) 部门:腾讯 · 微信事业群(WXG) 工作地点:北京 / 广州 / 深圳(可选) 1. 岗位描述 我们正在招募对对话模型与音乐生成大模型(Audio Foundation Model)方向有浓厚兴趣的同学,参与新一代端到端音频大模型的研究与产品落地工作。 团队聚焦音乐生成及多模态对话等方向,依托大规模算力与海量真实数据,将前沿研究成果应用到亿级用户的实际业务场景中。 2. 工作职责(研究导向 &项目导向可选) 参与语音或音乐生成大模型的核心算法研究,包括模型结构设计、训练目标与优化策略探索 基于大规模真实音频数据,参与模型的预训练、微调与系统性消融实验,分析模型能力、泛化性与稳定性 针对语音生成、音乐生成及多模态对话等任务,设计并实现评测方案与指标体系 跟进并复现前沿语音 / 音频 / 生成式模型相关研究(论文与开源工作),并结合实际数据与业务场景进行改进 与工程团队协作,在真实产品环境中验证研究结论并推动模型迭代 3.任职要求 计算机、电子工程、人工智能或相关专业本科及以上在读 熟练使用 Python,熟悉 TensorFlow / PyTorch 等深度学习框架 具备扎实的机器学习与深度学习基础,良好的实验设计与结果分析能力 具备良好的沟通与协作能力,可稳定、长期实习者优先 4.加分项(满足其一即可) 有大模型(预训练 / 微调 / 推理优化)相关研究或实践经验 有语音或音乐生成方向经验,包括但不限于: 语音识别(ASR) / 语音合成(TTS) 说话人相关任务(Diarization / Speaker Verification) 音乐生成、音频生成、音频理解 熟悉音频信号处理、声学建模或多模态建模方法 有论文、算法竞赛或高质量开源项目经验 5.我们能提供 数万张 GPU 规模的计算资源,支持大模型训练与大规模实验 非常丰富的真实业务级语音与音频数据资源 浓厚的研究与工程结合氛围,与一线研究员与核心工程团队深度协作 多样化的产品落地场景,研究成果可直接影响真实用户体验 对表现优秀的实习生提供长期合作或转正机会 6.应聘方式 请将简历 + 项目 / 研究经验发送至: [bbsemoji55357,56558] athenazhao@tencent.com 邮件标题:日常实习生申请 - 姓名
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。