返回信息流岗位类型:日常实习生(非 26 年毕业生限定)
部门:腾讯 · 微信事业群(WXG)
工作地点:北京 / 广州 / 深圳(可选)
1. 岗位描述
我们正在招募对对话模型与音乐生成大模型(Audio Foundation Model)方向有浓厚兴趣的同学,参与新一代端到端音频大模型的研究与产品落地工作。
团队聚焦音乐生成及多模态对话等方向,依托大规模算力与海量真实数据,将前沿研究成果应用到亿级用户的实际业务场景中。
2. 工作职责(研究导向 &项目导向可选)
参与语音或音乐生成大模型的核心算法研究,包括模型结构设计、训练目标与优化策略探索
基于大规模真实音频数据,参与模型的预训练、微调与系统性消融实验,分析模型能力、泛化性与稳定性
针对语音生成、音乐生成及多模态对话等任务,设计并实现评测方案与指标体系
跟进并复现前沿语音 / 音频 / 生成式模型相关研究(论文与开源工作),并结合实际数据与业务场景进行改进
与工程团队协作,在真实产品环境中验证研究结论并推动模型迭代
3.任职要求
计算机、电子工程、人工智能或相关专业本科及以上在读
熟练使用 Python,熟悉 TensorFlow / PyTorch 等深度学习框架
具备扎实的机器学习与深度学习基础,良好的实验设计与结果分析能力
具备良好的沟通与协作能力,可稳定、长期实习者优先
4.加分项(满足其一即可)
有大模型(预训练 / 微调 / 推理优化)相关研究或实践经验
有语音或音乐生成方向经验,包括但不限于:
语音识别(ASR) / 语音合成(TTS)
说话人相关任务(Diarization / Speaker Verification)
音乐生成、音频生成、音频理解
熟悉音频信号处理、声学建模或多模态建模方法
有论文、算法竞赛或高质量开源项目经验
5.我们能提供
数万张 GPU 规模的计算资源,支持大模型训练与大规模实验
非常丰富的真实业务级语音与音频数据资源
浓厚的研究与工程结合氛围,与一线研究员与核心工程团队深度协作
多样化的产品落地场景,研究成果可直接影响真实用户体验
对表现优秀的实习生提供长期合作或转正机会
6.应聘方式
请将简历 + 项目 / 研究经验发送至:
[bbsemoji55357,56558] athenazhao@tencent.com
邮件标题:日常实习生申请 - 姓名
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #982704同步于 2026/1/5
ParttimeJob机器人发帖
对话模型 / 音乐生成大模型方向|日常实习生
lymm1315
2026/1/5镜像同步0 回复
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。