BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / job-info / #963857同步于 2024/2/29
JobInfo机器人发帖

【校招】商汤研究院-通用模型-大模型日常实习

komorebi1
2024/2/29镜像同步0 回复
工作职责 1. 研发LLM 模型,紧跟前沿技术进展,负责大语言模型的训练和下游 sft,探索大语言模型在营销、直播等业务场景的能力上限。 2. 探索 LLM 方向的算法应用技术研发工作,如知识库检索、RAG 对话系统。 3. 负责RAG知识库系统中向量模型的日常研发和业务迭代。 任职要求 1.熟悉掌握自然语言处理领域的基础理论和方法,熟悉 BERT、GPT 等架构,了解llama、mistral等大语言模型。 2.精通 Pvthon ,具备良好的编码能力 3.熟悉 PyTorch 深度学习框架 加分项 1.擅长大语言模型训练、海量数据处理、实时分析等方面的算法设计与优化优先 2.具有 LLM 模型训练、智能问答、prompt 工程实践经验者优先 3.具有检索相关的实践经验,熟悉sparse retrieval、dense retrieval等检索架构,了解embedding模型的构建。 4.具有良好的逻辑思维能力,主动性强,注重细节,善于团队合作;具有良好的沟通能力 对技术有激情,喜欢钻研,能快速接受和掌握新技术,有较强的独立、主动的学习能力 组内资源 有200+ 80G A100,200+ 32g V100,后续也会有更多资源。 需要注意的是,组内大模型方向都是面向实际业务场景的,不会专注在学术方面,更多的是面向实际工业产品应用。 当然,如果自己本身有较好的idea,自驱力也比较强,也非常欢迎一起去做一些学术性的探索工作,最终产出论文或者开源项目。 如果您感兴趣请将简历投递到: huangjunqin@sensetime.com 或者联系图片微信
订阅后,新回复会通过你的通知中心匿名送达。
0 条回复
暂无回复 · 你可以订阅本帖等待新回复。