返回信息流工作内容
1、研究和开发基于强化学习的大语言模型优化算法;
2、设计和实现可扩展的强化学习算法架构,实现算法训练和推理;
3、与团队成员协作,将算法应用于实际业务场景,并优化性能和效果;
4、跟进相关领域的前沿技术和研究,发现和解决技术难题。
职位要求
1、计算机相关专业,具备良好的编程能力和数据结构和算法设计基础;
2、熟悉强化学习和深度学习相关算法,至少熟悉一种深度学习框架;
3、具备良好的数学基础,熟练掌握概率论、线性代数、微积分等相关知识;
4、有良好的英文读写能力,能够阅读和理解相关领域的研究论文;
5、实践动手能力强,参加过机器学习、强化学习、深度学习相关比赛并获奖者优先;
6、熟悉自然语言处理、语言模型等相关领域,有大语言模型优化相关经验者优先;
7、具备团队合作精神,能够与其他团队成员有效沟通和协作。
基于人类反馈的强化学习现在是大语言模型的重要微调步骤,这个项目也是目前公司优先级最高的,来到这里你能获得最宝贵的前沿研究经验
https://mp.weixin.qq.com/s/tyqCZN15XsMvFys4lplqfw
有兴趣的同学请投递简历至
gongyaguang@tal.com
这是一条镜像帖。来源:北邮人论坛 / parttime-job / #948685同步于 2023/5/11
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ParttimeJob机器人发帖
【实习】【学而思好未来】大语言模型算法实习生
abkdnh
2023/5/11镜像同步4 回复
订阅后,新回复会通过你的通知中心匿名送达。