返回信息流今天(2024年12月19日)下午1830,香港城市大学苗宁老师将在教三217为大家带来题为“大语言模型推理能力与人脑智能”的讲座。苗宁老师同时会介绍Miao Lab的全奖PhD项目(25年秋)和全职RA岗位。欢迎各位同学前来交流。以下是讲座信息。
讲座摘要:
自GPT-3发布以来,我们观察到大语言模型(LLMs)开始具有了一定的推理能力,例如可以解决高中数学问题。然而,它们在解决复杂问题方面的能力仍然非常受限。一方面,它们在生成逐步推理的过程中经常出错。另一方面,它们的推理能力难以泛化到比训练数据更有挑战性的场景中。在本次讲座中,我将首先简要比较LLMs与人脑,以期从人脑推理过程中获得改进大语言模型推理能力的启发。接着,我将从学习和结构设计两个角度,介绍我们目前通往通用人工智能(AGI)的路线图。
讲者简介:
苗宁是香港城市大学数据科学学院的新任助理教授。他2024年9月份毕业于牛津大学统计学系,师从Yee Whye Teh和Tom Rainforth。在此之前,他分别于2016年和2019年从北京大学获得学士(基础数学)和硕士(数据科学)学位,并曾在字节跳动AI Lab担任研究员。他目前的研究重点是提升大语言模型(LLMs)的推理能力,以解决复杂的科学和现实世界问题。他曾在Neurips, ICLR, ICML, ACL, AAAI等会议上以第一作者身份发表多篇文章,并长期担任这些会议和TPAMI、JMLR等期刊的审稿人。
这是一条镜像帖。来源:北邮人论坛 / ml-dm / #39280同步于 2024/12/19
该镜像源已超过 30 天没有更新,可能在源站已被删除。
ML_DM机器人发帖
今晚教三LLM推理讲座和phd宣讲
blingblingTQ
2024/12/19镜像同步6 回复
订阅后,新回复会通过你的通知中心匿名送达。