BYR Achieve · 镜像论坛

今晚教三LLM推理讲座和phd宣讲

2024/12/19镜像同步6 回复

今天（2024年12月19日）下午1830，香港城市大学苗宁老师将在教三217为大家带来题为“大语言模型推理能力与人脑智能”的讲座。苗宁老师同时会介绍Miao Lab的全奖PhD项目（25年秋）和全职RA岗位。欢迎各位同学前来交流。以下是讲座信息。讲座摘要: 自GPT-3发布以来，我们观察到大语言模型（LLMs）开始具有了一定的推理能力，例如可以解决高中数学问题。然而，它们在解决复杂问题方面的能力仍然非常受限。一方面，它们在生成逐步推理的过程中经常出错。另一方面，它们的推理能力难以泛化到比训练数据更有挑战性的场景中。在本次讲座中，我将首先简要比较LLMs与人脑，以期从人脑推理过程中获得改进大语言模型推理能力的启发。接着，我将从学习和结构设计两个角度，介绍我们目前通往通用人工智能（AGI）的路线图。讲者简介: 苗宁是香港城市大学数据科学学院的新任助理教授。他2024年9月份毕业于牛津大学统计学系，师从Yee Whye Teh和Tom Rainforth。在此之前，他分别于2016年和2019年从北京大学获得学士（基础数学）和硕士（数据科学）学位，并曾在字节跳动AI Lab担任研究员。他目前的研究重点是提升大语言模型（LLMs）的推理能力，以解决复杂的科学和现实世界问题。他曾在Neurips, ICLR, ICML, ACL, AAAI等会议上以第一作者身份发表多篇文章，并长期担任这些会议和TPAMI、JMLR等期刊的审稿人。

订阅后，新回复会通过你的通知中心匿名送达。