在开放世界构建通用智能体
Speaker
梁一韬
Time
2024-05-23 14:30:00 ~ 2024-05-23 16:00:00
Location
逸夫楼208教室
Host
温颖
Abstract
随着大型语言模型的出现,关于是否会出现通用智能体(generalist agent)的辩论重新兴起。然而,GPT在所涌现的通用能力,在除了文字领域似乎很难再现。在这次分享中,我们将介绍我们组以及其他一些相关的知名研究实验室的各种在使用开放世界环境(例如Minecraft)来开发通用智能体(agent)的努力。由于其超高的自由度,传统的多任务数据驱动的方式不可维系(我们无法对上千的任务同时进行大规模训练,过于昂贵)。一个可能的方向是,利用一些通用常识来获得高训练效率和模型泛化性。我会重点介绍如何利用大语言模型来利用环境知识进行具有系统泛化能力的任务拆解,以及如何利用无监督学习获得一个通用的可随prompt控制(steerable)的通用策略表达,并展现在Minecraft现在最前沿的智能体(agent)大概具备什么样的任务完成能力。
Bio
梁一韬博士,北京大学人工智能研究院助理教授,博导,博雅青年学者,2022年国家人才计划青年项目(海外)获得者。2021年6月于加利福尼亚大学洛杉矶分校获得博士学位。从事神经符号融合的研究,一直致力研究如何将知识注入机器学习中以提高其性能和通用性。曾获得过强化学习顶级会议AAMAS2016最佳论文提名、在ICML19举办的Reinforcement Learning for Real Life Workshop最佳论文及在NeurIPS 2017举办的Learning from Limited Labeled Data(LLD)Workshop次佳论文,在ICML2023举办的TEACH Workshop最佳论文。在学术服务方面,常年担任多个顶级期刊和会议的(资深)领域主席。