CoRL 2020奖项公布!张伟楠与指导的学生斩获最佳系统论文奖!
近日,CoRL 2020最佳论文奖、最佳系统论文奖、最佳论文展示奖等各项大奖出炉!我中心长聘教轨副教授张伟楠及其学生周铭获得最佳系统论文!
CoRL的全称为Conference on Robot Learning(机器人学习大会)
在CoRL官网,组委会这样描述举办CoRL的缘由:
机器人技术,自主感知和控制领域正在经历一场机器学习革命,现在正是时候提供一个将机器学习的基本进展与机器人应用和理论的实证研究相结合的场所。我们的目标是使CoRL成为机器人(机器)学习研究的首选大会。
CoRL大会自2017年推出以来,已迅速成为机器人技术与机器学习交叉领域的全球顶级学术盛会之一:“针对机器人学习研究的大会,涵盖了机器人技术、机器学习和控制等广泛主题,包括理论和应用各方面。”
今年,CoRL 2020有475篇论文投稿,比2019年增加了20%。最终,仅有165篇论文被接收,接受率为34.7%。
周铭
张伟楠
缪佳宇
论文介绍
论文题目:
《SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for Autonomous Driving》.
本文提出了一个完善且经过深思熟虑的系统,对自动驾驶社区具有巨大的潜在影响。
多智能体交互是现实世界中自动驾驶的基础,尽管人们已经进行了十多年的研究和发展,但如何在各种情况下与各种道路车辆(智能体)进行有效交互的问题仍未解决。Learning的方法可以为解决这个问题提供很多帮助,但是这一方法需要一个现实的多智能体模拟器,该模拟器会产生多种多样且有效的驾驶交互。为了满足这一需求,我们开发了一个专用的仿真平台:SMARTS (Scalable Multi-Agent RL Training School):可扩展多智能体强化学习学校。
上图是SMARTS 模型架构,其交互方案是使用特定领域语言(DSL)定义的。Social智能体是从“ Social智能体Zoo”中实例化而来。橙色车辆由学智能体控制、深蓝色车辆由 Social智能体控制、浅蓝色车辆由交通服务提供商控制。原则上,所有提供程序和智能体都可以在自己的进程中运行,也可以远程运行。SMARTS支持训练、积累和使用道路用户的各种行为模型,这些反过来又可以用于创建越来越现实和多样化的交互,从而可以对多智能体交互进行更深入、更广泛的研究。在本文中,我们描述了SMARTS的设计目标,解释了SMARTS的基本体系架构和关键功能,并通过在交互场景中进行具体的多智能体实验来说明其用法。
最后,我们开源了SMARTS平台以及相关的基准测试任务和性能评估指标,以鼓励和支持针对自动驾驶的多智能体学习的研究。