Home

【报名】强化学习和博弈论前沿算法研讨会


  • 2019-06-17 13:30:00 ~ 2019-06-17 17:30:00

      由上海交通大学约翰·霍普克罗夫特计算机科学中心主办的“强化学习和博弈论前沿算法研讨会”将于2019年6月17日(周一)在电信群楼3-200号报告厅举行。
 


      随着人工智能、5G和物联网等尖端技术渗透进我们的生活,我们有理由相信在不久的将来,我们将生活在一个万物互联的智能时代。智能器件将不再只是与人或者一堆固定的数据交流,它们之间会相互交流、协作甚至是竞争,从而完成我们当前无法想象的高级智能任务。

       在学术方面,强化学习和博弈论分别代表了决策智能和多智能体系统的技术前沿领域,这两个领域的交叉极可能迸发出万物互联的智能时代的新一代技术!但就目前来看,这两个领域的交流还比较少,搞强化学习的科学家往往不太懂博弈论,而搞博弈论的学者则不太关注强化学习。

      本次研讨会,我们将邀请四位做强化学习和博弈论的讲者与大家分享各自在这一交叉领域的探索情况。CMU方飞助理教授和上海财大陆品燕教授主攻博弈论前沿研究,并在近期加入强化学习和机器学习的模块到博弈论的框架中。南京大学的俞扬教授和上海交大的张伟楠助理教授则重点研究强化学习,并在近期探索了多智能体博弈中的强化学习算法和实验平台。我们期待本次研讨会能为这一令人激动的交叉领域带来全新的活力,吸引更多的学者和同学们加入探索。

时间:2019年6月17日(周一),13:30-17:30
地点:电信群楼3-200号报告厅
报名方式:点击“报名链接”,报名参会!

议程
13:30-13:35   
开场致辞,王新兵

13:35-13:40
强化学习和博弈论技术结合的背景介绍,张伟楠

13:40-14:30  
Integrating Learning with Game Theory for Societal Challenges ,方飞

14:30-15:20
Real-World Intelligent Decisions through Simulated Adversarial Reinforcement Learning ,俞扬

15:20-15:40
茶歇

15:40-16:30
最优拍卖机制设计:简单性与鲁棒性 ,陆品燕

16:30-17:20
大规模智能体强化学习:基础设施搭建和前沿算法落地,张伟楠

17:20-17:30
自由答疑环节


演讲嘉宾及报告摘要


方飞,CMU助理教授

Title: Integrating Learning with Game Theory for Societal Challenges
 
Abstract: There is a rising interest in developing artificial intelligence-based tools to address challenges in various security domains, e.g., protecting critical infrastructure and cyber networks and protecting wildlife, fishery, and forest. Motivated by these challenges, we have proposed game theory and machine learning based models and algorithms for problems with strategic interactions among agents. In this talk, I will introduce our models and algorithms that have led to two successfully deploy applications: one used by US Coast Guard for protecting the Staten Island Ferry in New York City since April 2013, the other used in multiple conservation areas around the world for anti-poaching effort. In addition, I will highlight our most recent advances in integrating deep learning with game theory, including computing equilibrium by learning from self-play and end-to-end learning of game parameters.
 
Bio: Fei Fang is an Assistant Professor at the Institute for Software Research in the School of Computer Science at Carnegie Mellon University. Before joining CMU, she was a Postdoctoral Fellow at the Center for Research on Computation and Society (CRCS) at Harvard University. She received her Ph.D. from the Department of Computer Science at the University of Southern California in June 2016. She received her bachelor degree from the Department of Electronic Engineering, Tsinghua University in July 2011. Her research lies in the field of artificial intelligence and multi-agent systems, focusing on integrating game theory and mechanism design with machine learning. Her work has been motivated by and applied to security, sustainability, and mobility domains, contributing to the theme of AI for Social Good. Her work has won the Distinguished Paper at the 27th International Joint Conference on Artificial Intelligence and the 23rd European Conference on Artificial Intelligence (IJCAI-ECAI’18), Innovative Application Award at Innovative Applications of Artificial Intelligence (IAAI’16), the Outstanding Paper Award in Computational Sustainability Track at the International Joint Conferences on Artificial Intelligence (IJCAI’15). Her dissertation is selected as the runner-up for IFAAMAS-16 Victor Lesser Distinguished Dissertation Award, and is selected to be the winner of the William F. Ballhaus, Jr. Prize for Excellence in Graduate Engineering Research as well as the Best Dissertation Award in Computer Science at the University of Southern California. Her work has been deployed by the US Coast Guard for protecting the Staten Island Ferry in New York City since April 2013. Her work has led to the deployment of PAWS (Protection Assistant for Wildlife Security) in multiple conservation areas around the world, which provides predictive and prescriptive analysis for anti-poaching effort.



俞扬,南京大学教授

Title: Real-World Intelligent Decisions through Simulated Adversarial Reinforcement Learning


Abstract:基于强化学习技术,人工智能系统已在围棋、视频游戏等领域展示出了可超越人类的决策能力。然而在大量的实际应用中,如此强大的决策能力仍然难以获得,其主要瓶颈之一在于,目前强化学习的训练过程需要大量试错,而在实际应用环境中直接试错将造成难以承受的代价,甚至发生灾难。针对这一瓶颈,我们在近期的研究中发展了"环境虚拟—强化学习—模型重用"的途径,对于有历史数据积累的应用领域,实现了0试错代价的决策学习。本次报告将汇报我们在这一途径上的探索进展和在应用场景中取得的效果。

Bio:俞扬,博士,南京大学教授。主要研究领域为机器学习、强化学习。分别于2004年和2011年获得南京大学计算机科学与技术系学士学位和博士学位,获2013年全国优秀博士学位论文奖、2011年CCF优秀博士学位论文奖。发表论文40余篇,包括多篇Artificial Intelligence、IJCAI、AAAI、NIPS、KDD等,获得4项国际论文奖励和2项国际算法竞赛冠军,入选2018年IEEE Intelligent Systems杂志评选的“国际人工智能10大新星”,获2018亚太数据挖掘"青年成就奖”,受邀在IJCAI’18作关于强化学习的"青年亮点"报告。
 

 
陆品燕,上海财大教授

Title:最优拍卖机制设计:简单性与鲁棒性

Abstract:设计最优拍卖机制是微观经济学中一个非常重要的课题,特别是网络经济的发展让这个课题更加具有现实意义。经济学中关于这个课题最重要的结果就是著名的Myerson最优拍卖理论,Myerson因此而获得了诺贝尔经济学奖。但这个漂亮的经济学理论在现实中的使用却非常少,主要有两个原因:一是这个最优拍卖机制比较复杂;二是这个机制的最优性有很严格的数学假设条件,这些条件不一定在现实中满足。针对这些问题,最近十几年里在理论计算机界有一系列关于最有拍卖机制设计的工作,主要突出机制的简单性与鲁棒性。本报告会综述这方面的工作并展望未来的方向。
 
Bio:陆品燕,上海财经大学信息学院教授,副院长,理论计算机科学研究中心主任。2009年1月于清华大学计算机系获博士学位后加入微软亚洲研究院,历任理论组副研究员,研究员,主管研究员。2015年12月全职加盟上海财经大学,领衔组建理论计算机科学研究中心,经过两年时间的建设,他的研究中心在CSRankings上算法与复杂性、计算经济学两个方向已经排到亚洲第一名、世界第十五名。他的主要研究方向是理论计算机,并注重与其它学科的交叉,包括自然科学中的统计物理以及社会科学中的经济学与社会选择理论等。有60余篇科研论文在STOC、FOCS、 SODA、EC等顶级计算机理论及博弈论的国际会议和杂志发表,荣获ICALP 2007、FAW 2010、ISAAC 2010 等重要国际会议最佳论文奖。2010年曾受丘成桐先生邀请在第五届国际华人数学家大会 (ICCM) 上作45分钟的大会报告。担任FAW-AAIM 2012、WINE 2017、FAW 2018等国际会议程序委员会联合主席,以及多次担任STOC,FOCS,ICALP等顶级国际会议的程序委员会委员。曾荣获上海市拔尖青年(2017)、中国计算机学会青年科学家(2014)、微软金星员工奖(2010)、 微软学者(2008)、清华大学特等奖学金(2007)等荣誉。



张伟楠,上海交通大学助理教授

Title:大规模智能体强化学习:基础设施搭建和前沿算法落地

Abstract:近年来,机器学习的落地场景有两个发展方向,一是从预测到决策的范式拓展,另一个则是从单智能体到多智能体的场景推广。由此,面向多智能体系统的深度强化学习开始越来越受到学术界和工业界的关注。本次报告,我将从多智能体深度强化学习的几个落地任务切入,由此引入它的基本数学定义和几个经典解决方法。之后我将深入海量智能体场景下的不同场景,探讨在海量智能体的情况下,传统多智能体强化学习方法的不足,并深入介绍基于平均场理论的强化学习和基于因子分解模型的强化学习算法。最后,我将介绍MAgent和CityFlow,两个专为海量智能体场景提供模拟实验的平台,并展示上述算法在该平台上的初步实验效果和业界落地情况。
 
Bio:张伟楠博士现任上海交通大学约翰·霍普克罗夫特计算机科学中心助理教授,科研领域包括深度学习、强化学习、数据挖掘、知识图谱及其在推荐系统、搜索引擎、文本分析等场景中的应用。相关的研究成果在国际一流会议和期刊上发表70余篇学术论文。2016年获得由微软研究院评选的“全球SIGKDD Top 20科研新星”称号;2017年获得ACM国际信息检索会议SIGIR的最佳论文提名奖;2017年获得上海ACM新星奖;2018年获得阿里巴巴达摩院青橙奖。他曾在KDD-Cup用户个性化推荐大赛获得全球季军,在全球大数据实时竞价展示广告出价算法大赛获得最终冠军。
 

点击“报名链接”,报名参会!
 

© John Hopcroft Center for Computer Science, Shanghai Jiao Tong University
分享到

地址:上海市东川路800号上海交通大学软件大楼专家楼
邮箱:jhc@sjtu.edu.cn 电话:021-54740299
邮编:200240