AIRS in the AIR
AIRS
AIRS in the AIR | 信息设计的机器学习与大语言模型方法
9月11日(周四)10:00-11:30,第85期AIRS in the AIR邀请香港中文大学(深圳)数据科学学院助理教授王趵翔做报告分享。报告将讨论如何通过强化学习方法和大语言模型(LLM)方法来求解最优信息策略,并将此问题扩展到自然语言领域,从而还原以往研究中被过度简化的现实世界复杂性。报告将展示大语言模型在博弈学习框架下的说服能力,并探讨其对大语言模型推理和多智能体大语言模型的影响。
王趵翔的主要研究方向为强化学习和学习理论,尤其关注博弈论背景下的问题以及面向大语言模型的策略学习。他于2020年获得香港中文大学计算机科学与工程博士学位,导师为Siu On Chan教授和Andrej Bogdanov。此前,他于2014年获得上海交通大学信息安全专业工学学士学位。他的研究成果发表于ICML、NeurIPS、ICLR等机器学习会议,以及ITCS、WINE等理论计算机会议。

请扫描二维码报名参加活动。
-
刘鹏飞AIRS机器人系统中心副主任执行主席 -
王趵翔香港中文大学(深圳)数据科学学院助理教授信息设计的机器学习与大语言模型方法王趵翔是香港中文大学(深圳)数据科学学院的助理教授。他的主要研究方向为强化学习和学习理论,尤其关注博弈论背景下的问题以及面向大语言模型的策略学习。他于2020年获得香港中文大学计算机科学与工程博士学位,导师为Siu On Chan教授和Andrej Bogdanov。此前,他于2014年获得上海交通大学信息安全专业工学学士学位。他的研究成果发表于ICML、NeurIPS、ICLR等机器学习会议,以及ITCS、WINE等理论计算机会议。
在现实世界的任务中,智能体(Agent)各有其目标,并根据其他智能体的行为作出适应性调整。为了在这样的环境中取得成功,智能体需要影响他者,使其行为变得更有助益、更少危害。信息设计(Information design)正是指通过策略性地沟通信息来影响他者的这类尝试。
在本次讨论中,我们将讨论如何通过强化学习方法和大语言模型(LLM)方法来求解最优信息策略。我们进一步将此问题扩展到自然语言领域,从而还原了以往研究中常常被过度简化的现实世界复杂性。我们将展示大语言模型在博弈学习框架下的说服能力,并探讨其对大语言模型推理和多智能体大语言模型的影响。
