Nankai University International E-Forum on Artificial Intelligence and Robotics
(第82期)
2026年南开大学人工智能与机器人国际学术讲坛
College of Artificial Intelligence, Nankai University
报告时间:2026年5月26日(周二)15:00-16:30
报告地点:南开大学津南校区 人工智能学院北楼102会议室
报告嘉宾:Guoxiang Gu(顾国祥)教授
专家单位:美国路易斯安那州立大学
报告题目:Data-Driven Off-Policy Reinforcement Learning for Discrete-Time LQR Control over Packet Drop Channels
报告摘要:
We study data-driven off-policy reinforcement learning control for discrete-time LQR control over packet drop channels. While reinforcement learning control has been extensively studied due to its data-driven nature, the reinforcement learning control over packet drop channels remained an unsolved problem. Our results include: a) Equivalence of LQR-PI learning and Q-PI learning, b) An iterative quadratic convergent algorithm in solving the MS stabilizing solution to modified algebraic Riccati equation under a known condition, and c) An efficient off-policy Q-PI learning algorithm, developed to solve the discrete-time LQR control problem over packet drop channels.
报告人简介:
顾国祥教授于1988年在美国明尼苏达大学获得电气工程博士学位。1988年至1990年,他在俄亥俄州代顿市的莱特州立大学电气工程系担任访问助理教授。他曾在香港科技大学担任访问职务。1990年起,他就职于路易斯安那州巴吞鲁日市的路易斯安那州立大学,现任该校电气与计算机工程教授。他已出版两部专著,发表九十余篇期刊论文,以及大量书籍章节和会议论文。他的研究方向包括网络化控制系统、建模与辨识,以及工业应用。顾教授曾担任《IEEE自动控制汇刊》编委、《SIAM控制与优化期刊》编委以及《Automatica》编委。他目前是美国路易斯安那州立大学电气工程系的F. Hugh Coughlin/CLECO杰出教授,并当选为IEEE会士。