报告题目: 基于强化学习的深海机器人智能搜索与运动控制方法
时间:9月22日下午16点
地点:自动化学院泰山报告厅
报告人简介:
宋士吉为清华大学自动化系教研系列教授、博士生导师。1996年获得哈尔滨工业大学数学博士学位;1996至2000年,在中国海洋大学物理海洋专业、东南大学控制理论与应用专业2次完成博士后研究。长期从事复杂制造系统建模优化与控制技术、机器学习与故障诊断、水下机器人智能控制等方向研究工作。在国内外重要学术期刊会议发表论文200余篇,其中IEEE Transactions 系列期刊长文、国际著名专业期刊SCI检索论文近100篇,担任《IEEE T SMC:Systems》,《中国科学-信息科学》及《自动化学报》等期刊编委,《人工智能与机器人研究》副主编。获得教育部自然科学二等奖励2项,黑龙江生自然科学二等奖1项,江苏省自然科学一等奖1项。主持完成了国家自然科学基金重大科学仪器研制项目、重点项目、面上项目、科技部重点专项、中国大洋协会专项课题等30余项。
报告摘要:
阐述强化学习在深海机器人智能搜索与运动控制领域的算法研究及其应用,从热液羽状流智能搜索与深海机器人运动控制两个方面开展工作。在热液羽状流智能搜索方面,研究基于强化学习和递归网络的羽状流追踪算法。利用传感器采集到的流场与热液信号信息,将机器人搜索热液喷口的过程建模为状态行为域连续的马尔科夫决策过程,通过强化学习算法得到机器人艏向的最优控制策略。在深海机器人运动控制方面,研究基于强化学习的轨迹跟踪与最优深度控制算法。在机器人系统模型未知的情况下,将控制问题建模成连续状态动作空间的马尔可夫决策过程,并构建评价网络与策略网络,通过确定性策略和神经网络学习得到最优控制策略。