项目的研究工作围绕资助计划中涉及的研究内容和关键科学技术问题展开,瞄准智能驾驶车辆、地面无人系统与智能机器人系统优化控制等国家重大需求问题,以“基于数据驱动的智能机器人系统优化与学习控制理论与方法”、“智能地面无人系统的自主学习方法与技术”为研究目标,提炼了强化学习与机器人自主控制研究的关键科学与技术问题,开展了理论方法与工程应用相结合、具有多学科领域交叉融合特点的创新研究工作。
在基础理论和方法方面,重点研究突破了复杂环境中三维视觉感知与小样本学习、高维状态下的深度可迁移强化学习理论和方法、采用数据驱动和滚动优化策略的强化学习与近似动态规划方法、机器人系统在复杂场景中的自学习优化决策与运动规划方法、以及机器人在线自学习控制与多平台协同控制理论和方法。
在实验和仿真验证方面,项目组完成了如下三个方面的实验验证工作:
上述成果验证了项目提出的机器人系统小样本学习、自学习优化决策规划和控制方法、以及多机器人分布式安全强化学习和鲁棒控制方法的有效性。项目技术成果已推广应用于科技创新企业,为提升智能车辆与机器人的自主感知与控制性能提供了关键技术支撑,产生显著的社会经济效益。