国家杰出青年科学基金项目:机器人自主控制与学习

项目的研究工作围绕资助计划中涉及的研究内容和关键科学技术问题展开,瞄准智能驾驶车辆、地面无人系统与智能机器人系统优化控制等国家重大需求问题,以“基于数据驱动的智能机器人系统优化与学习控制理论与方法”、“智能地面无人系统的自主学习方法与技术”为研究目标,提炼了强化学习与机器人自主控制研究的关键科学与技术问题,开展了理论方法与工程应用相结合、具有多学科领域交叉融合特点的创新研究工作。
在基础理论和方法方面,重点研究突破了复杂环境中三维视觉感知与小样本学习、高维状态下的深度可迁移强化学习理论和方法、采用数据驱动和滚动优化策略的强化学习与近似动态规划方法、机器人系统在复杂场景中的自学习优化决策与运动规划方法、以及机器人在线自学习控制与多平台协同控制理论和方法。
  1. 在机器人自主感知的高效机器学习算法方面,提出基于监督学习监督学习的三维对称性检测方法、大规模对称性检测数据集构建、三维对称性引导的机器人抓取检测方法;

  1. 在机器人规划决策的高效强化学习理论与方法方面,提出基于强化学习和模仿学习的堆叠场景机器人抓取规划方法、深度强化学习的高阶抽象建模理论、基于拓扑空间特征和强化学习的行为决策方法、基于稀疏核强化学习的智能车辆近似最优运动规划算法、多任务间元知识抽取的迁移强化学习算法、基于分组注意力机制的多智能体协同探索方法、基于认知特征表示的高效多智能体强化学习机理;

  1. 在机器人优化控制的学习建模与在线自主学习方面,提出深度Koopman数据驱动建模理论与方法、基于Koopman算子的数据驱动鲁棒模型预测控制理论、滚动时域鲁棒学习预测控制理论、不确定时延系统的滚动时域强化学习方法、面向机器人的基于正则化和特征选择Actor-Critic学习控制算法、智能车辆路径跟踪控制的多核在线强化学习算法、基于安全强化学习的规划控制一体化算法:

  1. 在多机器人协同控制的自主学习理论方面,提出基于分布式模型预测控制的无人平台集群安全学习优化控制方法、基于动态协同图的高速公路分布式自动驾驶车辆协同学习方法等
在实验和仿真验证方面,项目组完成了如下三个方面的实验验证工作:
  1. 搭建了UR5机械臂仿真/实物平台,在复杂场景中验证了项目提出的基于三维对称性的抓取检测方法和从示教样本中学习安全抓取策略等创新性机制;

  1. 研制了基于红旗EV电动汽车的智能驾驶验证平台和适应复杂越野地形的小型履带式无人平台,建立了车辆运行环境和感知数据采集交互仿真平台、车辆动力学建模仿真平台、基于Carsim、Prescan的可视化算法验证和测试平台。在典型场景对项目提出的基于拓扑空间特征和强化学习的行为决策方法、基于近似策略迭代的白学习优化决策方法、基于稀疏核强化学习的智能车辆近似最优运动规划方法和基于安全强化学习的规划控制一体化方法进行了实车测试。

  1. 建立了分布式多无人平台仿真与实验验证环境,可实现多无人平台决策规划和控制等分布式算法的快速验证。在多平台协同控制理论和应用方面,开展了分布式模型预测控制的无人平台集群安全学习优化控制方法、基于动态协同图的高速公路分布式自动驾驶汽车协同学习方法和基于正则化和特征选择的Actor-Critic学习控制方法的仿真和实验研究,验证了项目建立的理论方法的有效性。
上述成果验证了项目提出的机器人系统小样本学习、自学习优化决策规划和控制方法、以及多机器人分布式安全强化学习和鲁棒控制方法的有效性。项目技术成果已推广应用于科技创新企业,为提升智能车辆与机器人的自主感知与控制性能提供了关键技术支撑,产生显著的社会经济效益。
项目简介
创新成果
科学价值
人才培养
团队成员