智能科学与技术学报 (Dec 2021)
未知异构多智能体系统无模型自适应动态规划同步控制
Abstract
多智能体协同在众多领域逐渐得到应用,但是还有很多仍未解决的问题。为此,研究了基于无模型自适应动态规划(MFADP)的未知异构多智能体系统同步控制问题,其中领航者智能体和追随者智能体动态模型均是未知的。首先为每一个追随者智能体设计观测器来估计领航者智能体的信息,包括领航者智能体状态以及领航者智能体系统动态矩阵。然后利用追随者智能体动态模型信息和观测器动态模型信息构建增广系统,运用贝尔曼最优性原理求得最优控制器以及对应的代数黎卡提方程。在追随者智能体系统动态模型信息未知的情况下,引出了MFADP算法。最后使用双质量-弹簧系统来验证所提算法的有效性。