杨青林
杨青林 |
|
报告题目: 单体智能到集群涌现的协同控制与决策研究
个人简介: 北京航空航天大学与军事科学院培养博士生,研究方向为智能飞行控制、强化学习、多智能体博弈技术。以第一作者发表论文4篇,其中SCI论文2篇。
摘要: 空天领域的发展趋势正从以单个高性能平台为核心的竞争,转变为以大规模、智能化的无人系统集群为基础的网络化博弈。在此背景下,构建底层飞行器控制到顶层集群智能协同决策体系,成为掌握未来空天主动权的核心技术。在底层飞行器控制层面,传统有模型的控制算法往往需要得到精确的系统模型,且复杂飞行器系统的计算量往往难以满足实时要求。为此,本报告提出了基于神经神经网络局部近似的模型预测控制方法。该方法采用神经网络拟合无人机的非线性动力学模型,并在MPC预测时进行局部近似,克服了传统控制方法需要精确系统机理模型的限制,且有效降低了控制指令优化的计算复杂度。在确保个体智能高效的基础上,进一步探索了群体智能协同决策机制。传统多智能体强化学习方法常因奖励稀疏、信用分配等难题导致策略收敛到次优解,难以形成高级协同。为此本报告构建了基于认知能力的Transformer-MAPPO架构,利用自注意力机制处理多架己方无人机的集体观测,从而实现对联合团队状态和智能体间依赖关系的丰富理解。为了解决智能体盲目低效探索,我们设计了基于认知能力的自适应熵以驱动对不确定但信息丰富的区域进行智能探索。结果表明,在胜率、生存率、复杂协同策略涌现方面,所提方法表现出卓越的性能,显著优于现有最先进的基线。 |