智能科学与技术学报 (Jun 2024)
基于奖励塑造强化学习的智能导弹突防策略规划方法
Abstract
面向未来海上分布式作战需求,以对抗环境下分布式作战场景中智能导弹齐射突防水面舰艇为背景,首先,分析了导弹突防策略规划问题;其次,设计了基于奖励塑造强化学习的智能导弹突防策略规划方法;然后,在墨子联合作战推演系统上构建导弹突防舰艇的作战想定,实验结果表明本文方法的智能导弹突防打击成功率为79%,验证了基于奖励塑造强化学习方法的有效性;最后,经过复盘发现,奖励塑造实验涌现出智能导弹的4类对舰打击突防策略:集中迂回攻击、分散突防多向攻击、分组延时攻击、巡弋探测指引攻击。
Keywords