智能科学与技术学报 (Jun 2024)

基于奖励塑造强化学习的智能导弹突防策略规划方法

  • 罗俊仁, 刘果, 苏炯铭, 张万鹏, 陈璟

DOI
https://doi.org/10.11959/j.issn.2096-6652.202411
Journal volume & issue
Vol. 6, no. 2
pp. 189 – 200

Abstract

Read online

面向未来海上分布式作战需求,以对抗环境下分布式作战场景中智能导弹齐射突防水面舰艇为背景,首先,分析了导弹突防策略规划问题;其次,设计了基于奖励塑造强化学习的智能导弹突防策略规划方法;然后,在墨子联合作战推演系统上构建导弹突防舰艇的作战想定,实验结果表明本文方法的智能导弹突防打击成功率为79%,验证了基于奖励塑造强化学习方法的有效性;最后,经过复盘发现,奖励塑造实验涌现出智能导弹的4类对舰打击突防策略:集中迂回攻击、分散突防多向攻击、分组延时攻击、巡弋探测指引攻击。

Keywords