基于奖励塑造强化学习的智能导弹突防策略规划方法

罗俊仁, 刘果, 苏炯铭, 张万鹏, 陈璟

doi:10.11959/j.issn.2096-6652.202411

智能科学与技术学报 (Jun 2024)

基于奖励塑造强化学习的智能导弹突防策略规划方法

罗俊仁, 刘果, 苏炯铭, 张万鹏, 陈璟

Affiliations

罗俊仁, 刘果, 苏炯铭, 张万鹏, 陈璟

DOI: https://doi.org/10.11959/j.issn.2096-6652.202411
Journal volume & issue: Vol. 6, no. 2
pp. 189 – 200

Abstract

Read online

面向未来海上分布式作战需求，以对抗环境下分布式作战场景中智能导弹齐射突防水面舰艇为背景，首先，分析了导弹突防策略规划问题；其次，设计了基于奖励塑造强化学习的智能导弹突防策略规划方法；然后，在墨子联合作战推演系统上构建导弹突防舰艇的作战想定，实验结果表明本文方法的智能导弹突防打击成功率为79%，验证了基于奖励塑造强化学习方法的有效性；最后，经过复盘发现，奖励塑造实验涌现出智能导弹的4类对舰打击突防策略：集中迂回攻击、分散突防多向攻击、分组延时攻击、巡弋探测指引攻击。

Published in 智能科学与技术学报

ISSN: 2096-6652 (Print)
Publisher: POSTS&TELECOM PRESS Co., LTD
Country of publisher: China
LCC subjects: Science: Mathematics: Instruments and machines: Electronic computers. Computer science
Website: http://www.cjist.com.cn

About the journal

Abstract

Keywords