智能科学与技术学报 (Dec 2023)
面向对抗条件下资源分配的在线多阶段布洛托博弈求解方法
Abstract
未来战场上的作战资源分配是一个存在总资源预算约束的多阶段对抗问题,具有环境高复杂性、动态不确定性、博弈强对抗性。基于布洛托博弈模型,首先把多阶段对抗场景下的资源分配问题建模为双层在线布洛托博弈,然后将原资源分配问题转化为有向无环图上的在线最短路径问题,并借鉴拉格朗日博弈对资源分配问题进行分析求解。此外,提出LagrangeBwK-Exp3-G算法以实现多阶段对抗条件下资源分配问题的高概率遗憾最小化,进一步通过数学推导获得关于时间范围T的高概率遗憾界。最后,设计一个多阶段对抗条件下的卫星通信多信道功率分配实验,从而验证LagrangeBwK-Exp3-G算法具有良好性能。
Keywords