智能科学与技术学报 (Dec 2020)

深度强化学习算法与应用研究现状综述

  • 刘朝阳,
  • 穆朝絮,
  • 孙长银

Journal volume & issue
Vol. 2, no. 4
pp. 314 – 326

Abstract

Read online

深度强化学习主要被用来处理感知-决策问题,已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法,详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理,并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后,对深度强化学习的算法和应用进行展望,针对一些未来的研究方向和研究热点给出了建议。

Keywords