深度强化学习算法与应用研究现状综述

刘朝阳; 穆朝絮; 孙长银

智能科学与技术学报 (Dec 2020)

深度强化学习算法与应用研究现状综述

刘朝阳,
穆朝絮,
孙长银

Affiliations

刘朝阳: 天津大学电气自动化与信息工程学院
穆朝絮: 天津大学电气自动化与信息工程学院
孙长银: 东南大学自动化学院

Journal volume & issue: Vol. 2, no. 4
pp. 314 – 326

Abstract

Read online

深度强化学习主要被用来处理感知-决策问题，已经成为人工智能领域重要的研究分支。概述了基于值函数和策略梯度的两类深度强化学习算法，详细阐述了深度Q网络、深度策略梯度及相关改进算法的原理，并综述了深度强化学习在视频游戏、导航、多智能体协作以及推荐系统等领域的应用研究进展。最后，对深度强化学习的算法和应用进行展望，针对一些未来的研究方向和研究热点给出了建议。

Published in 智能科学与技术学报

ISSN: 2096-6652 (Print)
Publisher: POSTS&TELECOM PRESS Co., LTD
Country of publisher: China
LCC subjects: Science: Mathematics: Instruments and machines: Electronic computers. Computer science
Website: http://www.cjist.com.cn

About the journal

Abstract

Keywords