Mìkrosistemi, Elektronìka ta Akustika (Nov 2017)

Оптимізація нейронної мережі алгоритму DeepStack для гри у Leduc Hold’em

  • Yaroslav Yuriiovych Dorogyi,
  • Vasyl Vasylovych Tsurkan,
  • Vladyslav Yuriiovych Lisoviy

DOI
https://doi.org/10.20535/2523-4455.2017.22.5.105016
Journal volume & issue
Vol. 22, no. 5

Abstract

Read online

В статті розглянуте питання реалізації нейронної мережі та підбору її структури, яка використовується в алгоритмі DeepStack. Наведений детальний опис алгоритму та принцип його роботи. Розглянутий алгоритм використовується для прийняття рішення під час гри в покер. Покер представлений як гра з неповною інформацією. Розрахунок стратегії відбувається на основі двох параметрів – контрфактичних значень опонента та діапазону гравця. Запропонована нейронна мережа використовується для розрахунку стратегії, а саме контрфактичних значень опонента. В якості нейронної мережі була вибрана мережа прямого розповсюдження. В якості даних для навчання використовувався набір вирішений покерних ситуацій, який включав в себе різні величини ставок та комбінації рук. Розглянуто декілька структур мереж та вибрана оптимальна. Критерієм вибору слугує оцінка вразливості стратегії. Бібл. 13, рис. 9.

Keywords