Revista Brasileira de Computação Aplicada (Sep 2016)

Análise da influência da taxa de aprendizado e do fator de desconto sobre o desempenho dos algoritmos Q-learning e SARSA: aplicação do aprendizado por reforço na navegação autônoma

  • André Luiz Carvalho Ottoni,
  • Erivelton Geraldo Nepomuceno,
  • Marcos Santos de Oliveira,
  • Lara Toledo Cordeiro,
  • Rubisson Duarte Lamperti

DOI
https://doi.org/10.5335/rbca.v8i2.5249
Journal volume & issue
Vol. 8, no. 2
pp. 44 – 59

Abstract

Read online

Nos algoritmos de aprendizado por reforço, a taxa de aprendizado (alpha) e o fator de desconto (gamma) podem ser definidos entre qualquer valor no intervalo entre 0 e 1. Assim, adotando os conceitos de regressão logística, é proposta uma metodologia estatística para a análise da influência da variação de \alpha e \gamma nos algoritmos Q-learning e SARSA. Como estudo de caso, o aprendizado por reforço foi aplicado em experimentos de navegação autônoma. A análise de resultados mostrou que simples variações em \alpha e \gamma podem interferir diretamente no desempenho do aprendizado por reforço.

Keywords