Revista Brasileira de Computação Aplicada (Oct 2017)
Análise do desempenho do aprendizado por reforço na solução do problema da mochila multidimensional
Abstract
Neste trabalho, o objetivo é analisar o desempenho do Aprendizado por Reforço na solução do Problema da Mochila Multidimensional. Para isso, é proposto um modelo de Aprendizado por Reforço estruturado em estados, ações e recompensas. Além disso, os experimentos computacionais apresentados permitem a analisar a sensibilidade dos parâmetros do algoritmo Q-learning na resolução desse tipo de problema de otimização combinatória.
Keywords