Trends in Computational and Applied Mathematics (Nov 2024)

Sintonia QR do Regulador Linear Quadrático LQR Discreto e Programação Dinâmica Aproximada baseada em Ação-Estado para Aplicações Online do Projeto de Sistemas de Controle Ótimo

  • M. Cerqueira,
  • L. Lopes,
  • J. V. Fonseca

DOI
https://doi.org/10.5540/tcam.2024.025.e01686
Journal volume & issue
Vol. 25, no. 1

Abstract

Read online

Devido ao crescente desenvolvimento tecnol´ogico e `as consequentes aplicaç˜oes industriais, novos m´etodos para o projeto de controle e Aprendizado por Reforço tem sido desenvolvidas, n˜ao apenas para resolver novos problemas de controle, mas tamb´em para melhorar o desempenho de controladores j´a implementados em sistemas do mundo real. As abordagens de Aprendizagem por Reforc¸o e Regulador Quadr´atico Linear Discreto s˜ao conectadas por m´etodos de Programaç˜ao Dinˆamica Adaptativa. Esses paradigmas s˜ao orientados para o projeto de controladores ´otimos em sistemas multivari´aveis. Para o caso do Regulador Quadr´atico Linear Discreto, AD-HDP, Aprendizado por Reforc¸o, Pol´ıtica de Iterac¸ ˜ao e Valor de Iterac¸ ˜ao, um m´etodo e um algoritmo s˜ao desenvolvidos e implementados para projeto de controle online. Com base na seleção das matrizes de ponderac¸ ˜ao Q e R, tamb´em ´e apresentado um m´etodo para ajustar controladores reguladores lineares quadr´aticos discretos. Este m´etodo fornece diretrizes para a construção de heur´ısticas para a seleç˜ao de matrizes de ponderaç˜ao, aspectos de convergˆencia relacionados `as variaç˜oes das matrizes de ponderaç˜ao s˜ao investigados. Para um sistema dinˆamico multivari´avel de terceira ordem, o algoritmo proposto e a heur´ıstica de ajuste s˜ao avaliados pela capacidade de estabelecer a pol´ıtica de controle ´otima

Keywords