Brazilian Journal of Infectious Diseases (Oct 2023)

CAPACIDADE PREDITIVA DO MODELO RANDOM FOREST PARA ÓBITO EM PACIENTES COM COVID-19: UMA ANÁLISE DE DADOS NO CONTEXTO DA PANDEMIA

  • Victor Hugo Ovani Marchetti,
  • Maria Eugênia Pedruzzi Dalmaschio,
  • Tatiani Bellettini dos Santos,
  • Eduardo Toffoli Pandini

Journal volume & issue
Vol. 27
p. 102900

Abstract

Read online

O uso do machine learning foi impulsionado pela pandemia de COVID-19 para enfrentar desafios na saúde pública, auxiliando na detecção de casos, grupos de risco e desenvolvimento de modelos preditivos, fornecendo informações valiosas para controlar e prevenir a propagação da doença. O objetivo desse estudo é avaliar a capacidade preditiva de um modelo randomForest acerca do óbito em pacientes com diagnóstico confirmado para Covid-19. Este é um estudo transversal que utilizou dados de casos notificados no E-SUS VS do Espírito Santo de janeiro de 2020 a outubro de 2022. Foi criado um modelo Random Forest usando 70% dos dados para treinamento, com downsampling da classe majoritária. As previsões foram feitas no conjunto de teste e avaliadas usando tabela 2 × 2. O estudo fornece informações sobre as características associadas ao óbito e a capacidade do modelo de prever corretamente esses casos. No estudo, 111.024 pacientes foram randomizados para o grupo teste e 259.053 para o grupo treino, sendo reduzido para 7.766 após downsampling. As previsões do modelo resultaram em 90.644 verdadeiros negativos e 1.389 verdadeiros positivos, com 294 falsos positivos e 18.690 falsos negativos. A sensibilidade do modelo foi de 82,5%, indicando sua capacidade de identificar corretamente os casos de óbito. A especificidade foi de 82,9%, evidenciando a habilidade de classificar corretamente os casos de não óbito. A acurácia geral do modelo foi de 83,9%. O valor preditivo positivo foi de 6,9%, o que significa que das previsões de óbito, apenas 6,9% eram corretas. Por outro lado, o valor preditivo negativo foi de 99,7%, indicando a alta precisão das previsões de não óbito. Esses resultados demonstram um desempenho satisfatório do modelo na identificação precisa dos casos de óbito, com alta especificidade e acurácia geral. O modelo identificou corretamente dos casos de óbito, com sensibilidade de 82,5% e especificidade de 82,9%. A acurácia geral do modelo foi de 83,9%, indicando um desempenho consistente na classificação geral dos pacientes. No entanto, o valor preditivo positivo foi baixo, indicando que uma proporção relativamente pequena das previsões de óbito foi realmente correta, principalmente devido à baixa proporção de óbitos na amostra. O valor preditivo negativo foi alto, o que demonstra a confiabilidade das previsões de não óbito. Embora o modelo seja importante na identificação de casos de óbito, é necessário melhorar sua precisão na previsão dos casos positivos.

Keywords