CAPACIDADE PREDITIVA DO MODELO RANDOM FOREST PARA ÓBITO EM PACIENTES COM COVID-19: UMA ANÁLISE DE DADOS NO CONTEXTO DA PANDEMIA

Victor Hugo Ovani Marchetti; Maria Eugênia Pedruzzi Dalmaschio; Tatiani Bellettini dos Santos; Eduardo Toffoli Pandini

Brazilian Journal of Infectious Diseases (Oct 2023)

CAPACIDADE PREDITIVA DO MODELO RANDOM FOREST PARA ÓBITO EM PACIENTES COM COVID-19: UMA ANÁLISE DE DADOS NO CONTEXTO DA PANDEMIA

Victor Hugo Ovani Marchetti,
Maria Eugênia Pedruzzi Dalmaschio,
Tatiani Bellettini dos Santos,
Eduardo Toffoli Pandini

Affiliations

Victor Hugo Ovani Marchetti: Corresponding author.; Centro Universitário do Espírito Santo (UNESC), Colatina, ES, Brasil
Maria Eugênia Pedruzzi Dalmaschio: Centro Universitário do Espírito Santo (UNESC), Colatina, ES, Brasil
Tatiani Bellettini dos Santos: Centro Universitário do Espírito Santo (UNESC), Colatina, ES, Brasil
Eduardo Toffoli Pandini: Centro Universitário do Espírito Santo (UNESC), Colatina, ES, Brasil

Journal volume & issue: Vol. 27
p. 102900

Abstract

Read online

O uso do machine learning foi impulsionado pela pandemia de COVID-19 para enfrentar desafios na saúde pública, auxiliando na detecção de casos, grupos de risco e desenvolvimento de modelos preditivos, fornecendo informações valiosas para controlar e prevenir a propagação da doença. O objetivo desse estudo é avaliar a capacidade preditiva de um modelo randomForest acerca do óbito em pacientes com diagnóstico confirmado para Covid-19. Este é um estudo transversal que utilizou dados de casos notificados no E-SUS VS do Espírito Santo de janeiro de 2020 a outubro de 2022. Foi criado um modelo Random Forest usando 70% dos dados para treinamento, com downsampling da classe majoritária. As previsões foram feitas no conjunto de teste e avaliadas usando tabela 2 × 2. O estudo fornece informações sobre as características associadas ao óbito e a capacidade do modelo de prever corretamente esses casos. No estudo, 111.024 pacientes foram randomizados para o grupo teste e 259.053 para o grupo treino, sendo reduzido para 7.766 após downsampling. As previsões do modelo resultaram em 90.644 verdadeiros negativos e 1.389 verdadeiros positivos, com 294 falsos positivos e 18.690 falsos negativos. A sensibilidade do modelo foi de 82,5%, indicando sua capacidade de identificar corretamente os casos de óbito. A especificidade foi de 82,9%, evidenciando a habilidade de classificar corretamente os casos de não óbito. A acurácia geral do modelo foi de 83,9%. O valor preditivo positivo foi de 6,9%, o que significa que das previsões de óbito, apenas 6,9% eram corretas. Por outro lado, o valor preditivo negativo foi de 99,7%, indicando a alta precisão das previsões de não óbito. Esses resultados demonstram um desempenho satisfatório do modelo na identificação precisa dos casos de óbito, com alta especificidade e acurácia geral. O modelo identificou corretamente dos casos de óbito, com sensibilidade de 82,5% e especificidade de 82,9%. A acurácia geral do modelo foi de 83,9%, indicando um desempenho consistente na classificação geral dos pacientes. No entanto, o valor preditivo positivo foi baixo, indicando que uma proporção relativamente pequena das previsões de óbito foi realmente correta, principalmente devido à baixa proporção de óbitos na amostra. O valor preditivo negativo foi alto, o que demonstra a confiabilidade das previsões de não óbito. Embora o modelo seja importante na identificação de casos de óbito, é necessário melhorar sua precisão na previsão dos casos positivos.

COVID-19 Aprendizado de Máquina Supervisionado Saúde Pública

Published in Brazilian Journal of Infectious Diseases

ISSN: 1413-8670 (Print); 1678-4391 (Online)
Publisher: Elsevier
Country of publisher: Spain
LCC subjects: Medicine: Internal medicine: Infectious and parasitic diseases; Science: Microbiology
Website: https://www.journals.elsevier.com/the-brazilian-journal-of-infectious-diseases

About the journal

Abstract

Keywords