Hematology, Transfusion and Cell Therapy (Oct 2024)
O USO DE MACHINE LEARNING PARA PREVER SEQUELAS DO SISTEMA VASCULAR PÓS-COVID-19
Abstract
Introdução: A pandemia da COVID-19 trouxe novos desafios para a saúde pública. Nesse contexto, o uso de ferramentas de Machine Learning (ML) foram propostas para auxiliar no diagnóstico, desfecho clínico e agora na predição das sequelas. Estudos evidenciaram métodos multivariados e de ML para prever a mortalidade hospitalar e biomarcadores importantes. Objetivo: Comparar métodos estatísticos convencionais e de ML na detecção de sequelas vasculares da COVID-19 e definir o melhor modelo para os dados obtidos. Metodologia: Foram selecionados 206 pacientes: COVID Leve (55), moderado (60) e grave (91), entre 11/2020‒12/2021, confirmados por RT-PCR, > 18 anos, sem sintomas agudos há pelo menos 30 dias após infecção e não vacinados (2 doses). Todos assinaram o termo de consentimento livre e esclarecido, responderam um questionário online e coletaram amostras biológicas. Entre março e julho de 2023, os participantes foram contatados para responder um questionário sobre COVID Longa. Foram performados 19 parâmetros (sociodemográficos, comorbidades e biomarcadores). Ferramentas utilizadas: Support Vector Machine (SVM), Regressão Logística ‒ Elastic-Net (EN), Random Forest (RF), Extreme Gradient Boost (XGB) e Light Gradient Boosting Machine (LGBM) com técnica de reamostragem (SMOTENC), analisadas em termos de AUC, Acurácia, F1-score, Recall (R) e Precisão (PR). A predição de risco foi realizada usando Regressão Logística Stepwise (RLS). Sequelas analisadas: Flebite, Inchaço e Cãibras. Resultados: 1-ML a) Flebite: EN (F1 = 0,593; PR = 1; R = 0,421); XGB (F1 = 0,889; PR = 0,941; R = 0,842); LGBM (F1 = 0,818; PR = 0,964; R = 0,711); RF (F1 = 0,762; PR = 0,96; R = 0,632) e SVM (F1 = 0,593; PR = 1; R = 0,421). Importância das variáveis (IV) XGB: Gênero, Espectro Clínico (EC). b) Inchaço: EN (F1 = 0,630; PR = 0,85; R = 0,5); XGB (F1 = 0,774; PR = 0,857; R = 0,706); LGBM (F1 = 0,781; PR = 0,833; R = 0,735); RF (F1 = 0,721; PR = 0,815; R = 0,647) e SVM (F1 = 0,724; PR = 0,875; R = 0,618). IV LGBM: Prática regular de atividade física e Gênero. c) Cãibras: EM (F1 = 0,780; PR = 0.920; R = 0,676); XGB (F1 = 0,767; PR = 0,885; R = 0,676); LGBM (F1 = 0,754; PR = 0,852; R = 0,676); RF (F1 = 0,714; PR = 0,909; R = 0,588) e SVM (F1 = 0,762; PR = 0.828; R = 0,706). IV EN: Fator VIII, EC e IL-6. 2-RLS (p < 0,05) a) Flebite: EC Grave (OR = 4,261; 95% IC 1,2455‒17,842), gênero feminino (OR = 7,483; 95% IC 2,323‒30,270). b) Inchaço: EC Grave (OR = 3,772, 95% IC 1,340‒12,542), prática de atividade física (OR = 0,310, 95% IC 0,131‒0,681). c) Cãibras: Fator VIII elevado (OR = 5.4468, 95% IC 2,476‒12,905), IL-6 rs0811795 (OR = 3,089; 95% IC 1,417‒7,114). Discussão: O uso de ML revelou-se promissor para a predição de sequelas vasculares. Cada ferramenta apresentou vantagens específicas, destacando-se o modelo XGB para flebite, o LGBM para inchaço e o EN para cãibras. Esses modelos mostraram-se eficazes em métricas como F1-score, P e RC, refletindo uma capacidade robusta de identificar corretamente os pacientes com sequelas. Ademais, a análise estatística via RLS corroborou a importância de fatores como espectro clínico, gênero e biomarcadores específicos na predição das sequelas. Conclusão: O uso de ML mostrou-se eficaz na predição de sequelas vasculares da COVID-19, com diferentes modelos (XGB, LGBM, EN) destacando-se em diversas métricas. A análise estatística confirmou a importância de fatores como EC, gênero e biomarcadores específicos. Integrar ML pode melhorar a previsão e gestão clínica das sequelas, beneficiando a saúde pública.