Hematology, Transfusion and Cell Therapy (Oct 2023)

MACHINE LEARNING PARA PREDIÇÃO DE ÓBITO EM PACIENTES COM DIAGNÓSTICO DE LEUCEMIA

  • MCN Dias,
  • MCFD Santos,
  • CFD Nascimento,
  • TA Oliveira,
  • MFLD Santos,
  • RDA Soares,
  • JKFS Braz

Journal volume & issue
Vol. 45
pp. S299 – S300

Abstract

Read online

Introdução/Objetivos: Trata-se por leucemia aguda um grupo de neoplasias que acometem as células imaturas de pelo menos uma das linhagens hematopoiéticas da medula óssea, as quais apresentam comportamento agressivo e com alta taxa de mortalidade no Brasil. São doenças extremamente graves de rápida progressão em que o diagnóstico precoce e o tratamento imediato possuem forte influência sobre o carácter de desfecho do paciente. O presente trabalho tem como objetivo testar o desempenho de algoritmos de machine learning na predição de óbito em pacientes com diagnóstico de leucemia. Material e métodos: A amostra composta de 98 pacientes diagnosticados com leucemia aguda foi obtida através de um coorte prospectivo realizado no estado do Rio Grande do Norte em instituições de saúde público e privado, no período entre setembro de 2020 a março de 2023. O desfecho de interesse foi a ocorrência de óbito em 1 mês após o diagnóstico de leucemia. Como preditores, foram incluídos dados demográficos, resultados de exames laboratoriais, exposição a fatores de risco, o tipo de leucemia aguda, além do desempenho físico funcional. Os preditores numéricos foram padronizados em termos de escore Z e os categóricos convertidos por meio de one-hot encoding. Foi utilizada validação cruzada com rebalanceamento e otimização por grid search, sendo obtidas as métricas de melhor desempenho e a média das rodadas. Para avaliar a contribuição dos preditores na predição foram analisados os valores de Shapley. Resultados: O modelo com melhor desempenho foi o Random Forest, que apresentou área abaixo da curva (AUCROC) de 0,78, acurácia de 0,71, precisão média de 0,14 e recall de 0,17. Nesse algoritmo as variáveis preditoras que mais contribuíram para a predição de óbito foram a realização de quimioterapia ou radioterapia, o tipo de leucemia aguda e os valores das enzimas hepáticas TGO e TGP. Discussão: A análise de predição de pacientes com leucemia aguda envolve diversas variáveis clínicas, laboratoriais e moleculares, contudo algumas podem apresentar alta correlação de óbitos dos pacientes. Com algoritmo Random Forest as variáveis laboratoriais de TGO e TGP foram relacionados com uma tendência de óbitos, pois são marcadores inespecíficos de lesões teciduais que podem indicar um comprometimento da performance do paciente. Além disso, pela análise foi detectado que a quimioterapia e radioterapia estão entre as principais variáveis, já que esses procedimentos estão intrinsecamente ligados a um quadro de imunossupressão, aumentando a vulnerabilidade do indivíduo. Outro fator que tem altamente relacionado ao aumento de óbitos é o tipo de leucemia que o paciente foi diagnosticado. Sabe-se que a leucemia mieloide aguda subtipo M3 ou promielocítica aguda é a que apresenta maior agressividade ao diagnóstico. Conclusão: Com isso, temos que o algoritmo Random Forest pode ser um modelo eficaz a ser utilizado para analisar dados laboratoriais e clínicos para ser utilizados como ferramenta de rastreio de indivíduos com maior risco de óbito, e auxiliando a equipe na implementação de estratégias que otimizem o tratamento do paciente.