Brazilian Journal of Infectious Diseases (Oct 2023)
PERFIL DE PROTEÍNA MALDI-TOF MS DE AMOSTRAS DE URINA COMO FATOR PREDITIVO DE GRAVIDADE DA COVID-19 USANDO MACHINE LEARNING
Abstract
Introdução/Objetivos: O prognóstico da COVID-19 é uma etapa essencial para aumentar a sobrevida do paciente e desempenha um papel importante na alocação de recursos de saúde. A detecção precoce da COVID-19 grave requer técnicas não invasivas, rápidas, de baixo custo e precisas. A proteômica já é descrita na literatura como capaz de detectar padrões para COVID-19 grave, entretanto o uso de amostras pouco invasivas como urina foram pouco exploradas. Neste trabalho utilizamos a proteômica MALDI-TOF MS de amostra de urina combinada com dados clínicos e aprendizado de máquina para predizer gravidade da COVID-19. Métodos: Coorte prospectiva de 372 pacientes hospitalizados com COVID-19 confirmado, realizada no Hospital das Clínicas da FMUSP e no hospital Sírio Libanês, durante o período de julho de 2020 e setembro de 2021. 365 pacientes com até 15 dias de sintomas respiratórios foram incluídos. Amostras de urina foram coletadas, centrifugadas e o sobrenadante estocado a -80°C até o momento de análise. Para obtenção do proteoma por MALDI-TOF MS um total de 500µL de urina foram filtrados (filtro Amicon de 10 kD), dessalinizados (utilizando coluna C18) e submetidos a MALDI-TOF MS, usando uma matriz HCCA. Os arquivos brutos foram pré-processados no R, submetidos às etapas de transformação de dados, normalização, suavização e identificação de picos. A normalidade dos picos identificados foi testada e um teste Wilcoxon rank-sum foi realizado para filtrar os picos proteicos mais relevantes. Os picos resultantes foram usados para treinar um modelo de aprendizado de máquina para classificação de amostras entre condições leves e graves com e sem dados clínicos. Como critério de gravidade, foram considerados necessidade de ventilação mecânica, internação, óbito e marcadores de função renal como ureia e creatinina. Resultados: O modelo de floresta aleatória treinado apenas com o MALDI-TOF MS alcançou um AUC-ROC de 0,760, com precisão, sensibilidade e especificidade de 0,73, 0,77 e 0,69, respectivamente na predição de gravidade da COVID-19. A adição de dados clínicos aos dados proteômicos resultou em um AUC-ROC de 0,827 e sensibilidade e especificidade de 0,81 e 0,87, respectivamente. Conclusões: O perfil proteico por MALDI-TOF MS demonstrou ter potencial para prognóstico de COVID-19; no entanto, a alta variabilidade do proteoma da urina prejudicou o desempenho do modelo. A adição de dados clínicos demonstrou aumentar o desempenho do modelo na classificação da amostra.