Jornal de Assistência Farmacêutica e Farmacoeconomia (Nov 2023)

Dados administrativos brasileiros para pesquisa do mundo real: Método de Linkage Determinística e Harmonização OMOP CDM

  • Thales Brendon Castano Silva,
  • Jessica Mayumi Maruyama,
  • Julio Cesar Barbour Oliveira

DOI
https://doi.org/10.22563/2525-7323.2023.v1.s2.p.100
Journal volume & issue
Vol. 8, no. s. 2

Abstract

Read online

Introdução: Evidência do mundo real (RWE) fornece informações valiosas sobre a segurança, a eficácia e o valor das intervenções de saúde em populações de pacientes do mundo real e permite o exame das jornadas dos pacientes. As informações coletadas pelo DATASUS não são integradas pelos diferentes sistemas e os dados coletados por diferentes serviços de saúde carecem de identificadores-chave únicos no nível individual, o que representa um desafio para o relacionamento de registros de tais conjuntos de dados. Objetivos: Descrever os métodos e as resultados parciais do produto mínimo viável da definição de parâmetros necessários para criar um conjunto de dados usando dados de sinistros brasileiros, avaliando a qualidade dos dados em relação a uma instância OMOP CDM usando o DataQualityDashboard. Material e Método: As bases de dados do DATASUS utilizadas foram o Sistema de Informação Hospitalar e o Ambulatorial de janeiro de 2008 até a presente data. Atualmente, estamos desenvolvendo um pipeline de dados, que passará por atualizações mensais. As informações disponíveis em ambos os conjuntos de dados incluem todos os procedimentos ambulatoriais, consultas, códigos CID-10 de diagnóstico primário e secundário, medicamentos dispensados para uso domiciliar e dados pessoais, como data de nascimento, endereço residencial, CEP e sexo. Todos os registros originais do banco de dados DATASUS foram analisados para avaliar a consistência das informações para uma chave única de paciente. Após a etapa de limpeza e pré-processamento, um algoritmo de ligação determinística foi desenvolvido para conectar hospitais com registros ambulatoriais usando as informações-chave de CEP, data de nascimento e sexo. O processo de padronização no processo OMOP seguiu as diretrizes fornecidas pelos manuais da comunidade online e a verificação da qualidade dos dados foi realizada usando o DataQualityDashboard versão 2.1.1.7. Resultados: Foi construído um conjunto de dados padronizado que abrange o histórico completo de saúde desses 5,82 milhões de pacientes. Dessas 2.165 verificações que avaliam a plausibilidade dos dados, apenas 24 falharam em nosso banco de dados, enquanto 2.141 foram aprovadas. No mapeamento de qualidade da base de dados, encontramos 88 falhas e passamos com sucesso 3.578 consultas. Nosso banco de dados apresentou uma taxa de aprovação geral de 98%, indicando um índice satisfatório de qualidade do mapeamento. Discussão e Conclusões: Os resultados do presente estudo demonstraram uma metodologia de tratamento de dados para conjuntos de dados do DATASUS com forte qualidade e o fornecimento de um novo banco de dados que facilita a colaboração dentro da comunidade OHDSI. Através da harmonização dos dados, facilitamos a colaboração e a troca de informações entre pesquisadores, instituições e setores da indústria.

Keywords