Encontros Bibli (Mar 2024)
Terminologia de Interface: processamento de linguagem natural de dados clínicos em narrativas do Prontuário Eletrônico do Paciente
Abstract
Objetivo: Apresentar a recuperação e análise de dados clínicos provenientes de anamnese de Prontuário Eletrônico de Pacientes (PEP), denominada nesta pesquisa como Terminologia de Interface Método: O processo de coleta de dados clínicos desta pesquisa foi realizado em prontuários eletrônicos de pacientes de hospital privado. A amostra dos dados foi composta por 18.256 anamneses do domínio da ginecologia do ano de 2018. Os dados clínicos foram recuperados por meio de Processamento de Linguagem Natural utilizando a linguagem Python. Foram analisados os termos mais frequentes relacionados aos dados clínicos do tipo: abreviaturas e siglas, stop words, procedimento e n-gramas. Resultados: Os dados clínicos têm potencial de reutilização para produção científica, traçar perfil epidemiológico e na criação de dicionários e enriquecimento de vocabulários controlados para o PEP e outros sistemas de informação em saúde. Além disso são importantes na delimitação de algoritmos para fins de recuperação da informação. Como resultados um repositório foi criado no OSF contendo planilhas e tabelas com os dados clínicos para seu reuso na delimitação de algoritmo, criações de nuvem de palavras e para identificar os termos mais frequentes em prontuários eletrônicos do paciente no domínio da Ginecologia, já os algoritmos utilizados na recuperação ad informação foram disponibilizados no GitHub. Os dados foram publicados no repositório OSF: https://osf.io/de43a/. Conclusões: Os dados clínicos são informações sobre o paciente, utilizadas para fins de assistência, questões administrativas hospitalares, pesquisa relacionada à saúde e à doença do paciente. A Terminologia de Interface, exemplificada no PEP dos Hospital da pesquisa, apresentou diversidade de dados clínicos nas anamneses.
Keywords