Encontros Bibli (Jul 2022)

  • Cristina Restrepo-Arango,
  • Andrés L. Cárdenas-Rozo

DOI
https://doi.org/10.5007/1518-2924.2022.e83470
Journal volume & issue
Vol. 27, no. 1

Abstract

Read online

Este trabalho aplica a análise textual a cinco artigos paleontológicos sobre fósseis colombianos, a fim de identificar a proximidade lexical em um corpus de textos. Este trabalho permitiu determinar: as categorias gramaticais, a proximidade entre categorias de palavras e variáveis ​​com a análise de especificidades (AE), o agrupamento das palavras com a análise da classificação hierárquica descendente (CJD) e a apresentação gráfica das palavras. Verificamos que o corpus documental é composto por 31.319 ocorrências de palavras, 1.450 formas ativas ou palavras específicas e 303 formas complementares ou palavras comuns. A categoria gramatical de substantivo predomina (24%) e palavras não reconhecidas no dicionário (17%). As palavras comuns com maior número de frequências são artigos, conjugações, proposições e pronomes. Constatou-se que existe uma proximidade lexical entre o artigo 1 e as formas ativas de “Colômbia” e o artigo 2 e as formas ativas de “fóssil”. As palavras foram agrupadas em cinco classes e a nuvem de palavras foi criada com 1271 palavras

Keywords