Estudos do Século XX (Dec 2022)

Pesquisa Literária com R

  • Diego Giménez,
  • Andressa Rodrigues Gomide

DOI
https://doi.org/10.14195/1647-8622_22_7
Journal volume & issue
no. 22

Abstract

Read online

O presente artigo pretende oferecer uma metodologia de pesquisa com o pacote Quanteda, que utiliza a linguagem R, aplicada à análise da obra de Fernando Pessoa. Quanteda (Quantitative Analysis of Textual Data) é um pacote de R para a manipulação e estudo de dados textuais. O programa objetiva aplicar processamento de linguagem natural a textos. Por sua vez, R é uma linguagem de programação para computação estatística suportada pelo R Core Team e R Foundation for Statistical Computing. A ferramenta, assim, permite o estudo textual quantitativo de corpus e oferece ferramentas de visualização que representam as análises. Desde topic modeling até redes semânticas ou análises de co-ocorrências, as ferramentas possibilitam estudos e representações detalhados de estruturas textuais.

Keywords