GECONTEC: Revista Internacional de Gestión del Conocimiento y la Tecnología (Dec 2022)

Detección de Idioma en Twitter

  • Yudivián Almeida-Cruz,
  • Suilan Estévez-Velarde,
  • Alejandro Piad-Morffis

DOI
https://doi.org/10.5281/zenodo.7080732
Journal volume & issue
Vol. 2, no. 3

Abstract

Read online

El trabajo presenta una alternativa para identificar idiomas en Twitter sin que sea necesario utilizar conjuntos de entrenamiento o información agregada. En dicha alternativa se utilizan técnicas basadas en los algoritmos de reconocimiento de trigramas y small words. Se valora la utilización de estos algoritmos por sí solos y en un modelo de composición. Asimismo, se analiza la incidencia del pre-procesamiento de los tweets en la precisión de la identificación de los idiomas. Finalmente, después de un proceso de experimentación, se determina la mejor alternativa de las estudiadas.

Keywords