Clasificación multiclase y visualización de quejas de organismos oficiales en twitter

Beatriz Hernández-Pajares; Diana Pérez-Marín; Vanessa Frías-Martínez

doi:10.22430/22565337.1454

TecnoLógicas (Jan 2020)

Clasificación multiclase y visualización de quejas de organismos oficiales en twitter

Beatriz Hernández-Pajares,
Diana Pérez-Marín,
Vanessa Frías-Martínez

Affiliations

Beatriz Hernández-Pajares: Centro de Inteligencia Artificial, Wavespace, España
Diana Pérez-Marín: Universidad Rey Juan Carlos, España
Vanessa Frías-Martínez: Universidad de Maryland, Estados Unidos

DOI: https://doi.org/10.22430/22565337.1454
Journal volume & issue: Vol. 23, no. 47
pp. 109 – 120

Abstract

Read online

Las redes sociales acumulan gran cantidad de información. Las actuales técnicas de Procesamiento de Lenguaje Natural permiten su procesamiento automático y las técnicas de Minería de Datos permiten extraer datos útiles a partir de la información recopilada y procesada. Sin embargo, de la revisión del estado del arte, se observa que la mayoría de los métodos de clasificación de los datos identificados y extraídos de redes sociales son biclase. Esto no es suficiente para algunas áreas de clasificación, en las que hay más de dos clases a considerar. En este artículo, se aporta un estudio comparativo de los métodos svm y Random Forests, para la identificación automática de n-clases en microblogging de redes sociales. Los datos recopilados automáticamente para el estudio están conformados por 190 000 tweets de cuatro organismos oficiales: Metro, Protección Civil, Policía, y Gobierno de México. De los resultados obtenidos, se recomienda el uso de Random Forests, ya que se consigue una precisión media del 81.46 % y una cobertura media del 59.88 %, con nueve tipos de quejas identificadas automáticamente.

Published in TecnoLógicas

ISSN: 0123-7799 (Print); 2256-5337 (Online)
Publisher: Instituto Tecnológico Metropolitano
Country of publisher: Colombia
LCC subjects: Technology: Engineering (General). Civil engineering (General)
Website: http://revistas.itm.edu.co/index.php/tecnologicas/index

About the journal

Abstract

Keywords