Tecnología en Marcha (Nov 2020)

Estudio de la complejidad del Español para la simplificación textual

  • Randall Araya Camposa,
  • Paula Estrella,
  • José Arguedas Castillo,
  • Walter Alvarez Grijalba

DOI
https://doi.org/10.18845/tm.v33i7.5478

Abstract

Read online

La mayoría de los trabajos en el área de la simplificación textual se realizan sobre el idioma inglés por contar con más recursos lingüísticos y sobre el género periodístico. Sin embargo, por nuestro contexto, en este trabajo nos concentramos en estudiar y automatizar las métricas existentes para medir complejidad léxica para el español, como paso previo a la identificación de frases complejas y su subsiguiente simplificación. Otro aspecto novedoso de este trabajo es la utilización de corpus relacionados a los derechos humanos, concretamente de la Organización para las Naciones Unidas y del Alto Comisionado de las Naciones Unidas para los Refugiados. Los aportes más significativos son: la creación de una herramienta de código abierto, que genera un informe sobre la complejidad de un texto dado con el fin de dar soporte a quien esté interesado en simplificar ese texto, y la propuesta de una nueva métrica para medir la complejidad de manera multifacética. Los resultados obtenidos en los distintos experimentos realizados son prometedores y en muchos casos confirman las hipótesis planteadas.

Keywords