Tecnología en Marcha (Nov 2020)
Estudio de la complejidad del Español para la simplificación textual
Abstract
La mayoría de los trabajos en el área de la simplificación textual se realizan sobre el idioma inglés por contar con más recursos lingüísticos y sobre el género periodístico. Sin embargo, por nuestro contexto, en este trabajo nos concentramos en estudiar y automatizar las métricas existentes para medir complejidad léxica para el español, como paso previo a la identificación de frases complejas y su subsiguiente simplificación. Otro aspecto novedoso de este trabajo es la utilización de corpus relacionados a los derechos humanos, concretamente de la Organización para las Naciones Unidas y del Alto Comisionado de las Naciones Unidas para los Refugiados. Los aportes más significativos son: la creación de una herramienta de código abierto, que genera un informe sobre la complejidad de un texto dado con el fin de dar soporte a quien esté interesado en simplificar ese texto, y la propuesta de una nueva métrica para medir la complejidad de manera multifacética. Los resultados obtenidos en los distintos experimentos realizados son prometedores y en muchos casos confirman las hipótesis planteadas.
Keywords