Revista de Llengua i Dret - Journal of Language and Law (Jun 2023)

Inteligencia artificial, tecnologías y recursos del lenguaje: políticas y derecho para la explotación de corpus y bases de datos

  • Lorenzo Cotino Hueso

DOI
https://doi.org/10.58992/rld.i79.2023.3860
Journal volume & issue
Vol. 0, no. 79
pp. 61 – 77

Abstract

Read online

El procesamiento automático del lenguaje natural y, en particular, la traducción automática tienen enorme potencial para el español y otras lenguas españolas. Los poderes públicos desde hace una década han fijado los objetivos de las políticas en inteligencia artificial (IA) y lenguas, dotados ahora con más de 1.100 millones de euros en los Proyectos Estratégicos para la Recuperación y Transformación Económica (PERTE) “Nueva Economía de la Lengua”. Es clave la generación (pública) de infraestructuras, recursos, bases y, sobre todo, corpus lingüísticos que alimentan a la IA y otras tecnologías lingüísticas desarrolladas especialmente por el sector privado. El Derecho de la UE tiende hacia la flexibilidad y apertura de estos recursos lingüísticos. No obstante, desde el régimen de propiedad intelectual y el de reutilización de datos, no hay obligación de abrir y poner a disposición estos recursos, sino que los promotores tienen el derecho sui géneris a que no se pueda hacer minería de datos u otros procesados sin su autorización. Se critica la insuficiente regulación. Sobre esta base, es clave la elección de licencias permisivas, como las del ecosistema Meta-Share, de potencial proyección a los corpus españoles. Finalmente, se exponen los elementos clave en la planificación y adopción de modelos de explotación y sostenibilidad de los recursos lingüísticos en España.

Keywords