Revista de Humanidades Digitales (May 2024)

Diseño y explotación de un corpus histórico de textos oralizantes para el estudio del español clásico y moderno

  • Gael Vaamonde

DOI
https://doi.org/10.5944/rhd.vol.9.2024.39834
Journal volume & issue
Vol. 9
pp. 41 – 70

Abstract

Read online

En este artículo presentamos Oralia Diacrónica del Español (ODE), un corpus histórico de carácter especializado diseñado para investigar el léxico de la vida cotidiana y reconstruir la oralidad y la variación dialectal del español peninsular desde el siglo XVI hasta finales del siglo XIX. El corpus está compuesto por documentación inédita relativa a tres tipos textuales de inmediatez comunicativa: inventarios de bienes, declaraciones de testigos en juicios criminales y certificaciones periciales de cirujanos sobre personas heridas o fallecidas. ODE incluye las imágenes facsimilares de los manuscritos junto con la transcripción de los textos en lenguaje TEI-XML y cuenta, además, con lematización, etiquetación morfosintáctica y un sofisticado sistema de búsqueda en línea. En este trabajo explicamos el proceso de construcción de ODE y aportamos varios ejemplos que muestran las posibilidades de explotación de este recurso digital.

Keywords