Tecnologías para la Investigación en Segundas Lenguas (Jun 2024)

El Corpus léxico del español de Colombia CorlexCo y su aplicación a la investigación sobre el español LE y L2

  • Gloria Viviana Nieto Martín

DOI
https://doi.org/10.1344/teisel.v3.46686
Journal volume & issue
Vol. 3

Abstract

Read online

En este artículo se presenta el Corpus léxico del español de Colombia CorlexCo (https://clicc.caroycuervo.gov.co/corpus/CorlexCo) del Instituto Caro y Cuervo, herramienta que recopila combinaciones léxicas con criterio integral, es decir, las propias del país y también las compartidas con otros países hispanoamericanos y con el español general. No se limita a los colombianismos. Se trata de un macroproyecto iniciado en 2019 y desarrollado en fases anuales sucesivas. Por “combinaciones léxicas” nos referimos a todo tipo de unidades pluriverbales (compuestos, colocaciones, construcciones con verbo soporte, locuciones, paremias y fórmulas rutinarias). Los datos proceden de cinco fuentes de consulta: (1) diccionarios generales, escolares, dialectales, fraseológicos y combinatorios, (2) casi doscientos cincuenta repertorios léxicos del español de Colombia, (3) más de ciento cincuenta investigaciones académicas sobre el léxico de Colombia, (4) corpus lingüísticos y (5) el dominio http://www.google.com.co. Con respecto a la aplicación del CorlexCo, por una parte, puede usarse en planeación curricular, diseño de materiales didácticos y procesos de evaluación de español como lengua extranjera y segunda lengua (para indígenas y sordos); por otra, puede constituirse en obra de referencia de aprendientes, profesores, editores, traductores y, especialmente, de lingüistas que investiguen sobre el español LE y L2. En el apartado 1 se resume el estado actual de la lexicografía dialectal en Colombia. En el apartado 2 se describen las características principales del CorlexCo, la selección del tipo de unidades léxicas para cada fase anual, la selección de las entradas y la anotación, y se ilustra su uso con varios tipos de búsqueda. En el apartado 3 se muestra su aplicación a la investigación sobre español LE y L2. Este corpus es un recurso abierto que se actualiza periódicamente y que ofrece a la comunidad académica una descripción ampliada del léxico de Colombia.

Keywords