Treballs de Sociolingüística Catalana (Feb 2016)
Primers passos cap a la documentació de discurs signat: el projecte pilot de constitució del corpus de la llengua de signes catalana
Abstract
Aquest article presenta la creació del projecte pilot del primer corpus de referència de la llengua de signes catalana (LSC). El corpus d’una llengua consisteix en una col·lecció representativa d’exemples en format llegible per una màquina i té com a objectiu oferir una visió del conjunt d’un domini lingüístic, ja que constitueix una representació àmplia de la llengua i de les seves varietats geogràfiques, de registre, generacionals i discursives. Pel fet de tractar-se d’un corpus de llengua de signes, les col·leccions de vídeos anotats contenen material sincronitzat amb les dades visuals enregistrades. Aquestes dades contribueixen a millorar les descripcions gramaticals i sociolingüístiques de la LSC, tot proporcionant una base sòlida per a l’anàlisi posterior, així com a fer possible una anàlisi basada en dades tant espontànies com induïdes. Aquí presentem la feina feta durant el procés d’elaboració d’aquest projecte, tant pel que fa a la metodologia d’obtenció de dades, a les filmacions i als materials que s’han utilitzat, com a l’anotació que s’ha dut a terme de les dades signades. Aquesta feina constitueix el pas previ necessari per al projecte de constitució del corpus de referència de la LSC. Paraules clau: anotació, documentació, corpus, llengua de signes catalana (LSC), modalitat gestovisual, obtenció de dades.