Revista de Estudos da Linguagem (Dec 2015)
O léxico do corpo e anotação de sentidos em grandes corpora: o projeto Esqueleto
Abstract
Apresentamos aqui os resultados iniciais de um amplo estudo sobre o léxico do corpo humano e os seus sentidos, realizado por meio da anotação e revisão de corpora de grandes dimensões. Ao longo do artigo explicitamos as decisões linguísticas subjacentes à anotação, relatamos o resultado de um estudo sobre as classes de anotação e exploramos o vasto material criado: um corpus de entrevistas (1,4 milhão de palavras) e um corpus literário (1,2 milhão de palavras) anotados e integralmente revistos, e demais corpora do projeto, parcialmente revistos. Todo o material está publicamente disponível para a comunidade.
Keywords