LínguaTec (Jun 2019)
Corpus TecEM: o processo de construção de um corpus de produções textuais em Língua Portuguesa elaboradas por alunos de Ensino Médio Integrado a cursos técnicos
Abstract
O presente artigo visa a apresentar o processo de construção do Corpus TecEM, uma ferramenta que disponibiliza textos escritos por alunos de cursos técnicos integrados ao Ensino Médio em suas aulas de Língua Portuguesa. Para a obtenção deste objetivo geral, teve-se como objetivos específicos: (i) estabelecer os critérios para a organização dos dados linguísticos; (ii) organizar e rotular os textos do corpus de acordo com os critérios estabelecidos; e (iii) disponibilizar o corpus elaborado. A construção de um corpus com essas características se apresenta fundamental devido às potencialidades acadêmicas e ao desenvolvimento de práticas docentes que sua exploração pode embasar. Como base teórica, parte-se da compreensão da Linguística de Corpus como uma abordagem baseada em corpus, uma perspectiva para o estudo da linguagem. Para tanto, foi necessário: (a) levantamento bibliográfico; (b) contato com professores de Língua Portuguesa de Institutos Federais e convite aos interessados em contribuir na coleta de textos; (c) coleta de textos escritos por alunos de cursos técnicos integrados ao Ensino Médio durante suas aulas de Língua Portuguesa; (d) compilação dos textos a partir dos critérios estabelecidos; (e) armazenamento do corpus TecEM em um banco de dados online, definindo sua estrutura de maneira alinhada aos critérios de compilação; (f) desenvolvimento e disponibilização da ferramenta. Em março de 2019, o Corpus TecEM possuía 327 textos (118,009 palavras) escritos por alunos dos IFs localizados no RS e mais textos já foram coletados a partir de abril do mesmo ano. Com a construção deste corpus, entende-se que foi disponibilizada à comunidade acadêmica uma base de dados rica e criteriosa para futuras pesquisas, contribuindo tanto para o desenvolvimento teórico quanto para a proposição de novas práticas de ensino de Língua Portuguesa, de modo geral, e em contextos de formação tecnológica, em particular.
Keywords