Cadernos de Linguística (Apr 2021)
Desafios da gestão de dados linguísticos e a Ciência Aberta
Abstract
O simpósio Descrição linguística: gestão de dados linguísticos teve como proposta retomar questões específicas ao gerenciamento de dados linguísticos, quer de fala quer de textos escritos, da atualidade ou históricos, em função das demandas latentes, especialmente face a exigências como as da Ciência Aberta: i) Como atender aos princípios de ciência aberta quanto ao armazenamento, reuso e autoria de conjuntos de dados linguísticos? ii) Como lidar com a tensão entre a transparência e o sigilo de dados de fala? iii) Quais os formatos e as ferramentas mais adequados para a vitalidade dos conjuntos de dados linguísticos? iv) Quais ferramentas permitem o melhor armazenamento e sistemas de interface para consulta e pesquisa? Neste artigo, respondemos a estas a questões com o objetivo de motivar a discussão e o compartilhamento de boas práticas com a comunidade científica e sinalizamos as ações propositivas de natureza coletiva: i) a criação de políticas específicas da área para a replicabilidade dos estudos; ii) a adoção dessas políticas por programas de pós-graduação e periódicos; e iii) a criação e manutenção de repositórios de dados.
Keywords