Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades
Fernanda Vasques Ferreira,
Rafiza Varão,
Marco Aurélio Boselli,
Leandro Brito Santos,
Marcelo A. Moret
Affiliations
Fernanda Vasques Ferreira
Centro Universitário Senai Cimatec, Faculdade de Tecnologia. Salvador, BA, Brasil.
Universidade Federal do Oeste da Bahia, Centro Multidisciplinar de Santa Maria da Vitória. Santa Maria da Vitória,
BA
Rafiza Varão
Universidade de Brasília, Faculdade de Comunicação. Brasília, DF
Marco Aurélio Boselli
Universidade Federal de Uberlândia, Instituto de Física. Uberlândia, MG
Leandro Brito Santos
Universidade Federal do Oeste da Bahia, Centro Multidisciplinar de Bom Jesus da Lapa. Bom Jesus da Lapa, BA
Marcelo A. Moret
Centro Universitário Senai Cimatec, Faculdade de Tecnologia. Salvador, BA, Brasil.
Universidade do Estado da Bahia. Salvador, BA
Este trabalho tem como objetivo relatar estratégias para coleta de um conjunto de dados em português para treinamento de modelos de Inteligência Artificial com vistas a identificar de forma automática fake news sobre covid-19 disseminadas durante a pandemia, a partir de código Python. Analisamos um método de detecção de fake news baseado em uma Rede Neural Recorrente e de aprendizagem supervisionada. Selecionamos um corpus com 7,2 mil textos coletados em websites e agências de notícias por Monteiro et al. (2018) com cada um previamente catalogado como verdadeiro ou falso como conjunto de dados de treino e validação. O modelo foi usado para detecção de fake news sobre covid-19 em um conjunto de notícias coletadas e classificadas pelos autores deste trabalho. O índice de acerto foi de 70%, ou seja, essa foi a taxa de sucesso da detecção dos itens catalogados.