Ciência da Informação (Oct 2019)
Análise de sentimentos em comentários de vídeos do YouTube utilizando aprendizagem de máquinas supervisionada
Abstract
O artigo descreve um conjunto de três experimentos em análise de sentimentos, especificamente, para comentários textuais em português brasileiro e para um vídeo do YouTube. Utiliza-se o pacote de mineração de dados Weka para filtragem e um classificador baseado em aprendizagem de máquinas supervisionada (SMO). Os experimentos diferenciam-se pelo corpus a classificar: o primeiro utiliza três classes de polaridade (positiva, negativa e neutra), o segundo e o terceiro experimentos trabalham com duas classes (negativa e não negativa). No terceiro experimento são selecionadas somente postagens que comentam uma entidade (referente) específica. Os resultados de Acurácia e Medida-F Média são consideravelmente melhores para os experimentos contendo duas classes. O terceiro experimento atinge valores em volta de 81% para as duas medidas citadas, e sugere que quanto mais entidades são comentadas nos discursos do corpus, mais difícil seria a classificação de polaridades.