Revista Educar + (Jul 2021)

Mineração de dados educacionais com aprendizagem de máquina

  • Vanessa Faria de Souza

DOI
https://doi.org/10.15536/reducarmais.5.2021.2417
Journal volume & issue
Vol. 5, no. 4

Abstract

Read online

Com a o aumento da disponibilidade de dados, sobretudo no contexto educacional, surgiram áreas específicas para extração de informações relevantes, como a Mineração de Dados Educacionais (MDE), que integra inúmeras técnicas que dão suporte a captação, processamento e análises desses conjuntos de registros. A principal técnica associada a MDE é a Aprendizagem de Máquina, que vem sendo empregada a décadas no processamento de dados em diversos contextos, mas com o advento do Big Data houve uma intensificação na aplicação dessa técnica no intuito de extrair informações relevantes de uma enorme quantidade de dados. Nesse sentido, esse estudo tem como objetivo realizar a previsão do desempenho de alunos, em um conjunto de dados públicos, e comparar qual dos algoritmos de aprendizagem de máquina utilizados foi o mais eficaz, ademais indicar quais os principais atributos preditores para o desempenho dos alunos. Para isso foi implementado um processo de MDE baseado em 4 etapas: 1) Coleta de dados; 2) Extração de recursos e limpeza de dados (Pré-Processamento e Transformação); e 3) Processamento analítico e algoritmos; 4) análise e/ou interpretação dos resultados. Como resultado foi identificado que para o conjunto de dados utilizado neste estudo o algoritmo Árvores de Decisão foi o mais preciso – com uma acurácia de 87% – bem como foi constatado que atributos relacionados as atividades escolares são mais preditores para o desempenho dos alunos do que dados de características demográficas e socioeconômicas.

Keywords