Canadian Journal for the Scholarship of Teaching and Learning (Mar 2022)

A Data-First Approach to Learning Real-World Statistical Modeling

  • Luke Bornn,
  • Jacob Mortensen,
  • Daria Ahrensmeier

DOI
https://doi.org/10.5206/cjsotlrcacea.2022.1.10204
Journal volume & issue
Vol. 13, no. 1
pp. 1 – 18

Abstract

Read online

This paper presents a novel design for an upper-level undergraduate statistics course structured around data rather than methods. The course is designed around curated datasets to reflect real-world data science practice and engages students in experiential and peer learning using the data science competition platform Kaggle. Peer learning is further encouraged by patterning the course after a genetic algorithm: students have access to each other’s solutions, allowing them to learn from what others have done and figure out how to improve upon previous work from week to week. Implementation details for the course are provided, and course efficacy is assessed using a survey of students and a focus group. Student responses suggest that the structure of the course contributed to narrowing the perceived gap between low- and high-performing students, that desired learning outcomes were successfully achieved, and that a data-first approach to learning statistics is effective for learning. Cet article présente une conception nouvelle pour un cours de statistiques de fin de premier cycle structuré autour de données plutôt que de méthodes. Le cours est conçu autour d’ensembles de données conservées qui reflètent les pratiques de la science des données du monde réel et engage les étudiants et les étudiantes dans un apprentissage basé sur l’expérience et sur l’apprentissage par les pairs en utilisant la plate-forme de compétition de science des données Kaggle. L’apprentissage par les pairs est également encouragé grâce à la modélisation du cours sur un algorithme génétique : les étudiants et les étudiantes ont accès aux solutions des uns et des autres, ce qui leur permet d’apprendre à partir de ce que les autres ont fait et de trouver comment s’améliorer par rapport à leur travail passé d’une semaine à l’autre. Les détails de la mise en oeuvre du cours sont fournis et l’efficacité du cours est évaluée grâce à un sondage auprès des étudiants et des étudiantes et à un groupe de discussion. Les réponses des étudiants et des étudiantes suggèrent que la structure du cours a contribué à réduire l’écart perçu qui existait entre les étudiants et les étudiantes les plus forts et les plus faibles, que les résultats d’apprentissage désirés avaient été atteints et que l’approche axée sur les données pour l’apprentissage des statistiques était efficace pour l’apprentissage.

Keywords