Informatische Bildung in Schulen (Sep 2024)
ClusterLabor: Ein Werkzeug zur interaktiven Visualisierung und Analyse von Clusteralgorithmen
Abstract
In diesem Beitrag wird die Webanwendung ClusterLabor (verfügbar unter ddi.informatik.uni-wuerzburg.de) vorgestellt. ClusterLabor ermöglicht eine interaktive Visualisierung und Analyse von Clusteralgorithmen in zweidimensionalen Datensätzen. Damit können verschiedene Algorithmen hinsichtlich ihrer Ergebnisse in Abhängigkeit von der gewünschten Anzahl an Clustern verglichen werden. Anwender können aus verschiedenen Beispieldatensätzen wählen, eigene Datensätze hochladen oder Datensätze direkt durch manuelle Eingabe generieren. Zum Clustern stehen verschiedene Methoden zur Verfügung: der k-Means-Algorithmus mit Varianten wie Lloyd oder MacQueen, der k-Medoids-Algorithmus sowie hierarchische Clusteranalyse mit unterschiedlichen Distanzmaßen und Fusionierungsalgorithmen. Ein besonderer Fokus liegt dabei auf dem Unsupervised Learning, einem Bereich der Künstlichen Intelligenz (KI), bei dem Algorithmen Muster und Strukturen in unbeschrifteten Daten selbstständig erkennen. Zur Bestimmung der "optimalen" Clusterzahl k sind zudem Visualisierungen des Elbow Plots (Ellenbogendiagramms), des Average Silhouette Plots (ASW-Kurve) sowie des Dendrogramms integriert.
Keywords