Сучасні інформаційні системи (Aug 2018)
РІШЕННЯ ЗАДАЧІ КЛАСИФІКАЦІЇ В E-LEARNING НА ОСНОВІ МЕТОДУ ПАРАЛЕЛЬНОЇ ПОБУДОВИ ДЕРЕВ РІШЕНЬ
Abstract
Актуальність. Останнім часом в розвинутих країнах питанням машинного навчання приділяється все більше уваги. З одного боку це пов’язано зі стрімким ростом вимог до майбутніх фахівців, а з іншого - з дуже швидким розвитком інформаційних технологій та Інтернет комунікацій. Однією з головних задач e-learning є задача класифікації. Математичний апарат дерев рішень гарно пристосований для рішення задачі класифікації. Однак, з ростом кількості вхідних даних стає актуальним питання зменшення часу побудови дерев рішень. Використання паралельних обчислювальних систем та паралельних технологій програмування дозволяє отримати позитивні результати, але вимагає розробки нових методів побудови дерев рішень. Результати. В статті розкриваються основні етапи методу паралельної побудови дерев для вирішення задачі класифікації в e-learning. На відміну від існуючих, метод дозволяє враховувати особливості архітектури і організації паралельних процесів в обчислювальних системах із загальною і розподіленою пам'яттю. В методі врахована можливість оцінки показників ефективності побудови дерев рішень та паралельних алгоритмів. Отримання показників ефективності на кожній ітерації методу допомагає обрати раціональну кількість паралельних процесорів в обчислювальній системі. Це дозволяє домогтися подальшого скорочення часу побудови дерев рішень. Проведене моделювання з використанням технології паралельного програмування MPI, мови програмування Python для архітектури обчислювальної системи DM-MIMD підтверджує достовірність отриманих результатів. Наводиться приклад організації вхідних даних. Представлено Python програму для побудови дерева рішень. Висновок. Розроблена візуалізація отриманих оцінок показників ефективності дозволяє користувачу обрати необхідну конфігурацію обчислювальної системи.
Keywords