Науковий вісник НЛТУ України (May 2023)
Модель та засоби збирання та оброблення даних з використанням машинного навчання
Abstract
Досліджено вплив ітеративного методу зважування даних респондентів на підставі певних факторів на точність навчання моделі машинного навчання для вирішення завдань класифікації. Збір та оброблення даних є критичним етапом в процесі розроблення та використання моделей машинного навчання, оскільки якість та наочність даних безпосередньо впливають на точність та ефективність моделей. Проаналізовано математичне забезпечення алгоритмів моделей класифікації. Здійснено огляд літературних джерел, пов'язаних із тематикою статті. Проаналізовано набори даних, доступні у мережі для вирішення завдань класифікації. Розроблено програмне забезпечення для роботи із моделями машинного навчання. Проведено попередню підготовку вхідних даних для навчання та тестування вибраних моделей. Використано такі моделі класифікації, як наївний класифікатор Байєса, класифікатор випадкового лісу, наївний байєсів класифікатор Гауса, а також ітеративний метод зважування даних. Ці моделі інтегровано у програмне забезпечення, розроблене для оброблення, підготовки, зберігання даних. Досліджено обрані моделі із використанням попередньо підготовлених даних за допомогою програмного забезпечення відповідно до визначених сценаріїв. Згідно з результатами дослідження виявлено позитивний тренд на якість навчання моделей за коректної підготовки даних і вибору відповідних змінних для зважування даних респондентів. Показники ефективності, точності навчання алгоритму показують позитивну динаміку порівняно з результатами тестування моделей без використання зважування даних. Результатами дослідження підтверджується значущий вплив ітеративного методу зважування даних на результати навчання, тренування та тестування моделей машинного навчання, а саме мультиплікативного класифікатора Байєса.
Keywords