Известия Алтайского государственного университета (Mar 2023)
Оптимизация кластерных разбиений с привлечением техники латентного анализа классов
Abstract
Если каждый из изучаемых объектов отождествить с вектором, координаты которого являются значениями факторов, характеризующих этот объект, то построение кластерного разбиения превращается в формирование системы пучков подобных векторов. В работе изучены закономерности изменения суммарной тесноты этих пучков при перемещении объекта из одного кластера в другой. Исходя из полученных результатов, предлагается алгоритм, действуя согласно которому, можно понизить суммарную внутриклас-терную изменчивость уже имевшегося начального кластерного разбиения. В основу предлагаемого алгоритма положена идея современной методики анализа латентных классов. Она состоит в том, что внутри каждого из построенных кластеров формирующие показатели объектов должны максимально возможным образом коррелировать между собой. Это требование заменяется на максимально возможную близость к среднему вектору соответствующего пучка. Степень такой близости и называется теснотой пучка векторов кластера. Для построенной с помощью предлагаемого алгоритма неулучшаемой кластеризации предложен новый метод квантификации ее кластеров. Рассмотрен практический пример применения алгоритма к медицинским данным. Обсуждаются причины зависимости результата от выбора начального кластерного разбиения.
Keywords