Дискриминантный анализ

Предсказание принадлежности к группе на основе значений независимых переменных

Для чего нужен дискриминантный анализ?

Поиск наиболее сильных различий между сегментами.
Оценка устойчивости сегментации.
Воспроизведение сегментации с помощью обучения новой выборки по данным прошлых волн.
Восстановление пропущенных значений.

Как это работает?

На входе анализа – категориальная переменная, содержащая принадлежность к классам (например, сегментация, или потребление продуктов или брендов), и набор независимых переменных, измеренных по интервальным или дихотомическим шкалам. При этом категориальная переменная может иметь пропуски, т.е. не для всех респондентов будет заполнена: алгоритм самостоятельно предскажет эти значения.

С помощью статистического критерия (чаще всего используют критерий Фишера) алгоритм ищет такую комбинацию линейных уравнений (дискриминантных функций), которая наилучшим образом опишет различия между группами.

Первая дискриминантная функция отделяет первую группу от групп 2, 3, … N, вторая – вторую группу от групп 3, 4, … N и т.д. В итоге все N групп получаются отделёнными друг от друга дискриминантными функциями. Это даёт возможность определить вероятность принадлежности респондента к тому или иному классу.

Что получаем в итоге?

Дискриминантный анализ дает возможность понять, по каким именно переменным имеющиеся классы (сегменты, продукты, бренды, и т.д.) различаются сильнее всего.

Каждому респонденту приписывается вероятность попадания в тот или иной класс; таким образом, при сегментации можно определить основной (по наибольшей вероятности попадания) и дополнительный (второе по величине значение вероятности) сегмент респондента.

Метод позволяет воспроизвести уже имеющуюся сегментацию, распространив ее на новые волны исследования. Кроме того, с его помощью можно оценить устойчивость сегментов.

Наконец, с помощью дискриминантного анализа можно строить различные карты, существенно облегчающие интерпретацию результатов кластерного анализа.

Каковы преимущества метода - дискриминантный анализ?

Вкупе с кластерным анализом служит эффективным средством сегментирования, позволяет более четко понять различия между сегментами. Может использоваться для определения силы влияния независимых переменных на зависимую. В этом задача дискриминантного анализа в целом похожа на задачу регрессионного анализа, при этом дискриминантный анализ не имеет такого количества ограничений.