Кластерный анализ

Кластерный анализ.
Выделение однородных групп респондентов, сегментация потребителей

Оглавление

cluster prioritisation matrix 1024x563 - Кластерный анализ

Для чего нужен кластерный анализ?

  • Сегментация потребителей
  • Определение групп связанных признаков (при кластеризации переменных)

Как это работает?

На входе анализа – набор переменных, описывающих совокупность респондентов. Метод работает с интервальными (например, возраст, доход, оценка степени согласия по 10-балльной шкале и т.д.) и дихотомическими переменными (например, пол, наличие/отсутствие руководящих функций) переменными. Совокупность из n значений по всем n переменным определяет положение объекта в неком n-мерном пространстве. Исходя из этих координат определяются расстояния между объектами. Для расчёта расстояний чаще всего используется Евклидово расстояние, однако метод расчёта расстояний может варьироваться в зависимости от специфики данных. Метод группирует схожие (расположенные близко друг к другу) объекты, в результате чего формируется набор из нескольких кластеров. Число кластеров может определяться автоматически на основе выбранного критерия либо выбираться вручную исследователем с учётом теоретических предпосылок и понимания предмета исследования.

Что получаем в итоге?

На выходе – набор кластеров/сегментов. Каждый сегмент описывается средними по кластеру значениями переменных. С помощью этих данных можно выделить характерные особенности сегментов, их отличительные черты. При хорошем кластерном решении дисперсия значений переменных внутри кластера должна быть минимальной (т.е. респонденты внутри кластера однородны), а дисперсия между кластерами максимальна (т.е. респонденты из одного кластера не похожи на респондентов из другого).

Каковы преимущества метода - кластерный анализ?

Хорошее кластерное решение даёт яркие и чётко различающиеся сегменты. На основе данных кластерного анализа можно выбирать разные стратегии работы с каждым из сегментов. Тем не менее, т.к. метод основан на расстояниях между объектами, он не работает с типами переменных, которые не дают возможности рассчитать эти расстояния – категориальными и порядковыми. В случае с такими типами переменных для проведения сегментации рекомендуется использовать CHAID-анализ.

Почитать еще

073119 pic1 177x142 - Кластерный анализ

Машинное обучение

Глубокое обучение – это продвинутая форма машинного обучения. Глубокое обучение относится к способности компьютерных систем, известных

9d39cc 177x142 - Кластерный анализ

Выборка. Типы выборок

Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков

lend 500 269 177x142 - Кластерный анализ

Обзор основных видов сегментации

Загрузить программу ВІ Демонстрации решений Аналитика бизнеса Оглавление Сегментация бренда Сегментация помогает принимать более эффективные

50 technology vector illustrations by vige.co 02 177x142 - Кластерный анализ

Логарифмическая шкала

Мы обычно думаем о количественных масштабах как о линейных, с равными количествами от одного помеченного

Несколько видео о наших продуктах

085 - Кластерный анализ
Проиграть видео
Презентация аналитической платформы Tibco Spotfire
106 - Кластерный анализ
Проиграть видео
Отличительные особенности Tibco Spotfire 10X
1 11 - Кластерный анализ
Проиграть видео
Как аналитика данных помогает менеджерам компании
2021-02-15T10:00:03+02:00