CHAID-анализ

CHAID-анализ. Построение деревьев классификации
chaid example 1024x655 - CHAID-анализ

Для чего это нужно?

  • Определение целевых групп
  • Проведение «последовательной» сегментации рынка (в отличие от кластерного анализа, дающего «параллельную» сегментацию)

Как это работает?

Метод основан на критерии хи-квадрат. Критерий хи-квадрат является универсальным способом определения зависимости двух или более переменных, работающим для всех типов шкал, так как завязан на таблице сопряжённости, которую можно построить для любых переменных.

На входе анализа – категориальная зависимая переменная (например, заинтересованность/незаинтересованность в услуге) и несколько независимых переменных (предикторов).

Вначале ищется самый сильный фактор, который наилучшим образом объясняет различия между категориями зависимой переменной (например, выделяет группы с наибольшим и наименьшим процентом заинтересованных в услуге). Автоматически перебираются все предикторы, ищутся все комбинации значений и находится наилучшее решение, т.е. то, которое максимизирует различия (при котором наибольший хи-квадрат).

Далее в каждой из полученных групп процесс повторяется заново: вновь перебираются все предикторы и находится оптимальное решение для второго уровня. То же – для следующих уровней. В каждой из подгрупп процесс происходит независимо, т.е. например, первым фактором оказался пол, а далее для женщин важен возраст, а для мужчин, скажем, семейное положение.

Что получаем в итоге?

В результате метод позволяет построить дерево классификации – набор последовательно выделенных сегментов с наибольшими различиями целевой переменной (например, группы с максимальным и минимальным процентом заинтересованных в услуге).

Это позволяет найти, сочетание каких признаков сильнее всего влияет на целевую переменную; а также определить наиболее перспективные целевые группы.

Узнайте о других решениях

Каковы преимущества метода?

Метод работает с переменными всех типов, даже с номинальными (в отличие от других методов сегментации, в первую очередь, кластерного анализа).

Широкая сфера применимости деревьев классификации делает их весьма привлекательным инструментом анализа данных, но не следует поэтому полагать, что его рекомендуется использовать вместо традиционных методов статистики. Напротив, если выполнены более строгие теоретические предположения, налагаемые традиционными методами, и выборочное распределение обладает некоторыми специальными свойствами, то более результативным будет использование именно традиционных методов.

Но как метод разведочного анализа или как последнее средство, когда отказывают все традиционные методы, деревья классификации, по мнению многих исследователей, не знают себе равных.

Методы анализа

Напишите нам

и мы ответим в течении часа

support@asu-analitika.ru

Sorry, we couldn't find any posts. Please try a different search.

Нет загрузок по выбранному критерию

Несколько видео о наших продуктах

085 - CHAID-анализ
Проиграть видео
Презентация аналитической платформы Tibco Spotfire
106 - CHAID-анализ
Проиграть видео
Отличительные особенности Tibco Spotfire 10X
1 11 - CHAID-анализ
Проиграть видео
Как аналитика данных помогает менеджерам компании
2019-08-02T21:56:43+03:00Июль 28th, 2019|Рубрики: Data Mining, Анализ данных|Метки: , , , , |