Значимые различия и доверительные интервалы
Данные выборочного исследования не полностью совпадают с данными в генеральной совокупности. Существует некоторая ошибка выборки, обусловленная тем, что в выборку входят не все представители генеральной совокупности. Чем более размер выборки приближен к размеру генеральной совокупности, тем меньшей будет ошибка выборки и тем точнее полученные на выборочной совокупности данные.
- Аналитика бизнеса
- Методы анализа данных Data Mining
- Значимые различия и доверительные интервалы
Оглавление
Для чего нужны доверительные интервалы?
- Сравнение данных по подгруппам, регионам, волнам.
- Определение отличий подгрупп от выборки в целом.
Как это работает?
Данные выборочного исследования не полностью совпадают с данными в генеральной совокупности. Существует некоторая ошибка выборки, обусловленная тем, что в выборку входят не все представители генеральной совокупности. Чем более размер выборки приближен к размеру генеральной совокупности, тем меньшей будет ошибка выборки и тем точнее полученные на выборочной совокупности данные.
Ошибку выборки можно вычислить с помощью калькулятора. Для этого необходимы данные о размере генеральной совокупности и размере выборки. Также, имея данные о размере генеральной совокупности, можно вычислить объём выборки, необходимый для того, чтобы получить данные с заданной ошибкой выборки.
Доверительный интервал позволяет перенести результаты с выборки на генеральную совокупность и указывает интервал, в который с определенной вероятностью измеряемый показатель попадает в генеральной совокупности.
Различия между показателями, полученными для разных подгрупп, считаются значимыми, если их доверительные интервалы не пересекаются.
Что получаем в итоге?
Алгоритм позволяет находить и отмечать значимые различия между показателями для разных подгрупп.
Для удобства восприятия в отчётах эти различия обычно помечаются цветовыми обозначениями (стрелками или кружками): красным в случае, если показатель значимо выше, и синим, если показатель значимо ниже другого.
Каковы преимущества метода - доверительного интервала?
Начало работы с Tibco Spotfire Desktop
Для успешной работы с продуктами Tibco Spotfire, Вам потребуется 10 минут на освоение. Вы увидите …
Почитать еще
Введение в анализ временных рядов
Хотя для анализа данных используются все многочисленные передовые инструменты и методы, такие как наука о
История развития моделей данных
Итак, прыгайте на борт и наслаждайтесь путешествиями во времени наших попыток справиться с временностью в
Машинное обучение
Глубокое обучение – это продвинутая форма машинного обучения. Глубокое обучение относится к способности компьютерных систем, известных
Правила эффективного прогнозирования
Интуиция очень важна. С ее помощью было создано большое количество хороших прогнозов. Но нужно всегда
Выборка. Типы выборок
Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков
Обзор самых популярных алгоритмов машинного обучения
Существует такое понятие, как «No Free Lunch» теорема. Её суть заключается в том, что нет
Обзор основных видов сегментации
Загрузить программу ВІ Демонстрации решений Аналитика бизнеса Оглавление Сегментация бренда Сегментация помогает принимать более эффективные
Алгоритмы машинного обучения
В одной из статей мы познакомились с основами машинного обученияи, хотя кратко, но очень лаконично, мы
Полное руководство по анализу текста
Напоминание – это количество правильных результатов, разделенное на количество результатов, которые должны были быть возвращены. Загрузить