Визуализация данных – история
Начнем с небольшого исторического обзора, главная цель которого — объяснить, что «рисовать данные» люди начали относительно недавно. Ниже некоторые примеры из лекции (смотрите ссылки, там есть интересные вещи)…
- Аналитика бизнеса
- Методы анализа данных Визуализация
- Визуализация данных – история
Оглавление
Начнем с небольшого исторического обзора, главная цель которого — объяснить, что «рисовать данные» люди начали относительно недавно. Ниже некоторые примеры из лекции (смотрите ссылки, там есть интересные вещи)…
Необходимость визуализации данных продемонстрировал Энскомб с помощью четырёх наборов, см. рис. 1, у которых одинаковые статистические характеристики. Это двумерные наборы данных, по каждой переменной у них совпадают средние, оценки дисперсии, они имеют одинаковые коэффициенты корреляции между переменными, а также уравнения линейной регрессии, построенные с помощью метода наименьших квадратов.
Рис. 1. Квартет Энскомба
Не смотря на такую «статистическую идентичность», мы видим, что это совсем разные наборы с точки зрения выбора модели, описывающей данные. Первый набор — линейная модель с шумом, на второй видна квадратичная зависимость, третий — линейная с выбросом, последний — константа с выбросом.
Интересно, что графика как средство визуализации идей стала интенсивно развиваться совсем недавно: в 18 веке. Здесь стоит упомянуть Джозефа Пристли (тот самый, кто открыл кислород), который на шкале времени изображал жизни великих людей, расцветы империй и т.п. Всё это для иллюстрации истории. На досуге посмотрите его картинки, не во всех современных учебниках истории так изображают ключевые даты.
Рис. 2. Визуализация истории Д. Пристли
Уильям Плейфэр изобрёл линейчатый график, гистограммы, секторную диаграмму в круге и круговую диаграмму (да-да, всё это начало интенсивно использоваться только в конце 18 — начале 19 веков).
Рис. 3. Инфографика Плейфера.
Во многих книгах по анализу данных приводят карты Шарля Жозефа Минара как пример удачной инфографики (это уже 19 век). Кстати, на рис. 4 изображена инфографика, которую неформально считают «самой популярной». Часто упоминают Флоренс Найтингел — изобретательницу диаграммы «Петушиный гребень», с помощью которой удалось объяснить потери Великобритании в Крымской войне.
Рис. 4. Визуализация вторжения Наполеона в Россию (Ш.Ж. Минар)
В середине 19 века появляется протоанализ данных, т.е. примеры постановок и успешных решений задач анализа данных, который ещё не стал наукой, поскольку не очертил сферу своей компетентности, не выработал аппарат для решения стандартных задач и не нашёл «постоянных приверженцев». Один из первых крупных успехов — история британского врача Джона Сноу, который «победил» вспышку холеры на Брод-стрит в 1854 году (читайте по ссылке). Да, вопрос «кто такой Джон Сноу?» — очень хороший для проверки знания истории анализа данных.
Рисунок Джона Сноу.
Сейчас мы живём во время, когда красивой визуализацией уже никого не удивишь… Например, такой климат-картой, иллюстрацией опроса зрителей сериала или графиками к статье. Что и зачем рисовать при решении задач машинного обучения — расскажем в следующей части поста
Что выбрать Spotfire,Tableau,Microsoft BI или Qlik Sense?
Конечно, Tableau и Spotfire предлагают унифицированное представление данных, но не настолько эффективно, как QlikSense. QlikSense …
Почитать еще
Скользкий склон безудержной семантики
Недавняя статья под названием «Спящее будущее визуализации данных? Фотография »расширяет определение визуализации данных до нового предела.
Визуализация данных и виртуальная реальность
Время от времени кто-то заявляет, что визуализация данных может быть улучшена при просмотре в виртуальной
Алгоритм Δλ: каркас визуализации и виды осей
Интерактивная визуализация живёт в двух измерениях плоскости экрана. Именно эти два измерения придают массе данных
Визуальные коммуникации
Большое количество исследований— это еще и большое количество отчетов и презентаций. При разработке исследований мы
Алгоритм Δλ: визуальные элементы
Загрузить программу ВІ Демонстрации решений После ответа на вопрос о том, что является элементарной частицей данных, задумайтесь,
Когда гистограммы с накоплением полезны
Я начну эту статью с ответа на вопрос, который указан в заголовке. Я обнаружил, что 100%
Зачем визуализировать количественные данные
Но почему иногда мы должны использовать графические дисплеи для выполнения этих задач, а не другие
Как правильно выбрать график для ваших данных
Вы и я просеиваем много данных для нашей работы. Данные о производительности веб-сайта, продажах, принятии продукта,
Методы визуализации данных. Алгоритм Δλ
Я ломаюсь на элементарных частицах. Не могу экстраполировать на разные виды «частиц». Например, вот визуализация бюджета города, что