Визуализация данных – Как правильно выбрать тип диаграммы?

Осмысление фактов, цифр и измерений – это форма искусства – искусство визуализации данных . В море шума данных. Чтобы превратить ваши цифры в знания, ваша задача состоит не только в том, чтобы отделить шум от данных, но и правильно представить его.

Многие из нас происходят из «поколения PowerPoint» – именно в этом корни нашего понимания визуализации и представления данных. К сожалению, это далеко не все, что связано с добром, и я предстаю перед вами как виновный сам.

 

И если вы думаете, что я слишком циничен по этому поводу, не верьте мне на слово.

PowerPoint может быть самым мощным инструментом на вашем компьютере. Но это не так. Бесчисленные инновации терпят неудачу, потому что их чемпионы используют PowerPoint так, как того хочет Microsoft, а не правильно.
– Сет Годин , эксперт по маркетингу

Нет сомнений в том, что PowerPoint был, по крайней мере, частью проблемы, потому что это повлияло на поколение. Он должен был прийти с предупреждающей этикеткой и хорошим набором инструкций по дизайну еще в 90-х годах. Но обвинение в PowerPoint также является компромиссом – это всего лишь программное обеспечение, а не метод.
– Гарр Рейнольдс , эксперт по презентациям

Чтобы избежать распространенных ошибок в ваших презентациях, не мешало бы рассмотреть основы визуализации данных.

Рекомендации по визуализации данных

Существует четыре основных типа представления, которые вы можете использовать для представления своих данных:

  • сравнение
  • состав частей и целого
  • распределение
  • отношения

Если вы не являетесь статистиком или аналитиком данных, вы, скорее всего, используете только два, наиболее часто используемых типа анализа данных: сравнение или составление.

Выбор правильной диаграммы

Чтобы определить, какая диаграмма лучше всего подходит для каждого из этих типов презентаций, сначала вы должны ответить на несколько вопросов:

  • Сколько переменных вы хотите отобразить на одном графике? Раз, два, три, много?
  • Сколько элементов (точек данных) вы будете отображать для каждой переменной? Только несколько или много?
  • Будете ли вы отображать значения в течение определенного периода времени или среди элементов или групп?

Гистограммы хороши для сравнения, в то время как линейные диаграммы лучше работают для трендов. Точечные диаграммы хороши для отношений и распределений, но круговые диаграммы следует использовать только для простых композиций, а не для сравнений или распределений.

Существует диаграмма выбора диаграмм, созданная доктором Эндрю Абелой, которая должна помочь вам выбрать правильную диаграмму для вашего типа данных. 

Давайте раскроем и рассмотрим наиболее часто используемые типы диаграмм, некоторые примеры, а также то, что нужно и чего нельзя делать для каждого типа диаграммы.

Таблицы

Таблицы по сути являются источником для всех графиков. Их лучше всего использовать для сравнения, составления или анализа отношений, когда существует только несколько переменных и точек данных. Создавать диаграмму не имеет большого смысла, если данные можно легко интерпретировать из таблицы.

Используйте таблицы, когда:

  • Вам нужно сравнить или посмотреть отдельные значения.
  • Вам нужны точные значения.
  • Значения включают в себя несколько единиц измерения.
  • Данные должны сообщать количественную информацию, но не тенденции.

Используйте диаграммы при представлении данных:

  • Используется для передачи сообщения, содержащегося в форме данных.
  • Используется, чтобы показать связь между многими значениями.

Например, если вы хотите показать скорость изменения , например, внезапное падение температуры, лучше использовать диаграмму, которая показывает наклон линии, потому что скорость изменения не легко понять из таблицы.

Столбчатые диаграммы

Столбчатая диаграмма, вероятно, является наиболее часто используемым типом диаграммы. Эту диаграмму лучше всего использовать для сравнения разных значений, когда важны конкретные значения, и ожидается, что пользователи будут искать и сравнивать отдельные значения между каждым столбцом.

 

С помощью столбцовых диаграмм вы можете сравнить значения для разных категорий или сравнить изменения значений за определенный период времени для одной категории.

 

Лучшие практики для столбчатых диаграмм

  • Используйте столбчатые диаграммы для сравнения, если количество категорий довольно мало – до пяти , но не более семи категорий.
  • Если одним из ваших измерений данных является время – включая годы, кварталы, месяцы, недели, дни или часы – вы всегда должны устанавливать измерение времени на горизонтальной оси.
  • В диаграммах время всегда должно идти слева направо, а не сверху вниз.
  • Для столбцовых диаграмм числовая ось должна начинаться с нуля. Наши глаза очень чувствительны к высоте столбцов, и мы можем сделать неточные выводы, когда эти столбцы усечены.
  • Избегайте использования линий или заливок. Используйте рамку только для бликов.
  • Используйте столбцовые диаграммы только для отображения тенденций, если имеется достаточно низкое количество точек данных (менее 20) и если каждая точка данных имеет четко видимое значение.

Гистограммы столбцов

Гистограмма является распространенным вариантом столбчатых диаграмм, используемых для представления распределения и взаимосвязей одной переменной по набору категорий. Хорошим примером гистограммы может быть распределение оценок на школьном экзамене или размеры тыкв, разделенные на группы по размерам на фестивале тыкв.

Столбчатые диаграммы с накоплением

Используйте столбчатые диаграммы для отображения композиции. Не используйте слишком много композиционных элементов (не более трех или четырех) и убедитесь, что составные части имеют относительно одинаковый размер. Это может очень быстро запутаться.

 

Прежде чем перейти к следующему типу диаграммы, я хотел бы показать вам хороший пример того, как повысить эффективность вашей столбчатой ​​диаграммы, упростив ее. Кредит: Джои Чердарчук

Гистограммы

Гистограммы – это, по сути, горизонтальные столбчатые диаграммы.

 

Если у вас длинные имена категорий, лучше использовать гистограммы, потому что они дают больше места для длинного текста. Вы также должны использовать гистограммы вместо столбцовых диаграмм, когда количество категорий больше семи (но не больше пятнадцати) или для отображения набора с отрицательными числами.

  • Типичное использование гистограмм – это трафик посетителей с самых популярных реферальных сайтов. Ссылающиеся сайты, как правило, содержат более пяти-семи сайтов, а названия сайтов довольно длинные, поэтому их лучше отображать по горизонтали.
  • Другим примером могут быть показатели продаж торговых представителей. Опять же, имена могут быть довольно длинными, и может быть более семи торговых представителей.

Гистограмма гистограммы

Столбчатые диаграммы, для представления гистограмм можно использовать гистограммы.

  • Хорошим примером гистограммы является распределение населения по возрасту (и полу). Помните эти елочные графики?

С накоплением гистограммы

Я не совсем уверен насчет хорошего применения составных гистограмм – кроме случаев, когда есть только несколько переменных, составных частей, и акцент делается на композиции, а не на сравнении.

 

Сложенные столбцы не подходят для сравнения или анализа отношений. Единственная общая базовая линия расположена вдоль левой оси диаграммы, поэтому вы можете надежно сравнивать только значения в первой серии и для суммы всех рядов.

Линейные графики

Кто не знает линейных графиков? Мы рисовали их на школьных досках в школе.

 

Линейные диаграммы являются одними из наиболее часто используемых типов диаграмм. Используйте линии, когда у вас есть непрерывный набор данных. Они лучше всего подходят для визуализации данных на основе трендов за период времени, когда количество точек данных очень велико (более 20).

 

При работе с линейными диаграммами упор делается на продолжение или последовательность значений (тренд), но все еще есть некоторая поддержка для сравнения отдельных значений с использованием маркеров данных (только с менее чем 20 точками данных).

 

Линейный график также является хорошей альтернативой столбчатым диаграммам, когда график маленький.

Временные диаграммы

График временной шкалы является разновидностью линейных диаграмм. Очевидно, что любая линейная диаграмма, которая показывает значения за определенный период времени, является временной шкалой. Единственное отличие заключается в функциональности – большинство графиков временной шкалы позволяют увеличивать и уменьшать масштаб и сжимать или растягивать временную ось, чтобы увидеть больше деталей или общих трендов.

 

Наиболее распространенными примерами графика времени могут быть:

  • цены на фондовом рынке меняются со временем,
  • посетителей сайта в день в течение последних 30 дней,
  • цифры продаж по дням за предыдущий квартал.

Что нужно и чего нельзя делать для линейных графиков

  • Используйте линии для представления непрерывных данных в масштабе интервалов, где интервалы равны по размеру.
  • Для линейных графиков ось может не начинаться с нуля, если предполагаемое сообщение диаграммы – это скорость изменения или общая тенденция, а не точные значения или сравнение. Лучше начинать ось с нуля для широкой аудитории, потому что некоторые люди могут неправильно интерпретировать диаграмму.
  • На линейных графиках время всегда должно идти слева направо.
  • Не пропускайте значения для согласованных интервалов данных, представляющих информацию о тенденциях, например, определенные дни с нулевыми значениями.
  • Удалите указания, чтобы подчеркнуть тенденцию, скорость изменения и уменьшить отвлечение.
  • Используйте правильное соотношение сторон, чтобы показать важную информацию и избежать драматических эффектов наклона. Для лучшего восприятия, стремитесь к наклону под 45 градусов. (https://eagereyes.org/basics/banking-45-degrees)

Диаграммы области

График области – это, по сути, линейный график, который подходит для трендов и некоторых сравнений. Диаграммы с областями заполнят область под линией, поэтому лучше всего использовать этот тип диаграмм для представления накопленных изменений стоимости с течением времени, таких как товарный запас, количество сотрудников или сберегательный счет.

 

Не используйте диаграммы области для представления колеблющихся значений, таких как фондовый рынок или изменения цен.

Сложенная область

Графики с областями с накоплением лучше всего использовать для отображения изменений в составе с течением времени. Хорошим примером могут служить изменения доли рынка среди ведущих игроков или доли доходов по линейке продуктов за определенный период времени.

 

Диаграммы с областями с накоплением могут быть красочными и забавными, но вы должны использовать их с осторожностью, потому что они могут быстро стать беспорядком. Не используйте их, если вам нужно точное сравнение и не складывайте вместе более трех-пяти категорий.

Узнайте о других решениях

Круговые диаграммы и кольцевые диаграммы

data visualization pie chart 1024x576 - Визуализация данных - Как правильно выбрать тип диаграммы?

Кто не любит пироги или пончики, верно? Но не в визуализации данных. Эти графики являются одними из наиболее часто используемых и также неправильно используемых. Справа – хороший пример ужасной, бесполезной круговой диаграммы – слишком много компонентов, очень похожие значения.

 

Круговая диаграмма обычно представляет числа в процентах, используемые для визуализации части или всей композиции или композиции. Круговые диаграммы не предназначены для сравнения отдельных разделов друг с другом или для представления точных значений (для этого следует использовать гистограмму).

 

По возможности избегайте круговых диаграмм и пончиков. Человеческий разум мыслит линейно, но когда дело доходит до углов и областей, большинство из нас не может судить их хорошо. Источник: Oracle.com

С накоплением кольцевых диаграмм

Я не рекомендовал бы использовать составленные диаграммы пончика вообще! Я имею в виду, как никогда! Вы можете подумать, что вы можете использовать сложенный пончик для представления композиции, хотя и допускаете некоторое сравнение (с акцентом на композицию), но это плохо работает для обоих. Вместо этого используйте столбчатые диаграммы с накоплением.

 

Вот хороший пример того, как эффективно использовать круговую диаграмму. Кредит: Джои Чердарчук

«Дыщащая Земля» — симпатичная визуализация сезонных изменений зелёного покрова планеты:

Что нужно и чего нельзя делать для круговых диаграмм

Для тех из вас, кто по-прежнему сентиментален к старым круговым диаграммам PowerPoint и хочет продолжать их использовать, есть некоторые вещи, о которых следует помнить.

  • Убедитесь, что общая сумма всех сегментов равна 100 процентам .
  • Используйте круговые диаграммы только в том случае, если у вас менее шести категорий , если только нет явного победителя, на котором вы хотите сосредоточиться.
  • В идеале должно быть только две категории , например, мужчины и женщины, посещающие ваш сайт, или только одна категория, например доля рынка вашей компании, по сравнению со всем рынком.
  • Не используйте круговую диаграмму, если значения категорий почти идентичны или полностью отличаются . Вы можете добавить ярлыки, но это патч, а не улучшение.
  • Не используйте 3D и не разбивайте эффекты – они уменьшают понимание и показывают неправильные пропорции.

Точечные диаграммы

Точечные диаграммы в основном используются для анализа корреляции и распределения. Подходит для показа отношений между двумя разными переменными, где одна коррелирует с другой (или нет).

 

Точечные диаграммы могут также отображать тенденции распределения данных или кластеризации и помочь вам обнаружить аномалии или выбросы.

 

Хорошим примером точечных диаграмм может служить диаграмма, показывающая расходы на маркетинг и доходы.

Пузырьковые диаграммы

Пузырьковая диаграмма – отличный вариант, если вам нужно добавить другое измерение в диаграмму точечного графика. Точечные диаграммы сравнивают два значения, но вы можете добавить размер пузырька в качестве третьей переменной и, таким образом, включить сравнение. Если пузыри очень похожи по размеру, используйте этикетки.

 

Фактически, мы могли бы добавить четвертую переменную путем цветовой градации этих пузырьков или отображения их в виде круговых диаграмм, но это, вероятно, слишком много.

 

Хорошим примером пузырьковой диаграммы может служить график, показывающий расходы на маркетинг в сравнении с доходом и прибылью. Стандартный график рассеяния может показать положительную корреляцию для маркетинговых затрат и доходов (очевидно), когда пузырьковая диаграмма может показать, что увеличение маркетинговых затрат ограничивает прибыль.

 

Используйте диаграммы Scatter и Bubble, чтобы:

  • Существующие отношения между двумя (разброс) или тремя (пузырь) числовыми переменными,
  • Нарисуйте два или три набора переменных на одной координатной плоскости xy,
  • Поверните горизонтальную ось в логарифмическом масштабе, показывая таким образом отношения между более широко распределенными элементами.
  • Представлять шаблоны в больших наборах данных, линейных или нелинейных тенденциях, корреляциях, кластерах или выбросах.
  • Сравните большое количество точек данных без учета времени. Чем больше данных вы включите в точечную диаграмму, тем лучше будет сравнение.
  • Существующие отношения, но не точные значения для сравнения.

Карта Графики

Графики на картах хороши для того, чтобы дать вашим номерам географический контекст, чтобы быстро определить самые лучшие и худшие области, тренды и выбросы. Если у вас есть данные о местоположении, такие как координаты, названия стран, названия или сокращения штатов или адреса, вы можете нанести соответствующие данные на карту.

 

Карты не очень хороши для сравнения точных значений, потому что карты обычно имеют цветовую шкалу, а люди плохо различают оттенки цветов. Иногда лучше использовать наложенные пузырьки или цифры, если вам нужно передать точные цифры или включить сравнение.

 

Хорошим примером могут быть посетители веб-сайта по стране, штату или городу или продажи продукта по штатам, регионам или городам.

 

Но не используйте карты для абсолютно всего, что имеет географическое измерение. Сегодня почти любые данные имеют географическое измерение, но это не значит, что вы должны отображать их на карте.

Когда использовать карты?

  • Если вы хотите отобразить количественную информацию на карте.
  • Представить пространственные отношения и модели.
  • Когда важен региональный контекст для ваших данных.
  • Чтобы получить представление о распределении по географическим точкам.
  • Только если ваши данные стандартизированы (то есть они имеют одинаковый формат данных и масштаб для всего набора).

Диаграммы Ганта

Диаграммы Ганта были адаптированы Каролом Адамиецким в 1896 году. Но название происходит от Генри Ганта, который самостоятельно адаптировал этот тип гистограммы гораздо позже, в 1910-х годах.

 

Диаграммы Ганта хороши для планирования и планирования проектов. Диаграммы Ганта – это, по сути, карты проекта, иллюстрирующие, что необходимо сделать, в каком порядке и в какие сроки. Вы можете визуализировать общее время, затрачиваемое проектом, задействованные ресурсы, а также порядок и зависимости задач.

 

Но планирование проекта – не единственное приложение для диаграммы Ганта. Его также можно использовать в арендуемых предприятиях, отображая список предметов для аренды (автомобили, комнаты, квартиры) и периоды их аренды.

Чтобы отобразить диаграмму Ганта, обычно требуется, по крайней мере, дата начала и дата окончания. Для более сложных диаграмм Ганта вы должны ввести процент выполнения и / или зависимость от другой задачи.

Калибровочные диаграммы

Калибровочные диаграммы хороши для отображения KPI (ключевых показателей эффективности). Как правило, они отображают одно значение ключа, сравнивая его с индикатором уровня производительности с цветовой кодировкой, обычно показывая зеленый для «хорошо» и красный для «проблемы».

 

Панель инструментов была бы наиболее очевидным местом для использования калибровочных диаграмм. Там все KPI будут находиться в одном месте и быстро проведут «проверку работоспособности» вашего проекта или компании.

 

Датчики являются отличным выбором для:

  • Показать прогресс в достижении цели.
  • Представляет собой процентиль, как KPI.
  • Показать точное значение и значение одной меры.
  • Отобразите один бит информации, который можно быстро отсканировать и понять.

Недостатком калибровочных диаграмм является то, что они занимают много места и обычно показывают только одну точку данных. Если существует много диаграмм по сравнению с одной шкалой производительности, столбчатая диаграмма с пороговыми показателями будет более эффективным и компактным вариантом.

Многоосевые диаграммы

Бывают случаи, когда простая диаграмма просто не может рассказать всю историю. Если вы хотите показать отношения и сравнить переменные в совершенно разных масштабах, лучшим вариантом может быть наличие нескольких осей.

 

Многоосная диаграмма позволит вам построить данные, используя две или более оси Y и одну общую ось X. Но это приходит за плату. То есть диаграммы гораздо сложнее читать и понимать.

 

Многоосевые диаграммы могут быть полезны для представления общих тенденций, корреляций (или их отсутствия) и взаимосвязей между несколькими наборами данных. Но многоосевые диаграммы не подходят для точных сравнений (из-за разного масштаба), и вы не должны использовать этот тип, если вам нужно показать точные значения.

 

Используйте многоосевые диаграммы, если вы хотите:

  • Отобразите линейный график и столбчатый график с одинаковой осью X.
  • Сравните несколько показателей с различными диапазонами значений.
  • Проиллюстрируйте отношения, корреляцию или отсутствие их между двумя или более показателями в одной визуализации.
  • Сохраните пространство холста (если график не станет слишком сложным).

Визуализация данных: что нужно и что нельзя делать – общее заключение

  • Ось времени При использовании времени в графиках установите его на горизонтальной оси. Время должно идти слева направо. Не пропускайте значения (периоды времени), даже если они отсутствуют.
  • Пропорциональные значения. Числа на диаграмме (отображаемые в виде столбца, области, пузырька или другого физически измеренного элемента на диаграмме) должны быть прямо пропорциональны представленным числовым величинам.
  • Соотношение Data-Ink . Удалите лишнюю информацию, линии, цвета и текст из диаграммы, которая не добавляет ценности. Подробнее о соотношении данных и чернил
  • Сортировка. Для облегчения сравнения в столбчатых и столбчатых диаграммах сортируйте данные в порядке возрастания или убывания по значению, а не по алфавиту. Это относится и к круговым диаграммам.
  • Легенда Вам не нужна легенда, если у вас есть только одна категория данных.
  • Этикетки . По возможности используйте ярлыки непосредственно на линии, столбце, столбце, круговой диаграмме и т. Д., Чтобы избежать косвенного просмотра.
  • Регулировка инфляции . При использовании денежных значений в долгосрочных рядах обязательно учитывайте инфляцию. ( Инфляция в ЕС, инфляция в США )
  • Цвета На любом графике не используйте более шести цветов.
  • Цвета Для сравнения одного и того же значения в разные периоды времени используйте один и тот же цвет с различной интенсивностью (от светлого до темного).
  • Цвета Для разных категорий используйте разные цвета. Наиболее широко используемые цвета – черный, белый, красный, зеленый, синий и желтый.
  • Цвета Сохраняйте одинаковую цветовую палитру или стиль для всех диаграмм серии, а также одинаковые оси и метки для одинаковых диаграмм, чтобы сделать ваши диаграммы согласованными и удобными для сравнения.
  • Цвета Проверьте, как будут выглядеть ваши диаграммы при печати в оттенках серого. Если вы не можете различить цветовые различия, вы должны изменить оттенок и насыщенность цветов.
  • Цвета От 7 до 10 процентов мужчин имеют дефицит цвета. Помните об этом при создании диаграмм, чтобы они были удобочитаемы для дальтоников. Используйте Vischeck для проверки ваших изображений. Или попробуйте использовать цветовые палитры, удобные для дальтоников .
  • Сложность данных . Не добавляйте слишком много информации на один график. При необходимости разделите данные на две диаграммы, используйте выделение, упростите цвета или измените тип диаграммы. Кредит: Junkcharts

Инструменты анализа и визуализации данных

Решения аналитики данных

Напишите нам

и мы ответим в течении часа

support@asu-analitika.ru

Несколько видео о наших продуктах

085 - Визуализация данных - Как правильно выбрать тип диаграммы?
Проиграть видео
Презентация аналитической платформы Tibco Spotfire
106 - Визуализация данных - Как правильно выбрать тип диаграммы?
Проиграть видео
Отличительные особенности Tibco Spotfire 10X
1 11 - Визуализация данных - Как правильно выбрать тип диаграммы?
Проиграть видео
Как аналитика данных помогает менеджерам компании