Как построить диаграмму и не облажаться

В этой статье я поделюсь теорией, которая помогает здорово экономить время. Особенно, если вам как минимум раз в день необходимо показывать коллегам или руководству данные аналитики в графическом виде. Что тут сложного? Каждый может построить диаграмму. Но далеко не у всех она получается понятной без дополнительных комментариев.

Описанный ниже подход к построению визуализации данных сформулировал директор по визуальным коммуникациям компании McKinsey Джин Желязны в своей книге «Говори на языке диаграмм». Эта книга обязательна для прочтения в McKinsey. Идея Желязны строится на пяти основных типах сравнения, где каждому типу сравнения соответствует определенный тип диаграммы.

Типы сравнения

1. Покомпонентное сравнение

Используя этот тип, мы показываем размер каждого компонента в процентах от какого-то целого. Например, «доля рынка клиента в 2015 году составляет 10%». Слова-идентификаторы покомпонентного типа сравнения —  «доля», «проценты от целого», «составило Х процентов».

2. Позиционное сравнение

Показывает соотношение объектов друг с другом: одинаковы ли они, больше или меньше других. Например, «за последний год объём продаж товарной категории А в несколько раз больше, чем продажи других товарных категорий».  Для позиционного сравнения характерны слова: «больше, чем», «меньше, чем», «равно».

3. Временное сравнение

Как правило, встречается чаще остальных. В данном случае нас интересует не сравнение компонентов, а их изменение с течением времени. Например, «объём продаж имеет стабильный рост на протяжении последних пяти лет». Ключевыми словами для временного сравнения будут: «изменяться», «расти», «убывать», «колебаться» и так далее.

4. Частотное сравнение

Помогает определить, какое количество объектов попадает в ту или иную группу, сформированную по вашему усмотрению. Например, частотное сравнение используется, когда надо показать, сколько сотрудников компании зарабатывают менее $5000, сколько $5000 — $7500, сколько $7500 — $10 000, а также какое количество сотрудников зарабатывает более $10 000. Характерные для частотного сравнения термины: «в диапазоне от X до Y», «концентрация», «распределение» и «частотность».

5. Корреляционное сравнение

Показывает наличие или отсутствие зависимости между двумя переменными. Например, «зарплата исполнительных директоров не зависит от размера компании» или «Увеличение объёма продаж зависит от процента скидки». Если формулировка вашей идеи содержит такие слова, как «относится к», «возрастает при», «снижается при», «меняется при», это указывает на применение корреляционного сравнения.

Выбор типа диаграммы напрямую зависит от вашей идеи.

Основные типы диаграмм

 На рисунке выше приведены основные типы диаграмм:

  • круговая;
  • линейчатая;
  • гистограмма;
  • график;
  • точечная.

Теперь приведу таблицу соответствия типов сравнения и диаграмм непосредственно из книги «Говори на языке диаграмм».

Как видим, для покомпонентного сравнения, с помощью которого вы показываете процент, отображающий долю конкретного элемента от целого, наиболее подходящий тип диаграммы — круговая.

Для позиционного сравнения, то есть для того, чтобы показать насколько один элемент больше или меньше другого, следует использовать линейчатую диаграмму.

Для временного сравнения в принципе подходит как гистограмма, так и график. В данном случае исходите из количества временных рядов. Если их не более семи, то более подходящей будет гистограмма. Если точек на графике более семи, скорее всего, более приемлемым будет график. То же — в случае с частотным сравнением.

Для корреляционного сравнения следует использовать точечную или двухстороннюю линейчатую диаграмму.

По своему опыту могу сказать, что построение точеной диаграммы обычно проще, советую использовать именно её.

Советы по построению визуализации данных

1. Не используйте объёмные диаграммы

Несмотря на эффектный вид, они искажают восприятие информации. Ниже приведены две круговые диаграммы, построенные на основе одного и того же набора данных. При этом в объёмной диаграмме создается впечатление, что секторы D и A меньше секторов C и B. На самом деле все секторы равны.

2. Не стоит использовать всю доступную цветовую гамму

Выделяйте цветом только то, на что хотите обратить внимание. К примеру, если вы хотите показать, что продукция А намного маржинальнее остальных, выделите цветом именно ее.

3. Размещайте на одном графике не более одного показателя

Не стоит отображать на одной диаграмме всю возможную информацию — объем продаж, количество, средний чек и так далее. Лучше отобразите каждый показатель на отдельном графике.

4. Не включайте более семи секторов в круговые диаграммы

Если у вас более семи элементов, покажите шесть самых крупных и расположите их в порядке убывания. Остальные сгруппируйте в один сектор и назовите его «прочие». Старайтесь делать простые диаграммы, без нагромождения. Помните про сдержанность в выборе цветовой гаммы. Перед построением диаграммы убедитесь, что данные для визуализации корректны. Ценность любой информации определятся в первую очередь ее корректностью, а уже потом — оформлением.

Узнайте больше
62
58
0
Обнаружили ошибку? Выделите ее и нажмите Ctrl + Enter.