Алексей Колоколов – Азбука визуализации Power BI (страница 6)
К тому же, далеко не все эти диаграммы используются на дашбордах, где мы сталкиваемся с динамической визуализацией – данные обновляются и могут менять диапазон значений вследствие применения фильтров. В этом отличие нашего жанра бизнес-аналитики от креативной инфографики или журналистики данных.
Мы предлагаем вам упрощенную методику для выбора диаграмм. В 90 % случаев на дашбордах присутствуют данные трех типов: рейтинг, динамика и структура.
* Рейтинг – это количественное сравнение по принципу «больше-меньше»: кто на первом месте, кто входит в топ-5 и с каким отрывом, а кто насколько отстает. Например, рейтинг сотрудников по объему продаж, рейтинг статей затрат, рейтинг филиалов по численности. Базовая фигура для визуализации таких данных – это столбец (горизонтальный или вертикальный).
* Динамика – это изменение показателей во времени (год, месяц, день) или других упорядоченных периодов, например, этапов жизненного цикла проекта. Здесь важно показать общий тренд: рост, падения или сезонные колебания показателя. Базовая фигура для динамики – это линия на временной шкале (ее обычно так и называют – таймлайн). Также, для этого подходит столбчатая диаграмма.
* Структура – анализ состава целого, где акцент не на количестве, а на долях в процентах. Помогает понять, какие сегменты и категории вносят наибольший вклад в общий результат. Например, структура продаж по рынкам, структура расходов по проектам. Базовая фигура – круг, поделенный на секторы. Отсюда и возникла метафора “пирога” и “пончика”.
После того, как вы определили тип данных, нужно понять сколько категорий вы хотите показать: 5, 10, 15 или 50. На основе опыта проектов Института бизнес-аналитики мы разделили варианты на диапазоны и разработали метафорический компас (рисунок 2–2). В зависимости от того, сколько у вас категорий, стрелка покажет, какая диаграмма вам лучше подойдет. Если же вы хотите показать 50 категорий, то никакая диаграмма вам не поможет.
Рис 2–2. Компас визуализации.
Воспринимайте этот компас скорее как метафору, упрощенную шпаргалку. Границы здесь нечеткие: где-то может понадобиться изменить тип диаграммы не при 10-ти категориях, а уже при 8-ми. Или наоборот, столбчатая диаграмма с 11-тью категориями будет смотреться корректно. Это также зависит от размера диаграммы: либо вы предоставите для нее половину рабочей области дашборда, либо 1/6.
Рассмотрим подробно каждое из направлений компаса.
Рейтинг
Итак, для визуализации количественного сравнения по шкале мы используем столбец. Он может иметь как вертикальную, так и горизонтальную ориентацию. В Power BI (как и в Excel) это две разные диаграммы – столбчатая и линейчатая. Выбор зависит от:
1. Количества категорий на диаграмме;
2. Длины подписей категорий;
3. Размера диаграммы.
Количество категорий на диаграмме
Как вы уже успели узнать, по умолчанию Power BI для числового формата данных строит одну из таких диаграмм (зависит от версии программы). Рассмотрим вариант, когда мы автоматически получили столбчатую диаграмму. Если категорий несколько (3–7), то диаграмма выглядит хорошо и ее удобно читать. Но если их становится больше, то возникает проблема: подписи категорий отображаются под углом либо вертикально, и это критически усложняет чтение. В большинстве языков мы читаем по горизонтали слева направо, не стоит нарушать этот способ восприятия информации. На рисунке 2–3 вы видите, что столбчатая диаграмма по 3-м категориям товаров выглядит просто и понятно, а по более чем 15 подкатегориям перегружено – подписи располагаются под наклоном, и нужно внимательно всматриваться, чтобы понять, к какому столбцу относится подпись, а метки данных накладываются друг на друга или на столбцы.
Рисунок 2–3. Корректная столбчатая диаграмма (слева) и перегруженный вариант (справа).
Мы можем частично решить эту проблему, предоставив больше места для диаграммы, но длинные названия подкатегорий все равно останутся под наклоном, а часть из них будет отображаться не полностью (рисунок 2–4).
Рисунок 2–4. Растянутая столбчатая диаграмма: подписи под углом сложно читать.
Это говорит о том, что нужно использовать другую визуализацию – линейчатую диаграмму. В ней нам нужно “перевернуть” пропорции: столбцы были вытянуты по ширине, а теперь, чтобы поместились все горизонтальные полосы, нужно больше места по вертикали (рисунок 2–5). В этом варианте все подписи отображаются полностью, по горизонтали и достаточно крупно, в этом ключевое преимущество линейчатой диаграммы.
Рисунок 2–5. Корректная альтернатива столбчатой диаграмме с длинными наименованиями категорий – линейчатая диаграмма.
С точки зрения сторителлинга мы могли бы сказать, что нужно сфокусировать внимание на самых значимых товарах. На фоне сотен тысяч значения в диапазоне 10–30 тыс. не видны и их можно было бы сгруппировать в отдельную категорию Прочее. Тогда, получив порядка 10 категорий, мы бы поместили их на столбчатой диаграмме. Но данные на дашборде динамические, и мы не можем зафиксировать топ-10 с ограничением по значению, ведь при фильтрации разница в 10–20 тыс. может оказаться значимой.
Длина подписей категорий и размер диаграммы
Название категории может состоять из одного или нескольких слов. Power BI может переносить его по словам, но это будет зависеть от самого длинного из них. На рисунке 2–6 это слово
Рис 2–6. Варианты отображения подписей категорий: некорректный под наклоном (слева) и корректный по горизонтали с переносом по словам (справа).
Но что делать, если у нас нет дополнительного пространства? Тогда уже для 7–8 категорий мы будем использовать линейчатую диаграмму. Еще одно ее преимущество – она весьма компактная, и даже если мы почти вдвое сократим ее размер, то метки данных и подписи категории все равно будут хорошо видны (рисунок 2–7). При этом для малых значений в диапазоне 10–30 тыс. ничего существенно не изменилось – они как были тонкими полосками, так и остались.
Рис 2–7. Столбчатая диаграмма с подписями под наклоном (слева) и более компактная линейчатая диаграмма (справа).
В целом эта граница перехода между горизонтальным и вертикальным расположением столбцов находится в районе 10-ти категорий. Но в зависимости от длины подписей и размера диаграммы она может быть сдвинута как в меньшую, так и в большую сторону: для 7–8 категорий с развернутыми названиями вам нужно будет использовать линейчатую диаграмму, а для 11–12 категорий с короткими подписями оставить столбчатую.
Динамика
Чтобы показать, как менялся один показатель с течением времени, чаще всего используют линейный график. Он знаком нам со школы. Основная его идея заключается в том, что мы чертим горизонтальную ось времени (ось Х), которое движется слева направо, из прошлого в будущее, а по вертикали откладываем ось значений (ось Y). Для каждого периода на оси Х мы строим точку и соединяем их линиями, которые в итоге показывают нам тренд: растет показатель, падает или имеет сезонные пики и колебания.
С этой же целью мы можем использовать столбцы – они также покажут нам временную динамику. Возникает вопрос, что же выбрать: линию графика или столбцы? Подход здесь аналогичный рейтингу. Если у нас немного показателей, то хорошо будут смотреться столбцы. Например, данные за несколько лет или кварталов (рисунок 2–8 слева). А если на временной шкале много отрезков (по всем дням месяца, или неделям года), то следует выбирать график. Это может быть просто линия (рисунок 2–8 справа) или диаграмма с заливкой области.
Рис 2–8. Квартальная динамика продаж на столбчатой диаграмме (слева) и ежедневная динамика продаж на линейном графике (справа)
Существует пограничный интервал – 12 месяцев года. Для него подходят и столбцы, и линия (рисунок 2–9). Здесь нет проблемы с длинными подписями категорий. В отличие от рейтинга подписи временных интервалов более лаконичные: числовой формат даты, сокращенные названия месяцев и дней недели.
Рисунок 2–9. Два возможных способа отображения динамики продаж за 12 месяцев.
Поэтому на нашем компасе стоит граница в 12 периодов. Если их больше, например динамика за 2 года, то однозначно стоит строить линейный график – на нем проще увидеть тренд (рисунок 2-10 справа). А вот большое число столбцов выглядит перегружено (рисунок 2-10 слева).
Рисунок 2-10. Динамика с большим количеством периодов: некорректная столбчатая диаграмма (слева) и корректная линейная (справа).
Если же данные сгруппированы по кварталам или годам, то линия из нескольких точек наоборот будет смотреться невнятно. Для убедительной линии тренда недостаточно данных (рисунок 2-11 слева), а вот столбцы четко показывают поквартальное изменение выручки (рисунок 2-11 справа).
Рисунок 2-11. Динамика с малым количеством периодов: некорректный линейный график (слева) и корректный вариант столбчатой диаграммы (справа).
Структура
Структура показывает какие сегменты и категории вносят наибольший вклад в общий результат. Для визуализации таких данных обычно используется круг, разделенный на секторы – круговая диаграмма. Кольцевая диаграмма имеет точно такой же смысл, строится точно по таким же параметрам и отличается только наличием пустого пространства внутри. На рисунке 2-12 вы видите структуру продаж по каналам. Обе диаграммы выглядят просто и понятно.