Визуализация данных: основные правила, полезные приемы и инструменты

32
2812
Материалы для скачивания
769.83 Kb

Когда стандартные таблицы в Excel не раскрывают полную картину и нет возможности привлечь к созданию отчетов аналитиков, на помощь приходят сервисы и инструменты для визуализации данных.

В этой статье мы расскажем, зачем визуализировать данные и как правильно это делать, какие инструменты можно использовать для создания интерактивных дашбордов без помощи разработчиков и как выбрать тот, который подойдет именно вам.

Содержание

Зачем визуализировать данные

Если вы хотите, чтобы ваш пост в Facebook прочитало как можно больше людей, что вы сделаете? Правильно, добавите интересную картинку или фото. Этот прием прекрасно работает и с отчетами. Информация в графическом виде привлекает больше внимания, легче воспринимается и помогает быстрее донести до аудитории ваше сообщение. С помощью наглядных графиков и дашбордов можно сделать понятными даже сложные наборы данных.

Почему так происходит? Потому что большинство людей в мире — визуалы. И если вы хотите, чтобы большая часть ваших партнеров, коллег или клиентов могли взаимодействовать с вашими данными, нужно превратить скучные таблицы в красивые и динамичные графики.

Вот несколько интересных цифр, полученных в результате различных исследований, которые подтверждают важность визуализации:

  • 90% информации об окружающей среде человек получает с помощью глаз.
  • 50% нейронов мозга участвуют в обработке визуальной информации.
  • Наличие картинок на 80% повышает желание прочесть текст.
  • Человек запоминает 10% того, что услышал, 20% того, что прочитал, и 80% того, что увидел.
  • Если в инструкции к лекарству нет иллюстраций, человек усвоит 70% информации. Если добавить туда картинки, то цифра увеличится до 95%.

Если список показался вам скучным, есть инфографика, которая описывает эти же факты, но в более веселом и наглядном формате ;)

Грамотная визуализация данных принесет вашему бизнесу ряд преимуществ:

  • Скорость принятия решений. Проще и быстрее сделать вывод, глядя на график, где один из столбцов или одна из точек взаимодействия находится намного выше всех остальных, чем пролистать несколько страниц статистики в Google Sheets либо Excel.
  • Больше привлеченной аудитории. Как мы уже говорили, большинство людей лучше воспринимает и запоминает зрительную информацию.
  • Высокая вовлеченность читателей. Красивый яркий график с понятным посылом привлечет к себе внимание ваших читателей.
  • Лучшее понимание данных. Идеальные отчеты понятны не только технических специалистам, аналитикам и Data Scientists, но и маркетинг-директору или SEO и позволяют каждому сотруднику принимать решения в своей зоне ответственности.

Правила успешной визуализации

Первое, что нужно сделать перед созданием графика — проверить данные на точность и корректность. К примеру, если у вас коэффициент конверсии где-то равен 300%, а в среднем он обычно составляет 50-70%, проверьте, откуда взялось такое число. Возможно, это было поле total и у вас суммировались все данные. Возможно, это какой-то выброс, который нужно удалить с визуализации, иначе этот скачок поломает всю картину — 300% нивелируют разницу между 50% и 70%. Из-за такого выброса в отчете вы можете ошибиться и принять неверное решение.

В обычной жизни мы привыкли к тому, что правильное сообщение нужно донести до правильного человека в правильное время. При визуализации данных есть три похожих правила:

  1. Нужно выбрать правильный график в зависимости от того, какая у вас цель.
  2. Убедиться, что посыл вашего графика подходит аудитории.
  3. Оформить график в правильном дизайне.

Если вы сделали своевременное сообщение, но график не отображает динамику, у него неправильный посыл либо сложный дизайн, то результата, на который вы рассчитывали, не получится.

Какие бывают диаграммы и как их выбирать

Если график выбран неудачно, человек, который его смотрит, может запутаться либо ошибочно интерпретировать данные. Поэтому перед созданием отчета важно определиться, какие данные вы хотите визуализировать и с какой целью:

  • Сравнить разные показатели.
  • Показать распределение данных. Например, какие показатели встречаются чаще, а какие реже.
  • Показать структуру чего-либо с помощью данных. 
  • Проследить взаимосвязь между показателями.

Давайте рассмотрим самые популярные виды графиков и разберемся, для каких целей они подходят.

1. Линейный график (Line Chart)

Линейный график

Линейный график отображает динамику по одному или нескольким показателям. Его удобно использовать, чтобы сравнить, как меняются со временем разные наборы данных. Например, посмотреть статистику посещений трех посадочных страниц.

2. Столбиковая диаграмма (Bar Chart)

Столбиковая диаграмма

Еще одна диаграмма, которая идеально подходит для сравнения нескольких наборов данных. Горизонтальные столбиковые диаграммы обычно используют, когда нужно сравнить большое количество показателей или визуально выделить явное превосходство одного из них. А вертикальные столбцы хорошо иллюстрируют, как менялись показатели в разные периоды, например, ежегодная прибыль компании за несколько лет.

3. Гистограмма (Histogram)

Гистограмма

Гистограмму часто путают со столбиковой диаграммой из-за визуального сходства, но все же у этих графиков разные цели. Гистограмма показывает, как распределяются данные в рамках непрерывного интервала или определенного периода времени. На вертикальной оси этого графика находится частотность, а на горизонтальной — интервалы или временной период.

Столбиковая диаграмма в отличие от гистограммы, не связана с непрерывным интервалом — здесь каждый столбик означает отдельную категорию. Например, показать количество покупок в разные годы удобнее с помощью столбиковой диаграммы. Если же вы хотите узнать, в пределах какой суммы (от $10 — $100, $101 — $200, 201 — 300 и т.д.) совершается больше всего покупок, лучше выбрать гистограмму.

4. Круговая диаграмма (Pie Chart)

Круговая диаграмма

Круговая диаграмма показывает долю каждого значения внутри множества. Её используют, чтобы показать структуру какого-нибудь набора данных — из чего он состоит. Например, какой процент от общих продаж приносит каждая категория товаров.

5. График рассеяния или точечная диаграмма (Scatterplot)

График рассеяния

График рассеяния помогает найти взаимосвязь между двумя показателями. Например, с его помощью можно узнать, как меняется коэффициент конверсии в зависимости от размера скидки на товар.

6. Пузырьковая диаграмма (Bubble Chart)

Интересный график, который позволяет сравнить два параметра по третьему. Возьмем коэффициент конверсии и размер скидки из предыдущего примера, добавим к ним доход (за который отвечает размер круга) и получим примерно такую диаграмму.

Пузырьковая диаграмма

Глядя на этот график, легко заметить, что самая высокая конверсия у товаров со скидкой 30%, однако больше всего дохода приносят товары без скидки и товары со скидкой 5%.

8. Географическая диаграмма (Geo Chart)

Географическая диаграмма

С географической диаграммой все просто — ее используют, когда хотят увидеть, распределение определенного показателя по регионам, странам, материкам.

Мы перечислили одни из самых популярных диаграмм, но далеко не все. Посмотреть остальные типы графиков вы можете в «Каталоге визуализации данных». Также рекомендуем вам удобную схему, которая поможет правильно выбрать график, подходящий для ваших целей.

Правильное использование графиков и диаграмм

Второй важный момент, который необходимо учитывать при визуализации данных — это правильный месседж и выбор аудитории. Вашим читателям должны быть близки и понятны данные, о которых вы хотите рассказать в отчете.

Перед вами график, который в 2016 году был отмечен престижной премией Data Journalism Award. Для человека, незнакомого с предысторией, график выглядит, как рисунок трехлетнего ребенка. Однако, стоит узнать о нем чуть больше — и становится понятно, что его авторы проделали огромную работу.

Чарльз Сейф и Питер Олхоуз, редакторы Buzzfeed News, с помощью языка R визуализировали данные о полетах, которые совершают агенты FBI и DHS для воздушного наблюдения. Конкретно на этом графике изображены полеты над домом и мечетью преступников, которые устроили стрельбу в Сан-Бернардино в декабре 2015 года.

При выборе параметров, которые вы хотите визуализировать на одном графике, нужно убедиться, что их действительно можно сочетать. Бывает так, что связь данных, которые на первый взгляд идеально коррелируют друг с другом, совершенно лишена логики. Вот пример такого графика с ошибочной корреляцией. Он показывает, что число утонувших в бассейне тесно связано с количеством фильмов, в которых снимался Николас Кейдж.

Следующие вещи, на которые стоит обратить внимание при создании графика — это правильные шкала и масштаб. Люди привыкли, что отсчет на осях координат начинается снизу вверх и слева направо. Если вы измените порядок отсчета, это может ввести в заблуждение не внимательную аудиторию. Стоит оговориться, что обратная шкала допустима, если вы используете ее в качестве тактического приема, как в этом примере:

Обратная шкала

При первом взгляде на этот график может показаться, что количество убийств с применением огнестрельного оружия с годами падает. На самом деле все наоборот, так как отсчет на шкале идет сверху вниз. Вероятно, автор графика сделал это специально, чтобы снизить негативное впечатление от данных, представленных в отчете.

Правильно подобранный масштаб также сделает ваш график более наглядным и понятным. Если в отчете показаны очень близкие между собой показатели и в классическом масштабе вы не видите динамику и разницу, попробуйте изменить масштаб. Начните отсчет не с нуля, разбейте шкалу на более мелкие единицы — и картина сразу прояснится.

Масштабирование графика

Прежде, чем отдать отчет конечным пользователям, позаботьтесь о том, чтобы график работал быстро. Медленная работа убьет все ваши труды. К примеру, если вы визуализируете данные в Google Sheets, скорее всего, параметры хранятся на этом же листе или на соседнем и не подтягиваются из третьего источника. Если же вы делаете отчет в Data Studio, то данные вы будете откуда-то импортировать. В таком случае нужно позаботиться о доступности этого ресурса и о скорости передачи данных. Иначе вы увидите некрасивую картинку, когда макеты графиков есть, а данные не подгрузились.

Правильный дизайн отчетов

В дизайне ваших диаграмм всегда придерживайтесь принципа простоты. Если вам нужно подготовить какой-нибудь стандартный отчет, не стоит изобретать велосипед или заниматься «украшательством». Избегайте лишних элементов, которые только засоряют график: обилие разных цветов и структур, 3D-объем, тени, градиент и т.д.

Поверьте, чем проще график, тем лучше воспринимается информация, которую вы хотели донести.

Не делайте визуализацию слишком мелкой, не накладывайте все графики на одну страницу дашборда. Использовать на одном слайде либо на одной странице дашборда более трех видов графиков считается дурным тоном. Если вам действительно нужно столько типов графиков, разместите их на разных страницах — так их будет легче воспринимать.

Не бойтесь экспериментировать. Если у вас нетипичная задача, вполне возможно, что решение тоже будет нетипичным. На инфографике ниже мы видим траекторию движения крыльев разных животных. Здесь динамическая визуализация вполне уместна.

Инфографика движение крыльев

Давайте разберемся, какие есть инструменты для визуализации данных и как выбрать тот, который подойдет вам.

Сравнение инструментов для построения отчетов

Сейчас на рынке есть очень много инструментов для визуализации. Некоторые из них платные, некоторые нет. Одни работают в онлайне, другие можно установить на десктоп и работать в онлайне, а третьи только офлайновые. Мы сделали список из 10 инструментов, которые чаще остальных встречаются вместе со словами «визуализация данных»: ​

  1. Excel / Google Sheets
  2. Google Data Studio
  3. Tableau
  4. Power BI
  5. QlikView
  6. R Studio
  7. Visual.ly
  8. Tangle
  9. iCharts
  10. OWOX BI Smart Data

    До пятого пункта — это инструменты и сервисы крупных корпораций, которые специализируются на визуализации данных. После шестой строчки мы разместили достаточно интересные инструменты, преимущественно бесплатные и онлайновые. В них можно увидеть нестандартные виды визуализации и, возможно, найти новый подход к вашим данным.

    Чем руководствоваться при выборе инструмента для создания отчетов?

    • Отталкивайтесь от тех задач, которые вы хотите решить. К примеру, сейчас основной тренд на рынке — это возможность смотреть отчеты в динамике. Если инструмент не умеет работать с динамическими отчетами, это может сыграть не в его пользу.
    • Учитывайте сумму, которую вы готовы за это заплатить. Если у вас достаточно большая команда и каждый сотрудник должен работать с инструментом визуализации, то стоимость подписки на одного человека может стать стоп-фактором.
    • Продумайте, кто и как будет пользоваться инструментом: динамически или нет, возможно ли групповое редактирование. Насколько легко начать работу, понятный ли интерфейс. Есть ли возможность создать отчет без знания языков программирования. К примеру, R Studio — классный сервис особенно для поиска трендов, построения модели атрибуции, модели корреляции. Однако, если вы не знаете язык программирования, не умеете подключать специфические библиотеки, то есть не являетесь техническим специалистом, вам будет сложно начать работу с этим инструментом. 

    Мы выбрали пятерку сервисов и подготовили сравнительную таблицу с плюсами, минусами и основными характеристиками. Прежде чем к ней перейти, поясним чем отличаются строчки «Динамика в отображении данных» и «Динамические отчеты».

    Под динамическими отчетами мы имели в виду способность подгружать данные из различных источников на лету. Например, у Google Data Studio нет динамического отчета. Допустим, мы подключили к Data Studio запрос из Google BigQuery, а затем в запросе что-то поменяли. Чтобы эти изменения отразились в отчете, нужно как минимум обновить страницу в Data Studio. Однако, если мы в Google BigQuery добавили или удалили какое-то поле (не просто поменяли логику расчета, а изменили структуру таблицы) то Data Studio закроет отчет с ошибкой. Его придется переделывать.

    Динамика в отображении данных — это возможность, к примеру, посмотреть в рамках одного сеанса сводную статистику за разные даты. Как в Google Analytics: вы меняете временной интервал, и у вас подгружается статистика за нужные даты.

    Ключевые характеристики ТОП-5 инструментов визуализации

    Сравнение инструментов для визуализации данных

    Мы хотим подробнее остановится на трех инструментах, которые активно используем в OWOX BI. Это Google Data Studio, Google Sheets и OWOX BI Smart Data.

    Google Data Studio

    Data Studio позволяет подключать свои источники, визуализировать данные и, что самое удобное, легко делиться отчетами с коллегами, по аналогии с остальными продуктами Google.

    Преимущества:

    • Бесплатно.
    • Более 150 коннекторов, просто интегрируется.
    • Можно использовать данные из нескольких источников на одном дашборде.
    • Удобно делиться отчетами.

    Полезные ссылки:

    Это бесплатный инструмент, у которого очень много коннекторов. 17 нативных, которые предоставляет Google. Они проверены, работают хорошо и в целом для основных задач их достаточно. И есть коннекторы, которые предоставляют партнеры. Однако, нужно понимать, что писать коннекторы могут разработчики с разным уровнем знаний и не факт, что они все будут работать корректно.

    Кстати, если вы хотите видеть в отчетах Data Studio статистику из Facebook или Яндекс.Директ, вы можете импортировать данные в Google BigQuery с помощью OWOX BI. При этом, если в других коннекторах какая-то часть аналитики может быть не учтена, то в BigQuery выгружается полная аналитика из вашего FB-аккаунта.

    В Google Data Studio есть удобная галерея с готовыми шаблонами, которые вы можете использовать для своих отчетов.

    Галерея Data Studio

    У нас тоже есть готовые шаблоны дашбордов, которыми мы готовы поделиться. Первый — это Marketing Attribution Dashboard. На нем собраны все необходимые параметры и показатели, которые маркетологи и аналитики используются на постоянной основе.

    Marketing Attribution Dashboard

    Второй дашборд Digital Marketing Paid Channels KPI — на нем подробнее отображается информация в разрезе конкретных источников. То есть отфильтрованы данные по Facebook, Вконтакте и т.д.

    Это demo-дашборды. Вы можете скопировать их, изменить источник данных на свой и использовать отчеты в вашей работе.

    Одно из недавних обновлений Data Studio — возможность фильтровать данные по представлению (View). Например, чтобы сравнить показатели за текущий период и предыдущий год. Как это делать, мы наглядно показали в практической части вебинара «Сравнение инструментов для построения отчетов». Вы можете получить запись и презентацию вебинара, заполнив небольшую форму.

    ПОЛУЧИТЬ ЗАПИСЬ ВЕБИНАРА

    Еще одно интересное обновление в Data Studio — возможность менять тип графика уже в интерфейсе после того, как он построен. Раньше, когда вы создавали график, его нужно было удалить и создать новый. Сейчас можно поменять стиль графика непосредственно в интерфейсе.

    Google Sheets

    Самый популярный инструмент для отчетов, которым хоть раз пользовался любой маркетолог. Интерфейс у Google Sheets довольно простой и понятный особенно для тех, кто начинал работать с аналитикой в Excel. 

    Преимущества:

    • Бесплатный.
    • Гибкий: можно использовать динамические параметры, сводные таблицы и т.д.
    • Легко интегрируется с вашими источниками данных.
    • Удобно делиться отчетами при помощи ссылки.

    Полезные ссылки:

    Набор графиков и отчетов, которые есть в Google Sheets, аналогичен набору отчетов в Google Data Studio.

    Также есть возможность управлять цветом и выбирать форматирование ячеек:

    Форматирование в Google Sheets

    Наверное, самое главное преимущество Google Sheets — это сводные таблицы. Недавно в Google Data Studio вышло обновление, которое позволяет выводить в одной сводной таблице более 3 полей и порядка 10 столбцов. Это значительно упростило жизнь аналитиков, которые используют сервис, но все-таки возможности Data Studio не безграничны и в Google Sheets работать со сводными таблицами по-прежнему удобнее.

    У Google Sheets есть бесплатный аддон, который позволяет загружать данные напрямую из Google Analytics и строить отчеты уже на агрегированных данных. Также вы можете обращаться запросами к данным GA. На этой гифке видно, как импортировать данные, какие параметры и метрики можно задавать.

    Хотим поделиться нашим любимым примером отчета в Google Sheets — когортным анализом.

    Когортный анализ

    По ссылке доступен шаблон этого отчета. Вы можете посмотреть там инструкцию и формулы, которые мы использовали. Цветом выделены поля, которые необходимо заполнить и те поля, которые сами обновятся с помощью формул. Очень много расчетных показателей, но это очень сложный и трудоемкий отчет. Надеемся, что вам этот шаблон будет вам полезен. Кроме того, вы можете почитать статью «Когортный анализ в Google Analytics и Google Sheets», в которой мы приводим очень подробные инструкции. Также мы провели вебинар по когортному анализу.

    ПОЛУЧИТЬ ЗАПИСЬ ВЕБИНАРА

    OWOX BI Smart Data

    С OWOX BI Smart Data вам не понадобится знание SQL-синтаксиса. Достаточно задать вопрос на русском или английском языке, так как вы это делаете в жизни. Сервис сам обработает запрос, переведет его на технический язык и выдаст красивую картинку и таблицу с ответом на ваш вопрос.

    Преимущества:

    • Не нужна специальная техническая подготовка.
    • Быстрые ответы на вопросы.
    • Дружественный интерфейс.
    • Доступно 2 языка: русский и английский.

    У нас довольно подробно расписана справка, где можно узнать детальнее о каждом типе отчетов, которые можно создавать в Smart Data.

    Какие данные можно использовать для отчетов в Smart Data

    Действия пользователей на вашем сайте:

    Транзакции:

    Расходы на рекламные кампании:

    После того, как данные собраны, можно задавать вопросы. Мы добавляем в OWOX BI Smart Data все отчеты, которые необходимы нашим клиентам и группируем их в тематические блоки, чтобы было удобнее находить нужный отчет. У нас есть блоки с ROPO-отчетами, отчетами по атрибуции, по CPA-партнерам, отчеты с данными из CRM и многие другие.

    Все параметры и метрики в вопросах, выделенные квадратными скобками, можно легко менять. Вы можете кликнуть на метрику или параметр и из выпадающего списка выбрать то, что вам интересно.

    Вопросы к вашим онлайн-данным:

    • Как изменялась [метрика] по [параметру] за [период]?
    • Как [метрика] зависела от [параметра]?
    • Как [метрика] распределена по [параметру]?
    • Сколько [метрика] было на сайте?

    Вопросы по атрибуции:

    • Какая реальная ценность рекламных каналов, кампаний и ключевых слов?
    • Какими были основные показатели эффективности рекламных кампаний: ROAS, ROI, ДРР по модели Funnel Based?
    • Как распределялась ценность конверсий (например, регистраций) по каналам и кампаниям?
    • Какие источники имеют бОльшую или мЕньшую ценность по сравнению с моделью Last Non-direct.
    • Какие кампании и ключевые слова лучше всего привлекают новых пользователей?
    • Какие каналы и кампании лучше всего работают на каждом из шагов воронки?
    • Какие цепочки последовательностей источников и каналов приводят к транзакциям?
    Отчеты по атрибуции

    Вопросы к данным на стыке CRM + онлайн:

    • Как исполняемость заказов зависела от кампании?
    • Как изменялась валовая прибыль по группам каналов по дням?
    • Как количество пользователей из CRM и количество заказов в CRM зависело от города?
    • Как ROAS по валовой прибыли зависел от источника и канала?
    • Как количество заказов в CRM зависело от типа оплаты и типа доставки?
    • Как конверсия и среднее время доставки зависели от города?
    • Как количество заказов в CRM и количество пользователей из CRM зависело от магазина?

    В нашей справке вы можете ознакомиться с полной структурой данных для выгрузки из CRM.

    Вопросы о CPA-кампаниях помогут:

    • Обнаружить подмену источника трафика.
    • Обнаружить покупку рекламы на брендовые запросы.
    • Определить, какому партнеру платить за действие при пересечении транзакций.
    • Определить качество сессий, генерируемых CPA-партнерами.

    Узнать больше об отчетах по CPA-кампаниям вы можете в нашей статье «Примеры нечестной игры в CPA-маркетинге» или в этом видео.

    Вопросы о ROPO (Research Online — Purchase Offline) помогут:

    • Рассчитать влияние онлайн-рекламы на офлайн-покупки.
    • Понять реальное конверсионное окно ROPO-покупок, а также отследить зависимость ценности транзакции и количества дней, которое необходимо пользователю для принятия решения о покупке.
    • Узнать, как покупатели, транзакции и доход распределены по дням до совершения офлайн-покупки.
    • Узнать, сколько дней необходимо пользователю для принятия решения о наиболее ценной покупке.
    ROPO-отчеты

    Также мы собрали небольшой блок с частыми вопросам, которые задают пользователи OWOX BI Smart Data. Как построить запрос, какая у него должна быть структура. Как проверить есть ли параметры или метрики, которые вы хотите увидеть и т.д.

    Сколько метрик по параметрам можно выбрать за один раз?

    • Отчет в Smart Data не ограничивает вас в количестве метрик, которые вы можете использовать. Однако при большом количества метрик, строить визуализацию будет удобнее в Google Data Studio.
    • Со списком всех доступных метрик и параметров можно ознакомиться в справке.

    Как построить запрос, какая должна быть структура?

    Примеры и структуру вопросов можно найти в нашей справке:

    Точно ли эти графики показывают корректные значения?

    Отчеты в Smart Data основаны на ваших полных данных и готовых SQL-запросах, которые вы можете скопировать и проверить в вашем проекте Google BigQuery.

    Напоследок хотим поделиться полезными книгами и ссылками про визуализацию данных, которые нам понравились:

    P.S. Чтобы в ваших отчетах всегда были правильные и полные данные, ознакомьтесь с нашим чек-листом для маркетинг-аналитиков. Заполните форму, и мы пришлем чек-лист на ваш email.

    Использованные инструменты

    Вас также могут заинтересовать