Оценка дополнительной ценности мульти­канальной атрибуции

10
1284
В статье описан способ оценки дополнительного дохода, который может быть получен благодаря применению моделей атрибуции, учитывающих взаимное влияние каналов. Материал будет полезен маркетологам и аналитикам, которые стремятся в деньгах оценить потенциальную выгоду перехода от Last Non-Direct Click модели к мультиканальным моделям.

Постановка задачи

«Что нам это даст?» — этот вопрос справедливо задают даже те, кто хорошо знаком с  недостатками стандартных моделей атрибуции. Если вы не знаете, какая модель атрибуции используется в вашем проекте, то скорее всего это Last Non-Direct Click — вся ценность от транзакции атрибутируется на последний непрямой визит. Эта модель настроена по-умолчанию в большинстве аналитических сервисов, в том числе в Google Analytics.

Все знают, что Last Non-Direct Click не учитывает взаимное влияние каналов. Но как это померить в деньгах? Какую долю дохода искажает Last Non-Direct Click и в какой мере мы можем на это повлиять?

Не все цепочки одинаково полезны

Если в вашем проекте используется Google Analytics 360 или OWOX BI Streaming , то у вас есть доступ к несемплированным данным в Google BigQuery и вы можете проверить любую гипотезу на полных данных. Но если в вашем распоряжении только стандартная версия Google Analytics, то вечер перестает быть томным найти ответ будет непросто.

Посмотрим на отчет по длинам мультиканальных последовательностей:

В качестве типа конверсий необходимо выбрать только транзакции. В результате мы узнаем, какая доля доходов приходится на заказы, сделанные с первого визита. В нашем примере (мультиканальный ретейлер со средней посещаемостью) 72% дохода пришлось на мультиканальные цепочки, в которых было два и более визита.

Но искажение в 72% — выглядит нереально большим; сложно поверить, что даже Last Click настолько искажает распределение дохода.

Давайте посмотрим внимательнее на то, какие цепочки с двумя и более визитов являются наиболее популярными. Для этого откроем отчет Top Conversion Paths:

Обратите внимание:

  • Цепочки 1,3,4,6,8 и 9 заканчиваются Direct визитом и распределение в них не отличается от Last Non-Direct Click;
  • В цепочке 7 первым идет слабо управляемый канал трафика — органический поиск. Знание о том, что мы занизили его ценность плохо применимо на практике.

Здесь мы приходим к важным выводам. Для того, чтобы объективно оценить потенциал применения мультиканальной атрибуции необходимо рассматривать цепочки, удовлетворяющие следующим условиям:

  • Распределение ценности в цепочке должно отличаться от Last Non-Direct Click;
  • Управляемый канал трафика должен быть не последним в цепочке.

К управляемым каналам относятся, как минимум, платные источники трафика. Чтобы выделить такие последовательности, применим фильтр к цепочкам каналов:

В качестве регулярного выражения необходимо указать следующую строку:

(Paid Search|Display|Affiliates|unavailable|Email|Other).*>.*(Paid|Display|Affiliates|unavailable|Email|Social|Organic|Referral)

В переводе с регулярного выражения на русский язык здесь сказано, что в последовательностях должна встречаться цепочка из управляемого источника, а потом любого, кроме Direct. Соответствие групп каналов источникам подробно описано в справке.

После применения фильтра, мы получим только те цепочки, в которых распределение последовательности на управляемые каналы отличается от Last Non-Direct Click.

Обратите внимание:

  • В группировке каналов по умолчанию к unavailable отнесется весь не распознанный трафик с utm-метками, поэтому мы его тоже учитываем;
  • Если решите изменить регулярное выражение, не забудьте, что Google Analytics поддерживает синтаксис RE2. В нем не поддерживаются некоторые конструкции, например, исключения (?!re).

Теперь значение Conversion Value в отчете Top Conversion Paths нам покажет, что если учесть взаимное влияние каналов, то изменится распределение $19,7M, что составляет 40% доходов:

Перераспределение бюджета с учетом взаимного влияния каналов, по нашему опыту, дает прирост ROAS от 20 до 50% в данном сегменте.

В итоге дополнительную ценность от перераспределения бюджета можно оценить как

Дополнительный доход = Перераспределенный доход * Прирост ROAS

Перераспределенный доход — это доход, который при оценке каналов по модели Last Non-Direct Click не учитывает мультиканальное влияние и может быть перераспределен.

Прирост ROAS — это увеличение эффективности в данном сегменте дохода.

В нашем примере дополнительный доход составит:
$19.7M ∗ {20%; 50%} = от $3.8M до $9.6M в месяц.

Чтобы понять, насколько это важно для вашего проекта, подставьте свои цифры и спросите себя, как изменится ваше настроение, если при том же рекламном бюджете продажи упадут на эту сумму? А если увеличатся?

Принятые допущения

Перед применением полученных результатов следует остановиться на влиянии принятых допущений.

  • Multi-Funnel Channel отчеты в Google Analytics анализируют цепочки в рамках одного cookie (clientId). Поэтому если ваша модель использует объединение пользовательских цепочек на разных устройствах с помощью userId (например в Google BigQuery), то средняя длина цепочки возрастет и потенциальная дополнительная ценность станет еще выше;
  • Если вы заранее знаете, что уже исчерпали емкость определенных каналов, например брендовых каналов или узкоспециализированных площадок, их лучше отнести к неуправляемым каналам — увеличивать бюджет на них скорее всего не оправданно;
  • Самое главное: если после применения фильтра к цепочкам каналов вы получили предупреждение о семплировании — поздравляем, вас ждет бонус-трек!

1,000,000 — это достаточно большая выборка. Но так как она используется для построение большого числа небольших сегментов, то итоговая погрешность может быть колоссальной. Несемплированный результат может отличаться в несколько раз. Чтобы получить ответ необходимо исключить из отчета сегментацию по всевозможным разновидностям цепочек. К счастью, это можно сделать с помощью Multi-Channel Funnels API даже в стандартной версии Google Analytics.

Для этого создадим отчет со следующими параметрами:

Чтобы увидеть насколько группировка по каналам влияет на результат можете добавить в Dimensions: «mcf:sourceMediumPath,mcf:basicChannelGroupingPath».

Вот сравнение результатов с семплированием и без для проекта с посещаемостью порядка 500K сессий в день:

Применение полученных данных

Мы ответили на вопрос «Что нам это даст?». Следующий вопрос который за ним возникает — «Что нам с этим делать?».

В первую очередь поздравьте себя — у вашего проекта есть потенциал роста и возможность более эффективно вкладывать деньги в рекламу.

Следующее, что нужно сделать, это определить модель атрибуции, с помощью которой вы будете оценивать мультиканальные цепочки. Мы рекомендуем метод атрибуции на основе вероятностей прохождения воронки. В отличии от ассоциированных конверсий или смешанных моделей, он не атрибутирует больше, чем вы заработали и обеспечивает полностью прозрачные расчеты.

Порядок его применения и оценки мы подробно рассмотрим в отдельной статье. Главное, при оценке результатов любой мультиканальной модели атрибуции помнить общее правило: оценивать необходимо изменения в целом по сайту, а не в конкретном канале. Потому что как и у любого тренера, задача проекта максимизировать командный результат, а не индивидуальное достижение каждого игрока (кампании) в отдельности.

Вас также могут заинтересовать