Модели атрибуции — подробный обзор и сравнение

183
7989
Материалы для скачивания
262.14 Kb

В этой статье мы рассмотрим основные принципы, плюсы и минусы большинства известных моделей атрибуции: от стандартных моделей из Google Analytics до Цепей Маркова и Вектора Шепли. Вы узнаете, как оценить взаимное влияние кампаний, а не только последний клик, и сможете выбрать модель, максимально подходящую вашему бизнесу.

Содержание

Зачем нужна атрибуция

Чтобы ответить на этот вопрос, давайте посмотрим на типичную воронку продаж. Она состоит из четырех основных этапов:

  1. Знакомство с брендом.
  2. Рассмотрение, когда пользователь уже знает о компании, но еще думает, стоит ли покупать — смотрит отзывы, сравнивает цены, выбирает продукт.
  3. Конверсия, то есть покупка.
  4. Удержание, то есть повторные покупки.

Большинство из вас наверняка знает, что удерживать клиентов намного дешевле, чем привлекать новых. На привлечение направлены менее персонализированные кампании. У них намного шире охват, их сложнее оценить.

На удержание, наоборот, направлены более целевые кампании, оценить эффективность которых намного легче, потому что мы уже знаем конкретного пользователя и можем связать все его покупки и взаимодействия с компанией.

Как же узнать, какие рекламные каналы и кампании и на каком этапе воронки срабатывают лучше всего? На этот вопрос помогает ответить атрибуция.

Атрибуция — это распределение ценности от конверсии между кампаниями, которые продвигали пользователя по воронке. Она помогает ответить на вопрос, в какой мере каждый из каналов повлиял на ту прибыль, которую вы получили в итоге.

‘‘

Половина денег, которые я трачу на рекламу, не приносит пользы. Проблема в том, что я не знаю, какая именно половина.

Джон Уонамейкер,
бизнесмен

Подобрав правильную модель атрибуции для своего бизнеса, вы сможете оптимально распределять рекламный бюджет и, как следствие, снизить расходы и увеличить доход. Давайте разберемся, кому какая модель подходит.

Какие модели атрибуции доступны на рынке

Существуют десятки возможных моделей атрибуции. Их можно классифицировать разными способами в зависимости от того, какая логика используется при расчете:

  • Например, если мы смотрим на то, какое место занимал канал в цепочке перед заказом, то речь про модели атрибуции на основе позиции (Time Decay, Position Based). Если же при расчете учитываются все данные, а не только позиция канала в цепочке, то это алгоритмические модели атрибуции (Data-Driven, Цепи Маркова).
  • Если мы отдаем всю ценность только одному каналу, который участвовал в воронке, то такие модели называются одноканальными (Last Click, First Click). Если ценность распределятся между всеми каналами в цепочке, то это — многоканальные модели атрибуции (Linear, Time Decay).

Давайте рассмотрим каждую модель подробнее.

Модели атрибуции на основе позиции канала в цепочке

Начнем с самых простых моделей атрибуции на основе позиции, которые доступны в бесплатной версии Google Analytics.

1. По первому клику (First Interaction или First Click)

Вся ценность, полученная от конверсии, атрибутируется на первый источник, который привел пользователя. Например, если у нас есть цепочка из 4 касаний, как показано ниже, по модели First Click вся ценность от конверсии уйдет CPC каналу.

First Click

Плюсы: легко настроить и использовать, так как нет никаких вычислений или аргументов относительно распределения ценности между каналами. Полезна для маркетологов, которые сосредоточены исключительно на формировании спроса и узнаваемости бренда.

Минусы: не показывает всю картину и переоценивает каналы верхнего уровня. В большинстве случаев пользователь делает несколько касаний перед покупкой, которые модель First Interaction полностью игнорирует.

Кому подходит: бизнесам, которые хотят повысить узнаваемость бренда и увеличить охват аудитории, а также понять, где покупать трафик, который потом конвертируется.

2. По последнему клику (Last Interaction или Last Click)

По этой модели вся ценность от конверсии достается последнему каналу, с которым соприкоснулся пользователь перед конверсией. Вклад остальных каналов все так же игнорируется. На нашем примере вся ценность достанется каналу Direct.

Last Click

Плюсы: популярная и привычная многим маркетологам модель. Идеальна для оценки кампаний, направленных на быстрые покупки, например, сезонных товаров.

Минусы: как и все одноканальные модели, игнорирует роль других источников в цепочке перед заказом.

Кому подходит: бизнесам с коротким циклом продаж, которые используют до трех рекламных каналов.

3. По последнему непрямому клику (Last Non-Direct Click)

В отчетах Google Analytics эта модель используется по умолчанию. Вся ценность конверсии присваивается последнему каналу в цепочке, НО, если это прямой заход (Direct), то ценность атрибутируется на предыдущий источник. Логика проста — если пользователь перешел к вам из закладок или ввел URL, то он, скорее всего, уже знаком с вашим брендом. То есть это уже привлеченные пользователи, и их не нужно брать в расчет.

Last Non-Direct Click

Плюсы: позволяет игнорировать незначительные с точки зрения рекламных расходов каналы и сосредоточиться на платных источниках. К тому же Last Non-Direct Click можно использовать как базовую для сравнения с другими моделями атрибуции.

Минусы: не учитывает вклад других каналов в конверсию. Кроме того, часто предпоследним источником в цепочке оказывается email. Мы понимаем, что этот пользователь откуда-то раньше приходил и оставил нам свой email. Используя Last Non-Direct Click, мы недооцениваем те источники, которые помогли пользователю ознакомиться с брендом, оставить свой email и в конечном итоге решиться на покупку.

Кому подходит: бизнесам, которые хотят оценить эффективность конкретного платного канала и которым уже не так важна узнаваемость бренда.

4. Линейная модель атрибуции (Linear model)

Еще одна очень простая модель — мы просто делим ценность от транзакции поровну между всеми источниками в цепочке.

Linear model

Плюсы: простая, но при этом более продвинутая, чем одноканальные модели атрибуции, так как учитывает все сессии перед заказом.

Минусы: бесполезна, если вам нужно перераспределить бюджет — делить его поровну между каналами не самый оптимальный вариант, так как они не могут быть одинаково эффективны.

Кому подходит: бизнесам с длинным циклом продаж, которым важно поддерживать контакт с клиентом на всех этапах воронки, например, B2B компаниям.

5. С учетом давности взаимодействия (Time Decay)

Ценность от транзакции распределяется между каналами по нарастающей. То есть источник, который был первым в цепочке, получает меньше всего ценности, а источник который был последним и по времени ближе всех к конверсии, получает больше всего ценности.

Time Decay

Плюсы: все каналы в цепочке не остаются обделенными и получают свой «кусок пирога». Причем больше всего получает тот, который все-таки подтолкнул пользователя к покупке, что справедливо.

Минусы: сильно недооценивается вклад источников, которые привели пользователя в воронку.

Кому подходит: тем, кто хочет оценить эффективность акционных рекламных кампаний, то есть ограниченных во времени.

6. На основе позиции (Position Based или U-образная)

БОльшую ценность — по 40% — получают два источника: тот, что познакомил пользователя с брендом и тот, что закрыл сделку. Оставшиеся 20% делятся поровну между всеми каналами в середине воронки.

Position Based

Плюсы: отдает наибольшую ценность каналам, которые в большинстве случаев играют самую важную роль — привлекают клиента и мотивируют совершить конверсию.

Минусы: иногда сессии в середине цепочки продвигают пользователя по воронке намного больше, чем кажется на первый взгляд. Например, помогают ему добавить товар в корзину, подписаться на рассылку или нажать «Следить за ценой». Модель Position Based такие сессии и их источники недооценивает.

Кому подходит: бизнесам, для которых одинаково важно как привлечь новую аудиторию, так и конвертировать в покупателей уже имеющихся пользователей.

В чем проблема стандартных моделей атрибуции

Согласно исследованию Ad Roll за 2017 год, 44% маркетологов в США и Европе используют атрибуцию по последнему клику. По нашему опыту для рынка СНГ этот процент еще больше. В то же время алгоритмические модели атрибуции на основе данных используют лишь 18% маркетологов.

При этом 72,4% тех, кто все еще использует Last Click, отмечают, что они не знают, почему это делают — так сложилось исторически. При выборе модели они отдали предпочтение той, которая выглядит самой простой и понятной, несмотря на то, что она недооценивает все сессии в цепочке, кроме последнего клика.

У происходящего, на наш взгляд, есть три основных причины:

  1. Недопонимание потенциального эффекта от более сложных моделей атрибуции. К примеру, если вам сказать, что при переходе на алгоритмическую модель вы увеличите доход на 20%, вы перейдете? Скорее всего, да.
  2. Нет одного человека, который бы отвечал за атрибуцию. В итоге разные маркетологи используют разные модели в рамках одной кампании. В итоге общий атрибутированный доход получается больше реального дохода, который заработал бизнес.
  3. Разрозненные данные. Модели, доступны в Google Analytics, безусловно удобны — все данные в одной системе, можно использовать стандартные отчеты. Однако эти отчеты ничего не скажут вам об офлайн-данных, об исполняемости ваших заказов, о ROPO-эффекте.

Устранив эти причины, решить задачу атрибуции будет намного проще.

У Google Ads, Double Click и некоторых других сервисов тоже есть собственные модели атрибуции. Их общий недостаток в том, что по сути вы можете использовать для расчетов только внутренние данные сервиса.

Алгоритмические модели атрибуции

Представьте, что вы занимаетесь контекстом, настраиваете рекламу в Google Ads или Facebook. Оценка по последнему непрямому клику покажет, работает эта кампания или нет. Как аудитория на нее откликается. Внутри рекламного кабинета или Google Analytics использовать сложные модели атрибуции не имеет смысла.

Но, если вы хотите оценить взаимное влияние друг на друга всех своих источников, то тут уже нужно объединять в одной системе данные из разных рекламных сервисов, Google Analytics, CRM и использовать более сложные модели атрибуции. Благодаря этому вы узнаете, какие связки рекламных каналов хорошо работают вместе и на каких этапах.

К алгоритмическим моделям атрибуции относятся Data-Driven в Google Analytics 360, Цепи Маркова, OWOX BI Attribution и кастомные алгоритмы.

1. Атрибуция на основе данных (Data-Driven Attribution)

Пользователям платной версии Google Analytics доступна модель атрибуции на основе данных. Все описанные выше модели атрибуции, используют правила, которые задает система веб-аналитики или вы сами. В отличие от них, у модели Data-Driven нет заранее заданных правил — она рассчитывает ценность каналов, используя ваши данные и Вектор Шепли.

Особенность модели на основе данных в том, что она не учитывает порядок канала в цепочке, а оценивает в общем, как повлияло на конверсию присутствие этого канала. Если вы измените порядок сессий, то ценность каналов по Вектору Шепли никак не поменяется.

Data-Driven Attribution

Согласно Википедии, Вектор Шепли — это принцип оптимальности распределения выигрыша между игроками в задачах теории кооперативных игр. Представляет собой распределение, в котором выигрыш каждого игрока равен его среднему вкладу в благосостояние тотальной коалиции.

Чтобы понять, как работает Data-Driven, рассмотрим конкретный пример. Допустим, у нас есть две цепочки, которые привели к транзакциям:

  1. Facebook → Direct → Транзакция на $500.
  2. Direct → Транзакция на $300.

Мы специально взяли для примера короткие цепочки, чтобы не усложнять и без того сложную формулу.

Теперь определим, какую сумму принес каждый канал в отдельности и оба вместе:

V1 (Facebook + Direct) = $500
V2 (Direct) = $300
V3 (Facebook) = 0

Ценность канала по Вектору Шепли рассчитывается с помощью такой формулы:

Формула Вектора Шепли

Где:
n — количество игроков (в нашем случае это рекламные каналы).
v — ценность, которую принес источник.
k — количество участников коалиции K.

Если мы вставим в эту формулу значения из нашего примера, то получим следующее:

Ф1 = (1 - 1)! * (2 - 1)! / 2! * (0 - 0) + (2 - 1)! * (2 - 2)! / 2! * ($500 - $300) = 0 + $100 = $100
Ф2 = (1 - 1)! * (2 - 1)! / 2! * (300 - 0) + (2 - 1)! * (2 - 2)! * ($500 - 0) = $150 + $250 = $400

Ф1 — это ценность канала Facebook.
Ф2 — ценность канала Direct.

А теперь простыми словами, для тех кого напугали формулы :) Начнем с Facebook.
Этот канал сам по себе нам ничего не принес, поэтому первое слагаемое у нас будет 0.

Facebook вместе с Direct принесли $500, а Direct самостоятельно принес $300. Мы отнимаем от суммы, которую принесла коалиция каналов, деньги, заработанные директом, и делим результат на два. Получается: ($500 - $300) / 2 = $100. Это второе слагаемое.

Теперь складываем: 0 + $100 = 100$ — это ценность канала Facebook.

Теперь считаем ценность канала Direct. Самостоятельно он принес $300, делим это на два и получаем $150. Коалиция Facebook + Direc принесла $500, делим это на два и получаем $250. Складываем эти цифры и получаем $400 — ценность канала Direct.

Подробнее о том, как работает Вектор Шепли, вы можете посмотреть в видеоролике от Coursera.

Плюсы: максимально объективная и достоверная модель, так как для оценки каналов используются ваши собственные данные.

Минусы: для расчета необходимо иметь в Google Analytics достаточный объем данных, поэтому модель подходит не для всех компаний. Не оценивает продвижение по воронке, нельзя подключить офлайн-данные из CRM и посмотреть детальную информацию по каждой транзакции.

Кому подходит: всем, кто хочет узнать, какие кампании и ключевые слова работают максимально эффективно, и использовать эту информацию для распределения маркетингового бюджета. Не подойдет бизнесам, которым важно знать не только ценность, но и позицию канала в цепочке.

2. Атрибуция на основе Цепей Маркова (Markov Chains)

Согласно Википедии, Цепь Маркова — это последовательность случайных событий с конечным или счетным числом исходов, характеризующаяся тем, что при фиксированном настоящем будущее независимо от прошлого.

Изначально Цепи Маркова использовались, чтобы решать задачи с прогнозированием (погода, букмекерские конторы и т.д.). Использовать их для оценки рекламных кампаний начали относительно недавно — с развитием digital рынка. Атрибуция на основе Цепей Маркова помогает ответить на вопрос, как отсутствие канала повлияет на конверсию.

Чтобы понять, как работают Цепи Маркова, рассмотрим конкретный пример из Ecommerce. Допустим, у нас есть три цепочки:

  • С1 → C2 → C3 → Покупка.
  • C1 → Неуспешная конверсия.
  • C2 → C3 → Неуспешная конверсия.

    С1, C2 и C3 — это сессии с тремя разными источниками, например, Google CPC, Facebook и Email.

    Заполняем такую таблицу:

    В первом столбце у нас путь клиента — три цепочки из примера. Во втором столбце — то, как путь клиента будет выглядеть внутри модели. Мы добавили вход в воронку (нулевой этап Старт) и выход из воронки (Конверсия или null — неудачная конверсия). В третьем столбце мы разбили каналы попарно, так как нужно оценить все возможные переходы с одного шага на следующий.

    Затем нам нужно рассчитать вероятности для каждого из возможных вариантов перехода и занести их в отдельную таблицу. Эти цифры считаются эмпирически, то есть анализируются реальные данные о действиях пользователей, например из вашего Google Analytics. Делается это при помощи программирования, например, через R или Python.

    Цифры в таблице выше приведены для примера. Чтобы было понятно, что это за цифры, отобразим их на графике:

    Цепь Маркова

    Итак, мы видим все возможные варианты перехода для нашего примера. Все начинается с этапа Старт (start). Затем треть пользователей идет на канал С2, а две трети — на C1. Дальше половина пользователей с канала C1 покидает воронку, а другая половина идет на C2, потом на C3 и наконец совершает покупку. И еще несколько вариантов — перечислять их не будем, думаем, вам понятен принцип.

    Обратите внимание, что в нашем примере, путей к конверсии по сути всего два и оба они проходят через канал C2.

    Как оцениваются такие сессии? При помощи эффекта удаления. То есть мы удаляем по очереди каждый из источников и смотрим, как его отсутствие скажется на количестве конверсий:

    Например, если мы уберем из нашего примера источник C1, то потеряем 50% конверсий. Как получилась эта цифра?

    Расчет ценность каналов проводится в три этапа:

    1. Сначала нам нужно посчитать вероятность совершения конверсий для каждого из каналов. Точнее, сколько конверсий мы получим, если убрать из цепочки, конкретный канал.

    Вероятности конверсии (Р) для каждого канала считаются по следующей формуле:

    P1 = (0,33 * 1 * 0,5) = 0,167
    P2 = (0,33 * 0 * 0,5) = 0
    P3 = (0,33 * 1 * 0) = 0

    Давайте разберем подробнее первую формулу — это у нас вероятность конверсии для канала C1. Мы убрали из модели канал C1 и перемножили все оставшиеся вероятности перехода из цепочек, которые ведут к покупке. То есть умножили 33,3% на 100% и на 50%, только не в процентном, а в числовом формате. В результате у нас получилось 0,167 или 16,7% — столько конверсий мы получим, если убрать из воронки источник С1.

    Если мы уберем каналы C2 и C3, то у нас вообще не будет конверсий.

    2. Затем определяем эффект удаления (R) для каждого канала. Этот коэффициент показывает, сколько конверсий мы потеряем, если удалим канал из воронки, и считается так: от единицы (т.е.100%) отнимается вероятность конверсии (P), деленная на количество пользователей в начале цепочки (вероятность перехода).

    R1 = 1 - 0,167/0,33 = 0,5
    R2 = 1 - 0 = 1
    R3 = 1 - 0 = 1

    3. И наконец считаем ценность (V) каждого канала. Берем процент потерянных конверсий (R) и делим его на сумму всех коэффициентов (R1, R2 и R3)

    V1 = 0,5 / (0,5 + 1 + 1) = 0,2
    V2 = 1 / (0,5 + 1 + 1) = 0,4
    V3 = 1 / (0,5 + 1 + 1) = 0,4

    Плюсы: модель атрибуции на основе Цепей Маркова позволяет оценить взаимное влияние каналов на конверсию и узнать, какой канал самый значимый.

    Минусы: недооценивает первый канал в цепочке, требует навыков программирования.

    Кому подходит: бизнесам, у которых все данные собраны в единой системе.

    3. OWOX BI Attribution

    OWOX BI Attribution помогает оценить взаимное влияние каналов на конверсию и продвижение пользователя по воронке.

    Раньше ценность каналов рассчитывалась по собственному алгоритму OWOX BI. А с недавнего времени мы начали использовать в расчетах атрибуции Цепи Маркова. Скоро мы опубликуем подробную статью на эту тему, где опишем все изменения и преимущества нового алгоритма. А пока вы можете попробовать, как работает наша обновленная атрибуция, подписавшись на бесплатный trial-период.

    ПОПРОБОВАТЬ OWOX BI

    В модели OWOX BI Attribution вы можете использовать следующую информацию:

    • Данные о поведении пользователей из Google Analytics, собранные в Google BigQuery с помощью стандартного экспорта из GA 360 или с помощью OWOX BI Pipeline.
    • Данные из любых рекламных сервисов, которые вы используете.
    • Данные из вашей внутренней CRM-системы.

    Все эти данные можно анализировать в комплексе и использовать для настройки шагов воронки (по умолчанию используется воронка Enhanced Ecommerce). Вы можете добавить любые шаги, например, транзакции из СRM и любые другие онлайн- и офлайн-события (звонки, встречи и т.д).

    Воронка в OWOX BI Attribution

    Кроме того мы используем данные из CRM, чтобы сделать аналитику сквозной. То есть мы с помощью одного идентификатора связываем действия пользователя в мобильном приложении, на десктопе, на любых других устройствах, чтобы понимать, что это был один конкретный пользователь. В результате вы получите полную картину взаимодействия пользователя с вашим бизнесом и учтете влияние всех рекламных каналов на конверсию.

    Плюсы: позволяет найти эффективный канал и сказать, где именно он эффективен. Нет ограничений на минимальный объем данных. Определяет новых и вернувшихся пользователей и показывает детальную информацию по каждой транзакции: какая сессия, source/medium и действия пользователя на воронке к ней привели. Может учитывать маржу и исполняемость заказов из CRM.

    Также вы можете сравнить эффективность рекламы по вашей текущей модели атрибуции и по модели OWOX BI Attribution и увидеть недооцененные или переоцененные кампании.

    Минусы: недооценивает первый шаг воронки.

    Кому подходит: всем, кто хочет учитывать каждый шаг пользователя в воронке и честно оценивать рекламные каналы.

    Краткие выводы

    Согласно все тому же исследованию Ad Roll за 2017, 70% маркетологов затрудняются применять результаты атрибуции. Но без применения результатов атрибуция не имеет смысла!

    Неважно, какие у вас есть отчеты в Google Sheets или Google Data Studio — если вы не распределяете бюджет на основе этих данных и ничего не меняете в своей стратегии, то толку от этих отчетов немного.

    Всем, кто хочет узнать реальную эффективность своего маркетинга, мы рекомендуем:

    • Поставить перед собой четкую задачу: по каким KPI вы хотите оценивать, как должны выглядеть отчеты и дашборды.
    • Определить, кто отвечает за оценку рекламных кампаний в вашей компании.
    • Определить путь ваших пользователей.
    • Учитывать не только онлайн-, но и офлайн-данные
    • Убедиться в качестве входящих данных: проверить нет ли на сайте задвоенных транзакций, отслеживается ли каждый шаг, который вы хотите учитывать в воронке.
    • Попробовать и сравнить разные модели атрибуции и найти гибкое решение, оптимальное для вашего бизнеса.
    • Принимать решения на основе данных.

    Если вы не нашли в этой статье модель атрибуции, подходящую для вашего проекта, вы можете настроить кастомную модель, например, как это сделала компания Answear. Пишите нам на mail@owox.com — с радостью поможем вам настроить атрибуцию. Если у вас остались вопросы, вы можете задать их в комментариях.

    Вебинар по моделям атрибуции

    Использованные инструменты

    Вас также могут заинтересовать