Как увеличить продажи и ROI с помощью данных и машинного обучения

В e-commerce и мобильных играх, а также в других индустриях с относительно большим количеством сигналов, достаточно данных для обучения алгоритмов рекламных сетей. Поэтому стандартные подходы в рекламных площадках таких как Google, Facebook и Яндекс позволяют эффективно таргетировать и привлекать целевую аудиторию.

Во многих других индустриях целевая конверсия на порядки меньше и количество привлекаемых клиентов значительно ниже, чем из традиционных каналов. В такой ситуации очень важно работать с данными и использовать машинное обучение на стороне рекламодателя.

О том, какие возможности открывает ML для онлайн-маркетинга, мы побеседовали с Константином Баяндиным, основателем AdTech стартапа Tomi.ai.

Наши клиенты
растут на 22% быстрее

Растите быстрее, анализируя, что лучше сработает в вашем маркетинге

Измеряйте KPI, находите зоны роста и увеличивайте свой ROI

Записаться на демо

Расскажите о своем продукте Tomi.ai. Как вы пришли к его созданию?

Я работал CMO в OZON.ru, выстраивал там data-driven маркетинг, дополнительно руководил отделом аналитики и Data Science. Затем я переехал в США работать в компании Compass — это очень технологическая компания в сфере недвижимости. Перейдя из онлайн-рекламы и ecommerce в недвижимость, я был шокирован тем, насколько сложно заниматься маркетингом в этой индустрии. Основная проблема заключается в малом количестве финальных конверсий. Люди очень редко покупают квартиры или дома, например, в США происходит 5 млн покупок за год на всю страну.

Конверсия очень редкая. Грубо говоря, на 10 тысяч посетителей сайта приходится только одна покупка дома или квартиры, то есть конверсия в покупку 0.01%. Поэтому маркетологи в недвижимости не могут использовать автостратегии Google и Facebook, smart bidding. Они вынуждены либо максимизировать количество кликов, либо оптимизировать промежуточные конверсии на сайте, например, сбор контактов. Ценность этих конверсий не всегда понятна — люди часто оставляют контакты по причинам, не связанным с покупкой.

Почему вообще в некоторых индустриях сложно заниматься онлайн-маркетингом? Почему там получаются низкие конверсии и плохой ROI? У этого, на мой взгляд, 5 ключевых причин:

  1. Специфика аудитории. Как бы маркетолог ни старался, только 5% людей в ближайшие 12 месяцев что-нибудь купят или продадут в недвижимости.
  2. Офлайн компонента. Например, в недвижимости до сих пор необходимо подписывать договор на бумаге.
  3. Длинный цикл продаж. Люди выбирают автомобиль или квартиру неделями или месяцами и саму покупку осуществляют за пару недель.
  4. Крупные транзакции. Все вышеперечисленное зачастую может стоить очень дорого. И чем выше сумма, тем больше людям нужно времени для принятия решения.
  5. Регулирование. Оно присутствует не во всех вертикалях, но актуально для недвижимости и финансов. В США есть много законов, чтобы обеспечить равный доступ людей к жилью и кредиту. Например, есть Fair Housing Protection Act, одно из положений которого запрещает большую часть таргетингов в недвижимости (пол, возраст, раса, гео).

Если в вашем бизнесе есть хотя бы три компонента из перечисленных пяти, наверняка у вас низкая конверсия. В таком случае вам нужно очень аккуратно работать с данными, использовать машинное обучение, чтобы замкнуть цикл обратной связи от транзакций, которые происходят через какое-то время, с тем спросом, который есть в верхней части воронки.

Поэтому у меня появилась идея создать сервис, который бы при помощи машинного обучения и поведенческих данных посетителей сайта предсказывал их вероятность покупки в будущем. Tomi.ai — это платформа, которая помогает онлайн-маркетологам увеличить ROI от рекламы более чем в 2 раза с помощью ML, данных клиента и API интеграций. Это возможно в индустриях, где сложно делать онлайн-маркетинг: недвижимость, финансы, страхование, SaaS и образование (если у вас есть free trial).

Для наших клиентов из таких сложных индустрий мы загружаем предиктивный score в их рекламные кабинеты в качестве синтетической конверсии со значением ожидаемой ценности. То есть рассчитываем, какой ожидаемый доход принесут люди с определенным уровнем взаимодействия с сайтом. Называем это продажей, которая как будто уже произошла, и максимизируем эту метрику. В итоге клиенты могут показывать рекламу на высокововлеченных пользователей с высокой ожидаемой суммой продаж в будущем.

Насколько важно машинное обучение для онлайн-маркетинга?

Машинное обучение — это движок онлайн-маркетинга. Я считаю, что маркетологи в конце концов должны в какой-то степени стать аналитиками и дата-сайентистами, потому что операции в онлайн-маркетинге — это во многом задачи оптимизации в математике. Нужно что-то увеличить, например выручку, при ограничениях по бюджету, каналам и т.д.

Вся идея применения машинного обучения в онлайн-маркетинге заключается в том, чтобы работать над циклом обратной связи от продаж до самого верха воронки:

На всех этапах воронки можно строить предиктивные модели и пытаться предсказывать по раннему поведению пользователей, кто из них имеет бОльшие шансы сконвертироваться в будущем, бОльшую возможность что-то купить. Перевести это все на язык вероятности покупки и на язык ожидаемых продаж в денежном выражении.

Задача людей, которые занимаются технологиями в маркетинге, заключается в том, чтобы придумать, как замкнуть эту цепочку, как сделать value-based look-alike аудитории на основе LTV, которое получается на таких моделях. Как управлять биддингом в рекламных платформах не на основе конечных конверсий, которые происходят очень редко, а на основе ранних сигналов и микроконверсий, которые происходят в самом начале и которые машинное обучение приводит к одному знаменателю в виде ожидаемых конверсий и продаж.

Зачем маркетологам машинное обучение?

Если Google, Facebook и Яндекс на своей стороне уже имеют машинное обучение, зачем маркетологам этим заниматься?

Во-первых, ML расширяет сигнал.

Обычно, при низкой конверсии на сайте происходит много сессий. Например, какой-нибудь не очень крупный ecommerce-проект получает конверсию 2%. Это значит, что из 100 сессий всего 2 будут иметь не нулевую ценность. Их сила сигнала равна 100%.

Благодаря машинному обучению можно по ранним событиям, которые происходят в каждой сессии, понять вероятность конверсии и назначить этой сессии ненулевую ценность. Условно можно выделить 25% посетителей сайта, и у них будет разный сигнал — от 2% до 10%. Получается, что сигнал становится слабее, но он охватывает бОльшую аудиторию, и на основе этого уже можно создавать сегменты.

Во-вторых, ML позволяет рассчитать ожидаемый инкрементальный LTV.

Это позволяет понять, насколько хорошо работает кампания и принесет ли она необходимую ценность, даже до того, как настоящие конверсии произошли.

В-третьих, dLTV можно использовать для оптимизации ставок в рекламе.

Вы можете оптимизировать биддинг, понимая, какой ожидаемый результат может принести кампания, благодаря атрибуции, сделанной через машинное обучение.

Как машинное обучение помогает повысить продажи и ROI?

Допустим, вы запускаете рекламу в Google и у вас есть много ключевых слов. Вы потратили на каждый ключевик какое-то количество денег и получили какое-то количество продаж. Продажи поделили на деньги и получили ROI. Все эти ключевики вы отсортировали по убыванию ROI и разместили 100% затрат (это кумулятивные затраты) на оси X, а на оси Y разместили всю получаемую пользу в виде продаж или прибыли. Получится вот такая «кривая эффективности»:

Работа маркетинговых технологий заключается в том, чтобы снизить ставки на лишние элементы управления, в данном случае — ключевики, которые дают ROI хуже, чем вы ожидаете. Вы не можете себе позволить инвестировать в эти слова, поэтому там можно уменьшить бюджет.

Применяя новые подходы, вы можете изменить саму кривую эффективности. Сделать так, что при тех же самых инвестициях, в те же ключевики вы будете достигать большего результата. Например, в OZON.ru мы еще в 2016 году использовали в поиске бид-модификаторы на основе модели машинного обучения и тем самым помогали Яндексу и Google приводить более качественную повторную аудиторию на эти ключевики.

Ваш доход вырос, ваш marginal ROI стал лучше, чем ваша целевая отдача от инвестиций и поэтому вы можете находить новые возможности. Например, инвестировать в новые ключевики и увеличить затраты, чтобы достичь большего результата при заданном целевом значении ROI.

Таким образом технологии и данные вместе с машинным обучением помогают увеличить продажи компании.

Кто-то еще на рынке делает что-то подобное?

Наверное, в таких индустриях, как недвижимость, финансы и SaaS мы были первыми. До нас похожие вещи делались игровиками, то есть сама идея скорить пользователей и использовать этот score для оптимизации пришла из индустрии мобильных игр. Мобильные игры часто бывают бесплатными, но внутри игры можно делать какие-то покупки. 1% донатеров оплачивает игру для всех остальных игроков, и маркетологи мобильных игр заинтересованы в поиске таких «китов».

Все игры такого толка заточены на то, чтобы растить долю тех, кто платит и платит много. А самое главное — идентифицировать тех, кто будет много платить. Поэтому в этой индустрии продуктовые менеджеры уже давно считают и ориентируются на LTV.

Это мобильные игры — у них уже были интеграции с Google, а потом и Facebook по передаче офлайн-событий. Маркетологи брали один-два первых дня игры пользователя и на исторических данных коррелировали, насколько высоки шансы, что этот человек станет «китом». Делали такую синтетическую конверсию как quality install (качественная установка), отправляли это событие в Google UAC и оптимизировали рекламу уже не просто под установки, а под качественные установки.

Как вы собираете данные в Tomi.ai?

Мы делаем стандартные интеграции с нашими клиентами:

  1. Нужно установить на сайт пиксель Tomi.ai, который собирает поведенческие данные — на какие страницы заходит пользователь, как долго на них находится, куда кликает. Машинное обучение все эти сигналы перебирает и находит те, которые наиболее сильно предсказывают будущую конверсию. Например, люди, которым действительно нужно купить дом, используют калькулятор ипотеки, смотрят, какие школы находятся рядом (в США это важно) и т.д. Разнообразные факторы в совокупности дают те переменные, на основе которых машинное обучение предсказывает вероятность конверсии в покупку.
  2. Мы делаем CRM интеграцию, то есть просим у клиентов предоставить фид транзакций, которые произошли (исторические данные). Благодаря анонимным идентификаторам через хэши электронных почт и телефонов, которые люди оставили на сайте, мы можем связать транзакции в офлайне с тем, что люди делали в онлайне. На исторической выборке в месяц или больше мы обучаем наши модели на предмет того, как люди себя ведут и с какой вероятностью потом покупают.
  3. Третье, что мы делаем — это про то, как передать данные обратно в рекламные кабинеты. Мы просим у клиентов доступ к маркетинг API, чтобы подключиться и загружать конверсии и предиктивные аудитории в Google и Facebook.

Сколько должно быть данных для обучения модели?

Самое главное в машинном обучении — сколько положительных исходов произошло. Неважно, сколько было кликов на сайт и т.д. Важно, сколько конверсий мы смогли поймать. Теоретически достаточно 20 покупок, но практически мы с клиентами стараемся набрать как минимум 100 покупок, которые удалось связать с онлайн-поведением. А вообще, мы стараемся обучать модель на нескольких сотнях-тысячах покупок. Нам важно, чтобы за первый месяц нашей работы, когда мы собираем данные (или больше, если совсем мало конверсий), мы набрали хотя бы первую сотню положительных исходов.

Есть ли какие-то критерии к качеству данных для работы ML модели?

По нашему опыту, самое важное в качестве данных — какую долю заказов в офлайне мы можем связать с онлайном. Нужно не просто настроить интеграцию между сайтом и CRM, а собирать анонимизированные cookie идентификаторы. Обычно для этого используют Google Analytics ID. Нужно собирать Google Analytics ID пользователей и потом протягивать этот идентификатор в CRM по всем дальнейшим шагам: квалификация лида, ведение продажи, заключение договора и т.д.

Машинному обучению, в принципе, не так важно, какое качество данных внутри одной таблицы. Для ML важно, чтобы связь между таблицами была качественной.

The value of data is not in the data, it is between the data.

То есть ценность данных не в том, что у вас есть таблицы, а в том, что вы можете соединить несколько таблиц вместе и получить дополнительную ценность. Умение связывать таблицы онлайн-поведения с таблицей заказов для маркетологов очень важно.

Для работы с машинным обучением важно собирать качественные данные и правильно их объединять. Поэтому мы в OWOX BI уделяем особое внимание полноте и качеству данных, чтобы наши клиенты могли им доверять.

При импорте расходов OWOX BI проверяет UTM-метки в кампаниях и сообщает о возможных ошибках, распознает динамические параметры, конвертирует расходы в единую валюту, следит за актуальностью данных и предоставляет их автоматический мониторинг. Вы получаете полные данные из рекламных кабинетов, сайта и приложения в вашем проекте и под вашим контролем.

Как понять, что компании пора использовать машинное обучение?

Если рекламные кампании никогда не выходят из фазы обучения, а это может происходить при очень редких конверсиях, то вам точно надо что-то делать с использованием ML.

Если вы до сих пор максимизируете количество кликов на сайте, точно нужно что-то делать по-другому. Если оптимизируете рекламу на сбор контактов, а их качество плохое (только 5-10% контактов конвертируются в продажу), есть большая вероятность, что машинным обучением можно улучшить текущий подход.