Сбор данных о сессиях на основе алгоритма OWOX BI

21
782
Материалы для скачивания
978.32 Kb

Перемены бывают разные, поэтому некоторые люди их не любят. Но те изменения, о которых мы хотим вам рассказать, однозначно порадуют всех пользователей OWOX BI.

Возможно, вы уже слышали, что OWOX BI меняет логику, по которой собираются данные о сессиях. 1 марта мы закончили переход и вывели новый функционал в общий доступ. В этой статье мы расскажем подробнее, в чем заключаются изменения и чем они будут полезны для вашего бизнеса.

В чем суть

Раньше OWOX BI формировал таблицы с сессионными данными в Google BigQuery, используя только информацию о сессиях из Google Analytics. С одной стороны, это обеспечивало максимально соответствие данных в обоих источниках. С другой стороны, часть данных могла теряться по дороге с сайта в систему аналитики и облачное хранилище из-за ограничений Google Analytics Core Reporting API.

Чтобы это исправить, мы изменили алгоритм сбора данных о сессиях. Теперь данные о сессиях формируются на основе данных о хитах на стороне OWOX BI — на этот процесс больше не влияют лимиты Google Analytics. Благодаря такому решению вы можете собирать полные несемплированные данные о поведении пользователей на сайте и распределять их действия в правильные сессии. А теперь подробности.

1. Стройте отчеты без семплирования

Было: если посетители вашего сайта генерировали больше 500 тыс. сессий за отчетный период, Google Analytics (бесплатная версия) мог применить выборку. Как результат в ваш Google BigQuery попадали не все сессии, а только их определенная часть, рандомно выбранная системой.

Стало: пользователи OWOX BI получают в Google BigQuery сырые несемплированные данные о всех сессиях, независимо от объема трафика на их сайте и размера бизнеса.

2. Получите полные данные с точностью до хита

Было: если вы достигали ограничений Google Analytics на объем собираемых данных, система не обрабатывала данные сверх лимита, и они не попадали в Google BigQuery. Вот некоторые из таких ограничений: 200 тыс. хитов на пользователя в сутки, 10 млн хитов в месяц и 500 хитов на сессию. Также Google Analytics не фиксировал хиты, размер которых превышал 8 КБ.

Стало: у алгоритма OWOX BI нет перечисленных ограничений, а максимальный размер хита вдвое больше — 16 КБ. Это значит, что вы соберете данные о всех действиях пользователя, совершенных за время пребывания на сайте.

3. Получайте данные вовремя

Было: данные о сессиях могли обновляться повторно с задержкой более суток, так как зависели от обновления информации в API Google Analytics.

Стало: хиты формируются в сессии на стороне OWOX BI, поэтому сбор сессионной таблицы никогда не прервется из-за превышения лимитов или отсутствия доступа к Google Analytics. Данные быстрее попадают в BigQuery, что особенно важно, если вы используете их, например, для триггерных рассылок или часто обновляемых отчетов.

4. Точнее определяйте источник трафика

Было: в Google Analytics источник трафика определяется по модели Last Non-Direct Click (последнее непрямое взаимодействие). То есть, если прямой переход был последним в цепочке действий пользователя, то он игнорировался, а в источник записывался канал из последнего НЕпрямого взаимодействия.

Например, человек воспользовался google-поиском и нашел нужный товар у вас на сайте. Он запомнил ваш URL и через время ввел его в адресную строку. В результате источником для этой сессий записывается и передается в BigQuery google/organic, а вовсе не direct/none. Узнать, источником каких сессий действительно был прямой переход, в таком случае не получится.

Стало: алгоритм OWOX BI также использует для определения источника трафика модель Last Non-Direct Click. Однако, мы добавили в таблицу с данными о сессиях поле trafficSource.isTrueDirect, которое поможет вам при необходимости распознать прямой трафик. Это поле получает значение true, если сессия началась с прямого визита на сайт, и false, если она следует за сессией из платного источника. Благодаря этому вы можете отследить реальный вклад платных каналов в конверсии.

В Google Analytics поле isTrueDirect работает немного по-другому — оно принимает положительное значение не только, когда источником был direct, но и когда у двух сессий подряд совпадают сведения о кампании.

trafficSource.isTrueDirect

5. Отслеживайте путь пользователя на разных сайтах

Было: если у вас несколько сайтов и вы хотите отследить пересечение их аудиторий, можно настроить междоменное отслеживание в Google Analytics. Однако такое решение работает только в том случае, если пользователи перемещаются между вашими сайтами, используя перекрестные ссылки (т.е. с одного вашего сайта — на другой). Но что делать, если вы хотите проследить путь пользователя, который побывал на двух ваших сайтах в разное время и без кросс-ссылок? Мы об этом позаботились ↴

Стало: мы добавили в таблицу с сессионными данными OWOX User ID. Это анонимный идентификатор пользователя, с помощью которого вы сможете объединить действия пользователей на ваших сайтах, даже если они не связаны друг с другом прямыми ссылками. Также вы сможете, к примеру, исключить таких пользователей из рекламной аудитории, чтобы не платить дважды за один и тот же трафик.

OWOX User ID

6. Определите все события на сайте к правильным сессиям

Было: если вы отслеживаете события на сайте с помощью Measurement Protocol, то часть из них может потеряться. Дело в том, что в обеих версиях Google Analytics максимальное значение параметра &qt (разница между обращением и его отправкой) — 4 часа. Если значение больше 4 часов, событие не попадет ни в одну сессию. Например, ваш клиент совершил онлайн-платеж. Транзакция засчитается только после того, как придет подтверждение банка, а на это может уйти несколько дней. При этом транзакция не «приклеится» к нужной сессии, а значит источник, который привел к конверсии, оценен не будет.

Если параметр &qt отправлен вообще без значения, то для события автоматически будет создана отдельная сессия. В любом случае, это повредит точности ваших данных.

Стало: в сессиях на основе алгоритма OWOX BI лимит для параметра &qt составляет 30 дней. Это значит, что ваши события, отправленные через Measurement Protocol, будут определены к правильной сессии.

Другие отличия способов сбора сессионных данных

В новом алгоритме OWOX BI таблицы имеют такую же структуру, как и в старом. Отличаются только значения некоторых полей:

Как настроить сбор данных о сессиях по алгоритму OWOX BI

  • При создании новых потоков из Google Analytics в Google BigQuery сбор данных о сессиях на основе нового алгоритма включается автоматически.
  • Чтобы изменить алгоритм сбора данных о сессиях в уже созданных потоках, зайдите в настройки потока и включите сбор сессий «На основе данных о хитах».
  • После этого старый алгоритм сбора сессий станет недоступен и данные начнут собираться по новому алгоритму.
  • Вам больше не понадобится пользовательский параметр (custom dimension) на уровне сессий в Google Analytics. Вы можете удалить его в настройках своего GA и добавить другой необходимый вам параметр.
  • При этом обновлять код отслеживания OWOX BI на вашем сайте не нужно.
  • Для определения UTM-меток по авторазметке Google Ads (gclid) вам нужно настроить сбор отчетов с сырыми данными Google Ads в BigQuery. Это делается в один клик с помощью нативной интеграции Google Data Transfer.
  • Если у вас есть список исключений источников переходов (referral exclusion list) в Google Analytics, продублируйте его в настройках потока в OWOX BI.

Нужно ли менять запросы к таблицам в Google BigQuery?

Структура новых таблиц идентична структуре старых, поэтому кроме названия в запросах ничего менять не нужно. Чтобы адаптировать ваши существующие запросы к новым таблицам, достаточно заменить в них название старых таблиц session_streaming_ на новое owoxbi_sessions_.

Резюме

Стоит ли вам переходить на новый алгоритм сбора сессий от OWOX BI? Однозначно стоит, если вы ответите «Да» хотя бы на один из следующих вопросов:

  • Количество сессий на вашем сайте превышает 200 тыс. в сутки или приближается к этому числу?
  • Вы пользуетесь не только стандартными отчетами в Google Analytics и часто сталкиваетесь с семплированием данных?
  • Вы часто сталкиваетесь с лимитами в 500 хитов на сессию?
  • Вам важно отслеживать истинный direct traffic, но у вас нет Google Analytics 360?
  • Вы хотите объединить аудитории разных сайтов и анализировать их пересечение?
  • Вы хотите отправлять хиты с транзакциями в течение 30 дней, а не 4 часов?
  • Для вас важно получать данные с сессионными таблицам раньше?

Даже если сейчас эти вопросы кажутся вам неактуальными, вполне возможно, что вы столкнетесь с ними в ближайшем будущем. Так почему бы не подготовиться заранее?

Если у вас остались вопросы, задавайте их в комментариях — с радостью ответим. Если вы еще не пользуетесь OWOX BI Pipeline, но хотите попробовать, вы можете подписаться на 14-дневный бесплатный trial-период.

ПОЛУЧИТЬ TRIAL

Вас также могут заинтересовать