Почему в direct попадает другой трафик и как это исправить

26
2401

Если ваш direct трафик Сеансы, когда пользователь ввел URL сайта в адресной строке или использовал закладку выше 30%, не спешите открывать шампанское и отмечать потрясающую узнаваемость компании. Вполне возможно, что Google Analytics определил в direct трафик посещения сайта, которые на самом деле к нему не относятся.

Почему так происходит? Причины могут быть техническими (обрывы сессий, редиректы и т.д.) и технологическими (переходы на сайт из мобильных приложений, email, мессенджеров и т.д.).

К какой проблеме это приводит? Невозможно правильно оценить эффективность источников трафика, которые ошибочно записываются в direct.

В этой статье вы узнаете, как найти и устранить недочеты, которые искажают статистику по источникам трафика в GA.

Причины, по которым GA определяет сессии в direct трафик

Google Analytics ищет информацию об источниках трафика в следующей последовательности:

  1. Сначала GA проверяет наличие Adwords/DoubleClick тегов ( gclid Параметр автоматической пометки AdWords. Добавляется в URL целевой страницы, когда пользователь нажимает на объявление / gclsrc Параметр автоматической пометки DoubleClick Search ).
  2. Затем — наличие UTM-меток Переменная, которая добавляется в URL и позволяет системе веб-аналитики получить дополнительную информацию об источнике трафика (UTM_source/UTM_medium и т.д.). Подробнее о UTM-метках читайте в нашей статье.
  3. После ищет HTTP referrer В протоколе HTTP один из заголовков запроса клиента. Содержит URL источника запроса .
  4. И наконец, Google Analytics пытается идентифицировать пользователя по clientID или userID, проверяя совпадение за последние 4 часа, и привязать данные о хите к последней сессии пользователя. Например, пользователь перешел на сайт из рекламного объявления и через 2 часа купил товар в офлайн-магазине. Если данные о покупке отправляются в Google Analytics через Measurement Protocol и пользователя удается распознать по userID, хит (совершенная транзакция) будет засчитан в последнюю онлайн-сессию пользователя, у которой уже есть источник трафика (в нашем примере — google/cpc).

Чтобы определить источник трафика, достаточно одного из этих параметров. Если ничего из перечисленного не найдено, GA записывает источник трафика — direct.

Детальная схема обработки данных описана в справке GA.

По нашему опыту, в крупных проектах в direct попадает до 15% сессий, которые на самом деле к нему не относятся. Причины происходящего можно условно разделить на три группы: сессии, при которых не передается реферер, обрывы сессий и другое.

Не передается реферер

HTTP Referer — в протоколе HTTP один из заголовков запроса клиента. Содержит URL источника запроса. Если перейти с одной страницы на другую, то referer второй страницы будет содержать адрес первой страницы.

Реферер не передается в таких случаях:

  1. Переходы по ссылкам из оффлайновых документов: PDF, Word, Power Point и т.д.
  2. Переходы из мобильных и стационарных приложений: Skype, Viber, Facebook, VK, Google Search и т.д.
  3. Переходы из Email: Microsoft Outlook, Thunderbird и т.д.
  4. Отправка данных по Measurement Protocol без указания source/medium.
  5. Редиректы без передачи HTTP заголовка или UTM-меток в ссылке. Например, пользователь зашел по ссылке site.com, но система перенаправила его на site.ru. Если при редиректе не передавать HTTP заголовок (в т.ч. реферер, который привел посетителя на сайт, например, facebook.com) или UTM-метку в конечной ссылке (google.ru/?UTM_source=facebook&UTM_medium=cpc), то данный трафик будет попадать в direct. Чаще всего эта ошибка возникает, если вы делаете редиректы на стороне клиента (с помощью javascript).
  6. Переходы c HTTPS на HTTP страницы (согласно п. 5.5.2 в стандартах работы Web). Например, если у вас сайт на HTTP, то переходы без UTM-меток c https://www.youtube.com/ будут засчитываться в direct, потому что зашифрованный протокол передачи данных HTTPS не передает реферер.
  7. Посетитель включил настройки приватности браузера (режим инкогнито) и дополнения для блокировки скриптов вроде ScriptSafe (установить можно здесь) и других.
  8. Ошибки в коде. Иногда ошибки в скриптах могут обновлять куки, и этот трафик будет записываться в direct. Также при указании в коде ссылки <а href=..> атрибута ‘rel=noreferrer’ реферер передаваться не будет.
  9. Ошибки, когда браузер не передает реферер. Например в IE8 теряется реферер при использовании редирект метода Javascript:location.href и Meta refresh — 0. Также Internet Explorer теряет реферер, когда пользователь нажимает на ссылку, которая использует JS метод window.open или когда пользователь нажимает на линк, вставленный во Flash приложение.
  10. Неправильная UTM-разметка кампании (например, UTMSource вместо UTM_source). Если у ссылки есть UTM-метка, то GA игнорирует реферер. В тех случаях, где разметка ссылки не соответствует справке, визиты будут записывать в direct.

Обрывы сессии

Пользовательские сессии могут обрываться в следующих случаях:

  1. Отсутствие GA/GTM кода на посадочных страницах сайта. При переходе с посадочной страницы без GA кода на следующую страницу вашего сайта в реферер запишется собственный URL и UTM-меток уже не будет. GA запишет эту сессию в direct (если собственный домен добавлен в «Список исключаемых источников перехода») или в referral (если не добавлен).
  2. Авторизация через социальную сеть с полным переходом на нее вместо авторизации через всплывающее окно.
  3. Медленно загружается код GA — пользователь переходит на следующую страницу сайта до загрузки кода.
  4. Отправка хита весом более 8 кбайт на посадочной странице. Хит не будет отправляться в GA, соответственно сессия будет обрываться.
  5. Некорректная настройка кросс-доменного отслеживания.

Другие причины, которые искажают данные по direct трафику

Посещения сайта сотрудниками компании. Их можно исключать по IP адресам, специальным cookies на корпоративных/промежуточных страницах, с помощью расширений в браузерах или фильтров в Google Analytics.

Посещения сайта ботами. Найти IP-адреса ботов можно в логах сайта или с помощью OWOX BI Pipeline, собрав данные об активности на сайте в Google BigQuery. Вычислять ботов рекомендуем:

  1. По поведению на сайте. Например, время визита до 2 секунд, отсутствие транзакций, высокий показатель отказов и т.д.
  2. По User Agent (браузеры, провайдеры, локация, устройства). Например, один провайдер (site.ru), один регион (Москва, Россия).

Краткие рекомендации по поиску проблем

Определив проблемы с direct трафиком, вы сможете исправить статистику по источникам трафика и, соответственно, точнее оценивать ROAS.

Как решить проблемы с передачей referrer:

Как найти проблемы с обрывами сессий:

  • С помощью консоли разработчика и GA debugger.
  • С помощью записей сессий в Google Tag Assistant.
  • Проверить наличие GA/GTM кода на страницах сайта, используя Screaming Frog или другие сервисы.

Мы подготовили наглядное руководство, как найти проблемы с direct трафиком, и  готовы поделиться. Укажите email, на который вам его отправить.

Вас также могут заинтересовать