Расскажите о вашей задаче
Аналитика

Как без ошибок объединять данные в Google Data Studio

Привет, с вами по-прежнему Павел Мрыкин, эксперт по сквозной аналитике в Calltouch.

На сегодняшний день я являюсь не только отъявленным приверженцем готовых инструментов по созданию отчётности и внедрению сквозной аналитики, но также продолжаю следить за тем, что происходит на смежных рынках.

Я часто наблюдаю за процессом создания отчётов с помощью инструмента Google Data Studio. При создании отчётов одной из главных задач является объединение данных из нескольких источников, и именно в этот момент специалисты сталкиваются с тем, что функция объединения работает не так, как они думали/хотели бы.

Подробнее о способах объединения данных при создании отчётов я рассказал в первой статье. Сегодня мы с вами разберемся, что не так с функцией «Совмещение данных» и как отобразить данные из нескольких рекламных кабинетов в едином отчёте Google Data Studio.

Одной из задач, для которой используют Google Data Studio, это сравнение эффективности рекламных источников. Чтобы сравнение было качественным, помимо целевых действий и выручки в отчёты загружают также расходы, показы и клики. Берут их из аккаунтов рекламных систем.

Но для того, чтобы сравнивать рекламные аккаунты между собой, необходимо объединить данные в одну таблицу, это позволит использовать фильтры, сортировку и другие инструменты работы с данными.

Для объединения расходов из нескольких рекламных площадок новички используют одноимённую функцию — «Совмещение данных», но данные объединяются совсем не так, как было запланировано.

Как работает функция «Объединить данные» в Google Data Studio»

В прошлой статье мы уже говорили о том, как объединять данные, теперь давайте разбираться, как их объединять с помощью функции «Совмещение данных». При использовании функции мы можем указать по какому столбцу будут объединяться строки из одной таблицы и из другой. В нашем примере объединение происходит по столбцу Campaign ID.

После объединения получается такая же таблица, как и в предыдущей статье:

Именно так и работает функция «Совмещение данных» в Google Data Studio. Её задача свести данные из таблиц с разным типом данных. 

К слову, о том же самом можно подробно прочитать в справке.

Для сведения таблиц выше мы сначала объединили данные из рекламных площадок Яндекс.Директ и Google Ads, и только после этого стали объединять между собой таблицы с разными типа данных. Так же следует поступать при работе в Google Data Studio. Данные из рекламных площадок заранее должны быть объединены

К сожалению это не очевидно, особенно, когда только начинаешь разбираться с Google Data Studio и от функции «Совмещение данных» ждёшь, что она как раз и решит задачу по объединению расходов с разных рекламных площадок, но в лучшем случае это происходит не так, как ожидалось. В худшем — не происходит вообще.

Предлагаю на примере рассмотреть, что случится, если использовать функцию «Совмещение данных» не по назначению.

Ещё раз: это не решение. Это объяснение, почему такой метод не приводит к желаемому результату и что происходит на самом деле.

Допустим, мы подключились к двум рекламным площадкам: Яндекс.Директ и Google Ads. И Теперь у нас получились две такие таблицы:

яндекс гугл

Обратим внимание на общий итог по показам и кликам в обеих таблицах:

1. Яндекс.Директ

Показы: 17 645, клики: 3 109

2. Google Ads

Показы: 28 259, клики: 4523

Позже нам это пригодится. Что дальше?

Выбираем таблицу Яндекс.Директ и в блоке настроек кликаем на «Совмещение данных»:

После чего открывается окно настроек:

  1. Уже выбран источник, который был применён к таблице.
  2. В параметры и показатели мы можем добавить те, которые хотим видеть в итоговой таблице.
  3. Добавляем источник данных для объединения

После добавления источника представление данных меняется.

  1. Выбирается источник для объединения.
  2. Так как мы добавили источник для объединения, то в настройках появилось поле «Ключи для объединения».
  3. В предыдущей статье в качестве ключей мы рассматривали дату, источник и Campaign Id. В этом примере для упрощения будем использовать в качестве ключа только дату.
  4. В параметры из обоих источников добавляем нужные параметры для отображения.
  5. Аналогично с параметрами — выбираем показатели, которые должны отображаться.
  6. Задаём название для новой таблицы, которая получится после сведения двух таблиц.
  7. Здесь мы должны заподозрить неладное. А именно: у нас по два поля площадка, показы и клики. Почему? Всё просто — по одному полю из каждой таблицы. Если бы мы присоединяли ещё один рекламный источник — их было бы по три.
  8. Сохраняем нашу новую таблицу.

Теперь давайте посмотрим, что же у нас получилось.

Напоминаю, что на входе у нас было две таких таблицы:

Наши ожидания от объединения выглядят так:

Данные по каждой площадке выведены последовательно, в таблице мы применили двойную сортировку, сначала по дате, а потом по площадке. При помощи фильтров мы можем отдельно смотреть данные только по Google или только по Яндекс. Но это наши мечты, на деле результат объединения выглядит следующим образом:

На одной строке у нас отображаются данные по обеим площадкам. Это приводит к тому, что мы не можем использовать фильтры по таблице, и суммирование по показам/кликам также перестаёт быть наглядным.

Не считая того, что хранить данные в таком виде — некорректно, такой формат представления не позволяет быстро анализировать данные и поддерживать отчёты в будущем.

То есть названия площадок должны быть в одном столбце, то же касается и других параметров и показателей. Как же нам добиться такого варианта отображения, если Google Data Studio не объединяет так данные по умолчанию? 

Как объединить данные из нескольких рекламных площадок/аккаунтов в Google Data Studio

На правах заботливого автора напомню: ваши задачи вполне могут решить готовые сервисы автоматизации отчётности и сквозной аналитики, которые позволят не только отображать отчёты, но и автоматически разметить рекламные кампании, что является немалой проблемой при ручной сборке отчётов.

Если вам недостаточно той гибкости отчётов, что предоставляют готовые сервисы, то давайте разбираться, как же объединить данные в Google Data Studio.

Как нам получить уже объединённые данные из рекламных источников?Для ответа на этот вопрос необходимо вспомнить, каким образом эти данные сейчас могут поступать в Google Data Studio.

1. Встроенные коннекторы

Встроенные коннекторы к рекламным системам позволяют получать одновременно данные только из одного рекламного источника. Как мы убедились выше,  дальше мы с этими данными ничего сделать не сможем.

2. Google Analytics

Из Google Analytics можно получить данные о расходах, но прежде чем они там появятся, их необходимо туда загрузить. Сделать это можно вручную или с использованием сторонних платных сервисов. Помимо этого, данные могут задержаться в обработке до 24 часов, то есть будут импортированы, но не будут доступны для отображения в отчётах и для выгрузки в Google Data Studio.

3. Google Таблицы

В Google таблицах данные можно собирать как вручную, так и с помощью расширений, например бесплатного (на момент написания статьи) Renta. Кстати, с его помощью вы также сможете выгрузить и информацию по заявкам/звонкам и сделкам из Calltouch или по заказам из вашей CRM.

рента

Альтернативный платный коннектор для Google Таблиц — Supermetrics.

Как с этим работать?

При запросе данных из коннекторов они загружаются на отдельные листы, например:

Если мы будем подключать в DataStudio по очереди эти листы, то ничего хорошего у нас не получится, поэтому перед подключением необходимо объединить их с помощью массива в одну таблицу.

Массив создаётся с помощью фигурных скобок, в которых нам необходимо перечислить диапазоны для объединения. В качестве разделителя используется точка с запятой. Смотрите пример такой таблицы.

Однако в таком простом варианте наша таблица будет статичной, так как диапазоны ограничены в обеих таблицах 62 строкой, и, если будут добавлены новые данные, они не отобразятся в нашем массиве, и, следовательно, в Data Studio.

«Укажите самое большое число» — тоже не вариант, так как это тоже ограничение, поэтому мы просто убираем это ограничение и оставляем наши диапазоны «Открытыми»:

Казалось бы, это решает проблему, но одновременно и открывает ряд других:

  1. Между первым и вторым диапазоном будет отображаться пустота.
  2. Неподготовленному пользователю будет не понятно откуда берутся остальные данные, если видно только другие. На самом деле, остальные будут далеко внизу.
  3. Получаем вот такую строку с данными null, которую можно скрыть через фильтры:

Но лучше решить проблему иначе:

1. Переносим нашу формулу на вторую строку и оба диапазона берём без учёта заголовка, т. е. со строки A2:

2. Копируем название столбцов с одного из листов и вставляем в первую строку, теперь они подтягиваются не формулой.

3. Оборачиваем наш массив в формулу SORT и сортируем его по первому столбцу по возрастанию, то есть по дате.

Теперь, если обновить данные в Google Data Studio, то никаких null там не будет:

Тот же процесс по объединению массивов в видео-формате доступен здесь.

4. Google Big Query

BQ — это облачная база данных, в которой можно хранить любую аналитическую информацию о вашей компании. Однако работа с базами данных — это скачок на новый уровень по необходимой подготовке и по возможностям. Если в Big Query у вас в разных таблицах хранятся расходы из разных рекламных кабинетов, то для объединения данных вы можете использовать три варианта:

  1. Написать запрос, в котором будете объедините эти таблицы с помощью кляузы UNION ALL.
  2. Создать представление (VIEW), которое будет отображать уже склеенные данные, но технически это будет тот же запрос c кляузой UNION ALL, выраженный в качестве представления.
  3. Ежедневно вы можете запускать скрипт, который будет объединять данные из трёх таблиц расходов в одну. Обычно операция объединения таблиц нетрудоёмкая и нет необходимости делать подобные «слепки» по расписанию. Гораздо чаще такой сценарий применяют при использовании более сложных вопросов, чтобы сократить количество запросов к базе и ускорить обработку данных. Этот вариант подходит, когда не нужен доступ к live-данным.

Плюсы и минусы каждого способа

Google Analytics:

+ Простота в использовании.

- Необходимо импортировать данные о расходах вручную или с помощью платных сервисов.

- Данные о расходах отображаются не сразу.

Google Таблицы:

+ Простота в освоении.

+ Есть бесплатный плагин, который позволяет скачать данные из рекламных систем, CRM, а также из систем аналитики и коллтрекинга, таких, как Calltouch.

- На больших объёмах данных таблицы могут начать тормозить.

BigQuery:

+ Колоссальные мощности по обработке и нет ограничений на хранение информации.

+ Платный, но в большинстве случаев это очень небольшие деньги.

- Нужно выучить язык запросов SQL, хотя бы на базовом уровне.

- Необходимо решать вопрос с передачей данных в облачное хранилище, писать скрипты или использовать платные коннекторы.

Искренне надеюсь, что после прочтения этой статьи вы стали ближе к пониманию того, как именно объединяются данные в Google Data Studio и почему не надо делать так, как кажется «очевидным».

Также я постарался подробно рассмотреть возможные варианты предоставления информации о расходах в Google Data Studio, если у вас остались вопросы, пожелания или дополнения — пишите в комментариях.

16
2
6
Обнаружили ошибку? Выделите ее и нажмите Ctrl + Enter.
Узнайте больше

Комментарии (0)

Последние комментарии

    Чтобы оставить комментарий, нужно войти

    Чтобы оставлять комментарии, переключитесь на профиль читателя

    Подписаться

    на самую полезную рассылку по интернет-маркетингу
    Cookies policy
    Просматривая этот сайт, вы соглашаетесь с нашей политикой конфиденциальности — Ok