Функции вычисляемых полей Google Data Studio

Тому, кто работает с цифрами и аналитикой тяжело переоценить преимущества использования Google Data Studio. Функционал инструмента упрощает процесс анализа данных, а также позволяет в несколько кликов визуализировать результаты в удобном и понятном формате, создавать и расшаривать красивые отчеты и экономить время. Особенно, если освоить нехитрые премудрости работы в Data Studio.

Мы уже писали о том, как сделать красивую визуализацию с помощью инструмента. Теперь познакомимся с основными функциями вычисляемых полей.

О вычисляемых полях

Зачастую, чтобы наглядно представить данные, может быть недостаточно информации, загруженной с внешнего источника, например с Google Analytics. В таких случаях необходимо добавить дополнительные показатели, произвести расчеты на основе существующей информации, создать собственные переменные. Для этого в Data Studio существуют вычисляемые поля, которые предоставляют широкий спектр возможностей с использованием различных функций и формул. Данные, полученные в результате проведенных расчетов, без ограничений могут использоваться для визуализации, создания дашбордов и дальнейшего анализа.

В зависимости от функций, используемых в вычисляемом поле и типа параметров, различают несколько типов данных:

  • числовые;
  • текстовые;
  • дата и время;
  • логические;
  • географические данные;
  • валюта.

Особенности использования вычисляемых полей

Напомним, для добавления вычисляемых полей, в панели настроек таблицы в блоке «Данные» необходимо выбрать «Добавьте параметр» («Добавьте показатель») и нажать «Создать поле».

https://images.netpeak.net/blog/kak-dobavit-vycislaemoe-pole.png

Но прежде чем создавать какие-либо пользовательские вычисляемые внимательно ознакомьтесь с тем, что уже доступно в инструменте в правой боковой панели навигации.

Далее введите название. Оно должно быть информативным и лаконичным, не дублировать существующие названия полей. После этого начинается самое интересное — вводим формулу для вычисления.

Существует перечень функций, поддерживаемых Data Studio — все это можно найти в официальной документации.

Примеры использования функций вычисляемых полей

Приведем пример добавления вычисляемого поля с элементарными арифметическими расчетами. Предположим, что нам необходимо проанализировать соотношение новых пользователей и существующих, как это соотношение изменилось в сравнении с предыдущим годом. 

Нажимаем кнопку «Создать новое поле» — на экране появляется консоль, предлагающая ввести название и тип поля, формулу. Называем поле «Доля новых пользователей». Для расчета необходимо количество новых пользователей поделить на количество всех пользователей:

Теперь нажимаем «Применить». В результате получаем дополнительный столбец с новым параметром:

Для того, чтобы увидеть данные в процентном соотношении, достаточно изменить тип данных вычисляемого поля на «Процент»:

Чтобы сравнить показатели с предыдущим периодом или годом, необходимо перейти к разделу «Диапазон дат для сравнения» на правой панели и выбрать «Предыдущий период», «Фиксированные даты»  или «Предыдущий год» (в зависимости от целей анализа). После этого появятся новые столбцы, в которых будут отображаться изменения каждого показателя в таблице в сравнении с выбранным периодом.

Использование текстовой функции lower

Анализируя данные по источнику, с которого пользователь пришел на сайт, сталкиваемся с тем, что название одного и того же источника может быть представлено по разному, и в нижнем, и в верхнем регистре. 

В таких случаях сложно провести анализ, потому что необходимо свести и суммировать все возможные варианты названия источника. С вычисляемыми полями это ghjcnj сделать. Для этого создаем дополнительный параметр, используя функцию lower. С ее помощью можно преобразовать названия в верхнем регистре в названия в нижнем регистре. Вот так:

Чтобы избежать повторяющихся значений, удаляем в панеле настроек параметр «Источник» и оставляем только добавленный параметр «Источник в нижнем регистре».

Регулярные выражения в функциях вычисляемых полей

Те, кто уже не представляет свою работу с данными без регулярных выражений, точно оценят возможность их применения в Google Data Studio. Вся магия кроется в нескольких поддерживаемых функциях: 

  • regexp_extract — позволяет извлекать из поля часть значения, соответствующую заданному регулярному выражению;
  • regexp_match — возвращает true, если значение поля соответствует заданному регулярному выражению и false — если не соответствует;
  • regexp_replace — заменяет все значение, соответствующие заданному полю на указанное в функции.

Например, необходимо проанализировать, что пользователи ищут на сайте с помощью внутреннего поиска.

Для начала можно отфильтровать данные по параметрам, содержащихся в URL страниц результатов внутреннего поиска (в нашем примере search=). Добавить фильтр можно в панеле настроек таблицы, все тот же раздел «Данные». Настройки фильтра будут выглядеть так:

Чтобы понимать, что именно пользователи ищут, удобно извлечь поисковый запрос с URL. Для этого используем функцию:

regexp_extract(Страница,'search=(.*)')

И теперь значительно проще проанализировать, что и как часто пользователи ищут на сайте.

Использование оператора case

Case — один из самых мощных операторов, поскольку его можно использовать для манипулирования как параметрами, так и показателями. Чаще всего используется для создания новых категорий или групп данных

Синтаксис оператора:

 

  • condition — выражение, которое оценивается, как логическое значение (истина или ложь). Условия могут включать параметры или показатели, но не оба;
  • result — значение для возврата. Может быть параметром, метрикой или буквальным значением;
  • else result — (необязательно) значение по умолчанию, возвращаемое, если не выполняется условие из блока «When».

Оператор case состоит из одного или нескольких логических условий (when), за которым следует результат, возвращаемый, если это условие истинно (then). Если условия не выполняются, case возвращает значение, заданное в else.

С детальным руководством по оператору можно ознакомиться в официальной документации.

Несколько примеров

Вернемся к анализу данных по источнику, из которого пользователь пришел на сайт. Функция lower решает проблему с верхним и нижним регистром, но не решает проблему иных вариаций названий источника. Например, Facebook может быть представлен как «facebook» , «m.facebook.com» , «l.facebook.com», «facebook.com», «lm.facebook.com». Для того, чтобы привести все варианты к одному, необходимо использовать следующую функцию case when:

CASE WHEN Источник  IN ( "facebook" , "m.facebook.com" , 
"l.facebook.com" , "facebook.com" , "lm.facebook.com" ) 
THEN "Facebook"WHEN Источник IN ( "l.instagram.com" , 
"instagram.com" , "instagram" ) THEN "Instagram"WHEN Источник 
IN ( "t.co" , "twitter.com" , "twitter" ) THEN "Twitter"WHEN 
Источник IN ( "pinterest.com" , "pinterest" , "pinterest.ca" , 
"pinterest.co.uk" , "pinterest.fr" , "pinterest.jp" , 
"b.pinterest.com" , "pl.pinterest.com" , "pinterest.com.mx" , 
"pinterest.cl" , "id.pinterest.com" , "ru.pinterest.com" ,
 "br.pinterest.com" , "pinterest.com.au" ) 
THEN "Pinterest"WHEN Источник IN ("youtube.com", "youtube") 
THEN "Youtube"ELSE "_Другие"END

Таким образом, задав в условии when все возможные вариации того или иного источника можно привести их к единому формату.

Еще одно большое преимущество оператора case — возможность задать условие с помощью регулярных выражений. В этом случае одновременно используются функции regexp_extract, regexp_match, regexp_replace.

Например, если нам необходимо проанализировать статистику по типам страниц, то условие будет выглядеть примерно так:

CASE WHEN REGEXP_MATCH(Страница, "((?i).*^/$|^/\?.*).*") 
THEN "Homepage"WHEN REGEXP_MATCH(Страница, "((?i).*^/services$).*")
 THEN "Страницы услуг"WHEN REGEXP_MATCH(Страница, 
"((?i).*.*/blog/.*).*") THEN "Страницы блога"WHEN REGEXP_MATCH
(Страница, "((?i).*^/products/.*).*") THEN 
"Страницы товаров"WHEN REGEXP_MATCH(Страница, "((?i).*^/contact/.*).*") 
THEN "Контакты"ELSE "_Другие"END

Во время заполнения условий функции, автоматически выполняется проверка данных. Это исключает возможность ошибки. Также автоматически предлагаются варианты при указании полей, на основании которых мы хотим создать новый параметр, выводятся подсказки для корректного ввода исходных данных. Важно: какие бы расчеты вы не проводили и что бы не напридумывали, исходные данные останутся неизменными и всегда можно будет вернуться к изначальному виду.

Выводы

  1. Вычисляемые поля в Data Studio расширяют возможности проведения анализа данных. Позволяют создавать дополнительные параметры и показатели.
  2. Вычисляемые поля поддерживают несколько типов данных: числовые, текстовые, дата и время, логические, географические данные, валюту.
  3. С помощью вычисляемых полей можно выполнять как самые элементарные расчеты и действия, так и сложные функции.
  4. Lower — одна из самых распространенных функций для работы с текстовыми данными, которая преобразовывает текст из верхнего регистра в нижний.
  5. regexp_extract, regexp_match, regexp_replace — три функции, которые позволяют использовать регулярные выражения для создания новых переменных и параметров.
  6. Оператор case чаще всего применяется для создания новых категорий или групп данных. Оператор case состоит из одного или нескольких логических условий, за которым следует результат, возвращаемый, если это условие истинно. Если условия не выполняются, case возвращает значение, заданное в else.

Знание того, как получить максимальную отдачу от возможностей Data Studio, начинается с понимания того, как использовать вычисляемые поля. Поддерживаемые функции позволяют с легкостью оперировать исходными данными и превращать их в действительно полезную информацию.

Узнайте больше
20
2
4
Обнаружили ошибку? Выделите ее и нажмите Ctrl + Enter.