Как быстро найти ошибки на сайте — проверка важных тегов с помощью Google Tag Manager и таблиц Google
Как узнать, закрыли ли страницу для роботов поисковых систем буквально через минуту после того как это произошло? В этой статье — бесплатный алгоритм и скрипт для быстрой проверки наличия важных тегов на целевых страницах. Для внедрения понадобятся только Google Tag Manager и таблицы Google.
Кстати, этот текст — подробная расшифровка двенадцатой фишки
В качестве примера настроим проверку <meta name=”robots” content=”noindex”>. Этот тег часто ненарочно применяется для закрытия важных страниц от индексации.
1. В Google Tag Manager создаем переменную Meta Robots
В этой переменной будет храниться значение атрибута content тега meta robots.
Три CSS-селектора помогут избежать ошибок на сайтах, где название атрибута name содержит заглавные буквы (такое иногда случается).
2. В Google Tag Manager создаем триггер Noindex Meta Robots
Триггер будет срабатывать, если:
- переменная Meta Robots содержит noindex;
- URL страницы соответствует регулярному выражению.
Для второго правила нужно задать в регулярном выражении страницы, которые вы хотите проверять.
3. Копируем таблицу Google для приема данных
Нужно создать таблицу, которая будет принимать данные с нужными названиями колонок.
Чтобы упростить задачу, пройдите по пути File — Make a copy и скопируйте себе готовую таблицу-шаблон. В таблице уже есть все скрипты.
Достаточно определять URL и время обнаружения тега. Если хотите отслеживать больше параметров, просто добавьте новые столбцы и параметры URL в четвертом пункте.
Важно: не идите дальше, пока не указали названия колонок! Иначе скрипт будет выдавать ошибку.
4. Настраиваем скрипт приема данных
В таблице из предыдущего пункта следует пройти по пути Tools — Script editor и отредактировать переменные в файле Get data.gs.
В var SHEET_NAME = "Sheet Name"; замените Sheet Name на название вашего рабочего листа (в моем случае — noindex).
В var SHEET_KEY = "Spreadsheet ID"; заменить Spreadsheet ID на ID вашей таблицы.
После этого в редакторе скриптов следует опубликовать скрипт как веб-приложение с публичным доступом. При первом запуске нужно будет дать разрешение, нажав «Развернуть».
После этого будет сгенерирован URL-адрес веб-приложения.
Желтым выделен [ID_веб_приложения]. Сохраняем его — он понадобится во всех последующих пунктах.
Теперь мы можем передавать значения в таблицу по шаблону:
https://script.google.com/macros/s/[ID_веб_приложения]/exec?
[Название_колонки_1]=
[Данные_1]&[Название_колонки_2]=[Данные_2]&
[Название_колонки_3]=[Данные_3]&Timestamp
Мы будем передавать URL-адрес страницы с noindex. Для параметра Timestamp не нужно передавать значение. Скрипт сам запишет в него время получения данных.
5. Проверяем приходят ли данные в таблицу
Переходим в браузере по следующей ссылке:
https://script.google.com/macros/s/[ID_веб_приложения]/exec?url=https://domain.com/test-url&Timestamp
Мы должны получить подтверждение об успешном завершении операции и номер строки таблицы, куда были вставлены данные.
6. В Google Tag Manager создаем тег Meta robots check
Создаем тег типа «Пользовательское изображение». В URL изображения нужно вставить:
https://script.google.com/macros/s/[ID_веб_приложения]/exec?url={{Page URL}}&Timestamp
К тегу нужно применить триггер Noindex Meta Robots из второго пункта алгоритма.
7. Настраиваем скрипт проверки наличия URL в таблице
Скрипт уже есть на листе Check noindex.gs. Он проверяет, есть ли URL на листе noindex для текущей даты. Если есть хоть один URL, отправляется письмо на email-адрес, указанный на листе emails.
8. Устанавливаем триггер для скрипта
Теперь осталось только установить периодичность проверки наличия закрытых для индексирования URL в таблице.
Для этого в меню переходим Edit — Current project’s triggers, жмем Click here to add one now и задаем нужную периодичность срабатывания скрипта.
Если достаточно только один раз в день проверять страницы, раскомментируйте вторую переменную checkDate вверху файла Check noindex.gs и настройте соответствующий триггер.
Выводы
Чтобы быстро и бесплатно настроить проверку закрытия важных страниц от индексации, нужно:
- Создать в Google Tag Manager переменную для хранения значения meta robots.
- Создать в Google Tag Manager триггер, который срабатывает при наличии noindex в переменной.
- Настроить таблицу Google для приема данных.
- Настроить скрипт приема данных.
- Создать в Google Tag Manager тег типа «Пользовательское изображение», который будет передавать данные в таблицу.
- Настроить скрипт проверки наличия URL в таблице для нужного дня.
- Установить триггер для скрипта проверки.
Вы можете доработать скрипт под себя. Например, настроить передачу данных в одну таблицу для разных сайтов и отправку отдельных писем для каждого сайта.
Единственное ограничение предложенного метода: ограничение таблицы Google — 400 000 ячеек. Потому иногда нужно очищать главный лист от ненужных записей.
Жду в комментариях идеи по улучшению данного метода.
Свежее
Самые популярные ключевые слова в App Store за І половину 2024 года. Тенденции и прогнозы
Специалисты RadASO провели анализ топовых запросов на 10 крупнейших рынках мобильных приложений и в Украине. Читайте о трендах, популярных брендах и прогнозах
Ad Monetization. Как получить учетную запись Google AdX — пошаговая инструкция
В статье я расскажу об основах Google AdX и двух способах доступа к учетной записи, рассмотрю их преимущества и недостатки, а также поделюсь кейсами
Что такое IP-адрес сайта, и Как IP влияет на SEO
Что можно узнать из IP адреса, и как его определить для своего или чужого сайта