SEO

Канонический URL: как повысить рейтинг одинакового контента

52021

Причин возникновения дублей контента может быть много: особенности CMS сайта, страницы с динамическими параметрами URL, сайт доступен по https://www.site.com/ и по https://site.com/, https://site.com/ и так далее. Если не указать поисковику приоритетную — каноническую страницу с дублирующимся контентом, робот выберет ее на свое усмотрение и последствия могут быть неприятными, особенно для владельцев сайтов.

В этом выпуске «Азбуки SEO» поговорим о понятии каноничности страниц и атрибуте rel="canonical".

Что такое атрибут rel="canonical"?

Атрибут rel="canonical" указывает роботам поисковых систем, какую страницу необходимо считать приоритетной. Он присваивается тегу link и располагается в <head></head> страницы. Страница, указанная в атрибуте rel="canonical", начинает восприниматься поисковыми роботами как приоритетная (каноническая).

Например: <link rel="canonical" href="https://[url]" />, где [url] — адрес канонической страницы.

Допустим, для страницы «https://site.com/?get=12345» канонической является «https://site.com/». В таком случае на странице «https://site.com/?get=12345» тег будет таким: <link rel="canonical" href="https://site.com/" />.

Google поддерживает этот атрибут с 2009.

Зачем указывать canonical?

Устранить полные или частичные дубли контента на сайте.
Защитить контент от дублирования на ресурсах, которые частично или полностью могут кешировать сайт (например, веб-архивы).

В каких случаях нужно определять каноничность?

Страницы пагинации

Для страниц пагинации есть два решения вопроса с каноническими страницами. Выбор варианта зависит от того, есть ли в каждой категории сайта страница «Показать все», например, «https://site.com/category-1/show-all», на которой доступны все товары из категории.

Если такая страница есть, Google рекомендует на каждой из страниц пагинации указать канонической страницу «Показать все».

Например, «https://site.com/category-1/page-2» должна содержать каноническую ссылку: <link rel="canonical" href="https://site.com/category-1/show-all" />.

Если страницы «Показать все» нет и мы имеем дело с классической пагинацией, следует в качестве канонических указывать эти же страницы.

Например, страница «https://site.com/category-1/page-2» должна содержать каноническую ссылку: <link rel="canonical" href="https://site.com/category-1/page-2" />.

О том, как мы используем rel="canonical" для оптимизации страниц интернет-магазина, читайте здесь.

Страницы с UTM-метками

Необходимо настроить сервер так, чтобы при нахождении UTM-параметров в адресе страницы, отдавался код «200 ОК» и страница содержала абсолютную каноническую ссылку на URL этой страницы без UTM-метки.

Речь о следующих UTM-параметрах:

gclid;
utm_medium;
utm_source;
utm_campaign;
utm_content;
utm_term;
_openstat.

Так, страница «https://site.com/?utm_source=testk&utm_medium=test&utm_campaign=test» должна содержать каноническую ссылку: <link rel="canonical" href="https://site.com/" />.

Читайте, как правильно создавать и проставлять UTM-метки.

Страницы фильтрации

На страницах фильтрации следует в качестве канонических указывать сами страницы фильтрации.

Например, для страницы «https://site.com/category-1/filter-1/» нужна ссылка: <link rel="canonical" href="https://site.com/category-1/filter-1/" />.

Дублирование контента на разных доменах

Иногда при переходе на новое доменное имя используется сервер, который не поддерживает переадресацию на своей стороне. В таком случае можно использовать междоменный атрибут rel="canonical" в элементе link.

Просто нужно указать канонические ссылки со всех доменов, на которых есть дублирующийся контент, на основной — предпочтительный для индексирования.

Важно: на данный момент междоменный каноникал понимает только Google.

О чем следует помнить при простановке rel="canonical"?

Ссылки в атрибуте следует ставить абсолютные — с https:// или https://. Так сокращается риск появления ошибок.
Если на странице с дублирующимся контентом указываете на другую страницу как каноническую, не забудьте в <head></head> той страницы также прописать ее как каноническую.
Если на странице указаны несколько канонических адресов, поисковый робот проигнорирует их и определит каноническую страницу самостоятельно.
Если канонической указана страница, отдающая код ответа 404, поисковый робот не сможет использовать данную рекомендацию.
Чтобы избежать ошибок, не стоит использовать цепочки канонических страниц.
Поисковые роботы воспринимают атрибут rel="canonical" не как строгую директиву, а как рекомендацию, то есть указанный URL может быть проигнорирован.
При самостоятельном определении канонических страниц поисковая система Google отдает предпочтение страницам на https.

Выводы

В нашей практике бывали случаи, когда контент с сайта копировали полностью, вместе с внутренней текстовой перелинковкой и каноническими адресами. Поэтому атрибут rel="canonical" стоит указывать на всех страницах.

Особенно важно определять каноничность для:

страниц пагинации;
страниц с UTM-метками;
страниц фильтрации.

Это помогает бороться с дублированием контента и обезопасить сайт от копирования.

Узнайте больше о продвинутых способах использования rel="canonical".

Наталья Дурасова

В интернет-маркетинге и Netpeak c 2015 года.
Сертифицированный специалист Google Analytics, Google Adwords, Google Tag Manager, Bing.

Другие статьи автора

Узнайте больше

дублирование контента UTM-метки азбука SEO

Обнаружили ошибку? Выделите ее и нажмите Ctrl + Enter.

Свежее

GA4 для eCommerce: какие показатели действительно влияют на доход, а какие — просто «для отчета»

Как перестать быть пассивным наблюдателем и начать искать в GA4 точки роста

Обновляемый дайджест изменений в AI-поиске

Дайджест главных обновлений AI и их влияния на рынок

Meta (Facebook) Pixel Helper: что это такое и как его настроить?

В этой статье подробно рассмотрю, что это за инструмент, принцип его работы и как с его помощью проверить установку Pixel и передачу событий с сайта в кабинет Meta