Канонический URL: как повысить рейтинг одинакового контента
Причин возникновения дублей контента может быть много: особенности CMS сайта, страницы с динамическими параметрами URL, сайт доступен по https://www.site.com/ и по https://site.com/, https://site.com/ и так далее. Если не указать поисковику приоритетную — каноническую страницу с дублирующимся контентом, робот выберет ее на свое усмотрение и последствия могут быть неприятными, особенно для владельцев сайтов.
В этом выпуске «Азбуки SEO» поговорим о понятии каноничности страниц и атрибуте rel="canonical".
Что такое атрибут rel="canonical"?
Атрибут rel="canonical" указывает роботам поисковых систем, какую страницу необходимо считать приоритетной. Он присваивается тегу link и располагается в <head></head> страницы. Страница, указанная в атрибуте rel="canonical", начинает восприниматься поисковыми роботами как приоритетная (каноническая).
Например: <link rel="canonical" href="https://[url]" />, где [url] — адрес канонической страницы.
Допустим, для страницы «https://site.com/?get=12345» канонической является «https://site.com/». В таком случае на странице «https://site.com/?get=12345» тег будет таким: <link rel="canonical" href="https://site.com/" />.
Google поддерживает этот атрибут с 2009.
Зачем указывать canonical?
- Устранить полные или частичные дубли контента на сайте.
- Защитить контент от дублирования на ресурсах, которые частично или полностью могут кешировать сайт (например, веб-архивы).
В каких случаях нужно определять каноничность?
Страницы пагинации
Для страниц пагинации есть два решения вопроса с каноническими страницами. Выбор варианта зависит от того, есть ли в каждой категории сайта страница «Показать все», например, «https://site.com/category-1/show-all», на которой доступны все товары из категории.
Если такая страница есть, Google рекомендует на каждой из страниц пагинации указать канонической страницу «Показать все».
Например, «https://site.com/category-1/page-2» должна содержать каноническую ссылку: <link rel="canonical" href="https://site.com/category-1/show-all" />.
Если страницы «Показать все» нет и мы имеем дело с классической пагинацией, следует в качестве канонических указывать эти же страницы.
Например, страница «https://site.com/category-1/page-2» должна содержать каноническую ссылку: <link rel="canonical" href="https://site.com/category-1/page-2" />.
О том, как мы используем rel="canonical" для оптимизации страниц интернет-магазина,
Страницы с UTM-метками
Необходимо настроить сервер так, чтобы при нахождении UTM-параметров в адресе страницы, отдавался код «200 ОК» и страница содержала абсолютную каноническую ссылку на URL этой страницы без UTM-метки.
Речь о следующих UTM-параметрах:
- gclid;
- utm_medium;
- utm_source;
- utm_campaign;
- utm_content;
- utm_term;
- _openstat.
Так, страница «https://site.com/?utm_source=testk&utm_medium=test&utm_campaign=test» должна содержать каноническую ссылку: <link rel="canonical" href="https://site.com/" />.
Читайте, как правильно
Страницы фильтрации
На страницах фильтрации следует в качестве канонических указывать сами страницы фильтрации.
Например, для страницы «https://site.com/category-1/filter-1/» нужна ссылка: <link rel="canonical" href="https://site.com/category-1/filter-1/" />.
Дублирование контента на разных доменах
Иногда при переходе на новое доменное имя используется сервер, который не поддерживает переадресацию на своей стороне. В таком случае можно использовать междоменный атрибут rel="canonical" в элементе link.
Просто нужно указать канонические ссылки со всех доменов, на которых есть дублирующийся контент, на основной — предпочтительный для индексирования.
Важно: на данный момент междоменный каноникал понимает только Google.
О чем следует помнить при простановке rel="canonical"?
- Ссылки в атрибуте следует ставить абсолютные — с https:// или https://. Так сокращается риск появления ошибок.
- Если на странице с дублирующимся контентом указываете на другую страницу как каноническую, не забудьте в <head></head> той страницы также прописать ее как каноническую.
- Если на странице указаны несколько канонических адресов, поисковый робот проигнорирует их и определит каноническую страницу самостоятельно.
- Если канонической указана страница, отдающая код ответа 404, поисковый робот не сможет использовать данную рекомендацию.
- Чтобы избежать ошибок, не стоит использовать цепочки канонических страниц.
- Поисковые роботы воспринимают атрибут rel="canonical" не как строгую директиву, а как рекомендацию, то есть указанный URL может быть проигнорирован.
- При самостоятельном определении канонических страниц поисковая система Google отдает предпочтение страницам на https.
Выводы
В нашей практике бывали случаи, когда контент с сайта копировали полностью, вместе с внутренней текстовой перелинковкой и каноническими адресами. Поэтому атрибут rel="canonical" стоит указывать на всех страницах.
Особенно важно определять каноничность для:
- страниц пагинации;
- страниц с UTM-метками;
- страниц фильтрации.
Это помогает бороться с дублированием контента и обезопасить сайт от копирования.
Узнайте больше о продвинутых способах использования
По теме
Как работать с Open Graph
Что нужно сделать, чтобы превью веб-страниц в социальных сетях стало магнитом для пользователей?
Как стать SEO-специалистом
Как стать востребованным SEO-оптимизатором: 35+ ссылок для обучения и совершенствования своих знаний, а также советы
Что такое краулинг и как управлять роботами
Наука перехода — понятие краулинга (crawling, сканирование) сайта и принципа его работы. Виды поисковых роботов и способы их управления и другие полезные фишки в рубрике Азбука SEO на Netpeak Blog
Свежее
Как привести более 2500 лидов через Telegram Ads — кейс Antischool Online
Рассказываем, как продвигали телеграм-бот в образовательной нише и что из этого получилось
Онлайн-рецепция для клиники. Как создать чат-бот для сети медицинских учреждений — кейс клиники Медея
Главная цель разработки робота-администратора — расширение возможностей клиники и увеличение доступности ее услуг для пациентов
Как сделать анализ ссылочной массы конкурентов
Пошаговое руководство по анализу ссылок конкурентов. Как найти конкурентов в своей нише? Как узнать ссылку конкурентов? Как создать ссылочную стратегию?