Канонический URL: как повысить рейтинг одинакового контента
Причин возникновения дублей контента может быть много: особенности CMS сайта, страницы с динамическими параметрами URL, сайт доступен по https://www.site.com/ и по https://site.com/, https://site.com/ и так далее. Если не указать поисковику приоритетную — каноническую страницу с дублирующимся контентом, робот выберет ее на свое усмотрение и последствия могут быть неприятными, особенно для владельцев сайтов.
В этом выпуске «Азбуки SEO» поговорим о понятии каноничности страниц и атрибуте rel="canonical".
Что такое атрибут rel="canonical"?
Атрибут rel="canonical" указывает роботам поисковых систем, какую страницу необходимо считать приоритетной. Он присваивается тегу link и располагается в <head></head> страницы. Страница, указанная в атрибуте rel="canonical", начинает восприниматься поисковыми роботами как приоритетная (каноническая).
Например: <link rel="canonical" href="https://[url]" />, где [url] — адрес канонической страницы.
Допустим, для страницы «https://site.com/?get=12345» канонической является «https://site.com/». В таком случае на странице «https://site.com/?get=12345» тег будет таким: <link rel="canonical" href="https://site.com/" />.
Google поддерживает этот атрибут с 2009.
Зачем указывать canonical?
- Устранить полные или частичные дубли контента на сайте.
- Защитить контент от дублирования на ресурсах, которые частично или полностью могут кешировать сайт (например, веб-архивы).
В каких случаях нужно определять каноничность?
Страницы пагинации
Для страниц пагинации есть два решения вопроса с каноническими страницами. Выбор варианта зависит от того, есть ли в каждой категории сайта страница «Показать все», например, «https://site.com/category-1/show-all», на которой доступны все товары из категории.
Если такая страница есть, Google рекомендует на каждой из страниц пагинации указать канонической страницу «Показать все».
Например, «https://site.com/category-1/page-2» должна содержать каноническую ссылку: <link rel="canonical" href="https://site.com/category-1/show-all" />.
Если страницы «Показать все» нет и мы имеем дело с классической пагинацией, следует в качестве канонических указывать эти же страницы.
Например, страница «https://site.com/category-1/page-2» должна содержать каноническую ссылку: <link rel="canonical" href="https://site.com/category-1/page-2" />.
О том, как мы используем rel="canonical" для оптимизации страниц интернет-магазина,
Страницы с UTM-метками
Необходимо настроить сервер так, чтобы при нахождении UTM-параметров в адресе страницы, отдавался код «200 ОК» и страница содержала абсолютную каноническую ссылку на URL этой страницы без UTM-метки.
Речь о следующих UTM-параметрах:
- gclid;
- utm_medium;
- utm_source;
- utm_campaign;
- utm_content;
- utm_term;
- _openstat.
Так, страница «https://site.com/?utm_source=testk&utm_medium=test&utm_campaign=test» должна содержать каноническую ссылку: <link rel="canonical" href="https://site.com/" />.
Читайте, как правильно
Страницы фильтрации
На страницах фильтрации следует в качестве канонических указывать сами страницы фильтрации.
Например, для страницы «https://site.com/category-1/filter-1/» нужна ссылка: <link rel="canonical" href="https://site.com/category-1/filter-1/" />.
Дублирование контента на разных доменах
Иногда при переходе на новое доменное имя используется сервер, который не поддерживает переадресацию на своей стороне. В таком случае можно использовать междоменный атрибут rel="canonical" в элементе link.
Просто нужно указать канонические ссылки со всех доменов, на которых есть дублирующийся контент, на основной — предпочтительный для индексирования.
Важно: на данный момент междоменный каноникал понимает только Google.
О чем следует помнить при простановке rel="canonical"?
- Ссылки в атрибуте следует ставить абсолютные — с https:// или https://. Так сокращается риск появления ошибок.
- Если на странице с дублирующимся контентом указываете на другую страницу как каноническую, не забудьте в <head></head> той страницы также прописать ее как каноническую.
- Если на странице указаны несколько канонических адресов, поисковый робот проигнорирует их и определит каноническую страницу самостоятельно.
- Если канонической указана страница, отдающая код ответа 404, поисковый робот не сможет использовать данную рекомендацию.
- Чтобы избежать ошибок, не стоит использовать цепочки канонических страниц.
- Поисковые роботы воспринимают атрибут rel="canonical" не как строгую директиву, а как рекомендацию, то есть указанный URL может быть проигнорирован.
- При самостоятельном определении канонических страниц поисковая система Google отдает предпочтение страницам на https.
Выводы
В нашей практике бывали случаи, когда контент с сайта копировали полностью, вместе с внутренней текстовой перелинковкой и каноническими адресами. Поэтому атрибут rel="canonical" стоит указывать на всех страницах.
Особенно важно определять каноничность для:
- страниц пагинации;
- страниц с UTM-метками;
- страниц фильтрации.
Это помогает бороться с дублированием контента и обезопасить сайт от копирования.
Узнайте больше о продвинутых способах использования
Свежее
Что такое IP-адрес сайта, и Как IP влияет на SEO
Что можно узнать из IP адреса, и как его определить для своего или чужого сайта
Как отслеживать события в Google Analytics 4 через DebugView
Пошаговая инструкция по активации и использованию DebugView
Кто такой outsource-маркетолог, и Зачем он нужен
Если вы еще не знаете о проекте от Netpeak Agencies Group — «Маркетолог на аутсорсе», эта статья для вас. Расскажу, как работает маркетинг на аутсорсе и зачем это вашему бизнесу