Роботи пошукових систем під час перевірки сторінки спочатку дивляться на код стану HTTP, а потім уже приступають до перевірки вмісту документа. Наприклад, неіснуючі сторінки завжди повинні віддавати код 404. Чому? Google стверджує, що сторінки з кодом відповіді, відмінним від 404 та 410, скануватимуться. Тож якщо ви не знаєте, які коди віддають сторінки вашого сайту і як це перевірити, ставите під загрозу майбутнє всього проєкту. Тому треба розумітись у кодах стану сервера.
Що таке «код стану HTTP»
Це тризначне число, яке віддає сервер на запит відвідувача і завдяки якому корегується подальша обробка запитуваного документа. За числом завжди йде коротке пояснення коду англійською мовою, відокремлене пробілом. Це первинна інструкція клієнтові під час відвідування сторінки або документа сайту.
Код стану HTTP при зверненні на сторінку в першу чергу перевіряють і браузери, і роботи пошукових систем.
Чому коди стану важливі для SEO
Коди стану відіграють важливу роль у SEO. Якщо код відповіді налаштований правильно та вчасно, пошуковий бот зможе швидко просканувати сторінку та виконати необхідні дії.
З іншого боку, такі коди допомагають контролювати будь-які зміни на вебсайті. Наприклад, ви змінюєте адресу сторінки, переходите на безпечний протокол з’єднання або навіть обираєте іншу CMS. У всіх цих випадках, змінюючи код відповіді сервера, ви зможете інформувати пошукових роботів про те, що відбувається зі сторінками вашого сайту, щоб вони могли правильно реагувати на ці дії.
Які є класи кодів стану HTTP?
Є групи кодів, об’єднаних певними ознаками. На клас стану вказує перша цифра коду.
Виділяють п’ять класів:
- 1xx — інформаційні коди. Вони відповідають за процес передачі даних. Це тимчасові коди, котрі інформують про те, що запит прийнято і обробка буде продовжуватися.
- 2xx — успішна обробка. Запит було отримано та успішно оброблено сервером.
- 3xx — перенаправлення (редирект). Ці відповіді свідчать про те, що необхідно вжити подальших дій для виконання запиту. Наприклад, зробити запит на іншу адресу.
- 4xx — помилка клієнта. Означає, що запит не може бути виконаний з вини користувача.
- 5xx — помилка сервера. Ці коди виникають через помилки на стороні сервера. У цьому випадку користувач все зробив правильно, але сервер не може виконати запит. Для кодів цього класу сервер обов’язково показує повідомлення, що не може обробити запит і з якої причини.
Основні коди стану
200 ОК
Найпопулярніший і найважливіший статус. Означає, що запит виконано успішно відповідно до очікувань користувача — запитані дані або сторінка існують та доступні для перегляду. Усі сторінки, які хочете бачити в індексі пошукових систем, повинні віддавати код 200 OK.
301 Moved Permanently
Ця відповідь свідчить, що документ або сторінка були переміщені на іншу адресу назавжди. Якщо у сторінки, яка вже була у видачі пошукових систем, змінилася адреса, для збереження трафіку та ваги рекомендується налаштовувати 301 редирект зі старої URL-адреси на нову. Врешті пошуковик «склеїть» ці адреси.
302 Found
Документ тимчасово перенесено на іншу адресу. Цей код сигналізує, що видаляти сторінку з індексу не треба. За заявою Gary Illyes з Google, посилальна вага при цьому передається.
304 Not Modified
Важливий код з точки зору навантаження на сервер і кількості даних, що передаються. Сервер повертає 304 код, якщо в HTTP-заголовку дата останнього оновлення (Last-Modified) старіша, ніж у запиті із заголовком If-Modified-Since. Тобто, якщо документ не змінювався із зазначеної дати, сервер повертає код 304 Not Modified. У такому разі роботам пошукових систем немає необхідності завантажувати документ повторно: він не змінився з моменту їхнього останнього візиту. Фактично вони отримують лише http-заголовки та рухаються далі.
307 Temporary Redirect / Internal Redirect
Цей код стану було створено для пояснення тимчасового перенаправлення 302. Він належить до стандарту HTTP 1.1, але не такий поширений, як код 302.
Код стану 307 означає, що запитана сторінка тепер доступна за іншою URL-адресою, але все одно повернеться до попередньої URL. Як і у випадку з перенаправленням 302, сторінка не кешується, і пошукові роботи, швидше за все, не додадуть нову адресу до індексу.
Цей код відповіді схожий на 302, але він не дозволяє змінити метод запиту з POST на GET.
308 Permanent Redirect
Аналог HTTP 1.1 редиректа 301. Котрий водночас не дозволяє змінити метод запиту з POST на GET.
На даний момент немає чіткої інформації про те, який авторитет сторінки передає перенаправлення 308, тому рекомендую замість нього використовувати редирект 301, аби вказати, що вміст переміщено назавжди.
401 Unauthorized
Аутентифікація HTTP не вдалася. Запитана сторінка потребує комбінації імені користувача і пароля та/або не має доступу через її IP-адресу.
403 Forbidden
Відмовлено в доступі. Така відповідь повертається, якщо користувачеві заборонено доступ до цього документа. В даному випадку не йдеться про HTTP-автентифікацію (для таких випадків використовуються 401 і 407 коди). 403 код виводиться, наприклад, у разі входу із заборонених IP або спроби перегляду системного файлу .htaccess.
404 Not Found
Напевно, кожен користувач стикався з цією відповіддю. Вона означає, що за вказаною URL нічого не знайдено — документ не існує. Цей код слід віддавати при спробі потрапити на неіснуючі документи. Якщо сторінка за запитуваною адресою існувала, але була видалена, і ви хочете про це повідомити, використовуйте код 410.
Soft 404 pages
Сторінка з повідомленням 404 File Not Found не завжди повертає код стану 404. Багато вебмайстрів не звертають на це уваги, що в результаті може негативно позначитися на рейтингу всього сайту. Це так звані сторінки Soft 404. Вони виникають, якщо неіснуюча сторінка дає код відповіді, відмінний від 404 і 410. Soft 404 може включати сторінки, які мусять давати код 200, але вони не мають вмісту (порожня сторінка). Рішення полягає в тому, щоб знайти такі сторінки і обов’язково налаштувати для них код 404.
Ви можете перевірити сторінки Soft 404 на панелі покриття в Google Search Console.
Приклад Soft 404 pages у Google Search Console
У мистецтві оформлення 404 сторінок багато хто досяг успіху. Зацініть:
Дивіться також інші цікаві приклади дизайну сторінок із 404 помилкою.
407 Proxy Authentication Required
Код стану HTTP 407 вказує на те, що запит не було задовільнено через відсутність даних для автентифікації на проксі-сервері, який знаходиться між браузером і сервером, що може отримати доступ до сайту.
410 Gone
Ця відповідь каже, що документ був остаточно видалений і недоступний. Хоча коди 404 і 410 однаково вказують на те, що сторінка недоступна, в їхній обробці є відмінності. Звертаючись до 404 сторінки, пошуковий робот не позначатиме її як видалену і через якийсь час знову до неї звернеться для уточнення інформації. Чого не скажеш про 410 код. У цьому випадку робот точно зауважить, що сторінка або документ назавжди видалені із сервера. Довіряючись вебмайстру, робот не перевірятиме цю сторінку знову.
451 Unavailable For Legal Reasons
Останнім часом цей код зустрічається дедалі частіше. Він означає, що доступ до сервера закрито через його заборону на державному рівні або за рішенням суду у разі порушення авторських прав. Помилка 451 — варіант уточнення коду 403.
500 Internal Server Error
Будь-яка внутрішня помилка сервера, яка не описана в інших помилках цього класу. Стається, якщо сервер зіткнувся з проблемою, що не дозволяє виконати запит. Наприклад, через помилки в налаштуванні конфігураційного файлу.
503 Service Unavailable
Сервер тимчасово не може опрацьовувати запити з технічних причин. Якщо на сервер йде занадто багато запитів, і він не в змозі впоратися з ними, побачимо саме цю відповідь.
504 Gateway Timeout
Шлюз не відповідає. Відповідь з’являється, якщо сервер працював як проксі і не дочекався відповіді від вищого сервера для завершення запиту.
Для запобігання появі сторінок в індексі пошукових систем рекомендується використовувати на сторінці метатег robots з атрибутом noindex: <meta name="robots" content="noindex">.
Якщо потрібно видалити документ із результатів пошуку, можна налаштувати 404 або 410 код. У разі використання метатегу noindex сторінка регулярно повторно скануватиметься, а за використання коду відповіді 410 роботи вважатимуть, що сторінки більше немає і її сканувати не потрібно.
Як перевірити код стану HTTP
Щоб побачити код під час роботи в Google Chrome, скористайтеся вкладкою Network на панелі інструментів розробника. Після відкриття панелі оновіть сторінку.
Ще один спосіб перевірити код стану HTTP — популярний плагін Redirect Path.
Ці методи більше підходять для перевірки окремої сторінки.
Як перевірити коди стану HTTP в Google Search Console
«Інструмент перевірки URL» в Google Search Console дозволяє перевірити код стану HTTP.
На панелі «Покриття» відображається найважливіша інформація та помилки кодів стану HTTP для всіх сторінок сайту.
У прикладі нижче є сторінки з кодом стану 404 і сторінки з помилками 5xx:
Як перевірити коди стану HTTP за допомогою Netpeak Spider і Netpeak Checker
Netpeak Spider та Netpeak Checker обидва використовуються для сканування та технічного аудиту сайту з величезною кількістю параметрів. І код відповіді одні з них. Ви можете перевірити відповіді з усіх сторінок вебсайту, URL-адреси із sitemap.xml або просто завантажити список URL, які потрібно перевірити.
Приклад перевірки кодів стану HTTP у Netpeak Spider
Приклад перевірки кодів стану HTTP у Netpeak Checker
Як контролювати коди стану HTTP
Важливо постійно слідкувати за кодами відповідей, щоб мати змогу реагувати на помилки на сайті.
Для моніторингу кодів стану HTTP зручно використовувати Google Search Console. Вона може надсилати сповіщення електронною поштою, коли код відповіді сторінки відрізнятиметься від 200 OK.
Вам також слід регулярно проводити повний аудит усіх сторінок сайту. Із цим впорається Netpeak Spider.
Запам’ятати
- Є п’ять класів кодів стану HTTP, що вказують на різні етапи процесу передачі даних: від успішної обробки до помилки сервера.
- Усі сторінки, які ви хочете бачити в індексі пошукової системи, повинні повертати код 200 OK.
- Якщо сторінка, що вже була в індексі пошукової системи, змінила адресу, необхідно налаштувати 301 редирект зі старої URL на нову.
- Якщо неіснуюча сторінка повертає код відповіді, відмінний від 404 і 410, виникає помилка «Soft 404». Це в тому числі можуть бути сторінки, які повинні віддавати код 200, але на них немає вмісту.
- Коректні коди стану дозволяють пошуковим системам економити ресурси на обробці сайту. Роботи пошукових систем отримають лише ту інформацію, яка їм потрібна — це дуже важливо для SEO.
- Регулярна перевірка кодів стану HTTP допомагає швидко реагувати на будь-які зміни на сайті.
FAQ
1. Що таке коди стану HTTP?
Код стану — це тризначне число, яке сервер надсилає на запит користувача і яке далі корегує обробку запитуваної сторінки. Після номера завжди йде коротке пояснення коду англійською мовою, розділене пробілом. Це основна інструкція для клієнта при доступі до сторінки чи документа на сайті.
2. Що таке код стану 404?
Код стану 404 означає, що за вказаною URL-адресою нічого не знайдено — сторінка не існує.
3. Що таке Soft 404 pages?
Soft 404 pages виникають, якщо неіснуюча сторінка дає код відповіді, відмінний від 404 і 410. Може включати сторінки, які повинні давати код 200, але не мають вмісту (порожня сторінка). Такі сторінки необхідно знаходити та обов’язково налаштувати для них код 404.
4. Що таке код стану 500?
Це будь-яка внутрішня помилка сервера, яка не охоплюється іншими помилками цього класу. Коли сервер стикається з проблемою, що перешкоджає виконанню запиту. Наприклад, через помилки налаштувань у файлі конфігурації.
Свіжі
SEO-аналітика: гайд для початківців
Дізнайтеся, які метрики важливо відслідковувати у SEO-аналітиці, для чого потрібні ці показники та яку користь приносять бізнесу
Як транспортному стартапу зайняти своє місце на гіперконкурентному ринку: zavezu.ua відкриває можливості для малих перевізників
Розповімо про створення унікальної торговельної пропозиції для zavezu.ua та стратегії розвитку на її основі
Історія співпраці Netpeak та OLX. Як розвивати диджитал-маркетинг і не боятись тестувати нові підходи
Розповідаємо про роботу та спільні досягнення з одним з найдавніших партнерів