Блог про интернет-маркетинг для бизнеса

SEO

8 шагов к очистке семантического ядра в Key Collector

173
4
18
57

Мы уже писали, как самостоятельно собрать семантическое ядро. Но перед тем как разделить запросы по категориям, их следует хорошенько почистить. Как убрать восемь уровней шлака и оставить чистое серебро? Понадобится аккаунт в Key Collector и 12 минут на прочтение этого поста.

1. Чистка семантического ядра по словам-маркерам

Открываем Key Collector и с помощью фильтра отсеиваем все неподходящие слова. Например, для категории «серебряные кольца» основными маркерными словами будут «серебряные», «кольца», а также их словоформы. Вписываем только часть слова, чтобы охватить все словоформы.

В первую очередь отберем все запросы без «кол-» в Key Collector.

Для этого переходим на вкладку с выбором условий фильтраций:

переходим на вкладку с выбором условий фильтраций

И выбираем соответствующие условия (фраза не содержит «кол-»):

выбираем соответствующие условия (фраза не содержит «кол-»)

Отмечаем все отфильтрованные фразы и отправляем в «корзину».

Отмечаем все отфильтрованные фразы и отправляем в «корзину»

Дальше по такому же алгоритму отфильтруем запросы по слову «серебр-».

Чтобы охватить больше фраз с одинаковым значением, в Key Collector существует возможность создавать вложенные фильтры.

Для чего это нужно? Например, возьмем запросы «кулоны» и «подвески». Оба варианта в выдаче будут показывать идентичные результаты.

В данном примере мы выполнили поиск информационных запросов, содержащих слова «кулон» и «подвеска».

В данном примере мы выполнили поиск информационных запросов, содержащих слова «кулон» и «подвеска»

Все созданные фильтры по заданным условиям можно сохранять и использовать в других проектах.

Как это сделать:

Все созданные фильтры по заданным условиям можно сохранять и использовать в других проектах

2. Удаление повторяющихся слов

Фразы с повторами зачастую мусорные, поэтому имеет смысл удалить их уже на первых этапах чистки семантики. Для этого выбираем расширенный фильтр и настраиваем правило: «Фраза» — «Содержит повторы слов»:

Фразы с повторами зачастую мусорные, поэтому имеет смысл удалить их уже на первых этапах чистки семантики

3. Удаление латинских букв, специальных символов, запросов с цифрами

Удалить латинские буквы и спецсимволы можно с помощью:

  • расширенного фильтра;
  • регулярных выражений.

С помощью расширенного фильтра можно выбрать сразу несколько параметров:

С помощью расширенного фильтра можно выбрать сразу несколько параметров

Фильтр по условию «содержит прочие символы» выберет фразы с украинскими символами «і», «ї».

Не забывайте применить правило ИЛИ/И ко всем условиям.

Другой метод — изучить регулярные выражения и очистить семантическое ядро с их помощью.

Регулярное выражение \d+ помогает избавиться от цифр.

Например, в случае семантического ядра по серебряным кольцам я оставляла все запросы, содержащие значение пробы металла и веса изделия, но удаляла год выпуска.

Например, в случае семантического ядра по серебряным кольцам я оставляла все запросы, содержащие значение пробы металла и веса изделия, но удаляла год выпуска

Регулярное выражение [a-z]+ нужно для фильтрации букв латинского алфавита.

Буквы латинского алфавита могут быть в названиях брендов, коллекций или других элементов карточек товаров. Перед удалением таких запросов советую внимательно их просмотреть.

Буквы латинского алфавита могут быть в названиях брендов, коллекций или других элементов карточек товаров

Фильтрацию с помощью регулярных выражений можно проводить и с помощью быстрого фильтра (как на примере выше), и с помощью расширенного фильтра:

Фильтрацию с помощью регулярных выражений можно проводить и с помощью быстрого фильтра (как на примере выше), и с помощью расширенного фильтра

4. Чистка с помощью стоп-слов

Переходим на вкладку «Стоп-слова»:

Чистка с помощью стоп-слов

Добавляем слова, которые нам не нужны. Обычно я делю все стоп-слова на несколько групп:

  • информационные;
  • города (которые не соответствуют маркетинговым целям);
  • все, что относится к бесплатным способам получения товара: бесплатно, недорого, дешево, дорого, на/под заказ (не для всех сайтов) и так далее.
  • субъективные понятия: самый, лучший, красивый, необычный, прикольный, оригинальный.
  • названия сайтов с объявлениями: «пром юа», «олх», «клумба», «бигль юа».
  • визуализация: изображения, фото, видео, скачать, смотреть, чертежи, инструкции, схемы.
  • очень часто встречаются запросы с приставкой «своими руками», их тоже добавляем в стоп-слова.

Список групп может варьироваться в зависимости от тематики сайта, но приведенные выше примеры работают практически во всех случаях.

Полный список стоп-слов однажды решил собрать Антон Липский. С тех пор он регулярно пополняется находками других специалистов.

Так выглядит чистка с помощью списка стоп-слов в Key Collector:

Так выглядит чистка с помощью списка стоп-слов в Key Collector

Важно! Информационные запросы с приставками «как», «где», «что» советую не удалять. Лучше перенести их в отдельную папку и в будущем использовать для разработки контент-плана.

Также можно все ненужные слова добавлять непосредственно из полного списка запросов. В таком случае создаем отдельную группу — специально для таких стоп-слов.

Алгоритм действий:

1. Кликаем на значок слева от нерелевантного запроса:

Кликаем на значок слева от нерелевантного запроса

2. В открывшемся окне выбираем, что добавить в список стоп-слов:

В открывшемся окне выбираем, что добавить в список стоп-слов

5. Чистим ядро с помощью функции анализа группы слов

В KeyCollector переходим на вкладку «Данные» — «Анализ групп».

В KeyCollector переходим на вкладку «Данные» — «Анализ групп»

Отмечаем группы со словами, которые не подходят:

Отмечаем группы со словами, которые не подходят

Группы, отмеченные в таблице, автоматически отмечаются в основном списке запросов. После того как были отмечены все неподходящие слова, закрываем таблицу и удаляем все ненужные запросы.

6. Ищем и удаляем неявные дубли

Для использования данного метода необходимо сначала собрать информацию о частотности запросов. После этого переходим на вкладку «Данные» — «Анализ неявных дублей»:

Для использования данного метода необходимо сначала собрать частотность запросов. После этого переходим на вкладку «Данные» — «Анализ неявных дублей»

Выделяем необходимые настройки:

Выделяем необходимые настройки

Нажимаем кнопку «Умная отметка»:

Нажимаем кнопку «Умная отметка»

Программа автоматически отметит все неявные дубли, частотность которых меньше в указанной поисковой системе.

7. Ручной поиск по группе запросов

Наконец можно отметить вручную все ненужные слова в семантическом ядре: сленг, слова с ошибками и так далее. Основной массив нерелевантных запросов уже был очищен ранее, так что ручная чистка не займет много времени.

8. Очистка запросов по частотности

С помощью расширенного фильтра в KeyCollector устанавливаем параметры частоты запросов и отмечаем все низкочастотные фразы. Данный этап нужен далеко не всегда.

С помощью расширенного фильтра в KeyCollector устанавливаем параметры частоты запросов и отмечаем все низкочастотные фразы

Выводы

Чтобы качественно очистить семантическое ядро от мусора, следует выполнить восемь шагов в KeyCollector:

  1. Чистка семантического ядра по словам-маркерам.
  2. Удаление повторяющихся слов.
  3. Удаление латинских букв, специальных символов, запросов с цифрами.
  4. Чистка с помощью стоп-слов.
  5. Очистка ядра с помощью функции анализа группы слов.
  6. Поиск и удаление неявных дублей.
  7. Ручной поиск по группе запросов.
  8. Очистка запросов по частотности.

На каждом этапе желательно просмотреть слова, помеченные для удаления, так как существует риск удалить качественные и релевантные запросы.

Вместо удаления ненужных запросов лучше создать отдельную группу и переносить их туда. В свежих обновлениях Key Collector появилась соответствующая группа по умолчанию — «Корзина».

После тщательной чистки семантического ядра можно переходить к следующему этапу — кластеризации и группировке запросов.

Отмечу, что всегда существует риск упустить парочку нерелевантных запросов во время чистки ядра. Их как раз очень легко выявить и удалить на этапе группировки, но об этом — в следующий раз.

Обнаружили ошибку? Выделите ее и нажмите Ctrl + Enter.

Комментарии (13)

  1. 0
    7 месяцев назад

    Если укажу ошибку в статье, которая может привести к потере трафика даже по ВЧ запросам, (ошибку любой сеошник-практик поймет сразу), дадите доступ к спайдеру на месяц? :)

  2. 0
    8 месяцев назад
    Подскажите, пожалуйста, где можно скачать эту программу? 
  3. 2
    8 месяцев назад

    Алина, спасибо за статью:)

    Полезно, когда можно почитать нормально структурированную иформацию и можно вспомнить правильный порядок действий.

  4. -1
    7 месяцев назад

    видно что джун писал... 

    пояснений практически нет ... например 

    2. Удаление повторяющихся слов

    т.е. этого достаточно что бы понять что и как это чистит ? Если типа для тех кто в теме... так они и статью эту читать не будут, а если для тех кто не в теме то это бесполезная информация т.к. не понятна...


    по другим пунктам практически тоже самое...


    Хотелось бы еще увидеть средний % потери качественных фраз при такой фильтрации, т.е. я как бы намекаю почему бы сеньеру не написать статью с этим же названием... было бы интересно к прочтению.

    • 1
      Дмитрий Южный
      6 месяцев назад

      Лол, где это сеньоры собирают семантику?) Джуны в этом вопросе шарят, в основном, гораздо лучше, так как уделяют этому много своего рабочего времени. Ну, если честно, то статья очень похожа на обычный рерайт таких статей как:
      http://shakin.ru/seo/9-ways-to-clean-keywords-in-key-collector.html
      и
      http://solutionsseo.ru/blog/filtratsia-semanticheskogo-yadra-kc/
      Хотелось бы прочесть что-то новое(

    • 0
      Дмитрий Южный
      8 месяцев назад

      Здравствуйте.

      Что касается алгоритмов работы фильтров программы, для этого лучше почитать справку KeyCollector. Цель моей статьи - показать на определенном примере, как быстро и эффективно почистить семантическое ядро, используя ряд конкретных действий. 

      Что касается % потери, как уже писала в статье, перед тем как удалять не нужные нам фразы, обязательно нужно визуально пройтись по списку. 


    • 0
      Дмитрий Южный
      8 месяцев назад
      Что именно может быть непонятно новичку? На скриншотах примеры с «серебряными кольцами», в тексте — ссылка на список Липского, чего уж более? Или вы хотели пример почищенной семантики? Не думаю, что новичкам это поможет)
      • 1
        Георгий Рябой
        8 месяцев назад

        эта статья как я понимаю расчитана на тех кто ниразу не пользовался этими инструментами... а значит примеры с «серебряными кольцами» и список Липского, практически бесполезны. 


        в общем вам виднее, зачем учитывать мнение читателей...
        • 0
          Дмитрий Южный
          8 месяцев назад

          Добрый день.

          Цель этой статьи – показать как можно использовать KeyCollector для решения базовых задач, возникающих при работе с семантикой, а не рассказать о тонкостях работы с ней.

          Показывать как работает та или иная функция без примера – плохая идея, поэтому примеры тут как нельзя кстати :)

          Насчет процента потерянных фраз – он минимален. Фильтрами отсеиваются то, что наверняка нам не нужно и перед отсеиванием всегда нужно пробежаться глазами по списку фраз.

        • 0
          Дмитрий Южный
          8 месяцев назад
          Объяснение базовых принципов работы в Key Collector, Словоёбе достойно отдельной статьи, она обязательно будет.
  5. 1
    8 месяцев назад

    Отличный материал, особенно пригодились регулярные выражения.

Чтобы оставить комментарий, необходимо авторизироваться

Подписаться

на самую полезную рассылку по интернет-маркетингу

Самое

обсуждаемое популярное читаемое