Текстовая релевантность: как проверить и исправить. Инструкция для новичков
Текст — главный
Есть два традиционных варианта использования этого мощного инструмента:
1. «Чтобы было»
Недооценивать силу качественного текста — большая ошибка, особенно если формат предусматривает лаконичность и динамичность, как в постах в социальных сетях или информации на главной страницы сайта. К сожалению, довольно часто можно наблюдать обратное — коммерческий текст написан сумбурно, без исследования темы, штамповано или просто без цели, лишь бы заполнить пустое пространство.
С приходом в наш мир ChatGPT, можно генерировать тексты среднего качества бесплатно и всего за пару минут. Ну и что, если главный смысл текста скрывается в пятом абзаце с конца? Главное, что ключевые слова есть!
Существует несколько признаков некачественного текста:
- отсутствует смысловая нагрузка — текст говорит обо всем, но ни о чем конкретно;
- лексическая скудность или чрезмерная витиеватость текста — повторение одних и тех же слов или использования устаревших, специфических словоформ;
- откровенный абсурд — особенно часто встречается при написании текстов искусственным интеллектом без последующей проверки редактором;
Из реальных примеров: в украиноязычном тексте по психологии вместо слова «горевание» использовали слово «горение».
- стилистические несоответствия — например, если текст написан в фамильярном и дурашливом тоне для бренда дорогой мужской одежды, который в социальных сетях держит официальный тон общения;
- смысловые несоответствия — следует осторожно использовать фразеологизмы, особенно при письме на иностранных языках;
- перенасыщение ключевыми слова — может привести даже к штрафным санкциям от поисковых систем.
Использование таких текстов может негативно повлиять на конверсию и даже пагубно сказаться на ранжировании сайта в поисковых системах.
2. Качественный текстовый контент
В идеальном варианте текст должен отвечать на несколько ключевых параметров. Про качественный текстовый контент можно сказать:
- написан грамотно;
- тематика текста соответствует ключевым словам;
- использованы LSI-слова;
- ориентирован на читателей, отвечает на их запросы или решает их проблему;
- держится в одном стиле с голосом бренда;
- разделен на смысловые абзацы, нумерованные или маркированные списки для лучшего пользовательского опыта;
- красиво оформлен — использованы разные блоки и элементы, возможно даже цитаты.
Качественный текст радует глаз читателю и помогает ему сохранить приятное впечатление о вашем сайте.
Подготовка технического задания
Написание текста начинается с создания технического задания. В первую очередь, определитесь с параметрами будущего текста:
- Ключевые слова. Это слова или словосочетания, задают вектор написания текста. Они описывают, о чем будет текст. Могут использоваться как в прямом (то есть в полностью идентичной морфологической форме), так и в непрямой форме. Важно не перенасыщать текст ключевыми словами.
- Объем текста. Как правило, заказчик дает диапазон символов, но идеальный объем текста — это полный ответ на вопрос пользователя. Можно ориентироваться на текст конкурента.
- Тезисы. Краткие основные посылы текста, будущие подзаголовки.
- Уникальность. Процентный показатель отличия текста от существующих в интернете. Должен стремиться к 100%.
После того, как статья написана, её важно вычитать и проверить на соответствие техническому заданию
Шаг 1. Проверка тезисного плана
Берете готовый текст, читаете и сопоставляете с тезисами технического задания. Универсального рецепта по проверке не существует, но в тексте должен быть четкий «ответ» на тезис.
Например, даны тезисы:
- Что такое пасхальный декор?
- Виды пасхального декора.
- Как подготовить дом к Пасхе?
- Топ-3 идей для пасхального декора.
После прочтения вы должны узнать о каждом из тезисов. Если этого не случилось, дописывайте текст и добавлять информацию.
Шаг 2. Проверка уникальности
Уникальность — процентный показатель отличия текста от существующих в интернете.
Я рассмотрю несколько программ проверки уникальности.
Serpstat
Если вы SEO-специалист, который знаком с Serpstat не понаслышке, то могли заметить появление новых функций. Одна из них как раз и есть проверка на плагиат. Для того чтобы воспользоваться новой возможностью, следует быть пользователем с подпиской Lite и выше.
Для использования Serpstat нужно войти в аккаунт и следовать таким шагам:
- Нажмите кнопку «AI Content Tools», а затем выберите «Plagiarism checker».
- Вы окажетесь на странице, где нужно ввести свой Serpstat API токен. Он находится во вкладке «Account Management».
Проверить количество оставшихся лимитов для функционала «AI для контента» можно во вкладке «Мой профиль», в графе «Инструменты».
Количество потраченных кредитов, внутренней валюты Serpstat, для проверки на плагиат исчисляется в запросах:
- 1 запрос = 500 кредитов для английского языка;
- 1 запрос = 750 кредитов для других языков.
- После того, как был введен токен, появляется окно с возможностью введения текста на проверку. Минимальное количество символов — 256, максимальное — 10240.
- Следует выбрать язык, на котором будет проводиться поиск плагиата. На июнь 2023 года для проверки доступно 26 языков:
- романские — испанский, французский, итальянский, румынский, португальский;
- германские — английский, датский, немецкий, нидерландский, шведский;
- славянские — болгарский, чешский, польский, русский, словацкий, словенский, украинский;
- азиатские — японский, китайский;
- тюркские — турецкий;
- финно-угорские — эстонский, финский, венгерский;
- балтийские — литовский, латышский;
- другие — греческий.
- Вы можете указать, какие сайты не стоит учитывать при анализе на плагиат. Их нужно вводить через запятую.
- После того, как вы ввели ваш текст и выбрали настройки для него, нажмите кнопку «Calculate».
Результаты подаются в процентном соотношении плагиата и со ссылками на сайты, где были найдены похожие фрагменты текста.
Также будет дана оценка URL — это таблица со страницами с наибольшим процентом совпадений текста. В каждом URL в этом блоке есть Score — доля предложений, которые были найдены на данной странице. Например, если оценка 0,1, это означает, что 10% предложений из добавленного текста были найдены на данной странице.
Плюсы:
- большой выбор языков;
- не нужно отдельно докупать доступ к сервису;
- понятный интерфейс.
Минусы:
- дороговато, если нет нужды использовать другие функции Serpstat;
- функция новая, поэтому могут быть технические недочеты.
Plagiarismdetector.net
Для услуг бесплатной версии сервиса Plagiarismdetector.net не нужно регистрироваться или иметь аккаунт. Можете просто зайти на сайт и следовать инструкции.
- Введите текст в программу. Для этого есть несколько способов:
- скопируйте нужный для проверки текст и вставить его в окно ввода;
- найдите и загрузите файл с рабочего стола через функцию «Upload File» или через DropBox;
- загрузите URL страницы с текстом с помощью окна «Check By URL».
Этот способ использования я не рекомендую, так как подтягивается не вся информация и можно потерять важную часть текста. Могут подтянуться и части описания из футера и других технических элементов.
- В поле «Exclude URL» введите ссылки сайтов, которые не должны учитываться при проверке на плагиат.
- После этого нажмите на «Check Plagiarism» и подождите пару минут. Результат высвечивается вверху справа, показывая соотношение оригинального контента к плагиату. Внизу представлены источники плагиата с процентом их использования в представленном тексте.
Отчет можно сохранить в документе Word.
Разницы между Download Report и Download Word Report нет, обе ссылки отправляют на страницу конвертации файла PDF в Word.
После конвертации вы получите файл со скрином результатов проверки. Редактировать его невозможно.
Plagiarismdetector.net разрешает проводить проверку на плагиат на 16 языках:
- романские языки — испанский, португальский, французский, итальянский;
- германские языки — английский, немецкий, шведский, нидерландский;
- славянские языки — русский;
- азиатские — вьетнамский;
- тюркский — турецкий;
- другие — хинди, арабский, индонезийский, филиппинский, малайский.
Украинский язык на момент июня 2023 года добавлен не был.
Стоимость использования PRO версии начинается от 5 долларов за неделю за 50 страниц текста. Годовая минимальная подписка будет стоить от 110 долларов.
Плюсы:
- большой выбор редких языков стран архипелагов;
- можно купить ПРО-версию на неделю.
Минусы:
- нельзя проверять больше 1000 слов в бесплатной версии;
- не качественная конвертация в Word;
- нет украинского языка.
Duplichecker
Как и предыдущий сайт, Duplichecker не требует регистрации для использования бесплатной версии. Чтобы проверить текст, следуйте инструкции.
- Загрузите текст для проверки в поле, воспользуйтесь загрузкой файлов в текстовых форматах. У сервиса есть возможность проверки через URL-адрес, но мне он выдал ошибку, говорит что текста на странице слишком мало.
- После введения текста, пройдите Captcha и нажмите «Check Plagiarism».
- Ознакомьтесь с результатами проверки:
- процентным количеством плагиата и уникального контента;
- ссылками на страници с которых был скопирован текст;
- количеством слов.
- Можете сохранить результаты проверки в pdf или word форматах. В отличие от Plagiarismdetector.net, результат конвертации можно редактировать.
Duplichecker поддерживает проверку на плагиат на 18 языках:
- романские языки — испанский, португальский, итальянский, французский, румынский;
- германские языки — английский, немецкий, нидерландский, шведский, датский, норвежский;
- славянские языки — русский;
- азиатские — вьетнамский, корейский, японский;
- тюркские — турецкий;
- другие — индонезийский, арабский.
Минимальная стоимость подписки за 30 000 слов — 10 долларов в месяц.
Плюсы:
- есть бесплатная версия;
- есть редкие европейские и азиатские языки.
Минусы:
- минимальная подписка на платную версию — 1 месяц;
- нет украинского языка.
Как выбрать сервис для проверки на плагиат?
Есть несколько важных критериев, на которые стоит обращать внимание при выборе сервиса для проверки на плагиат.
- Какие языки нужно проверять.
У каждого из представленных сервисов есть свои особенности в плане выборов языков:
- Serpstat имеет самый обширный список славянских языков, включая польский, словацкий и болгарский, это единственный сайт, в котором включен украинский язык;
- Plagiarismdetector отлично подходит, если вы работаете с редкими языками, такими как индонезийский, малайский или хинди;
- Duplichecker.com приходит на помощь, если вам нужно проверить скандинавские или корейский языки.
- Цена подписки.
В зависимости от количества символов и слов, которые вам нужно проверить, варьируется и стоимость подписки. Для примера, минимальная стоимость пакета в месяц:
- Duplichecker.com — 10$ за 30 000 слов (есть возможность оплачивать недельные тарифы);
- Plagiarismdetector.net — 20$ за 71 000 слов;
- Serpstat — проверка уникальности входит в стандартный пакет в 69$, но это общая стоимость доступа к множеству другого SEO функционала.
Рынок программ и устройств для проверки на плагиат достаточно обширный, так что вполне возможно найти сервисы проверки на плагиат для большинства языков мира.
Шаг 3. Проверка использования ключевых слов в тексте
На этапе создания технического задания специалист подбирает ключевые слова и фразы для копирайтера. В зависимости от назначения текста, требования к использованию ключей варьируются.
Все показатели частотности ключевых фраз очень приблизительны. На них можно ориентироваться при беглом первичном анализе текста, но вывод о качестве текста может сделать только специалист после вычитки.
Чтобы быстро проверить ключевые слова в тексте можно использовать программу ISTIO — бесплатный сервис для подбора LSI-слов и проверки текста.
Да данный момент сервис поддерживает поиск слов на четырех языках:
- английский;
- русский;
- украинский;
- немецкий.
Как работает ISTIO?
- Введите текст для проверки одним из двух способов:
- скопируйте ссылку страницы, в этом случае сервис сам подтянет весь текст страницы на проверку, включая текстовые части кнопок и других элементов;
- скопируйте и введите нужный текст вручную.
- Можете указать какие ключевые слова должен найти сервис.
- Нажмите на «Key Selection».
Минус этого сервиса — он не находит long-tail keywords, а разбивает их на несколько частей. Например, ключевое слово «Ukrainian military» будет разделено на «Ukrainian» и «military», которое будет подсвечиваться во всем тексте.
- Ознакомьтесь с отчетом результатов проверки, а именно:
- количеством ключевых слов такого типа в тексте («Count»);
- насколько представленное ключевое слово коррелируется с темой текста («Relevance»);
- процентом ключевого слова в соотношении ко всем важным словам в тексте (% in core);
- процентом ключевого слова в соотношении ко всем (то есть включая стоп-слова) словам в тексте (% in text).
Стоп-слова — это предлоги и вводные слова. Они автоматически вписаны в работу сервиса и вводить их вручную не нужно.
Использование ключей в тексте также можно проверить ручным методом через функцию «Поиск» любого текстового редактора.
Рекомендую выучить горячие клавиши для вызова этой функции:
- PC — Ctrl + F;
- MacOS — ⌘ + F;
- ChromeOS — Ctrl + F.
Самый важный показатель качества при проверке текста на вхождение ключевых фраз (или слов) — его читабельность. Если в процессе вычитки текста, чтобы понять текст, вам пришлось перечитать фразу несколько раз — предложение нужно переписывать. Помните, что текст пишется для читателя.
Шаг 4. LSI-копирайтинг. Проверка использования LSI
Как уже говорилось ранее, LSI (latent semantic indexing — латентно-семантическое индексирование) — это слова, задающие тематику, за исключением ключевых фраз. Прочитав список этих слов, сразу становится понятно, о чем текст, хотя ни одного ключа в списке нет.
Например, в поиске вбивается слово «плита». Плита — слишком неоднозначный ключ, если рассматривать только его, но, подключив LSI «кухонная, газовая, конфорки, электрическая, техника, доставка», становится понятно, что речь идет о кухонной плите, а не, к примеру, о бетонной.
Существует несколько популярных бесплатных методов для подбора LSI-ключей.
Поисковые подсказки и рекомендации поисковиков
Введя нужное ключевое слово в поисковую строку любой поисковой системы (Google, Bing и так далее), вы найдете предложения выдачи, которое может выступать LSI-словами.
Serpstat
Используйте автоматические сервисы для подбора, такие как Serpstat.
Как использовать Serpstat для поиска LSI-слов?
- Введите нужное вам ключевое слово в пространство «Keyword».
- На панели слева выберите пункт «Keyword research» — «Search suggestions».
- После этого вверху выберите регион поиска. Например, США.
- Опционально можете выбрать теги из числа самых популярных слов «Most popular words».
- Готово. Ознакомьтесь с предложенными вариантам слов, можете отфильтровать их и экспортировать при надобности.
Использование автоматических сервисов как Serpstat сильно облегчает поиск LSI ключей и помогает получить самую точную информацию.
ISTIO
Можно воспользоваться и уже упомянутым сервисом ISTIO, у которого есть богатый функционал для выделения LSI-слов в тексте конкурентов:
- Кнопка «Map» показывает важность разных слов в тексте на основе количества их упоминания. Чем важнее слово для понимания текста — тем оно больше и чернее. Предлоги, вводные слова и аббревиатуры обычно выделяются светло-серым.
- С помощью кнопки «Analysis» вы получите отчет с перечислением всех важных LSI-слов в тексте.
- Нажав на кнопку «Dictionary» получите доступ ко всем словам, кроме стоп-слов, найденных в этом тексте. Их легко можно копировать.
- Справа от анализа находится справка с главными характеристиками текста.
В этом окне можно найти разнообразие полезной информации для понимания качества текста:
- количество символов с пробелами и без них;
- количество всех слов в тексте;
- количество уникальных слов;
- количество «воды» — то есть слов, которые не несут информационную нагрузку;
- «тошнота текста» — частотность повторяемых одинаковых слов, степень спамности текста;
- количество уникальных слов без стоп-слов;
- тема текста (определяется не всегда);
- язык текста;
- 10 самых используемых слов в тексте.
Вся эта информация может помочь довести текст до совершенства и добиться поставленных маркетинговых целей.
Стоит ли доверять показателям «воды» и «тошноты» текста?
Рекомендуется перепроверять результаты автоматического анализа текстов, ведь они довольны относительны и должны рассматриваться только в общем контексте.
Например, ISTIO считает предлоги «водой», но отказаться от них невозможно из-за особенностей английского языка. Такие сервисы помогают увидеть нагромождение и излишества, но они не должны считаться истиной в последней инстанции.
Шаг 5. Вычитка текста
Самый важный этап проверки текста. При вычитке обязательно внимательно и вдумчиво перечитайте текст. Если вы несколько раз перечитываете фразы или предложения, — смело переписывайте их заново или выбрасывайте.
Всегда нужно учитывать целевую аудиторию сайта. Например, текст написанный для молодых мамочек и для профессиональных юристов будет иметь абсолютно разную стилистическую окраску.
Плотность ключевых слов, соответствие тематике, водность и тошнота — все эти показатели не дают точную оценку, в отличие от вычитки.
Главное правило на этом этапе — текст должен легко восприниматься, фразы не должны «резать слух» и статья должна быть интересной.
Отдельно стоит избегать понятия канцеляризма — то есть слишком заумных конструкций и слов, которые усложняют понимание текста.
Какие сервисы использовать для вычитки текста?
Для проверки текстов предлагаю использовать следующие сервисы. Все они имеют платную версию, но основной функционал может быть использован и бесплатно:
- Grammarly поможет найти орфографические и пунктуационные ошибки, а также канцеляризмы на английском языке. Команда Grammarly работает над собственным искусственным интеллектом, который будет помогать улучшать текст. Сейчас дополнение находится в бета-версии и доступно пользователям.
- Hemingway App помогает сделать текст «легче» стилистически. Сервис подчеркивает слишком длинные предложения, злоупотребления страдательным залогом и переусердствование с наречиями. Работает только с английским языком.
- Languagetool тоже подчеркивает орфографические, стилистические и пунктуационные ошибки. В отличие от других сервисов, Languagetool поддерживает множество языков, включая украинский.
В целом, стоит с осторожностью использовать любые сервисы с автоматической проверкой текста, так как они не являются панацеей от ошибок и недопониманий в тексте. Скорее стоит рассматривать их как инструмент, которые поможет предотвратить помарки и «замыленный взгляд».
Универсальные советы для улучшения текста
Есть несколько правил, которым нужно следовать для улучшения общего качества текста:
- Если можете использовать активные глаголы вместо пассивных — сделайте это. Конечно, если это не научный текст, где как раз рекомендуют пассивный залог.
Примеры:
- «юристы защитили подсудимого в суде» звучит лучше, чем «подсудимый был защищен в суде юристами»;
- «наши витамины улучшат ваше зрение» лучше, чем «ваше зрение будет улучшено нашими витаминами».
- Избегайте канцеляризмов и штампов.
Устоявшиеся фразы не всегда звучат красиво. Если вы не используете такие сочетания в обычной речи, то стоит задуматься про их уместность в тексте.
Примеры канцеляризмов:
- проводить поливку цветов = поливать цветы;
- осуществлять молитву = молиться;
- оказывать благотворный эффект = помогать, улучшать.
- Понимайте своего читателя.
Если нужно использовать специализированные термины, профессионализмы, диалектизмы, аббревиатуры, англицизмы или архаизмы — объясните их читателю. Если вы пишете про фейки в молодежном журнале, то можно рассчитывать, что читатели поймут. А вот аудитория журнала про сад и огород может такие слова и не знать.
Англицизмы советую использовать осторожно и по возможности заменять аналогами. Например, в обычном медиа рекомендуется заменять:
- «скамить» на «обманывать, заниматься мошенничеством»;
- «оптимизировать процессы» — «улучшать процессы»;
- идти на «митинг» — «участвовать в онлайн-встрече».
- Если пишете с помощью ChatGPT, то проверяйте все незнакомые слова на стилистические особенности. AI часто использует сложные стилистические конструкции и выражения вместо простых синонимов.
Примеры:
- В английской статье про недвижимость для Турции было использовано слово «covet», что переводится как «возжелать»/«сильно хотеть». Это слово имеет яркое значение и используется в Библии также в контексте «You shall not covet your neighbor's wife» — «Не возжелай жену ближнего своего». По смыслу слово подходит, но стилистически и, самое главное, контекстуально оно слишком сложное для текста на регион с невысоким средним уровнем английского.
- «Familiarize yourself with» обычно можно заменить на простое «learn».
Если не уверены в том, что точно понимаете контекстуальный смысл английского слова или его уместность, то рекомендую проверять себя с помощью Cambridge Dictionary, где отдельно подчеркивается формальность слова.
Чувство текста — вот, что должно быть главным при его проверке. Если взгляд цепляется за какие-то абзацы — то их нужно править. Особенно, если это небольшой коммерческий текст. Если не уверены в его качестве — читайте вслух, ведь это поможет отследить его логичность и последовательность.
Вывод
Проверка текстов — процесс творческий и для него не существует шаблонов и универсальных правил. Проверяйте основные параметры, но обязательно руководствуйтесь здравым смыслом.
Основные этапы проверки текстов:
- Проверка тезисного плана. После вычитки текста, все тезисы должны быть освещены в статье.
- Проверка уникальности. Не тратьте время на неуникальный контент, пользы от него все равно не будет.
- Проверка ключевых слов. Ключи должны использоваться в тексте, но без фанатизма.
- Проверка LSI-слов. Если пишите текст для своего читателя, используете их даже без списка от SEO-специалиста.
- Вычитка текста. Обязательно проверяйте текст на грамотность, пользуйтесь соответствующими сервисами и общими правилами.
По теме
Диджитализация АТБ. Комплексный онлайн-маркетинг для лидера ритейла Украины — кейс
Рассказываем как выстроить комплексную диджитал-стратегию
Что такое админ-панель сайта и как туда попасть
Чтобы попасть в админку сайта, необходимо определить, какая именно CMS используется. Для этой цели подойдет ручной анализ сайта и его HTML-кода, а также онлайн-сервисы
Что такое URL — как создать корректный адрес сайта
Понятные людям и роботам URL. Это уникальный набор символов, который дает возможность идентифицировать всевозможные ресурсы в интернете (страницы сайтов, файлы, изображения, видео и так далее). Чтобы узнать больше, читайте далее!
Свежее
Тенденции дизайна в Украине и мире на 2025 год
Что будет популярным, а что забудется уже через несколько месяцев? Разбираем и приводим примеры
Идентификатор потока данных Google Analytics 4: что это такое, как его найти и установить
В этой статье расскажу, для чего нужен идентификатор потока данных в GA4, как его найти и установить, чтобы начать собирать данные
Как получить целевого подписчика на канал за 10 грн в нише медицины. Кейс Pleso по Telegram Ads
В качестве инструмента мы выбрали Telegram Ads — новую для Украины услугу, которая позволяет получить быстрые результаты и интересует все больше бизнесов.