Семантическое ядро
Модуль 2Сбор и чистка3/5

Чистка семантического ядра: что выкидывать и почему

5 мин чтения

Сырое ядро после сбора — это всегда смесь. Из 500 запросов реально твоих — 200-300. Остальное — мусор, который, если оставить, испортит и кластеризацию, и трекинг, и страницы. Чистка — это этап, который отделяет любительский подход от профессионального.

Разберём по категориям.

Семь категорий мусора в сыром ядре
КатегорияПример (ниша: торты)Что делать
Информационные при коммерческом сайтекак испечь медовиквыкинуть или в блог
Гео-промахиторт спб (а ты в Москве)минус-слово региона
Не твой подвид товарасвадебный торт (ты — детские)минус-слово
Бренды конкурентовторты от Палыча, тортычаминус-слово
Опт / wholesale (если ты розница)торты оптом, оптминус-слово
Видео / картинкиторт видео, торт фотоминус-слово
Низкое качество / DIYсвоими руками, лайфхакминус-слово или в блог
Если хотя бы половина из этих категорий есть в твоём ядре — без чистки кластеризация будет хаотичной.

Категория 1: информационные при коммерческом сайте

Самый частый мусор. Если у тебя коммерческий сайт (магазин, услуги), а в ядре полно запросов «как», «что такое», «почему» — они не твои. Их интент не покупка, а обучение.

Что делать: либо выкинуть полностью (если они тебе вообще не нужны), либо отложить в отдельный «блог-список» — туда пойдут информационные статьи, которые будут привлекать трафик в воронку, но не на основные коммерческие страницы.

Маркеры в запросе: «как», «что такое», «почему», «зачем», «отличие», «история», «причины», «виды».

Категория 2: гео-промахи

Если ты в Москве — все запросы с другими городами выкидываются. Это просто: «торт спб», «торт екатеринбург» — нет.

Лайфхак: в Wordstat ты сразу можешь поставить регион «Москва», и большинство гео-промахов не попадёт в выдачу. Но в правой колонке («запросы, похожие на») — всё равно бывает мусор из других городов. Их выкидываем.

Маркер: название города или региона, отличающееся от твоего.

Категория 3: не твой подвид товара/услуги

Если ты продаёшь только детские торты, а в ядре «свадебные торты» — это запрос не твой. Просто потому, что Wordstat включает в выдачу всё со словом «торт», и часть из этого — не для тебя.

Маркеры: прилагательные перед основным словом, которые отличают подкатегорию. «детский / взрослый», «мужской / женский», «эконом / премиум», «для ИП / для ООО».

Решение зависит от стратегии:

  • Сужать ядро: оставить только свой подвид. Минимум мусора, чище кластеры.
  • Расширить бизнес: добавить новые подвиды в продукт. Иногда сбор ядра показывает спрос на смежное, о чём ты не думал.

Категория 4: бренды конкурентов

«торты палыч», «торт волшебница», «у пушкина торт» — это конкуренты, по их брендам ты не выиграешь и не должен. Ранжироваться по чужому бренду — это либо обманывать юзера (он искал конкретный магазин), либо ловить мизерный CTR.

Что делать: минус-слова с названиями конкурентов. Заодно при чистке ты узнаешь, кто твои основные конкуренты — список пригодится позже для анализа.

Категория 5: опт / wholesale

Если ты розничный магазин, а в ядре «торты оптом», «опт москва», «закупка тортов» — это B2B-запросы, не твоя аудитория. И наоборот: если ты оптовик, выкидываешь розничные.

Маркеры: «оптом», «опт», «закупка», «прайс», «для бизнеса», «b2b», «для перепродажи», «дилеры», «франшиза».

Категория 6: видео / картинки / музыка

Это запросы, где юзер ищет контент, а не покупает: «торт видео», «торт фото», «торт раскраска», «торт мультик». Не твой клиент.

Маркеры: «фото», «картинка», «видео», «обои», «раскраска», «песня», «мультик», «игра».

Категория 7: DIY / своими руками

Запросы вида «торт своими руками», «как сделать торт» — снова информационный интент, но особенно опасный, потому что часто формулируется похоже на коммерческий. Юзер хочет сделать сам, а не купить.

Маркеры: «своими руками», «самостоятельно», «как сделать», «инструкция», «лайфхак», «мастер-класс».

Если в твоём бизнесе можно продавать наборы для DIY (готовые ингредиенты + рецепт) — этот мусор для тебя превращается в золото. Если нет — выкидывай.

Как чистить технически

В Excel/Google Sheets:

  1. Загружаешь список в одну колонку (например, A).
  2. В колонке B пишешь категорию мусора, если запрос подходит под одну из семи.
  3. Фильтруешь по пустым в колонке B — это твоё рабочее ядро.

Или через AI: можно вставить весь список в AI-помощника с промптом «разложи эти запросы по категориям мусора и оставь только коммерческие московские запросы про детские торты». Claude/GPT справляются с такой задачей быстро, особенно на 200-500 запросах.

Для нашего сервиса есть бесплатный разбор интента — он размечает запросы по типам (коммерческий / информационный / навигационный / транзакционный / смешанный), и информационные ты сразу видишь.

Минус-слова для Wordstat и рекламы

Дополнительный бонус чистки: ты собираешь стоп-лист для всей ниши.

Стоп-лист — список слов, по которым ты НЕ хочешь показываться. Используется и в Wordstat (чтобы при следующих ресёрчах не лезли эти запросы), и в Яндекс.Директе (чтобы реклама не показывалась по нерелевантным запросам).

Для детских тортов в Москве типичный стоп-лист:

оптом
опт
закупка
рецепт
своими руками
как сделать
мастер-класс
видео
фото
картинка
свадебный
взрослый
спб
екатеринбург
краснодар
... (все нерелевантные города)
... (все нерелевантные подвиды)

Этот стоп-лист пишется один раз и потом переиспользуется при каждом расширении ядра.

Дубли — отдельная боль

После чистки часто остаются почти-дубли:

  • «купить торт москва» и «торт москва купить» (одно и то же по сути)
  • «торт на заказ» и «заказать торт» (одно и то же)
  • «детский торт» и «торт детский» (одно и то же)

Wordstat считает это разными фразами и показывает разные частотности. Поисковые системы давно считают их одним и тем же запросом (это про нормализацию — почему «купить» и «куплю» — одно).

Решение: при чистке ты оставляешь в ядре только одну фразу из каждой пары почти-дублей. Это убирает 10-30% «фантомных» запросов.

Сколько занимает чистка

Сырое ядро на 500 запросов чистится за 60-90 минут вручную или 15-20 минут с AI-помощью. Это того стоит: после чистки кластеризация даёт в 2-3 раза меньше кластеров (без дублей), и каждый кластер — точно твой.

Частые вопросы

Что делать с информационными запросами на коммерческом сайте?

Не выкидывать — отложить в «блог-список». Эти запросы привлекают тёплый трафик: люди читают, узнают о теме, потом покупают. Просто не делай под них основные коммерческие страницы.

Как составить стоп-лист минус-слов?

Пройдя сырое ядро 1 раз, ты получаешь готовый стоп-лист: все слова из мусорных категорий выписываешь в файл. Дальше переиспользуется при каждом расширении ядра.

AI быстрее чистит ядро, чем я вручную?

Да, в 3-5 раз. Вставляешь 500 запросов в Claude/GPT с промптом про категории мусора — получаешь готовый размеченный список за 5 минут вместо 60 минут вручную.

Следующая статья: подсказки поиска — бесплатный источник 1000+ идей для хвоста.

Читайте дальше