Делаем правильно кластеризацию семантического ядра

Понятие кластеризации семантического ядра (+группировка)

По сути, алгоритм кластеризации состоит из двух этапов:

  1. Для всех ключевых фраз считываются ссылки (URL) из выдачи (ТОП-5,10,20,50).
  2. Затем они сравниваются между собой на предмет совпадения URL’ов, и фразы с общими наборами попадают в одну группу.

Выполнить данную процедуру для одного запроса, может, и не сложно, но обработать тысячи ключевиков вручную просто нереально. Именно поэтому используются разные программы кластеризации семантического ядра сайта. Их плюсы очевидны:

  • экономия времени;
  • формирования структуры проекта с точки зрения поисковиков;
  • объединение похожих по смыслу запросов (синонимов);
  • проверка совместимости нескольких ключей для продвижения на одной странице;

В KeyAssort есть два вида кластеризации (формирования групп) — Soft и Hard.

При этом задается специальный параметр «сила кластеризации», влияющий на «мягкость» выборки:

  • При Soft методе запрос добавляется в группу, если для него найдено число совпадений с другими URL’ми, большее или равно силе кластеризации.
  • При Hard ключевики попадают в одну группу, только если имеют общее число совпадений, большее или равно силе кластеризации.

Первый вариант лучше подходит для информационных сайтов (более широкая выборка, меньше групп), второй — для коммерческих ниш (точнее, но больше групп). Как правило, информационные заметки содержат много сопутствующей информации по теме статьи, используют синонимы и похожие термины, тогда как в коммерческой нише нужно максимально точное совпадение ключей на странице для выхода в топ.

После кластеризации выполняется группировка семантического ядра (структуризация). Вы анализируете полученные кластеры ключевых слов, формируя из них разделы и страницы сайта

Важно ведь не только написать тексты под все поисковые запросы, но и логически все это оформить для посетителей сайта. 

Частые ошибки в работе с кластеризаторами по ТОПу

Неверно подобрана «сила». Подгоняйте ее, пробуйте разные пороги. Мы кэшируем выдачу, которую получили, и вы можете переформировать выдачу по той же самой тематике достаточно быстро, буквально в течение нескольких минут.

Сделано один раз и «на века». Очень частая история, когда сделали семантику, сделали кластеризацию и дальше все время так будем делать

Важно пересматривать семантику, удалять запросы, которые либо не идут в топ, либо потеряли какую-либо популярность, и добавлять новые запросы, которые появляются в каждой тематике.

Слепое доверие инструментам. Инструмент не может знать лучше специалиста

Специалист должен менять релевантную, если ему кажется, что что-то не так.

Этап 1. Кластеризация

Кластеризация — это группировка ключевых фраз на основе схожести результатов поисковой выдачи по ним.

В отличие от группировки на основе семантической близости, кластеризация позволяет избежать ошибок, связанных с размещением на одной странице запросов с разным интентом.

Например, фразы «картина для спальни купить» и «картины для спальни» при группировке на основе семантики наверняка бы попали в одну группу. Но если посмотреть на поисковую выдачу по ним, то она окажется разной.

Для кластеризации есть онлайн-сервисы (Just Magic, PixelPlus, PromoPult и др.) и десктопные программы (KeyAssort, KeyCollector). Работают они по похожему принципу (разве что в KeyCollector кластеризация требует специфической подготовки): загружаете список запросов, указываете регион, точность кластеризации и получаете сгруппированное ядро.

При кластеризации особенно важно задать правильную точность — количество совпадений результатов выдачи в ТОП-10, при котором фразы попадают в одну группу. Например, при точности 3 запросы попадут в один кластер, если в выдаче по ним будет три и более одинаковых результата

Если точность низкая, то кластеры получаются слишком обширными, а если высокая, то ядро может быть излишне раздроблено.

Чтобы не гадать и не переплачивать за лишние итерации, удобнее всего задать точность диапазоном. В этом случае вы получите несколько кластеризованных ядер, но заплатите только один раз. Такая функция есть в кластеризаторе PromoPult. Задаем точность от 3 до 7, устанавливаем приоритетную поисковую систему, регион и запускаем процесс:

Загружаем отчет и сравниваем результаты кластеризации при разной точности. Наша задача — выбрать «золотую середину», чтобы кластеры были и не слишком обширными, и не раздробленными. В нашем примере оптимальной видится точность 6.

Например, есть кластеры «деревянные подсвечники» и «купить свечи в интернет магазине». Мы не можем размещать эти кластеры на одной странице — у них разный интент. Но на сайте товарные группы с такими названиями расположены как раз на одной странице, что с точки зрения оптимизации неверно.

Логика подсказывает: почему бы просто не создать раздел «Свечи» и оптимизировать его под кластер «свечи купить», а раздел «Подсвечники, канделябры, свечи» переименовать в «Подсвечники» и оптимизировать под «деревянные подсвечники»?

Но все не так просто: а что делать с другими кластерами вроде «подсвечник в подарок»? Размещать в разделе «Подсвечники»? Или «Праздники»? Или еще каком-то? И таких кластеров около 200 — и каждый из них по-своему «проблемный».

Кластеризация ключевых слов сайта

Именно последний шаг в создании семантического ядра вызывает много вопросов. Дело в том, что первые этапы (кроме первого) более менее автоматизированы. Не нужно много усилий, чтобы провести сбор запросов и сделать их анализ. А вот этап группировки ключевых слов требует от веб-мастера максимум временных и умственных затрат. Поэтому и возникают различные ошибки. Наша с Вами задача — их не допустить!

Что такое группировка ключевых слов

Группировка (или кластеризация) ключевых слов — это процесс распределения поисковых запросов одной тематики (группа запросов) для продвижения одной страницы. Почему одной? Ответ Вы найдете в моем практическом мануале о каннибализации поисковых фраз.

Другими словами, с помощью этого этапа найденные словосочетания формируем в отдельные смысловые группы. Каждая группа внедряется только на свою продвигаемую страницу и решает одну задачу (общую для всех запросов этой группы):

Таким образом, все запросы группы соответствуют главной теме конкретной целевой страницы. Все они раскрывают цель конкретного документа сайта с той или иной стороны.

Более детально о понятии кластеризации семантического ядра Вы можете изучить в этом посте. В нем Вы найдете историю появления этого вида seo-работы, увидите наглядный пример по группировке запросов.

Еще под кластеризацией поисковых запросов понимается автоматизированный сбор фраз путем взаимодействия сервиса со страницами в поисковых выдачах. Об этом я подробнее расскажу, когда речь пойдет об одноименной услуге Топвизора.

Что дает грамотная кластеризация ключей для сайта

  • видение будущей полноценной структуры нового сайта (или старого);
  • путеводитель по темам, которые интересны пользователям из поиска;
  • понимание текущего спроса на товары/услуги в конкретной нише;
  • план seo-продвижения (какой контент формировать в первую очередь);
  • для проведения правильной перелинковки веб-ресурса;
  • для формирования длинного хвоста поисковых запросов;
  • материал, из которого видны запросы для оптимизации страницы.

Поясню один важный момент. Кластеризация в группы дает колоссальную возможность использовать все ресурсы для привлечения максимального поискового трафика! Не делая группировку поисковых запросов, мы тем самым отсекаем свой сайт от освящения тем, которые нужны пользователям из Яндекса и Гугла.

Об этом подробно можно прочитать в статье о создании современного МФА сайта (основана на докладе Алесандра Люстика, автора программы Key Collector).

Что сулит неправильное распределение ключевиков

Итак, не имея распределенных групп по большой теме, владелец веб-ресурса не видит полноту всей картины продвижения. Это самая большая проблема, которая возникает при игнорировании этапа кластеризации (или ее неполноценного совершения).

Но даже наличие этого шага в Вашем плане продвижения не может гарантировать Вам достижения всех назначенных seo-задач. Это может произойти из-за ошибок, которые возникают при группировке запросов на целевые страницы. Вот проблемы, которые дает неправильное распределение ключевых слов:

  • появление дублей в индексах поисковых систем (за счет каннибализации);
  • потеря или не получение мест в первой десятке поисковой выдачи;
  • потеря денег, затраченных на формирование «лишнего» контента;
  • ухудшение поведенческих факторов, не достижение поставленных целей.

Как говорил один известный киношный персонаж «Картина маслом». По-другому тут и не скажешь. В современном поисковом продвижении нельзя делать «чуть-чуть» или оставлять что-то на потом. Все нужно выполнять вовремя и со смыслом. Кластеризация семантического ядра — это тот этап, после которого на скелет сайта нанизывается «мясо» (контент). И здесь любая ошибка превращает seo-раскрутку сайта в настоящий апокалипсис. Проблемы возникают там, где их не ждут.

Кластеризация в Rush Analytics

У нас есть модуль кластеризации и 3 типа кластеризации:

По Wordstat. Самый простой и менее затратный по времени с точки зрения оптимизатора метод. Идеально подойдет для ситуаций, когда мы не знаем о структуре сайта практически ничего.

1) В Excel загружаете в одну колонку ключевые слова, в другую — частотность по Wordstat, и отправляете на кластеризацию.

2) Мы сортируем весь список по убыванию: наверху получаются самые частотные слова (обычно самые короткие).

3) Алгоритм работает так: мы берем первое слово, пробуем привязать к нему все остальные слова, группируем. Все, что привязалось, вырезаем, делаем сортировку заново и опять повторяем эту итерацию.

4) Из списка ключевых слов мы получаем набор кластеров.

По маркерам

1) Мы знаем маркерный запрос (основной запрос страницы или несколько запросов, под которые она продвигается).

2) Мы берем список ключевых слов, в колонке справа единицами отмечаем маркерные запросы, и нулями — все остальные запросы.

3) Мы берем маркерное ключевое слово и пытаемся привязать к нему остальные ключевые слова и сгруппировать в кластеры

Здесь важно, что в этом алгоритме маркерные слова, которые мы пометили единичками, никогда не будут связаны между собой. Мы не будем пытаться их привязать

Комбинированная кластеризация

Этот алгоритм совмещает в себе два предыдущих

1) Мы загружаем ключевые слова, отмечаем «маркер/не маркер» и частотность.

2) Привязываем к маркерным запросам все слова, которые мы можем привязать.

3) Берем ключевые слова, которые остались не привязанными, и группируем их между собой по Wordstat.

4) Все остальное откинется в «некластеризованные».

5) В итоге — структура, которую мы уже знаем. Также получится автоматическая кластеризация всех остальных ключевых слов, что поможет нам расширить структуру. Все эти типы кластеризации есть в Rush Analytics.

Какие еще есть инструменты на рынке?

Из достойных, кроме Rush Analytics, можно выделить сервис JustMagic, где есть и Hard и Soft кластеризация. Сервис разработал Алексей Чекушин.

Это все, что вам нужно знать о кластеризации, чтобы начать работу по группировке ключевых слов.

Используйте кластеризацию и экономьте свое время. К тому же, люди часто ошибаются, процент ошибок оптимизатора — порядка 15%. Доверьте рутину роботам — не нужно разбирать это руками.

Хорошие статьи в продолжение:

— Как сделать семантическое ядро сайта — пошаговое руководство

— Подбор ключевых слов для англоязычного сайта — пошаговое руководство

Когда кластеризация по ТОПу не работает, и что делать в этом случае SEO-специалисту?

Даже в текущем примере кластеризация по ТОПу работает неидеально. Мы видим, что у нас здесь разные релевантные. С этим надо что-то делать.

Может ли группировка по ТОПу обманывать?

Когда группировка по ТОПу может обманывать и давать не совсем корректный результат? На самом деле ситуаций достаточно много, как минимум пять:

Вы неверно выявили и поставили пороги. То есть вы сказали, что нам достаточно одного одинакового адреса в выдаче по двум разным запросам, и у вас получилось, что какой-то случайный документ, например, Википедия, присутствует в топе по 300 запросам. У вас, соответственно, сформируется огромный кластер в 300 запросов, и вы думаете, что вы сейчас создадите один документ и продвинете 300 запросов. Это первая проблема.

Новая тематика, которая только недавно появилась. Выдачу сильно штормит, все время появляются какие-то новые статьи, новостные результаты с разных ресурсов. В этом случае, скорее всего, кластеризация по ТОПу сильно не поможет, потому что состав выдачи сильно меняется. И не факт, что он вообще релевантен потребностям пользователей. То есть интент всегда первичен.

У вас много микро и низкочастотных запросов и, вообще, запросов длиной 6 слов и более. В этом случае, скорее всего, у поисковой системы недостаточно данных о поведении пользователя на выдаче, качество выдачи тоже, скорее всего, низкое

Если вы кластеризуете такие вот низкочастотные «хвосты», то вам имеет смысл обращать внимание и на потребность пользователя. Иначе кластеризация будет работать для вас неидеально.

Довольно редкий, но интересный кейс, когда в выдаче много результатов с одного сайта

Многие кластеризаторы начинают в этот момент врать. Например, если мы собираем тематику по кредитам, и у нас содержится слово «кредит Альфа-банк» (условно), и вы хотите в топ по этому запросу, то результатов с Альфа-банка может быть достаточно для того, чтобы склеивать большое количество запросов, разных по потребности, в один кластер просто потому, что в выдаче содержится детальный ответ и несколько результатов с одного сайта. Когда такое встречается, требуется дополнительная рекластеризация, пересмотр кластеров.

Большое количество «примесей». В том случае, если вы не фильтруете результаты на входе, то, скорее всего, получите слишком много мелких групп (когда запросы можно было бы объединить, если бы вы почистили выдачу, и у вас было бы больше одинаковых URL-адресов в выдаче).

Вот как минимум пять кейсов, в рамках которых неидеально работает группировка по ТОПу. Поэтому, когда говорят, что сделали по группировке и дальше будут действовать исходя из нее, на самом деле это не совсем так.

Что делать в этих случаях?

  • Включать голову. Понятно, что это крайние случаи, когда группировка может сильно врать. Но даже в случае, если у вас устоявшаяся тематика, требуется включать голову и оценивать интент пользователя. Оценивать, что он хочет получить в ответ. Помните, что Пиксель Тулс дает некую технологию, а конечное решение о том, какой конкретно URL-адрес продвигать, принимать вам.

  • Менять метод и «силу». Рекомендуем «прогонять» семантику с несколькими порогами. То есть эта «сила» может быть 2, 3, 4. То есть количество одинаковых URL-адресов по разным документам, которое должно быть минимальным в топе, для того чтобы мы эти запросы сформировали в кластер. Либо даже в ряде случаев «прогонять» в другой поисковой системе.

Что такое семантическое ядро и почему оно так важно?

Перечень ключевых слов и фраз, которые характеризуют направление и тематику сайта, называют семантическим ядром. Оно позволяет понять, пользуется ли спросом информация, товар, услуга, и выстроить грамотную структуру ресурса.

Термин «семантическое ядро» встречается часто. Что это такое? Поговорим о механизме работы поисковой системы. Мы вводим запрос (ключевое слово) и получаем перечень страниц, максимально релевантных нашему запросу и оптимизированных под него. Семантическим ядром считается список всех ключей, используемых для продвижения сайта.

Вам обязательно нужно знать и понимать, какие сведения и по каким запросам человек может найти на веб-ресурсе. Если вы не знаете этого, востребованным сайт никогда не станет. То есть SEO-продвижение невозможно без формирования семантического ядра.

Веб-сайт должен привлекать всю целевую аудиторию (ЦА). Для этого требуется:

  • сбор полного семантического ядра. Помните, что на один запрос не делают одну страницу;
  • кластеризация запросов. После сбора всех ключевых слов их нужно объединить в группы. В них может быть как 5, так и 25 ключей. Каждая группа предназначена для решения одной задачи;
  • определение посадочной страницы. Одна страница — на одну группу. На сайте не должно быть двух страниц, решающих одну задачу.

Если вы заинтересованы в нормальном SEO-продвижении своего ресурса, соберите все возможные ключи. Возьмем сайт строительной компании. При выборе запросов мы понимаем, что жилье можно разбить по типам: дом, таунхаус, квартира и т. д. Соответственно подбираются следующие ключевые запросы: купить дом, купить квартиру, купить таунхаус, купить дом с ремонтом и пр.

Итак, мы разбили запросы на все способы и типы. Сейчас наша задача — разместить информацию. Необязательно помещать всё в меню веб-сайта. Лучше распределите данные по страницам разделов и подразделов, создайте блок фильтров. Так вы раскидаете все запросы по сайту и получите дополнительный трафик.

Поэтапное формирование семантического ядра выглядит так:

  1. Сбор ключевых запросов из многочисленных источников.
  2. Очистка ядра от неподходящих запросов.
  3. Объединение и группировка запросов.
  4. Формирование структуры сайта под данное ядро.

Залог качественного SEO-продвижения сайта заключается в грамотном формировании семантического ядра. Оно несет смысловую нагрузку вашего ресурса. Если человек по запросу не может получить полные (релевантные) сведения о вашем сайте, придется с ним (с сайтом) поработать.

Формирование качественного семантического ядра — долгий процесс. Кто-то предпочитает сбор семантики вручную, но большинство веб-студий делают это автоматизировано, используя специальные сервисы. Как подобрать запросы, что брать за основу? Поговорим об основных источниках ключевых слов.

В первую очередь нужно проанализировать информацию, товары или услуги, которые уже размещены или скоро появятся на сайте. Это — самое главное при работе с семантическим ядром. Ваша задача — максимально глубоко проанализировать проект и понять специфику ниши. У многих веб-специалистов нет возможности полностью изучить чужой бизнес, а потому в этом вопросе непременно нужно взаимодействовать с клиентом. Так, например, вы можете согласовать весь перечень поисковых фраз.

Яндекс-статистика запросов в поисковиках — прекрасное решение для оптимизаторов, позволяющее узнать, что пользователи ищут в Интернете. Всё, что вам нужно сделать — зайти на сервис wordstat.yandex.ru. Подобный инструмент есть и у Google: частота запросов www.google.ru/adwords/. Сервисы предназначены для использования контекстной рекламы, однако и для SEO-оптимизации тоже подходят.

Статистика сайта — отличный источник ключевых слов. Её также необходимо тщательно анализировать, особенно если у сайта уже есть хороший трафик. Накопленные данные позволяют оценить запросы и трафик поведения пользователей на странице (число просмотров, проведенное время, количество отказов).

Чтобы легко и быстро создать качественную структуру сайта, нужно проанализировать веб-ресурсы конкурентов. Необходимо лишь найти нескольких лидеров в вашем сегменте, у которых SEO-структура сформирована грамотно.

Далее есть несколько вариантов:

  • анализ видимости конкурентов в поисковиках и получение списка их ключевых слов. Формирование семантического ядра на основе данных запросов или дополнение своего отсутствующими;
  • сбор лучших решений из структуры нескольких сайтов конкурентов и создание своей идеальной.

Сервисы поисковых систем

Поисковики предоставляют собственные бесплатные сервисы для анализа и подбора ключевых слов.

— Яндекс Вордстат
Подбор ключевых слов от Яндекса. Можно задавать регион и искать связанные слова, смотреть популярность запросов.

— Рамблер Вордстат
Статистика по запросам от Рамблера. Можно выбирать период и проверять сезонность запросов. Также позволяет узнать популярность запроса в разных странах и российских регионах.

— Keyword Planner от Google
Подбор запросов от Google. Можно настроить поиск не только слов из органики, но и видео-запросов с YouTube.

— Статистика запросов от Mail.ru
Реальные запросы в Mail с демографической статистикой. Хорошо показывает, что некоторые высокочастотные фразы не такие уж высокочастотные.

— Тренды Google
Поиск трендовых (быстрорастущих) запросов, текущих, за период или в разных странах.

— Google Correlate
Поиск слов, коррелирующих с заданным. Производится на основе поведенческих данных (одинаковой активности пользователей по разным запросам).

Группировка по намерениям (интенту) пользователей

Люди, которые вводят в поиске название вашего товара или услуги, руководствуются разными намерениями — одним нужен товар для личного пользования, другим — оптовая партия, третьим — вообще монтаж.

Так мы получаем три группы объявлений — для тех, кому нужны:

  • двери в свою квартиру;
  • оптовая партия дверей;
  • услуги по установке.

Запросы с разным интентом разносим в разные группы

А если бы мы сгруппировали эти ключи по морфологическому принципу и взяли за основу фразу «межкомнатные двери», то они бы попали в одну группу.

Есть разные механики группировки по интенту. Самый простой вариант — в группы заносятся слова в широком соответствии. Но в этом случае сложно контролировать показ объявлений по нужным словам. Потребуется длительная и тщательная минусовка.

Есть подход IBAGs, который в Store Growers. Суть в том, что каждый ключ заносится в группу в трех типах соответствия: точном, фразовом и с модификатором (для Google Ads). Широкое соответствие не используется. В этом случае уменьшится процент нецелевых показов.

IBAGs является вариацией SKAG-подхода (мы еще ) — с той лишь разницей, что в каждой группе не один ключ в трех типах соответствия, а несколько ключей в тех же трех типах соответствия.

Когда применять

Группировка по поисковому интенту может принести лучший результат, чем по продуктовому или морфологическому принципу. Но она требует больше ресурсов. Поэтому метод целесообразно использовать:

  • в сложных нишах с длительным сроком принятия решения о покупке/заказе, высокой конкуренцией и дорогим трафиком;
  • в любых нишах — при небольшом объеме семантического ядра, когда не придется тратить недели на группировку.

Плюсы:

  • Объединяя ключи по намерениям, мы можем написать для группы более релевантное объявление, чем при группировке по продуктовому принципу. Это повысит CTR, рейтинг объявления и конверсию.
  • Анализируя намерения пользователей, мы уделяем больше внимания смыслу поисковых запросов, а значит, не добавим в одну группу похожие морфологически, но разные по смыслу фразы.

Минусы:

  • Группировка более затратна по времени и сложнее автоматизируется, чем разделение по морфологическому принципу, потому что нужно просмотреть все запросы и выбрать слова со схожими намерениями. И это основной минус. Частично решить проблему трудоемкости помогает кластеризация — на ней мы .
  • При таком подходе в группу попадут разные слова. Не все из них получится вписать в заголовки и тексты объявлений. Но при желании можно или увеличить количество объявлений, или использовать динамическую вставку ключевых слов.

Разные по морфологии слова с похожим интентом

Заключение

Я рекомендую всегда применять кластеризацию при продвижении сайта, независимо от количества продвигаемых запросов. Исключение составляют только тематики, в которых конкуренция сверхнизкая – качественная группировка запросов по методу топов в таких тематиках практически невозможна ввиду отсутствия в выдаче релевантных ответов.

Главное преимущество использования автоматической кластеризации — это, прежде всего, ускорение работы, что особенно актуально при разборе больших ядер. Используя кластеризаторы, SEO-специалист может разгруппировать огромное количество запросов всего за несколько часов, раньше на выполнение такого же объема работы могли уйти недели или даже месяцы.

Автоматическая кластеризация не дает 100% точного результата, в большинстве случаев кластеры необходимо дорабатывать вручную. Но она существенно упрощает работу оптимизатора, позволяет создать максимально правильную структуру сайта и подготовить грамотные ТЗ.

Материалы по теме:

Выводы

Сервисы по сбору семантики предоставляют разные ключевые слова: у всех разные базы данных и источники информации. Чем больше инструментов задействуется, тем полнее картина.

Но если вы выбираете качественный сервис для расширения семантического ядра, обращайте внимание на такие характеристики:

  • размер базы поисковых запросов и частота ее обновления;
  • выбор источника поисковых запросов (Google, Yandex, Bing);
  • показ актуальных частотностей ключевых слов;
  • возможность подбора синонимов для ключевых фраз в отдельном отчете;
  • присутствие загрузки поисковых фраз для расширения списком, а не по одному слову;
  • доступность баз поисковых фраз на всех языках и для всех стран мира;
  • возможность искать поисковые подсказки для ключевых фраз;
  • возможность добавлять список минус-слов в конкретной тематике.

После первого сбора ключевых фраз стоит еще раз пересмотреть высокочастотные, среднечастотные запросы, собрать список из частотных запросов, которых не было в базовом списке, и повторно выгрузить по ним семантику повторно.

Оцените статью
Рейтинг автора
5
Материал подготовил
Илья Коршунов
Наш эксперт
Написано статей
134
Добавить комментарий