Решение... Советы... Windows 10

Кластеризация запросов — правильная группировка ключевых слов семантического ядра. Группировка ключевых слов Кластеризация запросов для директа

Группировка ключевых слов (или по-другому кластеризация запросов) — это разделение ключевых слов на однородные группы по определенным признакам. Производится для повышения релевантности между ключевыми словами и рекламными объявлениями. В результате улучшается качество рекламных кампаний и понижается стоимость клика по объявлению.

При подготовке рекламных кампаний группировка ключевых слов занимает достаточно много времени. Некоторые специалисты используют подход «1 ключевое слово – 1 группа объявлений», который отбрасывает необходимость группировки и экономит время. Но его не всегда удобно использовать, особенно при большом количестве низкочастотных ключевых слов. Если была произведена кластеризация ключевых слов, то есть разбиение на смысловые группы , то структура рекламной кампании становится более понятной и проще анализируемой.

Группировка ключевых слов и поисковых запросов с помощью PPC tool

Группировка ключевых слов was last modified: Март 24th, 2017 by сайт

В своей предыдущей статье: « » я назвал кластеризацию одним из основополагающих факторов успеха в продвижении. В этой публикации я подробно разбираю, что такое кластеризация, и как правильно применять её.

Что такое кластеризация?

Это автоматическое объединение запросов в группы, которое решает две важные задачи:

  1. Объединение похожих запросов (с одинаковым «интентом») вне зависимости от их семантической схожести. («интент» = намерение пользователя). Например, запросы «снять квартиру» и «аренда квартир» - выражают одно и то же желание пользователя.
  2. Проверка совместимости продвигаемых запросов: можно ли их продвинуть на одной странице в топ Яндекса одновременно . Т.е. возможно ли подстроить оптимизацию страницы под все эти запросы. Или же какие-то запросы требуют выноса на отдельную страницу.

Из всех существующих сегодня методов наиболее эффективно эти задачи решает, так называемая, «кластеризация по топам », когда запросы сравниваются по количеству одинаковых URL-ов в топ-10 Яндекса.

Теперь поговорим о каждом пункте подробнее.

Объединение запросов с одинаковым интентом

Что такое запросы с одинаковым интентом ? Это разные запросы, в которых человек, на самом деле, ищет одно и то же. Очевидно, что запросы «телевизоры самсунг » и «телевизоры samsung » должны продвигаться на одной странице. Но это - явные вещи.

Однако существуют и куда менее очевидные примеры:

  • «спецодежда» - «рабочая одежда»
  • «ипотека» - «кредит под залог квартиры»
  • «автоломбард» - «кредит под залог авто»

Семантически эти пары совсем не похожи, но фактически обозначают одно и то же. Классические способы поиска таких запросов, обладающих единым интентом (намерением пользователя), основываются на синонимах. Как правило, с этой целью используют словари синонимов или синонимы Яндекса . Однако в обоих методах есть свои серьезные минусы.

Если мы будем пользоваться словарями синонимов, то найдем там весьма странные связи. Например, согласно одному из самых популярных словарей, синонимом к «мобильный телефон» являются:

  • мобила
  • мобильник
  • радиотелефон
  • сотовик
  • сотовый телефон
  • телефон
  • эбонитовый друг

Сотовый телефон - однозначно полезный синоним. А вот «радиотелефон» - совершенно другой тип товара. Ну а кто такой «эбонитовый друг», остается только догадываться.

Второй вариант поиска синонимов - попытаться «выцепить» их из подсветок Яндекса. Но это сопряжено с двумя проблемами:

Во-первых, подсвечиваются не только синонимы, но и другие слова. Например, в подсветку по ключевой фразе «сотовые телефоны» попадает не только синоним «мобильные», но и: «цены», «москва», «купить», «каталог», которые подсвечиваются по другим причинам. В целом, это проблема решаемая, обходные пути есть.

Во-вторых, синонимы в Яндексе являются невзаимными . Например, вхождение «мобильные телефоны» является синонимом к запросу «сотовые телефоны», а в обратном порядке это уже не работает. «Сотовые телефоны» не будет синонимом к «мобильные телефоны», и этот момент становится критически важным. Как понять, что запрос «сотовые телефоны» соотносится с запросом «мобильные телефоны», если слово «сотовые» по нему не подсвечивается?

Наконец, как вы поймете, что запросы «ювелирный магазин», «ювелирные изделия» и «ювелирные украшения» обладают одним интентом, если, с точки зрения Яндекса, они не являются синонимами?

Решение проблемы приходит через кластеризацию запросов по топам. Нахождение в топе одинаковых URL-ов сигнализирует об одинаковом интенте. Вот пример работы кластеризатора just-magic:

Вроде бы, кластеризатор все правильно объединил: «мобильные телефоны» положил в одну группу с «сотовыми», а «ювелирные изделия» — в группу, где присутствует «ювелирный магазин». Почему же тогда «ювелирные украшения» попали в отдельную группу, несмотря на то, что тематика здесь та же (это видно по столбцу «spec-grp»)?

Ответ на этот вопрос приводим в следующей части статьи.

Проверка совместимости продвигаемых запросов

Для продвижения нам не просто нужно собрать на странице похожие запросы, необходимо еще и проверить их совместимость.

В Яндексе нет единой формулы ранжирования под все запросы. Запросы делятся на большое количество типов. И формулы для разных типов запросов часто предъявляют к странице взаимоисключающие требования для попадания в топ. Причем часто визуально эти запросы очень похожи. Например, запросы «смартфон» и «смартфоны». Первый — некоммерческий, геонезависимый. Второй - коммерческий геозависимый. Как видно, в данном случае единственное и множественное число - несовместимы на одной странице!

Если вы вдруг подумали что это логично, то вот другой пример: запросы «ноутбук» и «ноутбуки». Они оба коммерческие и геозависимые и прекрасно совмещаются на одной странице.

Коммерческость и геозависимость - лишь два самых очевидных признака. На самом деле, их намного больше. Например, главную или внутреннюю страницу поиск хочет видеть в топе по запросу. Когда мы не знаем всего многообразия признаков, единственный способ определить возможность совместного продвижения запросов на странице - это посмотреть, есть ли URL-ы, которые одновременно показываются по двум запросам, и подсчитать, сколько их.

Логика здесь следующая:

  • Если по запросам в топе находятся одинаковые URL-ы, значит их можно продвинуть на одной странице.
  • Если по запросам общих URL-ов нет, то мы не знаем, возможно ли продвинуть запросы на одной странице. Скорее всего, это невозможно.

И здесь мы сталкиваемся с вопросом: как именно объединять запросы на основании топов? Я различаю два метода - так называемые, «soft» и «hard» кластеризации.

Следующая картинка наглядно объясняет разницу между ними:

Soft-кластеризация сводится к следующему: для формирования группы берется один «центральный» запрос и все остальные сравниваются с ним по количеству общих URL-ов в топ-10 Яндекса. Если количество общих URL-ов превышает порог - запрос добавляют в группу.

При hard-кластеризации запросы объединяют в группу, только если есть общий для всех запросов набор URL-ов, который показывается по всем этим запросам в топ-10.

Soft-кластеризация дает группы бὸльшего размера, но часто ошибается в определении возможности совместного продвижения запросов на странице.

Классический пример : представим себе, что в качестве «центрального» был выбран запрос, по которому в топе 5 главных и 5 внутренних страниц. К нему могут оказаться привязаны два запроса, у одного из которых в топе 10 «морд», у другого - 10 «внутряков». Очевидно, что из этих трех запросов мы можем продвинуть только два (в зависимости от типа страницы, который выберем - главная или внутренняя). В случае hard-кластеризации появление такой группы невозможно.

Но это все лирика. Перейдем к численным оценкам.

Итак, у нас есть два критерия оценки кластеризации:

  1. Насколько полно собрана группа запросов. То есть, попали ли в неё все запросы, имеющие один и тот же «интент». За 100% возьмем ситуацию, когда все запросы с одним интентом - попали.
  2. Насколько попавшие в группу запросы совместимы между собой. За 100% возьмем ситуацию, когда все попавшие в кластер запросы совместимы между собой.

Ключевой параметр кластеризации - минимальное количество общих URL-ов для образования группы. Это число называют «порогом кластеризации ». Чем он выше - тем точнее получаемые группы, но при этом они закономерно уменьшаются в размерах. Экспериментальным путем было определено, что минимальный рабочий порог для «hard»-кластеризации - 3 URL-а, для «soft» - 4 URL-а. Работать с меньшим числом - нет смысла: слишком много «левых» запросов попадает в группы.

Вот пример результатов для разных порогов для hard-кластеризации:

Используя сервис just-magic.org , мы провели сравнение двух методов кластеризаций на выборках из разных тематик. Ниже представлен сводный график:

Сравнения проводилось для методов «soft» и «hard». Для числа пересекающихся URL-ов от 3-х до 6-ти (это минимальное число общих URL-ов для формирования кластера).

Как видно из графика, hard-кластеризация показывает очень высокую точность уже при пороге в 3 URL-а - 92%. Чтобы читатели статьи понимали, насколько это большая цифра, приведу пример: в исполнении опытного оптимизатора без инструментов точность будет составлять порядка 70%, а если за работу возьмется неопытный специалист, точность не будет превышать 30%. При этом, однако, полнота получается достаточно низкая - всего 40%. Но, опять же, смотря, с чем сравнивать. «Руками» оптимизаторы набирают максимум 20%.

Soft-кластеризация демонстрирует очень хорошие показатели полноты, но точность - «хромает на обе ноги». Приемлемые для продвижение значения получаются только на пороге «5», но при этом полнота падает до 23%.

Означает ли это, что данный метод неприменим? Нет. Все зависит от вашей задачи. Если вы занимаетесь «трафиковым» продвижением, и вам важно вывести на странице как можно больше запросов - неважно каких, то вам подойдет soft-кластеризация. Именно поэтому, когда в январе этого года в сервисе just-magic.org появилась hard-кластеризация, для модуля «маркеры» был сохранен «soft»-режим.

Если же вам важно вывести на странице определенный набор запросов, то ваш выбор однозначен - только hard-кластеризация, только хардкор. Еще один плюс hard-кластеризации состоит в том, что получаемые группы - однозначны. То есть, запросы, оказавшиеся в одной группе по 4 URL-ам, не могут оказаться в разных группах по 3 URL-ам (при использовании soft-кластеризации, такое запросто может быть). Поэтому кластеризатор Just-Magic отображает группы сразу по 3,4,5 и 6 URL-ам.

Стоит отдельно отметить, что если мы хотим в дальнейшем проводить текстовый анализ страницы, то допустимо использовать только hard-кластеризацию. Дело в том, что любой текстовый анализ по группе запросов для страницы очень строго соотносится с качеством этой группы. Только hard-кластеризация обеспечивает группы нужного качества.

Подведем итоги

Итак, какие бонусы дает кластеризация?

Во-первых, это ускорение процесса разбора больших ядер. Раньше на это уходили недели и месяцы работы. С помощью кластеризатора оптимизатор делает это за пару часов.

Во-вторых, это возможность распределить запросы по страницам таким образом, чтобы их было возможно одновременно продвинуть. «Ручной» альтернативы кластеризации здесь нет - даже опытный оптимизатор совершает до 30% ошибочных распределений, если действует «на глазок».

Исходя из второго пункта, становится понятно, что кластеризацию при продвижении нужно использовать всегда . Даже если ядро меньше 100 запросов, сделать правильно распределение запросов по страницам «на глазок» вы не сможете. Исключением могут стать только тематики со сверхнизкой конкуренцией, где кластеризация по топам перестает работать из-за отсутствия в топах релевантных ответов.

Если вы занимаетесь «трафиковым» продвижением, то можете пользоваться как «soft», так и «hard» методами кластеризации. Если же осуществляете «позиционное» продвижение, когда важно вывести в топ все запросы, то подойдёт только метод «hard». Также, с совместим только «hard»-режим.

Используйте кластеризацию в своей работе, и вы обретете счастье и гармонию, а продвигаемые вами запросы гарантированно попадут в топ!

Предлагаем две бесплатные программы для Windows:

  • Majento Кластеризатор, аналогичный нашему онлайн-сервису, с возможностью ручной группировки фраз
  • кластеризатор ядра запросов на основе Excel-кластеризатора по леммам от Roman Igoshin

Majento Кластеризатор 1.4

Программа является копией нашего онлайн-сервиса, однако имеет дополнительный функционал в виде ручной группировки фраз, доступной после автоматической кластеризации поисковых запросов. Сбор данных для кластеризации берется из выдачи Яндекса и ведется с использованием лимитов Яндекс.XML . После кластеризации становится доступной функция ручной группировки запросов (перемещение запросов по группам, создание новых групп и удаление кластеров). Результаты кластериции запросов экспортируются в Excel-файл формата CSV.

В программе имеется возможность импорта данных выдачи ПС Яндекс из KeyCollector для группировки фраз без использования XML-лимитов (пример файла импорта приложен в архиве).


Основные возможности

  • Кластеризация произвольного списка запросов
  • Указание региона в Яндекс для сбора данных при кластеризации
  • Группировка запросов методами Soft и Hard, "ручное" указание порога кластеризации фраз (от 1 до 10)
  • Возможность произвольной группировки фраз
  • Импорт данных выдачи ПС Яндекс из KeyCollector для группировки фраз без использования XML-лимитов
  • Экспорт кластеризации в Excel (CSV)

Отличия от аналогов

  • Низкие требования к ресурсам компьютера, малый расход оперативной памяти
  • Кластеризация ядер любых объемов
  • Портативный формат (работает без установки на ПК или прямо со сменного носителя)
  • Бесплатное распространение

Помощь проекту

Если у вас есть желание поддержать развитие программы, вы можете перевести любую сумму одним из удобных для вас способов:

  • на кошелек WebMoney: R848899779227 (перевод производится без протекции сделки).
  • на кошелек Яндекс.Деньги (форма ниже):

Благодарим за поддержку!

История версий

Версия 1.4 (build 33), 23.11.2017:

  • добавлено отображение числа главных страниц по каждому запросу и по группе запросов в целом

Версия 1.3 (build 31), 27.09.2017:

  • добавлена возможность просмотра наиболее часто встречающихся сайтов в конкретном кластере
  • расширен список регионов Яндекс, добавлена возможность их редактирования в текстовом файле (regions.txt)
  • исправлена ситуация, когда в поле списка запросов не загружалось более 2000 строк

Версия 1.2 (build 28), 29.08.2017:

  • добавлена возможность указания региона в Яндекс для сбора данных при кластеризации
  • добавлена возможность "ручного" указания порога кластеризации фраз (от 1 до 10)
  • добавлена возможность импорта данных выдачи ПС Яндекс из KeyCollector для группировки фраз без использования XML-лимитов

Версия 1.1 (build 22), 10.08.2017:

  • добавлена возможность ручной группировки фраз
  • добавлена возможность экспорта кластеризованных групп в Excel (CSV)

Версия 1.0 (build 5), 07.06.2016:

  • возможность кластеризации по запросам из списка
  • возможность группировки запросов методами Soft и Hard

Минимальные системные требования:
- 500 МГц (рекомендуется: 1 ГГц или выше)
- 1 ГБ RAM (рекомендуется: 2 ГБ или выше)
- Microsoft Windows XP/2003/Vista/7-10
- выход в интернет

Кластеризатор по леммам

Исходя из статьи Романа Игошина (http://www.it-agency.ru/academy/excel-clusterer/), идея заключалась занести данные в таблицу, а потом уже вручную играться с параметрами, добиваясь нужного результата. Так что если идти по этому пути, то программа явно проигрывает с точки зрения удобства.

Возможно, правильней было бы улучшить изначальную идею - дописать и оптимизировать скрипты для экселя...
Поэтому полученный софт выкладывается "как есть". Если будут мысли, как докрутить до рабочего варианта - вэлкам.

Скачать кластеризатор по леммам: majento-clusterer.zip (7 Мб)

PS. Описание настроек см. в ридми + примеры включены.
PPS. Для небольшого списка запросов нужно уменьшить мин. вес до 1000000 (по логике, чем меньше запросов, тем меньше должен быть вес).

Ограничение: 5 раз в сутки для 1 IP-адреса. Для Вашего IP осталось 5 раз. Зарегистрируйтесь, чтобы снять ограничение...

Запросы для онлайн кластеризации (макс. 250) ↓


Примечание: знаки "+" из текста удаляются автоматичски

Метод кластеризации: SOFT HARD

Подобрать релевантную страницу


Защита от автоматических генераций:


Используется два метода кластеризации: Soft и Hard.

  • Soft -кластеризация: выбирается "центральный" запрос с которым сравниваются остальные запросы по количеству общих URL в ТОП-10 Яндекса. Если количество общих URL-ов превышает порог - запрос добавляется в группу.
  • Hard -кластеризация: запросы объединяются в группу, только если есть общий для всех запросов набор URL, который показывается по ВСЕМ этим запросам в ТОП-10.

При использовании сервиса кластеризации без регистрации действует ограничение - не более 250 фраз за один раз. Зарегистрированные пользователи могут группировать запросы до 500 фраз единоразово любое количество раз.

Сегодня поговорим о таком важном процессе в подготовке к созданию контента для сайта, как кластеризация семантического ядра. Это группировка ключевых запросов из ядра по группам, чтобы каждой группе соответствовала своя страница. После сбора ключевых слов для проекта, они — список без какой-либо структуры и иерархии. В списке запросы как очень похожие друг на друга, так и которые существенно отличаются по смыслу.

Кластеризация предусматривает группирование запросов, для максимальной релевантности одной странице. Кластеризацию проводят как руками, так и автоматически с помощью множества сервисов, существующих в интернете. Давайте рассмотрим все методики, которые возможно применить распределяя и группируя запросы по страницам сайта.

Содержание статьи:

Ручная кластеризация запросов ядра сайта


Несмотря, что она достаточно трудоемкая и занимает много времени, является наиболее качественным вариантом группировки. Подходить для небольших проектов, когда количество ключей не слишком большое. Если ключей несколько тысячи, то лучше провести автоматическую кластеризацию, а потом доработать результаты руками.

Делается она просто. Ключи собираются в отдельные группы по смыслу. Чтобы было понятнее, приведу пример. Есть собранные ключевые слова для информационного проекта о болезнях грудных детей. Нужно разбить все семантическое ядро на группы по отдельным болезням, чтобы написать о них и о способах лечения конкретные статьи.


Выбирая из массы ключей, собранных по запросу «Грудничок», те, которые содержат слово «тремор», мы соберем кластер ключей, где будут все запросы, относящиеся к тремору у грудничков. Именно их и нужно использовать в написании статьи о болезни.

В ручной группировке хорошо поможет обычный Excel или Google Таблицы, позволяющие сортировать, фильтровать и выделять нужные строчки и слова в них. Также есть бесплатные сервисы, облегчающие ручную группировку. Это, например, сервис Keyword Assistant, позволяющий в несколько кликов выделить нужные ключи из общего списка и поместить их в группу.

Автоматическая кластеризация запросов — онлайн сервис

Автоматическая кластеризация выполняет по определенным алгоритмам. Она делает все то же самое, что и человек. Из плюсов стоит выделить скорость работы в тысячи раз быстрее ручной, а также анализ ключевых слов и их позиций в поисковой выдаче.

Из минусов – полное отсутствие логического мышления у алгоритмов, за счет чего нередко попадаются неверные включения запросов в группы. Также явно подходящие по смыслу запросы могут не включаться в одну групп. Пример, запросы «Как одевать ребенка при низкой температуре на улице» и «Температура 39 у ребенка» — это запросы, относящиеся к разным группам, но алгоритмы чаще объединят их в одну.

Все равно после автоматической кластеризации семантическое ядро нужно дорабатывать руками, приводя его к идеальному виду. От качества группировки напрямую зависит дальнейшая оптимизация сайта.

Для автоматической работы я рекомендую сервис Rush Analytics , являющийся мощным инструментом в помощь оптимизатору. Достаточно добавить все ключевые запросы и программа сгруппирует их максимально быстро. Единственный минус – сервис достаточно дорогой и если вам нужно единоразовое использование, то лучше найти оптимизатора, имеющего подписку. За сотню-другую рублей он добавить ключи для прогона в сервисе.

Актуальны и следующие ресурсы: Seo intellect, KeyAssistant.

Особенности кластеризации семантики для коммерческих сайтов

Если с запросами для информационных проектов все понятно. Здесь у нас стоп-словами являются все коммерческие фразы со словом купить, заказать и т.д., то с коммерческими не все так однозначно. Стоит немного уделить внимание тому, как лучше сгруппировать ключи, например, для интернет-магазина.

К примеру, магазин электроники будет продавать телевизоры. Есть масса запросов со словом телевизор и нам необходимо их кластеризировать. Все запросы, которые относятся к коммерческим, типа «Купить телевизор Samsung», «Купить телевизор диагональ 43», мы распределяем по своим кластерам: по брендам, диагонали или другим свойствам.

А вот информационные запросы вроде «Как выбрать хороший телевизор» или «Какой телевизор хороший в 2017 году» мы сортируем отдельно и в структуре сайта предусматриваем блоговый раздел, где будем рассказывать пользователям о выборе или преимуществах того или иного свойства техники. Так мы сможем привлечь больше трафика за счет и информационных запросов.

Как видите, кластеризация семантического ядра – это несложно, просто занимает достаточно много времени. Но является одним из столпов в подготовке к запуску проекта.

  • Читайте статьи по этой теме:

Кластеризация запросов сортирует (разбивает) список семантического ядра (СЯ), на группы по схожести, что дает возможность в дальнейшем оптимизировать под них страницы сайта.

Как кластеризуются запросы?

Инструмент анализирует выдачу Яндекс по каждому запросу и сравнивает ее с выдачей остальных запросов из списка. Если в ТОП-10 по разным запросам находятся те же релевантные страницы, то эти запросы определяются как схожие и помещаются в одну группу. Это значит что под них можно оптимизировать одну страницу.

Порог кластеризации запросов это количество совпавших релевантных страниц в выдаче, по разным запросам. Проще говоря, если ввести в Яндекс два запроса и в выдаче ТОП-10 будет две одинаковые страницы (две из десяти), то при выставлении "порога кластеризации 2" эти два запроса будут помещены в одну группу.

Минусы ручной группировки запросов

Группировка ключевых запросов, известная также как разбивка, выполняется SEO оптимизаторами непосредственно после сбора СЯ.

  1. При наличии большого количества запросов сложно в ручном режиме определить их схожесть между собой, приходится либо вводить каждый запрос в поиск, либо полагаться на интуицию/опыт, что может сыграть злую шутку при продвижении и не дать нужных результатов.
  2. Высокая стоимость, которая сформировалась за счет длительности процесса. На качественную разбивку семантики с 500 запросами на борту уходит в среднем 4..16 часов. Необходимо вычитать каждый запрос, определить его группу (наличие которой необходимо держать в голове), при необходимости перепроверить поиском или сервисами…бррр.

Плюсы автоматической группировки запросов

  1. Скорость выполнения разбивки примерно равна скорости звука. Система проверит выдачи каждого из запросов, сравнит их и даст возможность поправить возможные мелкие исключения вручную, после чего результат можно выгрузить в CSV файл (эксель).
  2. Точность результата, досигаемая за счет исключения человеческого фактора. Человек может отвлечься и потерять мысль, забыть, недопонять или просто не уметь делать разбивку правильно, с программой такие сложности не наблюдаются.
  3. Инструмент предоставляется полностью на бесплатной основе; он не требует помесячной заработной платы, отпусков, больничных; также у него нет графика работы: работает 24/7.

Разбивка является очень важным процессом при продвижении, она задает цели для оптимизации каждой страницы проекта и всего сайта в целом.