54
Кластеризация по ТОПам – от теории к практике Олег Шестаков Data Driven SEO Москва 2016 Рекламно-консалтинговое агентство Rush Rush Analytics – сервис поисковой аналитики

Data Driven SEO - Кластеризация по топам - от теории к практике

Embed Size (px)

Citation preview

Page 1: Data Driven SEO -  Кластеризация по топам - от теории к практике

Кластеризация по ТОПам – от теории к практике

Олег ШестаковData Driven SEO Москва 2016

Рекламно-консалтинговое агентство RushRush Analytics – сервис поисковой аналитики

Page 2: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

- В SEO с 2008 года- Участвовал более чем в 100 SEO-проектах- Автор стратегий для 20 крупных интернет-магазинов, 3 из

ТОП20 в России- Специализация: E-commerce, проекты с большой семантикой, автоматизация в SEO- Основатель и CTO в Rush Analytics & Founder Rush Agency

Rush Analytics – сервис поисковой аналитики

Page 3: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

1. Теория и практика кластеризации по ТОПам2. Источники сбора семантики для качественной семантики3. Маркеры: как готовить, «раскрытие» маркеров, кластеризация маркеров4. Кластеризация облака запросов для построения структуры5. Финализация структуры сайта

О чем сегодня поговорим?

Rush Analytics – сервис поисковой аналитики

Page 4: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Кластеризация по ТОПам – как это работает?

Rush Analytics – сервис поисковой аналитики

Таким образом строим матрицы по всему ядру. Точность кластеризации - количество общих URL (!) в ТОПе по двум запросам, необходимое для создания кластера.

Page 5: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Кластеризация по ТОПам – как это работает?

Rush Analytics – сервис поисковой аналитики

Page 6: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

1. Ускорение группировки ключевых слов (в 10-30 раз)2. Выделение мусорных слов в «сложной семантике»3. Разбивка ядра на коммерцию и некоммерцию4. Увеличение релевантности и % вывода ключевых

слов в сложных тематиках

Какие задачи решает кластеризация по ТОПам?

Rush Analytics – сервис поисковой аналитики

Page 7: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

1. Лингвистическая группировка не охватывает синонимы и переформулировки доп. время на обработку ядра

2. Временные затраты на разборы ядра более 10к растут нелинейно

3. Ошибки семантиков могут «похоронить» до 15% запросов

Ускорение группировки ключевых слов

Rush Analytics – сервис поисковой аналитики

Page 8: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

1. Фактически используем готовые данные Яндекса о коммерческости

2. При удовлетворительном качестве выдачи и правильном подборе точности кластеризации – кластера отлично разделяются под листинги и статьи

Разбивка ядра на коммерцию/некоммерцию

Rush Analytics – сервис поисковой аналитики

Page 9: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

1. Во многих конкурентных тематиках даже запросы «цена» и «стоимость» могут не продвигаться на одну страницу

2. Hard – кластеризация отлично показывает как устроено ранжирование в тематике, указывает на нужные типы страниц.

Работа над ВЧ запросами

Rush Analytics – сервис поисковой аналитики

Page 10: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

1. Soft-кластеризация 2. Hard-кластеризация

Какие виды кластеризации по ТОПам существуют?

Rush Analytics – сервис поисковой аналитики

Page 11: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Назначение: трафиковые проектыРаботаем с большим пулом СЧ – НЧ нет возможности следить за 100% совместимостью запросов

Soft-кластеризация

Rush Analytics – сервис поисковой аналитики

Page 12: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Назначение: конкурентная позиционкаКрайне важна совместимость запросов

Hard-кластеризация

Rush Analytics – сервис поисковой аналитики

Page 13: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Алгоритм построения семантики для трафиковых проектов

Rush Analytics – сервис поисковой аналитики

Создание списка маркерных запросов – «скелет спроса»(Ручные гипотезы + Wordstat)

+Сбор расширений базового спроса – «облака запросов»

(Поисковые подсказки)

Создание финальной структуры сайта (Кластеризация)

Page 14: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Какие источники необходимы и достаточны для построения качественной трафиковой семантики?

Источники сбора семантики

Rush Analytics – сервис поисковой аналитики

Page 15: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Что важно:1. Используем в большинстве своем для маркеров2. Правильно парсим маркеры 3. Верифицируем словоформы по частотке(вернемся к этому в разделе про маркеры)

Yandex Worstat (старый добрый )

Rush Analytics – сервис поисковой аналитики

Page 16: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Почему?1. Только реальные запросы пользователей2. Только правильные словоформы (при

правильном парсинге)3. Всегда свежие и трендовые запросы

Поисковые подсказки

Rush Analytics – сервис поисковой аналитики

Page 17: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

А что еще можно использовать?1. Метрика – ДА, можно – но нужно чистить мусор2. Базы данных типа Букварикса и MOAB –

предлагают откровенный треш с 30-87% поддельных (генерированных запросов)

Все? – Да!

Rush Analytics – сервис поисковой аналитики

Page 18: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Наше исследование качества баз данных ключевых слов

Rush Analytics – сервис поисковой аналитики

Page 19: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Наше исследование качества баз данных ключевых слов

Rush Analytics – сервис поисковой аналитики

Page 20: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Наше исследование качества баз данных ключевых слов

Rush Analytics – сервис поисковой аналитики

Page 21: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Наше исследование качества баз данных ключевых слов

Rush Analytics – сервис поисковой аналитики

Page 22: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Wordstat и подсказки дают 70-80% того, что нужно для качественной семантики.

Итого:

Rush Analytics – сервис поисковой аналитики

Page 23: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Маркерные запросы - это запросы, которые четко отвечают продвигаемой странице. Такие запросы обычно имеют значимую частотность по Wordstat и являются средне-частотными (СЧ), или "жирными" низкочастотниками (НЧ), и могут породить "хвост" запросов, например при добавлении слов "купить", "цена", "отзывы".

Маркерые запросы

Rush Analytics – сервис поисковой аналитики

Page 24: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Одежда - плохой маркерный запрос т.к. слишком широкийКупить коричневые ботинки – хороший маркерный запрос – четко отвечает продвигаемой страницеКупить коричневые броги недорого в спб - слишком узкий запрос и не может породить дочерние

Примеры маркерных запросов

Rush Analytics – сервис поисковой аналитики

Page 25: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Чтобы собрать максимум подсказок - нам нужно «раскрыть» маркеры:1. Просклонять2. Переставить слова3. Добавить транзакционные добавки

«Раскрытие» маркеров (подготовка к парсингу)

Rush Analytics – сервис поисковой аналитики

Page 26: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Базовое слово – бетон М300. Раскрывая маркер получаем:1. Бетон М300, Бетон М3002. Купить бетон М300, купить бетон м 300, бетон

М300 купить…..3. Бетон М300 цена, цена бетон М300Для чего?

Пример раскрытия маркера

Rush Analytics – сервис поисковой аналитики

Page 27: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Подсказки по запросу «купить бетон М300»

Rush Analytics – сервис поисковой аналитики

Page 28: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Подсказки по запросу «бетон М300 купить»

Rush Analytics – сервис поисковой аналитики

Page 29: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Если учесть только главную словоформу – мы потеряем до 50% семантики. Факт

Подсказочная выдача совершенно разная

Rush Analytics – сервис поисковой аналитики

Page 30: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Запрос: стиральные (машины|машинки) (samsung|самсунг) -ремонт -ошибки -отзыв -коды -видео -запчасти –неисправности

Лайфхак по сбору маркеров №1

Rush Analytics – сервис поисковой аналитики

Page 31: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Запрос: получаем самый частотный порядок слов, «закавычивая запрос» – смотрим на первое слово в левой колонке

Лайфхак по сбору маркеров №2

Rush Analytics – сервис поисковой аналитики

Page 32: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

1. Подсказки гео-зависимы – совершенно разная выдача в МСК и СПБ

2. Подсказки КРАЙНЕ чувствительны к лингвистике (достаточно смены окончания или пробела для получения на 80% другого списка)

3. В Яндексе до 30% фантомных подсказок при «тупом переборе»

Нюансы парсинга поисковых подсказок

Rush Analytics – сервис поисковой аналитики

Page 33: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

1. Подсказки гео-зависимы – совершенно разная выдача в МСК и СПБ

2. Подсказки КРАЙНЕ чувствительны к лингвистике (достаточно смены окончания или пробела для получения на 80% другого списка)

3. В Яндексе до 30% фантомных подсказок при «тупом переборе»

Нюансы парсинга поисковых подсказок

Rush Analytics – сервис поисковой аналитики

Page 34: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Что есть оптимальная семантика:По аналогии с информационным поиском:Полнота vs/* точность1. Если спарсим мало – потеряем трафик2. Если спарсим слишком много – «закопаемся» в

разборе облака нерелевантных НЧ ключей

Как парсить подсказки для получения оптимальной семантики

Rush Analytics – сервис поисковой аналитики

Page 35: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Есть несколько вариантов перебора лингвистики:1. Базовое слово, базовое слово + пробел2. Пробел + перебор алфавита [а-я], [a-z], [0-9]3. Комбинации методов

Как парсить подсказки для получения оптимальной семантики

Rush Analytics – сервис поисковой аналитики

Page 36: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Хардкорный парсинг подсказок для получения всех ключей

Rush Analytics – сервис поисковой аналитики

Усложним перебор лингвистики:

1. ключевое слово +[а-я]_ +[a-z]_ +[0-9]_2. ключевое слово +[аа-ая, ба-бя] +[aa-az,

ba-bz] +[00-09, 10-19]

Page 37: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Какие фишки еще есть при парсинге подсказок?

Rush Analytics – сервис поисковой аналитики

1. Важно фильтровать подсказки на лету по стоп словам

2. Если зацепить «вк», «вконтакте», «одноклассники» - разобрать это будет невозможно

3. Для оптимизации нагрузки на парсер – нужно фильтровать дубликаты «на лету»

Page 38: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

«Боевая» методология сбора подсказок

Rush Analytics – сервис поисковой аналитики

1. Берем базовые или «раскрытые» маркеры2. Собираем подсказки Яндекс по словам, словам

+ пробел3. Смотрим на результат и формируем список стоп-

слов4. «На лету» вырезаем стоп-слова, «убивая»

паразитые ветки подсказок

Page 39: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

«Боевая» методология сбора подсказок.Часть 2

Rush Analytics – сервис поисковой аналитики

1. Запускаем парсинг подсказок с переборами алфавита [а-я], [a-z], [0-9] в зависимости от тематики

2. Обязательно метчим стоп-слова и дубликаты3. Получаем конечный список целевых подсказок4. NB: Без предварительного составления списка

стоп-слов не получится чистой семантики

Page 40: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Реализация списков стоп-слов в Rush Analytics

Rush Analytics – сервис поисковой аналитики

Page 41: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Пост-обработка подсказок и треш-холды

Rush Analytics – сервис поисковой аналитики

1. Все зависит от тематики. В тематиках «кредиты» и «казино» около 50% спроса – это 6 и боле словные запросы – нужно парсить глубже

2. В тематиках «окна» и «мебель» можно спарсить базовые переборы на 2 уроверь и получить все расширения

3. Зная частотность в тематике можно резать по количеству слов.

Page 42: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

1. Кластеризация по частотности Wordstat2. Кластеризация с фиксированными маркерами3. Комбинированный метод 1 + 2

Какие типы кластеризации мы используем?

Rush Analytics – сервис поисковой аналитики

Page 43: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

На самом деле метод не использует Wordstat для связей внутри кластеров 1. На вход подается ключевое слово | Частотность2. Ключевые слова сортируются по убыванию

частотности3. Первое слово признается маркером, привязываем

к нему все что возможно. Итерация повторяется

Кластеризация по Wordstat

Rush Analytics – сервис поисковой аналитики

Page 44: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Когда используется этот метод?1. Когда структура сайта еще не ясна/проектируется2. Статейные проекты3. Для оценки интентов в тематике

Кластеризация по Wordstat

Rush Analytics – сервис поисковой аналитики

Page 45: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Кластеризация по Wordstat - Результат

Rush Analytics – сервис поисковой аналитики

Page 46: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Используем когда уже есть скелет структуры. Точно знаем что хотим куда вести1. На вход подается ключевое слово | 1/0 –

маркер/не маркер2. Берется первый маркер, к нему привязается все

что возможно из облака. Итерация повторяется

Кластеризация с фиксированными маркерами

Rush Analytics – сервис поисковой аналитики

Page 47: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Кластеризация с фиксированными маркерами – входной файл

Rush Analytics – сервис поисковой аналитики

Page 48: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Как решить проблему, что «купить» и «цена» в Ecommerce кластеризуются на разные

страницы из-за плохой выдачи?

Rush Analytics – сервис поисковой аналитики

Page 49: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Кластеризация маркеров

Rush Analytics – сервис поисковой аналитики

1. Сначала кластеризуем маркеры по WS между собой

2. Получаем группы маркеров, которые могут продвигаться на 1 страницу

3. Привязанное к кластеризованным маркерам облако ведем на 1 страницу

Page 50: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Кластеризация маркеров

Rush Analytics – сервис поисковой аналитики

Page 51: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Комбинированная кластеризация

Rush Analytics – сервис поисковой аналитики

1. Сначала запросы из облака привязываются к маркерам

2. Оставшиеся запросы кластеризуются между собой

На выходе получаем:- Семантику для структуры, которую уже знаем- Гипотеза для расширения структуры

Page 52: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Построение структуры на основе кластеризации

Rush Analytics – сервис поисковой аналитики

Подробнее на: http://www.rush-analytics.ru/faq/kak-sozdat-strukturu-sayta-na-osnove-semanticheskogo-yadra

Page 53: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

Какие фишки есть в Rush Analytics?

Rush Analytics – сервис поисковой аналитики

1. 3 метода кластеризации, описанные выше (Soft)2. Автоматическое определение релевантных URL для

кластера + определение кластеров в ТОПе3. Подсветки выдачи для каждого кластера автоматом4. Показываем самый мощный URL конкурента по

кластеру – идем и забираем оптимизацию 5. Скорость – 100к ключевых слов 1-2 часа.

Сами используем в работе каждый день

Page 54: Data Driven SEO -  Кластеризация по топам - от теории к практике

Рекламно-консалтинговое агентство Rush

[email protected] www.facebook.com/shestakov.oleg www.rush-analytics.ru

Ваши вопросыData Driven SEO Москва 2016