Seo без границ осенняя практика от mega index.tv

Preview:

DESCRIPTION

Seo без границ осенняя практика от mega index.tv

Citation preview

SEO без границ.Осенняя практика от MegaIndex.tv

«Практические примеры фильтрации семантики»

23.09.2014

Игорь Бакалов• В клиентском SEO с 2010 года• Опыт продвижения: более 60 проектов• Автор блога http://bakalov.info/

Для кого этот доклад

Данный доклад будет полезен, если:• Вам часто приходится подбирать СЯ в

коммерческих нишах;• Объем составляемых СЯ в среднем от

нескольких сотен, до нескольких тысяч запросов;

• Вы стараетесь минимизировать объем ручного труда;

План доклада

1. Фильтрация навигационных запросов2. Фильтрация омонимов3. Фильтрация не явных adult запросов4. Хаки при фильтрации семантики

Фильтрация навигационных запросов

Навигационный запрос – это запрос, по которому пользователь ищет конкретную фирму или сайт.

Чаще встречаются в тематиках: стоматология, недвижимость, фаст-фуд, финансы, и т.д.

Примеры запросов: «агентство недвижимости этажи», «стоматология мастер дент», «суши терра»…

Какие существуют способы фильтрации?

Фильтрация навигационных запросов

Способ №1: Проверить все запросы руками

Плюсы:• Это просто

Минусы: • Очень долго и не рационально – в ряде тематик до 50%

запросов могут быть навигационными, например «агентство недвижимости»;

• Большая вероятность ошибки, например: «отель премиум санкт петербург», «гостиница у фонтана санкт петербург» - это все навигационные запросы;

Фильтрация навигационных запросов

Способ №2: Проверить запросы через Яндекс.XMLПлюсы:• Высокая скорость обработки;• Высокая точность – если Яндекс определил запрос как навигационный

и по данному запросу есть витальный сайт, то это видно в XML:

Минусы: • Нужны XML лимиты;• Нужен скрипт для проверки;

Фильтрация навигационных запросов

Способ №3: Проверить запросы через выдачу GoogleПлюсы:• Можно определить навигационные запросы, по которым в Яндексе нет витальных

сайтов. Пример выдачи по запросу «отель премиум санкт петербург» :

Минусы: • Нужно писать скрипт для парсинга результатов поиска;• Сопутствующие расходы на каптчу и прокси;• Иногда бывают «ложные» срабатывания;

Фильтрация навигационных запросов

Способ №4: Проверить запросы через выдачу ЯндексаПо многим навигационным запросам Яндекс отображает в топ-10 больше 1 страницы витального сайта.

Плюсы:• Это просто! Нужно лишь собрать топ-10 и выгрузить в Excel.• Это можно делать при помощи KeyCollector!

Минусы: • Выявляются не все навигационные запросы – не редки случаи, когда

витальный сайт занимает только одну позицию.

Подробное описание метода: http://bakalov.info/filtraciya-navigacionnyx-zaprosov-v-keycollector.html

Фильтрация омонимовОмонимы - разные по значению, но одинаковые по звучанию и написанию слова © Википедия

Задача: собрать СЯ для магазина по продаже ковров.Что делаем? Парсим вордстат по запросам «магазин ковров», «продажа ковров»…

И кроме целевых, получаем еще пачку вот таких запросов:магазины в ковровегород ковров магазиныковров недвижимость продажапродажа недвижимости в ковровепродажа квартир г ковровинтернет магазин в ковровемото продажа в ковровегород ковров продажа квартирпродажа машин в ковровепродажа собак в коврове

Как быть?

Фильтрация омонимов

1. Фильтруем руками

Это же не наш метод

Фильтрация омонимовШаг первый: при помощи Regex выделяем запросы с топонимом. В KeyCollector в «Быстрый фильтр» вставляем:

(^г\s|\sг\s|\sг$|^город\s|\sгород\s|\sгород$|^городе\s|\sгороде\s|\sгороде$)

Получаем:г ковров магазиныгород ковров магазиныпродажа квартир г ковровгород ковров продажа квартирпродажа квартир в городе ковровепродажа домов в городе ковровепродажа квартир в г ковровеавито продажа квартиры г ковровинтернет магазин город ковровмебельные магазины г ковровэльдорадо интернет магазин город ковров

Удаляем такие запросы и переходим к шагу №2.

Фильтрация омонимовШаг второй: в случае частичной омонимии разбираем омоформы. Мы имеем:• ковров – в случае города это: ед. число, им. падеж;• ковров – в случае «плотное тканое изделие» это: мн. число, родит.

падеж от слова «ковер».Предложный падеж для города «Ковров» будет «Коврове», а для «Ковры» это будет «Коврах». Фильтруем по «Коврове» и получаем:

магазины в ковровеинтернет магазин в ковровепродажа квартир в ковровепродажа домов в ковровепродажа авто в ковровеавито продажа квартир в ковровепродажа недвижимости в коврове

Удаляем подобные запросы и переходим к шагу №3.

Фильтрация омонимовШаг третий: фильтрация омонимов по сниппетам. Поисковые системы весьма не плохо умеют «понимать» значение омонима по контексту поискового запроса. Как это использовать?

Берем запросы с «ковров», собираем топ-10 по каждому ключу, проверяем сниппеты на наличие словоформы «коврове», делаем выборку и получаем:

продажа авто на авито ковровковров продажа квартирпродажа ковров на авитоковров недвижимость продажапродажа авто ковровпродажа машин ковровковров продажа квартир объявленияковров продажа домовковров мебельные магазины

Перед удалением на всякий случай проверяем нет ли косяков

Фильтрация не явных adult запросов

Явный adult запрос – это запрос, в котором в явном виде указано, что пользователю нужен контент «18+». Фильтруются подобные запросы весьма просто - при помощи словаря стоп слов:

порно, порнуха, проститутки, секс, ххх, грудастой, изнасиловал, лесбиянки, лесби, малолетки, маструбация, минет... (всего около 250 слов)

НЕ явный adult запрос – это запрос, который не содержит порно лексики, но подразумевает соответствующий пользовательский интент. Чаще всего такие запросы встречаются в тематиках: «массаж», «нижнее женское белье» и др…

Фильтрация не явных adult запросов

Как это выглядит на практике. Например, вы спарсили вордстат для салона красоты по запросу «массаж», почистили от явной порно лексики, глянули, а там:

пришла на массаж русскоескрытая камера массажмужик делает массаж мужикумассаж зрелой женщинемассаж а потомрусская на массажебрат делает массажво время массажамуж делает жене массажбрат и сестра массаж

Хотят ли эти пользователи стать клиентом массажного салона?

Фильтрация не явных adult запросов

Смотрим выдачу Яндекса по запросу «пришла на массаж русское»:

Принцип фильтрации – собираем топ-10 по каждому запросу и проверяем на наличие «взрослых» слов (делается в KeyCollector).

Хаки при фильтрации семантикиХак первый: выделяем запросы с «мусорными» предлогами. Для быстрого фильтра в KeyCollector используем Regex:

(^(о|об)\s|\s(без|в|где|для|до|за|из|или|и|к|над|на|не|но|ну|об|от|о|под|по|при|про|со|с|те|чем|что)$)

Получаем:акция пластиковые окна двухкомнатная квартира заарочные пластиковые окна ипластиковые окна профили взастекление балкона или пластиковые окна подблагодаря этому пластиковые окна и

Очень актуально, если вы не только парсите вордстат/подсказки, но и работаете с базами ключевых слов.

Хаки при фильтрации семантики

Хак второй: хитрая фильтрация запросов с латиницей.Входные данные: ~700 запросов про «видеорегистратор dvr».Задача: оставить общие запросы («видеорегистратор dvr купить», «dvr видеорегистратор отзывы», «автомобильный видеорегистратор dvr» и т.п.), исключить запросы про конкретные бренды/модели («видеорегистратор eplutus dvr», «видеорегистратор vehicle dvr» и и т.п.). Для решения используем Regex:

([a-z]\s.*dvr|dvr\s.*[a-z])

На выходе получаем ~ 150 «чистых» запросов:видеорегистратор dvr, dvr видеорегистратор отзывы, инструкция видеорегистратор dvr, автомобильный видеорегистратор dvr, dvr видеорегистратор купить...

Хаки при фильтрации семантики

Хак от КО: если вы постоянно работаете с семантикой, то у вас просто обязательно должны быть свои списки стоп-слов.

Наглядный пример: собранно ~3700 запросов про «доставку пиццы» для сайта из Нижнего Новгорода. Список-стоп слов по городам позволяет сразу отсеять ~2500 запросов, т.е. 67%!

В идеале делить стоп-слова на группы: информационные, adult, навигационные, образовательные, развлекательные…

Хаки при фильтрации семантики

А вот так список стоп-слов может выглядеть на практике:

Спасибо за внимание!

Игорь Бакалов

Подписывайтесь на мой блог:

http://bakalov.info/И добавляйтесь в соц сетях:

https://www.facebook.com/bakalov.igorhttps://twitter.com/Bakalov_Igor