16

Riw 13 intelsib

Embed Size (px)

Citation preview

Page 2: Riw 13 intelsib

2

Москва, 18 октября 2013 годаИгорь Чуркин, руководитель отдела аналитики

Неявные факторы ранжирования

в поисковой системе Яндекс

Page 3: Riw 13 intelsib

Пара общеизвестных фактов:

• Количество факторов, используемых Яндексом в расчетах ранжирующей формулы весьма велико. Речь идет о, без малого, тысяче разнообразных параметров сайта, документа, запроса.

• Существует большое число вариаций формулы, зависящих от региональности сайта и пользователя, от типа запроса, от тематического кластера сайта и запроса.

• Нельзя однозначно решить задачу выявления наиболее значимых факторов так, чтобы решение было бы универсальным.

Очевидный вывод:

Page 4: Riw 13 intelsib

Классификации факторов:

1. Традиционная:a. Внутренние;b. Внешние;с. Поведенческие.

2. По доступности:a. Легкокорригируемые;b. Нетривиально (и не всегда честно) редактируемые;c. Неизменяемые в принципе.

Page 5: Riw 13 intelsib

Доменные зоны – присутствие в индексе

Page 6: Riw 13 intelsib

Доменные зоны – влияние

доля в

индекседоля в топ-

100отношение

долейчисло

ссылок

ru 62,20% 87,61% 1,41 100%

su 0,75% 0,83% 1,11 +3%

info 1,16% 1,01% 0,87 +13%

org 1,62% 1,13% 0,70

by 1,85% 1,05% 0,57

net 3,23% 1,81% 0,56 +13%

biz 0,49% 0,21% 0,43 +15%

kz 1,35% 0,48% 0,35

others 2,02% 0,58% 0,29 +28%

com 13,29% 3,69% 0,28 +31%

рф 0,49% 0,11% 0,22

ua 11,55% 1,49% 0,13

Page 7: Riw 13 intelsib

Не ключами едиными

Очевидный способ поиска синонимов и дополнительных лемм

Page 8: Riw 13 intelsib

Не ключами едиными

Статистический способ поиска дополнительных лемм

Документы из топа по запросу

Леммы, встречающиеся минимум в 5 документах одновременно

городгруздоставкакомпаниямоскваперевозкауслугацена

Документы из топа по запросу

[грузоперевозки по россии]

Документы из топа по запросу

Леммы, встречающиеся минимум в 5 документах одновременно

Page 9: Riw 13 intelsib

Не ключами едиными

Документы из топов по СЯ

Коллекция лемм, упорядоченная по

TF*Ln(ponTopic)

Статистический способ поиска тематических маркеров

Page 10: Riw 13 intelsib

Поиск «фишек»

Page 11: Riw 13 intelsib

Контроль гипотез

По хвостам По головам

На «боевых» проектах

Page 12: Riw 13 intelsib

Результаты

• Для специализированных интернет-магазинов, юридических и медицинских сайтов

Реорганизация структуры сайта

Уплощение иерархии

• Для мультитоварных интернет-магазинов и строительных сайтов

Углубление каталогов

Page 13: Riw 13 intelsib

Результаты

• Для интернет-магазинов, новостных и медицинских сайтов

Дополнительные инфо-блоки

Видео

• Для юридических и строительных сайтов

Документы pdf, doc, xls и т.п.

• Для магазинов одежды, салонов красоты, дизайн-студий и строительных сайтов

Полноформатные изображения

Page 14: Riw 13 intelsib

Результаты

• On-line консультанты; • Калькуляторы; • Конструкторы; • Активные адреса и телефоны;• Элементы геймификации.

Интерактив на сайте

Page 15: Riw 13 intelsib

Результаты

Исходящие ссылки

Их должно быть достаточно для создания возможно полного семантического узла.Из определения:

понятно, что только внутренними ссылками обойтись нельзя.

Семантический узел –это такой объект текстовой семантики, у которого заполнены все валентности, как эксплицитно выраженные в тексте, так и имплицитные – те, которые получаются из экстралингвистических источников.

А.А. Леонтьев

Page 16: Riw 13 intelsib

Спасибо за внимание!

Рад ответить на все вопросы.

Даже письменно.