Принципы работы поисковых систем

Tags:

Preview:

DESCRIPTION

Презентация с семинара it donbass. 22 ноября 2012, г. Донецк. Раскрывает матчасть процесса работы поисковой машины.

Citation preview

Принципы работы поисковых систем

22 ноября 2012, Донецк

Задача поисковой системы

Задача поисковой системы

Показать страницы с запрошенным текстом

Задача поисковой системы

Дать релевантный ответ на вопрос

Показать страницы с запрошенным текстом

Задача поисковой системы

Дать релевантный ответ на вопрос

Показать страницы с запрошенным текстом

Порекомендовать качественные ресурсы, отвечающие на вопрос

Задача поисковой системы

Дать релевантный ответ на вопрос

Показать страницы с запрошенным текстом

Порекомендовать качественные ресурсы, отвечающие на вопрос

Сделать пользователя счастливым...

Составляющие работы ПС

Составляющие работы ПС

1. Составление плана

2. Сбор данных3. Индексация

4. Вычисления5. Ранжирование

6. Оценка качества

1. Составление плана

Цель ПС: Найти новые документы и расставить приоритеты их сканирования, составить расписание

Наша задача: Дать о себе знать

Данные: Ссылки и форма AddURL

2. Сбор данных (Crawling)

Цель ПС: Быстро собрать данные со страниц сайта

Наша задача: Обеспечить оптимальное взаимодействие

• Индексируемый текст / HTML

• Отсутствие дублей

• Перелинковка

• Оптимизированная скорость загрузки

Важно для бота-краулера

• HTTP-заголовки страниц

• Файл robots.txt

• Тег meta-robots

• Частота обновления сайта (модифицирует расписание)

3. Индексация

Цель ПС: Создать индекс для быстрого поиска

Наша задача: Предоставить разнообразный контент и оптимальные связи между документами

Тексты индексируются, связи преобразуются в графы

4. Вычисления

Цель ПС: Расчитать метрики сайта по данным текстовых индексов, графов и др. свойств

Наша задача: Быть, а не казаться...

• Размер контента, кол-во ссылок, ...

• PageRank, TrustRank, SpamRank, ...

Множество алгоритмов построения ранков по разнообразным сигналам

5. Ранжирование

Цель ПС: Рассортировать документы на базе расчитанных метрик в порядке ... (каком?) с учетом спектра интента

Что влияет на ранжирование помимо метрик сайта?

• Тип запроса

• Регион и язык поиска

• Персонализация

6. Оценка качества

Цель ПС: Улучшить поисковую выдачу

Наша задача: Ответить страницей на вопрос, сделать сайт удобным, использовать микроразметку

• Количество кликов

• Кол-во и быстрота возвратов

• Кол-во переформулировок (дополнений)

• Кол-во просматриваемых страниц выдачи

Что дальше?

Для Яндекса и Google поиск закончился. А для вас?

• Продажи, подписки, скачивания...

• Конверсия, средний чек, ...

• Возвраты и доверие

С поисковиками нужно налаживать отношения, но они роботы, а сайт посещают реальные люди. Изучайте людей больше, чем поисковые системы и налаживайте отношения с ними в первую очередь!

Благодарю за внимание!

Web: http://devaka.ru

Google+ http://gplus.to/devaka

Twitter: @devakaru

E-mail: event@devaka.ru

Телефон: +38 (097) 33-888-69

Кокшаров Сергей (Devaka) Специально для IT Donbass 2012

Recommended