21
Принципы работы поисковых систем 22 ноября 2012, Донецк

Принципы работы поисковых систем

  • Upload
    -

  • View
    2.432

  • Download
    4

Tags:

Embed Size (px)

DESCRIPTION

Презентация с семинара it donbass. 22 ноября 2012, г. Донецк. Раскрывает матчасть процесса работы поисковой машины.

Citation preview

Page 1: Принципы работы поисковых систем

Принципы работы поисковых систем

22 ноября 2012, Донецк

Page 2: Принципы работы поисковых систем

Задача поисковой системы

Page 3: Принципы работы поисковых систем

Задача поисковой системы

Показать страницы с запрошенным текстом

Page 4: Принципы работы поисковых систем

Задача поисковой системы

Дать релевантный ответ на вопрос

Показать страницы с запрошенным текстом

Page 5: Принципы работы поисковых систем

Задача поисковой системы

Дать релевантный ответ на вопрос

Показать страницы с запрошенным текстом

Порекомендовать качественные ресурсы, отвечающие на вопрос

Page 6: Принципы работы поисковых систем

Задача поисковой системы

Дать релевантный ответ на вопрос

Показать страницы с запрошенным текстом

Порекомендовать качественные ресурсы, отвечающие на вопрос

Сделать пользователя счастливым...

Page 7: Принципы работы поисковых систем

Составляющие работы ПС

Page 8: Принципы работы поисковых систем

Составляющие работы ПС

1. Составление плана

2. Сбор данных3. Индексация

4. Вычисления5. Ранжирование

6. Оценка качества

Page 9: Принципы работы поисковых систем

1. Составление плана

Цель ПС: Найти новые документы и расставить приоритеты их сканирования, составить расписание

Наша задача: Дать о себе знать

Данные: Ссылки и форма AddURL

Page 10: Принципы работы поисковых систем

2. Сбор данных (Crawling)

Цель ПС: Быстро собрать данные со страниц сайта

Наша задача: Обеспечить оптимальное взаимодействие

• Индексируемый текст / HTML

• Отсутствие дублей

• Перелинковка

• Оптимизированная скорость загрузки

Page 11: Принципы работы поисковых систем

Важно для бота-краулера

• HTTP-заголовки страниц

• Файл robots.txt

• Тег meta-robots

• Частота обновления сайта (модифицирует расписание)

Page 12: Принципы работы поисковых систем
Page 13: Принципы работы поисковых систем

3. Индексация

Цель ПС: Создать индекс для быстрого поиска

Наша задача: Предоставить разнообразный контент и оптимальные связи между документами

Тексты индексируются, связи преобразуются в графы

Page 14: Принципы работы поисковых систем

4. Вычисления

Цель ПС: Расчитать метрики сайта по данным текстовых индексов, графов и др. свойств

Наша задача: Быть, а не казаться...

• Размер контента, кол-во ссылок, ...

• PageRank, TrustRank, SpamRank, ...

Множество алгоритмов построения ранков по разнообразным сигналам

Page 15: Принципы работы поисковых систем

5. Ранжирование

Цель ПС: Рассортировать документы на базе расчитанных метрик в порядке ... (каком?) с учетом спектра интента

Что влияет на ранжирование помимо метрик сайта?

• Тип запроса

• Регион и язык поиска

• Персонализация

Page 16: Принципы работы поисковых систем
Page 17: Принципы работы поисковых систем
Page 18: Принципы работы поисковых систем

6. Оценка качества

Цель ПС: Улучшить поисковую выдачу

Наша задача: Ответить страницей на вопрос, сделать сайт удобным, использовать микроразметку

• Количество кликов

• Кол-во и быстрота возвратов

• Кол-во переформулировок (дополнений)

• Кол-во просматриваемых страниц выдачи

Page 19: Принципы работы поисковых систем
Page 20: Принципы работы поисковых систем

Что дальше?

Для Яндекса и Google поиск закончился. А для вас?

• Продажи, подписки, скачивания...

• Конверсия, средний чек, ...

• Возвраты и доверие

С поисковиками нужно налаживать отношения, но они роботы, а сайт посещают реальные люди. Изучайте людей больше, чем поисковые системы и налаживайте отношения с ними в первую очередь!

Page 21: Принципы работы поисковых систем

Благодарю за внимание!

Web: http://devaka.ru

Google+ http://gplus.to/devaka

Twitter: @devakaru

E-mail: [email protected]

Телефон: +38 (097) 33-888-69

Кокшаров Сергей (Devaka) Специально для IT Donbass 2012