22
Сергей Кузнецов Кто потеснит полнотекстовый поиск? «Интернет и Бизнес», Москва, 2008

Кто потеснит полнотекстовый поиск?

Embed Size (px)

DESCRIPTION

Кто потеснит полнотекстовый поиск? (Сергей Кузнецов, Smartus) Круглый стол "Поиск". C КИБ 2008.

Citation preview

Page 1: Кто потеснит полнотекстовый поиск?

Сергей КузнецовКто потеснит полнотекстовый поиск?

«Интернет и Бизнес», Москва, 2008

Page 2: Кто потеснит полнотекстовый поиск?

С чего все начиналось?

17 октября 1996 года

Page 3: Кто потеснит полнотекстовый поиск?

Чем все кончилось?

Page 4: Кто потеснит полнотекстовый поиск?

Чем все кончилось?

Page 5: Кто потеснит полнотекстовый поиск?

Почему каталоги проиграли?

1. древовидная структура слишком сложна

Page 6: Кто потеснит полнотекстовый поиск?

Почему каталоги проиграли?

2. трудно поддерживать актуальность каталога

Page 7: Кто потеснит полнотекстовый поиск?

Почему полнотекстовый поиск не так уж хорош?

1. Технология полнотекстового поиска трудна для пользователя

визуалам трудно с линейной выдачей

трудно искать не текст, а картинку или результат из базы данных

новичкам трудно сформулировать верный запрос

Page 8: Кто потеснит полнотекстовый поиск?

Почему полнотекстовый поиск не так уж хорош?

2. Полнотекстовый поиск не обеспечивает нужной релевантности

В более чем 99% случаев поисковый механизм выдает больше результатов, чем пользователь способен оценить или хотя бы просмотреть

Не более 6% пользователей используют результаты выдачи после десятого (по данным AOL Search Data, выборка из >9000000 пользовательских запросов)

Насколько много среди этих десяти результатов дорвеев?

Page 9: Кто потеснит полнотекстовый поиск?

Почему полнотекстовый поиск не так уж хорош?

3. Качество источников сложно оценить

Достоверность источника определяется сочетанием двух факторов:

1. Источник правильно определяет истинность набора утверждений, про которые заведомо известно, истинны они или ложны.

2. Мнение источника об истинности или ложности некоторого набора утверждений, про которые нет однозначного ответа, истинны они или ложны, совпадает с мнением пользователя.

Мало того, что достоверность источника зависит от пользователя – но даже «объективную» достоверность поисковые машины не слишком хорошо умеют мерить.

Page 10: Кто потеснит полнотекстовый поиск?

Почему полнотекстовый поиск не так уж хорош?

Несколько примеров пользовательских сценариев

Page 11: Кто потеснит полнотекстовый поиск?

Где же выход?

кластеризация результатов поиска

«продвинутые» интерфейсы

метапоиск по базам данных и «глубокому вебу»

вертикальный поиск

поиск по ограниченной базе источников

Page 12: Кто потеснит полнотекстовый поиск?

Несколько примеров

Page 13: Кто потеснит полнотекстовый поиск?

Несколько примеров

Page 14: Кто потеснит полнотекстовый поиск?

Несколько примеров

Page 15: Кто потеснит полнотекстовый поиск?

Тематический поиск

новости

отели

билеты

рестораны

финансы

недвижимость

работа

автомобили

… и многое другое

Page 16: Кто потеснит полнотекстовый поиск?

Несколько примеров

Page 17: Кто потеснит полнотекстовый поиск?

Несколько примеров

Page 18: Кто потеснит полнотекстовый поиск?

Несколько примеров

Page 19: Кто потеснит полнотекстовый поиск?

Несколько примеров

Page 20: Кто потеснит полнотекстовый поиск?

Назад к каталогам?

использование тэгов

автоматическое обновление

Page 21: Кто потеснит полнотекстовый поиск?

Назад к каталогам?

Page 22: Кто потеснит полнотекстовый поиск?

Назад к каталогам?