Кто потеснит полнотекстовый поиск?

Preview:

DESCRIPTION

Кто потеснит полнотекстовый поиск? (Сергей Кузнецов, Smartus) Круглый стол "Поиск". C КИБ 2008.

Citation preview

Сергей КузнецовКто потеснит полнотекстовый поиск?

«Интернет и Бизнес», Москва, 2008

С чего все начиналось?

17 октября 1996 года

Чем все кончилось?

Чем все кончилось?

Почему каталоги проиграли?

1. древовидная структура слишком сложна

Почему каталоги проиграли?

2. трудно поддерживать актуальность каталога

Почему полнотекстовый поиск не так уж хорош?

1. Технология полнотекстового поиска трудна для пользователя

визуалам трудно с линейной выдачей

трудно искать не текст, а картинку или результат из базы данных

новичкам трудно сформулировать верный запрос

Почему полнотекстовый поиск не так уж хорош?

2. Полнотекстовый поиск не обеспечивает нужной релевантности

В более чем 99% случаев поисковый механизм выдает больше результатов, чем пользователь способен оценить или хотя бы просмотреть

Не более 6% пользователей используют результаты выдачи после десятого (по данным AOL Search Data, выборка из >9000000 пользовательских запросов)

Насколько много среди этих десяти результатов дорвеев?

Почему полнотекстовый поиск не так уж хорош?

3. Качество источников сложно оценить

Достоверность источника определяется сочетанием двух факторов:

1. Источник правильно определяет истинность набора утверждений, про которые заведомо известно, истинны они или ложны.

2. Мнение источника об истинности или ложности некоторого набора утверждений, про которые нет однозначного ответа, истинны они или ложны, совпадает с мнением пользователя.

Мало того, что достоверность источника зависит от пользователя – но даже «объективную» достоверность поисковые машины не слишком хорошо умеют мерить.

Почему полнотекстовый поиск не так уж хорош?

Несколько примеров пользовательских сценариев

Где же выход?

кластеризация результатов поиска

«продвинутые» интерфейсы

метапоиск по базам данных и «глубокому вебу»

вертикальный поиск

поиск по ограниченной базе источников

Несколько примеров

Несколько примеров

Несколько примеров

Тематический поиск

новости

отели

билеты

рестораны

финансы

недвижимость

работа

автомобили

… и многое другое

Несколько примеров

Несколько примеров

Несколько примеров

Несколько примеров

Назад к каталогам?

использование тэгов

автоматическое обновление

Назад к каталогам?

Назад к каталогам?

Recommended