28
Архитектура поиска в Avito Андрей Смирнов

Архитектура поиска в Avito / Андрей Смирнов (Avito)

  • Upload
    ontico

  • View
    264

  • Download
    12

Embed Size (px)

Citation preview

Page 1: Архитектура поиска в Avito / Андрей Смирнов (Avito)

Архитектура поиска в Avito

Андрей Смирнов

Page 2: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 3: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 4: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 5: Архитектура поиска в Avito / Андрей Смирнов (Avito)

Группы поисковых сервисов в Avito ● Основной поиск.● Avito Контекст● Backoffice.

(800 млн объявлений)● Небольшие сервисы.

(fias, подсказки, ошибки, geo)● Технические логи. kibana

Page 6: Архитектура поиска в Avito / Андрей Смирнов (Avito)

● 30 млн. объявлений● 150 млн. запросов в день● В пик 17000 запросов в секунду● 14 Гб индексов

Основной поиск

Page 7: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 8: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 9: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 10: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 11: Архитектура поиска в Avito / Андрей Смирнов (Avito)

● Быстрое отображение платного контента.● Быстрый антифрод.● Время вывода сервиса в бой.

Частое обновление индексов. Зачем?

Page 12: Архитектура поиска в Avito / Андрей Смирнов (Avito)

● Своя база данных.

Логическая репликация.

Останавливаем запись на время индексации.

View таблицы.● Параллельная индексация.

Сортируем категории по убыванию времени индексации.

Ускоряем индексацию.

Page 13: Архитектура поиска в Avito / Андрей Смирнов (Avito)

Время индексации категорийseconds

Page 14: Архитектура поиска в Avito / Андрей Смирнов (Avito)

Время индексации категорий, после «разрезания».

seconds

Page 15: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 16: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 17: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 18: Архитектура поиска в Avito / Андрей Смирнов (Avito)

● Rsync – надежный, простой.● Torrent base – быстро, надежно, забивает сеть.● UFTP

Нет гарантии доставки.

* Обязательно настраивать коммутатор.

* Эксперименты с настройками.

Ускоряем деплой

Page 19: Архитектура поиска в Avito / Андрей Смирнов (Avito)

Этап индексации и деплоя

Page 20: Архитектура поиска в Avito / Андрей Смирнов (Avito)

Этап проверки и ротации

Page 21: Архитектура поиска в Avito / Андрей Смирнов (Avito)

Оптимизация поиска

● Мониторинг.● Поиск аномалий.● Анализ медленных запросов● Подмешивание атрибутов в поиск

Page 22: Архитектура поиска в Avito / Андрей Смирнов (Avito)

Эффект от размазывания кэша.

200ms

200ms

100ms

100ms

Page 23: Архитектура поиска в Avito / Андрей Смирнов (Avito)

● Исправление ошибок.● Подмешиваем характеристики.● Сленг.

Помогаем продавцам

Page 24: Архитектура поиска в Avito / Андрей Смирнов (Avito)

комбинезон 71

компьютер 61

запчасть 54

hakkapelliita 34

mitsubishi 28

комплект 28

hyundai 27

Page 25: Архитектура поиска в Avito / Андрей Смирнов (Avito)

камбенезон камбинезон камбинизон кимбинезон

кобинезон кобминезон комбенезон комбензон

комбиезон комбиензон комбимнезон комбинедзон

комбинезан комбинезин комбинензон комбинзон

комбинизон комбинозон комбиньзон комбмнезон

комбнезон комбтнезон комибинезон коминезон

коммбинезон комьинезон конбенезон конбинезон

конбинизон

Page 26: Архитектура поиска в Avito / Андрей Смирнов (Avito)
Page 27: Архитектура поиска в Avito / Андрей Смирнов (Avito)

● Раскладка клавиатуры● Опечатки ● Подскажки при вводе● Лишние слова

Помогаем покупателям.

Page 28: Архитектура поиска в Avito / Андрей Смирнов (Avito)

meetup Sphinxsearch

18 июня в офисе Avito

bit.ly/sphinxmeetup