25

Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

Embed Size (px)

Citation preview

Page 1: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016
Page 2: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

Логотип партнера

Page 3: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016
Page 4: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

Что бы это значило?

│ Запись динамического контента

Page 5: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

Изменяемые объявления, «Другие статьи на эту тему», лента

новостей, бесконечно подгружаемая лента и т.д.

│ Персонализация

Page 6: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

│ Мобильныеверсии сайтов

Page 7: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

Этого больше не будет:

│ Простота подключения

Page 8: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

https://yandex.ru/blog/metrika

Q1 – постепенный переход желающих

│ Следите за новостями

Page 9: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

Logs API

Page 10: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

10

Logs API

• Данные за всю историю счётчика

• Все визиты и все просмотры

• TSV

Page 11: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

│ Сложные конверсионные воронки

Page 12: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

│ Произвольные модели атрибуции

Page 13: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

│ Объединение данных из разных источников

Page 14: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

│ Контроль над статистикой

Page 15: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

ClickHouse

Page 16: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

16

ClickHouse timeline

Prototype

Январь 2009 Август 2012

Data Transfer

Июнь 2014

Metrica 2.0

Декабрь 2014 Июнь 2016

Open Source

Production

Page 17: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

17

Основные идеи при создании ClickHouse

• SQL

• Линейная масштабируемость

• Фокус на быстром выполнении запросов

• Column-oriented

Page 18: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

18

ClickHouse сегодня

• Более 20 проектов в Яндексе

• Open-source с июля 2016

• В продакшне вне Яндекса

Page 19: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

19

Запросы

• SQL диалект

• Приблизительные вычисления, URI функции

• Массивы, кортежи

• Распределённые запросы из коробки

• Внешние словари

Page 20: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

20

С чего начать?

• Tutorial: https://clickhouse.yandex/tutorial.html

• Пишите вопросы: [email protected]

• GitHub: https://github.com/yandex/ClickHouse

• Больше информации: https://clickhouse.yandex

Page 21: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

Logs API + ClickHouse

Page 22: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

│ Скрипт выгрузки данных из Logs API в локальный ClickHouse

Page 23: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

23

Интерфейсы ClickHouse

• Консольный клиент

• HTTP

• JDBC

• Python, PHP, NodeJS, Go и Perl коннекторы

Page 24: Евгений Куршев, Яндекс.Метрика вместо сериалов: анализируем поведение пользователей, Optimization2016

24

Пример запроса

# Weekly traffic and audience

SELECT

count() as visits,

sum(PageViews) as hits,

uniq(UserID) as users

FROM visits_all

WHERE StartDate > today() - 7