24
Как выйти из плоскости (How to escape from Flatland) Павел Айткулов ([email protected]) http://www.convert- conf.ru/

"Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Embed Size (px)

Citation preview

Page 1: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Как выйти из плоскости(How to escape from Flatland)

Павел Айткулов ([email protected])

http://www.convert-conf.ru/

Page 2: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

M. C. Escher, Reptiles, 1943

Page 3: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

(c)opyrights

(Big?) Data engineer

Обо мне

Page 4: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Маленькие девочки любят картинки

Бизнес любит картинки

Alice was beginning to get very tired of sitting by her sister on the bank and of having nothing to do: once or twice she had peeped into the book her sister was reading, but it had no pictures or conversations in it, "and what is the use of a book," thought Alice, "without pictures or conversations?'

Page 5: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Больше чем 2D: размер, температура, география, ...

И так, инфографика?

Page 6: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

В основном, 2D

Сегодня

Page 7: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

- (NY) Привет Роман, нам нужен отчет для клиента.- (BRA) Хорошо, к утру сделаю.- +1 день- (Bra) Готово, посмотри пожалуйста.- (NY) Классно, сейчас взгляну.- +1 день- (NY) Есть вопрос. Почему по строке….- (Bra) Мда, - (Bra) Переделал, обнови.- (NY) Вроде все нормально. Так, вот это все надо

для другого клиента.- +1 день

Клиент -> наш бизнес -> наш аналитик

C B -> C A -> O B -> O A -> O P

B Бизнес, O наш, A аналитик, C клиент, P программист

+ на каждом слое по менеджеру

Отдача результата: <- <- <- <-

Идеальный мир:

Бизнес <-> поиграться с данными

Почти идеальный мирБизнес аналитик <-> поиграться с данными

Проблема

Page 8: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Характеристики прототипа

Входные данные: 100+Гб, 400 млн строк (pageviews)

Время реакции: < 3 c

Количество входных измерений: десятки, < 100 (да и зачем вам больше?)

Количество измерений в запросах: < 12-15 (финальные данные должны влезть в память)

Следите за руками (обман!), предобрабатываем входные (100+Гб) в разумные данные.

Page 9: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Демо

Мифы:

Apple более щедрые чем android

Доля Mac не более 10% рынка

Глубже?

Page 10: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск
Page 11: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Группировки по:

Пользователю (уже сделано)

Url

Стране

Разделу (tag, спорт/политика/новости)

Автору

Url: расширить данными (переходы с соцСетей) Наиболее ценные страницы(платники), оценка соцЗаказа (покупка заказных статей блогеров). SEO. На какие же страницы приходят с поиска?

Страна: А уж не блокирует ли кто нас? “Национальная кухня”

Раздел: Наиболее ценные разделы(платники)

Автор: Топ-10 лучших авторов. Топ-10 худших авторов. Система оплаты авторов. Наиболее ценные авторы (платники)

Как насчет?

Page 12: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Что если вы работаете в:

Банк

Служба такси

Ритейлер

Нефтяная компания

Железные дороги

Данные:

Клиент, менеджер, офис, тип операции

Клиент, водитель, машина, география,

Покупатель, продавец, товар, поставщик, склад, магазин

Всегда: деньги, время, размер очереди обслуживания

Группировать: обсудить с аудиторией

Задачи:

Удержание клиента, системы лояльности

Поиск аномалий, защита от мошенничества

За границами веб-аналитики

Page 13: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

СравнениеProduct + - =

GA/YM Простота Не глубоко

GA/YM платный

$$$, доп знания

Excel Распространенность Не большие данные, по большей части 2D, знания

Иметь данные

Tableau Визуализация, многомерность

$$$, доп знания Иметь данные

OLAP Многомерность $$$, доп знания Иметь данные

Revolve (этот)

Простота, глубина, скорость Пока не продукт Иметь данные

Page 14: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

+ Быстро. (100+Гб/300млн строк за 1-3 с) Глубоко. > 2D Интуитивно, не требует знаний программирования (SQL, R, Excel). Бизнес может с этим поиграться.

- Нужен доступ до данных (GA/YM собирает, но не предоставляет) Все равно нужно уметь “готовить” данные

Преимущества/недостатки

= Является инструментом для выборки/запроса данных, не является средством для расчета. (Скрестить с excel/google sheet?) Визуализация побочна/вторична. Никак не является системой сбора данных Для целей аналитики, нельзя навесить действие на выделенный сегмент

Page 15: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

- Что мне делать, если я средний … (банкир, веб-аналитик)?- Не быть средним

(с) Богатый папа, бедный папа, Роберт Кийосаки

Совет

Что делать, если у меня нет доступа до данных?==Что делать, если у меня нет денег?== Что делать, если ничего нет, а хочется?

Ничего, см. выше

Page 16: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Андрей Овсянников (Picom, [email protected])

Picom (http://picom.ru)

Благодарности

Page 17: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Мои цели на эту конференцию

Понять есть ли у кого схожие задачи (и за пределами веб-аналитики, возможные связи).

Обратная связь. Куда двигаться? Нужно ли вообще двигаться? (куда можно еще съездить?)

Page 18: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Спасибо.

А мы все ставим каверзный ответ, и не находим нужного вопроса (с) Высоцкий В. С. Мой Гамлет

[email protected]

Page 19: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Pageview

Grouped by user

Projection

Page 20: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

1) Room. Man and woman. W: “Which dress? Red or blue?”2) Man: “Does it matter?”3) The house, the street, the city, the country...4) Aliens on orbit: “If she picks the blue one, explode the planet!”

Getting the vision of its audience

Otherwise, you can print reports.

There is no difference whether the user visits site 204 or 217 times.We do not need total accuracy, just the general vision.

If your traffic went up by 15%, it’s just fluctuation.

If your traffic has been going up by 15% for the last 6 months, then it’s probably a trend.

Page 21: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Business wants reports.

Business wants to get the vision of its audience.

Select specific part of the audience.

Perform some actions.

Get feedback.

Repeat. ^^^

Page 22: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск

Why do we need analytics?

Why business needs analytics?

Translation from Business language to Technical language (!?)

actually, money

This is all about happiness.

Page 23: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск
Page 24: "Как выйти из плоскости" Павел Айткулов, piano.io, Ижевск