45
Андрей Себрант, Директор по маркетингу сервисов Что такое Big Data и чем они прекрасны

Андрей Себрант - Что такое Big data и почему это страшно интересно

  • Upload
    yandex

  • View
    493.333

  • Download
    3

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Андрей Себрант - Что такое Big data и почему это страшно интересно

Андрей Себрант, Директор по маркетингу сервисов

Что такое Big Data и чем они прекрасны

Page 2: Андрей Себрант - Что такое Big data и почему это страшно интересно

Для разогрева

Case: магазин Target и беременная девочка (США, 2012 год)

Page 3: Андрей Себрант - Что такое Big data и почему это страшно интересно

Еще для разогрева

Case: Jawbone UP

Page 4: Андрей Себрант - Что такое Big data и почему это страшно интересно

Есть такой браслет (точнее, 100 000)

Page 5: Андрей Себрант - Что такое Big data и почему это страшно интересно

60 лет каждую ночь

«Jawbone’s significant share of a growing market gives it quite a lot of data to mine. According to Rogati, the company collects the equivalent of 60 years of sleep data every night. Sleep, of course, is only a part of what the band monitors. For Rogati, Jawbone’s data trove was too good an opportunity to pass up. She joined the company this past summer from LinkedIn, another data-driven powerhouse.»

http://venturebeat.com/2013/11/06/how-jawbone-is-using-big-data-to-lead-the-personal-fitness-wearable-industry/

Page 6: Андрей Себрант - Что такое Big data и почему это страшно интересно

Включите фантазию Что можно придумать, если знать когда, сколько, насколько глубоко спят люди. С точностью до дня, с точностью до города.

Page 7: Андрей Себрант - Что такое Big data и почему это страшно интересно

7

Уточнение  термина  Big  Data  

Часто  говорят  про  3  V  –  дело  не  просто  в  размере  

•  Volume  Действительно  большие  (хотя  размер  зависит  от  доступных  ресурсов  для  их  обработки)  

•  Variety  Слабо  структурированные  и  разнородные  •  Velocity  Обрабатывать  надо  очень  быстро  (причем  и  результаты  часто  нужны  оперативно,  если  речь  об  онлайновых  сервисах)  

Page 8: Андрей Себрант - Что такое Big data и почему это страшно интересно

8

Четыре  самых  продвинутых  отрасли  

В  мире  (но  не  обязательно  у  нас):    

• Финансы  • Медицина  •  Государство  • High-­‐tech  и  интернет-­‐компании  

Впрочем,  и  прочие  подтягиваются  

Page 9: Андрей Себрант - Что такое Big data и почему это страшно интересно

9

Ancestry.com: от рукописных данных до ДНК-анализа

http://wiki.yandex-team.ru/users/asebrant/BigDataSF-2013/.files/ancestry.pdf

Page 10: Андрей Себрант - Что такое Big data и почему это страшно интересно

Машинное���обучение

Page 11: Андрей Себрант - Что такое Big data и почему это страшно интересно

11

Неприятные  свойства  данных  и  что  с  ними  делать  

Данные часто неполны Данные содержат ошибки Данные очень разнородны Машинное обучение Нечеткие связи и соответствия Постоянно искать обратную связь

Page 12: Андрей Себрант - Что такое Big data и почему это страшно интересно

1. 2. 3.

Построение семейной истории человечества

Генеалогические деревья и установление родства

Миграция глобальная и внутри стран

Историческая картина демографии

Page 13: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 14: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 15: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 16: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 17: Андрей Себрант - Что такое Big data и почему это страшно интересно

17

•  Относительная площадь лица на фотографии уже не столь очевидно влияет на вероятность контакта, и это – полезный инсайт

Оцифрованная романтика: eHarmony

Page 18: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 19: Андрей Себрант - Что такое Big data и почему это страшно интересно

Атом будущего

1. Дремучая: «Я так сказал!»

2. Продвинутая: «Мы провели A/B test»

3. Технологичная и современая: «Мы знаем, какую ты любишь»

История о цвете кнопки:���

Page 20: Андрей Себрант - Что такое Big data и почему это страшно интересно

Вернемся к братьям

Антропоморфизм – штука рискованная Следит ли за нами Большой Брат?

Page 21: Андрей Себрант - Что такое Big data и почему это страшно интересно

Есть дисциплина, называемая Machine Learning, машинное обучение

Как это работает?

Page 22: Андрей Себрант - Что такое Big data и почему это страшно интересно

МАШИННОЕ ОБУЧЕНИЕ В РЕКЛАМЕ

КАК НАЙТИ МОЮ

АУДИТОРИЮ?

Page 23: Андрей Себрант - Что такое Big data и почему это страшно интересно

Спам Поиск похожих картинок Распознавание рукописного текста Поиск Реклама

Page 24: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 25: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 26: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 27: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 28: Андрей Себрант - Что такое Big data и почему это страшно интересно
Page 29: Андрей Себрант - Что такое Big data и почему это страшно интересно

Мамы с детьми 0-3 года

[годовалый]

[ходунок]

[котофей]

[бебиблог]

[брокколи]

[дом2новости]

[джигурда]

Page 30: Андрей Себрант - Что такое Big data и почему это страшно интересно

On-line gamers

[dota] [кпд] [массовка] [cheat] [эмулятор] [варфэйс] [капа][паркур] [гайд] [дрифт]

[замужество] [партнерка] [прицел] [приворот]

Page 31: Андрей Себрант - Что такое Big data и почему это страшно интересно

Выпендрежники

Page 32: Андрей Себрант - Что такое Big data и почему это страшно интересно

Выпендрежники

[уильямс] [рафаэль] [инканто] [азур]

[бирюза] [топхотелс]

[татуаж] [пегий] [центробанк]

[старец] [нептун] [парадиз] [арго]

[slender] [ларедут] [вепрь]

Page 33: Андрей Себрант - Что такое Big data и почему это страшно интересно

33

Задача: найти на десктопе владельцев iPhone, iPad и Android

3 кампании: -  Без таргетинга -  С таргетингом Крипты -  С таргетингом по логину

Page 34: Андрей Себрант - Что такое Big data и почему это страшно интересно

34

0,23

Все Android (login) Android (Crypta)

CTR

Page 35: Андрей Себрант - Что такое Big data и почему это страшно интересно

35

0,23

0,36

Все Android (login) Android (Crypta)

CTR

Page 36: Андрей Себрант - Что такое Big data и почему это страшно интересно

36

0,23

0,36 0,38

Все Android (login) Android (Crypta)

CTR

Page 37: Андрей Себрант - Что такое Big data и почему это страшно интересно

37

Page 38: Андрей Себрант - Что такое Big data и почему это страшно интересно

38

Уровень телесмотрения

-  99% россиян смотрят ТВ ежемесячно* -  30% пользователей Рунета проводят у экрана ТВ менее часа в день**

*По данным TNS России ** По данным OMI и TNS

Page 39: Андрей Себрант - Что такое Big data и почему это страшно интересно

39

Light TV: методология исследования

Анкетирование  

• Анкета  TNS  • 4  вопроса    

• Опрос  проведен  OMI  

• 28’000  респондентов  

Cookie  matching  OMI-­‐Яндекс  

• Совмещение  панелистов  OMI  и  пользователей  Яндекса  

Анализ  поведения  выборки  в  интернете  

• Крипта  • 200  факторов  поведения  

Page 40: Андрей Себрант - Что такое Big data и почему это страшно интересно

40

Heavy TV viewers Light TV viewers

«сбербанк», «коммунальный», «шарлотка», «выкройка»,

«биглион», «irr», «заработать»

«книга», «переводчик», «словарь», «формула»,

«японский», «французский», «немецкий», «такси»

Больше запросов кириллицей Много запросов латиницей

Page 41: Андрей Себрант - Что такое Big data и почему это страшно интересно

41

Heavy TV viewers Light TV viewers

«тнт», «дом-2», «телепрограмма», «стс»

«С++», «wi-fi», «фотошоп», «torrent»,

«adobe»

Page 42: Андрей Себрант - Что такое Big data и почему это страшно интересно

42

Heavy TV viewers Light TV viewers

«спартак», «цска», «пиво» «загранпаспорт», «авиабилет», «виза», «самолет», «аэропорт», «ржд»

Page 43: Андрей Себрант - Что такое Big data и почему это страшно интересно

43

Домашнее чтение

Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим Виктор Майер-Шенбергер, Кеннет Кукьер http://www.livelib.ru/book/1000755419

Page 44: Андрей Себрант - Что такое Big data и почему это страшно интересно

44

Data is new oil ������

Data is just like crude. It’s valuable, but if unrefined it cannot really be used. It has to be changed into gas, plastic, chemicals, etc., to create a valuable entity that drives profitable activity; so must data be broken down, analyzed for it to have value.

Michael Palmer, 2006���

Page 45: Андрей Себрант - Что такое Big data и почему это страшно интересно

Андрей Себрант

Спасибо! Вопросы?

asebrant@yandex-­‐team.ru  Twiyer:  @asebrant  Facebook:  hyps://www.facebook.com/asebrant