31
Визуализация данных Или художественный компонент в Big Data

Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Embed Size (px)

DESCRIPTION

Конференция "AI&BigData Lab", 12 апреля 2014

Citation preview

Page 1: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Визуализация данных

Или художественный

компонент в Big Data

Page 2: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

О чем поговорим?

❖ Вкратце: что такое визуализация данных, и кому это

нужно

❖ Какие этапы и кто участвует в разработке?

❖ А как это создавать технически?

Page 3: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Data visualization:

что и зачем

Page 4: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Данные - ценны

Page 5: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Зачем визуализировать?

❖ Хочется минимизировать разглядывание таблиц aka

сырых данных

❖ Хочется подергать данные за ниточки

❖ Хочется найти простой способ презентации и

анализа сложных структур данных

❖ Хочется упростить поиск ответов на вопросы

Page 6: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

"Main goal of data visualization is to communicate

information clearly and efficiently through graphical

means"

Page 7: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Простой Пример

0

25

50

75

100

125

Апрель Май Июнь Июль

Page 8: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Пример посложнее

❖ http://bost.ocks.org/mike/nations/

The Wealth & Health of Nations

Page 9: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Еще пример - карта

❖ http://prescriptions-demo.dataart.com/

Page 10: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Немного о политикеhttp://cartodb.s3.amazonaws.com/static_vizz/ukr.html

Page 11: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Какие задачи стоят?

❖ Ответить на вопросы о данных которые интересны в

этот конкретный момент

❖ Сделать это максимально понятно

❖ А уж затем (если повезет) - сделать это красиво

Page 12: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Каков процесс

Page 13: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Из чего состоит процесс

Аналитика

❖ Сбор данных

❖ Постановка вопросов

Аналитика + Дизайн

❖ Поиск способов отображения

Техническая реализация

❖ Имплементация

❖ Интерактив

❖ Рефайнмент

Page 14: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Подготовим данные

❖ А как угодно

Page 15: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Зададимся вопросами

❖ ОТКУДА взялись данные?

❖ КТО пользователь?

❖ ЧТО ему нужно увидеть?

❖ ЗАЧЕМ ему это видеть?

Page 16: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Подумаем

Page 17: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Ну и реализация

❖ Наконец-то

Page 18: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Что такое хорошая визуализация?

❖ Не та, которая красивая

❖ Не та, которая показывает на одной картинке

миллион записей базы данных

❖ Но та, которая отвечает на конкретные вопросы (те

самые, которые мы задали пару слайдов назад)

Page 19: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Lorem Ipsum Dolor

Техническая реализация

Page 20: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Три "подхода"

❖ Использовать существующий продукт(дорого, не всегда комфортно, но доступно многим)

❖ Использовать существующие компоненты(дешево, быстро, но не все есть из коробки)

❖ Разработать самому(долго и дорого, но возможности безграничны)

Page 21: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Enterprise продукты

❖ Tableau, Qlikview, TIBCO Spotfire, Panopticon, .....

❖ Можно создать интерактивную картинку без единой

строки кода - много шаблонов "из коробки"

❖ Но зато дорого, сложно интегрировать, и ограничены

все той же "коробкой"

❖ Сравнение

Page 22: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Сравним

❖ Spotfire – замечательно

для Big Data

❖ QlikView –

интерактивность,

дашбоарды, мобильность

❖ Tableau – просто, удобно,

быстро развивается

Page 23: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Ну и пример - Tableau

Page 24: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Библиотеки графиков

❖ Платные (Highcharts, jqchart) и Open Source (Google

charts, nvd3, rickshaw, ...)

❖ Дешевле и быстрее

❖ Но ограничены в наборе графиков, стилизации и

кастомизации

Page 25: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Пример - HighCharts

Page 26: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Кастомная разработка

❖ Возможность создать визуализацию, которая:

❖ отвечает на конкретный вопрос

❖ помогает принимать конкретные решения

❖ анализирует конкретные данные

❖ Может быть красивой и увлекательной (хотя это не

самоцель)

❖ D3.js, Raphael, Processing

Page 27: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

D3.js

❖ http://d3js.org/

❖ …“D3 allows you to bind arbitrary data to a Document Object Model (DOM), and then apply data-driven transformations to the document. For example, you can use D3 to generate an HTML table from an array of numbers. Or, use the same data to create an interactive SVG bar chart with smooth transitions and interaction”…

❖ …“D3 is not a new graphical representation. Unlike Processing, Raphaël, or Protovis, the vocabulary of marks comes directly from web standards: HTML, SVG and CSS”…

Page 28: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Пример ❖ http://www.brightpointinc.com/interactive/political_influence/

Page 29: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Пример ❖ http://www.findtheconversation.com/concept-map

Page 30: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Подведем итоги

❖ Визуализация данных – тема, которая в тренде

❖ Существует множество способов реализовать

визуализацию в вашем проекте

❖ Цели проекта и вопросы, которые задает

пользователь, должны диктовать выбор технологии

Page 31: Тимашев Дмитрий "Что такое визуализация данных, или почему специалисты, работающие с данными, должны

Вопросы?

mailto: [email protected]