Процесс анализа данных • Эксперт — специалист в предметной области, который умеет эффективно решать
возникающие в этой области задачи • Аналитик — специалист в области анализа и моделирования • Гипотезой в анализе данных часто выступает предположение о влиянии какого-либо
фактора или группы факторов на результат
Выдвижение предположения,
гипотезы (эксперт)
Формализация гипотезы, оценка
требований и поиск источников данных
(аналитик)
Проверка гипотезы с использованием
визуализации данных
Проверка гипотезы с использованием
моделирования
Перевод результатов на язык бизнеса
(аналитик)
Интерпретация результатов (эксперт,
аналитик)
Принятие решения (эксперт, ЛПР)
Presenter
Presentation Notes
Цель анализа – решение конкретного прикладного вопроса: Какова структура продаж за определенный период? Какие клиенты приносят наибольшую прибыль? Какие товары продаются или заказываются вместе? Как оптимизировать товарные остатки на складах? Процесс анализа В информационном подходе к анализу данных помимо модели присутствуют еще три важные составляющие: эксперт, гипотеза и аналитик. Эксперт — специалист в предметной области, профессионал, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области Роль эксперта: выдвигает гипотезы, аналитик строит модели для проверки достоверности. В крупных проектах участвуют несколько экспертов и аналитик. Гипотезой в анализе данных часто выступает предположение о влиянии какого-либо фактора или группы факторов на результат. К примеру, при построении прогноза продаж допускается предположение, что на величину будущих продаж существенно влияют продажи за предыдущие периоды и остатки на складе. При оценке кредитоспособности потенциального заемщика выдвигается гипотеза, что на кредитоспособность влияют социально-экономические характеристики клиента: возраст, образование, семейное положение и т.п. Аналитик — специалист в области анализа и моделирования. Аналитик на достаточном уровне владеет какими-либо инструментальными и программными средствами анализа данных, например методами Data Mining. Кроме того, в обязанности аналитика входят функции систематизации данных, опроса мнений экспертов, координации действий всех участников проекта по анализу данных. Аналитик - мост между экспертами разных уровней и областей. Собирает гипотезы, выдвигает требования к данным, проверяет гипотезы и анализирует результаты с экспертами вместе. Решает технические вопросы, связанные с БД, интеграцией с источниками и производительностью. Аналитик - главное действующее лицо в процессе анализа данных. Преимущества моделирования: Позволяет найти знания, которые невозможно извлечь никаким другим способом Дают формализованное описание процесса, которое поддается автоматической обработке и тиражированию Недостатки моделирования: Чувствительно к качеству данных, знаниям эксперта и аналитика, �формализации изучаемого процесса Имеются случаи, не укладывающиеся ни в какие модели
3
Цели использования аналитических систем
Какие типы аналитических систем наиболее полезны для вашей компании сейчас? Будут наиболее полезны через 24 месяца?
Визуализация: исходные данные
4
Визуализация: результаты
5
Визуализация: прогнозы
6
7
Визуализация: геоданные
Инструменты визуализации данных
8
Magic Quadrant for Business Intelligence and Analytics Platforms, 2014