31
Анализ промышленных данных в эпоху Big Data Лайфхаки реализации проектов Дмитриев Владимир

Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

  • Upload
    others

  • View
    21

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

Анализ промышленных данных в эпоху Big Data

Лайфхаки реализации проектов

Дмитриев Владимир

Page 2: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

DATA SCIENCE ЗАДАЧИ НА ПРОИЗВОДСТВЕ

Оптимизация производственного процесса

Оптимизация издержек Предиктивный ремонт

Рекомендательные системы (подсказчики)

Оценки влияние рисков Ценообразование

Управление цепочками поставок

Page 3: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

НА КАКИЕ ВОПРОСЫ МЫ ИЩЕМ ОТВЕТ?

Как постоянно держать минимальные складские

остатки для обеспечения максимально возможного

числа контрактов?

?

Как сократить простои станков при выполнении различных

производственных программ??

Как определить, когда и какой транспорт выбрать для снижения

себестоимости перевозки продукции??

Почему возникают дефекты продукции и как их минимизировать??

Page 4: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

DATA SCIENCE = ПРИБЫЛЬ!

Промышленность

Хочу знать, как повысить

производительность!

Data Science

Рекомендательная система

Искусственный интеллект

Машинное обучение

Page 5: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

DATA SCIENCE – КАК ЭТО РАБОТАЕТ?

Иллюстрация взята с http://research.cs.tamu.edu/prism/lectures/pr/ © Ricardo Gutierrez-Osuna | CSE@TAMU

Измерения

Предобработка

данных

Снижение

размерности

Сенсоры

Базы данных

Глобальная сеть

Ψ-тесты

Экспертные оценкиВыделение признаков (extraction)

Генерация признаков (generation)

Нормирование (normalizing)

Очистка (cleansing)

Выбор признаков

(selection)

Поиск главных компонент/факторов

Обучение моделей и

предсказание Выбор модели

Классификаторы

Модели регрессии

Поиск информативных кластеров

Модели для оценки вероятности

событий

Кросс-валидация

Бутстреп-методы

Внешняя среда

Page 6: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ВАЖНЫЕ ШАГИ ВНЕДРЕНИЯ DATA SCIENCE

ПРОЕКТОВ НА ПРОИЗВОДСТВЕ

3.Регулярная работа на объекте

Качественная разметкаПред.тестирование

моделейКонтакт с

пользователями моделиОчные консультации с

экспертами

2. Понимание данных

Как измеряются и где?Как используются и

кем/чем?Какие шумы и погрешности?

Как были выгружены?

1. Согласованная задокументированная формулировка бизнес-цели

Измеримые критерии успешности Оценка экономического эффекта Возможна корректировка

Page 7: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ВАЖНЫЕ ШАГИ ВНЕДРЕНИЯ DATA SCIENCE

ПРОЕКТОВ НА ПРОИЗВОДСТВЕ

5. Эксперимент и еще раз эксперимент

Данные реального

времени

Ошибки в 2-3 раза

заметнее

Зона «комфорта»

оператора

Внешние возмущения на

модель

4. Оценка реального объема данных, пригодного для моделирование

Оценка пригодности размера

выборки для моделей черного

ящика

Скрытые факторы влияния

(неизмеримые)Сокращение размерности

Page 8: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ПЕРВОЕ ОБЩЕНИЕ С ЗАКАЗЧИКОМ

Хочу знать, как повысить

производительность!

Конкурс!

Page 9: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ПЕРВОЕ ОБЩЕНИЕ С ЗАКАЗЧИКОМ

Выявить потребность – предложить нужное решение.

Хочу знать, как повысить

производительность!

Конкурс!

Page 10: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ПЕРВОЕ ОБЩЕНИЕ С ЗАКАЗЧИКОМ

Промышленность

1. Проблемы

2. «Потолок» улучшений

3. Данные

4. Пользователи

5. Функциональные требования

6. Сроки и объем работ

7. Риски

8. Финансы

Достижимая и измеримая бизнес-цель и подходы

Page 11: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ПРИМЕРНО ВОТ ТАК

Задача проекта: обеспечить увеличение среднесуточного значения одного из основных показателей производства от оптимума не менее чем на 0,2%.

Цель проекта: получение экономической выгоды при производстве

Page 12: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ПРИМЕРНО ВОТ ТАК

Решение VISIOLOGY: разработана программа с алгоритмом оптимизации производства:

Контроль целевой метрики в реальном времени.

В 6 раз сокращена скорость оптимизации работы установки

Задача проекта: обеспечить увеличение среднесуточного значения одного из основных показателей производства от оптимума не менее чем на 0,2%.

Цель проекта: получение экономической выгоды при производстве

Page 13: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ПРИМЕРНО ВОТ ТАК

Повышениe емкости производства на

тонн / год

Page 14: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ПРИМЕРНО ВОТ ТАК

После оптимизацииДо оптимизации

Верхний предел спецификации

Нижний предел спецификации

Page 15: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

Забыл сказать, просто этот датчик

давно барахлит

Page 16: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

РЕГУЛЯРНАЯ РАБОТА НА ОБЪЕКТЕ

качественного обследования и понимания процесса

Регулярные 1-2 недели на производстве в начале проекта и

контакт с технологическими экспертами залог:

качественной разметки датасета и отбора

обучающих выборок

правильной постановки задачи и цели

корректировки и проверки модели в процессе R&D

Page 17: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ВОВЛЕЧЕНИЕ ИСПОЛНИТЕЛЕЙ

И ПОЛЬЗОВАТЕЛЕЙ В ЖИВОЕ ОБЩЕНИЕ

Page 18: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

4 ПРИЧИНЫ ПОЧЕМУ ВАЖНО РАБОТАТЬ

С БУДУЩИМИ ПОЛЬЗОВАТЕЛЯМИ

Получить нужную информацию

Получить нужную ценность и функциональность

Повысить доверие к результату

Вовлечь пользователей и обеспечить дальнейшее

использование модели в рабочем процессе

Page 19: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

DATA SCIENCE ГЛАЗАМИ ЗАКАЗЧИКА

«Большие данные» на производстве

Очищенные данные

Page 20: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ВЫБОРКА И СЕКРЕТЫ ПРОИЗВОДСТВА

Пригодные для

моделирования

данные

Очищенные данные

Page 21: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ВЫБОРКА И СЕКРЕТЫ ПРОИЗВОДСТВА

Сложные зависимости между параметрами, которые модели не улавливают – часть производства «черный ящик»

Возможно какая-то часть важных данных и измерений отсутствует или не измеряется вовсе

Секретное «ноу-хау» производителя, которые он тщательно охраняет даже под NDA

Необходимо понимать производство и расчеты для сокращения размерности моделей

Слишком мало данных для моделей «черного ящика»

Page 22: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

«СЛЕПОЙ» ТЕСТ ПРИ ОЦЕНКЕ КАЧЕСТВА

МОДЕЛИ

Page 23: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

«СЛЕПОЙ» ТЕСТ ПРИ ОЦЕНКЕ КАЧЕСТВА

МОДЕЛИ

Page 24: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

«СЛЕПОЙ» ТЕСТ ПРИ ОЦЕНКЕ КАЧЕСТВА

МОДЕЛИ

Решая задачи с данными реального времени,

нельзя полагаться на успешные результаты слепого теста

Page 25: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

«СЛЕПОЙ» ТЕСТ ПРИ ОЦЕНКЕ КАЧЕСТВА

МОДЕЛИ

Page 26: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ЭКСПЕРИМЕНТ И ТОЛЬКО ЭКСПЕРИМЕНТ

Модель должна проходить несколько экспериментальных

проверок в процессе разработки

Page 27: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ПРОВЕРКА НА АДЕКВАТНОСТЬ

Page 28: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

ПРИЧИНЫ НЕОБХОДИМОСТИ ПРОВЕРКИ

Постоянные внутренние и внешние возмущения на

процесс могут менять его параметры

Границы применимости модели (допущения,

граничные условия)

Сложная мат. модель ≠ правильные результаты

Высокая стоимость ошибки

Page 29: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

DATA SCIENCE PROJECT KEY TIPS

Есть ли задача и цель?!

Достаточно ли данных!

Как оценить эффект?!

Сколько мы на этом заработаем?!

Page 30: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

АНАЛИТИЧЕСКАЯ КУЛЬТУРА

Page 31: Анализ промышленных данных в эпоху Big Data · 2019. 10. 21. · Анализ промышленных данных в ... Обучение моделей

СПАСИБО ЗА ВНИМАНИЕ!