Обучаем машины для службы людям - прикладное машинное...

Preview:

Citation preview

Прикладное машинное обучениеобучаем машины для службы людям

ООО «Экспасофт»

2010 - …ООО "Экспасофт"ООО "Исследовательские системы"

ЭКСПАСОФТ

1999 - 2003Выпускники НГУ(к.ф.-м.н.)

2003 - 2011ИМ СО РАН, лаборатория анализа данных

История создания

2015 - …Лаборатория аналитики потоковых данных и машинного обучения НГУ

Оптимальные решения

Команда

Евгений Павловскийк.ф.-м.н. по математической логике, управление проектами, бизнес анализ, заведующий лабораторией машинного обучения

Владимир Дюбановинтеллектуальный анализ данных, 4 место на Data Mining Cup-2009, 20+ проектов по машинному обучению, 30+ публикаций

18 сотрудников, 4 к.ф.-м.н., аспиранты, магистранты НГУ

Команда

Клиенты

Анализ данныхклассификация, кластеризация, скоринг, прогнозирование, восстановление данных

Курсы по BigDataсбор данных, постановка задач, основные технологии решения, проверка результатов

Глубинное обучениераспознавание изображений, звуковых (речевых) сигналов, сейсмических сигналов

Направления

Анализ данныхклассификация, кластеризация, скоринг, прогнозирование, восстановление данных

Курсы по BigDataсбор данных, постановка задач, основные технологии решения, проверка результатов

Глубинное обучениераспознавание изображений, звуковых (речевых) сигналов, сейсмических сигналов

Направления

Методология CRISP-DM Уникальная научная база Лаборатория машинного обучения

Анализ данных и машинное обучение

−Понимание целей−Понимание данных

−Подготовка данных

−Моделирование−Оценка−Внедрение

Методология CRISP-DM

Поиск ошибок списания

Анализ актов списания расходных материалов и медикаментовВыделение нетипичных актов списания

Нетипичный – существенно отличающийся от всего виденного ранее. Степень существенности отличия однозначно определяется вариативностью данных.

Акты списания

Модуль поиска100% 10%

HR аналитика

результативность

вероятность ухода

результативность первых

месяцев работыпоказатели на

обучении

90%

Эффективность рекламы

Билборды

Интернет

? ???

Таргетирование

объем продаж

магазинов 4812

жанров книг 1864

0-2300

618 команд

164 организации

42 страны

4 место

ошибка < 1

Прогнозирование потока посетителей

Персонализациярост конверсии

сегментация аудитории

совместный анализ

обучение с подкреплением

персональные предложения

Прогнозирование операционных осложнений

Модель: признак/вес Результат (распознано верно, %)

«Креатин»/6, «Сахарный диабет»/6, «Моч»/3, «Инсульт слева»/2

Осложнение: 94.55%Норма: 19.68%

«Т/м»/5, «Анестезия»/4, «Контр оккл»/3, «Сахарный диабет»/2, «ФВ»/1,«Контр стеноз»/1, «Виллизиев круг»/1

Осложнение: 91.95%Норма: 33.96%

«Виллизиев круг»/9, «ФВ»/7,«Контр оккл»/6, «Анестезия»/2, «КСО»/2,«Пат извитость сосудов»/1

Осложнение: 82.84%Норма: 49.20%

050

100

050

100

050

100

Прогнозирование отказа оборудования

3 месяца

температура

давление

сила токанапряжени

е

Фракционный состав смеси

сепаратор% газа

% нефти

% воды

показания датчиков

показания датчиков

показания датчиков

калибровка

смесь

Управление ресурсами

«стоимость» запросов

потребление ресурсов каждым

вебсайтом

объем трафика

появление«сверхновых»

оптимальное размещение сайтов по вычислительным

узлам

выявить для узла прогнозировать для вебсайта

рассчитать для кластера

Скоринговые модели

соц.-дем. данные

кредитная историяоплата

телефона/интернетаонлайн анкетирование

вероятность дефолтавероятност

ь просрочки

объем штрафов

максимизация прибыли

снижение рисков

Спектральный анализ

Анализ данныхклассификация, кластеризация, скоринг, прогнозирование, восстановление данных

Курсы по BigDataсбор данных, постановка задач, основные технологии решения, проверка результатов

Глубинное обучениераспознавание изображений, звуковых (речевых) сигналов, сейсмических сигналов

Направления

Распознавание изображений Распознавание звуков Машинное чтение текстов

Глубинное обучение

https://expasoft.com/services/

Распознавание лиц

ВерификацияТочность на LWF = 98%

=

ИдентификацияТочность на LFW = 86%

Aaron Peirsol

Abdel Nasser

Aaron Eckhart

Распознавание пола и возраста

Распознавание документов

Детектирование людей и автомобилей

Блокировка порнографии

60 000

60 000

30 000

98%

2%

5 сек.

20 сек.

MOBIO Database

77.0%

96.2%

deep learning

ТЕХНОЛОГИЯ

FRiSАУТЕНТИФИКАЦИЯ3

TEXT

Распознавание звуковых событийплач

лай

сирена

Восстановление модели черепа

Извлечение фактов из текстов

Автоматизация создания онтологий

извлечение фактов

воссоздание иерархии

GPU

Мобильные нейронные сети

$2 000

387,6 Вт

270×100×35 мм

детектирование пешеходов

3,5 Вт

23×23 мм

72%детектирование лиц 91%

Обработка видео в режиме реального времени

78%95%

ARM

$50

Анализ данныхклассификация, кластеризация, скоринг, прогнозирование, восстановление данных

Курсы по Big Dataсбор данных, постановка задач, основные технологии решения, проверка результатов

Глубинное обучениераспознавание изображений, звуковых (речевых) сигналов, сейсмических сигналов

Направления

BA Кейсы Проектный цикл

Бизнес-задачи

Бизнес-модели

ML Алгоритмы Модели Критерии Техники

SE Python SciPy NumPy OWL

Tools

MapReduce Tableau TextMinin

gGreenPlu

m

Dat

a Sc

ient

ist

CIO

Бизнес-аналитик,

дата-аналитик

Разработчик

DBA

Курсы по анализу больших данных

ОБУЧЕНИЕ BIG DATA

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ

ПРОГНОЗНЫЕ МОДЕЛИ

РАЗУМНЫЕ ТЕХНОЛОГИИ

Recommended