40
Георгий Айзель, к.т.н., м.н.с. Машинное обучение в гидрологии

Машинное обучение в гидрологии (Г.В. Айзель)

Embed Size (px)

Citation preview

Page 1: Машинное обучение в гидрологии (Г.В. Айзель)

Георгий Айзель, к.т.н., м.н.с.

Машинное обучение в гидрологии

Page 2: Машинное обучение в гидрологии (Г.В. Айзель)

На самом деле нет!

1 АПРЕЛЯ -

Международный день вомбатов и котиков

(или День Дурака)

Page 3: Машинное обучение в гидрологии (Г.В. Айзель)

Поисковый запрос:

“вомбат... котяня”

Без машинного обучения мы бы никогда не нашли такую картинку

Page 4: Машинное обучение в гидрологии (Г.В. Айзель)

ВомбатиПутин

Page 5: Машинное обучение в гидрологии (Г.В. Айзель)

Котяняи

Путин

Page 6: Машинное обучение в гидрологии (Г.В. Айзель)

Машинное обучение в гидрологии

Page 7: Машинное обучение в гидрологии (Г.В. Айзель)

WTF?

Page 8: Машинное обучение в гидрологии (Г.В. Айзель)

Разумные компьютеры-убийцы

Технологии: нейронные сети, связь с внешним источником супер-интеллекта skynet, зрение, распознавание звуков, могут стрелять/резать и т.д.Цель: истребление человечестваГод: до 2029 (на самом деле нет)

Page 9: Машинное обучение в гидрологии (Г.В. Айзель)

Технологии: нейронные сети (convolutional, deep learning)Цель: распознавание образов объектов, ориентирование на местностиГод: 2013

Page 10: Машинное обучение в гидрологии (Г.В. Айзель)

Яндекс.Диктовка

Технологии: разнообразие методов машинного обучения

Цель: быстрая коммуникация компьютер - человек

Год: 2014

Page 11: Машинное обучение в гидрологии (Г.В. Айзель)

Стадии развития методов машинного обучения (Vapnik, 1995):

● первые алгоритмы машинного обучения

● основы теории

● нейронные сети

● альтернативы нейронным сетям

Page 12: Машинное обучение в гидрологии (Г.В. Айзель)

Идея машинного обучения

Обучающаяся программа

Примеры данных с закономерностями

Модель закономерности

Поиск закономерностей в

новых данных

Page 13: Машинное обучение в гидрологии (Г.В. Айзель)

?

признаковое описание

Об

учаю

щая

вы

бо

рка

Пр

ове

ро

чная

вы

бо

рка

Матрица объект-признак (X) Целевой вектор (y)

Page 14: Машинное обучение в гидрологии (Г.В. Айзель)

Цикл решения задачи

Предобработка данных

Выбор метода и параметров

Обучение

Оценка качества

Окончательная методика

Page 15: Машинное обучение в гидрологии (Г.В. Айзель)

X1

y WTF?

Page 16: Машинное обучение в гидрологии (Г.В. Айзель)

X1

y

Простейшая задача машинного обучения - Линейная регрессия

?

Page 17: Машинное обучение в гидрологии (Г.В. Айзель)

WTF?

X1

X2

Page 18: Машинное обучение в гидрологии (Г.В. Айзель)

Простейшая задача машинного обучения - Логистическая регрессия

X1

X2

?? ?

Page 19: Машинное обучение в гидрологии (Г.В. Айзель)

МАТАН - ДОБРО

Page 20: Машинное обучение в гидрологии (Г.В. Айзель)

Нейронные сети

Page 21: Машинное обучение в гидрологии (Г.В. Айзель)

Нейронные сети

● Могут подстроиться под любые данные

● Ассоциативная память

● Любят переобучаться (т.к. очень много параметров)

● На самом деле нет ничего общего с мозгом человека :)

● Огромное количество преимуществ и недостатков

● Made in

Page 22: Машинное обучение в гидрологии (Г.В. Айзель)

Обучение нейронных сетей

Самый простой (но долгий) - алгоритм обратного распространения ошибки

● сходимость процесса

обучения

● выпуклость

● общие функциональные

пространства и сжимающие

отображения

Page 23: Машинное обучение в гидрологии (Г.В. Айзель)

How to train your dragon ANN?

Кричите на неё!

Page 24: Машинное обучение в гидрологии (Г.В. Айзель)

МАТАН - ДОБРО

Page 25: Машинное обучение в гидрологии (Г.В. Айзель)

Пример использования искусственных

нейронных сетей в решении

гидрологической задачи

Page 26: Машинное обучение в гидрологии (Г.В. Айзель)

Гидрологическое моделирование

Физически обоснованная модель взаимодействия

поверхности суши с атмосферой (SWAP)

Параметры

Осадки, температура

Параметры подстилающей

поверхности

Тепловая энергия

...

Рассчитанный речной сток

Измеренный речной сток

Калибровка параметров

Page 27: Машинное обучение в гидрологии (Г.В. Айзель)

ДанныеКалибровка параметров

моделиДанные по стоку

Расчет речного стока

Данные

???

???

Расчет речного стока

Здоровый человек

Курильщик

Page 28: Машинное обучение в гидрологии (Г.В. Айзель)

WTF?

Page 29: Машинное обучение в гидрологии (Г.В. Айзель)

Выход есть !

Page 30: Машинное обучение в гидрологии (Г.В. Айзель)

323 MOPEX-водосбора

210 водосборов на которых будет происходить обучение ИНС

113 «неизученных» водосборов для проверки эффективности разрабатываемой методики

Page 31: Машинное обучение в гидрологии (Г.В. Айзель)

?

признаковое описание

Об

учаю

щая

вы

бо

рка

Пр

ове

ро

чная

вы

бо

рка

Матрица объект-признак (X) Целевая матрица (Y)

17 характеристик природных условий (GSWP – 2, MOPEX)

11 параметров модели SWAP

Неизученные водосборы

Page 32: Машинное обучение в гидрологии (Г.В. Айзель)

Архитектуры ИНС

Многослойный персептрон Радиальная базисная функция

Алгоритмы обучения ИНС

● Обратного распространения ошибки

● Левенберга-Марквардта

● Сопряженных градиентов

Page 33: Машинное обучение в гидрологии (Г.В. Айзель)

Результаты

Медианные оценки:

Eff = 0.484|Bias| = 13.7%

Page 34: Машинное обучение в гидрологии (Г.В. Айзель)

Краткая характеристика результатов

Page 35: Машинное обучение в гидрологии (Г.В. Айзель)

Альтернативы нейронным сетям

● SVM (Support Vector Machines)

● GEP (Gene Expression Programming)

● Boosting (combine ‘em all, weak decision trees, Yandex Matrix Net)

Page 36: Машинное обучение в гидрологии (Г.В. Айзель)

2010 2011 2012 2013 2014 2015

Это стильно, модно, молодежно?

Page 37: Машинное обучение в гидрологии (Г.В. Айзель)

Самые распространенные проблемы

● Размытая постановка задачи

● Большое количество степеней свободы

● Большое количество разных источников данных

● Качество данных и пропуски в них

● «Сырое» ПО для работы с данными

● Неудобство работы с большими данными

● Наличие обучающей выборки

@akrot (habr)

Page 38: Машинное обучение в гидрологии (Г.В. Айзель)

С чего начать?

● Linux-way

● Python с библиотекой SciKit (или R, Matlab/Octave)

● Coursera (Machine Learning от Andrew Ng)

● Kaggle competition (kaggle.com)

● Yandex events (tech.yandex.ru, events.yandex.ru)

● Habrahabr.ru

Page 39: Машинное обучение в гидрологии (Г.В. Айзель)

Александр Фонарев

Максим Мусин tech.yandex.ru

Andrew Ng

Александр Крот (@akrot)

Page 40: Машинное обучение в гидрологии (Г.В. Айзель)

Спасибо!

[email protected]