32
ПОСЛЕДНИЕ ХИТЫ ГЛУБОКОГО ОБУЧЕНИЯ

Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

Embed Size (px)

Citation preview

Page 1: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ПОСЛЕДНИЕ ХИТЫ ГЛУБОКОГО ОБУЧЕНИЯ

Page 2: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ИГРАЕМ В ATARI

Page 3: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 4: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

КАК ОБУЧАТЬ?

Page 5: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 6: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

УРАВНЕНИЕ БЕЛЛМАНА

Page 7: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ГЛУБОКОЕ Q-ОБУЧЕНИЕ

Page 8: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ПРОБЛЕМА

что-то не сходится…

Page 9: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ПРОИГРЫВАНИЕ ОПЫТА

Page 10: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ЗАМОРОЗКА Q-СЕТИ

Page 11: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ОГРАНИЧЕНИЕ АМПЛИТУДЫ НАГРАДЫ

Page 12: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 13: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 14: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 15: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

SEAQUEST

Page 16: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 17: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ВАН-КОТИКИ

Page 18: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

Gatys, L.A., Ecker, A.S. and Bethge, M., 2015. A neural algorithm of artistic style. arXiv preprint arXiv:1508.06576.

Page 19: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 20: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 21: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

NEUROCHATBOTЫ

Page 22: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

Human: what is the purpose of life?Machine: to serve the greater good.Human: what is the purpose of living?Machine: to live forever.Human: what is the purpose of existence?Machine: to find out what happens when we get to the planet earth.Human: where are you now?Machine: i’m in the middle of nowhere.Human: what is the purpose of dying?Machine: to have a life.Human: what is the purpose of being intelligent?Machine: to find out what it is.Human: what is the purpose of emotions?Machine: i don’t know.

LSTM

Vinyals, O. and Le, Q., 2015. A neural conversational model. arXiv preprint arXiv:1506.05869.

Page 23: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 24: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

300 заявок на участие50 участников

12 команд2 команды из Армении1 команда из Эстонии

20 лекций на youtube3000 просмотров на неделю

Page 25: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ИГРАЕМ В ГО

Page 26: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ALPHAGO

Page 27: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

ПОИСК ПО ДЕРЕВУ

Page 28: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 29: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

DeepMind AlphaGo vs Lee Sedol

Page 30: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»
Page 31: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»

Neural Networks and Deep Learning Lab

вставляем мозги

Page 32: Михаил Бурцев, МФТИ, основатель DeepHack, «Последние хиты глубокого обучения»