51
РАЗВИТИЕ ТЕХНОЛОГИЙ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА: ОТ ПЕРЦЕПТРОНА ДО ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ Михаил Бурцев, к. ф.- м. н., зав. лаб. «Нейронных сетей и глубокого обучения » МФТИ, директор по науке DeepHackLab вставляем мозги

Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

Embed Size (px)

Citation preview

Page 1: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

РАЗВИТИЕ ТЕХНОЛОГИЙ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА:ОТ ПЕРЦЕПТРОНА ДО ГЛУБОКИХ НЕЙРОННЫХ СЕТЕЙ

Михаил Бурцев,к.ф.-м.н., зав. лаб.

«Нейронных сетей и глубокого обучения» МФТИ,директор по науке DeepHackLab

вставляем мозги

Page 2: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

• McCulloch, W.S. & Pitts, W.H. (1943). A Logical Calculus of the Ideas Immanent in Nervous Activity, Bulletin of Mathematical Biophysics, 5:115-137

• Hebb, D.O. (1949). The Organization of Behavior, John Wiley & Sons, New York

• Rosenblatt, F. (1958). The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain, Psychological Review, 65:386-408

ЭВОЛЮЦИЯ ИИ

Page 3: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

Нейроны передают электрические сигналы

мозг можно смоделировать

электрической схемой

искусственные нейронные сети

Человеческий интеллект основан на манипуляции

с символами

компьютер совершает манипуляции с символами

искусственный интеллект

ЭВОЛЮЦИЯ ИИ

Page 4: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

• 1958, H. A. Simon and Allen Newell: "within ten years a digital computer will be the world's chess champion" and "within ten years a digital computer will discover and prove an important new mathematical theorem."

• 1965, H. A. Simon: "machines will be capable, within twenty years, of doing any work a man can do."

• 1967, Marvin Minsky: "Within a generation ... the problem of creating 'artificial intelligence' will substantially be solved."

• 1970, Marvin Minsky: "In from three to eight years we will have a machine with the general intelligence of an average human being."

ЭВОЛЮЦИЯ ИИ

Page 5: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

• Классификация огромныхмассивов изображений и видео.

• Google и Facebook охотятсяза головами ученыхзанимающихсянейронными сетями.

• Нейросети учатся играть в игры по картинке.

deep learning

ЭВОЛЮЦИЯ ИИ

Page 6: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

• Активность нейрона определяется преобразованием взвешенного суммарного воздействия на него

• Воздействия могут быть активирующими(положительные веса) или тормозными (отрицательные веса)

ИСКУССТВЕННЫЙНЕЙРОН

Page 7: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

• Искусственная нейронная сеть(ИНС) является концептуальной моделью биологической нейронной сети

• Состоит из элементов, влияющих на активность друг друга

• Основные свойства– надежность – по мере ухудшения качества входа, удалении связей или элементов эффективность сети снижается постепенно

– гибкость –ИНС могут быть применены в широком круге задач

– генерализация – достаточно обучения на ограниченной выборке

– ассоциативность памяти

ИСКУССТВЕННАЯНЕЙРОНАЯ СЕТЬ

Page 8: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ЧТО ТАКОЕГЛУБОКОЕ ОБУЧЕНИЕ?

DEEP LEARNING =

DIG DATA + GPU

Page 9: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

Статистическая обработка данных

– высокие трудозатраты на разработку специализированной системы обработки данных

– сложность адаптации к меняющейся структуре данных

– низкая эффективность обработки и хранения данных

Глубокое обучение нейронных сетей

ü низкие трудозатраты за счет универсальности алгоритмов

ü легкость адаптации при изменении структуры данных

ü ценная информацияü больше данных – выше качество

данныеинформация ИНФОРМАЦ

ИЯданные

ПРЕИМУЩЕСТВАГЛУБОКОГО ОБУЧЕНИЯ

Page 10: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ОСНОВНЫЕ НАПРАВЛЕНИЯГЛУБОКОГО ОБУЧЕНИЯ

ВИДЕТЬ ПОНИМАТЬ ДЕЙСТВОВАТЬ

Page 11: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

СВЕРТОЧНЫЕ НЕЙРОННЫЕ СЕТИ

Page 12: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

СВЕРТОЧНЫЕНЕЙРОСЕТИ

Page 13: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

КЛАССИФИКАЦИЯ И СЕГМЕНТАЦИЯ ИЗОБРАЖЕНИЙ

Page 14: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

Gatys, L.A., Ecker, A.S. and Bethge, M., 2015. A neural algorithm of artistic style. arXiv preprint arXiv:1508.06576.

ПЕРЕНОС СТИЛЯ ИЗОБРАЖЕНИЙ

Page 15: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ПЕРЕНОС СТИЛЯ ИЗОБРАЖЕНИЙ

ostagram.ru

Page 16: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ПЕРЕНОС СТИЛЯ ИЗОБРАЖЕНИЙ

ostagram.ru

Page 17: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

РЕКУРРЕНТНЫЕ НЕЙРОННЫЕ СЕТИ

Page 18: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

• «Классические» нейронные сети – сети прямого распространения (feedforward network) не обладают памятью.

• «Активации» проходят всю сеть насквозь.

• Нейросети «с памятью» –рекуррентные сети.

• За счет наличия обратных связей «активации» циркулируют в сети.

В ПОИСКАХ ПАМЯТИ

сеть прямого распространения

рекуррентная сеть

Page 19: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

• Сигнал затухает!

ПРОБЛЕМА ГЛУБИНЫ

Page 20: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

LSTM: НЕЙРОАРХИТЕКТУРА

Page 21: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

Human: what is the purpose of life?Machine: to serve the greater good.Human: what is the purpose of living?Machine: to live forever.Human: what is the purpose of existence?Machine: to find out what happens when we get to the planet earth.Human: where are you now?Machine: i’m in the middle of nowhere.Human: what is the purpose of dying?Machine: to have a life.Human: what is the purpose of being intelligent?Machine: to find out what it is.Human: what is the purpose of emotions?Machine: i don’t know.

Vinyals, O. and Le, Q., 2015. A neural conversational model. arXiv preprint arXiv:1506.05869.

Page 22: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных
Page 23: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

Алиса теперь счастлива.

• Она не говорит, что это так. • Она в опасности. • Она выглядит прекрасно. • Она была на концерте Фаллуджи.

• Я знаю, что она влюблена в него.

• Она великолепна.• Она принесла нам немного воды.

• Она ведьма. • А когда она говорит: "Я не говорю, что когда она позвонит"

• И когда она вернётся, я поняла,

Алиса попала в беду.

• Она не собирается никого убивать.

• Она изменила свою жизнь. • Да, да. Она не умеет жить.• Я видела в ней все свои приключения.

• Вот она вот и все. • Ты не нашел ее? • И все же так обожает. • . ♪ К кому она придумала это? ♪• А она не знает, кто ты?

Page 24: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ

Внутреннее представление вопроса

Page 25: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ПРИ ГЕНЕРАЦИИ ОТВЕТАХРАНИМ В ПАМЯТИ ВОПРОС

Внутреннее представление вопроса

Page 26: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

Yao, Kaisheng, Geoffrey Zweig, and Baolin Peng. "Attention with Intention for a Neural Network Conversation Model." arXiv preprint arXiv:1510.08565 (2015).

ПРИ ГЕНЕРАЦИИ ОТВЕТАХРАНИМ В ПАМЯТИ ВОПРОС +

СОСТОЯНИЕ ДИАЛОГА

Внутреннее представление вопроса

Внутреннее представление диалога

Page 27: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ПОРЯДОК ИМЕЕТ ЗНАЧЕНИЕДВУНАПРАВЛЕННОЕ КОДИРОВАНИЕ

Schuster, Mike, and Kuldip K. Paliwal. "Bidirectional recurrent neural networks." Signal Processing, IEEE Transactions on 45.11 (1997): 2673-2681.

Внутреннее представление вопроса

Page 28: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ПОРЯДОК ИМЕЕТ ЗНАЧЕНИЕ ФУНКЦИЯ «ВНИМАНИЯ»

«внимание»

Page 29: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

СЕТЬ С ПАМЯТЬЮMEMORY NETWORK

Sukhbaatar, S., Weston, J., & Fergus, R. (2015). End-to-end memory networks. In Advances in Neural Information Processing Systems (pp. 2431-2439).

Page 30: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

Xiong, Caiming, Stephen Merity, and Richard Socher. "Dynamic Memory Networks for Visual and Textual Question Answering." arXiv preprint arXiv:1603.01417 (2016).

ДИНАМИЧЕСКАЯ СЕТЬ С ПАМЯТЬЮDYNAMIC MEMORY NETWORK

Page 31: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ

Xiong, Caiming, Stephen Merity, and Richard Socher. "Dynamic Memory Networks for Visual and Textual Question Answering." arXiv preprint arXiv:1603.01417 (2016).

Page 32: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

РАБОТА С ЕСТЕСТВЕННЫМ ЯЗЫКОМ И ДИАЛОГОВЫЕ СИСТЕМЫ

Xiong, Caiming, Stephen Merity, and Richard Socher. "Dynamic Memory Networks for Visual and Textual Question Answering." arXiv preprint arXiv:1603.01417 (2016).

Page 33: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

НЕЙРОСЕТЕВОЕ ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 34: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ГЛУБОКОЕОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 35: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных
Page 36: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

SEAQUEST

ГЛУБОКОЕОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 37: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ГЛУБОКОЕОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 38: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ГЛУБОКОЕОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 39: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ГЛУБОКОЕОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 40: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ГЛУБОКОЕОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 41: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных
Page 42: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ГЛУБОКОЕОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 43: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ГЛУБОКОЕОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 44: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

4 : 1

ГЛУБОКОЕОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ

Page 45: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

МАШИННЫЙ ИНТЕЛЛЕКТПРИЛОЖЕНИЯ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Page 46: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

ГЛУБОКИЙ ИНТЕРЕС К ГЛУБОКОМУ ОБУЧЕНИЮ

Компания Продукты

Google§ Google Brain§ Google DeepMind

ü Распознавание речи в Google Now

ü Классификация изображение в Google Photos и Google+

Facebook§ Facebook AI Research

ü Поиск людей на фото в Facebookü Персональный помощник

M в Messenger

Baidu§ Baidu Institute of

Deep Learning

ü Поиск изображений в Baiduü Мобильное медико-диагностическое приложение

AskADoctor

Microsoft§ Deep Learning

Technology Center

ü Поиск изображений в Bingü Онлайн перевод устной речи в Skype

IBM§ Watson§ Cortical Learning Center

ü Часть продукта Watson (система искусственного интеллекта)

ü Alchemy API

Apple ü SIRI

Page 47: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных
Page 48: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных
Page 49: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных
Page 50: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

РЕВОЛЮЦИЯ ИИот BIG DATA к DEEP LEARNING

глубокое обучение делает большие данные осмысленными

Page 51: Михаил Бурцев. Развитие технологий искусственного интеллекта: от перцептрона до глубоких нейронных

вставляем мозги

Neural Networks

and Deep Learning

Lab