51
Машинное обучение с элементами киберспорта Петр Ромов Яндекс, МФТИ, ВШЭ ФКН

Машинное обучение с элементами киберспорта

  • Upload
    romovpa

  • View
    464

  • Download
    7

Embed Size (px)

Citation preview

Page 1: Машинное обучение с элементами киберспорта

Машинноеобучениесэлементамикиберспорта

ПетрРомовЯндекс,МФТИ,ВШЭФКН

Page 2: Машинное обучение с элементами киберспорта

Какуюплощадьобъестпривязанныйкозелвквадратномогороде?

hMp://acm.Umus.ru/problem.aspx?space=1&num=1084

Page 3: Машинное обучение с элементами киберспорта

Какуюплощадьобъестпривязанныйкозелвквадратномогороде?

hMp://acm.Umus.ru/problem.aspx?space=1&num=1084

a

r

f(a, r) 7! S

Page 4: Машинное обучение с элементами киберспорта

Какуюплощадьобъестпривязанныйкозелвквадратномогороде?

hMp://acm.Umus.ru/problem.aspx?space=1&num=1084

a

r

f(a, r) 7! S

Page 5: Машинное обучение с элементами киберспорта

Какаяпогодабудетзавтра?

Исходныеданные Результат

Долгопрудный(55.9°N,37.5°E)2февраля2016

+1..+3Снег

Page 6: Машинное обучение с элементами киберспорта

Какаяпогодабудетзавтра?1.   Знаниезаконовприроды:

уравнения,описывающиесостояниеатмосферы,движениевоздушныхпотоков

Page 7: Машинное обучение с элементами киберспорта

Какаяпогодабудетзавтра?1.   Знаниезаконовприроды:

уравнения,описывающиесостояниеатмосферы,движениевоздушныхпотоков

2.Начальныеусловия:состояниеатмосферывначальныймоментвремени(сегодня)вразличныхточках

Page 8: Машинное обучение с элементами киберспорта

Какаяпогодабудетзавтра?

1. 2.

3.Алгоритмрешенияоченьбольшойсистемыуравнений+суперкомпьютер

Page 9: Машинное обучение с элементами киберспорта

Ктозатащиткатку?

Page 10: Машинное обучение с элементами киберспорта

Ктозатащиткатку?

Page 11: Машинное обучение с элементами киберспорта

Ктозатащиткатку?

Page 12: Машинное обучение с элементами киберспорта

Ктозатащиткатку?

Page 13: Машинное обучение с элементами киберспорта

Ктозатащиткатку?

Page 14: Машинное обучение с элементами киберспорта

Ктозатащиткатку?

Исходныеданные РезультатВседействияигроков:перемещенияпокарте,покупкаартефактов,боиит.д.Изменениеколичествазаработанногозолота,опытанапротяжениивремени…

Radiant

Задача:Попервым5игровымминутамопределить,какаякоманда(RadiantилиDire)выиграетматчвDota2.

Page 15: Машинное обучение с элементами киберспорта

Какподойтикзадаче?1.  Правильногорешения(котороепройдетвсе

тесты)—несделаемНо,можемсделатьрешение,котороередкоошибается

Page 16: Машинное обучение с элементами киберспорта

Какподойтикзадаче?1.  Правильногорешения(котороепройдетвсе

тесты)—несделаемНо,можемсделатьрешение,котороередкоошибается

2.  Эвристики–  наосновеопытаигрывDota2•  «есликоманданабралапреимуществовзолотеболее

чемнаX,тоонавыиграет(скореевсего)»•  «есликомандавыбраланеудачнуюкомбинацию

героев,тоонапроиграет»•  …

Page 17: Машинное обучение с элементами киберспорта

Какподойтикзадаче?1.  Правильногорешения(котороепройдетвсе

тесты)—несделаемНо,можемсделатьрешение,котороередкоошибается

2.  Эвристики–  наосновеопытаигрывDota2•  «есликоманданабралапреимуществовзолотеболее

чемнаX,тоонавыиграет(скореевсего)»•  «есликомандавыбраланеудачнуюкомбинацию

героев,тоонапроиграет»•  …

–  найтизакономерностиавтоматически•  проанализировавмиллионыматчей,которыебыли

сыгранынапрошлойнеделе

Page 18: Машинное обучение с элементами киберспорта

Машинноеобучение

Входныеданные Ответ

345 1

223 0

...

925 1

Обучающаявыборкамножествопримероввходныхданныхиправильныхответов

Алгоритммашинногообучения Построеннаямодель

461

0

Page 19: Машинное обучение с элементами киберспорта

Машинноеобучение

Входныеданные Ответ

345 1

223 0

...

925 1

Обучающаявыборкамножествопримероввходныхданныхиправильныхответов

Алгоритммашинногообучения Построеннаямодель

461

0Признаковыеописаниячисловыевектора

фиксированнойдлины,вкоторыхзакодированався

входнаяинформация

Значенияцелевойпеременной

ответы,закодированныечислами

Новыевходныеданные

Предсказание

Page 20: Машинное обучение с элементами киберспорта

Ранжированиепоисковойвыдачинайденовиндексе(поискомподстроки)

Page 21: Машинное обучение с элементами киберспорта

Ранжированиепоисковойвыдачи

Признаки(запросаидокумента) Релевантность

34535234… 5

22366323.. 1

...

92536325… 3

ОбучающаявыборкаСоставляетсяспециальнымилюдьми—ассессорами

•  естьлислово«купить»?•  сколькословвзапросе?

•  сколькословиззапросаестьвдокументе?•  какчастовдокументевстречаютсясловаиззапроса?•  какойдоменувеб-сайта?

•  делаллипользовательпрограммистскиезапросы?

Page 22: Машинное обучение с элементами киберспорта

ПерсональноерадиоВЯндекс.Радионесколькомиллионовтреков,сотнитысячисполнителей.

Какойтреквключитьпользователю,чтобыонпоставиллайк?

Page 23: Машинное обучение с элементами киберспорта

Персональноерадио

Признаки(трекаипользователя) Лайкилинет?

34535234… +1(Лайк)

22366323.. -1(Дизлайк)

...

92536325… 0(Ничегонепоставил)

ПопулярностьЖанрДлительностьЕстьлиголос?Женскийилимужскойголос?

ОбучающаявыборкаИсториялайковидизлайковразличныхпользователей(сервисимеетмноголетнююисторию)

Какмногослушалтрекиэтогожанра?Какчастоприходитслушатьмузыку?Какоевремясуток?(поместномувремени)

Page 24: Машинное обучение с элементами киберспорта

Поисклицанаизображении

Page 25: Машинное обучение с элементами киберспорта

Поисклицанаизображении

1(Лицо)

0(Нелицо)

Page 26: Машинное обучение с элементами киберспорта

Фармацевтикаимедицина

•  Поописаниюхимическогосоединенияпредсказать:будетлионовоздействоватьнараздражитель?

•  Поисторииболезнейпациентапредсказать:какоелекарство(изсхожихпосвойствам)подействуетэффективнее?

Page 27: Машинное обучение с элементами киберспорта

ТяжелаяметаллургияСкольконеобходимоброситьвсплавдополнительноговещества,чтобыон

соответствовалГОСТу?Можносэкономить5–8%дополнительныхвеществ,вмасштабахзавода—несколькодесятковвагонов.

Обучающаявыборка:историяплавокзанескольколетфункционированиязавода.

Page 28: Машинное обучение с элементами киберспорта

Алгоритмымашинногообучения1.Решающиедеревья 2.Ансамбльизрешающихдеревьев

3.Линейнаямодель 4.Нейронныесети

Page 29: Машинное обучение с элементами киберспорта

Деревьярешений(decisiontrees)

Page 30: Машинное обучение с элементами киберспорта

Обучениедереварешений

Отличнаяиллюстрацияпринциповработыиобучениядереварешений:hMp://www.r2d3.us/

Page 31: Машинное обучение с элементами киберспорта

Ансамбльиздеревьеврешений•  Проблемарешающихдеревьев

–  Деревомалойвысотынеулавливаетвсезакономерности–  Деревобольшойвысотысклонновыделятьложныезакономерности

•  Решение:–  Строитьбольшоечислоразныхдеревьев–  Усреднятьихпредсказания/определятьответметодомголосования

•  Каксделатьдеревьяразными?–  Припостроениидереваиспользоватьслучайноеподмножествообучающихпримеров–  Припостроениидереваиспользоватьслучайноеподмножествопризнаков–  Строитьоченьнеглубокиедеревья,такчтобыкаждоеследующеедеревокорректировало

ошибкипредыдущих

Page 32: Машинное обучение с элементами киберспорта

Линейнаямодель

y(x;w) = w0 + w1x1 + w2x2 + · · ·+ wDxD

x = (x1, x2, . . . , xD) —признаки

y —правильныйответ

w = (w0, w1, . . . , wD) —неизвестныепараметрымодели

Модельпредсказания:

Page 33: Машинное обучение с элементами киберспорта

Обучениелинейноймодели

Оптимизацияпараметровпредсказательноймодели:

{(x1, y

1), (x2, y

2), . . . , (xN, y

N )}—обучающаявыборка(парынаборовпризнаковиправильныхответов)

NX

n=1

(y(xn;w)� y

n)2 ! minw

задачарешаетсяМетодомНаименьшихКвадратов(МНК)

Теперьвекторw—известен,можемделатьпредсказаниянановыхвходныхвекторахx:

y ⇡ y(x;w) = w0 + w1x1 + w2x2 + · · ·+ wDxD

Page 34: Машинное обучение с элементами киберспорта

Линейнаямодельинейронывходы—дендриты

выход—аксон

� —функцияактивации

Page 35: Машинное обучение с элементами киберспорта

Трехслойныйперсептрон

hj(x;Whidden) = �(whidden

j0 + x1whiddenj1 + · · ·+ xDw

hiddenjD )

Модельпредсказания:

y(h;W output) = �(woutput

0

+ h1

woutput

1

+ · · ·+ hDwoutput

D )

(W hidden,W output) —параметры,которыенеобходимообучить

Page 36: Машинное обучение с элементами киберспорта

Большеслоев

Page 37: Машинное обучение с элементами киберспорта

Нейронныесетидляраспознаванияизображений

Page 38: Машинное обучение с элементами киберспорта

Глубинноеобучение

•  Оченьбольшиенейронныесети•  Оченьмногопараметровдляобучения•  Оченьамбициозныезадачи:создать«искусственныймозг»•  Сложныеалгоритмыподбораоптимальныхпараметров•  ПрограммированиенаGPU,илидажекластерахGPU

Page 39: Машинное обучение с элементами киберспорта

Соревнованияпоанализуданных

hMp://kaggle.com

Page 40: Машинное обучение с элементами киберспорта

Соревнованияпоанализуданных

Page 41: Машинное обучение с элементами киберспорта

Соревнованияпоанализуданных

Page 42: Машинное обучение с элементами киберспорта

Соревнованияпоанализуданных

Page 43: Машинное обучение с элементами киберспорта

Соревнованияпоанализуданных

Page 44: Машинное обучение с элементами киберспорта

Мировойрейтинганалитиковданных

РейтинговаясистемакакнаTopCoderилиCodeForces

Page 45: Машинное обучение с элементами киберспорта

Соревнованияпопрограммированию

(ACMICPC,CodeForces)

•  Задачусоставилнектоболееумныйчемвы

•  Правильноерешениезаведомосуществует,ионегознает

Соревнованияпоанализуданных

(Kaggle,DrivenData)

•  Задачуставиткомпания,укоторойестьданные

•  Решенияниктонезнает•  Абсолютноправильного

решениянесуществует•  Аналитикисоревнуются

качествомрешений•  Решениезадачипринесет

пользу(ввидеденег,экономии,уникальногопродукта,сохраненныхжизней)

Page 46: Машинное обучение с элементами киберспорта

Шуткишутками…Ноктокаткузатащит?

НаборданныхизраспаршеныхреплеевреальныхматчейвDota2

hMps://kaggle.com/join/coursera_ml_dota2_contest

Page 47: Машинное обучение с элементами киберспорта

Шуткишутками…Акогонужнопикатьто?

hMps://kaggle.com/join/slava_sotone_dota2_pick

Page 48: Машинное обучение с элементами киберспорта

ПрогнозфинальныхматчейShanghaiMajor2016

•  Хакатонпосоставлениюалгоритмов,предсказывающихикорректирующихпрогнозыврежимереальноговремени

•  DotaScience.com

Page 49: Машинное обучение с элементами киберспорта

ФУПММФТИ,кафедраИС•  Теорияобучениямашин•  Мат.методыпрогнозированияФИВТМФТИ•  Прикладнаястатистика•  Введениевавтоматическую

обработкутекстов

ГдеучатанализуданныхВМКМГУ,кафедраММП•  Мат.методыраспознавания

образов•  Прикладнаястатистика•  Графическиемодели

ФКНВШЭ,Специализация«Машинноеобучениеиприложения»•  Машинноеобучение•  Прикладнаястатистика•  Анализтекстов•  Анализизображений•  Анализвременныхрядов•  Машинноеобучениенабольшихданных•  Численныеметодыванализеданных•  Информационныйпоиск•  Глубинноеобучение

Page 50: Машинное обучение с элементами киберспорта

Хочупрямосейчас

•  Coursera– Курс«Введениевмашинноеобучение»,ВШЭ– Специализация«Машинноеобучениеианализданных»,МФТИ

•  АвторыобоихкурсовпреподаютнаФКН

hMps://www.coursera.org/learn/vvedenie-mashinnoe-obucheniehMps://www.coursera.org/specializaUons/machine-learning-data-analysis

Page 51: Машинное обучение с элементами киберспорта

Контакты

•  Еслихотитеещечто-тоузнать– ПетрРомов– DataScienUstвЯндексе– АспирантФИВТМФТИ– ПреподавательФКНВШЭ– e-mail:[email protected]

•  Вопросы?