34
Základy strojového učení DataRestart 2016 Michal Illich

Základy strojového učení

Embed Size (px)

Citation preview

Page 1: Základy strojového učení

Základy strojového učení

DataRestart 2016

Michal Illich

Page 2: Základy strojového učení

Michal Illich

Page 3: Základy strojového učení

Obsah

1. Kdo používá strojové učení?

2. Kde ho můžete použít vy

3a. Jaké modely používat?

3b. Dva jednoduché příklady

4. Co s tím děláme my

5. Shrnutí

Page 4: Základy strojového učení

Kdo používá produkty strojového učení?

Page 5: Základy strojového učení

Kde se používá na webu - I

Page 6: Základy strojového učení

Kde se používá na webu - II

Page 7: Základy strojového učení

Kde se používá na webu - III

Page 8: Základy strojového učení

Mimo web

Siri

OCR

Self-driving cars

Page 9: Základy strojového učení

Kde ho můžete použít vy?

Page 10: Základy strojového učení

Ema má e-shop...

Page 11: Základy strojového učení

Skladovost

● Které zboží mám nakoupit na sklad?

● Cíl:– Minimalizace ceny skladovaného zboží

– Při maximalizace prodejů

Page 12: Základy strojového učení

Cenotvorba

● Jakou mám nastavit marži?(u konkrétního výrobku)

● Cíl:– Maximální celkový zisk

(přičemž nižší cena znamená více prodejů, ale s nižší marží...)

Page 13: Základy strojového učení

Parametry zboží

● Mám desítky tisíc produktů v e-shopu, jak k nim doplnit informace (technické specifikace)?

● Cíl:– Informovat zákazníka a umožnit vyhledávání

– Ale minimalizovat náklady na získání informací

Page 14: Základy strojového učení

Doporučování

● Zákazník si koupil X, jaká Y mu nabídnout?

● Cíl:– Prodat více (nebo častěji)

Page 15: Základy strojového učení

Jaké modely se používají?

Page 16: Základy strojového učení

Co je to vlastně model?

Krabička● Má vstupy● Má výstup(y)● a „uvnitř je chytrá“

Page 17: Základy strojového učení

Jak model vznikne?

Učením!

1. Vyberete algoritmus (a jeho parametry)

2. Natrénujete model (na minulých datech)

3. Pak jej používáte (na nových datech)

Page 18: Základy strojového učení

Lineární regrese

1. Každý vstup má přiřazenou váhu

2. Vstupy prostě vynásobím váhou.

A všechno to sečtu.

3. A mám výsledek.

Page 19: Základy strojového učení

Lineární regrese - příklad

Marže = 3

– 0.2 * PočetKonkurentůCoToMajíSkladem

– 0.3 * PočetKonkurentůCoToMajíLevnější

+ 0.8 * JeToNovinka

+ 0.5 * MámSklademPosledníKus

Page 20: Základy strojového učení

Lineární regrese - pokračování

Co udělá strojové učení lépe než člověk?● zanalyzuje obrovská data● určí koeficienty „matematicky optimálně“● vybere ty správné vstupy● může to vše dělat každou noc automaticky

Page 21: Základy strojového učení

Rozhodovací stromy

Page 22: Základy strojového učení

Neuronová síť

Page 23: Základy strojového učení

Neuronová síť

Velmi obecná- využitelná pro mnoho různých problémů- špičkové výsledky zejména pro obraz a zvuk

Nelineární

Deep learning- obrovský trend- viz mj. i moje přednáška

Hodně „magie“- těžká na interpretaci- vyžaduje zkušenosti s nastavením

Page 24: Základy strojového učení

Kde si s ním hrajeme my

Magictable

Brandiozo

Golem

a jeden neveřejný projekt

Page 25: Základy strojového učení

Hledáme chyby...

Page 26: Základy strojového učení

Případně data rovnou dodáme

Robot to udělá- levněji než lidé- rychleji a na větších datech- stejně přesně nebo lépe

Člověk zůstane v roli dohledu/učitele,nedělá už rutinní práci.

Page 27: Základy strojového učení

Příklad, jak strojové učení používáme

Page 28: Základy strojového učení

Jak jej používáme – vysvětlení

1. Ručně navržené algoritmy spárují zdroje Konkrétně parametry z různých zdrojů (e-shopů, webů)

2. Strojové učení umí předpovědět které spárování je správně a které nejspíš chybně. S přesností 97 %

3. Chybná/podezřelá spárování potlačíme Dáme jim nižší váhu v souhrnném reportu

Page 29: Základy strojového učení

Open source nástroje

Neuronové sítě:

theano, keras, tensorflow, cuda-convnet

Další algoritmy:

gbm, libsvm, vowpal wabbit, sofia-kmeans, gensim

Nástroje s GUI:

weka, orange, rapid miner

Cloudové služby (proprietární):

Amazon, Azure, Google, BigML

Page 30: Základy strojového učení

Závěr

Page 31: Základy strojového učení

1/2

Mít data nestačí. Používejte je.kreslit barevné grafy je základ, nikoliv plné využití dat

Page 32: Základy strojového učení

Strojové učení.nechte stroje samotné najít si vztahy v datech

2/2

Page 33: Základy strojového učení

Díky!

[email protected] @michalillich

MagicTable.com(vyplňte svůj mail, máte-li zájem)

Page 34: Základy strojového učení

Appendix

Zdroje obrázků:http://www.edureka.co/blog/decision-trees/