80
TEORETYCZNE PODSTAWY INFORMATYKI WFAiS UJ, Informatyka Stosowana I rok studiów, I stopień 1 15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Embed Size (px)

Citation preview

Page 1: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

TEORETYCZNE PODSTAWY

INFORMATYKI WFAiS UJ, Informatyka Stosowana

I rok studiów, I stopień

1

15/01/2018

Prof. dr hab. Elżbieta Richter-Wąs

Page 2: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Wykład 13c

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

2

Data Science:

Uczenie

maszynowe

Uczenie maszynowe: co to znaczy?

Metody

Regresja

Klasyfikacja

Klastering i wybor podzbioru

System do rekomendacji

Wykład na podstawie materiałów:

E. Fox & C. Guestrin, Univeristy of Waschington,

„Machine Learning Specialization”

http://www.coursera.org./learn/ml-foundations

Page 3: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie maszynowe

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

3

Metody uczenia maszynowego (machine learning) rewolucjonizują obecnie podejście do różnych problemów związanych z analizą danych.

Jeszcze kilka lat temu był to bardziej „akademicki” problem z zakresu numeryki i algorytmiki.

Page 4: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie maszynowe

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

4

Obecnie, bardzo szybko staje się kluczową techniką

dla wielu wiodących firm komercyjnych

Page 5: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie maszynowe: cel

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

5

Uzyskać odpowiedź dla różnej klasy pytań na

podstawie informacji zawartej w danych, bez

potrzeby budowy „modelu zjawiska”.

ML metod = np. klasyfikacja, regresja liniowa, sieci neuronowe

Page 6: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie maszynowe: przykład

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

6

Przewidywanie ceny domu na podstawie zebranych

danych dotyczących ceny innych

Page 7: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie maszynowe: przykład

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

7

Ranking restauracji

Page 8: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie maszynowe: przykład

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

8

Znajdowanie podobnych dokumentów

Page 9: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie maszynowe: przykład

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

9

Rekomendowanie podobnego produktu

Page 10: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie maszynowe: przykład

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

10

Rekomendowanie podobnego produktu na podstawie jego charakterystycznych cech

Page 11: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie maszynowe: przykład

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

11

Rekomendowanie podobnego produktu: na podstawie jego charakterystyki graficznej

Page 12: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Regresja

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

12

Uczenie maszynowe:

Regresja

Przewidywanie odpowiedzi na

podstawie informacji wejściowej

Page 13: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Cena akcji na giełdzie

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

13

Page 14: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Tweet popularność

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

14

Page 15: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Przykład: przewidywana cena domu

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

15

Page 16: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Data, model

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

16

Page 17: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Data, model

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

17

Jaki model dla f(x)?

Page 18: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Przewidywanie

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

18

A potem chcielibyśmy przewidzieć odpowiedź

Page 19: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Pętla iteracyjna?

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

19

Page 20: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Simple linear regression model

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

20

Co to znaczy „simple”?

1 input x, fitujemy zależność liniową do danych

Page 21: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Simple linear regression model

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

21

Co to znaczy „simple”?

1 input x, fitujemy zależność liniową do danych

Page 22: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Simple linear regression model

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

22

Co to znaczy „simple”?

1 input x, fitujemy zależność liniową do danych

Page 23: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Pętla iteracyjna

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

23

Page 24: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Funkcja „kosztu”

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

24

Page 25: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Minimalizacja funkcji „kosztu”

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

25

Page 26: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Pętla iteracyjna

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

26

Page 27: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Minimalizacja funkcji „kosztu”

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

27

Page 28: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Asymetryczny błąd kosztu

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

28

Page 29: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Polynomial regression

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

29

Page 30: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Multiple regression

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

30

Page 31: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Regresja: przewidywanie na

podstawie danych

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

31

Page 32: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Klasyfikacja

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

32

Uczenie maszynowe:

Klasyfikacja

Inteligentny system rankingu restauracji

Page 33: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Klasyfikacja

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

33

Uczenie maszynowe:

Klasyfikacja

Inteligentny system rankingu restauracji

Page 34: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Prosta klasyfikacja

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

34

Page 35: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Dane trenujące

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

35

Używamy danych trenujących aby przypisać prawdopodobieństwo (wagę) dla każdego słowa

Waga całego zdania (score) to będzie prosta sumą tych wag

Page 36: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Uczenie klasyfikatora

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

36

Page 37: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Jak wygląda nasz model

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

37

Page 38: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Zmiana współczynników

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

38

Page 39: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Jak wygląda nasz model?

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

39

Page 40: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Czy jesteś pewny swojej klasyfikacji

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

40

Page 41: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Interpretacja

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

41

Page 42: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Interpretacja

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

42

Link funkcja

Page 43: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Logistic regression model

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

43

Sigmoid funkcja

Page 44: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Logistic regression model

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

44

Effekt współczynników na kształt funkcji

sigmoidalnej

Page 45: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Jak pewny jesteś swojej klasyfikacji

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

45

Page 46: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Zmienne opisowe

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

46

Nadajemy numeryczne wartości

Page 47: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Klasyfikacja: ranking restauracji

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

47

Page 48: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Klastrowanie i wybór podobnych

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

48

Uczenie maszynowe:

Klasyfikacja i

wyszukiwanie

podobnych obiektów

Poszukiwanie podobnych obiektów

Page 49: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Wyszukaj podobny tekst

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

49

Musimy zdefiniować co to znaczy „podobny”

Page 50: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Wyszukaj podobny tekst

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

50

Musimy zdefiniować co to znaczy „podobny”

Page 51: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Technika może być stosowana do wielu

zagadnień

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

51

Page 52: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

„Odkryj” grupę podobnych obiektów

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

52

Page 53: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Pogrupuj wg. tematów dokumenty

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

53

Page 54: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Pogrupuj obrazki

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

54

Page 55: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Przykład: dokument na podobny temat

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

55

Jak mierzymy podobieństwo ?

Jak szukamy podobieństw ?

Page 56: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Najbliższy sąsiad

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

56

Page 57: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Reprezentacja dokumentu

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

57

Dokument = zbiór słów

Nieistotna kolejność występowania

Zliczaj ilość wystąpień i zaznaczaj

Page 58: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Reprezentacja dokumentów : TF-IDF

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

58

Słowa mogą być rzadko występujące, te rzadko

występujące są bardziej charakterystyczne.

Page 59: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Ważymy cechy charakterystyczne

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

59

Niektóre cechy są bardziej ważne niż inne

Niektóre różnice (absolutna wartość) są bardziej istotne niż inne. Liczy się rozmycie całego zbioru dla danej cechy.

Page 60: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Skalowana Euclidesowa miara

odległości

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

60

Page 61: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Naturalna miara odległości

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

61

Page 62: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Cosine miara odległości

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

62

Page 63: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Klastering: poszukiwanie dokumentu

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

63

Page 64: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

64

Uczenie maszynowe:

system

rekomendujący

Personalizacja

Page 65: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Rekomendacja: filmy

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

65

Page 66: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Rekomendacja: producty

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

66

Page 67: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujacy: popularność

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

67

Popularność?

Ranking wg. liczba oglądań

Nie ma personalizacji

Page 68: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujacy: klasyfikacja

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

68

Klasyfikacja?

Jakie prawdopodobieństwo że kupie ten product.

Personalizacja: patrzy na historie zakupów, koreluje

z pora roku, pora dnia, etc.

Page 69: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujacy: korelacje

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

69

Patrzy na korelacje. Osoby które kupiły A kupiły

również B

Utwórzmy macierz korelacji

Page 70: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujacy: korelacje

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

70

Patrzy na korelacje. Osoby które kupiły A kupiły również B

Macierz korelacji może należy znormalizować?

A może wprowadzić jakąś miarę „co znaczy podobne”?

Ograniczenie:

Nie patrzy na historię w czasie

Co zrobić z nowym użytkownikiem systemu?

Page 71: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący: filmy

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

71

Page 72: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący: filmy

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

72

Page 73: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący: filmy

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

73

Page 74: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący: sprawność

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

74

Page 75: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący: sprawność

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

75

Page 76: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący: sprawność

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

76

Page 77: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący: sprawność

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

77

Page 78: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący: sprawność

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

78

Page 79: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

System rekomendujący: sprawność

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

79

Page 80: TEORETYCZNE PODSTAWY INFORMATYKI - th-erichter/dydaktyka/Dydaktyka2017/TPI-2017/TPI... · Wykład 13c Prof. dr hab. Elżbieta Richter-Wąs 15/01/2018 2 Data Science: Uczenie maszynowe

Macierz podobieństw: rekomendacja

produktu

15/01/2018 Prof. dr hab. Elżbieta Richter-Wąs

80