54
Teorię gier można określić jako teorię podejmowania decyzji w szczególnych warunkach. Zajmuje się ona logiczną analizą sytuacji konfliktu i kooperacji; bada jak gracze racjonalnie powinni rozgrywać grę. Prezentacja przygotowana przez: Daria Sitkowska Katarzyna Urbaniak

Teorię gier można określić jako teorię podejmowania ...math.uni.lodz.pl/~kowalcr/TGZ/Prezentacja1.pdf · Teorię gier można określić jako teorię podejmowania decyzji w szczególnych

  • Upload
    leduong

  • View
    220

  • Download
    0

Embed Size (px)

Citation preview

Teorię gier można określić jako teorię podejmowania decyzji w szczególnych warunkach. Zajmuje się ona logiczną analizą sytuacji konfliktu i kooperacji; bada jak gracze racjonalnie powinni rozgrywać grę. Prezentacja przygotowana przez:

Daria Sitkowska Katarzyna Urbaniak

Aby można było mówid o grze, należy określid kilka pojęd: 1. Gracz – uczestnik sytuacji, może nim byd człowiek, firma, paostwo, gatunek w znaczeniu biologicznym; w grze musi byd co najmniej dwóch graczy 2. Strategia – możliwośd postępowania każdego z graczy, sposób rozgrywania przez niego gry 3. Wynik gry – determinowany jest przez kombinacje strategii wybieranych przez poszczególnych graczy 4. Wypłata – określa wartośd wyniku gry dla poszczególnych graczy, można ją wyrazid liczbowo; poszczególne wyniki są przyporządkowane pewnym zbiorom strategii

Ponieważ gra to dowolna sytuacja konfliktowa lub kooperacyjna to wyjaśnijmy te pojęcia:

Konflikt – mamy z nim do czynienia, ponieważ zazwyczaj każdy z graczy dąży do innego wyniku gry

Kooperacja – jest możliwa, gdy kilku graczy koordynuje swoje strategie, by doprowadzić do wyniku dającego każdemu z nich wyższą wypłatę

W praktyce teoria gier ma pewne ograniczenia:

1. Gry rozgrywane w rzeczywistym świecie są bardzo skomplikowane – wskazanie wszystkich graczy, opisanie ich strategii, możliwych wyników i wartości wypłat jest trudne. Możliwe jest konstruowanie prostych gier dotyczących niektórych istotnych elementów rzeczywistości.

2. Teoria gier zakłada, że gracze zachowują się racjonalnie – w realnym świecie nie zawsze ma to miejsce

3. Teoria gier nie potrafi dokładnie przewidzieć przebiegu gier, w których interesy obu graczy nie są dokładnie przeciwstawne i w których bierze udział więcej niż dwóch graczy

Gra o sumie zerowej – gra, w której interesy obu graczy są dokładnie przeciwstawne; osoba pierwsza wygrywa dokładnie tyle, ile przegrywa druga. Takie gry stanowią modele dla sytuacji czystego konfliktu dwóch stron.

Przykład: Gra: Wypłata osoby I

Dla takich gier wystarczy podać wypłaty jednego gracza. Wypłatę drugiego uzyskamy mnożąc wypłatę pierwszego przez -1. Analizując sposób, w jaki gracze powinni rozegrać taką grę, możemy ją zapisać także jako diagram przesunięć. Strzałki przeprowadzamy w następujący sposób: - w poszczególnych wierszach prowadzimy je z każdej komórki do komórki z najmniejszą wartością - w kolumnach prowadzimy je z każdej komórki do komórki z największą wartością w danej kolumnie

Gra o sumie niezerowej - gra, w której wypłaty obu graczy nie sumują się do zera.

Przykład:

Gra macierzowa – gra dwuosobowa o sumie zerowej, która jest macierzą m x n, gdzie m to liczba strategii jednej osoby, a n to liczba strategii drugiej. Celem osoby pierwszej jest taki wybór wiersza, by uzyskać wynik reprezentowany przez największą wartość, drugiej – wybór kolumny, w której wynik gry jest liczbą najmniejszą.

Definicja

Strategia S dominuje strategię T, jeżeli każdy wynik dawany przez S jest co najmniej równie korzystny co odpowiedni wynik dawany przez T, a przynajmniej jeden

wynik dawany

przez S jest

bardziej

korzystny niż

odpowiedni

wynik dawany

przez T.

Kryterium dominacji.

Racjonalny gracz nigdy nie wybiera strategii zdominowanej (mniej korzystnej).

Kryterium to pozwala czasami wyeliminować niektóre strategie, ale ma dość ograniczone zastosowanie.

Przykład:

- Dla osoby II strategia B jest bezwzględnie lepsza niż C, bo w każdej komórce B znajduje się liczba mniejsza niż w odpowiedniej komórce kolumny C.

- Mówimy, że strategia B dominuje strategię C lub strategia C jest zdominowana przez strategię B.

- Można zauważyć też, że strategie B i C są najbezpieczniejsze.

- Para strategii C osoby I i B osoby II daje wynik będący punktem równowagi. Znaczy to tyle, że strategie te są wzajemnie najlepszymi odpowiedziami na siebie. W takim przypadku wypłata dla tej pary strategii jest jednocześnie największa w swoim wierszu i najmniejsza w swojej kolumnie.

Definicja punktu siodłowego

Wynik gry macierzowej (dla macierzy zawierającej wypłaty gracza wybierającego wiersze) nazywamy punktem siodłowym, jeżeli jego wartość jest mniejsza lub równa każdej wartości w jego wierszu, a większa lub równa każdej wartości w jego kolumnie.

Kryterium punktu siodłowego.

Jeżeli gra macierzowa ma punkt siodłowy, obaj gracze powinni wybrać zawierające go strategie.

Definicja wartości gry Dla każdej gry macierzowej, dla której istnieje taka liczba v, że osoba I ma strategię gwarantującą jej wygranie co najmniej v, a osoba II ma strategię gwarantującą, że osoba I nie wygra więcej, v jest wartością gry. Jeżeli gra ma punkt siodłowy , to jego wartość jest wartością gry. Niektóre gry nie mają żadnego punktu siodłowego, inne mają ich kilka. Gdy gra ma wiele punktów siodłowych, wszystkie one są ze sobą powiązane – mają tę samą wartość i leżą na wierzchołkach jednego prostokąta.

Twierdzenie Każde dwa punkty siodłowe tej samej gry mają taką samą wartość. Jeżeli zarówno osoba I, jak i osoba II zagrają strategie zawierające punkty siodłowe, to wynik gry zawsze będzie punktem siodłowym. Metoda określania, czy gra ma punkt siodłowy i jeśli tak, pozwalająca go znaleźć: - wypisujemy najmniejsze wartości z każdego wiersza i wybieramy największą spośród nich - wypisujemy największe wartości z każdej kolumny i wybieramy najmniejszą z nich Jeśli maksimin wierszy i minimaks kolumn jest

taki sam, to leży on w punkcie siodłowym Jeżeli maksimin i minimaks mają różne wartości,

gra nie posiada punktu siodłowego

Przykład:

Zad.1

W następującej grze

wskaż wszystkie

zdominowane i

dominujące

strategie obu

graczy.

Rozwiązanie: Kolumna: - C dominuje A, bo 2≤3, 0≤2, -5≤-4 (A jest zdominowana przez C) - B dominuje D, bo -6≤-4, 1≤1, 3≤4 (D jest zdominowana przez B) Wiersz: - brak strategii zdominowanych

Kryterium dominacji wyższego rzędu – głosi ono, że gracze mogą wybierać jedynie te strategie, które przetrwają proces eliminacji polegający na tym, że w pierwszym kroku skreślamy wszystkie strategie zdominowane, uzyskując w ten sposób nową, mniejszą grę. W tej mniejszej grze niektóre strategie mogą znów być zdominowane, pomimo że nie były zdominowane w grze oryginalnej, znajdujemy je i skreślamy, otrzymując ponownie zmniejszoną grę. Powtarzamy ten proceder, dopóki w uzyskanej grze nie ma już żadnych strategii zdominowanych.

Zad.2

Które ze strategii w poniższej grze są dopuszczalne ze względu na kryterium

dominacji

wyższego

rzędu?

Rozwiązanie:

Krok 1:

- kB dominuje kA, bo 1≤1, 1≤2, 2≤2, 2≤2 (kA jest zdominowana przez kB)

- kC dominuje kB, bo 1≤1, 1≤1, 1≤2, 2≤2 (kB jest zdominowana przez kC)

Krok 2:

-wA dominuje wB, bo 1≥1, 2≥1, 2≥2 (wB jest zdominowany przez wA)

-wB dominuje wC, bo 1≥1, 1≥1, 2≥1 (wC jest zdominowany przez wB)

Krok3:

-kE dominuje nad kD, bo 2≤2, 0≤1 (kD jest zdominowana przez kE)

Strategie A i D dla Wiersza oraz strategie C i E dla Kolumny są dopuszczalne ze względu na kryterium dominacji wyższego rzędu.

Zad.3

Wyznacz w poniższych grach wszystkie punkty siodłowe, a dla gier b) i c) narysuj diagramy przesunięć.

Rozwiązanie:

a) 4 punkty siodłowe

b) 1 punkt siodłowy

c) Brak punktów siodłowych

Do tej pory mieliśmy do czynienia z grami w których minimaks wierszy i maksimin kolumn mają różne wartości i w efekcie gry te nie mają punktów siodłowych. Przykładem (*) takiej gry jest:

Żaden z uczestników tej gry nie ma strategii, którą opłacałoby mu się stale stosować – przy braku punktu siodłowego znajomość strategii przeciwnika można skutecznie wykorzystać przeciwko niemu!! W tej sytuacji jedynym sensownym rozwiązaniem jest każdorazowy wybór konkretnej strategii w drodze losowania. Taka metoda, polegająca na losowaniu jednej z kilku strategii z określonymi prawdopodobieństwami, nazywana jest strategią mieszaną, w odróżnieniu od strategii czystej, gdy gracz wybiera, bez losowania jedną konkretną strategię.

Aby zbadać, jakie skutki może mieć zastosowanie przez jednego lub obu graczy strategii mieszanych, posłużymy się pojęciem wartości oczekiwanej.

DEFINICJA

Wartością oczekiwaną dla danych wypłat a1,a2,…,an

uzyskiwanych z prawdopodobieństwami odpowiednio p1,p2,…,pn jest liczba a1p1+a2p2+…+anpn.

Wartość oczekiwana wypłaty jest średnią możliwych wypłat, ważoną ze względu na prawdopodobieństwo ich uzyskania.

KRYTERIUM WARTOŚCI OCZEKIWANEJ.

Jeżeli wiesz, że Twój przeciwnik gra określoną strategię i będzie ją stosować niezależnie od tego, jak ty grasz, powinieneś stosować strategię dającą ci największą

wartość oczekiwaną wypłaty.

Warto się zastanowić, w jaki sposób może w praktyce wyglądać stosowanie strategii mieszanej np. 3/4A i 1/4B. Oto kilka możliwości: • Można rzucać dwiema monetami i grać B tylko wtedy gdy wypadły dwa orły; • Na ślepo wybrać z talii kart jedną i grać B tylko wtedy, gdy wybraną kartą jest pik; • Wrzucić do kapelusza trzy karteczki z napisem „A” oraz jedną z napisem „B” i losować; • Sprawdzić sekundy na cyfrowym zegarku i zagrać B, jeśli ich liczba jest podzielna przez 4; • Użyć komputera do wygenerowania liczby losowej z przedziału od 0 do 1, zagrać B, jeśli liczba ta będzie większa niż 0,75.

Jak w przykładzie (*) powinien postępować Pan Wiersz?

Jeśli Pan Wiersz wybierze strategię pA, (1-p)B, która nie pozwala uzyskać Pani Kolumnie przewagi, Pan Wiersz musi wykonać rachunki:

Jeśli Kolumna zagra A px2+(1-p)x0=2p

Jeśli Kolumna zagra B px(-3)+(1-p)x3=3-6p

Rozwiązując równanie 2p=3-6p uzyskujemy p=3/8. Jeżeli Pan Wiersz zagra strategię mieszaną 3/8A, 5/8B, gwarantuje sobie oczekiwaną wartość wygranej wynoszącą co najmniej ¾ niezależne od tego jaką strategię zagra Pani Kolumna.(3/8x2+ 3/8x0 =3/8x(-3)+

5/8x3).

Analizując nasze zadnie do końca otrzymujemy podobną sytuację, jak w przypadku gier mających punkt siodłowy. Pan Wiersz ma (mieszaną) strategię gwarantującą mu (oczekiwaną) wypłatę wynoszącą co najmniej ¾. Pani Kolumna ma (mieszaną) strategię gwarantującą jej, że (oczekiwana) wypłata Wiersza wyniesie co najwyżej ¾. Analogicznie jak w przypadku punktu siodłowego, w teorii gier przyjmuje się, że:

• Wartość tej gry wynosi ¾;

• Optymalną strategią Pani Kolumny jest ¾ A i ¼ B;

• Optymalną strategią Pana Wiersza jest 3/8 A i 5/8 B.

Wartość gry oraz obie

optymalne strategie

stanowią łącznie

rozwiązanie gry.

W książce [Williams, 1986] można znaleźć prostą metodę wyznaczania rozwiązania w strategiach mieszanych gier 2x2 nie mających punktu siodłowego. Aby określić w jakich proporcjach Pan Wiersz ma grać strategie A i B należy dla każdego wiersza określić wartość bezwzględną z różnicy pomiędzy poszczególnymi wypłatami, a następnie zamienić je miejscami. Podobnie u Pani Kolumny. Należy jednak pamiętać aby przed użyciem tej metody upewnić się, że gra nie ma punktu siodłowego, gdyż w takim przypadku metoda jest nieskuteczna!

Warto zająć się teraz grami 2xn, w których Pan Wiersz ma dwie czyste strategie, a Pani Kolumna n>2 czystych strategii oraz grami mx2 (Pan Wiersz ma m strategii, zaś Kolumna 2 czyste strategie). Jeśli gra taka nie ma punktu siodłowego to jej rozwiązaniem zawsze jest rozwiązanie w strategiach mieszanych jednej z jej podgier 2 x 2. Istnieje graficzna metoda znajdowania podgry 2x2 pozwalająca wyznaczyć rozwiązanie gry 2xn lub mx2, dająca przy okazji geometryczną ilustrację pojęcia rozwiązania gry. Rozważmy grę =>

Wykres przedstawiony po prawo powstał w ten sposób, że kolejno dla każdej strategii Wiersza na lewej osi zaznaczyliśmy wypłatę Wiersza, gdy Kolumna gra A, na prawej osi wypłatę Wiersza, gdy Kolumna gra B, a następnie narysowaliśmy odcinek łączący oba te punkty. Zauważmy, że wartość drugiej współrzędnej (wysokość) punktu należącego do tego odcinka, leżącego nad punktem p odpowiada oczekiwanej wypłacie Wiersza, gdy kolumna gra strategię (1-p)A, p B.

Jeśli Pan Wiersz wie lub domyśla się, jaką strategię mieszaną zagra Pani Kolumna, to może wybrać strategię będącą najlepszą odpowiedzią na strategię Kolumny – w takim wypadku wynik gry będzie odpowiadał któremuś z punktów na górnej łamanej (rys. zaznaczony czerwoną kreską). Pani Kolumna wybierze takie p aby wypłata Wiersza była najmniejsza, czyli taką strategię, aby wynik wypadł w najniższym punkcie górnej łamanej. Ponieważ punkt ten leży na przecięciu linii odpowiadających strategiom A i B Wiersza, rozwiązaniem całej gry będzie rozwiązanie podgry.

Pan Wiersz powinien zagrać strategie 2/7 A, 5/7 B, zaś C nie powinien grać w ogóle! Możemy sprawdzić, że jest to rozwiązanie wykonując obliczenia w tabeli obok => Wszystkie wyniki w lewej kolumnie są mniejsze lub równe 4/7, a w prawej większe lub równe 4/7 -Kolumna wie, że Wiersz przy takiej strategii wygra (średnio) nie więcej niż 4/7, zaś Wiersz może sobie zapewnić (oczekiwaną) wygraną nie mniejszą niż 4/7, będące wartością gry.

Oczekiwany wynik gry

w zależności od

decyzji Wiersza gdy

Kolumna gra (𝟓

𝟕 )A,

( 𝟐

𝟕)B

Oczekiwany wynik gry w

zależności od decyzji

Kolumny, gdy Wiersz gra

(𝟐

𝟕)A, (

𝟓

𝟕 )B, (0)C

Gdy Wiersz gra A:

𝟓

𝟕∗ 𝟐 +

𝟐

𝟕∗ −𝟑 =

𝟒

𝟕

Gdy Kolumna gra A:

𝟐

𝟕∗ 𝟐 +

𝟓

𝟕∗ 𝟎 + 𝟎 ∗ (−𝟓) =

𝟒

𝟕

Gdy Wiersz gra B

𝟓

𝟕∗ 𝟎 +

𝟐

𝟕∗ 𝟐 =

𝟒

𝟕

Gdy Kolumna gra B

𝟐

𝟕∗ (−𝟑) +

𝟓

𝟕∗ 𝟐 + 𝟎 ∗ 𝟏𝟎 =

𝟒

𝟕

Gdy Wiersz gra C

𝟓

𝟕∗ −𝟓 +

𝟐

𝟕∗ 𝟏𝟎

= −𝟓

𝟕

Wracając do diagramu: najniższy

punkt górnej łamanej znajduje

się nad p=2/7, na wysokości

oznaczonej jako 4/7 (wartość

gry). Punkt należący do strategii

C Wiersza, znajdujący się nad

x=2/7 leży niżej i odpowiada

wypłacie -5/7 i dlatego Wiersz

nigdy nie zagra C.

Do rozwiązywania takich gier stosuje się analogiczną metodę graficzną z jedną istotną zmianą. Przykład:

Wtedy Pani Kolumna tak wybiera strategię, aby wynik gry leżał na dolnej łamanej, natomiast Pan Wiersz gra tak aby osiągnąć najwyższy punkt!

Gra 2xN

Dla Pani Kolumny oznacza to,

że powinna grać strategię

mieszaną A i C.

Optymalne strategie mieszane

obu graczy

przedstawiają się

następująco:

Kolumna (2/7;0;5/7;0;0)

Wiersz (4/7;3/7)

Sprawdzając

wyniki

mamy:

Kolumna

(2/7;0;5/7;0;0)

Wiersz

(4/7;3/7)

Oczekiwany wynik gry w zależności

od decyzji Wiersza gdy Kolumna

gra swoją strategię optymalną

Oczekiwany wynik gry w

zależności od decyzji

Kolumny, gdy Wiersz gra

swoją strategię optymalną

Gdy Wiersz gra A:

𝟐

𝟕∗ (−𝟐) +

𝟓

𝟕∗ 𝟏 =

𝟏

𝟕

Gdy Kolumna gra A:

𝟒

𝟕∗ (−𝟐) +

𝟑

𝟕∗ 𝟑 =

𝟏

𝟕

Gdy Wiersz gra B

𝟐

𝟕∗ 𝟑 +

𝟓

𝟕∗ (−𝟏) =

𝟏

𝟕

Gdy Kolumna gra B

𝟒

𝟕∗ 𝟓 +

𝟑

𝟕∗ (−𝟑) =

𝟏𝟏

𝟕

Gdy Kolumna gra C

𝟒

𝟕∗ 𝟏 +

𝟑

𝟕∗ (−𝟏) =

𝟏

𝟕

Gdy Kolumna gra D

𝟒

𝟕∗ 𝟎 +

𝟑

𝟕∗ 𝟑 =

𝟗

𝟕

Gdy Kolumna gra E

𝟒

𝟕∗ −𝟒 +

𝟑

𝟕∗ 𝟖 =

𝟖

𝟕

Wartość gry wynosi 1/7! Aby sprawdzić czy poprawnie wskazaliśmy wartość gry należy skontrolować czy wszystkie wartości oczekiwane wyniku, gdy Kolumna gra przeciwko optymalnej strategii Wiersza są nie mniejsze niż 1/7 :

Jeśli chociaż jedna z nich byłaby mniejsza niż 1/7, to rozwiązując grę musieliśmy się pomylić!

Co z grami w których obaj gracze mogą wybierać spośród więcej niż

dwóch strategii?

Na szczęście (!)

mamy twierdzenie Johna von Neumanna mówiące, że każda gra macierzowa ma rozwiązanie:

Każda gra macierzowa m x n ma rozwiązanie, tzn. istnieje dokładnie jedna liczba v nazwana „wartością gry”, oraz optymalne strategie (czyste lub mieszane) obu graczy takie, że

1) Jeżeli Wiersz gra swoją optymalną strategię, to jego oczekiwana wypłata będzie większa lub równa v, niezależnie od tego, jaką strategię będzie grała Kolumna:

2) Jeżeli Kolumna gra swoją optymalną strategię, to oczekiwana wypłata Wiersza będzie mniejsza lub równa v, niezależnie od tego jaką strategię będzie grał Wiersz.

Ponadto, rozwiązanie gry macierzowej m x n zawsze jest rozwiązaniem jakiejś jej podgry k x k. Innymi słowy, rozwiązaniem gry m x n albo jest rozwiązanie podgry 1x1 (wówczas gra ma punkt siodłowy), bądź też podgry 2x2, 3x3 lub większej. Czyste strategie, które wchodzą do rozwiązania gry, nazywamy strategiami aktywnymi; gracze wybierają z odpowiednimi prawdopodobieństwami – strategie aktywne; pozostałe w ogóle nie są grane.

Należy pamiętać, że metoda wyrównywania wartości oczekiwanych zawiedzie, jeśli rozwiązaniem gry 3x3 jest rozwiązanie podgry 2x2 lub 1x1. Zanim zastosujemy tę metodę, trzeba sprawdzić czy gra nie ma punktu siodłowego lub strategii zdominowanych; a jeżeli metoda ta zawiedzie, należy szukać rozwiązania wśród rozwiązań podgier 2x2( najłatwiej stosując graficzną metodę rozwiązywania dla trzech podgier 3x2). Na tej zasadzie można teoretycznie rozwiązać każdą grę macierzową, jednak jest to w praktyce strasznie mozolne!

Najefektywniejszą metodą rozwiązywania dużych gier jest jednak

technika programowania liniowego. Większość pakietów komputerowych które zawierają programowanie liniowe, oferuje

opcję rozwiązywania gier macierzowych.

Zad 1

a) Co dzieje się, gdy próbujemy wyznaczyć strategię Kolumny wyrównującą wartości oczekiwane wypłat Wiersza dla gry 2x2 mającej punkt siodłowy?

Rozważmy grę:

Powyższa gra posiada punkt siodłowy.

Nie zauważając tego możemy starać się wyznaczyć strategię Kolumny wyrównując wartości oczekiwane wypłat Wiersza.

Niech Kolumna gra pA, (1-p)B:

Jeśli Wiersz gra A: p*0+(1-p)*1=1-p

Jeśli Wiersz gra B: p*3+(1-p)*3=3

1-p=3

-p=2

p=-2 a to nie jest możliwe bo p nie należy do <0,1>

b) Co się dzieję, gdy do gry 2x2 mającej punkt siodłowy próbujemy zastosować metodę proporcji Williamsa?

Rozważmy grę:

Wówczas próbując rozwiązać metodą proporcji mamy:

Zadanie 2

Rozwiąż następujące gry:

Zadanie 3

Niektóre gry mogą mieć więcej niż jedno rozwiązanie. W każdym z nich wartość gry jest taka sama, ale gracze mogą mieć kilka różnych strategii, które gwarantują im osiągnięcie tej wartości. Rozwiąż poniższą grę metodą graficzną. Co zauważyłeś?