Upload
others
View
4
Download
0
Embed Size (px)
Citation preview
2. Igre sa sumom nula
(9.3.2017)
1
Doc. dr. sc. Tunjo Perić
2
Igre dva igrača sa sumom nula
Osnovne karakteristike:
1. Imamo samo dva igrača, nazvani igrač redak i igrač stupac.
2. Igrač redak bira jednu od m strategija, a igrač stupac bira jednu od
n strategija.
3. Ako igrač redak bira njegovu i-tu strategiju a igrač stupac bira
njegovu j-tu strategiju, onda igrač redak dobiva isplatu (nagradu)
aij a igrač stupac ostvaruje gubitak u iznosu aij.
• Igre sa sumom nula predstavljaju se u matričnoj formi:
Strategija
igrača “redak”
Strategije igrača “stupac”
Stupac 1 Stupac 2 ... Stupac n
Redak 1 a11 a12 ... a1n
Redak 2 a21 a22 ... a2n
...
...
...
...
...
Redak m am1 am2 ... amn
• John von Neumann and Oskar Morgenstern su razvili teoriju
igranja igre sa sumom nula.
Osnovne pretpostavke:
• Svaki igrač bira strategiju koja mu osigurava da učini najbolje što
može, pri čemu oba igrača znaju svoje i strategije protivnika.
Dakle, igrač redak bira strategiju koja mu osigurava
maksimalnu isplatu bez obzira koju strategiju bira igrač
stupac, tj. on bira maksimum među minimumima po recima, dok
igrač stupac bira strategiju koja mu osigurava minimalni
gubitak bez obzira koju strategiju izabrao igrač redak, tj. on
bira minimum među maksimumima po stupcima.
• Ako je
tada igra ima sedlastu točku.
• Ako igra ima sedlastu točku, onda zajedničku vrijednost (isplatu)
obiju strana nazivamo vrijednost igre.3
svi stupcisvi recimax(min po recima) min (max po stupcima) (1)
• Sedlasta točka predstavlja točku ekvilibrija u kojoj niti jedan
igrač ne može profitirati od unilateralne promjene strategije.
Dakle, sedlasta točka kod igre dva igrača sa sumom nula je lokalni
minimum u jednom pravcu (gledajući duž retka) i lokalni
maksimum u drugom pravcu (gledajući niz stupac).
• Prema tome, u sedlastoj točki niti jedan igrač nema interesa
odstupiti izvan te točke.
• Na sličan način se rješavaju igre dva igrača s konstantnom
sumom c.
4
Čiste strategije
Primjer: Dva konkurentna međunarodna poduzeća žele
otvoriti predstavništvo u Republici Hrvatskoj. Predstavništvo
mogu otvoriti u jednom od četiri najveća grada: Osijek, Split,
Rijeka ili Zagreb. Ako otvore predstavništva u istom gradu,
podijelit će tržište popola. Za ostale slučajeve provedeno je
istraživanje i rezultat je prikazan u tablici:
Prvo
poduzeće
Drugo poduzeće
Osijek Rijeka Split Zagreb
Osijek 50% 20% 30% 35%
Rijeka 80% 50% 55% 45%
Split 70% 45% 50% 40%
Zagreb 65% 55% 60% 50%
5
Naveden je udio tržišta koji osvoji prvo poduzeće ako otvori predstavništvo u
gradu koji označava redak, a drugo poduzeće u gradu koji označava stupac
matrice. Na primjer, ako prvo poduzeće otvori predstavništvo u Osijeku a drugo
u Zagrebu, prvo poduzeće osvaja 35% tržišta, a drugo poduzeće preostalih 65%
tržišta. Ovim pretpostavljamo da drugo poduzeće uvijek osvaja cijeli preostali
dio tržišta, tj. da imamo igru sume 100.
To ima ekonomskog smisla ako se radi o djelatnosti koja do sada nije bila
zastupljena u Republici Hrvatskoj. Pobjednik je poduzeće koje osvoji više od
pola tržišta.
U prvom poduzeću razmišljaju da za svaku od četiri svoje strategije traže
protivnikovu strategiju koja je za njih najnepovoljnija, tj. traže minimalne
brojeve u recima isplata. Na taj način prvo poduzeće sebi osigurava
zagarantirani tržišni udjel bez obzira na strategiju koju bira drugo poduzeće. :
Prvo
poduzeće
Drugo poduzeće
Osijek Rijeka Split Zagreb
Osijek 50% 20% 30% 35%
Rijeka 80% 50% 55% 45%
Split 70% 45% 50% 40%
Zagreb 65% 55% 60% 50%6
Od četiriju brojeva obojanih plavo najveći je 50%. Prema tome, prvo
poduzeće će osvajiti barem pola tržišta ako otvori predstavništvo u
Zagrebu. Za ostale odabrane strategije njihov je garantirani dobitak manji,
iako maksimalni dobitak može biti veći.
Najpovoljnija strategija za prvo poduzeće bila bi da otvori predstavništvo u
Rijeci, a drugo poduzeće da otvori predstavništvo u Osijeku (tada osvaja
80% tržišta). Međutim, drugo poduzeće također se ponaša racionalno i neće
izabrati za sebe nepovoljnu mogućnost (Osijek).
Na analogan način razmišljaju u drugom poduzeću. Za svaku svoju
strategiju nalaze za njih najnepovoljniju mogućnost, a među njima onu koja
je najpovoljnija. Drugim riječima traže maksimume stupaca i biraju
najmanji od tih maksimuma:
Prvo
poduzeće
Drugo poduzeće
Osijek Rijeka Split Zagreb
Osijek 50% 20% 30% 35%
Rijeka 80% 50% 55% 45%
Split 70% 45% 50% 40%
Zagreb 65% 55% 60% 50%7
Zeleno obojeni broj označila su oba poduzeća. Za jedno i za
drugo poduzeće najbolje je predstavništvo otvoriti u Zagrebu,
jer tada sigurno osvajaju 50% tržišta. 50% je vrijednost igre.
Otvaranje predstavništva očito se igra samo jednom. Takve
igre nazivamo strogo određenim igrama.
Prvo
poduzeće
Drugo poduzeće
Osijek Rijeka Split Zagreb
Osijek 50% 20% 30% 35%
Rijeka 80% 50% 55% 45%
Split 80% 45% 50% 40%
Zagreb 65% 55% 60% 50%
8
Prema tome ova igra ima sedlastu točku.
Sedlasta točka je element matrice koji je ujedno minimum
retka i maksimum stupca u kojem se nalazi.
Vrijednost igre je broj upisan u sedlastu točku.
Za strogo određene igre lako je naći optimalne strategije i
vrijednost igre. Međutim, postoje igre gdje to nije moguće
učiniti.
9
Mješovite strategije
Primjer. Igra “par – nepar”
U ovoj igri igrači pokazuju šaku s nekoliko ispruženih prstiju.
Ako je broj ispruženih prstiju paran, pobjeđuje prvi igrač
(“par”), u suprotnom pobjeđuje drugi igrač, “nepar”.
Ovdje igrači imaju samo dvije različite mogućnosti:
pokazati paran broj ili pokazati neparan broj prstiju. Prema
tome, svaki igrač ima dvije strategije: 1. pokazati paran broj
prstiju, i 2. pokazati neparan broj prstiju.
Igrač koji je pobijedio dobiva određenu količinu novca od
igrača koji je izgubio, recimo jednu kunu.
Radi se o igri sa sumom nula, pošto je iznos koji osvaja
pobjednik jednak iznosu koji njegov protivnik gubi.
U nekim igrama to nije slučaj, npr. dio novca može zadržati
organizator igre (kockarnica).
10
Sa stajališta prvog igrača svi mogući ishodi igre par - nepar su:
o Pokazati paran broj, a ako protivnik također pokaže paran broj tada
dobivam jednu kunu;
o Pokazati paran broj, a ako protivnik pokaže neparan broj tada gubim
jednu kunu;
o Pokazati neparan broj, a ako protivnik pokaže paran broj tada gubim
jednu kunu;
o Pokazati neparan broj, a ako protivnik također pokaže neparan broj
tada dobivam jednu kunu.
Ova se tablica naziva tablicom isplata i njome je igra potpuno
određena.
Prvi igrač
(“par”)
Drugi igrač (“nepar”)
Paran broj Neparan broj
Paran broj 1 -1
Neparan broj -1 1
11
Važna pretpostavka u ovom primjeru je da se igra ponavlja.
Ako se par – nepar igra samo jednom, nema smisla govoriti o
optimalnom ponašanju igrača.
U slučaju kad se igra ponavlja, igrači mogu igrati dobro ili loše
i daljnja analiza ima smisla.
Pretpostavimo da prvi igrač uvijek pokazuje paran broj
prstiju. Njegov bi protivnik mogao brzo shvatiti da
pokazivanjem neparnog broja uvijek pobjeđuje, odnosno ako
samo malo češće pokazuje parne nego neparne brojeve, drugi
igrač može uvijek pokazivati neparne brojeve i pobjeđivat će
češće.
Zaključujemo da prvi igrač treba jednakom frevencijom
birati parne i neparne brojeve, a isto naravno vrijedi i za
drugog igrača.
12
Prema tome, igrači ne smiju dopustiti da protivnik uoči
pravilnost u njihovom nizu brojeva.
Najbolje za njih je parnost brojeva birati na slučajan
način, recimo bacanjem novčića i sl.
Tako dolazimo do pojma mješovite strategije. Radi se o
vjerojatnostima prema kojima igrači biraju retke, odnosno
stupce matrice isplata. Uobičajeno je za prvog igrača
vjerojatnosti zapisivati u vektor redak P, a za drugog u vektor
stupac Q. Optimalne mješovite strategije u igri par – nepar su,
dakle,
i . 1/ 2 1/ 2P 1/ 2
1/ 2Q
13
U općem slučaju zaključujemo: igračima nije u interesu da
protivnik uoči pravilnost u njihovoj igri, zato retke i stupce
matrice isplata biraju slučajno. Mješovitu strategiju čine
vjerojatnosti prema kojima igrači biraju svoje strategije. Za
prvog igrača zapisujemo ih horizontalno, a za drugog
vertikalno:
i .
Brojevi pi, qj su vjerojatnosti koje ne smiju biti negativne ni
veće od jedan.
Osim toga mora vrijediti jer
igrači u svakom ponavljanju igre biraju točno jednu čistu
strategiju.
1 2 ... mP p p p
1
2
n
q
q
1 1... ... 1,m np p q q
14
Mješovite strategije zapisuju se na opisan način da bi mogli
množiti matrice P, A i Q. Produkt jednak je
matematičkom očekivanju dobitka prvog igrača i označava se
E(P,Q). Radi se o broju koji mjeri prosječan dobitak prvog
igrača. Prvom je igraču u interesu da taj broj bude što veći, a
drugom da bude što manji. Igrači utječu na njega izborom
svojih mješovitih strategija (prvi igrač bira P, a drugi Q).
Za igru par – nepar već smo našli optimalne strategije.
Vrijednost igre je očekivani dobitak kad oba igrača igraju
optimalno, u našem slučaju
Ako je vrijednost igre jednaka nuli, igra je poštena.
P A Q
1 1 1/ 2
( , ) 1/ 2 1/ 2 0.1 1 1/ 2
E P Q
15
Ako je vrijednost igre pozitivna prvi igrač ima prednost, a ako
je negativna drugi igrač ima prednost.
Prosječni dobitak prvog igrača teži vrijednosti igre kad broj
ponavljanja igre raste.
Grafičko predstavljanje igre dva igrača sa sumom nula
Očekivana isplata igraču 1, ako igrač 2 igra strategiju paran
broj, iznosi E(p) = p + (– 1)(1 – p) = 2p – 1.
16
Prvi igrač
Strategija
Drugi igrač
Paran broj (q) Neparan broj (1 – q)
Paran broj (p) 1 –1
Neparan broj (1 – p) –1 1
• Očekivana isplata igraču 1, ako igrač 2 bira neparan broj, iznosi
E(p) = (– 1)p + (1 – p)= 1 – 2p.
• Na grafu to izgleda ovako:
17
1
1
-1
A(0, 1) E(1, 1)
D(0, -1) C(1, -1)
p
E(p) Drugi igrač bira neparan broj
Drugi igrač bira paran broj
BIgrač 1 ostvaruje maksimalni
dobitak u točki B igrajući strategiju
paran broj 50% puta, a strategiju
neparan broj 50% puta. Igrač 1
može biti siguran da će (bez obzira
koju strategiju bira Igrač 2) njegov
očekivani dobitak biti najmanje 0.
• Očekivana isplata igraču 2, ako igrač 1 igra strategiju paran broj,
iznosi E(q) = q + (– 1)(1 – q) = 2q – 1.
• Očekivana isplata igraču 2, ako igrač 1 igra strategiju neparan broj,
iznosi E(q) = – q + (1 – q) = –2q + 1.
18
q1
B
E
CD
APrvi igrač bira neparan broj
Prvi igrač bira paran broj
Igrač 2 ostvaruje minimalni
gubitak u točki B igrajući strategiju
paran broj 50% puta, a strategiju
neparan broj 50% puta. Igrač 2
može biti siguran da će (bez obzira
koju strategiju bira Igrač 1) njegov
očekivani gubitak biti najviše 0.
• Primjer. Dva konkurentska poduzeća moraju istovremeno odrediti
koliko će proizvoda proizvoditi. Ukupni profit koji uvijek zarađuju
oba poduzeća iznosi 500 $. Ako je proizvodna razina poduzeća 1
niska a poduzeća 2 također niska, onda poduzeće 1 ostvaruje profit
od 250 $; ako je razina proizvodnje poduzeća 1 niska, a poduzeća
2 visoka, onda profit poduzeća 1 iznosi 200 $. Ako je proizvodna
razina poduzeća 1 visoka, a poduzeća 2 također visoka, onda
poduzeće 1 ostvaruje profit od 300 $; ali ako razina proizvodnje
poduzeća 1 visoka, a poduzeća 2 niska, onda je profit poduzeća 1
samo 150$.
• Pronađite vrijednosti optimalnih strategija za ovu igru s
konstantnom sumom.
• Upotrijebite grafičku metodu.
19
Linearno programiranje i igre sa sumom nula
• Linearno programiranje možemo koristiti za nalaženje vrijednosti
optimalnih strategija bilo koje igre sa sumom 0.
Primjer. Kamen, papir i škare
• Dva igrača istovremeno izgovaraju jednu od tri riječi: kamen,
papir i škare. Ako oba igrača izgovore istu riječ, onda je igra
neriješena. U ostalim slučajevima jedan igrač dobiva $1 od drugog
igrača prema sljedećem: škare sijeku (pobjeđuju) papir, papir
pokriva (pobjeđuje) kamen, kamen kida (pobjeđuje) škare. Naći
vrijednost optimalnih strategija za ovu igru dvije osobe sa sumom
0. Tablica isplata izgleda ovako:
20
Igrač A
Igrač B
Kamen (y1) Papir (y2) Škare (y3) Minimum retka
Kamen (x1) 0 -1 +1 -1
Papir (x2) +1 0 -1 -1
Škare (x3) -1 +1 0 -1
Maksimum
stupca
+1 +1 +1
21
Iz tablice primjećujemo da nema dominiranih strategija i da igra nema sedlastu točku. Da bi
odredili optimalne mješovite strategije za igrača A i igrača B, definirajmo:
x1 = vjerojatnost da igrač A bira kamen,
x2 = vjerojatnost da igrač A bira papir,
x3 = vjerojatnost da igrač A bira škare,
y1 = vjerojatnost da igrač B bira kamen,
y2 = vjerojatnost da igrač B bira papir,
y3 = vjerojatnost da igrač B bira škare.
• LP za igrača A. Igrač A bira mješovitu strategiju (x1, x2, x3).
Prema osnovnoj pretpostavci, igrač B bira strategiju koja donosi
igraču A očekivanu isplatu jednaku min (x2 – x3, – x1 + x3, x1 – x2).
Pri tome igrač A treba izabrati (x1, x2, x3) tako da iznos min (x2 –
x3, – x1 + x3, x1 – x2) bude što je moguće veći.
• Da bi dobili LP formulaciju koja će dovesti do optimalne strategije
igrača A, primijetimo da za bilo koju vrijednost x1, x2 i x3, min (x2
– x3, – x1 + x3, x1 – x2) je upravo najveći broj (označimo ga s v)
koji je istovremeno manji ili jednak x2 – x3, – x1 + x3, i x1 – x2.
• x1, x2 i x3 moraju zadovoljavati x1 0, x2 0, x3 0, i x1 + x2 + x3
= 1. Dakle, optimalnu strategiju igrača A možemo naći
rješavanjem sljedećeg problema LP:22
23
max v
p.o. v x2 – x3
v –x1 + x3
v x1 – x2
x1 + x2 + x3 = 1
x1, x2, x3 0.
Optimalna strategija igrača A je x1 = , x2 = , x3 =
• LP za igrača B. Pretpostavimo da igrač B bira mješovitu strategiju
(y1, y2, y3). Za svaku strategiju igrača A potrebno je izračunati
očekivanu isplatu igraču B ako on bira (y1, y2, y3) . Po pretpostavci
igrač A zna (y1, y2, y3). Igrač A će birati strategiju koja igraču B
osigurava očekivanu isplatu od max (– y2 + y3, y1 – y3, – y1 +y2).
Stoga igrač B treba izabrati (y1, y2, y3) tako da iznos max (– y2 + y3,
y1 – y3, – y1 +y2) bude što manji.
1
3
1
3
1.
3
• Da bi dobili LP problem koji će dati najbolje strategije igrača B,
primijetimo da za bilo koji izbor (y1, y2, y3), max (– y2 + y3, y1 – y3,
– y1 +y2) će biti jednak najmanjem broju koji je istovremeno veći
ili jednak od – y2 + y3, y1 – y3 i – y1 +y2 (ovaj broj nazovimo w).
Također, da bi (y1, y2, y3) bilo mješovita strategija, mora biti
zadovoljeno y1 + y2 + y3 = 1, y1 0, y2 0 i y3 0. Dakle,
optimalnu strategiju igrača B nalazimo rješavanjem sljedećeg
problema LP:
min w
p.o. w – y2 + y3
w y1 – y3
w – y1 + y2
y1 + y2 + y3 = 1
y1, y2, y3 0.
Optimalna strategija igrača stupca je: y1 = , y2 = , y3 = .
24
1
3
1
3
1
3
25
Rješavanje problema LP primjenom Excel Solvera