2. Igre sa sumom nula (9.3.2017) - 2 Igre dva igrača sa sumom nula Osnovne karakteristike: 1. Imamo samo dva igrača, nazvani igrač redak i igrač stupac. 2. Igrač redak bira jednu

2. Igre sa sumom nula

(9.3.2017)

1

Doc. dr. sc. Tunjo Perić

2

Igre dva igrača sa sumom nula

Osnovne karakteristike:

1. Imamo samo dva igrača, nazvani igrač redak i igrač stupac.

2. Igrač redak bira jednu od m strategija, a igrač stupac bira jednu od

n strategija.

3. Ako igrač redak bira njegovu i-tu strategiju a igrač stupac bira

njegovu j-tu strategiju, onda igrač redak dobiva isplatu (nagradu)

aij a igrač stupac ostvaruje gubitak u iznosu aij.

• Igre sa sumom nula predstavljaju se u matričnoj formi:

Strategija

igrača “redak”

Strategije igrača “stupac”

Stupac 1 Stupac 2 ... Stupac n

Redak 1 a11 a12 ... a1n

Redak 2 a21 a22 ... a2n

...

...

...

...

...

Redak m am1 am2 ... amn

• John von Neumann and Oskar Morgenstern su razvili teoriju

igranja igre sa sumom nula.

Osnovne pretpostavke:

• Svaki igrač bira strategiju koja mu osigurava da učini najbolje što

može, pri čemu oba igrača znaju svoje i strategije protivnika.

Dakle, igrač redak bira strategiju koja mu osigurava

maksimalnu isplatu bez obzira koju strategiju bira igrač

stupac, tj. on bira maksimum među minimumima po recima, dok

igrač stupac bira strategiju koja mu osigurava minimalni

gubitak bez obzira koju strategiju izabrao igrač redak, tj. on

bira minimum među maksimumima po stupcima.

• Ako je

tada igra ima sedlastu točku.

• Ako igra ima sedlastu točku, onda zajedničku vrijednost (isplatu)

obiju strana nazivamo vrijednost igre.3

svi stupcisvi recimax(min po recima) min (max po stupcima) (1)

• Sedlasta točka predstavlja točku ekvilibrija u kojoj niti jedan

igrač ne može profitirati od unilateralne promjene strategije.

Dakle, sedlasta točka kod igre dva igrača sa sumom nula je lokalni

minimum u jednom pravcu (gledajući duž retka) i lokalni

maksimum u drugom pravcu (gledajući niz stupac).

• Prema tome, u sedlastoj točki niti jedan igrač nema interesa

odstupiti izvan te točke.

• Na sličan način se rješavaju igre dva igrača s konstantnom

sumom c.

4

Čiste strategije

Primjer: Dva konkurentna međunarodna poduzeća žele

otvoriti predstavništvo u Republici Hrvatskoj. Predstavništvo

mogu otvoriti u jednom od četiri najveća grada: Osijek, Split,

Rijeka ili Zagreb. Ako otvore predstavništva u istom gradu,

podijelit će tržište popola. Za ostale slučajeve provedeno je

istraživanje i rezultat je prikazan u tablici:

Prvo

poduzeće

Drugo poduzeće

Osijek Rijeka Split Zagreb

Osijek 50% 20% 30% 35%

Rijeka 80% 50% 55% 45%

Split 70% 45% 50% 40%

Zagreb 65% 55% 60% 50%

5

Naveden je udio tržišta koji osvoji prvo poduzeće ako otvori predstavništvo u

gradu koji označava redak, a drugo poduzeće u gradu koji označava stupac

matrice. Na primjer, ako prvo poduzeće otvori predstavništvo u Osijeku a drugo

u Zagrebu, prvo poduzeće osvaja 35% tržišta, a drugo poduzeće preostalih 65%

tržišta. Ovim pretpostavljamo da drugo poduzeće uvijek osvaja cijeli preostali

dio tržišta, tj. da imamo igru sume 100.

To ima ekonomskog smisla ako se radi o djelatnosti koja do sada nije bila

zastupljena u Republici Hrvatskoj. Pobjednik je poduzeće koje osvoji više od

pola tržišta.

U prvom poduzeću razmišljaju da za svaku od četiri svoje strategije traže

protivnikovu strategiju koja je za njih najnepovoljnija, tj. traže minimalne

brojeve u recima isplata. Na taj način prvo poduzeće sebi osigurava

zagarantirani tržišni udjel bez obzira na strategiju koju bira drugo poduzeće. :

Prvo

poduzeće

Drugo poduzeće


Osijek 50% 20% 30% 35%

Rijeka 80% 50% 55% 45%

Split 70% 45% 50% 40%

Zagreb 65% 55% 60% 50%6

Od četiriju brojeva obojanih plavo najveći je 50%. Prema tome, prvo

poduzeće će osvajiti barem pola tržišta ako otvori predstavništvo u

Zagrebu. Za ostale odabrane strategije njihov je garantirani dobitak manji,

iako maksimalni dobitak može biti veći.

Najpovoljnija strategija za prvo poduzeće bila bi da otvori predstavništvo u

Rijeci, a drugo poduzeće da otvori predstavništvo u Osijeku (tada osvaja

80% tržišta). Međutim, drugo poduzeće također se ponaša racionalno i neće

izabrati za sebe nepovoljnu mogućnost (Osijek).

Na analogan način razmišljaju u drugom poduzeću. Za svaku svoju

strategiju nalaze za njih najnepovoljniju mogućnost, a među njima onu koja

je najpovoljnija. Drugim riječima traže maksimume stupaca i biraju

najmanji od tih maksimuma:

Prvo

poduzeće

Drugo poduzeće


Osijek 50% 20% 30% 35%

Rijeka 80% 50% 55% 45%

Split 70% 45% 50% 40%

Zagreb 65% 55% 60% 50%7

Zeleno obojeni broj označila su oba poduzeća. Za jedno i za

drugo poduzeće najbolje je predstavništvo otvoriti u Zagrebu,

jer tada sigurno osvajaju 50% tržišta. 50% je vrijednost igre.

Otvaranje predstavništva očito se igra samo jednom. Takve

igre nazivamo strogo određenim igrama.

Prvo

poduzeće

Drugo poduzeće


Osijek 50% 20% 30% 35%

Rijeka 80% 50% 55% 45%

Split 80% 45% 50% 40%

Zagreb 65% 55% 60% 50%

8

Prema tome ova igra ima sedlastu točku.

Sedlasta točka je element matrice koji je ujedno minimum

retka i maksimum stupca u kojem se nalazi.

Vrijednost igre je broj upisan u sedlastu točku.

Za strogo određene igre lako je naći optimalne strategije i

vrijednost igre. Međutim, postoje igre gdje to nije moguće

učiniti.

9

Mješovite strategije

Primjer. Igra “par – nepar”

U ovoj igri igrači pokazuju šaku s nekoliko ispruženih prstiju.

Ako je broj ispruženih prstiju paran, pobjeđuje prvi igrač

(“par”), u suprotnom pobjeđuje drugi igrač, “nepar”.

Ovdje igrači imaju samo dvije različite mogućnosti:

pokazati paran broj ili pokazati neparan broj prstiju. Prema

tome, svaki igrač ima dvije strategije: 1. pokazati paran broj

prstiju, i 2. pokazati neparan broj prstiju.

Igrač koji je pobijedio dobiva određenu količinu novca od

igrača koji je izgubio, recimo jednu kunu.

Radi se o igri sa sumom nula, pošto je iznos koji osvaja

pobjednik jednak iznosu koji njegov protivnik gubi.

U nekim igrama to nije slučaj, npr. dio novca može zadržati

organizator igre (kockarnica).

10

Sa stajališta prvog igrača svi mogući ishodi igre par - nepar su:

o Pokazati paran broj, a ako protivnik također pokaže paran broj tada

dobivam jednu kunu;

o Pokazati paran broj, a ako protivnik pokaže neparan broj tada gubim

jednu kunu;

o Pokazati neparan broj, a ako protivnik pokaže paran broj tada gubim

jednu kunu;

o Pokazati neparan broj, a ako protivnik također pokaže neparan broj

tada dobivam jednu kunu.

Ova se tablica naziva tablicom isplata i njome je igra potpuno

određena.

Prvi igrač

(“par”)

Drugi igrač (“nepar”)

Paran broj Neparan broj

Paran broj 1 -1

Neparan broj -1 1

11

Važna pretpostavka u ovom primjeru je da se igra ponavlja.

Ako se par – nepar igra samo jednom, nema smisla govoriti o

optimalnom ponašanju igrača.

U slučaju kad se igra ponavlja, igrači mogu igrati dobro ili loše

i daljnja analiza ima smisla.

Pretpostavimo da prvi igrač uvijek pokazuje paran broj

prstiju. Njegov bi protivnik mogao brzo shvatiti da

pokazivanjem neparnog broja uvijek pobjeđuje, odnosno ako

samo malo češće pokazuje parne nego neparne brojeve, drugi

igrač može uvijek pokazivati neparne brojeve i pobjeđivat će

češće.

Zaključujemo da prvi igrač treba jednakom frevencijom

birati parne i neparne brojeve, a isto naravno vrijedi i za

drugog igrača.

12

Prema tome, igrači ne smiju dopustiti da protivnik uoči

pravilnost u njihovom nizu brojeva.

Najbolje za njih je parnost brojeva birati na slučajan

način, recimo bacanjem novčića i sl.

Tako dolazimo do pojma mješovite strategije. Radi se o

vjerojatnostima prema kojima igrači biraju retke, odnosno

stupce matrice isplata. Uobičajeno je za prvog igrača

vjerojatnosti zapisivati u vektor redak P, a za drugog u vektor

stupac Q. Optimalne mješovite strategije u igri par – nepar su,

dakle,

i . 1/ 2 1/ 2P 1/ 2

1/ 2Q

13

U općem slučaju zaključujemo: igračima nije u interesu da

protivnik uoči pravilnost u njihovoj igri, zato retke i stupce

matrice isplata biraju slučajno. Mješovitu strategiju čine

vjerojatnosti prema kojima igrači biraju svoje strategije. Za

prvog igrača zapisujemo ih horizontalno, a za drugog

vertikalno:

i .

Brojevi pi, qj su vjerojatnosti koje ne smiju biti negativne ni

veće od jedan.

Osim toga mora vrijediti jer

igrači u svakom ponavljanju igre biraju točno jednu čistu

strategiju.

1 2 ... mP p p p

1

2

n

q

qQ

q

1 1... ... 1,m np p q q

14

Mješovite strategije zapisuju se na opisan način da bi mogli

množiti matrice P, A i Q. Produkt jednak je

matematičkom očekivanju dobitka prvog igrača i označava se

E(P,Q). Radi se o broju koji mjeri prosječan dobitak prvog

igrača. Prvom je igraču u interesu da taj broj bude što veći, a

drugom da bude što manji. Igrači utječu na njega izborom

svojih mješovitih strategija (prvi igrač bira P, a drugi Q).

Za igru par – nepar već smo našli optimalne strategije.

Vrijednost igre je očekivani dobitak kad oba igrača igraju

optimalno, u našem slučaju

Ako je vrijednost igre jednaka nuli, igra je poštena.

P A Q

1 1 1/ 2

( , ) 1/ 2 1/ 2 0.1 1 1/ 2

E P Q

15

Ako je vrijednost igre pozitivna prvi igrač ima prednost, a ako

je negativna drugi igrač ima prednost.

Prosječni dobitak prvog igrača teži vrijednosti igre kad broj

ponavljanja igre raste.

Grafičko predstavljanje igre dva igrača sa sumom nula

Očekivana isplata igraču 1, ako igrač 2 igra strategiju paran

broj, iznosi E(p) = p + (– 1)(1 – p) = 2p – 1.

16

Prvi igrač

Strategija

Drugi igrač

Paran broj (q) Neparan broj (1 – q)

Paran broj (p) 1 –1

Neparan broj (1 – p) –1 1

• Očekivana isplata igraču 1, ako igrač 2 bira neparan broj, iznosi

E(p) = (– 1)p + (1 – p)= 1 – 2p.

• Na grafu to izgleda ovako:

17

1

1

-1

A(0, 1) E(1, 1)

D(0, -1) C(1, -1)

p

E(p) Drugi igrač bira neparan broj

Drugi igrač bira paran broj

BIgrač 1 ostvaruje maksimalni

dobitak u točki B igrajući strategiju

paran broj 50% puta, a strategiju

neparan broj 50% puta. Igrač 1

može biti siguran da će (bez obzira

koju strategiju bira Igrač 2) njegov

očekivani dobitak biti najmanje 0.

• Očekivana isplata igraču 2, ako igrač 1 igra strategiju paran broj,

iznosi E(q) = q + (– 1)(1 – q) = 2q – 1.

• Očekivana isplata igraču 2, ako igrač 1 igra strategiju neparan broj,

iznosi E(q) = – q + (1 – q) = –2q + 1.

18

q1

B

E

CD

APrvi igrač bira neparan broj

Prvi igrač bira paran broj

Igrač 2 ostvaruje minimalni

gubitak u točki B igrajući strategiju

paran broj 50% puta, a strategiju

neparan broj 50% puta. Igrač 2

može biti siguran da će (bez obzira

koju strategiju bira Igrač 1) njegov

očekivani gubitak biti najviše 0.

• Primjer. Dva konkurentska poduzeća moraju istovremeno odrediti

koliko će proizvoda proizvoditi. Ukupni profit koji uvijek zarađuju

oba poduzeća iznosi 500 $. Ako je proizvodna razina poduzeća 1

niska a poduzeća 2 također niska, onda poduzeće 1 ostvaruje profit

od 250 $; ako je razina proizvodnje poduzeća 1 niska, a poduzeća

2 visoka, onda profit poduzeća 1 iznosi 200 $. Ako je proizvodna

razina poduzeća 1 visoka, a poduzeća 2 također visoka, onda

poduzeće 1 ostvaruje profit od 300 $; ali ako razina proizvodnje

poduzeća 1 visoka, a poduzeća 2 niska, onda je profit poduzeća 1

samo 150$.

• Pronađite vrijednosti optimalnih strategija za ovu igru s

konstantnom sumom.

• Upotrijebite grafičku metodu.

19

Linearno programiranje i igre sa sumom nula

• Linearno programiranje možemo koristiti za nalaženje vrijednosti

optimalnih strategija bilo koje igre sa sumom 0.

Primjer. Kamen, papir i škare

• Dva igrača istovremeno izgovaraju jednu od tri riječi: kamen,

papir i škare. Ako oba igrača izgovore istu riječ, onda je igra

neriješena. U ostalim slučajevima jedan igrač dobiva $1 od drugog

igrača prema sljedećem: škare sijeku (pobjeđuju) papir, papir

pokriva (pobjeđuje) kamen, kamen kida (pobjeđuje) škare. Naći

vrijednost optimalnih strategija za ovu igru dvije osobe sa sumom

0. Tablica isplata izgleda ovako:

20

Igrač A

Igrač B

Kamen (y1) Papir (y2) Škare (y3) Minimum retka

Kamen (x1) 0 -1 +1 -1

Papir (x2) +1 0 -1 -1

Škare (x3) -1 +1 0 -1

Maksimum

stupca

+1 +1 +1

21

Iz tablice primjećujemo da nema dominiranih strategija i da igra nema sedlastu točku. Da bi

odredili optimalne mješovite strategije za igrača A i igrača B, definirajmo:

x1 = vjerojatnost da igrač A bira kamen,

x2 = vjerojatnost da igrač A bira papir,

x3 = vjerojatnost da igrač A bira škare,

y1 = vjerojatnost da igrač B bira kamen,

y2 = vjerojatnost da igrač B bira papir,

y3 = vjerojatnost da igrač B bira škare.

• LP za igrača A. Igrač A bira mješovitu strategiju (x1, x2, x3).

Prema osnovnoj pretpostavci, igrač B bira strategiju koja donosi

igraču A očekivanu isplatu jednaku min (x2 – x3, – x1 + x3, x1 – x2).

Pri tome igrač A treba izabrati (x1, x2, x3) tako da iznos min (x2 –

x3, – x1 + x3, x1 – x2) bude što je moguće veći.

• Da bi dobili LP formulaciju koja će dovesti do optimalne strategije

igrača A, primijetimo da za bilo koju vrijednost x1, x2 i x3, min (x2

– x3, – x1 + x3, x1 – x2) je upravo najveći broj (označimo ga s v)

koji je istovremeno manji ili jednak x2 – x3, – x1 + x3, i x1 – x2.

• x1, x2 i x3 moraju zadovoljavati x1 0, x2 0, x3 0, i x1 + x2 + x3

= 1. Dakle, optimalnu strategiju igrača A možemo naći

rješavanjem sljedećeg problema LP:22

23

max v

p.o. v x2 – x3

v –x1 + x3

v x1 – x2

x1 + x2 + x3 = 1

x1, x2, x3 0.

Optimalna strategija igrača A je x1 = , x2 = , x3 =

• LP za igrača B. Pretpostavimo da igrač B bira mješovitu strategiju

(y1, y2, y3). Za svaku strategiju igrača A potrebno je izračunati

očekivanu isplatu igraču B ako on bira (y1, y2, y3) . Po pretpostavci

igrač A zna (y1, y2, y3). Igrač A će birati strategiju koja igraču B

osigurava očekivanu isplatu od max (– y2 + y3, y1 – y3, – y1 +y2).

Stoga igrač B treba izabrati (y1, y2, y3) tako da iznos max (– y2 + y3,

y1 – y3, – y1 +y2) bude što manji.

1

3

1

3

1.

3

• Da bi dobili LP problem koji će dati najbolje strategije igrača B,

primijetimo da za bilo koji izbor (y1, y2, y3), max (– y2 + y3, y1 – y3,

– y1 +y2) će biti jednak najmanjem broju koji je istovremeno veći

ili jednak od – y2 + y3, y1 – y3 i – y1 +y2 (ovaj broj nazovimo w).

Također, da bi (y1, y2, y3) bilo mješovita strategija, mora biti

zadovoljeno y1 + y2 + y3 = 1, y1 0, y2 0 i y3 0. Dakle,

optimalnu strategiju igrača B nalazimo rješavanjem sljedećeg

problema LP:

min w

p.o. w – y2 + y3

w y1 – y3

w – y1 + y2

y1 + y2 + y3 = 1

y1, y2, y3 0.

Optimalna strategija igrača stupca je: y1 = , y2 = , y3 = .

24

1

3

1

3

1

3

25

Rješavanje problema LP primjenom Excel Solvera

Documents

2. Igre sa sumom nula (9.3.2017) - 2 Igre dva igrača sa sumom nula Osnovne karakteristike: 1. Imamo samo dva igrača, nazvani igrač redak i igrač stupac. 2. Igrač redak bira jednu