Upload
hoangkiet
View
252
Download
0
Embed Size (px)
Citation preview
TEORIA GIER I PRAKTYKA NEGOCJACJI:
SYMULACJE W OPARCIU O GRĘ
PLANSZOWĄ „DYPLOMACJA”
Teoria gier statycznych Strategie zdominowane
Iterowane wykreślanie
Gry o sumie zerowej vs niezerowej, dylemat
więźnia, chicken
Równowaga Nasha
Gry z niepełną informacją
[bonus: Schemat arbitrażowy Nasha]
Elementy teorii gier kooperacyjnych
Teoria gier dynamicznych Przetarg ultymatywny, przetarg
naprzemiennych ofert
Zaufanie, oszustwo, reputacja
[bonus: gry dynamiczne z niepełną
informacją]
Stosunki międzynarodowe: teoria
neorealistyczna
Negocjacje BATNA
Stosunek do ryzyka
Cierpliwość
Style negocjacji
Określanie i powiększanie obszaru
zainteresowań stron
Reputacja/zaufanie
Emocje, zdrada, reputacja.
Etyka w negocjacjach.
JAK ZALICZYĆ ZAJĘCIA? Udział w grze dyplomacja „online”
(30 punktów).
o Do 20 punktów zdobyć można za samą
aktywność. 5 punktów kary za każdy
przegapiony lub nonsensowny ruch.
o Do 10 punktów będzie można zdobyć w
zależności od wyników. Zwycięzca każdej
partii dostanie 10/k punktów, gdzie k
będzie liczbą gier, które uda się danemu
studentowi ukończyć w ciągu semestru,
a pozostali dostaną punkty w proporcji
do liczby baz posiadanych na koniec
partii (w szczególności gracze
wyeliminowani wcześniej – zero).
Egzamin końcowy (40 punktów)
Prace domowe/kartkówki/aktywność na
zajęciach (30 punktów)
PIERWSZA WOJNA ŚWIATOWA
https://www.youtube.com/watch?v=-3UjJ5kxiLI
https://www.youtube.com/watch?v=cQfdnMC7
VAc
(i następne części)
Wykaz używanych skrótów i oznaczeń
„dyplomacyjnych”
Reguły gry:
https://www.wizards.com/avalonhill/rules/diplo
macy.pdf
A – armia
F – flota
AT, DE, FR, GB, IT, RU, TR – skróty krajów
Używamy trzyliterowych, pisanych małą literą
skrótów nazw, np. ber=Berlin
mun>ber – ruch z Monachium do Berlina
H – holds (jednostka zostaje w miejscu)
S – supports (jednostka wspiera w obronie lub
ataku), np. bur S (par>gas)
GRY W POSTACI NORMALNEJ
DEFINICJA
Gra G = (N, S1, . . . , Sn, u1, . . . , un)
N = {1, 2, . . . , n} – zbiór graczy,
S1, S2, . . . , Sn – zbiory strategii; Si – zbiór
strategii gracza i,
u1, u2, . . . , un – funkcje wypłaty; ui : S → R to
funkcja wypłaty gracza i.
Założenia:
racjonalność
wspólna wiedza graczy o grze: gracz i1 wie,
że gracz i2 wie, że ... gracz ik zna wszystkie
zbiory strategii i funkcję wypłat
analogiczne wspólna wiedza graczy o ich
racjonalności
każdy z graczy dokonuje jednokrotnego
wyboru swojej strategii, nie wiedząc jak
wybierają inni.
Podziękowanie: część materiałów oparta jest o slajdy dr.
Marcina Malawskiego, wykorzystane za jego zgodą.
STRATEGIE I WYPŁATY W DYPLOMACJI (UWAGA: do odwołania ignorujemy negocjacje)
N = (Austria, …, Turcja)
ui(s1, s2, . . . , sn) = 1 gdy i wygrał i 0 w przeciwnym
przypadku.
Pojedyncza strategia danego gracza si to przepis co
ma robić dla każdej możliwej dotychczasowej historii
gry. Nawet jeśli ograniczono liczbę lat gry (i np.
wygrywają wszyscy, który do tego czasu nie zostali
wyeliminowani), zbiór Si jest gargantuiczny. Np.
przyjmując dla uproszczenia, że wiosną 1914 każda
jednostka ma cztery możliwe ruchy, mamy 422 ≈
1,8∙1013 historii pierwszego ruchu. Przyjmując, że
jesienią 1914 znów cztery możliwe ruchy, mamy
około 41,8∙1013 możliwych planów działania jesienią
dla pojedynczej jednostki. Zatem typowy gracz
(dysponujący trzema jednostkami) ma około
43(41,8∙1013)3 strategii już w (mało interesującej)
grze ograniczonej do jednego roku (o ile zapomnimy
o ucieczkach i uzupełnieniach). Ta liczba w
rozwinięciu dziesiętnym nie zmieści nam się na
slajdach.
STRATEGIE I AKCJE
Ogromna liczba strategii jest dość typowa dla
gier dynamicznych (podobnie w szachach).
Dużo łatwiej rozważać zbiór AKCJI gracza i po
danej historii H, oznaczany Ai(H). W grach
statycznych (jednoczesnych), takich jak np.
jednokrotna gra papier-nożyce-kamień, zbiór
akcji i zbiór strategii są tożsame, bo jedyna
możliwa historia jest pusta.
Możliwe akcje Francuzów (jeśli nie mają więcej
jednostek niż widać. Uwaga: zawsze
przyjmujemy, że jednostki poza widoczną mapą
nie mają wpływu):
(par>bre, bur>bel)
(par>bre, bur>gas)
…
(par>bre, bur S (par>gas)) [nie wszystkie akcje
mają jakikolwiek sens]
…
ANALIZA POJEDYNCZEGO RUCHU
Na razie skupimy się na zbiorach akcji.
Będziemy traktować pojedynczy ruch tak, jakby
był całą grą. Jeśli tak naprawdę gra się po nim
nie kończy, to skąd mamy wiedzieć jakie są
wypłaty? Powinniśmy używać
prawdopodobieństw końcowego sukcesu, ale
nawet tego nie znamy nawet w przybliżeniu (z
wyjątkiem niektórych przypadków, gdy jest ono
bliskie 0). Naturalną uproszczoną funkcją
wypłat jest ta przypisująca dla każdej
kombinacji akcji graczy ich zmiany w
posiadanej liczbie baz. A więc uNiemcy = −2 gdy
Niemcy po tym ruchu stracą dwie bazy itp.
UWAGA 1: To ma jakiś sens raczej w
zastosowaniu do ruchu jesiennego.
UWAGA 2: W praktyce nie zawsze im więcej
baz w krótkim okresie tym lepiej. A na pewno
użyteczność nie rośnie liniowo.
UWAGA 3: Tak naprawdę zdecydowanie nie
jest wszystko jedno, które bazy mamy i gdzie
stoją nasze jednostki
PRZYKŁAD
Austria\Rosja gal>bud gal>vie gal coś
innego [co
nie daje
szans
zdobycia
bazy]
bud>vie −1;1 0;0 0;0
bud>gal lub
bud holds lub
bud sup. sth.
0;0 −1;1 0;0
bud>gdzieś
indziej [gdzie
nie ma szans
zdobycia
bazy]
−1;1 −1;1 0;0
UWAGA 1: zakładamy, że działania innych
jednostek nie mają wpływu na tę interakcję. W
szczególności jeśli AT i RU mają inne jednostki,
to wiersze i kolumny powyższej macierzy nie
odpowiadają dostępnym graczom akcjom (ale
takie rozbicie na osobne gry bez wzajemnego
wpływu jest b. wygodne)
UWAGA 2: jak widać, czasem warto
kolapsować różne możliwe akcje, które (dla
ustalonej akcji przeciwnika) dają te same efekty
Uwaga: nie należy zbyt pochopnie definiować
strategii i wrzucać zbyt wiele do kategorii „inne,
które można pominąć”
Przyjmijmy, że RU i IT są w sojuszu i można
ich traktować jako jednego gracza. Czy AT
może obronić wszystkie swoje bazy? Ponieważ
ma tylko dwie armie, nie może skierować armii
do wszystkich baz. Na oko wystarczy rozważać
następujące strategie (pozostałe nie będą
lepsze):
AT\RU+IT ven>tri,
gal>vie
ven>tri,
gal>bud
bud H, vie>tri −1;1 0;0
vie H, bud>tri 0;0 −1;1
vie H, bud H −1;1 −1;1
Ostatnia strategia AT nigdy nie da lepszego
efektu niż pierwsza, a czasem da gorszy.
Pierwsza i druga są równie dobre: AT ocali bazę
jeśli zgadnie co zrobią RU+IT (albo inaczej
mówiąc RU+IT bazę zdobędą jeśli zgadną co
zrobi AT). A może AT może zrobić jeszcze coś
innego?
Armie AT wzajemnie się blokują, więc bez
wsparcia nie można wejść do żadnej z ich baz!
Czy RU+IT mają na to dobrą odpowiedź? Tak!
gal>vie w połączeniu z ven S (vie>tri)! (albo
analogicznie dla bud). Więc dostajemy macierz
gry:
AT\RU+IT ven>tri,
gal>vie
ven>tri,
gal>bud
gal>vie,
ven S
(vie>tri)
gal>bud,
ven S
(bud>tri)
bud H, vie>tri −1;1 0;0 −1;1 0;0
vie H, bud>tri 0;0 −1;1 0;0 −1;1
vie>tri,
bud>tri
0;0 0;0 −1;1 −1;1
vie H, bud H −1;1 −1;1 0;0 0;0
DOMINACJA
Niech S−i oznacza zbiór strategii łącznych
innych graczy poza graczem i. Powiemy, że
strategia si ∈ Si dominuje strategie si’ jeżeli dla
każdej s−i ∈ S−i zachodzi ui(si, s−i) > ui(si’, s−i).
Czyli si zawsze da lepszy efekt niż si’
Gdy zastąpimy znak „>” znakiem „≥” (lecz dla
przynajmniej jednej s−i nierówność będzie ostra)
otrzymujemy definicję słabej dominacji. Czyli
nigdy si’ nie opłaci nam się lepiej niż si, a dla
przynajmniej jednej kombinacji strategii
pozostałych opłaci się gorzej.
Nie należy używać strategii ściśle
zdominowanych. Ale użycie słabo
zdominowanych może mieć pewien sens, zob.
niżej: (G,L) daje obydwu graczom lepszy efekt
niż (D,P) i nie mają powodu od swojej strategii
odstąpić, o ile nie spodziewają się odstąpienia
przeciwnika.
L P
G 1;1 −1;1
D 1; −1 0;0
ITEROWANE USUWANIE STRATEGII
(SŁABO) ZDOMINOWANYCH IE(W)DS
Jeśli inny gracz ma strategię (słabo)
zdominowaną, to można o niej zapomnieć –
wykreślić ją z macierzy gry. Wtedy może się
okazać, że któraś z naszych strategii staje się
zdominowana itd. Takie postępowanie może
znacznie ułatwić analizę gry.
PRZYKŁAD WYKREŚLANIA SŁABO
ZDOMINOWANYCH
Austria\Rosja gal>bud gal>vie gal coś
innego [co
nie daje
szans
zdobycia
bazy]
bud>vie −1;1 0;0 0;0
bud>gal lub bud
holds lub bud sup.
sth.
0;0 −1;1 0;0
bud>gdzieś
indziej [gdzie nie
ma szans
zdobycia bazy]
−1;1 −1;1 0;0
IEWDS: PRZYKŁAD
Austriacy mogą próbować zdobyć dwie bazy:
rum i bul. Ale (con>bul, aeg>gre) słabo
dominuje każdą inną strategię TR i sev>rum
słabo dominuje każdą inną strategię RU. Więc
można zapomnieć o szansie zdobycia dwóch
baz. Po wykreśleniu stosownych „wierszy” i
„kolumn” atak na rum ze wsparciem (dający
gwarancję zdobycia jednej) słabo dominuje
każdą inną opcję AT.
DEFINICJA: Strategia si gracza i jest jego
najlepszą odpowiedzią na „łączną” strategie s−i
pozostałych graczy, (ozn. si = BRi(s−i)) jeżeli dla
każdej innej strategii si’ ∈ Si zachodzi
ui(si, s−i) ≥ ui(si’, s−i) .
Uwaga 1. Jeżeli si = BRi(s−i), to si nie może być
zdominowana (ale może słabo).
DEFINICJA:
Układ strategii (strategia łączna) s = (s1, s2, . . .
sn) jest równowagą Nasha gry
G = (N, S1, . . . , Sn, u1, . . . , un) jeżeli dla
każdego i = 1, 2, . . . n mamy si = BRi(s−i), czyli
dla każdego i i każdej si’∈Si
ui(s1,…, si−1, si, si+1, … sn) ≥ ui(s1, … , si’, … sn).
Uwaga 2. Strategie w równowadze nie mogą
zostać usunięte w procesie IEDS (ale mogą w
IEWDS)
Problemy z równowagą Nasha
1. Nie zawsze istnieje
2. Gdy istnieje, bywa nieoptymalna w sensie
Pareto
3. W tej samej grze może być ich wiele
AT\RU+IT ven>tri,
gal>vie
ven>tri,
gal>bud
gal>vie,
ven S
(vie>tri)
gal>bud,
ven S
(bud>tri)
bud H,
vie>tri −1;1* 0*;0 −1;1* 0*;0
vie H,
bud>tri 0*;0 −1;1* 0*;0 −1;1*
vie>tri,
bud>tri 0*;0 0*;0 −1;1* −1;1*
vie H, bud
H −1;1* −1;1* 0*;0 0*;0
Wypłaty odpowiadające BR danego gracza
oznaczono gwiazdką. Ponieważ nie ma dwóch
gwiazdek dla tej samej pary strategii – nie ma
równowagi Nasha.
IT\AT tri>ven tri>alb
ven>tri 0*;0* 1; −0,8
ven>pie −0,8;1 0,2;0,2
(uwaga: przyjmujemy, że jednostki gdzieś
indziej mogą coś zdziałać, ale nie od razu
zdobyć bazę. To coś ma, przyjmijmy arbitralnie,
wartość 0,2)
Wybór strategii dominujących prowadzi do
jedynej równowagi, w której wypłaty są Pareto-
zdominowane przez wypłaty osiągane dla
pewnej nie-równowagowej kombinacji strategii.
Tego typu sytuację nazywamy czasem
dylematem więźnia.
GRY O SUMIE ZEROWEJ
Gra (N, S1, . . . , Sn, u1, . . . , un) jest grą o sumie
stałej, jeśli istnieje taka stała C, że dla każdej
strategii łącznej (s1, . . . , sn) ∈ S zachodzi
Σiui(s1, . . . , sn) = C.
Częściej mówi się o grach o sumie zerowej, co
na jedno wychodzi, bo odjęcie stałej od
wszystkich wypłat danej osoby nie zmienia gry.
W dwuosobowych grach o sumie zerowej nie
ma miejsca na współpracę – zysk innego gracza
jest tożsamy z moją stratą. Są to gry ściśle
konkurencyjne. Dla innych gier – ważne
negocjacje!
Dotychczas rozważaliśmy głównie gry o sumie
zerowej. Cała gra w dyplomację, o ile jest tylko
jeden zwycięzca, jest taką grą. Lokalny konflikt
także, jeśli wszystkie bazy są już zajęte i
jedynym celem jest maksymalizacja liczby baz.
Ale na początku są i bazy neutralne.
DE\GB nth>hol nth>bel
ruh>hol 0;0 1;1
ruh>bel 1;1 0;0
gra (anty)koordynacji – w ogóle nie ma
konfliktu
GB\RU nwy H nwy>swe
nth>nwy 0;1 1;1
coś innego 0;1 0;1
Rosji jest wszystko jedno co się zdarzy, ale GB
nie – zmienna suma.
Właściwości równowag
w grach ściśle konkurencyjnych
Gdy (s1, s2) , (r1, r2) są równowagami takiej gry,
to
u1(s1, s2) ≥ u1(r1, s2) (bo s1 jest BR1(s2))
u1(r1, s2)=−u2(r1, s2) ≥ −u2(r1, r2) = u1(r1, r2) (bo
r2 jest BR2(r1))
u1(r1, r2) ≥ u1(s1, r2) (bo r1 jest BR1(r2))
u1(s1, r2)=−u2(s1, r2) ≥ −u2(s1, s2) = u1(s1, s2) (bo
s2 jest BR2(s1))
i stąd
u1(s1, s2) = u1(r1, r2) i oczywiście u2(s1, s2) =
u2(r1, r2) (wszystkie równowagi są równie
dobre),
(s1, r2) , (r1, s2) też są równowagami
(„równowagi są wymienne”),
W grach ściśle konkurencyjnych tę wielkość –
wypłatę gracza 1 w równowadze – nazwiemy
wartością gry.
STRATEGIE MIESZANE
Strategia mieszana to wybór strategii w sposób
losowy.
Gdy Si jest zbiorem strategii gracza i w grze G,
to zbiorem jego strategii mieszanych jest Si*:
zbiór wszystkich rozkładów
prawdopodobieństwa na Si.
Będziemy rozważać tylko gry ze skończoną
liczbą strategii, wówczas przez
σi,k oznaczymy prawdopodobieństwo użycia
przez gracza i jego strategii nr k.
Elementy Si będziemy nazywać strategiami
czystymi.
Strategią nieczystą będziemy nazywać tylko
wyjątkową podłość.
Nośnik strategii mieszanej to zbiór strategii
czystych wybieranych z dodatnim
prawdopodobieństwem.
Oczekiwana wypłata ze strategii mieszanej
będzie średnią z wypłat ze strategii czystych,
ważoną ich prawdopodobieństwami.
Austria\Rosja q: gal>bud (1−q): gal>vie
p: bud>vie −1;1 0;0
(1−p): bud>gal 0;0 −1;1
[p, q to prawd. zagrania danej strategii]
Wypłata RU: pq+(1−p)(1−q)
Kiedy gracz zechce grać jakąś strategię czystą z
dodatnim prawdopodobieństwem? Kiedy żadna
inna strategia czysta nie przynosi mu średnio
rzecz biorąc więcej. Załóżmy, że p=0,7.
Wówczas gal>bud przyniesie średnio 0,7, a
gal>vie średnio 0,3. Więc RU nie zechce
mieszać – jedyną BR jest gal>bud. Ale
BRAT(gal>bud)=bud>gal, a
BRRU(bud>gal)=gal>vie itd. Stąd wnioskujemy
jak szukać równowag w strategiach mieszanych.
ZNAJDOWANIE RÓWNOWAG
W STRATEGIACH MIESZANYCH
Krok pierwszy: ustalić nośniki.
Krok drugi: rozwiązać układ nierówności na σi,k
by żadna strategia czysta należąca do nośnika
nie dawała mniej niż jakaś inna strategia czysta.
W naszym przypadku
EURU(gal>bud)=p= (1−p)=EURU(gal>vie), stąd
p=0,5
I analogicznie q=0,5
Ale nie zawsze mieszać należy z równymi
prawdopodobieństwami. Np. przyjmijmy, że RU
woli pozyskać bud niż vie, bo obok ma bazę w
rum, więc zdoła bud utrzymać. Natomiast jeśli
zdobędzie vie, to ocenia, że z pr. 0,5 szybko
straci go na rzecz Niemiec.
AT\RU q: gal>bud (1−q): gal>vie
p: bud>vie −1;1 0;0
(1−p): bud>gal 0;0 −1;0,5
W wyliczeniu q nic się nie zmienia – Rosja
nadal rzuca uczciwą monetą. Ale AT już nie!
EURU(gal>bud) = p = 0,5(1−p) = EURU(gal>vie),
stąd p=1/3.
To jest nieintuicyjne – przy zmianie wypłat RU
zachowanie zmienia tylko AT.
Uwaga: Niektóre strategie (nawet jeśli nie są
zdominowane) mogą nie należeć do nośnika
równowagowej strategii mieszanej. To główna
trudność w szukaniu równowag w strategiach
mieszanych w większych grach.
TWIERDZENIE NASHA:
Każda gra skończona ma równowagę Nasha
(być może w strategiach mieszanych).
AT\RU+IT ven>tri,
gal>vie
ven>tri,
gal>bud
gal>vie,
ven S
(vie>tri)
gal>bud,
ven S
(bud>tri)
bud H, vie>tri −1;1 0;0 −1;1 0;0
vie H, bud>tri 0;0 −1;1 0;0 −1;1
vie>tri,
bud>tri
0;0 0;0 −1;1 −1;1
vie H, bud H −1;1 −1;1 0;0 0;0
Brak równowagi w strategiach czystych
Szukamy równowagi w strategiach mieszanych.
1. Wartość gry musi wynosić −0,5 (dlaczego?).
2. Właśnie tyle musi przynosić każda strategia
AT, a każda strategia RU+IT: 0,5 (dlaczego?)
3. rodzina równowag: p1=p2, p3=p4, q1= q4, q2=q3
GRY Z NIEPEŁNĄ INFORMACJĄ
Czasem nie wiemy jaka jest struktura wypłat
innych graczy (a oni wiedzą). W rozważanym
przykładzie możemy nie wiedzieć czy Włochy i
Rosja współpracują, czy wręcz przeciwnie –
nienawidzą się (albo nie chcą się zdradzić ze
swym sojuszem). W tym ostatnim przypadku
współpraca mogłaby być dla nich de facto
wykluczona.
AT uważa, że gra z pr. w w tę grę:
AT\RU+IT 1 ven>tri,
gal>vie
ven>tri,
gal>bud
gal>vie,
ven S
(vie>tri)
gal>bud,
ven S
(bud>tri)
bud H, vie>tri −1;1 0;0 −1;1 0;0
vie H, bud>tri 0;0 −1;1 0;0 −1;1
vie>tri,
bud>tri
0;0 0;0 −1;1 −1;1
vie H, bud H −1;1 −1;1 0;0 0;0
… i z prawdopodobieństwem 1− w w tę:
AT\RU+IT 2 ven>tri,
gal>vie
ven>tri,
gal>bud
gal>vie,
ven S
(vie>tri)
gal>bud,
ven S
(bud>tri)
bud H, vie>tri −1;1 0;0 −1;-5 0;-5
vie H, bud>tri 0;0 −1;1 0;-5 −1;-5
vie>tri,
bud>tri
0;0 0;0 −1;-5 −1;-5
vie H, bud H −1;1 −1;1 0;-5 0;-5
(Wartość −5 jest arbitralna. −1 albo −100 da te
same teoretyczne przewidywania.) Jak znaleźć
optymalne strategie? Ta sama logika wzajemnie
optymalnych odpowiedzi: RU+IT typu 1 oraz
RU+IT typu 2 wybierają BR na strategię
mieszaną gracza AT. AT wybiera BR na
strategię mieszaną wynikającą ze strategii obu
typów przeciwnika i ich postrzeganej częstości.
Niech qi, i=1,…4 oznaczają parametry strategii
mieszanej gracza RU+IT typu 1 i podobnie z ri
dla typu 2. qi, i=1,…4 dla gracza AT jak
wcześniej. Dla uproszczenia przyjmijmy, że vie
i bud są traktowane symetrycznie, zatem p1=p2,
q1=q2, q3=q4, r1=r2=0,5, r3=r4=0 (zdominowane)
Wypłaty ze strategii AT:
1: −w(q1+q3) − 0,5(1−w) = − 0,5
2: −w(q2+q4) − 0,5(1−w) = − 0,5
3: −w(q3+q4)= −2wq3
4: −w(q1+q2) − (1−w)= −2wq1 − (1−w)
Jeśli q3<q1, lub w<0,5, to strat. 3 dominuje
pozostałe.
Wypłaty RU+IT typu 1:
1: p1+p4
2: p2+p4= p1+p4
3: p1+p3
4: p2+p4= p1+p3
Gdy p4>p3, ten gracz wybierze tylko strategie 1 i
2, wtedy strategia 3 AT dominuje pozostałe,
więc RU+IT typu 1 wybierałby jednak tylko
strategie 3 i 4. Zatem p3≥p4.
Przypadek 1: p3>p4. Wtedy q1=q2=0, q3=q4=0,5
Wypłaty ze strategii AT:
1, 2: –0,5, 3: –w, 4: − (1−w)
To jest zgodne z p3≥p4 gdy w≤0,5.
Przypadek 1a: w<0,5: p3=1
Przypadek 1b: w=0,5: p3≥p4 (nic nowego)
Przypadek 2: p3=p4.
Przypadek 2a: p3=p4>0
Wypłaty AT ze strategii 3 i 4 równe:
−2wq3 =−2wq1−(1−w)
q3= q1+(1−w)/2w
ale i q3=0,5−q1, więc q1+(1−w)/2w=0,5−q1
q1=0,25−(1−w)/4w, co jest możliwe (tj. q1
pozostaje w dopuszczalnym przedziale [0,1]) dla
w z przedziału [1/2,1].
Wtedy wypłata AT ze strategii 4 wyniesie
−2w(0,25−(1−w)/4w)−(1−w)= −0,5w+0,5(1−w)
−(1−w)=0,5, czyli ze wszystkich tyle samo.
Przypadek 2b: p3=p4=0. To oznacza, że trzecia i
czwarta strategia nie mogą przynieść więcej niż
pierwsza lub druga.
0,5≥ −2wq3
0,5≥ −2wq1 − (1−w)
lecz dodajmy stronami:
ponieważ −2wq3 −2wq1 − (1−w)=1, musimy
mieć w dwie równości. Co znów daje ten sam
wniosek: q1=0,25−(1−w)/4w.
Podsumowując, im bardziej AT wierzy we
współpracę rosyjsko-włoską (większe w), tym
częściej oni powinni wchodzić do Triestu (a nie
wspierać podstępnie austriacki atak) gdy
faktycznie współpracują. Natomiast AT
powinien wybierać vie>tri, bud>tri jeśli uważa
tę współpracę za mało prawdopodobną i
mieszać (ale przy tym wybierać (vie H, bud H)
nie częściej niż vie>tri, bud>tri) gdy uważa za
prawdopodobną.
Uff, teraz trochę prostszy przykład gry z
niepełną informacją. Francja obiecuje coś
Niemcom. Niemcy mogą uwierzyć lub nie (i
stosownie wybrać ruchy). Macierz wypłat:
Niemcy\Francja dotrzymać zdradzić
wierzyć 1;1 −2;2−c
nie wierzyć 0;0 0; −c
c to znany tylko Francuzom francuski koszt
zdradzenia (wynikający z wewnętrznej
uczciwości albo chęci ochrony swojej reputacji).
Przyjmijmy dla uproszczenia:
𝑐 = {0 z pr. 𝑤 (𝑛𝑖𝑒𝑢𝑐𝑧𝑐𝑖𝑤𝑦)2 w p. p. (uczciwy)
Dla uczciwej FR zdrada jest ściśle
zdominowana. Oznaczmy pr. dotrzymania przez
nieuczciwego przez q. Wypłaty DE:
Wierzyć: w[q−2(1−q)]+1−w = 1−3w(1−q)
Nie wierzyć: 0
Przypadek 1: Niemcy wierzą, czyli p=1
Wówczas nieuczciwa FR zdradza, czyli q=0.
Wypłata DE: 1−3w ≥0 (bo inaczej nie chcieliby
wierzyć). Czyli to możliwe gdy w≤1/3.
Nieuczciwa FR ma wypłatę 2.
Przypadek 2: Niemcy czasem wierzą, 1>p>0.
Wówczas nieuczciwa FR zdradza, czyli q=0.
Wypłata DE: 1−3w =0 (bo inaczej nie chcieliby
mieszać). Czyli to możliwe tylko gdy w=1/3.
Nieuczciwa FR ma wypłatę 2p.
Przypadek 3: Niemcy nie wierzą, czyli p=0.
Wówczas nieuczciwej FR wszystko jedno.
1−3w(1−q)≤0, 3w(1−q)≥1, q≤1−1/(3w)
Czyli Niemcy ufają, gdy nieuczciwych mało –
nieuczciwi na tym zyskują. Od pewnego momentu
Niemcy nie ufają. Wtedy im więcej jest w przyrodzie
nieuczciwych (w duże), tym częściej nieuczciwy
udaje uczciwego (q duże).
W szczególnym przypadku DE ufają czasem.
NIEKOMPLETNA INFORMACJA: JESZCZE
JEDEN PRZYKŁAD
Czy Włosi powinni zajmować Tunis czy
próbować Grecję?
IT\TR bul>gre
[w+(1−w)q]
bul sth else
[(1−w)(1−q)]
ion>tun [p] 1;2 1;1+b
ion>gre [1−p] 0;1 1,2;0,8+b
b to znany tylko TR pożytek z sth else.
𝑏 = {0 z pr. 𝑤 0,5 w p. p.
Gdy b=0, bul sth else jest zdominowane, więc
nie będzie grane.
Wypłaty gracza IT:
ion>tun: 1
ion>gre: 1,2(1−w)(1−q)
Wypłaty gracza TR typu 2:
bul>gre: 1+p
bul sth else: 1+0,5−0,2(1−p)
Przypadek 1: p=1. Musi być 1,2(1−w)(1−q)≤1.
Ale q będzie 1, więc to spełnione na pewno
Przypadek 2: 1>p>0. Czyli 1,2(1−w)(1−q)=1.
q=1−5/[6(1−w)]. Musi zachodzić w≤1/6. Jeśli
0<q<1, to musi być
1+p=1,3−0,2p, czyli
p=3/8
jeśli q=0 (w=1/6), to może być 1+p<1,3−0,2p,
p<3/8
Przypadek 3: p=0. Musi być 1,2(1−w)(1−q)≥1.
q=0, 1,2(1−w) ≥1, czyli musi zachodzić w≤1/6.
Podsumowując: najbardziej prawdopodobne jest
ion>tun, bul>gre, które jest NE w grze z pełną
informacją (dla obu typów TR). Jednak gdy jest
wysokie pr., że TR odniesie duże korzyści z
ruchu sth else (w≤1/6), istnieją inne równowagi.
GRY Z NIEKOMPLETNĄ INFORMACJĄ:
PRZYPADEK CONTINUUM TYPÓW.
REINTERPRETACJA STRATEGII
MIESZANYCH
DE\GB nth>bel
[q] [kg/x]
nth>hol [1−q]
[(x−kg)/x]
ruh>hol [p] [(x−kd)/x] 2+d;1 0;0
ruh>bel [1−p] [kd/x] 0;0 1;2+g
Zmodyfikujmy nieco naszą grę (anty)-
koordynacji. Każdy z graczy chętniej zająłby
Holandię (np. bo graniczy z bazą w Kilonii).
Najpierw załóżmy, że g=d=0, czyli gra z
kompletną informacją. Mamy trzy równowagi
(hol,bel), (bel,hol) i mieszana (p=2/3, q=1/3). Ta
ostatnia może wynikać nie z mieszania explicite,
a z istnienia continuum typów, które wybierają
strategie czyste. Załóżmy, że d i g mają rozkład
jednostajny na [0,x]. Tylko DE zna d, tylko GB
zna g. Duża wartość d (większa od pewnej
krytycznej wartości kd, co zdarzy się z pr.
(x−kd)/x) skłania DE do gry (hol). Duża wartość
g (większa od pewnej krytycznej wartości kg, co
zdarzy się z pr. (x−kg)/x) skłania GB do gry
(hol). Pokażemy, że dla małego x równowaga
gry z niekompletną informacją zbiega do
mieszanej równowagi gry z kompletną
informacją, czyli tak (x−kd)/x jak i (x−kg)/x
zbiegają do 2/3 przy x zbiegającym do 0.
Oczekiwane wielkości wypłat DE wyniosą:
hol: kg(2+d)/x
bel: (x−kg)/x
Zatem DE powinny wybrać (hol) gdy
d≥(x−3kg)/kg. Ta wielkość to właśnie
poszukiwane kd. Podobnie wypłaty GB wyniosą:
bel: (x−kd)/x
hol: kd/(2+g)x
Stąd możemy wyznaczyć kg=(x−3kd)/kd.
Teraz mamy układ dwóch równań na kg, kd.
Widzimy, że kd = kg
Zatem kd2+3kd =x. Dla x zbiegającego do zera i
dodatniego kd, wyraz kd2 staje się
zaniedbywalnie mały, zatem kd≈x/3 i oczywiście
kg≈x/3, zatem (x−kd)/x, (x−kg)/x zbiegają do 2/3,
CBDO.
To przykład ogólnej prawidłowości (Harsanyi,
1973), pokazujący, że strategia w równowagach
mieszanych to sytuacja niepewności co do akcji
przeciwnika – wynikającej niekoniecznie z
randomizowania explicite, ale być może z
(drobnej) wątpliwości co do jego preferencji.
GRY W POSTACI EKSTENSYWNEJ
(DRZEWA GRY) Niektórzy z graczy mogą podejmować decyzje
wiedząc coś o decyzjach innych graczy. To oznacza,
że tamte są wcześniejsze – czas gra rolę.
Dopuszczamy także możliwość, że gracz podejmuje
decyzje wielokrotnie.
Nadal zakładamy wspólną wiedzę o grze (graczach,
możliwych akcjach i wypłatach), racjonalność i
wspólną wiedzę o racjonalności,
DEFINICJA:
(N, W, (W1, . . . ,Wn,W0,WK), I, (u1, … , un), P)
gdzie
N = {1, 2, . . . , n} – zbiór graczy,
W = (W,E) – drzewo gry (graf skierowany spójny
bez cykli):
W – wierzchołki (sytuacje w grze),
E – łuki (przejścia między nimi),
W1,W2, . . . ,Wn – rozbicie zbioru W na zbiory
decyzyjne graczy :
W = W1 ∪ . . . ∪ Wn ∪ W0 ∪ WK.
Wj – zbiór wierzchołków w których decyzję (o
wyborze akcji) podejmuje gracz j,
WK – zbiór wierzchołków końcowych (liści),
W0 – zbiór wierzchołków, w których następuje
posunięcie losowe
Nadto:
A – zbiór akcji – nazw łuków,
A(w) – zbiór akcji odpowiadających łukom
wychodzącym z wierzchołka w,
I – struktura informacyjna – rozbicie każdego ze
zbiorów W1, ... , Wn na
zbiory informacyjne (Wj = Ij,1 ∪ . . . ∪ Ij,kj ),
u1, u2, . . . , un – funkcje wypłaty
ui : WK → R funkcja wypłaty gracza i.
P – rodzina rozkładów prawdopodobieństwa
wyników posunięć losowych:
dla każdego w ∈ W0 mamy Pw – rozkład na A(w)
Struktura informacyjna pozwala modelować stan
(nie)wiedzy gracza: gracz nie potrafi powiedzieć w
którym z wierzchołków danego zbioru
informacyjnego się znajduje.
Dwa ruchy: wiosna, jesień
bel hol
GB GB
b h b h
… tutaj podobnie …
b h
GB GB
b h b h
0;0 1;1 1;1 0;0
Przerywana linia obejmuje wszystkie wierzchołki w
tym samym zbiorze informacyjnym – GB nie wie
czy DE wybrał bel czy hol. To kto pierwszy się rusza
jest arbitralne; ważne, że ten drugi i tak nie wie jak
ruszył się pierwszy.
DE
DE
Matka Natura
FR uczciwa [1−w] FR nieuczciwa [w]
DE DE
wierzyć nw w nie wierzyć
zdradzić d
-2;0 1,1
z. dotrz.
z. d. z. d.
0;-2 0;0 -2;2 1;1 0;0 0;0
Niemcy\Francja dotrzymać zdradzić
wierzyć 1;1 −2;2−c
nie wierzyć 0;0 0; −c
FR
W grach z niepełną informacją
możliwe są sytuacje, w których aktualnie decydujący
gracz nie zna całej dotychczasowej historii gry
= są to gry z co najmniej jednym więcej-niż-jedno-
elementowym zbiorem informacyjnym.
Ale zakładamy, że gracze znają swoje obecne opcje,
własne przeszłe ruchy i nigdy nie zapominają.
Dlaczego poniższe zbiory informacyjne są
niepoprawne?
Gracz 1
Gracz 2
Gracz 1
Gracz 2
Strategia w grze w postaci ekstensywnej –
funkcja sj: Wj → A taka że
(1) ∀w ∈ Wj sj(w) ∈ A(w) ,
(2) w,w′ ∈ Ij,k ⇒ sj(w) = sj(w′).
= kompletny plan rozegrania całej gry.
Strategie łączne – jak w postaci normalnej, s =
(s1, s2, . . . , sn).
Jeśli nie ma posunięć losowych, strategia łączna
jednoznacznie wyznacza wierzchołek końcowy,
w którym gra się skończy. Jeśli są – można
określić rozkład prawdopodobieństwa na
możliwych końcach gry i stąd wartości
oczekiwane wypłaty. Każdą grę w postaci
drzewa można zatem zapisać także w postaci
macierzy (i vice versa).
Stąd na drzewa przenoszą się pojęcia
– dominacji i słabej dominacji
– najlepszej odpowiedzi
– równowagi Nasha
Podgra gry w postaci ekstensywnej
to dowolne poddrzewo W’ = (W’,E’) drzewa W
(= dowolny wierzchołek w i cała część drzewa
W następująca po w) o ile nie przecinamy
żadnego zbioru informacyjnego gry.
Ćwiczenie: wróć do drzew gry z poprzednich
stron i zidentyfikuj wszystkie podgry.
Każda strategia (czysta lub mieszana) w grze
wyznacza strategię w dowolnej jej podgrze
(przez obcięcie).
Równowaga stabilna względem podgier
(doskonała, Subgame-Perfect Nash Equilibrium,
SPNE):
Równowaga Nasha (s1, s2,… , sn) w grze w
postaci ekstensywnej stanowi SPNE
jeśli po obcięciu do dowolnej podgry wyznacza
w tej podgrze równowagę.
DE
zaufać nie ufać
GB 0;0
dotrzymać zdradzić
1;1 -1;2
DE
samolubnie ofiarnie
GB 0;2
ukarać zazgrzytać zębami i odpuścić
−1; −1 1;0
Ćwiczenie: znajdź równowagi powyższych gier.
Które z nich są SPNE? Jak warunek stabilności
względem podgier ma się do eliminacji strategii
słabo zdominowanych?
Ćwiczenie: rozważ rodzinę gier dynamicznych z
pełną informacją, w której każdy z graczy ma
zawsze dwie możliwe akcje, A lub B, i wypłaty
zależą tylko od podjętych akcji. Podaj
przykładową funkcję wypłaty, która spowoduje,
że
a) opłaca się ruszać jako pierwszemu
b) nie opłaca się ruszać jako pierwszemu
c) kolejność ruchów nie ma znaczenia
Czy można podać ogólne warunki na f. wypłaty,
które spowodują, że gra należy do typu a), b) lub
c)?
RÓWNOWAGA SEKWENCYJNA
(SEQUENTIAL EQUILIBRIUM)
Tym razem oszczędzamy formalizmów. Oprócz
Strategii każdy z graczy w każdym zbiorze
informacyjnym formułuje Przekonania (Beliefs)
tj. rozkład prawdopodobieństwa na należących
do tego zbioru wierzchołkach. W równowadze
te przekonania muszą być „rozsądne”, w obliczu
tego jakie strategie są grane. Natomiast strategie
muszą maksymalizować oczekiwaną wartość
pod warunkiem przekonań. „Rozsądne”
przekonania w zbiorach informacyjnych, które
zostaną osiągnięte z niezerowym
prawdopodobieństwem można wyznaczyć
korzystając z Wzoru Bayesa, w pozostałych
przy pomocy bardziej skomplikowanego
rozumowania, którego nie będziemy
analizować. W każdym razie równowagi
sekwencyjne są stabilne względem podgier.
PRZYKŁAD
Natura czyni GE uczciwymi lub nie (GE znają
swój typ, pozostali znają tylko rozkład, np.
50/50). Następnie GE oszukują AT lub nie. Po
czym FR musi zdecydować czy wierzyć GE czy
nie, A GE czy dotrzymać czy nie.
Matka Natura
GE uczciwe [1−w] GE nieuczciwe [w]
GE GE
nie oszukać AT o. o. nie oszukać AT
w n w nie
wierzyć nie
GE
wierzyć nie
FR
FR powinna aktualizować swoje przekonania co
do typu GE obserwując jego akcję wobec AT.
Jeśli w równowadze uczciwe GE oszukują AT z
prawdopodobieństwem 0, a nieuczciwe z
prawdopodobieństwem p, to FR, obserwując, że
AT została oszukana wnioskuje, że GE są
nieuczciwe, a gdy AT nie została oszukana,
powinna wierzyć, że GE są uczciwe z
prawdopodobieństwem (1−w)/[(1−w)+pw].
Nieuczciwe GE mogą zyskać na udawaniu
uczciwych, przynajmniej na początku, o ile
naprawdę uczciwych jest dostatecznie dużo
(zakładamy, że FR jest skłonna uwierzyć gdy jest
dostatecznie pewna uczciwości GE oraz że GE
zyskują gdy FR im wierzy).
GRY PRZETARGU (targowania się)
Założenia: Dwóch graczy. Do podziału jest
„ciasto” o początkowej wielkości 1.
Gracz 1 zaczyna propozycją podziału: (k1, k2)
gdzie k1 + k2 = 1. Kto odrzucił w chwili t
propozycję drugiego, ten w t +1 składa własną.
Pierwsza przyjęta propozycja kończy grę.
Wynik gry: (a, b, t); t ∈ N – czas;
a, b – otrzymane części ciasta (a + b = 1).
Ciasto jest pożądane:
u1(k1, k2, t) > u1(k1− ε, k2+ε, t) oraz
u2(k1, k2, t) < u2(k1−ε, k2+ε, t)
dla dowolnych k1, k2 i t oraz ε > 0
Cias to pieniądz:
ui(k1, k2, t) > ui(k1, k2, t + 1).
Np. ui(k1, k2, t) = δt−1
ki
gdzie δ1, δ2 ∈(0, 1) – współczynniki dyskonta
graczy 1 i 2 – miary niecierpliwości
(„o ile bardziej lubię świeże ciasto od
wyschniętego”).
ZASTOSOWANIE „DYPLOMACYJNE”
A i B próbują sformować koalicję przeciwko C.
Muszą dogadać się co do podziału zdobytych
baz. Jednemu z nich (przyjmijmy: A) może się
bardziej spieszyć.
Interpretacje opóźnienia i niechęci do niego:
1.[pomiędzy rundami] Tylko jedna propozycja
na rundę. C może bardziej zagrażać A niż B,
albo bazy C będące w zasięgu A mogą
zostać łatwiej przejęte przez jeszcze innego
gracza – każdy ruch zwłoki więcej kosztuje
A niż B.
2.[w obrębie rundy] Wiele propozycji na
rundę. A może bardziej zależeć by szybko
skończyć negocjacje niż B, bo np. chce
zdążyć pogadać z innymi, musi się uczyć do
egzaminu, nie chcę wyjść na chciwca itp.
Przetarg Stahla – ograniczony w czasie. Np.
runda się niedługo kończy. W zadanym z góry
momencie T przy braku porozumienia pozostałe
ciasto zostaje podzielone w ustalonych z góry
proporcjach K1,K2, K1 + K2 = 1.
Ta gra jest skończona i jedyną SPNE łatwo
znaleźć rozwiązując od końca (indukcja
wsteczna).
Ćwiczenie: Austria i Niemcy negocjują warunki
sojuszu przeciw Rosji. Każda runda zmniejsza
postrzeganą przez Austrię wartość sojuszu o
20% a przez Niemcy o 10%. Jeśli się nie
dogadają w ciągu dwóch rund, w t = 3
automatycznie podzielą się po równo (przed
uwzględnieniem dyskonta). Narysuj drzewo gry
i znajdź SPNE. A co by było, gdyby propozycje
mogła składać tylko Austria?
Uwaga 1: wysoka BATNA popłaca.
Uwaga 2: inicjatywa w negocjacjach popłaca
Przetarg Rubinsteina – bez ograniczenia czasu
trwania.
Możliwa jest „wieczna niezgoda”, (0, 0,∞).
ui(0, 0,∞) = 0.
Oznaczamy:
x(t)
= (x1(t)
,1 − x1(t)
) – propozycja gracza 1
złożona w nieparzystej chwili t,
y(t)
= (y1(t)
, 1 − y1(t)
) – propozycja gracza 2
złożona w parzystej chwili t.
Każdy podział ciasta (a, 1 − a) może być
osiągnięty w pewnej równowadze Nasha. Oto
dające ją strategie:
Gracz 1 (s1): Zawsze proponuję (a, 1 − a), na
(y1(t)
, 1 – y1(t)
) zgadzam się wtedy i tylko wtedy
gdy y1(t)
≥ a
Gracz 2 (s2): Zawsze proponuję (a, 1 − a), na
(x1(t)
,1 − x1(t)
)) zgadzam się wtedy i tylko wtedy
gdy 1 − x1(t)
≥ 1 − a.
Żadna z powyższych równowag nie jest
doskonała. s2 nie jest najlepszą odp. gracza 2 na
s1 w podgrze następującej po propozycji x(1)
=
(x1(1)
,1 − x1(1)
), gdzie 1 − x1(1)
∈ (δ2(1 − a), (1 −
a)
Jedyną równowagą doskonałą modelu z
dyskontem jest para strategii:
Gracza 1: Zawsze proponuję podział (x1, 1− x1),
zgadzam się na podział (y1, 1− y1) ⇔ y1 ≥ δ1x1;
Gracza 2: Zawsze proponuję podział (y1, 1−y1),
zgadzam się na podział (x1, 1− x1) ⇔ 1−x1 ≥
δ2(1−y1), przy czym y1 = δ1x1 , 1−x2 = δ2(1−y2)
Rozwiązanie tego układu równań:
𝑥1 =1 − 𝛿2
1 − 𝛿1𝛿2, 𝑥2 =
𝛿2(1 − 𝛿1)
1 − 𝛿1𝛿2
𝑦1 =𝛿1(1 − 𝛿2)
1 − 𝛿1𝛿2, 𝑦2 =
1 − 𝛿1
1 − 𝛿1𝛿2
Np. przy δ1 = 5/6, δ2 = 4/5
x1 =3/5, x2 =2/5, y1 = y2 =1/2
i w grze, w której pierwszą propozycję składa
gracz 1, dostanie 60% ciasta, gdy zaś gracz 2 –
podzielą się po równo.
Uwaga 2b: Inicjatywa wciąż popłaca.
Ćwiczenie: rozwiąż analogiczną grę, w której
tylko co trzecią propozycję wysuwa gracz 2.
Uwaga 3: Cierpliwość popłaca. Przy ustalonym
δ1: gdy δ2 rośnie, to y2 i x2 rosną.
Uwaga: pierwsza propozycja zawsze zostanie
przyjęta – rozwiązanie będzie efektywne. W
ogólności nie jest to prawdą w przetargach z
niepełną informacją.
GRY KOOPERACYJNE
Zamiast skupiać się na możliwych strategiach
graczy możemy spróbować określić co dana
koalicja może uzyskać jeśli będzie optymalnie
kooperować.
UWAGA: Taki rodzaj analizy ma sens jeśli
spodziewamy się, że gracze dotrzymają
zobowiązań
DEFINICJA: Gra kooperacyjna (z wypłatami
ubocznymi) – para (N, v) gdzie
N = {1, 2, . . . , n} – zbiór graczy,
Ɲ – zbiór wszystkich podzbiorów N (koalicji),
v: Ɲ → R – funkcja charakterystyczna
(spełniająca v(∅) = 0).
Interpretacja :
v(S) – to co może łącznie uzyskać koalicja S
niezależnie od działań pozostałych.
Każdą grę niekooperacyjną można naturalnie
przedstawić jako kooperacyjną, zakładając, że
członkowie S maksymalizują sumę swoich
wypłat, a pozostali – minimalizują tę sumę.
Za v(S) przyjmujemy wartość takiej gry (o
sumie stałej).
Ćwiczenie: każdy z trzech graczy, A, B i C,
jednocześnie decyduje czy zachować się dobrze
czy źle. Jeśli wszyscy zachowają się dobrze,
wszyscy mają wypłatę 4. Złe zachowanie
zwiększa wypłatę gracza o 1, ale zmniejsza
wypłatę każdego z pozostałych o 2. Przekształć
tę grę na kooperacyjną.
Gra prosta to taka, że każda koalicja ma wartość
0 lub 1, v(N) = 1 i gdy S jest podzbiorem T, to
v(S)≤v(T).
Przykład (gra ważonej większości) Koalicja
mająca ponad połowę baz wygrywa grę (v = 1,
zaś w p.p. v = 0). Wyznacz funkcję
charakterystyczną gdy: a) IT ma 8 baz, RU 10,
TR 16 b) AT ma 5 baz, DE 8, FR 10, GB 11
DEFINICJA: Podział w grze (N, v) to wektor
x = (x1, x2, . . . xn) taki że
∑ 𝑥𝑖 = 𝑣(𝑁)
𝑁
𝑖=1
Oznaczmy 𝑋𝑆 = ∑ 𝑥𝑗𝑗∈𝑆 . Podział x jest
koalicyjnie racjonalny jeżeli dla wszystkich koalicji S mamy XS ≥ v(S). Szczególnie
przekonująca jest indywidualna racjonalność
(warunek spełniony dla jednoelementowych
koalicji: xi≥ vi. Zbiór wszystkich podziałów
koalicyjnie racjonalnych w grze (N, v)
nazywamy rdzeniem (core) tej gry i oznaczamy
C(v).
Niestety rdzeń bywa pusty. Np. łatwo wykazać,
że każda gra v o sumie stałej (tzn. dla
wszystkich S, v(S) + v(N \ S) = v(N)) ma pusty
rdzeń, C(v) = ∅, chyba że jest addytywna,
∀S v(S) = Σj∈S v(j) (czyli koalicje nie mają
w ogóle znaczenia, a gra jest niezbyt ciekawa).
Rdzeń bywa też „dziwny”/mało przekonujący.
Ćwiczenie: znajdź rdzeń każdej z gier
z przykładu z poprzedniej strony.
WARTOŚCI GIER KOOPERACYJNYCH
Wartość to funkcja przypisująca każdej grze
podział w tej grze.
Wartość Shapleya gry (N, v) to podział w tej
grze, 𝜑(𝑣) = (𝜙1(𝑣), … , 𝜑𝑛(𝑣)), dany wzorem
𝜙𝑖(𝑣) = ∑(𝑠 − 1)! (𝑛 − 𝑠)!
𝑛!(𝑣(𝑆) − 𝑣(𝑆\𝑖))
𝑆∈𝑖
Gdzie n oznacza liczbę wszystkich graczy w
grze a s liczebność koalicji s. Interpretacja:
gracze dołączają w losowej kolejności
(wszystkie permutacje jednakowo
prawdopodobne) i każdy otrzymuje swoją
wartość dodaną.
Ćwiczenie Czy wartość Shapleya musi należeć
do rdzenia jeśli ten jest niepusty?
TWIERDZENIE Shapleya:
Jedyną wartością spełniającą łącznie
1. równoprawność: jeżeli gracze i, j są wymienni
w grze v (wymiana jednego na drugiego nie
zmienia v koalicji), to ϕi(v) = ϕj(v),
2. warunek gracza zerowego: jeżeli i jest
graczem zerowym (dodanie go do dowolnej
koalicji nie zmienia jej v), to ϕi(v) = 0,
3. addytywność: dla gry z = v + w mamy ϕ(z) =
ϕ(v) + ϕ (w)
jest wartość Shapleya.
Przykład. AT ma 5 baz, DE 13, FR 16. DE i AT
są skłócone, poniosą więc łączny psychiczny
koszt wyceniany na a ≤ 1 jeśli stworzą
dwuosobową koalicję. Wyznacz wartość
Shapleya. Ile musi wynosić a by rdzeń był
niepusty?