Upload
gioffreda-di-maio
View
220
Download
2
Embed Size (px)
Citation preview
Modellizzare le decisioni razionali con la teoria dei giochi.
Gian Italo Bischi DESP - Dipartimento di Economia, Società e PoliticaUniversità di Urbino “Carlo Bo”
[email protected]://www.mdef.it/gian-italo-bischi/
Caldè 27 Luglio 2013
Galileo Galilei 1564-1642
La filosofia è scritta in questo grandissimo libro che continuamente ci sta aperto innanzi agli occhi (io dico l’Universo), ma non si può intendere se prima non si impara a intender la lingua, e conoscer i caratteri, ne’ quali è scritto.
Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi ed altre figure geometriche, senza i quali mezi è impossibile a intenderne umanamente parola; senza questi è un aggirarsi vanamente per un oscuro laberinto.
Galileo, da “ Il Saggiatore”
The unreasonable effectiveness of mathematics in the natural sciences
(Eugene P. Wigner, Nobel per la Fisica nel 1963)
Capacità di descrivere e prevedere i fenomeni naturali: una mela, un pianeta, una particella elementare, un fluido, un gas …
Una sfida: Può la matematica aiutare anche a descrivere, prescrivere, prevedere i comportamenti umani?
(Hari Seldon, Parker Pyne …).
Ma il problema del bar di Santa Fe...
Vito Volterra (1860-1940)
Il matematico si trova in possesso di uno strumentomirabile e prezioso, creato dagli sforzi accumulatiper lungo andare di secoli dagli ingegni più acutie dalle menti più sublimi che siano mai vissute.Egli ha, per così dire, la chiave che può aprire ilvarco a molti oscuri misteri dell’universo, ed unmezzo per riassumere in pochi simboli una sintesiche abbraccia e collega vasti e disparati risultati di scienze diverse[…]Ma è intorno a quelle scienze nelle quali le matematiche solo da poco tempo hanno tentato d’introdursi, le scienze biologiche e sociali, che è più intensa la curiosità, giacché è forte il desiderio di assicurarsi se i metodi classici, i quali hanno dato così grandi risultati nelle scienze meccanico-fisiche, sono suscettibili di essere trasportati con pari successo nei nuovi ed inesplorati campi che si dischiudono loro dinanzi. dal discorso inaugurale per l’anno accademico 1901-1902 dell’Università di Roma
Vito Volterra (1860-1940)
Problema del monopolista: Più produco e più guadagno?
q = quantità prodottap = prezzo unitario di venditac = costo unitario di produzione Profitto = Ricavo – Costo = p q – c q = (p – c) q
Teorema.
Se p > c allora il profitto cresce ogniqualvolta cresce la produzione
Ma ci sono sempre dei consumatori disposti a comprare ciò che si produce al prezzo imposto dal monopolista ?
q (quantità venduta) e p (prezzo di vendita) non sono indipendenti
Il prezzo decresce al crescere della quantità ovvero
la quantità acquistata è funzione decrescente del prezzo
Esempio: Funzione di domanda lineare
p
q
p = A – B q
A=pmax per merce rara
p→0 pur di vendere
Tutta la produzione
= f (q) = – B q2 + (A – c) q
Profitto
quantità prodottaA c
B
2
A c
B
è una parabola!
profitto del monopolista = p q – c q = (A – B q) q – cq
Problema del duopolio
A. Cournot, Récherches sur les principes matématiques de la théorie de la richesse, 1838.
Due produttori, 1 e 2, vendono lo stesso prodotto
Il produttore 1 produce e immette nel mercato q1 con costi c1q1
Il produttore 2 produce e immette nel mercato q2 con costi c2q2
prezzo: p = A – B QTOT = A – B ( q1 + q2)
Profitto produttore 1: 1 = pq1 – c1q1 = [ A – B ( q1 + q2 )]q1 – c1q1
Profitto produttore 2: 2 = pq2 – c2q2 = [ A – B ( q1 + q2 )]q2 – c2q2
1 = [ A – B ( q1 + q2)]q1 – c1q1 = – Bq12 + (A – c1 –Bq2 )q1
Max per
2 = [ A – B ( q1 + q2)]q2 – c2q2 = – Bq22 + (A – c2 Bq1 )q2
Max per
B
BqcAqrq
2)( 21
211
2 12 2 1( )
2
A c Bqq r q
B
q2
q1
q2 = r
2 (q1 )
q1 = r
1 (q2 )
Equilibrio:
)(
)(
122
211
qrq
qrq
* 2 12
2
3
A c cq
B
* 1 2
1
2
3
A c cq
B
Equilibrio di Cournot-Nash
John Maynard Keynes (1883–1946)
Non basta semplicemente adattare i metodi e i ragionamenti della fisica alla modellizzazione dell’economia perché l’economia è una scienza morale.Essa ha a che vedere con motivazioni, aspettative, incertezze psicologiche. È come se la caduta della mela al suolo dipendesse dalle aspirazioni della mela, se per lei sia conveniente o meno cadere a terra, se il suolo vuole che essa cada, e se vi sono stati errori di calcolo da parte della mela sulla sua reale distanza dal centro del pianeta”
Aggiungiamo: come e quanto la mela si fa condizionare dal comportamento delle altre mele dello stesso albero o di alberi vicini, le aspirazioni e aspettative dellac mela, le informazioni che la mela ha, ecc.
Verso una “Matematica per le decisioni”. Occorre introdurre una descrizione formale di azioni possibili, informazioni sugli esiti, preferenze, razionalità.
Preferenze razionali: transitività
arancia ;-)) pera e pera ;-)) mela, allora
Parte oggettiva:A= insieme di azioni {a1, a2, …, am}E = insieme di eventi {e1, e2, …, em} con ei= h(ai), i=1,…m
Parte soggettiva:L’insieme E sia dotato di una relazione di preferenza: simbolo … ei ;-)) ej
significa: ei preferito o indifferente a ej, ovvero ej non peggio di ei
arancia ;-)) mela
Perché individui non transitivi non ci sono?Una possibile spiegazione evolutiva (money pump)
E = {x1=mela, x2=pera, x3=arancia}
Supponiamo che un individuo abbia preferenze non transitive (o cicliche)
Preferenze x1 ;-) x2 , x2 ;-) x3 , x3 ;-) x1
Gli regalo una mela.
Poi gli offro in cambio un’arancia e gli chiedo 1 cent in aggiunta.
Poi gli offro una pera e gli chiedo 1 cent in aggiunta.
Poi gli offro una mela e gli chiedo 1 cent in aggiunta.
Poi…
Un esempio: da transitività individuale a non transitività collettivaIl paradosso di Condorcet
1° 2° 3°
1 A B C
2 B C A
3 C A B
Cioè per l’elettore 1 A ;-) B ;-) C ecc.
Con un unico turno non c’è vincitore
Due turni: I) A contro B ….vince A II) A contro C …. vince CQuindi per la collettività dei 3 elettori A ;-) B e C;-) A
Proviamo a cambiare il primo turno I) B contro C …. vince B II) B contro A … vince A (come sapevamo)Quindi: B ;-) C e A ;-) B
Riassumendo: A ;-) B , B ;-) C , C ;-) A preferenze cicliche!!
x1
x2
xn
.
.
.
Azioni utilità (funzione di preferenza)
u(x1)
u(x2)
u(xn)
.
.
.
x* : max u( xk ) k=1,…,n
Se x è una variabile continua (cioè x [a,b] ) allora u:[a,b]→
abbiamo un tipico problema di ricerca di un massimo assoluto
in un compatto, detto spazio delle azioni
u(x1)
x1xx2 x3 x4 x5
u(x4)
u(x3)
Funzione di utilità: un valore numerico (una misura) alle preferenze e1 ;-)) e2 u(e1) u(e2)
Es. u(mela) = 10, u(pera) = 15 , u(arancia) = 20
Interazione strategica
John (János) von Neumann Budapest (Ungheria) 1903Washington (USA) 1957
Princeton, 1947
Oskar MorgensternGörlitz (Germania) 1902Princeton (USA) 1977
Dall'oroscopo di Linda Wolf del 3 dicembre 2009
Ariete.
Anche se siete sicuri del fatto vostro
fate molta attenzione alle decisioni degli altri
DECISIONI IN PRESENZA DI INTERAZIONE STRATEGICA
Interazione strategica, uA = uA (xA ,yB) : matrici dei payoffs aij= u(xi,yj)
Bimatrice dei payoffs
BA
a1
a2
an
.
.
.
b1 b2 bm. . .
a11
a21
an1
a12
a22
an2
a1m
a2m
anm
...
. . .
. . .
A
a1
a2
an
.
.
.
b11
b21
bn1
b12
b22
bn2
b1m
b2m
bnm
...
. . .
. . .
b1 b2 bm. . .B
A
a1
a2
an
.
.
.
(a11,b11)
...
. . .
. . .
b1 b2 bm. . .B
(a21,b21)
(an1,bn1)
(a12,b12)
(a21,b21)
(an1,bn1)
(a1m,b1m)
(a2m,b2m)
(anm,bnm)
Payoff giocatore A in presenza di B Payoff giocatore B in presenza di A
Principio di razionalità.Un giocatore non sceglie l’azione x se ha a disposizione una scelta y che gli permetta di ottenere di più qualunque siano le scelte dell’altro (o degli altri) giocatori
Esempio: B
A
a1
a2
b1 b2 b3
(0,1) (1,0) (-1,2)
(2,2) (3,2) (0,1)
BA
a1
a2
b1 b2 b3
(0,1) (1,0) (-1,2*)
(2*,2*) (3*,2*) (0*,1)
Metodo dell’eliminazione delle strategie dominate
Metodo del best reply (risposta ottima)
(5*,5*) (15*,0)
(10,10)(0,15*)
Preferisci che dia 5 euro a te oppure 10 al tuo amico?
BA
a1
a2
b1 b2
Giocatore A: a1: 5 a me a2: 10 a B
Giocatore B: b1: 5 a me b2: 10 ad A
(-1,-1) (-10,0*)
(-5*,-5*)(0*,-10)
BA
Dilemma del prigioniero
Tace Accusa
Tace
Accusa
Gioco proposto da Merrill Flood e Melvin Dresher, Rand Corporation 1950,per le possibili applicazioni ad una strategia nucleare globale.La versione "il dilemma di prigioniero" si deve ad Albert Tucker che volle rendere più accessibili le idee di Flood e Dresher a un pubblico di psicologi di Stanford.
Se denunci il tuo complice ti lasceremo libero (legge sui collaboratori) e il tuo complice starà in prigione per 10 anni. Ma se il tuo complice fa altrettanto allora sarete dichiarati entrambi colpevoli e, pur usufruendo dello sconto per aver collaboratori, rimarrete in carcere 5 anni ciascuno. Se entrambi tacete, 1 anno di prigione ciascuno per guida pericolosa e detenzione di armi.
FishermanCFisherman
R
Moderateexploitaton
(cooperative)
Intensiveexploitation
(competitive)
(3, 3)
(2, 2)
(1, 4)
(4, 1)
Moderateexploitaton
(cooperative)
Intensiveexploitation
(competitive)
Dilemma del Pescatore
Un tipico dilemma sociale
Hardin, G. “The tragedy of the commons”, Science (1968).
E la mano invisibile di Adam Smith?
(a,a) (b,c)
(d,d)(c,b)
BA
a1
b2
a2
b1
In generale …
con c > a > d > b
Altre situazioni : Scambio a scatola chiusa Corsa agli armamenti e politiche di disarmo Parlare a voce alta in pizzeriaInquinare o no?Porto il casco per correre in bici?
E’ meglio il più o il meno?
Singolo decisore
x
u(x)
Interazione strategica
(10,10) (3,15*)
(5*,5*)(15*,3)
BA
a1
a2
b1 b2
(8*,8*) (2*,7)
(0,0)(7,2*)
BA
a1
a2
b1 b2
E’ meglio avere più possibilità di scelta?
Singolo decisore
x
u(x)
Interazione strategica
(10*,10*)(3*,5)
(1,1) (5,3*)
BA
a1
a2
b1 b2
x1 x2x3
(10,10)(3,5)
(1,1) (5,3)
(1*,1*)
(0,11*)
(4*,0) (11*,0)
(0,4*)
BA
a1
a2
b1 b2b3
a3
BA
a1
a2
b1b2
a3
b3
0,4* 4*,0 5,3
4*,0 0,4* 5,3
3,5 3,5 6*,6*
BA
a1
a2
b1b2
b4b3
1,4 -1,6* 3,0
2*,0 4,0 6*,0
2*,2
2*,1*
0,4 5*,6* 0,-2 -1,1
Non ha strategie dominate da eliminareComunque ha un unico equilibrio di Nash
a3
Si poteva eliminare al prima riga, poi la terza colonna e poi la prima colonna
Un equilibrio di Nash sopravvive all’eliminazione iterata di strategie dominate, ma nessuno mi garantisce che l’eliminazione iterata sia in grado di rimuovere tutto tranne gli equilibri di Nash
(0,0)(0,0)
(1,1) (0,0)
BA
Facile se ciascuno conosce la matrice dei payoff e sa che l’altro è razionale e sa che l’altro sa…
(1,1)(0,0)
(1,1) (0,0)
BA
Gioco di puro coordinamento. Se giochiamo la stressa strategia va bene per entrambi, se giochiamo diverso male per entrambi. Occorre comunicazione preliminare, (poi non c’è pericolo di defezione)
(2,1)(0,0)
(1,2) (0,0)
BA Anche qui due equilibri di Nash, ma difficile
accordo preliminare. Se ciascuno persegue il proprio Nash preferito si finisce in (0,0). E anche un eccesso di altruismo da parte di entrambi…battaglia dei sessi:
shopping o partita?
tenere la destra o la sinistra?
a1
a2
b1 b2
a1
a2
b1 b2
a1
a2
b1 b2
(0,0)(1,1)
(0,0) (1,1)
BA
Apriamo un negozio dello stesso tipo o di tipo diverso?
(0,0)(2,1)
(0,0) (1,2)
BA
E se uno dei due articoli offre maggiori profitti?
(1,1)(0*,2*)
(-1,-1) (2*,0*)
BA
Accelera
Frena
Accelera Frena
Gioco del Chicken (Gioventù bruciata)
Attacco nucleare (guerra fredda USA URSS)
a1
a2
b1 b2
a1
a2
b1 b2
9 3 0
6 5 7
-1 4 9
0
5
-1
9 5 9
Equilibrio: maxmin = minmax = sella della matricemaxmin = minmax = sella della matrice
Giochi a somma zeronon ci sono equilibri di Nash inefficienti
,-9 ,-3
,-6 ,-5 ,-7
,0
,1 ,-4 ,-9
minimo guadagno su ogni riga
massima perdita su ogni colonna
min fra le max perdite(minmax)
max fra i min guadagni(maxmin)
BA
a1
a2
b1 b2
a3
b3
0 4 7 3 2
5 8 9 5 6
1 5 3 2 1
5 10 8 5 9
0 9 6 1 7
BA
a1
a2
b1 b2
a3
b3 b4 b5
a4
a5
0
5
1
5 5 9
minimi guadagni
massime perdite
minmax
maxmin
Gioco a somma zero - non ci sono equilibri di Nash inefficienti (interessi contrapposti)- vale la proprietà di rettangolarità: se ci sono più strategie di Nash ciascuno può scegliere le proprie Nash senza preoccuparsi di quale sceglie l’altro (purché razionale)
10 9
5
0
maxmin
minmax
BA
S
F
S F
C
0,0 1*, -1 -1, 1*
-1, 1* 0,0 1*,-1
1*,-1 -1,1* 0,0
Morra cinese: Sasso, Forbici, Carta
C
-1,1*1*, -1
-1,1* 1*, -1
BA
P
D
P DMorra (pari-dispari)Matching pennies
Due luoghi, due ex fidanzati con interessi opposti
Giochi senza equilibrio di Nash (in strategie pure)
Idea delle strategie miste e loro interpretazioni
Matching pennies a strategie miste
-1,1
-1,1 1,-1
BA
a1
a2
b1 b2
p
(1- p)
q (1- q)
payoff atteso VA(a1) = -1q + 1(1- q) = 1−2q
payoff atteso da VA(a2) = 1q −1(1- q) = 2q - 1
2
1
1
1,-1
Quindi VA(a1)> VA(a2) se q<1/2
payoff atteso VB(b1) 1p − 1(1- p) = 2p − 1
payoff atteso da VB(b2) -1p + 1(1-p) = 1 − 2p
Analogamente per il giocatore B
Quindi VB(b1)> VB(b2) se p>1/2
2
1
1 q
p
Payoff attesi da A in base alle scelte attese da parte di B
Funzioni di reazione
12
10
2
1]1,0[
2
101
)(
qse
qse
qse
qRp A
12
11
2
1]1,0[
2
100
)(
pse
pse
pse
pRq B
Battaglia dei sessi con strategie miste
1,2
2,1 0,0
BA
a1
a2
b1 b2
p
(1- p)
q (1- q)
payoff atteso VA(a1) = 2q
payoff atteso da VA(a2) = 1- q
3
1
0,0
Quindi VA(a1)> VA(a2) se q>1/3 p=1
payoff atteso VB(b1) = p
payoff atteso da VB(b2) = 2(1-p) = 1 − 2p
Analogamente per il giocatore B
Quindi VB(b1)> VB(b2) se p>2/3 q=1
3
2
1 q
p
Payoff attesi da A in base alle scelte attese da parte di B
Funzioni di reazione
13
101
3
1]1,0[
3
100
)(
qse
qse
qse
qRp A
13
21
3
2]1,0[
3
200
)(
pse
pse
pse
pRq B
1
Gioco degli aiuti umanitariDue paesi ricchi hanno sovrabbondanza di beni rapidamente deteriorabili (es. alimentari) e decidono di regalarli a paesi poveri per ottenere un’influenza politica o alleanza in caso di conflitto.Due i paesi beneficiari, I e II; 4 e 3 le unità di beni a disposizione di A e B risp. Se un paese ricco dà a uno povero più unità del bene se ne assicura il controllo (+1) se meno perde il controllo (-1) se uguale neutralità (0).Può A sfruttare il vantaggio (4 contro 3) per controllarli entrambi?
BA
a1:4,0
a2:3,1
b1
3,0b2
2,1
a3 :2,2
b3
1,2b4
0,3
a4 :1,3
a5 :0,4
Payoff di A: somma algebrica
dei controlli
gioco a somma 0
1 0 0 0
1 1 0 0
0 1 1 0
0 0 1 1
0 0 0 1
0
BA
a1:4,0
a2:3,1
b1
3,0b2
2,1
a3 :2,2
b3
1,2b4
0,3
a4 :1,3
a5 :0,4
1 0 0
1 1 0 0
0 1 1 0
0 0 1 1
0 0 0 1
10
1 0
BA
a2
a4
b1 b4
p
(1- p)
q (1- q)
Soluzionep=q=1/2
(b,b,b) (b,b,a) (b,a,b) (d,c,c) (a,b,b) (c,d,c) (c,c,d) (c,c,c)
preferenzea > b > c > d
S N S N S N S N
S N S N
S N
Ci aumentiamo lo stipendio?Passa se votato da almeno due su tre.Si vota a turno e in modo palese
a: voto no e passab: voto sì e passac: voto no e non passad: voto sì e non passa
S N
b a(b,b)
(b,a) (a,b) (c,c)
S N S N
S N
Mosse successive con informazione completa. Giochi in forma estesa e induzione a ritroso.
I
II
III
Forma estesa e strategica. Un esempio
Due “giocatori”, scimmia grande S e scimmia piccola s. Per mangiare almeno una deve salite sull’albero delle noci di cocco, e scuotere i rami per farle cadere. Ciascuna ha due strategie c = climb w = wait
(c,c) S spende due per salire e poi mangia 7, s mangia 3: (5,3)(c,w) s mangia 4 prima che S arrivi, poi S mangia 6: (4,4)(w,c) S mangia 9 e s mangia 1 che è rimasto: (9,1)(w,w) : (0,0)
0,09*, 1*
5,3 4*, 4*
sS
c
w
c w
Due equilibri di Nash, scelta difficile perché entrambi presentano il pericolo di restare a digiuno se l’altro defeziona.Non è facile un accordo preventivo
Mosse simultanee (ovvero senza sapere cosa fa l’altro)
c wc w
c w
S
s
(4,4) (9,1) (0,0)(5,3)
c w c w
c w
S
s
Passiamo a mosse consecutive a informazione completa. S decide per primo e poi s
(5,3) (4,4) (9,1) (0,0)
Potatura della scelta di s (considerato razionale)
c w
S
(4,4) (9,1)
Unica soluzione: (w,c)
sS
c
w
cc cw wwwc
5,3 5*,3 4,4*
9*,1* 0,0 9*,1*
4*,4*
0,0
3 Eq. Nash, ma solo (w,cc) e (w,wc) sono perfetti nei sottogiochi, ma (w,wc) è preferibile per s (perché un errore di S gli dà 4 invece di 3). La minaccia di s do giocare w potrebbe essere credibile perché perde solo 1
S ha due strategie: c,wS ne ha 4: cc (arrampica cmq), cw (imita), wc (fa l’opposto), ww (attende cmq)
Ultimatum game.Due giocatori. Il primo (proponente) può ottenere un premio di E euro a patto che ne ceda una parte X al secondo giocatore (ricevente). Se questi accetta ciascuno prende la propria parte, E-X il primo, X il secondo. Se questi rifiuta non prende niente nessuno dei due.
(E-X,X) (0,0)
Unico equilibrio di Nash:X > 0 più piccolo possibile
Le evidenze sperimentali sono molto diverse: il proponente offre tra il 30% e il 40% della somma totale, il 50% dei riceventi rifiutano se l’offerta è minore del 20% di E
Dictator Game (o di puro altruismo)Il proponente ha la possibilità (non l’obbligo) di donare una parte al ricevente, senza avere ritorsioni. Le evidenze sperimentali mostrano che X è tra il 10% e il 25% se i due giocatori si conoscono.Invece in caso di doppio anonimato il 70% circa non lascia nulla e il rimanente tra il 10% e il 20%
Behavioral economics (Economia comportamentale)
Asta da un dollaro
Si tratta della tipica situazione in cui il vincitore paga un prezzo sproporzionato rispetto al premio che ottiene, lo sconfitto paga un alto prezzo per una battaglia che non frutta nulla.
Morale: era meglio non iniziare
Si mettono all’asta 100 euro, partendo da un’offerta iniziale di 1 € .Chi offre di più si aggiudica i 100 euro, ma anche chi fa la seconda offerta paga, senza però vincere nulla.
…proviamo…all’inizio sembra una buona opportunità…ai 50 euro ci si rende conto che il banditore ha fatto un affare …ai 99 euro si vorrebbe smettere ma…conviene offrire 100 e poi 101… se non vogliamo perdere tutto…aste realmente effettuare sono arrivate a 300-350 euro, con un guadagno del 700% da parte del banditore !!!
Harsanyi Nash Selten
Premio Nobel, 1994 "for their pioneering analysis of equilibria in the theory of non-cooperative games"
Aumann Schelling
Premio Nobel, 2005 "for having enhanced our understanding of conflict and cooperation through game-theory analysis"
Premio Nobel Economia, 2007 "for having laid the foundations of mechanism design theory"
Hurwicz Maskin Myerson
Nobel 2012 “per le loro ricerche sulla teoria dei giochi applicata al funzionamento dei mercati.
Shapley Roth
Alcune letture
Roberto Lucchetti “Scacchi e scimpanzé” Bruno Mondadori 2012
Pierluigi Argoneto “I Radiohead, l’arcobaleno e il piede sinistro di Dio”, Armando Editore 2009
Roberto Lucchetti “Passione per Trilli” Springer Italia 2007
Fioravante Patrone “Decisori (razionali) interagenti”, Plus edizioni 2006
Tom Siegfried “E’ la matematica, bellezza!”, Bollati Boringhieri 2006