Modellizzare le decisioni razionali con la teoria dei giochi. Gian Italo Bischi DESP - Dipartimento di Economia, Società e Politica Università di Urbino

Modellizzare le decisioni razionali con la teoria dei giochi.

Gian Italo Bischi DESP - Dipartimento di Economia, Società e PoliticaUniversità di Urbino “Carlo Bo”

[email protected]://www.mdef.it/gian-italo-bischi/

Caldè 27 Luglio 2013

Galileo Galilei 1564-1642

La filosofia è scritta in questo grandissimo libro che continuamente ci sta aperto innanzi agli occhi (io dico l’Universo), ma non si può intendere se prima non si impara a intender la lingua, e conoscer i caratteri, ne’ quali è scritto.

Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi ed altre figure geometriche, senza i quali mezi è impossibile a intenderne umanamente parola; senza questi è un aggirarsi vanamente per un oscuro laberinto.

Galileo, da “ Il Saggiatore”

The unreasonable effectiveness of mathematics in the natural sciences

(Eugene P. Wigner, Nobel per la Fisica nel 1963)

Capacità di descrivere e prevedere i fenomeni naturali: una mela, un pianeta, una particella elementare, un fluido, un gas …

Una sfida: Può la matematica aiutare anche a descrivere, prescrivere, prevedere i comportamenti umani?

(Hari Seldon, Parker Pyne …).

Ma il problema del bar di Santa Fe...

Vito Volterra (1860-1940)

Il matematico si trova in possesso di uno strumentomirabile e prezioso, creato dagli sforzi accumulatiper lungo andare di secoli dagli ingegni più acutie dalle menti più sublimi che siano mai vissute.Egli ha, per così dire, la chiave che può aprire ilvarco a molti oscuri misteri dell’universo, ed unmezzo per riassumere in pochi simboli una sintesiche abbraccia e collega vasti e disparati risultati di scienze diverse[…]Ma è intorno a quelle scienze nelle quali le matematiche solo da poco tempo hanno tentato d’introdursi, le scienze biologiche e sociali, che è più intensa la curiosità, giacché è forte il desiderio di assicurarsi se i metodi classici, i quali hanno dato così grandi risultati nelle scienze meccanico-fisiche, sono suscettibili di essere trasportati con pari successo nei nuovi ed inesplorati campi che si dischiudono loro dinanzi. dal discorso inaugurale per l’anno accademico 1901-1902 dell’Università di Roma

Vito Volterra (1860-1940)

Problema del monopolista: Più produco e più guadagno?

q = quantità prodottap = prezzo unitario di venditac = costo unitario di produzione Profitto = Ricavo – Costo = p q – c q = (p – c) q

Teorema.

Se p > c allora il profitto cresce ogniqualvolta cresce la produzione

Ma ci sono sempre dei consumatori disposti a comprare ciò che si produce al prezzo imposto dal monopolista ?

q (quantità venduta) e p (prezzo di vendita) non sono indipendenti

Il prezzo decresce al crescere della quantità ovvero

la quantità acquistata è funzione decrescente del prezzo

Esempio: Funzione di domanda lineare

p

q

p = A – B q

A=pmax per merce rara

p→0 pur di vendere

Tutta la produzione

= f (q) = – B q2 + (A – c) q

Profitto

quantità prodottaA c

B

2

A c

B

è una parabola!

profitto del monopolista = p q – c q = (A – B q) q – cq

Problema del duopolio

A. Cournot, Récherches sur les principes matématiques de la théorie de la richesse, 1838.

Due produttori, 1 e 2, vendono lo stesso prodotto

Il produttore 1 produce e immette nel mercato q1 con costi c1q1

Il produttore 2 produce e immette nel mercato q2 con costi c2q2

prezzo: p = A – B QTOT = A – B ( q1 + q2)

Profitto produttore 1: 1 = pq1 – c1q1 = [ A – B ( q1 + q2 )]q1 – c1q1

Profitto produttore 2: 2 = pq2 – c2q2 = [ A – B ( q1 + q2 )]q2 – c2q2

1 = [ A – B ( q1 + q2)]q1 – c1q1 = – Bq12 + (A – c1 –Bq2 )q1

Max per

2 = [ A – B ( q1 + q2)]q2 – c2q2 = – Bq22 + (A – c2 Bq1 )q2

Max per

B

BqcAqrq

2)( 21

211

2 12 2 1( )

2

A c Bqq r q

B

q2

q1

q2 = r

2 (q1 )

q1 = r

1 (q2 )

Equilibrio:

)(

)(

122

211

qrq

qrq

* 2 12

2

3

A c cq

B

* 1 2

1

2

3

A c cq

B

Equilibrio di Cournot-Nash

John Maynard Keynes (1883–1946)

Non basta semplicemente adattare i metodi e i ragionamenti della fisica alla modellizzazione dell’economia perché l’economia è una scienza morale.Essa ha a che vedere con motivazioni, aspettative, incertezze psicologiche. È come se la caduta della mela al suolo dipendesse dalle aspirazioni della mela, se per lei sia conveniente o meno cadere a terra, se il suolo vuole che essa cada, e se vi sono stati errori di calcolo da parte della mela sulla sua reale distanza dal centro del pianeta”

Aggiungiamo: come e quanto la mela si fa condizionare dal comportamento delle altre mele dello stesso albero o di alberi vicini, le aspirazioni e aspettative dellac mela, le informazioni che la mela ha, ecc.

Verso una “Matematica per le decisioni”. Occorre introdurre una descrizione formale di azioni possibili, informazioni sugli esiti, preferenze, razionalità.

Preferenze razionali: transitività

arancia ;-)) pera e pera ;-)) mela, allora

Parte oggettiva:A= insieme di azioni {a1, a2, …, am}E = insieme di eventi {e1, e2, …, em} con ei= h(ai), i=1,…m

Parte soggettiva:L’insieme E sia dotato di una relazione di preferenza: simbolo … ei ;-)) ej

significa: ei preferito o indifferente a ej, ovvero ej non peggio di ei

arancia ;-)) mela

Perché individui non transitivi non ci sono?Una possibile spiegazione evolutiva (money pump)

E = {x1=mela, x2=pera, x3=arancia}

Supponiamo che un individuo abbia preferenze non transitive (o cicliche)

Preferenze x1 ;-) x2 , x2 ;-) x3 , x3 ;-) x1

Gli regalo una mela.

Poi gli offro in cambio un’arancia e gli chiedo 1 cent in aggiunta.

Poi gli offro una pera e gli chiedo 1 cent in aggiunta.

Poi gli offro una mela e gli chiedo 1 cent in aggiunta.

Poi…

Un esempio: da transitività individuale a non transitività collettivaIl paradosso di Condorcet

1° 2° 3°

1 A B C

2 B C A

3 C A B

Cioè per l’elettore 1 A ;-) B ;-) C ecc.

Con un unico turno non c’è vincitore

Due turni: I) A contro B ….vince A II) A contro C …. vince CQuindi per la collettività dei 3 elettori A ;-) B e C;-) A

Proviamo a cambiare il primo turno I) B contro C …. vince B II) B contro A … vince A (come sapevamo)Quindi: B ;-) C e A ;-) B

Riassumendo: A ;-) B , B ;-) C , C ;-) A preferenze cicliche!!

x1

x2

xn

.

.

.

Azioni utilità (funzione di preferenza)

u(x1)

u(x2)

u(xn)

.

.

.

x* : max u( xk ) k=1,…,n

Se x è una variabile continua (cioè x [a,b] ) allora u:[a,b]→

abbiamo un tipico problema di ricerca di un massimo assoluto

in un compatto, detto spazio delle azioni

u(x1)

x1xx2 x3 x4 x5

u(x4)

u(x3)

Funzione di utilità: un valore numerico (una misura) alle preferenze e1 ;-)) e2 u(e1) u(e2)

Es. u(mela) = 10, u(pera) = 15 , u(arancia) = 20

Interazione strategica

John (János) von Neumann Budapest (Ungheria) 1903Washington (USA) 1957

Princeton, 1947

Oskar MorgensternGörlitz (Germania) 1902Princeton (USA) 1977

Dall'oroscopo di Linda Wolf del 3 dicembre 2009

Ariete.

Anche se siete sicuri del fatto vostro

fate molta attenzione alle decisioni degli altri

DECISIONI IN PRESENZA DI INTERAZIONE STRATEGICA

Interazione strategica, uA = uA (xA ,yB) : matrici dei payoffs aij= u(xi,yj)

Bimatrice dei payoffs

BA

a1

a2

an

.

.

.

b1 b2 bm. . .

a11

a21

an1

a12

a22

an2

a1m

a2m

anm

...

. . .

. . .

A

a1

a2

an

.

.

.

b11

b21

bn1

b12

b22

bn2

b1m

b2m

bnm

...

. . .

. . .

b1 b2 bm. . .B

A

a1

a2

an

.

.

.

(a11,b11)

...

. . .

. . .

b1 b2 bm. . .B

(a21,b21)

(an1,bn1)

(a12,b12)

(a21,b21)

(an1,bn1)

(a1m,b1m)

(a2m,b2m)

(anm,bnm)

Payoff giocatore A in presenza di B Payoff giocatore B in presenza di A

Principio di razionalità.Un giocatore non sceglie l’azione x se ha a disposizione una scelta y che gli permetta di ottenere di più qualunque siano le scelte dell’altro (o degli altri) giocatori

Esempio: B

A

a1

a2

b1 b2 b3

(0,1) (1,0) (-1,2)

(2,2) (3,2) (0,1)

BA

a1

a2

b1 b2 b3

(0,1) (1,0) (-1,2*)

(2*,2*) (3*,2*) (0*,1)

Metodo dell’eliminazione delle strategie dominate

Metodo del best reply (risposta ottima)

(5*,5*) (15*,0)

(10,10)(0,15*)

Preferisci che dia 5 euro a te oppure 10 al tuo amico?

BA

a1

a2

b1 b2

Giocatore A: a1: 5 a me a2: 10 a B

Giocatore B: b1: 5 a me b2: 10 ad A

(-1,-1) (-10,0*)

(-5*,-5*)(0*,-10)

BA

Dilemma del prigioniero

Tace Accusa

Tace

Accusa

Gioco proposto da Merrill Flood e Melvin Dresher, Rand Corporation 1950,per le possibili applicazioni ad una strategia nucleare globale.La versione "il dilemma di prigioniero" si deve ad Albert Tucker che volle rendere più accessibili le idee di Flood e Dresher a un pubblico di psicologi di Stanford.

Se denunci il tuo complice ti lasceremo libero (legge sui collaboratori) e il tuo complice starà in prigione per 10 anni. Ma se il tuo complice fa altrettanto allora sarete dichiarati entrambi colpevoli e, pur usufruendo dello sconto per aver collaboratori, rimarrete in carcere 5 anni ciascuno. Se entrambi tacete, 1 anno di prigione ciascuno per guida pericolosa e detenzione di armi.

FishermanCFisherman

R

Moderateexploitaton

(cooperative)

Intensiveexploitation

(competitive)

(3, 3)

(2, 2)

(1, 4)

(4, 1)

Moderateexploitaton

(cooperative)

Intensiveexploitation

(competitive)

Dilemma del Pescatore

Un tipico dilemma sociale

Hardin, G. “The tragedy of the commons”, Science (1968).

E la mano invisibile di Adam Smith?

(a,a) (b,c)

(d,d)(c,b)

BA

a1

b2

a2

b1

In generale …

con c > a > d > b

Altre situazioni : Scambio a scatola chiusa Corsa agli armamenti e politiche di disarmo Parlare a voce alta in pizzeriaInquinare o no?Porto il casco per correre in bici?

E’ meglio il più o il meno?

Singolo decisore

x

u(x)


(10,10) (3,15*)

(5*,5*)(15*,3)

BA

a1

a2

b1 b2

(8*,8*) (2*,7)

(0,0)(7,2*)

BA

a1

a2

b1 b2

E’ meglio avere più possibilità di scelta?

Singolo decisore

x

u(x)


(10*,10*)(3*,5)

(1,1) (5,3*)

BA

a1

a2

b1 b2

x1 x2x3

(10,10)(3,5)

(1,1) (5,3)

(1*,1*)

(0,11*)

(4*,0) (11*,0)

(0,4*)

BA

a1

a2

b1 b2b3

a3

BA

a1

a2

b1b2

a3

b3

0,4* 4*,0 5,3

4*,0 0,4* 5,3

3,5 3,5 6*,6*

BA

a1

a2

b1b2

b4b3

1,4 -1,6* 3,0

2*,0 4,0 6*,0

2*,2

2*,1*

0,4 5*,6* 0,-2 -1,1

Non ha strategie dominate da eliminareComunque ha un unico equilibrio di Nash

a3

Si poteva eliminare al prima riga, poi la terza colonna e poi la prima colonna

Un equilibrio di Nash sopravvive all’eliminazione iterata di strategie dominate, ma nessuno mi garantisce che l’eliminazione iterata sia in grado di rimuovere tutto tranne gli equilibri di Nash

(0,0)(0,0)

(1,1) (0,0)

BA

Facile se ciascuno conosce la matrice dei payoff e sa che l’altro è razionale e sa che l’altro sa…

(1,1)(0,0)

(1,1) (0,0)

BA

Gioco di puro coordinamento. Se giochiamo la stressa strategia va bene per entrambi, se giochiamo diverso male per entrambi. Occorre comunicazione preliminare, (poi non c’è pericolo di defezione)

(2,1)(0,0)

(1,2) (0,0)

BA Anche qui due equilibri di Nash, ma difficile

accordo preliminare. Se ciascuno persegue il proprio Nash preferito si finisce in (0,0). E anche un eccesso di altruismo da parte di entrambi…battaglia dei sessi:

shopping o partita?

tenere la destra o la sinistra?

a1

a2

b1 b2

a1

a2

b1 b2

a1

a2

b1 b2

(0,0)(1,1)

(0,0) (1,1)

BA

Apriamo un negozio dello stesso tipo o di tipo diverso?

(0,0)(2,1)

(0,0) (1,2)

BA

E se uno dei due articoli offre maggiori profitti?

(1,1)(0*,2*)

(-1,-1) (2*,0*)

BA

Accelera

Frena

Accelera Frena

Gioco del Chicken (Gioventù bruciata)

Attacco nucleare (guerra fredda USA URSS)

a1

a2

b1 b2

a1

a2

b1 b2

9 3 0

6 5 7

-1 4 9

0

5

-1

9 5 9

Equilibrio: maxmin = minmax = sella della matricemaxmin = minmax = sella della matrice

Giochi a somma zeronon ci sono equilibri di Nash inefficienti

,-9 ,-3

,-6 ,-5 ,-7

,0

,1 ,-4 ,-9

minimo guadagno su ogni riga

massima perdita su ogni colonna

min fra le max perdite(minmax)

max fra i min guadagni(maxmin)

BA

a1

a2

b1 b2

a3

b3

0 4 7 3 2

5 8 9 5 6

1 5 3 2 1

5 10 8 5 9

0 9 6 1 7

BA

a1

a2

b1 b2

a3

b3 b4 b5

a4

a5

0

5

1

5 5 9

minimi guadagni

massime perdite

minmax

maxmin

Gioco a somma zero - non ci sono equilibri di Nash inefficienti (interessi contrapposti)- vale la proprietà di rettangolarità: se ci sono più strategie di Nash ciascuno può scegliere le proprie Nash senza preoccuparsi di quale sceglie l’altro (purché razionale)

10 9

5

0

maxmin

minmax

BA

S

F

S F

C

0,0 1*, -1 -1, 1*

-1, 1* 0,0 1*,-1

1*,-1 -1,1* 0,0

Morra cinese: Sasso, Forbici, Carta

C

-1,1*1*, -1

-1,1* 1*, -1

BA

P

D

P DMorra (pari-dispari)Matching pennies

Due luoghi, due ex fidanzati con interessi opposti

Giochi senza equilibrio di Nash (in strategie pure)

Idea delle strategie miste e loro interpretazioni

Matching pennies a strategie miste

-1,1

-1,1 1,-1

BA

a1

a2

b1 b2

p

(1- p)

q (1- q)

payoff atteso VA(a1) = -1q + 1(1- q) = 1−2q

payoff atteso da VA(a2) = 1q −1(1- q) = 2q - 1

2

1

1

1,-1

Quindi VA(a1)> VA(a2) se q<1/2

payoff atteso VB(b1) 1p − 1(1- p) = 2p − 1

payoff atteso da VB(b2) -1p + 1(1-p) = 1 − 2p

Analogamente per il giocatore B

Quindi VB(b1)> VB(b2) se p>1/2

2

1

1 q

p

Payoff attesi da A in base alle scelte attese da parte di B

Funzioni di reazione

12

10

2

1]1,0[

2

101

)(

qse

qse

qse

qRp A

12

11

2

1]1,0[

2

100

)(

pse

pse

pse

pRq B

Battaglia dei sessi con strategie miste

1,2

2,1 0,0

BA

a1

a2

b1 b2

p

(1- p)

q (1- q)

payoff atteso VA(a1) = 2q

payoff atteso da VA(a2) = 1- q

3

1

0,0

Quindi VA(a1)> VA(a2) se q>1/3 p=1

payoff atteso VB(b1) = p

payoff atteso da VB(b2) = 2(1-p) = 1 − 2p

Analogamente per il giocatore B

Quindi VB(b1)> VB(b2) se p>2/3 q=1

3

2

1 q

p

Payoff attesi da A in base alle scelte attese da parte di B

Funzioni di reazione

13

101

3

1]1,0[

3

100

)(

qse

qse

qse

qRp A

13

21

3

2]1,0[

3

200

)(

pse

pse

pse

pRq B

1

Gioco degli aiuti umanitariDue paesi ricchi hanno sovrabbondanza di beni rapidamente deteriorabili (es. alimentari) e decidono di regalarli a paesi poveri per ottenere un’influenza politica o alleanza in caso di conflitto.Due i paesi beneficiari, I e II; 4 e 3 le unità di beni a disposizione di A e B risp. Se un paese ricco dà a uno povero più unità del bene se ne assicura il controllo (+1) se meno perde il controllo (-1) se uguale neutralità (0).Può A sfruttare il vantaggio (4 contro 3) per controllarli entrambi?

BA

a1:4,0

a2:3,1

b1

3,0b2

2,1

a3 :2,2

b3

1,2b4

0,3

a4 :1,3

a5 :0,4

Payoff di A: somma algebrica

dei controlli

gioco a somma 0

1 0 0 0

1 1 0 0

0 1 1 0

0 0 1 1

0 0 0 1

0

BA

a1:4,0

a2:3,1

b1

3,0b2

2,1

a3 :2,2

b3

1,2b4

0,3

a4 :1,3

a5 :0,4

1 0 0

1 1 0 0

0 1 1 0

0 0 1 1

0 0 0 1

10

1 0

BA

a2

a4

b1 b4

p

(1- p)

q (1- q)

Soluzionep=q=1/2

(b,b,b) (b,b,a) (b,a,b) (d,c,c) (a,b,b) (c,d,c) (c,c,d) (c,c,c)

preferenzea > b > c > d

S N S N S N S N

S N S N

S N

Ci aumentiamo lo stipendio?Passa se votato da almeno due su tre.Si vota a turno e in modo palese

a: voto no e passab: voto sì e passac: voto no e non passad: voto sì e non passa

S N

b a(b,b)

(b,a) (a,b) (c,c)

S N S N

S N

Mosse successive con informazione completa. Giochi in forma estesa e induzione a ritroso.

I

II

III

Forma estesa e strategica. Un esempio

Due “giocatori”, scimmia grande S e scimmia piccola s. Per mangiare almeno una deve salite sull’albero delle noci di cocco, e scuotere i rami per farle cadere. Ciascuna ha due strategie c = climb w = wait

(c,c) S spende due per salire e poi mangia 7, s mangia 3: (5,3)(c,w) s mangia 4 prima che S arrivi, poi S mangia 6: (4,4)(w,c) S mangia 9 e s mangia 1 che è rimasto: (9,1)(w,w) : (0,0)

0,09*, 1*

5,3 4*, 4*

sS

c

w

c w

Due equilibri di Nash, scelta difficile perché entrambi presentano il pericolo di restare a digiuno se l’altro defeziona.Non è facile un accordo preventivo

Mosse simultanee (ovvero senza sapere cosa fa l’altro)

c wc w

c w

S

s

(4,4) (9,1) (0,0)(5,3)

c w c w

c w

S

s

Passiamo a mosse consecutive a informazione completa. S decide per primo e poi s

(5,3) (4,4) (9,1) (0,0)

Potatura della scelta di s (considerato razionale)

c w

S

(4,4) (9,1)

Unica soluzione: (w,c)

sS

c

w

cc cw wwwc

5,3 5*,3 4,4*

9*,1* 0,0 9*,1*

4*,4*

0,0

3 Eq. Nash, ma solo (w,cc) e (w,wc) sono perfetti nei sottogiochi, ma (w,wc) è preferibile per s (perché un errore di S gli dà 4 invece di 3). La minaccia di s do giocare w potrebbe essere credibile perché perde solo 1

S ha due strategie: c,wS ne ha 4: cc (arrampica cmq), cw (imita), wc (fa l’opposto), ww (attende cmq)

Ultimatum game.Due giocatori. Il primo (proponente) può ottenere un premio di E euro a patto che ne ceda una parte X al secondo giocatore (ricevente). Se questi accetta ciascuno prende la propria parte, E-X il primo, X il secondo. Se questi rifiuta non prende niente nessuno dei due.

(E-X,X) (0,0)

Unico equilibrio di Nash:X > 0 più piccolo possibile

Le evidenze sperimentali sono molto diverse: il proponente offre tra il 30% e il 40% della somma totale, il 50% dei riceventi rifiutano se l’offerta è minore del 20% di E

Dictator Game (o di puro altruismo)Il proponente ha la possibilità (non l’obbligo) di donare una parte al ricevente, senza avere ritorsioni. Le evidenze sperimentali mostrano che X è tra il 10% e il 25% se i due giocatori si conoscono.Invece in caso di doppio anonimato il 70% circa non lascia nulla e il rimanente tra il 10% e il 20%

Behavioral economics (Economia comportamentale)

Asta da un dollaro

Si tratta della tipica situazione in cui il vincitore paga un prezzo sproporzionato rispetto al premio che ottiene, lo sconfitto paga un alto prezzo per una battaglia che non frutta nulla.

Morale: era meglio non iniziare

Si mettono all’asta 100 euro, partendo da un’offerta iniziale di 1 € .Chi offre di più si aggiudica i 100 euro, ma anche chi fa la seconda offerta paga, senza però vincere nulla.

…proviamo…all’inizio sembra una buona opportunità…ai 50 euro ci si rende conto che il banditore ha fatto un affare …ai 99 euro si vorrebbe smettere ma…conviene offrire 100 e poi 101… se non vogliamo perdere tutto…aste realmente effettuare sono arrivate a 300-350 euro, con un guadagno del 700% da parte del banditore !!!

Harsanyi Nash Selten

Premio Nobel, 1994 "for their pioneering analysis of equilibria in the theory of non-cooperative games"

Aumann Schelling

Premio Nobel, 2005 "for having enhanced our understanding of conflict and cooperation through game-theory analysis"

Premio Nobel Economia, 2007 "for having laid the foundations of mechanism design theory"

Hurwicz Maskin Myerson

Nobel 2012 “per le loro ricerche sulla teoria dei giochi applicata al funzionamento dei mercati.

Shapley Roth

Alcune letture

Roberto Lucchetti “Scacchi e scimpanzé” Bruno Mondadori 2012

Pierluigi Argoneto “I Radiohead, l’arcobaleno e il piede sinistro di Dio”, Armando Editore 2009

Roberto Lucchetti “Passione per Trilli” Springer Italia 2007

Fioravante Patrone “Decisori (razionali) interagenti”, Plus edizioni 2006

Tom Siegfried “E’ la matematica, bellezza!”, Bollati Boringhieri 2006

Documents

Modellizzare le decisioni razionali con la teoria dei giochi. Gian Italo Bischi DESP - Dipartimento di Economia, Società e Politica Università di Urbino