Teoria dei giochi

Preview:

DESCRIPTION

Teoria dei giochi. Teoria che analizza in modo formale l’interazione strategica di soggetti razionali che agiscono in modo strategico. Situazione strategica Dieci persone si recano insieme al ristorante Si paga alla romana  semplice problema di scelta (Max U s.t. VdB) - PowerPoint PPT Presentation

Citation preview

Teoria dei giochiTeoria che analizza in modo formale l’interazione strategica di soggetti razionali che agiscono in modo strategicoSituazione strategica

Dieci persone si recano insieme al ristorantea) Si paga alla romana semplice problema di scelta (Max U s.t. VdB) Ciascuno è in grado di controllare autonomamente il risultato delle sue scelte b) Si paga dividendo il conto per 10 problema strategico

Non riesco a controllare la mia spesa Il risultato delle mie azioni dipende anche dalle scelte degli altri

Gioco

insieme astratto di regole

che vincolano il comportamento dei giocatori

definiscono i risultati sulla base delle azioni che essi intraprendono

Il gioco è le regole

In un gioco vi sono tre elementi caratteristici

1)I giocatori (A,B,C…)

2)Le strategie a loro disposizione Per ogni giocatore le regole stabiliscono un insieme di strategie (SA,SB,SC….)Le mosse che le regole rendono possibili (si Si)

3) I Payoffs associati agli esiti finali del giocoi (sA,sB,sC….)

Rappresentazione di un gioco

• Forma normale: matrice delle vincite

• Forma estesa: albero del gioco

Forma Normale• Uso di matrice a doppia entrata • Le righe rappresentano le mosse che

può compiere il giocatore di riga• Le colonne rappresentano le mosse che

può compiere il giocatore di colonna• In ogni cella sono rappresentate le vincite

che i due giocatori (di riga e di colonna) ottengono attuando le mosse raffigurate nelle corrispondenti righe e colonne

Esempio

GiocatoriB

A

Sinistra Destra

Alto 1 , 2 0 , 1Basso 2 , 1 1, 0

Strategie B

Strategie A

Uno dei 4 esiti del gioco

Payoff A Payoff B

Forma estesa• Albero del gioco: descrive le regole

e i possibili premi di un gioco• Nodo: punto decisionale dov’è

indicata l’identità del giocatore cui spetta la mossa

• Rami: rappresentano le scelte fatte nei nodi

A

BB

Dx

NonSxDx Dx

Sx

Sx

2 , 3 1 , 2 2 , 0 0 , 1

Forma estesaRami Nodi

Uno dei 4 esiti del gioco

Payoff A Payoff B

Ipotesi sul comportamento dei giocatori

Razionalità - Sono interessati a massimizzare il payoff materiale

individuale- Sono “calcolatori” perfetti - Tutti conoscono la razionalità degli altri e si

aspettano che gli altri si comportino in modo razionale

Classificazione dei giochiCooperativi i giocatori possono assumere

degli impegni che hanno valore VINCOLANTE

NON Cooperativi i giocatori NON possono assumere degli impegni che hanno valore VINCOLANTE

Informazione completa

Informazione incompleta

Tutte le informazioni del gioco sono note a tutti i giocatori

NON tutte le informazioni del gioco sono note a tutti i

giocatori

Classificazione dei giochiGiochi a somma

zero il guadagno di un giocatore

CORRISPONDE sempre alla perdita di un altro giocatoreGiochi NON a somma

zero La somma delle vincite (o delle perdite) dei giocatori NON È

COSTANTE

Giochi statici

Giochi one-shot

I giocatori fanno le loro mosse SIMULTANEAMENTE

Vengono giocati UNA SOLA volta

Giochi dinamiciI giocatori fanno le loro mosse SEQUENZIALMENTE

Vengono giocati PIÙ VOLTE fra gli stessi giocatori

Giochi ripetuti

Soluzione dei giochi

Equilibrio per un gioco: situazione in cui nessun giocatore desidera modificare il suo comportamento unilateralmente dato il comportamento degli altri giocatori

Equilibrio di Nash

L’equilibrio di Nash si definisce strategicamente stabile o autovincolante perché nessun giocatore, singolarmente preso, desidera deviare dalla propria strategia di equilibrio ferme restando le strategie adottate dagli altri giocatori

Un insieme di strategie, una per ogni giocatore, tale che la strategia di ogni giocatore sia la migliore per lui, quando anche gli altri giocatori giochino la loro strategia di equilibrio

Equilibrio di NashDiremo che un vettore n dimensionale (n è il numero dei

giocatori) )s.....,s,s(s *

n*2

*1

* È un equilibrio di Nash se e solo

se )s,..,s,...s,s()s,..,s,...s,s( *ni

*2

*1i

*n

*i

*2

*1i

E questo sia vero per ogni i (per ogni giocatore) e per ogni

ii*ii Ss e ss

Payoff che ottiene il giocatore i-esimo quando sceglie di

deviare dalla strategia di Nash giocando una strategia diversa

e tutti gli altri continuino a giocare la strategia di Nash

Payoff che ottiene il giocatore i-esimo quando egli gioca la strategia di Nash e quando

tutti gli altri giocano la strategia di Nash

B

b1 b2 b3

a1 0,3 2,2 1,3

A a2 2,1 3,2 2,3

a3 5,1 1,4 1,0

Equilibrio di NashLa strategia (a2,b3) è un equilibrio di Nash perché né A né B hanno l’incentivo a cambiare strategia data la scelta dell’altro giocatore

Se A cambiasse otterrebbe 1 giocando a1 e 1 giocando a3

Se B cambiasse otterrebbe 1 giocando b1 e 2 giocando b2

B

b1 b2 b3

a1 0,3 2,2 1,3

A a2 2,1 3,2 2,3

a3 5,1 1,4 1,0

Equilibrio di NashLa strategia (a2,b3) è un equilibrio di Nash perché né A né B hanno l’incentivo a cambiare strategia data la scelta dell’altro giocatore

L’equilibrio non produce né per A né per B necessariamente il payoff più alto

A preferirebbe il 5 di (a3,b1)

ma allora A si sposterebbe in a2

infine B si sposterebbe in b3da qui NON ci si muove più

ma (a3,b1) non è un equilibrio perché B cambierebbe la sua scelta in b2

Equilibrio di Nash

)s,..,s,...s,s()s,..,s,...s,s( *ni

*2

*1i

*n

*i

*2

*1i

Il giocatore i-esimo, cosi come tutti gli altri, non può ottenere un payoff superiore giocando una strategia diversa se gli altri continuano a giocare la strategia

di Nash

Nessun giocatore ha l’incentivo a cambiare le sue scelte se gli altri non lo

fanno

Equilibrio di Nash)s,..,s,...s,s()s,..,s,...s,s( *

ni*2

*1i

*n

*i

*2

*1i

*is

ii*ni

*2

*1i

sSs s.t. )s,..,s,...s,s(Max

i

è la soluzione del problema

*is Può essere vista come la ottima risposta del

giocatore i-esimo alle mosse degli altri giocatori Possiamo definire una risposta ottima per ogni strategia

degli altri giocatori costruendo una funzione di risposta ottima

BRF funzione di risposta ottimaL’equilibrio di Nash sarà caratterizzato dal fatto che per

tutti i giocatori è una risposta ottima alle scelte degli altri

Come si trova l’equilibrio di Nash

strategia che risulta migliore (garantisce più alti payoffs) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori

Strategia DOMINANTE

Strategia DOMINATAstrategia che risulta inferiore (garantisce più bassi payoffs) per un giocatore indipendentemente dalle strategie adottate dagli altri giocatori

Se esiste una strategia dominante un giocatore razionale giocherà QUELLASe esiste una strategia dominata un giocatore razionale non la giocherà MAI

B

B1 b2 B3

a1 0,3 2,2 1,3

A a2 2,1 3,2 2,3

a3 5,1 1,4 1,0

Esempio: prendiamo i due giochi che seguono

B

B1 b2 B3

a1 1,3 2,4 1,3

A a2 2,1 3,2 1,1

a3 5,1 4,4 2,0

Strategia Dominata

Strategia Dominante

B

B1 b2 B3

a1 0,3 2,2 1,3

A a2 2,1 3,2 2,3

a3 5,1 1,4 1,0

Eq. di Nash.

Come si trova l’equilibrio di Nash

Eliminazione iterata delle strategie dominateVengono eliminate via le strategie dominate finche non si ottiene l’equilibrio

di Nash

ESEMPIO

Equilibrio di Nash verifica

1)b,a(2)b,a( 31A32A

1)b,a(2)b,a( 33A32A

1)b,a(3)b,a( 12B32B

2)b,a(3)b,a( 22B32B

Strategia di Nash Possibile mossa alternativa

BB1 b2 B3

a1 0,3 4,2 1,3A a2 2,1 3,2 2,3

a3 5,1 1,4 1,0

Problema non sempre è possibile trovare la soluzione di Nash utilizzando tale procedura

Consideriamo lo stesso gioco di prima con la sola

differenza rappresentata dal payoff del giocatore A nella

in (a1,b2)

Ora non ci sono né strategie dominate né strategie dominantiPer trovare la soluzione occorre utilizzare la funzione

di risposta ottima (BRF)risposta ottima La migliore strategia che un giocatore può

effettuare DATA la strategia scelta dagli ALTRI GIOCATORI

Funzione di risposta ottima L’insieme delle risposte ottime di un giocatore

Bb1 b2 b3

a1 0,3 4,2 1,3A a2 2,1 3,2 2,3

a3 5,1 1,4 1,0

Trovare l’ E.d.N. utilizzando la BRF

Se il giocatore B sceglie b1 la migliore risposta di A è a3Se il giocatore B sceglie b2 la migliore risposta di A è

a1Se il giocatore B sceglie b3 la migliore risposta di A è a2

Se il giocatore A sceglie a3 la migliore risposta di B è b2

Se il giocatore A sceglie a1 la migliore risposta di B è b1 o b3Se il giocatore A sceglie a2 la migliore risposta di B è b3

E.d.N deve essere la coppia di

strategie che è la risposta ottima di

entrambi i giocatori

Limiti della definizione di equilibrio di Nash

Gioco del calcio di rigore

e cerchiamo l’equilibrio con il metodo della risposta ottima

E’ evidente che non esiste un equilibrio di Nash per questo gioco

P

dx cx sx

dx 0,2 2,0 2,0

A cx 2,0 0,2 2,0

sx 2,0 2,0 0,2

Strategie miste: strategie che definiscono combinazioni probabilistiche di tutte le possibile strategie pure del giocoIl giocatore non sceglie direttamente una mossa (ad esempio, sx) ma la probabilità con la quale adotterà ciascuna mossa

Valore atteso strategia mista: media ponderata dei premi che il giocatore si aspetta di ricevere, ove i pesi sono le probabilità. del verificarsi di tali vincite

L’equilibrio di Nash può non esistere in strategie pure

Tuttavia se allarghiamo la definizione di strategie per considerare le strategie miste

Si può dimostrare che se consideriamo le strategie miste esiste sempre un equilibrio di Nash

Limiti della definizione di equilibrio di Nash

Lei

Opera Stadio

LuiOpera 1 , 2 0 , 0

Stadio 0 , 0 2 , 1

Consideriamo questo gioco classico

La guerra dei sessi

Esiste una molteplicità

(due) di equilibri di

Nash

Quale selezionare ?

Limiti della definizione di equilibrio di NashMolteplicità equilibri di Nash

S

P F

DP -2, -2 2 , 0F 0 , 2 0 , 0

Nino

c b

Lucac 3 , 3 0 , 0b 0 , 0 1 , 1

Prendiamo due altri esempi di gioco

Gioco dell’incrocioDue auto (S e B) arrivano

contemporaneamente all’incrocioPossono Fermarsi o Passare

Gioco dell “appuntamento”

Due amici (Nino e Luca) devono andare al cinema ma si non si

sono accordati su dove incontrarsi

Davanti al cinema o al bar del Paese

Qual è la differenza fra questi due giochi?

Abbiamo visto che l’individuo ordina i panieri alternativi secondo le sue preferenze e scegli il paniere che massimizza

il suo benessere dati i vincoli cui è soggetto

Come possiamo confrontare allocazioni che coinvolgano più di un soggetto

Problema L’utilità non è misurabileNon possiamo semplicemente sommare la soddisfazione individuale

Criterio Paretiano (da W. Pareto)

Esiste un punto di vista sociale per valutare le allocazioni? Ci sono o no criteri che ci

consentano di direse l’allocazione A è superiore all’allocazione B,

oppure se è vero il contrario?Allocazione = distribuzione di beni, benessere o quant’altro fra più soggetti

Criterio Paretiano

Il “criterio di Pareto ” afferma quanto segue:

Criterio Paretiano

Un’allocazione A è superiore a un’altra allocazione B,

se almeno un soggetto preferisce A a B e nessuno preferisce B ad A (e viceversa).

Un’allocazione A è superiore a un’altra allocazione B, se in A tutti stanno altrettanto

bene che in B e almeno uno sta meglio in A che in B

oppure

Non tutte le allocazioni sono Pareto Ordinabili

A = (10, 3, 7)B = (10, 2, 7)C = (9, 5, 16)

Un'allocazione è efficiente (ottima) nel senso di Pareto se non ne esiste un'altra che sia migliore sulla base del principio di Pareto; cioè, se non è possibile migliorare il benessere di qualcuno senza peggiorare quello di qualcun altro

Criterio Paretiano (da W. Pareto)

Molteplicità equilibri di Nash

Nel caso del gioco dell’incrocio (e nella guerra dei sessi) gli equilibri di Nash non sono Pareto

OrdinabiliNel caso del gioco dell’appuntamento gli equilibri di Nash sono Pareto Ordinabili

2,0 e 0,2

1, 1 e 3, 3

Nel caso giochi ripetuti ed equilibri Pareto ordinabili allora vi sarà un endogeno coordinamento verso la soluzione Pareto Superiore

Gioco in cui un numero fisso di giocatori effettua ripetutamente lo stesso gioco l’uno contro l’altro

I giocatori scelgono le loro mosse sulla base delle azioni compiute dalle rivali nei periodi precedenti

Le strategie ed i comportamenti sono più complessi ma anche più realistici che nei giochi uniperiodali

Folk Theorem

Gioco

Ripetuto

In caso la questo ripetizione del gioco può far scomparire la molteplicità

La differenza è importante quando si considerano giochi ripetuti

Molteplicità equilibri di Nash: giochi sequenziali

Auto A

Auto B Auto B

F P

F FP P

0 , 0 0 , 2 2 , 0 -2 , -2

Consideriamo il gioco dell’incrocio, immaginando che l’auto A si presenti per prima all’incrocio

Il gioco non è più simultaneo ma sequenziale, l’auto A effettuerà la prima mossa e successivamente muoverà

l’auto B

La rappresentazione del gioco a forma estesa è

preferibile

Giochi sequenziali in forma estesa: induzione a ritroso

Auto A

Auto B Auto B

F P

F FP P

0 , 0 0 , 2 2 , 0 -2 , -2

Induzione a ritroso Si parte dai nodi finali del gioco e si analizzano le scelte dei

giocatori fino a risalire all’inizio del gioco

B sceglierà P che gli da 2 al

posto di 0A lo sa e sa che se sceglierà F

prenderà 0

B sceglierà F che gli da 0 al posto di -2

A lo sa e sa che se sceglierà P prenderà 2

A sceglierà P che gli garantisce 2

mentre se scegliesse F

avrebbe 0

Minacce non credibili

Pierino

1

2 M & P

Zia Cinema

Punire Non punire

1 1

-1 -1

2 0

Gioco del bambino capriccioso

A

BB

S D

S SD

2 , 5

1 , 0 2 , 1 2 , 1 3 , 3

1 , 2

A A

D

D

DSS

3,32, 1

3,32, 5

Induzione all’indietro e perfezione nei sottogiochi

Sottogioco

Molteplicità equilibri di Nash: meccanismi istituzionali

Quando non esistono altri sistemi per eliminare la molteplicità degli equilibri possono intervenire dei

meccanismi istituzionali che regolamentano il comportamento individuale e risolvono l’ambiguità

Esempio classico il semaforo nel gioco dell’incrocio

Risolvere questo tipo di ambiguità è una delle spiegazioni della nascita delle istituzioni

Dilemma del prigioniero• Due criminali che hanno commesso in complicità un grave

delitto e sono detenuti in celle separate (non possono comunicare).

• Ci sono le prove solo per accusarli di un delitto minore la cui pena è 1 anno di reclusione

• Ogni prigioniero può confessare il delitto grave o tacere.• Se confessa uscirà subito di prigione, mentre il complice

avrà una pena di 20 anni di reclusione.• Se entrambi confessano saranno condannati ad una pena

intermedia di 5 anni.• Se nessuno dei 2 confessa la pena sarà di 1 anno.

O.P

Nash

B

Confessa Tace

BConfessa 5 , 5 0 , 20

Tace 20 , 0 1 , 1

Dilemma del prigioniero

L’EQUILIBRIO DI NASH È SOTT'OTTIMALE (in senso Paretiano) rispetto ad un altro esito del gioco che

sarebbe preferito da entrambi i giocatori ma che non è ottenibile

Risultato paradossale

Un comportamento

teso a massimizzare il

benessere individuale produce un

risultato non ottimo da un punto di vista

individuale

R

T A

BT 3, 3 0 , 4A 4, 0 1 , 1

Pampers

NF FP

LinesNF 500,500 150,750

FP 750,150 250,250

Prendiamo due altri esempi di gioco

Gioco del trafficoDue soggetti (sig. Rossi e sig. Bianchi) devono decidere se

prendere l’auto o il tram

Gioco della PubblicitàDue imprese devono decidere

quanto investimento pubblicitario effettuare il prossimo anno

Dilemma del prigioniero framework generale

Sotto-ottimalità dell’equilibrio di Nashpossibili soluzioni

Meccanismi istituzionali

Mafia, malavita organizzata dilemma del prigioniero

Blocco del traffico gioco del traffico

Modificano dall’esterno la struttura degli incentivi

Meccanismi endogeni

accordo fra i giocatori

Non sono credibili perché in assenza di meccanismi istituzionali esterni qualsiasi accordo fra le parti non

sarebbe rispettato

Dilemma del prigioniero e giochi ripetuti

Ma nella realtà il gioco è spesso ripetuto

Possono emergere dei meccanismi endogeni di punizione di comportamenti devianti

Prendiamo il gioco della pubblicità

Immaginiamo un accordo (esplicito o tacito) per non

fare pubblicità

Se una delle due aziende violasse l’accordo di non fare

pubblicità l’altra farebbe pubblicità per sempre

All’inizio di ogni periodo le due imprese devono decidere se violare o meno l’accordo

Meccanismo punitivo

Dilemma del prigioniero e giochi ripetuti

.....)r1(

250r1

250750)FP( 2

.....)r1(

500r1

500500)NF( 2

Se si viola l’accordo

Se non si viola

l’accordo

dr1

1

Ponendo e notando che sono serie convergenti

d1d250750)FP(

d1500)NF(

Si ottiene

Dilemma del prigioniero e giochi ripetuti

750

500

250

π

tempo1 2 3 4

Vantaggio immediato Perdita

futura

Dilemma del prigioniero e giochi ripetuti

1r se o 5.0d se )FP()NF(

Se i giocatori sono sufficientemente pazienti (attribuiscono un peso adeguato ai guadagni futuri)

Il risultato pareto ottimale può essere raggiunto

Reputazione -- Credibilità

Nota Il gioco deve durare

all’infinito o avere una durata finita ma incerta

Recommended