Učenje i viši kognitivni procesi 3. Odlučivanje, II deo

UČENJE I VIŠI KOGNITIVNI PROCESI Prolećni semestar 2013. Predavač: Goran S. Milovanović

Predavanje 2 ODLUČIVANJE – Deo II

Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 2

Problem odlučivanja u uslovima rizika

• Večeras ima odličan koncert, ali i dobra pozorišna predstava.

• {KONCERT, POZORIŠTE} – skup odlučivanja, dva ishoda.

• Preferencije? Ostavljam to Vama... • Ipak: ili KONCERT ≽ POZORIŠTE, ili POZORIŠTE ≽ KONCERT!

(razmislite zašto ovo tražim od vas)

• Verovatnoća

• Šanse da nabavimo karte za KONCERT su ¼ • Šanse da nabavimo karte za POZORIŠTE su ¾

• Šta ćemo da radimo? problem odlučivanja u uslovima rizika

Repetitorijum


Odlučivanje u uslovima rizika

• Šanse da nabavimo karte za KONCERT su ¼ • Šanse da nabavimo karte za POZORIŠTE su ¾

• Ako krenemo na koncert i nema karata propalo veče, predstava već počela. • Vice versa, ako krenemo u pozorište i ne nađemo karte...

• Naša situacija odlučivanja je zapravo ovakva:

¼ Koncert

¾ Ništa

¾ Pozorište

¼ Ništa

?

Repetitorijum


Bernulijeva hipoteza očekivane korisnosti

Danijel Bernuli

∑ ⋅=i

ii xxpLE )()(Očekivana vrednost

∑ ⋅=i

ii xuxpLU )()()(

Očekivana korisnost

Repetitorijum


Bernulijeva hipoteza očekivane korisnosti: 1738.

Uvođenjem konkavne funkcije korisnosti... 1. objašnjava opadajuću marginalnu vrednost novca, 2. objašnjava averziju prema riziku, 3. rešava Petrovgradski paradoks.

Danijel Bernuli

∑ ⋅=i

ii xuxpLU )()()(


0

1

2

3

4

5

6

7

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Koris

nost

Vrednost

Averzija

Repetitorijum


Stepena funkcija korisnosti i stavovi prema riziku

0

5

10

15

20

25

30

35

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Koris

nost

Vrednost

Sklonost

0

2

4

6

8

10

12

14

16

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Koris

nost

Vrednost

Neutralnost

Funkcije korisnosti koje opisuju averziju, neutralnost i sklonost prema riziku. Slika prikazuje tri stepene funkcije korisnost iz familije oblika u(x) = xρ: • konkavnu (averzija prema riziku, puna linija) sa

vrednošću eksponenta ρ < 1, • konveksnu (sklonost ka riziku, isprekidana linija)

sa vrednošću eksponenta ρ > 1, • i linearnu (neutralnost prema riziku, tačkasta

linija) sa vrednošću eksponenta ρ = 1.

u(x) = xρ

0

1

2

3

4

5

6

7

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Koris

nost

Vrednost

Averzija

Repetitorijum


Teorija racionalnog izbora: aksiomatizacija

Džon fon Nojman (desno) i Oskar Morgenštern (levo).

Repetitorijum


Paradoksi teorije racionalnog izbora (A4) Nezavisnost. Za sve p, q, r i bilo koji broj α koji leži između 0 i 1: p ≽ q ako i samo ako α∙p + (1- α) ∙r ≽ α∙q + (1- α) ∙r. Ukoliko neka osoba više voli jabuke od breskvi, a nađe se u situaciji izbora u uslovima rizika gde joj se nude opcije (i) dobitka jabuke sa verovatnoćom α i kruške sa verovatnoćom 1- α, ili (ii) breskve sa verovatnoćom α i kruške sa verovatnoćom 1- α, ta osoba će uvek preferirati opciju (i) nad opcijom (ii), jer se one razlikuju samo po tome da se sa istom verovatnoćom α osvoji jabuka ili breskva. Rezon: pošto je već ustanovljeno da ta osoba ima preferenciju jabuke ≻ breskve, dodavanje jednoj i drugoj opciji podjednako verovatne mogućnosti osvajanja kruške ne sme da utiče na ovu početnu preferenciju.


Paradoksi teorije racionalnog izbora: Aleov paradoks

Opcija A: sa sigurnošću (100%) dobitak od 100 miliona dolara. Opcija B: sa 89% dobitak od 100 milion dolara, sa 10% dobitak od 500 miliona dolara, i sa 1% ništa (0 dolara). Izaberite sada između opcija A1 i B1:

Opcija A1: sa 89% ništa (0 dolara) i sa 11% dobitak od 100 miliona dolara Opcija B1: sa 90% ništa (0 dolara) i sa 10% dobitak od 500 miliona dolara A (sigurni dobitak od 100 miliona dolara) je dominantan izbor između A i B, dok je B1 (90% ništa i 10% dobitak od 500 miliona dolara) dominantan izbor između A1 i B1.


Paradoksi teorije racionalnog izbora: Aleov paradoks

Moris Ale

1% 10% 89%

A 100M $ 100M $ 100M $

B 0 500M $ 100M $

A1 100M$ 100M$ 0

B1 0 500M $ 0


Paradoksi teorije racionalnog izbora: paradoks zajedničke proporcije

Izaberite između A i B: Opcija A: 6000 dolara sa verovatnoćom .45, u suprotnom ništa. Opcija B: 3000 dolara sa verovatnoćom .90, u suprotnom ništa. Izaberite sada između A1 i B1: Opcija A1: 6000 dolara sa verovatnoćom .001, u suprotnom ništa. Opcija B1: 3000 dolara sa verovatnoćom .002, u suprotnom ništa. U prvom slučaju, većina ispitanika bira opciju B, koja nosi veću verovatnoću dobitka, dok u drugom slučaju, većina ispitanika bira opciju A1, koja nosi višu vrednost.



Izaberite između A i B: Opcija A: 4000 dolara sa verovatnoćom .80, ništa sa verovatnoćom .20. Opcija B. Sigurnih 3000 dolara. Izaberite sada između A1 i B1: Opcija A1: 4000 dolara sa verovatnoćom .20, ništa sa verovatnoćom .80. Opcija B1. 3000 dolara sa verovatnoćom .25, ništa sa verovatnoćom .75. Većina ispitanika u ovakvom zadatku bira opciju B u prvom slučaju i opciju A1 u drugom slučaju.



Opcija A: 4000 dolara sa verovatnoćom .80, ništa sa verovatnoćom .20. Opcija B. Sigurnih 3000 dolara. Opcija A1: 4000 dolara sa verovatnoćom .20, ništa sa verovatnoćom .80. Opcija B1. 3000 dolara sa verovatnoćom .25, ništa sa verovatnoćom .75.


Subjektivni tretman verovatnoća

Vrednost od 3000$ u džepu deluje kao bolji izbor od neizvesnih 4000$, čak i sa visokom verovatnoćom osvajanja od 80%, iz čega sledi da je skok u šansama za osvajanje ishoda sa 80% na sigurnih 100% na neki način veoma uticajan. Slično, takođe se pokazuje empirijski, kao psihološki uticajan otkriva se skok u verovatnoći sa 0 na neku nisku verovatnoću, npr. 10% ili 20%. U takvim slučajevima, psihološki je značajan prelaz iz nemogućnosti u mogućnost: nešto što uopšte nije moglo da se ostvari (verovatnoća nula) je postalo moguće (makar i sa nekom malom verovatnoćom).



Opcija A: 6000 dolara sa verovatnoćom .45, u suprotnom ništa. Opcija B: 3000 dolara sa verovatnoćom .90, u suprotnom ništa. Opcija A1: 6000 dolara sa verovatnoćom .001, u suprotnom ništa. Opcija B1: 3000 dolara sa verovatnoćom .002, u suprotnom ništa.

p(3000) : p(6000) = ½ Da li je odnos subjektivnih verovatnoća uvek ½? Nemoguće. Uvek bi svi birali 3000$.



Neka neki donosila odluka prvo evaluira loz koji sa 5% donosi 100 evra, i sa 95% ne donosi ništa – i pokazuje sklonost ka riziku. Prepostavimo sada da isti donosilac odluka evaluira loz koji sa 95% donosi 100 evra, i sa 5% ništa - i pokazuje averziju prema riziku. Ako donosilac odluka u obe situacije ima istu funkciju korisnosti – što je standardna pretpostavka teorije odlučivanja – kako objašnjavamo činjenicu da je on sklon ka riziku u oceni prvog loza, i averzivan prema riziku u oceni drugog loza?

Poznat empirijski nalaz: četvoročlana struktura stavova prema riziku za niske verovatnoće p dobitka x: sklonost ka riziku za umerene i visoke verovatnoće p dobitka x: averzija prema riziku za niske verovatnoće p gubitka x: averzija prema riziku za umerene i visoke verovatnoće p gubitka x: sklonost ka riziku.



5% donosi 100 evra, i sa 95% ne donosi ništa –pokazuje sklonost ka riziku. 95% donosi 100 evra, i sa 5% ništa - pokazuje averziju prema riziku. Ako donosilac odluka u obe situacije ima istu funkciju korisnosti – što je standardna pretpostavka teorije odlučivanja – kako objašnjavamo činjenicu da je on sklon ka riziku u oceni prvog loza, i averzivan prema riziku u oceni drugog loza?

Ako donosilac odluka tretira p = .05 u prvom lozu kao nešto višu nego što jeste... ako donosilac odluka tretira p = .95 u drugom lozu kao nešto nižu nego što jeste... ...ovaj empirijski nalaz može da se objasni.

Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 18-1


0 1

1

Objektivna P

Subjektivna P



0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Objektivna verovatnoca

Pon

deris

ana

(opa

zena

) ver

ovat

noca

Funkcija ponderisanja verovatnoca za teoriju izgleda

potcenjivanje većih verovatnoća

precenjivanje manjih verovatnoća

izvesnost

nemogućnost


Različit tretman dobitaka i gubitaka: efekat refleksije

Plan A: primena plana A sigurno spašava život 200 ljudi. Plan B: primena plana B garantuje sa verovatnoćom od 1/3 da će preživeti svih 600 ljudi i sa verovatnoćom od 2/3 da neće preživeti niko.

Plan C: primena plana C dovodi do sigurnog gubitka 400 života. Plan D: primena plana D garantuje sa verovatnoćom od 1/3 da niko neće umreti i sa verovatnoćom od 2/3 da će svih 600 ljudi umreti.

U nekoj zemlji izbila je epidemija nepoznate azijske bolesti. Pred nadležnim organima se nalaze plan A i plan B (plan C i plan D). Koji od planova biste izabrali da sprovedete (Tversky & Kahneman, 1987)?

Ispitanici koji biraju između A i B većinski biraju plan A, čime otkrivaju averziju prema riziku. Ispitanici koji biraju između planova C i D većinski biraju plan D, čime otkrivaju sklonost ka riziku. Jedina razlika između planova A i B, s jedne, i C i D, s druge strane, je ta što su planovi C i D formulisani u terminima gubitaka, dok su planovi A i B formulisani u terminima dobitaka. Ovakavi efekti se nazivaju efektima okvira ili formulacije (engl. framing effects).


Različit tretman dobitaka i gubitaka: efekat refleksije

-100 -80 -60 -40 -20 0 20 40 60 80 100-100

-80

-60

-40

-20

0

20

40

60

80

100

Value (Vrednost)

Util

ity (K

oris

nost

)

Funkcija korisnosti koja je konkavna za dobitke i konveksna za gubitke.

Ako držite ρ u funkciji u(x) = xρ između 0 i 1, dobijete ovakvu funkciju.

Averzija prema riziku za dobitke, sklonost ka riziku za gubitke? To možemo da sredimo:


Različit tretman dobitaka i gubitaka: averzija prema gubicima

50% a 50% b 50% c 50% d λ

1 0 0 -25 61 2.44

2 0 0 -50 101 2.02

3 0 0 -100 202 2.02

4 0 0 -150 280 1.87

(prema Tversky & Kahneman, 1992)



Kahneman, Knetch & Thaler, 1991.

I grupa Imaš šolju: po kojoj ceni bi je prodao?

II grupa Nemaš šolju: koliko bi je platio?

7$ 12 centi 2$ 87 centi



Kahneman & Tversky, 1984.

Bacimo dukat, izađe glava: Bacimo dukat, izađe pismo:

Dobiješ 10$ Izgubiš 10$ NE!

Dobiješ 20$ ? NE!



-120 -100 -80 -60 -40 -20 0 20 40 60

-120

-100

-80

-60

-40

-20

0

20

40

60Value Function

Value (Vrednost)

Util

ity (K

oris

nost

)

Funkcija vrednosti:

u(x) =

u(x) = xρ, dobici

u(x) = λxρ, gubici

λ

x

2x


Teorija izgleda (Kahneman & Tversky, 1979, Tversky & Kahneman, 1992)

Daniel Kahneman (desno) i Amos Tversky (levo).

∑ ⋅=i

ii xxpLE )()(

Očekivana vrednost

∑ ⋅=i

ii xuxpLU )()()(


∑ ⋅=i

ii xupwLV )()()(

Teorija izgleda

∑ ⋅⋅=i

ii xupwLV )()()( λ

u(x) =

u(x) = xρ, dobici

u(x) = λxρ, gubici


Teorija izgleda (Kahneman & Tversky, 1979, Tversky & Kahneman, 1992)

Daniel Kahneman, 2002.

Amos Tversky, 1937-1996.

„... for having integrated insights from psychological research into economic science, especially concerning human judgment and decision-making under uncertainty."

Education

Učenje i viši kognitivni procesi 3. Odlučivanje, II deo