Upload
goran-milovanovic
View
344
Download
11
Embed Size (px)
DESCRIPTION
Učenje i viši kognitivni procesi 3. Odlučivanje, II deo
Citation preview
UČENJE I VIŠI KOGNITIVNI PROCESI Prolećni semestar 2013. Predavač: Goran S. Milovanović
Predavanje 2 ODLUČIVANJE – Deo II
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 2
Problem odlučivanja u uslovima rizika
• Večeras ima odličan koncert, ali i dobra pozorišna predstava.
• {KONCERT, POZORIŠTE} – skup odlučivanja, dva ishoda.
• Preferencije? Ostavljam to Vama... • Ipak: ili KONCERT ≽ POZORIŠTE, ili POZORIŠTE ≽ KONCERT!
(razmislite zašto ovo tražim od vas)
• Verovatnoća
• Šanse da nabavimo karte za KONCERT su ¼ • Šanse da nabavimo karte za POZORIŠTE su ¾
• Šta ćemo da radimo? problem odlučivanja u uslovima rizika
Repetitorijum
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 3
Odlučivanje u uslovima rizika
• Šanse da nabavimo karte za KONCERT su ¼ • Šanse da nabavimo karte za POZORIŠTE su ¾
• Ako krenemo na koncert i nema karata propalo veče, predstava već počela. • Vice versa, ako krenemo u pozorište i ne nađemo karte...
• Naša situacija odlučivanja je zapravo ovakva:
¼ Koncert
¾ Ništa
¾ Pozorište
¼ Ništa
?
Repetitorijum
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 4
Bernulijeva hipoteza očekivane korisnosti
Danijel Bernuli
∑ ⋅=i
ii xxpLE )()(Očekivana vrednost
∑ ⋅=i
ii xuxpLU )()()(
Očekivana korisnost
Repetitorijum
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 5
Bernulijeva hipoteza očekivane korisnosti: 1738.
Uvođenjem konkavne funkcije korisnosti... 1. objašnjava opadajuću marginalnu vrednost novca, 2. objašnjava averziju prema riziku, 3. rešava Petrovgradski paradoks.
Danijel Bernuli
∑ ⋅=i
ii xuxpLU )()()(
Očekivana korisnost
0
1
2
3
4
5
6
7
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Koris
nost
Vrednost
Averzija
Repetitorijum
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 6
Stepena funkcija korisnosti i stavovi prema riziku
0
5
10
15
20
25
30
35
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Koris
nost
Vrednost
Sklonost
0
2
4
6
8
10
12
14
16
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Koris
nost
Vrednost
Neutralnost
Funkcije korisnosti koje opisuju averziju, neutralnost i sklonost prema riziku. Slika prikazuje tri stepene funkcije korisnost iz familije oblika u(x) = xρ: • konkavnu (averzija prema riziku, puna linija) sa
vrednošću eksponenta ρ < 1, • konveksnu (sklonost ka riziku, isprekidana linija)
sa vrednošću eksponenta ρ > 1, • i linearnu (neutralnost prema riziku, tačkasta
linija) sa vrednošću eksponenta ρ = 1.
u(x) = xρ
0
1
2
3
4
5
6
7
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Koris
nost
Vrednost
Averzija
Repetitorijum
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 7
Teorija racionalnog izbora: aksiomatizacija
Džon fon Nojman (desno) i Oskar Morgenštern (levo).
Repetitorijum
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 8
Paradoksi teorije racionalnog izbora (A4) Nezavisnost. Za sve p, q, r i bilo koji broj α koji leži između 0 i 1: p ≽ q ako i samo ako α∙p + (1- α) ∙r ≽ α∙q + (1- α) ∙r. Ukoliko neka osoba više voli jabuke od breskvi, a nađe se u situaciji izbora u uslovima rizika gde joj se nude opcije (i) dobitka jabuke sa verovatnoćom α i kruške sa verovatnoćom 1- α, ili (ii) breskve sa verovatnoćom α i kruške sa verovatnoćom 1- α, ta osoba će uvek preferirati opciju (i) nad opcijom (ii), jer se one razlikuju samo po tome da se sa istom verovatnoćom α osvoji jabuka ili breskva. Rezon: pošto je već ustanovljeno da ta osoba ima preferenciju jabuke ≻ breskve, dodavanje jednoj i drugoj opciji podjednako verovatne mogućnosti osvajanja kruške ne sme da utiče na ovu početnu preferenciju.
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 9
Paradoksi teorije racionalnog izbora: Aleov paradoks
Opcija A: sa sigurnošću (100%) dobitak od 100 miliona dolara. Opcija B: sa 89% dobitak od 100 milion dolara, sa 10% dobitak od 500 miliona dolara, i sa 1% ništa (0 dolara). Izaberite sada između opcija A1 i B1:
Opcija A1: sa 89% ništa (0 dolara) i sa 11% dobitak od 100 miliona dolara Opcija B1: sa 90% ništa (0 dolara) i sa 10% dobitak od 500 miliona dolara A (sigurni dobitak od 100 miliona dolara) je dominantan izbor između A i B, dok je B1 (90% ništa i 10% dobitak od 500 miliona dolara) dominantan izbor između A1 i B1.
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 10
Paradoksi teorije racionalnog izbora: Aleov paradoks
Moris Ale
1% 10% 89%
A 100M $ 100M $ 100M $
B 0 500M $ 100M $
A1 100M$ 100M$ 0
B1 0 500M $ 0
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 11
Paradoksi teorije racionalnog izbora: paradoks zajedničke proporcije
Izaberite između A i B: Opcija A: 6000 dolara sa verovatnoćom .45, u suprotnom ništa. Opcija B: 3000 dolara sa verovatnoćom .90, u suprotnom ništa. Izaberite sada između A1 i B1: Opcija A1: 6000 dolara sa verovatnoćom .001, u suprotnom ništa. Opcija B1: 3000 dolara sa verovatnoćom .002, u suprotnom ništa. U prvom slučaju, većina ispitanika bira opciju B, koja nosi veću verovatnoću dobitka, dok u drugom slučaju, većina ispitanika bira opciju A1, koja nosi višu vrednost.
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 12
Paradoksi teorije racionalnog izbora: paradoks zajedničke proporcije
Izaberite između A i B: Opcija A: 4000 dolara sa verovatnoćom .80, ništa sa verovatnoćom .20. Opcija B. Sigurnih 3000 dolara. Izaberite sada između A1 i B1: Opcija A1: 4000 dolara sa verovatnoćom .20, ništa sa verovatnoćom .80. Opcija B1. 3000 dolara sa verovatnoćom .25, ništa sa verovatnoćom .75. Većina ispitanika u ovakvom zadatku bira opciju B u prvom slučaju i opciju A1 u drugom slučaju.
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 13
Paradoksi teorije racionalnog izbora: paradoks zajedničke proporcije
Opcija A: 4000 dolara sa verovatnoćom .80, ništa sa verovatnoćom .20. Opcija B. Sigurnih 3000 dolara. Opcija A1: 4000 dolara sa verovatnoćom .20, ništa sa verovatnoćom .80. Opcija B1. 3000 dolara sa verovatnoćom .25, ništa sa verovatnoćom .75.
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 14
Subjektivni tretman verovatnoća
Vrednost od 3000$ u džepu deluje kao bolji izbor od neizvesnih 4000$, čak i sa visokom verovatnoćom osvajanja od 80%, iz čega sledi da je skok u šansama za osvajanje ishoda sa 80% na sigurnih 100% na neki način veoma uticajan. Slično, takođe se pokazuje empirijski, kao psihološki uticajan otkriva se skok u verovatnoći sa 0 na neku nisku verovatnoću, npr. 10% ili 20%. U takvim slučajevima, psihološki je značajan prelaz iz nemogućnosti u mogućnost: nešto što uopšte nije moglo da se ostvari (verovatnoća nula) je postalo moguće (makar i sa nekom malom verovatnoćom).
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 15
Subjektivni tretman verovatnoća
Opcija A: 6000 dolara sa verovatnoćom .45, u suprotnom ništa. Opcija B: 3000 dolara sa verovatnoćom .90, u suprotnom ništa. Opcija A1: 6000 dolara sa verovatnoćom .001, u suprotnom ništa. Opcija B1: 3000 dolara sa verovatnoćom .002, u suprotnom ništa.
p(3000) : p(6000) = ½ Da li je odnos subjektivnih verovatnoća uvek ½? Nemoguće. Uvek bi svi birali 3000$.
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 16
Subjektivni tretman verovatnoća
Neka neki donosila odluka prvo evaluira loz koji sa 5% donosi 100 evra, i sa 95% ne donosi ništa – i pokazuje sklonost ka riziku. Prepostavimo sada da isti donosilac odluka evaluira loz koji sa 95% donosi 100 evra, i sa 5% ništa - i pokazuje averziju prema riziku. Ako donosilac odluka u obe situacije ima istu funkciju korisnosti – što je standardna pretpostavka teorije odlučivanja – kako objašnjavamo činjenicu da je on sklon ka riziku u oceni prvog loza, i averzivan prema riziku u oceni drugog loza?
Poznat empirijski nalaz: četvoročlana struktura stavova prema riziku za niske verovatnoće p dobitka x: sklonost ka riziku za umerene i visoke verovatnoće p dobitka x: averzija prema riziku za niske verovatnoće p gubitka x: averzija prema riziku za umerene i visoke verovatnoće p gubitka x: sklonost ka riziku.
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 17
Subjektivni tretman verovatnoća
5% donosi 100 evra, i sa 95% ne donosi ništa –pokazuje sklonost ka riziku. 95% donosi 100 evra, i sa 5% ništa - pokazuje averziju prema riziku. Ako donosilac odluka u obe situacije ima istu funkciju korisnosti – što je standardna pretpostavka teorije odlučivanja – kako objašnjavamo činjenicu da je on sklon ka riziku u oceni prvog loza, i averzivan prema riziku u oceni drugog loza?
Ako donosilac odluka tretira p = .05 u prvom lozu kao nešto višu nego što jeste... ako donosilac odluka tretira p = .95 u drugom lozu kao nešto nižu nego što jeste... ...ovaj empirijski nalaz može da se objasni.
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 18-1
Subjektivni tretman verovatnoća
0 1
1
Objektivna P
Subjektivna P
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 18-2
Subjektivni tretman verovatnoća
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
Objektivna verovatnoca
Pon
deris
ana
(opa
zena
) ver
ovat
noca
Funkcija ponderisanja verovatnoca za teoriju izgleda
potcenjivanje većih verovatnoća
precenjivanje manjih verovatnoća
izvesnost
nemogućnost
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 19
Različit tretman dobitaka i gubitaka: efekat refleksije
Plan A: primena plana A sigurno spašava život 200 ljudi. Plan B: primena plana B garantuje sa verovatnoćom od 1/3 da će preživeti svih 600 ljudi i sa verovatnoćom od 2/3 da neće preživeti niko.
Plan C: primena plana C dovodi do sigurnog gubitka 400 života. Plan D: primena plana D garantuje sa verovatnoćom od 1/3 da niko neće umreti i sa verovatnoćom od 2/3 da će svih 600 ljudi umreti.
U nekoj zemlji izbila je epidemija nepoznate azijske bolesti. Pred nadležnim organima se nalaze plan A i plan B (plan C i plan D). Koji od planova biste izabrali da sprovedete (Tversky & Kahneman, 1987)?
Ispitanici koji biraju između A i B većinski biraju plan A, čime otkrivaju averziju prema riziku. Ispitanici koji biraju između planova C i D većinski biraju plan D, čime otkrivaju sklonost ka riziku. Jedina razlika između planova A i B, s jedne, i C i D, s druge strane, je ta što su planovi C i D formulisani u terminima gubitaka, dok su planovi A i B formulisani u terminima dobitaka. Ovakavi efekti se nazivaju efektima okvira ili formulacije (engl. framing effects).
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 20
Različit tretman dobitaka i gubitaka: efekat refleksije
-100 -80 -60 -40 -20 0 20 40 60 80 100-100
-80
-60
-40
-20
0
20
40
60
80
100
Value (Vrednost)
Util
ity (K
oris
nost
)
Funkcija korisnosti koja je konkavna za dobitke i konveksna za gubitke.
Ako držite ρ u funkciji u(x) = xρ između 0 i 1, dobijete ovakvu funkciju.
Averzija prema riziku za dobitke, sklonost ka riziku za gubitke? To možemo da sredimo:
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 21-1
Različit tretman dobitaka i gubitaka: averzija prema gubicima
50% a 50% b 50% c 50% d λ
1 0 0 -25 61 2.44
2 0 0 -50 101 2.02
3 0 0 -100 202 2.02
4 0 0 -150 280 1.87
(prema Tversky & Kahneman, 1992)
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 21-2
Različit tretman dobitaka i gubitaka: averzija prema gubicima
Kahneman, Knetch & Thaler, 1991.
I grupa Imaš šolju: po kojoj ceni bi je prodao?
II grupa Nemaš šolju: koliko bi je platio?
7$ 12 centi 2$ 87 centi
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 21-3
Različit tretman dobitaka i gubitaka: averzija prema gubicima
Kahneman & Tversky, 1984.
Bacimo dukat, izađe glava: Bacimo dukat, izađe pismo:
Dobiješ 10$ Izgubiš 10$ NE!
Dobiješ 20$ ? NE!
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 22
Različit tretman dobitaka i gubitaka: averzija prema gubicima
-120 -100 -80 -60 -40 -20 0 20 40 60
-120
-100
-80
-60
-40
-20
0
20
40
60Value Function
Value (Vrednost)
Util
ity (K
oris
nost
)
Funkcija vrednosti:
u(x) =
u(x) = xρ, dobici
u(x) = λxρ, gubici
λ
x
2x
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 23
Teorija izgleda (Kahneman & Tversky, 1979, Tversky & Kahneman, 1992)
Daniel Kahneman (desno) i Amos Tversky (levo).
∑ ⋅=i
ii xxpLE )()(
Očekivana vrednost
∑ ⋅=i
ii xuxpLU )()()(
Očekivana korisnost
∑ ⋅=i
ii xupwLV )()()(
Teorija izgleda
∑ ⋅⋅=i
ii xupwLV )()()( λ
u(x) =
u(x) = xρ, dobici
u(x) = λxρ, gubici
Učenje i viš.kog.procesi, Proleće 2013: Odlučivanje, Deo II – Predavanje 2 24
Teorija izgleda (Kahneman & Tversky, 1979, Tversky & Kahneman, 1992)
Daniel Kahneman, 2002.
Amos Tversky, 1937-1996.
„... for having integrated insights from psychological research into economic science, especially concerning human judgment and decision-making under uncertainty."