238
BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM Gazdaság- és Társadalomtudományi Kar Üzleti Tudományok Intézet Dr. Kövesi János – Erdei János – Dr. Tóth Zsuzsanna Eszter – Dr. Jónás Tamás KVANTITATÍV MÓDSZEREK oktatási segédanyag Budapest, 2013

Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM

Gazdaság- és Társadalomtudományi Kar Üzleti Tudományok Intézet

Dr. Kövesi János – Erdei János – Dr. Tóth Zsuzsanna Eszter – Dr. Jónás Tamás

KVANTITATÍV MÓDSZEREK

oktatási segédanyag

Budapest, 2013

Page 2: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

2

TARTALOMJEGYZÉK

I. VALÓSZÍN ŰSÉGSZÁMÍTÁSI ALAPOK ..................................................................................................... 5

I.1 A VALÓSZÍNŰSÉG FOGALMA .......................................................................................................................... 7 I.2 MŰVELETEK ESEMÉNYEKKEL ........................................................................................................................ 8 I.3 A VALÓSZÍNŰSÉGSZÁMÍTÁS AXIÓMARENDSZERE ......................................................................................... 11 I.4 VALÓSZÍNŰSÉG MEGHATÁROZÁSÁNAK MÓDSZEREI ..................................................................................... 12 I.5 A FELTÉTELES VALÓSZÍNŰSÉG FOGALMA .................................................................................................... 14 I.6 A TELJES VALÓSZÍNŰSÉG TÉTELE ................................................................................................................. 16 I.7 BAYES-TÉTEL ............................................................................................................................................... 17 I.8 FA DIAGRAM ................................................................................................................................................ 18 I.9 ESEMÉNYEK FÜGGETLENSÉGE ..................................................................................................................... 19

II. VALÓSZÍN ŰSÉGI VÁLTOZÓ, ELMÉLETI ELOSZLÁSOK ................. ............................................... 21

II.1 VALÓSZÍNŰSÉGI VÁLTOZÓ JELLEMZŐI ........................................................................................................ 22 II.2 DISZKRÉT ELMÉLETI ELOSZLÁSOK .............................................................................................................. 26

II.2.a Karakterisztikus eloszlás .................................................................................................................... 26 II.2.b Diszkrét egyenletes eloszlás ............................................................................................................... 26 II.2.c Binomiális eloszlás ............................................................................................................................. 26 II.2.d Hipergeometrikus eloszlás ................................................................................................................. 27 II.2.e Poisson-eloszlás ................................................................................................................................. 28

II.3 FOLYTONOS ELMÉLETI ELOSZLÁSOK .......................................................................................................... 29 II.3.a Folytonos egyenletes eloszlás ............................................................................................................ 29 II.3.b Exponenciális eloszlás ....................................................................................................................... 30 II.3.c Normális (Gauss-) eloszlás ................................................................................................................ 30

II.4 A NAGY SZÁMOK TÖRVÉNYEI ..................................................................................................................... 33 II.4.a Nagy számok törvényének Bernoulli-féle alakja ................................................................................ 33 II.4.b Központi határeloszlás tétele ............................................................................................................. 34

II.5 TAPASZTALATI (EMPIRIKUS) ELOSZLÁSFÜGGVÉNY ..................................................................................... 35

III. MINTAVÉTEL ............................................................................................................................................. 36

III.1 A MATEMATIKAI STATISZTIKA TÁRGYA .................................................................................................... 37 III.2 M INTAVÉTELI HIBA ................................................................................................................................... 38 III.3 M INTAVÉTELI ELJÁRÁSOK ......................................................................................................................... 39

III.3.a Egyszerű véletlen mintavétel ............................................................................................................. 39 III.3.b Rétegzett mintavétel .......................................................................................................................... 40 III.3.c Csoportos mintavétel ........................................................................................................................ 41 III.3.d Többlépcsős mintavétel ..................................................................................................................... 42 III.3.e Nemvéletlen mintavételi eljárások .................................................................................................... 42

IV. LEÍRÓ STATISZTIKA ............................................................................................................................... 44

IV.1 A LEÍRÓ STATISZTIKA HELYE, SZEREPE A STATISZTIKA VILÁGÁBAN ......................................................... 45 IV.2 A STATISZTIKAI LEÍRÁS CÉLJA, MÓDSZEREI............................................................................................... 45 IV.3 AZ ADATOK ÁBRÁZOLÁSA ......................................................................................................................... 46 IV.4 TAPASZTALATI ELOSZLÁSOK..................................................................................................................... 49 IV.5 TAPASZTALATI ELOSZLÁSOK KÖZÉPÉRTÉK MUTATÓI ................................................................................ 54

IV.5.a Medián (Me) ..................................................................................................................................... 54 IV.5.b Módusz (Mo) ..................................................................................................................................... 56 IV.5.c Számtani átlag ( )x ........................................................................................................................... 57 IV.5.d Egyéb átlagfajták .............................................................................................................................. 58 IV.5.e Választás a középértékek között ........................................................................................................ 59 IV.5.f Kvantilisek ......................................................................................................................................... 60

IV.6 AZ INGADOZÁS MÉRŐSZÁMAI ................................................................................................................... 62 IV.6.a Terjedelem (R) .................................................................................................................................. 62 IV.6.b Átlagos abszolút különbség (G) ........................................................................................................ 63 IV.6.c Átlagos abszolút eltérés (∆) .............................................................................................................. 63 IV.6.d Tapasztalati szórás (s), korrigált tapasztalati szórás (s*) ................................................................. 64 IV.6.e Relatív szórás (v) ............................................................................................................................... 65

IV.7 AZ ELOSZLÁS ALAKJÁT JELLEMZŐ EGYÉB MUTATÓSZÁMOK ..................................................................... 65

Page 3: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

3

IV.7.a Aszimmetria mutató .......................................................................................................................... 66 IV.7.b Csúcsossági mutató ........................................................................................................................... 67

IV.8 ESETTANULMÁNY – LEÍRÓ STATISZTIKAI ELEMZÉS ................................................................................... 68

V. BECSLÉS ........................................................................................................................................................ 74

V.1 A BECSLÉS TULAJDONSÁGAI ....................................................................................................................... 75 V.1.a Torzítatlan becslés ............................................................................................................................. 75 V.1.b Konzisztens becslés ............................................................................................................................ 76 V.1.c Hatásos becslés .................................................................................................................................. 78 V.1.d Elégséges becslés: .............................................................................................................................. 78

V.2 A PONTBECSLÉS MÓDSZEREI....................................................................................................................... 79 V.2.a Exponenciális eloszlás paraméterének grafikus becslése .................................................................. 80 V.2.b Normális eloszlás paramétereinek grafikus becslése ......................................................................... 80

V.3 INTERVALLUMBECSLÉS .............................................................................................................................. 81 V.3.a Konfidenciaintervallum a normális eloszlás várható értékére ........................................................... 82 V.3.b Konfidenciaintervallum a normális eloszlás várható értékére, elméleti szórás ismeretlen ................ 84 V.3.c Sokasági arány becslése ..................................................................................................................... 85 V.3.d Sokasági variancia becslése, .............................................................................................................. 86 V.3.e Konfidenciaintervallum két sokaság várható értékének különbségére, független mintavétel ............. 88 V.3.f Két sokasági arány közötti különbség becslése ................................................................................... 90 V.3.g A minta elemszámának meghatározása .............................................................................................. 91

VI. HIPOTÉZISVIZSGÁLATOK: NEMPARAMÉTERES PRÓBÁK ... ...................................................... 92

VI.1 A HIPOTÉZISVIZSGÁLAT ÁLTALÁNOS MENETE ........................................................................................... 93 VI.2 ILLESZKEDÉSVIZSGÁLAT χ2-PRÓBÁVAL .................................................................................................... 97 VI.3 ILLESZKEDÉSVIZSGÁLAT KOLMOGOROV-PRÓBÁVAL ................................................................................ 99 VI.4 χ2-PRÓBA ALKALMAZÁSA HOMOGENITÁSVIZSGÁLATRA ......................................................................... 100 VI.5 χ2-PRÓBA ALKALMAZÁSA FÜGGETLENSÉGVIZSGÁLATRA ........................................................................ 102

VI.5.a Asszociációs kapcsolat szorossága ................................................................................................. 104 VI.6 SOROZATPRÓBA ...................................................................................................................................... 105 VI.7 MANN-WHITNEY PRÓBA ......................................................................................................................... 106

VII. HIPOTÉZISVIZSGÁLATOK: PARAMÉTERES PRÓBÁK ..... ......................................................... 109

VII.1 EGYMINTÁS PRÓBÁK.............................................................................................................................. 110 VII.1.a Szórásnégyzetre vonatkozó próba.................................................................................................. 110 VII.1.b Várható értékre irányuló próbák ................................................................................................... 111 VII.1.c Sokasági arányra irányuló nagymintás próba ............................................................................... 113

VII.2 KÉTMINTÁS PRÓBÁK .............................................................................................................................. 115 VII.2.a Két szórásnégyzet (szórás) összehasonlítása ................................................................................. 115 VII.2.b Két független minta várható értékének összehasonlítása .............................................................. 116 VII.2.c Páros minták várható értékének összehasonlítása ......................................................................... 119 VII.2.d Aránypróba .................................................................................................................................... 121

VII.3 TÖBBMINTÁS PRÓBÁK ............................................................................................................................ 123 VII.3.a Több szórás összehasonlítására vonatkozó próbák ....................................................................... 123 VII.3.b Varianciaanalízis ........................................................................................................................... 125

VIII. KORRELÁCIÓ- ÉS REGRESZIÓELEMZÉS ............. ....................................................................... 128

VIII.1 KAPCSOLATOK JELLEGE ....................................................................................................................... 129 VIII.2 A KORRELÁCIÓS KAPCSOLAT SZEMLÉLTETÉSE ..................................................................................... 130 VIII.3 KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁS .............................................................................................. 131

VIII.3.a A kétváltozós regressziós modell .................................................................................................. 132 VIII.3.b Korrelációs mérőszámok .............................................................................................................. 139 VIII.3.c Intervallumbecslés ........................................................................................................................ 141 VIII.3.d A regressziófüggvény eredményeinek ellenőrzése: hipotézisvizsgálatok ...................................... 141

VIII.4 PÉLDA KORRELÁCIÓ- ÉS REGRESSZIÓSZÁMÍTÁSRA ............................................................................... 149

IX. DÖNTÉSELMÉLET .................................................................................................................................. 156

IX.1 BEVEZETÉS ............................................................................................................................................. 157 IX.2 ESETPÉLDA ............................................................................................................................................. 157 IX.3 A DÖNTÉSI ALAPMODELL ........................................................................................................................ 158

Page 4: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

4

IX.4 A DÖNTÉSI MÁTRIX ................................................................................................................................. 159 IX.5 A DÖNTÉSI FOLYAMAT LOGIKÁJA............................................................................................................ 160 IX.6 BIZONYTALAN DÖNTÉSEK OSZTÁLYA ..................................................................................................... 161

IX.6.a A valószínűség, mint döntési kritérium ........................................................................................... 168 IX.6.b Kombinált kritériumok .................................................................................................................... 170

IX.7 KOCKÁZATOS DÖNTÉSEK OSZTÁLYA....................................................................................................... 168 IX.7.a Kockázatos döntés az elsődleges információk alapján ................................................................... 172 IX.7.b Teljes információ ............................................................................................................................ 173 IX.7.c A teljes információ várható értéke (TIV) ......................................................................................... 174 IX.7.d Kockázatos döntés a pótlólagos információk alapján, nem teljes információ ................................ 175 IX.7.e Kockázatos döntés az etikai neutralitás elve alapján: .................................................................... 179 IX.7.f Biztos döntések osztálya................................................................................................................... 180 IX.7.g Döntés konfliktus esetén .................................................................................................................. 181

X. KOMPLEX RENDSZEREK ÖSSZEMÉRÉSI PROBLÉMAI, RANGMÓ DSZEREK ALKALMAZÁSA ............................................................................................................................................. 182

X.1 BEVEZETÉS ............................................................................................................................................... 183 X.2 A MÉRÉS, A MÉRÉSI SKÁLÁK ..................................................................................................................... 184

X.2.a Névleges (nominális) skála ............................................................................................................... 184 X.2.b Sorrendi (ordinális skála) ................................................................................................................ 185 X.2.c Intervallumskála ............................................................................................................................... 186 X.2.d Arányskála (abszolút skála) ............................................................................................................. 186

X.3 KOMPLEX RENDSZEREK ÖSSZEMÉRÉSI PROBLÉMÁI .................................................................................. 187 X.3.a Az értékelési tényezők súlyozása ...................................................................................................... 187 X.3.b Súlyozás sorrendi skálán .................................................................................................................. 188 X.3.c A következetesség szignifikancia vizsgálata ..................................................................................... 190 X.3.d Súlyozás intervallumskálán .............................................................................................................. 191

X.4 CSOPORTOS DÖNTÉS ................................................................................................................................. 194 X.4.a Teljes egyetértés és teljes ellentét ..................................................................................................... 194 X.4.b A Kendall-féle rangkonkordancia együttható szignifikancia vizsgálata .......................................... 198

X.5 SPEARMAN-FÉLE RANGKORRELÁCIÓ ........................................................................................................ 199

XI. BEVEZETÉS A MENEDZSMENT LÁGY SZÁMÍTÁSI MÓDSZERE IBE ........................................ 202

XI.1 ÜZLETI FOLYAMATOK JÓSÁGÁNAK, MEGBÍZHATÓSÁGÁNAK ÉRTELMEZÉSE ............................................ 203 XI.1.a Karakterisztikák és attribútumok mutatószám alapú mérése .......................................................... 203 XI.1.b A mérések eredményeinek értékelése .............................................................................................. 203

XI.2 ÜZLETI FOLYAMATOK JÓSÁGÁNAK, MEGBÍZHATÓSÁGÁNAK FUZZY ALAPÚ ÉRTÉKELÉSE ........................ 205 XI.2.a Tradicionális megközelítés.............................................................................................................. 205 XI.2.b Fuzzy megközelítés .......................................................................................................................... 209

XI.3 FUZZY ALKALMAZÁSOK AZ ÜZLETI TUDOMÁNYOK TERÜLETÉN .............................................................. 218

XII. FELHASZNÁLT IRODALOM ......................... ...................................................................................... 219

XIII. FÜGGELÉK: TÁBLÁZATOK ........................ ...................................................................................... 221

Page 5: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

5

I. Valószínűségszámítási alapok1

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

1 A fejezet Csernyák L.(szerk.): Valószínűségszámítás, Tankönyvkiadó, Budapest, 1990; Szabó G. Cs. (szerk.): Alkalmazott statisztika I., Műegyetemi Kiadó, Budapest, 1994; Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985, megfelelő fejezeteinek a felhasználásával készült.

Page 6: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

6

A hétköznapi és az üzleti életben is gyakran használunk olyan kifejezéseket, mint „nem valószínű”, „biztosra vehető”, „elképzelhető”, „esélytelen”, „valószínűleg”, „nem biztos”, stb. Ezek a kifejezések egy kívánt, vagy éppen elkerülendő eseménnyel kapcsolatos bizonytalanságot mutatják. Nem tudjuk pontosan megmondani, hogy bekövetkezik-e az általunk feltételezett történés. Bármennyire is igyekszünk kiszámíthatóvá tenni a gazdasági és üzleti élet folyamatait, s számokkal jellemezni szinte minden tevékenységünket, a legtöbb esetben annyira összetettek ezek a folyamatok, annyira sok szempontot kell figyelembe venni a döntéseknél, hogy lehetetlen minden tényezőt pontosan felmérni, számszerűsíteni. Még ha össze is gyűjtjük az összes látható, megismerhető adatot, nagyon kevés eseményt lehet pontosan előre jelezni. Melyik vállalat lehet például biztos abban, hogy a termékei mindig sikeresek lesznek, vagy, hogy az üzleti környezete stabil marad, vagy, hogy szervezeti formája éppen az adott körülményeknek megfelelő? Sokan úgy vélik a véletlen események kezelhetetlenek, nem kiszámíthatók, ezért döntéseinkben legfeljebb a szerencsére hagyatkozhatunk. Sőt időnként hajlamosak vagyunk a véletlent azonosítani az oknélküliséggel, a rendezetlenséggel, a „sors szeszélyének”, a „vakszerencsének” betudni a következményeket. Néha valóban nincs más mód, mint a megérzéseinkre, ösztöneinkre, jobb esetben szakmai tudásunkra, tapasztalatunkra hallgatni, de sok esetben a véletlen események törvényszerűségei is megismerhetők, a várható eredmények modellezhetők. Éppen ezzel foglalkozik a matematika egyik ága, a valószínűségszámítás. A valóságban megfigyelt eseményeknek alapvetően két fajtáját különböztethetjük meg, attól függően, hogy a kezdeti, kiindulási feltételekből mennyire tudunk következtetni az esemény végkimenetelére. Ha az ún. peremfeltételeket feltárjuk, s ismertek a jelenség lefolyásának szabályai is, a feltételek ismeretéből viszonylag nagy pontossággal megadható a végeredmény. Ezeket hívjuk determinisztikus jelenségeknek. A legtöbb ilyen a természettudományok területén figyelhető meg. A csillagászok például nagy pontossággal meg tudják mondani, hogy mikor tér vissza a Föld közelébe egy üstökös, mikor és hol várható teljes vagy részleges napfogyatkozás. Ohm-törvénye ismeretében pontosan kiszámolható, hogy adott ellenállás és feszültség mellett mekkora áramerősség folyik egy vezetékben. Még hosszasan sorolhatnánk a példákat a műszaki és természettudományi területekről. A társadalmi, gazdasági élet törvényszerűségeit is igyekszünk minél jobban megismerni, de e területeken már nem annyira egyértelműek a feltételek, a szabályok, mint a természettudományokban. A jelenségek másik nagy csoportjánál nem tudjuk, de lehet, hogy nem is akarjuk feltárni az összes peremfeltételt, nem ismerjük a jelenség lefolyásának pontos törvényszerűségeit, így nem lehet előre megadni, hogy milyen eredmény következik be. Ezeket a jelenségeket véletlen, sztochasztikus jelenségeknek nevezzük. A valószínűségszámítás a véletlen tömegjelenségek törvényszerűségeinek feltárásával, leírásával foglalkozik. Véletlen (sztohasztikus) jelenségen olyan eseményeket, folyamatokat értünk tehát, amelyeknél a figyelembe vett (vehető) körülmények, környezeti feltételek nem határozzák meg egyértelműen a jelenség lefolyását, így annak több végeredménye, kimenetele lehet. Ha e véletlen jelenségek – elvileg azonos körülmények között – tetszőleges számban megfigyelhetők ill. megismételhetők, akkor az ilyen jelenségeket véletlen tömegjelenségnek nevezzük. (A véletlen jelenségekkel kapcsolatos megfigyeléseket szokás kísérleteknek is nevezni, függetlenül attól, hogy a jelenséget csak megfigyeljük, vagy annak előidézésében tevékenyen közreműködtünk.)

Page 7: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

7

I.1 A valószínűség fogalma

A véletlen események egyik legfontosabb jellemzője bekövetkezésük valószínűsége. A valószínűségszámítás elmélete abból indul ki, hogy a véletlen kísérletek lehetséges eredményeihez egyértelműen hozzárendelhető egy számérték: az adott esemény valószínűsége. A valószínűségszámítás alapvető célja az események ezen objektív valószínűségének a meghatározása. Objektív valószínűségen azt értjük, hogy egy adott kísérlet során egy esemény bekövetkezésének valószínűsége egy adott mérőszám, amely független attól, hogy ismerjük-e, meg tudjuk-e határozni, illetve milyen pontosan tudjuk meghatározni. A valószínűség fogalmát többféleképpen is definiálhatjuk2. Az ún. klasszikus valószínűség meghatározás szerint a valószínűség nem más, mint a számunkra kedvező esetek száma, osztva az összes lehetséges eset számával. Ez a megközelítés azonban csak akkor alkalmazható, ha az összes elemi esemény valószínűsége azonos. (Ez a helyzet leginkább a szerencsejátékoknál áll elő. E játékok vizsgálata vezetett a valószínűségszámítás kialakulásához, ezért nevezzük ezt a területet klasszikus valószínűségszámításnak.) A tapasztalati alapú, statisztikai oldalról közelítő definíció szerint a valószínűség az a számérték, amely körül a véletlen esemény relatív gyakorisága ingadozik (1. ábra). A relatív gyakoriság (jelölése: gA v. g(A)) a megfigyelt (kedvező) esemény (jelöljük A-val) bekövetkezésének száma (fA v. f(A)) osztva az összes kísérlet, megfigyelés számával (n). Az fA számot az A esemény gyakoriságának nevezzük. Az események valószínűségét P betűvel jelöljük, zárójelbe téve a vizsgált eseményt. Az A esemény valószínűségének jelölése: P(A).

1. ábra: A valószínűség fogalma

2 Lásd pl. Szabó G. Cs. (szerk.): Alkalmazott statisztika I., Műegyetemi Kiadó, Budapest, 1994

Készítette: Erdei János

A valószínűség fogalma

A n f(A)

n

AfAg

)()( =

)()(lim APAgn

=∞→

Page 8: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

8

Minél nagyobb az n, vagyis minél többször ismételjük meg a kísérletet, a relatív gyakoriságok annál nagyobb stabilitást mutatnak. Azt a törvényt, mely szerint egy kísérletet igen sokszor egymástól függetlenül elvégezve, a relatív gyakoriságok stabilitást mutatnak, a nagy számok törvényének nevezzük. Ez a törvényszerűség teszi lehetővé a valószínűség gyakorlati alkalmazását. A valószínűség fenti definíciójából egyenesen következik, hogy bármely esemény valószínűségének a [0,1] zárt intervallumbeli számnak kell lennie. Annak ellenére, hogy több korábbi definíció is szinte tálcán kínálta a valószínűségszámítás matematikai igényű megalapozásának lehetőségét, ez csak az 1930-as években A. N. Kolmogorovnak sikerült. Az általa felállított axiómarendszer segítségével minden korábbi állítás, most már a matematika szabályainak megfelelően is, bizonyíthatóvá vált. A Kolmogorov-féle valószínűségelmélet a valószínűség fogalmának meghatározásánál halmazelméleti és eseményalgebrai összefüggésekre is épít. Feltételezi ugyanis, hogy a véletlen események reprezentálhatók az elemi események halmazának, az eseménytérnek bizonyos részhalmazaival, amely részhalmazok azokból az eseményekből állnak, amelyek bekövetkezése esetén a kérdéses véletlen összetett esemény bekövetkezik. Az elemi események és események fogalmának ilyen elvont megfogalmazása jelentős szerephez jut a valószínűségszámítás Kolmogorov-féle matematikai elméletében. Mielőtt megismernénk a valószínűségszámítás axiómarendszerét, tekintsük át röviden az eseményalgebra néhány alapfogalmát.

I.2 Műveletek eseményekkel

A véletlen jelenségek (kísérletek) végrehajtása előtt nem tudjuk előre meghatározni, hogy milyen eredmény következik be, azt azonban általában meg tudjuk mondani, hogy mik lehetnek a kísérlet eredményei. Egy kísérlet lehetséges kimeneteleit (eredményeit) elemi eseményeknek, az összes elemi esemény halmazát eseménytérnek nevezzük. Az eseménytér jelölésére Ω vagy H betűt használjuk. A kísérletre vonatkozó bármely esemény az eseménytér egy adott részhalmazaként értelmezhető. Az események jelölésére latin nagybetűket (A, B, C, … ) ill. indexszel ellátott latin nagybetűket (A1, A2, A3, ….) alkalmazunk. Példa: Figyeljük meg egy szabályos, hatoldalú dobókockával történő dobás felülre kerülő oldalának pontszámát! Ebben az esetben hat kimenetele lehet a kísérletnek: az 1-es pontszám lesz felül, a 2-es pontszám lesz felül, a 3-as pontszám lesz felül, a 4-es pontszám lesz felül, az 5-ös pontszám lesz felül, a 6-os pontszám lesz felül. Jelöljük a fenti eseményeket sorban A1-el, A2-vel, A3-mal, A4-el, A5-tel és A6-tal. Az eseményteret ez a hat elemi esemény alkotja: H = A 1, A2, A3, A4, A5, A6. Egy kísérlettel kapcsolatban különböző állításokat fogalmazhatunk meg, melyeket egy vagy több elemi esemény alkot. Ilyen (összetett) esemény lehet a kockadobásnál például, hogy

Page 9: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

9

páros számot dobunk (jelöljük B-vel), hogy a dobott szám kisebb 3-nál (C), vagy, hogy 1-et, 4-et vagy 5-öt dobunk a kockával (D). Minden ilyen esemény tehát az eseménytér valamely részhalmazával reprezentálható. A B esemény, azaz hogy páros számot dobunk, a H halmaz B = A 2, A4, A6 részhalmazával írható le. A C esemény a C = A1, A2, a D pedig a D = A1, A4, A5 részhalmazzal adható meg. Akkor mondhatjuk, hogy egy összetett esemény bekövetkezett, ha az eseményt alkotó valamelyik elemi esemény lett a kísérlet eredménye. Ha például a dobott szám 2 (A2 esemény következett be), akkor egyúttal bekövetkezett a párosat dobunk esemény is (a B esemény), hiszen az A2 eleme a B-nek is. Ezzel egyidejűleg bekövetkezik minden olyan esemény, melynek eleme az A2, így pl. az általunk megfogalmazott C esemény is. Látható, hogy a véletlen események és a halmazok között kölcsönösen egyértelmű kapcsolat létesíthető, így az eseményalgebrában is felhasználhatjuk a halmazelméletben megismert összefüggéseket. A H halmazt, mint eseményt, biztos eseménynek nevezzük, hiszen bármi is a kísérlet végeredménye, ez az esemény bekövetkezik. Az üres halmazt – amely nem tartalmazza a H egyetlen elemét sem – mint eseményt, lehetetlen eseménynek hívjuk, hiszen bármi is a kísérlet kimenetele, ez az esemény nem következhet be. (A lehetetlen eseményt ∅-val jelöljük.) Tegyük fel, hogy két kockával dobunk egyszerre. Legyen A esemény, hogy két 1-est dobunk, B pedig, hogy a dobott szám összege 6-nál kisebb. Ekkor, valahányszor az A bekövetkezik, bekövetkezik B is. Ez azt jelenti, hogy az A-t reprezentáló halmaz része a B-nek. Ha valahányszor, amikor A bekövetkezik, bekövetkezik B is, azt mondjuk, hogy az A esemény maga után vonja B eseményt, s az alábbi módon jelöljük: A ⊂ B. Események közötti összefüggéseket szemléletesen ábrázolhatjuk az ún. Venn-diagramon. Az eseményteret (H) egy négyzet vagy egy téglalap szemlélteti, s ezen belül általában kör illetve ellipszis mutatja az ezen az eseménytéren bekövetkező eseményeket.

A B

H

AA BB

H

2. ábra: A ⊂ B Ellentétes esemény Egy A esemény „be nem következése” maga is esemény, jelöljük ezt A -al, s A komplementerének vagy ellentett eseményének hívjuk. A az eseménytér mindazon elemeit tartalmazza, melyek az A eseményben nincsenek benne, de H-hoz tartoznak. Események összege (egyesítése) Legyen A és B egy eseménytér két eseménye. Azt az eseményt, hogy közülük legalább az egyik bekövetkezik, az A és B esemény összegének nevezzük, és A+B-vel jelöljük. Az A+B esemény tehát akkor következik be, ha vagy A, vagy B, vagy mindkettő bekövetkezik.

Page 10: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

10

A B

H

AA BB

H

3. ábra: A+B Események szorzata (közös része) Legyen A és B egy eseménytér két eseménye. Azt az eseményt, amely akkor következik be, ha az A és a B is bekövetkezik, azaz a két esemény egyszerre következik be, az A és B események szorzatának nevezzük, és A⋅B-vel (röviden AB-vel) jelöljük. Előfordulhat, hogy a két esemény közös része az üres halmaz, ilyenkor a két esemény sosem következhet be egyszerre. Ekkor az A-t és B-t egymást kizáró eseményeknek nevezzük.

AB

H

AB

AABB

H

AB

4. ábra: A⋅B

Események különbsége Legyen A és B egy eseménytér két eseménye. Azt az eseményt, ami akkor következik be, ha az A esemény bekövetkezik, de B nem, az A és B események különbségének nevezzük, s A-B-vel jelöljük.

AB

H

AABB

H

5. ábra: A-B Az eseményekkel végezhető alapműveletek ismeretében most már pontosan definiálhatjuk az összetett esemény fogalmát is. Egy eseményt összetett eseménynek nevezünk, ha előállítható – a triviális felbontástól eltérően – két esemény összegeként. Bármely eseményre nyilvánvalóan igaz az alábbi összegzés: A = A+A és A = A+∅. Ezt a felbontást nevezzük triviális felbontásnak. Az összetett esemény az eseménytér olyan részhalmaza, mely egynél több elemet tartalmaz. Ettől eltérően, elemi esemény az eseménytér egyelemű részhalmaza, ezért csak triviális felbontása létezik. (A lehetetlen eseményt nem tekintjük sem elemi, sem összetett eseménynek.)

Page 11: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

11

Korábbi kockadobás példánkban tehát az A1, A2, A3, A4, A5, A6 események elemi események, s a definiált B, C, és D események összetett események. Teljes eseményrendszer Egy kísérlettel kapcsolatos B1, B2, …, Bn események (melyek közül egyik sem lehetetlen esemény) teljes eseményrendszert alkotnak, ha egymást páronként kizáró események, s összegük a biztos esemény. Az elemi események (a H eseménytér egyelemű részhalmazai) nyilvánvalóan teljes eseményrendszert alkotnak, ha megszámlálható sokan vannak, hiszen egymást páronként kizárják, s összegük a biztos esemény.

I.3 A valószínűségszámítás axiómarendszere

Mint korábban említettük a valószínűségszámítás axiomatikus megalapozása Kolmogorov nevéhez fűződik, aki 1933-ban német nyelven megjelent könyvében a valószínűségszámítás addig sajátosnak tekintett alapjait a modern matematika általános fogalma közé sorolta. Három axiómát fogalmazott meg, melyek segítségével a valószínűségszámítás tételei bizonyíthatóvá váltak, így a valószínűségszámítás is bekerült a matematika általánosan elfogadott területei közé. I. axióma: Egy tetszőleges A esemény bekövetkezési valószínűsége

0 ≤ P(A). II. axióma: A biztos esemény valószínűsége 1, azaz

P(H) = 1. III. axióma: Ha A és B egymást kizáró események, azaz A⋅B = 0, akkor

P(A+B)= P(A) + P(B). A III. axiómát addíciós tételnek, vagy a valószínűség additív tulajdonságának is szokás nevezni, amely nem vezethető le az I. és II. axiómákból. Szemléltetése Venn-diagram segítségével a 6. ábrán látható.

AB

H

AABB

H

6. ábra: Kolmogorov III. axiómájának szemléltetése Az axiómarendszerből kiindulva néhány alapvető valószínűségszámítási tétel fogalmazható meg (a bizonyításoktól eltekintünk, azokat az érdeklődő hallgatók a fejezet végén található könyvekben megtalálják):

• az ellentétes esemény valószínűsége : P(A ) = 1 – P(A)

Andrej N. Kolmogorov

Page 12: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

12

• a lehetetlen esemény valószínűsége: P(∅) = 0 Fordítva nem igaz a tétel, azaz abból, hogy egy esemény valószínűsége 0, nem következik, hogy az lehetetlen esemény.

• a III. axióma kiterjesztése két esemény összegére, ha az együttes bekövetkezés nem kizárt (AB ≠ 0): P(A + B) = P(A) + P(B) - P(AB)

7. ábra: III. axióma kiterjesztése

• ha A1, A2, …. An események teljes eseményrendszert alkotnak, akkor

P(A1) + P(A2) + ….+ P(An) = 1 • ha az A esemény maga után vonja a B eseményt (A⊂B), akkor

P(B–A) = P(B) – P(A), amiből következik, hogy P(A) ≤ P(B) • ha egy kísérletben az eseménytér n számú egyenlően valószínű elemi eseményt

tartalmaz, akkor a kísérlettel kapcsolatban megfogalmazható bármely véletlen esemény valószínűségét megkapjuk, ha a véletlen eseményt alkotó elemi események számát elosztjuk az összes elemi esemény számával (klasszikus valószínűségszámítás).

I.4 Valószínűség meghatározásának módszerei

• Klasszikus valószínűségmeghatározás - (kombinatorikus számítási mód)

számaeseteklehetséges

számaesetekkedvezőAP =)(

• Geometriai úton - Ha egy véletlen kísérlettel kapcsolatos elemi eseményeket egy

korlátos geometriai alakzat (szakasz, ív, síkidom v. test) pontjainak véletlenszerű kiválasztásával modellezhetünk, és a pontok egyenletes eloszlására vonatkozó feltétel teljesül, akkor a kísérlettel kapcsolatos események valószínűségét geometriai módszerekkel (hosszúság, terület v. térfogat kiszámításával) határozhatjuk meg3.

3 Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985, pp. 29.

A B

A·B

H

Page 13: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

13

• Valószínűségszámítási tételek segítségével - Feltételes valószínűség fogalma, Teljes valószínűség tétele,

Bayes-tétel, Szorzási szabály, Események függetlensége • Elméleti eloszlások segítségével • Empirikus adatokból • Szubjektív becsléssel

8. ábra: A valószínűségszámítás fő területei

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Page 14: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

14

I.5 A feltételes valószínűség fogalma

Gyakran előfordul, hogy egy esemény valószínűségét olyan esetben kell megadni, ha egy másik esemény is bekövetkezik. Ilyenkor felvetődik a kérdés, hogy az első esemény bekövetkezése befolyásolja-e a másik esemény bekövetkezésének valószínűségét. Valószínűbb-e (vagy kevésbé valószínű-e) az A esemény bekövetkezése, ha a B esemény már bekövetkezett? A matematika többi ágához hasonlóan a valószínűségelmélet is adott körülmények megléte esetén vizsgálja a kísérletek lehetséges kimeneteleit, az események véletlen jellegét e feltételek együttesen határozzák meg. Ha tehát azt kérdezzük, hogy mekkora az A esemény bekövetkezési valószínűsége egy adott kísérletben, ha a B esemény már bekövetkezett, akkor a kísérlet körülményeihez hozzávesszük B esemény bekövetkezését, s ezzel a szóba jöhető események összességét leszűkítettük. A H eseménytér helyett B eseményt tekintjük eseménytérnek, s ezen eseménytéren vizsgáljuk A bekövetkezését. Így a feltételes valószínűség a már ismert (feltétel nélküli) valószínűséghez vezet. Ebből következik, hogy a korábban megismert összefüggések, tételek érvényesek a feltételes valószínűségre is. A vizsgált eseményt AB –vel („A vonás B”), a valószínűséget pedig a szokásos módon P(AB)-vel jelöljük. A P(AB) valószínűséget az A eseménynek B feltétel melletti feltételes valószínűségének nevezzük. Definíció: Ha A és B egy kísérlettel kapcsolatos két esemény, és P(B)>0, akkor a

)(

)()|(

BP

BAPBAP

⋅=

hányadost az A eseménynek a B eseményre vonatkoztatott feltételes valószínűségének nevezzük.

Példa: Egy vállalatnál a férfi és női dolgozók kartonjait szétválogatták szakképzett és szakképzetlen kategóriákra. A megoszlást az alábbi táblázat mutatja:

Férfi Nő Összesen Szakképzett 28 12 40

Szakképzetlen 17 33 50 Összesen 45 45 90

Mekkora a valószínűsége, hogy egy találomra kiemelt karton egy a) szakképzett dolgozó kartonja? b) egy férfi kartonja? c) egy szakképzett férfi kartonja? d) Mennyi a valószínűsége, hogy egy szakmunkás kartonját emeltük ki, ha tudjuk, hogy a

kiemelt karton egy férfié? Megoldás: Legyen az A esemény, hogy egy szakmunkás kartonját, a B esemény, hogy egy férfi kartonját húzzuk ki.

Page 15: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

15

Véletlenszerűen választva a kartonok között, minden karton kihúzásának valószínűsége azonos, így a valószínűségek meghatározására alkalmazhatjuk a klasszikus valószínűségszámítást (P(A) = kedvező esetek száma/összes eset száma). a.) P(A) = 40/90 = 4/9 b.) P(B) = 45/90 = 1/2 c.) P(AB) = 28/90 = 14/45 d.) P(AB) = 28/45 alkalmazva a feltételes valószínűség definícióját: P(AB) = 28/90 : 1/2 = 56/90 = 28/45 A feltételes valószínűséget általában nem a definíció felhasználásával számoljuk ki. Ez a valószínűségre vonatkozó ismereteink felhasználásával is meghatározható, figyelembe véve, hogy az eseménytér szerepét a feltételt jelentő esemény veszi át. Gyakran az együttes bekövetkezés valószínűségének meghatározása nehezebb feladat, mint a feltételes valószínűségé. A feltételes valószínűség definíciójának segítségével ilyenkor a feltételes valószínűség ismeretében az együttes bekövetkezés valószínűségét is számolhatjuk.

P(AB) = P(AB) ⋅ P(B). Ha az A eseményt tekintjük feltételnek, akkor pedig

P(AB) = P(BA) ⋅ P(A). Ezt az összefüggést a valószínűségek szorzási szabályának nevezzük. A szorzási szabály kettőnél több eseményre is kiterjeszthető, általános alakja:

P(A1⋅A2⋅ … ⋅An) = P(A1)P(A2A1)P(A3A1⋅A2)…P(AnA1⋅A2⋅…An-1).

Page 16: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

16

I.6 A teljes valószínűség tétele

Tétel: Ha B1, B2, …. Bn események teljes eseményrendszert alkotnak és P(Bk)>0 (k=1,2,…n), A pedig egy tetszőleges esemény, akkor

∑=

⋅=n

kkBPAPAP

1k )()B|()(

A teljes valószínűség tételét akkor tudjuk alkalmazni, ha meg tudjuk határozni egy eseménynek egy teljes eseményrendszerre vonatkozó feltételes valószínűségeit és a teljes eseményrendszert alkotó események valószínűségeit is. Ekkor a tétel alapján az A esemény valószínűségét (teljes valószínűségét) a feltételes valószínűségekből (részvalószínűségekből) határozhatjuk meg. Példa: A BME GTK nappali MSc képzésein a Kvantitatív módszerek vizsgán a fiúk 60%-a, a hölgyek 80%-a szerepel sikeresen. A fiúk az évfolyam 45%-át teszik ki. Mekkora a valószínűsége, hogy egy találomra kiválasztott hallgató sikeresen szerepel a vizsgán? Megoldás: A = sikeres a vizsga B1 = a kiválasztott hallgató fiú B2 = a kiválasztott hallgató lány Ismertek továbbá az alábbi valószínűségek: P(B1) = 0,45 P(B2) = 0,55 P(AB1) = 0,6 P(AB2) = 0,8 P(A) = 0,6⋅0,45 + 0,8⋅0,55 = 0,71

Page 17: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

17

I.7 Bayes-tétel

Gyakran nem egy A esemény valószínűségét szeretnénk meghatározni, hanem azt kívánjuk megtudni, hogy A megvalósulásában mekkora valószínűséggel játszott közre egy teljes eseményrendszer valamelyik (vagy akár mindegyik) eseménye. Az előző, a Kvantitatív módszerek vizsgát elemző feladatban például azt akarjuk megtudni, hogy ha a vizsga sikeres volt, mekkora a valószínűsége, hogy a vizsgázó fiú (vagy lány). Ez a teljes valószínűség tételénél megfogalmazott probléma megfordítása. Az A esemény teljesülését tudjuk (ez válik feltétellé), s e feltétel mellett a teljes eseményrendszert alkotó B események valamelyikének bekövetkezési valószínűségét kívánjuk meghatározni. A kérdésre a választ a most következő Bayes-tétel felhasználásával adhatjuk meg. Tétel: Ha B1, B2, …. Bn események teljes eseményrendszert alkotnak és P(Bk)>0 (k=1,2,…n),

A pedig egy tetszőleges esemény, amelyre igaz, hogy P(A)>0, akkor

∑=

=n

iii

kkk

BPBAP

BPBAPABP

1

)()|(

)()|()|(

Szokás a P(BkA) valószínűségeket „a posteriori”, a P(Bk) valószínűségeket pedig „a priori” valószínűségeknek, valamint magát a tételt „az okok valószínűségének” tételeként is nevezni. Példa: Az előző pontban megoldott vizsgázós feladattal kapcsolatban határozzuk meg annak a valószínűségét, hogy fiú volt a vizsgázó, ha tudjuk, hogy a vizsga sikerült! Megoldás: Felhasználva a teljes valószínűségnél bevezetett jelöléseket, a feladat a P(B1A) valószínűség kiszámolása. Alkalmazzuk a Bayes-tételt: P(B1A) = 0,6⋅0,45/(0,6⋅0,45 + 0,8⋅0,55) = 0,38.

Page 18: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

18

I.8 Fa diagram

A fenti típusú problémákat – nem túl összetett esetekben – könnyebben megoldhatjuk az ún. fa diagram segítségével. Ez az ábrázolás gyakran nagyon hasznos segítséget jelent a probléma, az adott szituáció áttekintésében. A döntéselméletben alkalmazott döntési fa mintájára egy eseménysor valószínűségeit szemléltethetjük az ábrán. Példa: Oldjuk meg a Kvantitatív módszerek vizsgás példa mindkét részét (teljes valószínűség és Bayes-tétel) fa diagram segítségével! Megoldás: A könnyebb számolás, illetve az áttekinthetőbb ábrázolás kedvéért ne a valószínűségeket ábrázoljuk a diagramon, hanem annak százszorosát. Lényegében tegyük fel, hogy 100 diák vizsgázik a tárgyból. A vizsgázók 45%-a fiú, azaz a 100 hallgatóból 45 fiú és 55 lány. A fiúk 60%-a sikeres, tehát a 45 fiúból 27-en teljesítik a vizsgát, 18-an nem. A lányoknál 80% a siker valószínűsége, így az 55 vizsgázóból 44-en leteszik a vizsgát, s 11-nek nem sikerül. Ábrázoljuk a fenti gondolatmenetet.

27 fiú és 44 lány teljesíti sikeresen a vizsgát, összesen 100-ból 71-en, azaz 71% a sikeres vizsga valószínűsége. Ha tudjuk, hogy a vizsga sikerült, mekkora a valószínűsége, hogy az illető fiú? Összesen 71 sikeres vizsga volt, s ebből 27 fiú. Tehát annak valószínűsége, hogy egy sikeresen vizsgázó fiú, 27/71 = 0,38.

100 hallgató

45 fiú

55 lány

sikeres 60%

nem sikeres 40%

sikeres 80%

nem sikeres 20%

27 sikeres, fiú

18 nem sikeres, fiú

44 sikeres, lány

11 nem sikeres, lány

Page 19: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

19

I.9 Események függetlensége

Két esemény függetlenségén a hétköznapi életben azt értjük, hogy az egyik bekövetkezése nem befolyásolja a másik bekövetkezését. Nehéz azonban eldönteni csupán a szemlélet alapján, hogy ez valóban igaz-e? Egyértelmű mérőszám, s szubjektív tényezőktől mentes, matematikai definícióra van szükség. A valószínűségszámításban két eseményt akkor tekintünk egymástól függetlennek, ha az egyik esemény bekövetkezése nem befolyásolja a másik esemény bekövetkezésének valószínűségét. A feltételes valószínűség fogalmának bevezetésekor láttuk, hogy annak valószínűsége, hogy a férfiak (B esemény) közül választva egy szakmunkás (A esemény) kartonját húzzuk ki, P(AB) = 28/45 volt. Ha az összes karton közül választunk, akkor az A esemény valószínűsége P(A) = 4/9. Eltér a két valószínűség P(AB) ≠ P(A), tehát a B esemény bekövetkezése befolyásolja az A esemény valószínűségét. A nem és a szakképzettség egymástól nem független tulajdonságok. Más lenne a helyzet, ha a két valószínűség azonos, azaz P(AB) = P(A). Ha A és B független események, akkor a P(A|B) feltételes valószínűség nem függ a feltételtől:

)()(

)()|( AP

BP

ABPBAP ==

Ilyenkor, a feltételes valószínűség fogalmából, illetve a szorzási szabályból következik:

P(A⋅B) = P(AB)⋅P(B) = P(A)⋅P(B) Definíció: Két eseményt egymástól függetlennek nevezünk, ha együttes bekövetkezésük

valószínűsége a két esemény valószínűségének a szorzata. Ha az A és B események valószínűsége nem 0, és A független B-től, akkor B esemény is független A-tól, valamint bármelyiket az ellentettjével helyettesítve, a kapott két esemény is független. Ha három esemény páronként független, még nem biztos, hogy "teljesen függetlenek", azaz még teljesül az is, hogy: P(A·B·C)=P(A)⋅P(B)⋅P(C). Az A1, A2, ... An események teljesen függetlenek, ha közülük kiválasztott tetszőleges számú eseményre teljesül, hogy az együttes bekövetkezésük valószínűsége egyenlő az egyes valószínűségek szorzatával. Példa: Szabályos kocka feldobásakor vizsgáljuk az alábbi eseményeket: A = páros számot dobtunk B = a dobott szám 4 vagy 4-nél kisebb Független-e a két esemény? Megoldás: P(A) = 3/6 = 1/2 P(B) = 4/6 = 2/3 P(AB) = 2/6 = 1/3 P(AB) = 2/4 = 1/2 P(A)⋅P(B) = 1/2 ⋅ 2/3 = 1/3 = P(AB) P(AB) = 1/2 = P(A) A valószínűségek megegyeznek, tehát A és B események függetlenek egymástól.

5 6

2 4

1

3

B A

H

Page 20: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

20

A fenti definíció alapján a valószínűségek ismeretében könnyen eldönthetjük a függetlenséget. A gyakorlatban azonban sokszor nem ismerjük a valószínűségeket. Ilyenkor a relatív gyakoriság ismeretében matematikai statisztikai módszerekkel próbáljuk igazolni vagy elvetni a függetlenség hipotézisét. A definíció alapján függetlennek kell tekintenünk minden olyan eseménypárt, melyre a fenti összefüggés igaz, még akkor is, ha a függetlenséget valamilyen gyakorlati összefüggéssel nem tudjuk alátámasztani. A függetlenség nem jelenti azt, hogy a két esemény között nem lehet valamilyen ok-okozati összefüggés. Felhívjuk a figyelmet arra, hogy a függetlenség és a kizárás nem azonos fogalmak, bár sokszor összetévesztik őket. Ha A és B egymást kizáró események, tehát együttes bekövetkezésük valószínűsége P(AB) = 0, a függetlenség definíciója alapján P(AB) = P(A) ⋅ P(B) = 0, csak akkor teljesülhet, ha legalább az egyik esemény bekövetkezési valószínűsége 0. (Ez nem jelenti azt, hogy az esemény lehetetlen esemény.) Ebből következik, ha két esemény egymást kizárja, s mindkettő bekövetkezési valószínűsége nagyobb 0-nál, nem lehetnek független események.

Page 21: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

21

II. Valószínűségi változó, elméleti eloszlások

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Page 22: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

22

Eddig a sztochasztikus jelenségekben megfigyelt események bekövetkezésének ill. be nem következésének a valószínűségét vizsgáltuk. Ha egy kísérlettel kapcsolatos eseménytéren minden elemi eseményhez egyértelműen hozzárendelünk egy valós számot, ezt a hozzárendelést valószínűségi változónak nevezzük. Kockadobás esetén például legyen az A1 esemény, hogy 1-est dobunk, A2 esemény a 2-es dobás, stb. Az egyes elemi eseményekhez rendeljünk hozzá egy számot – célszerűen a dobott szám értékét –, akkor az így létrehozott függvénykapcsolat alapján azt mondhatjuk, hogy a kísérlet lehetséges eredményei: 1, 2, 3, 4, 5, vagy 6. A valószínűségi változó fogalma nem adja meg, hogy az elemi eseményekhez milyen valós számokat rendeljünk. Természetes azonban, hogy ha egy elemi esemény bekövetkezésekor egyúttal számértékek is adódnak, akkor célszerű az egyes elemi eseményekhez ezeket a számokat hozzárendelni. A hozzárendeléshez azonban nem feltétlenül szükséges, hogy a kísérlet során számértékeket kapjunk eredményül. Az előbbi hozzárendelést akkor is elvégezhetjük, ha a kocka oldalai nem számokkal, hanem mondjuk színekkel vannak jelölve. Piros dobás 1-es, kék dobás 2-es stb. A valószínűségi változót általában görög kisbetűvel jelöljük, leggyakrabban a kis kszhi vagy éta betűkkel: ξ vagy η. Attól függően, hogy a valószínűségi változó milyen értékeket vehet fel, két fő csoportot különböztetünk meg: diszkrét és folytonos valószínűségi változót: • Diszkrét valószínűségi változóról akkor beszélünk, ha a valószínűségi változó véges,

vagy megszámlálhatóan végtelen értéket vehet fel. Diszkrét valószínűségi változó például a fenti kockadobásnál megfigyelt számértékek, a selejtes termékek száma egy adott műszakban, a balesetek száma egy adott időszak alatt, a születések, halálozások száma egy évben, stb.

• Folytonos valószínűségi változóról akkor beszélünk, ha a valószínűségi változó megszámlálhatatlanul végtelen sok értéket vehet fel. Folytonos valószínűségi változó pl. a telefonbeszélgetések hossza, vagy motorgyártásnál a henger felületi érdessége, a BUX index értéke, az ország GDP-je, stb.

II.1 Valószínűségi változó jellemzői4

a) Valószínűség-eloszlás függvény Diszkrét esetben a ξ valószínűségi változó eloszlását egyértelműen jellemzi az, hogy a változó a lehetséges értékeit milyen valószínűséggel veszi fel. Ezt adja meg a pk valószínűség-eloszlás:

pk = P(ξ=k). tulajdonságai:

0 ≤ pk ≤ 1

1=∑∞

−∞=kkp

P(a ≤ ξ < b) = ∑−

=

1b

akkp

Feladat: Rajzoljuk fel a kockadobás valószínűség-eloszlás függvényét!

4 A fejezet Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985; Spiegel, Murray R.: Statisztika: Elmélet és gyakorlat, Panem – McGraw-Hill, Budapest, 1995, megfelelő fejezeteinek a felhasználásával készült.

Page 23: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

23

b) Eloszlásfüggvény Az eloszlásfüggvény [jelölése: F(k) v. folytonos változó esetén F(x)] megadja, hogy a ξ valószínűségi változó mekkora valószínűséggel vesz fel egy adott k-nál (folytonos esetben x-nél) kisebb értéket, azaz:

F(k) = P(ξ < k) ill. F(x) = P(ξ < x). tulajdonságai: monoton növekvő, azaz F(a) ≤ F(b), ha a < b F(-∞) = 0, F(∞) = 1 balról folytonos pk és F(k) kapcsolata:

pk = F(k+1)-F(k)

F(k) = ∑−

−∞=

1k

iip

P(a ≤ ξ < b) = F(b)-F(a) = ∑−

=

1b

akkp

Feladat: Rajzoljuk fel a kockadobás eloszlásfüggvényét! c) Sűrűségfüggvény Ha a ξ folytonos valószínűségi változó eloszlásfüggvénye F(x), akkor az

f(x) = F’(x) függvényt a ξ sűrűségfüggvényének nevezzük. tulajdonságai:

f(x) ≥ 0

∫∞

∞−

=1)( dxxf

f(x) és F(x) kapcsolata:

F(x) = ∫∞−

x

dxxf )( ; f(x)=F’(x)

P(a ≤ ξ < b) = F(b)-F(a) = ∫b

a

dxxf )(

d) Várható érték A ξ diszkrét valószínűségi változó lehetséges értékei legyenek k1, k2, k3, …. , akkor ξ várható értékének az ∑=

iii kpM )(ξ összeget nevezzük;

ha ξ folytonos valószínűségi változó és sűrűségfüggvénye f(x), akkor a ξ várható értéke

∫∞

∞−

⋅= .)()( dxxfxM ξ

Ha n21 ..., ξξξ tetszőleges valószínűségi változók, s létezik a várható értékük, akkor összegük várható értéke egyenlő a valószínűségi változók várható értékének összegével:

Page 24: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

24

( ) ( ) ( ) ( )nn MMMM ξξξξξξ +++=+++ ...... 2121

Ha c egy tetszőleges valós szám, akkor M(c) = c. Ha M(ξ) létezik, akkor létezik M(cξ) is, és M(cξ) = c M(ξ). e) Szórás, szórásnégyzet (variancia) A várható érték körül a valószínűségi változók különböző eloszlásoknál más-más módon „tömörülhetnek”. Elég nagy különbség van a végeredményt tekintve például az alábbi két eset között, holott a várható érték mindkettőben azonos. Az évfolyam Kvantitatív módszerek jegyének várható értéke abban az esetben is közepes, ha mindenki hármast kap, s akkor is, ha az évfolyam egyik fele jelest, a másik fele pedig elégtelent kap. Annak vizsgálatára, hogy a valószínűségi változó mennyire tér el a középértéktől, a szórást használjuk. Ha a ξ - M(ξ) valószínűségi változó négyzetének létezik a várható értéke, akkor az alábbi összefüggést ξ szórásnégyzetének nevezzük:

][( ).)()( 22 ξξξ MMD −=

Ennek négyzetgyöke a )()( 2 ξξ DD = a ξ valószínűségi változó szórása.

Ha ξ valószínűségi változónak létezik a várható értéke, akkor

( ) ( ) ( )ξξξ 222 MMD −= Ha ξ valószínűségi változó szórása létezik, akkor tetszés szerinti a és b valós szám esetén

( ) ( )ξξ 222 DabaD =+ Ha n21 ..., ξξξ független valószínűségi változó és szórásaik léteznek, akkor összegük és

különbségük szórásnégyzete egyenlő a valószínűségi változók szórásnégyzetének összegével: ( ) ( ) ( ) ( )n

22

21

2n21

2 D...DD...D ξξξξξξ +++=+++ .

Példa: Határozzuk meg hatoldalú szabályos dobókockával történő dobások várható értékét és szórását! ξ = a dobott szám

6

1)( === kPpk ξ , k = 1, 2, 3, 4, 5, 6

M(ξ) = 1/6⋅(1+2+3+4+5+6) = 21/6 = 3,5 A ( ) ( ) ( )ξξξ 222 MMD −= összefüggést felhasználva:

D2(ξ) = 1/6⋅(1+4+9+16+25+36) – (21/6)2 = 91/6 - (21/6)2 = 546/36-441/36 = 105/36. D(ξ) ≈ 1,7078 f) Medián Valamely ξ valószínűségi változó mediánja, me(v Me) az a valós szám, amelyre P(ξ<me) = 0,5. g) Kvantilisek A mediánhoz hasonlóan értelmezhetjük a p-kvantilist. A p-kvantilis az a valós szám, mely az eloszlást p : (1-p) arányban osztja ketté. A fentiek alapján a medián a 0,5-kvantilis. Kvantilis jelölése: xp. Kvantiliseket p adott értékeinél a p-kvantilis megnevezés helyett az értékre utaló

Page 25: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

25

szóhasználattal jelöljük pl. x0,25 kvartilis, x0,1 decilis, x0,01 centilis, stb. Valószínűségi változók jellemzésére gyakran használjuk a kvartiliseket. Az x0,25 értéket első v. alsó, az x0,75 értéket pedig harmadik v. felső kvartilisnek is szokás nevezni. h) Módusz Ha ξ valószínűségi változó lehetséges értékei között van olyan, amelyet nagyobb valószínűséggel vesz fel, mint a többit, akkor ezt az értéket ξ móduszának nevezzük. Folytonos valószínűségi változó esetén ξ módusza a sűrűségfüggvény (lokális) maximumhelye(i). A módusz jele: mo v. Mo. i) Momentumok A ξ valószínűségi változó momentumainak nevezzük a következő számértékeket: - k-adik momentum M(ξk), - k-adik abszolút momentum M(|ξk|), - k-adik centrális momentum M[ξ-M(ξ)]k, - k-adik centrális abszolút momentum M[|ξ-M(ξ)|k], ahol k =1,2,3,…. Látható, hogy ξ első momentuma M(ξ), a valószínűségi változó várható értéke, s második centrális momentuma M[ξ-M(ξ)]2, a szórásnégyzete. j) Ferdeség A ferdeség egy eloszlás aszimmetriájának fokát, azaz a szimmetriától való eltérését mutatja. Ha egy eloszlás sűrűségfüggvénye a centrális maximumától inkább jobbra elnyúló, akkor balra ferdének vagy pozitív ferdeségűnek nevezzük. Ha az ellenkező oldalra nyúlik el, akkor jobbra ferdének vagy negatív ferdeségűnek nevezzük. Ferde eloszlások esetében a várható érték általában a módusznak az elnyúló véggel azonos oldalán fekszik. Pearson-féle első és második ferdeségi együttható:

( ))(

)(1 ξ

ξαD

mM o−= v.

( ))(

)(32 ξ

ξαD

mM e−=

Gyakran használjuk a ferdeség jellemzésére a harmadik centrális momentumból képzett ferdeségi együtthatót:

][( )( )ξ

ξξγ3

3

1

)(

D

MM −=

Unimodális eloszlás esetén a valószínűségi változó sűrűségfüggvényének grafikonja γ1<0 esetén a módusztól balra, γ1>0 esetén a módusztól jobbra hosszan elnyúlik. k) Csúcsosság A csúcsossági mutató egy eloszlásnak – a vele megegyező várható értékű és szórású – normális eloszláshoz viszonyított csúcsosságának (lapultságának) fokát méri. A csúcsosság mérőszáma a negyedik centrális momentumból képzett együttható:

][( )( ) 3

)(4

4

2 −−=ξ

ξξγD

MM

Ha γ2>0, akkor a valószínűségi változó sűrűségfüggvénye magasabban „ugrik ki” és csúcsosabb, mint a megfelelő normális eloszlású valószínűségi változóé.

Page 26: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

26

II.2 Diszkrét elméleti eloszlások5

A valószínűségi változók száma elvileg végtelen lehet. A gyakorlatban azonban viszonylag kis számú valószínűségeloszlás-típus fordul elő. Diszkrét valószínűségi változók közül a menedzsment területén legfontosabbak az alábbi eloszlások.

II.2.a Karakterisztikus eloszlás

Legyen A egy tetszés szerinti esemény. Ha a valószínűségi változó csak a 0 és 1 értéket veheti fel, mégpedig ξ = 1, ha A bekövetkezik és ξ = 0, ha A nem következik be, akkor karakterisztikus valószínűségi változóról, más szóval az A esemény indikátorváltozójáról beszélünk. Képlettel:

P(ξ=1) = p és P(ξ=0) = 1-p = q, ahol 0≤p≤1. A karakterisztikus valószínűségi változó egy bizonyos esemény bekövetkezését jellemzi. A várható értéke és a szórása egyszerűen felírható:

( ) pqpM =⋅+⋅= 01ξ ,

( ) ( ) pqpppppqpD =−=−=−⋅+⋅= 101 22222 ξ ,

( ) pqD =ξ .

II.2.b Diszkrét egyenletes eloszlás

Az egyik legegyszerűbb eloszlásfajta. Gyakorlatban főképp a szerencsejátékokkal kapcsolatban találkozhatunk vele. A menedzsment és az üzleti élet területén ritkán fordul elő. Egyenletes eloszlás esetén a ξ valószínűségi változó által felvehető véges számú érték mindegyike egyenlően valószínű, vagyis

nkPpk

1)( === ξ , k = 1, 2, …, n

Ebben az esetben a várható értéket és a szórást (ill. szórásnégyzetet) viszonylag egyszerűen, az alapképletekbe történő behelyettesítéssel kapjuk:

∑=

=n

iik

nM

1

1)(ξ

2

11

22 11)(

−= ∑∑==

n

ii

n

ii k

nk

nD ξ

II.2.c Binomiális eloszlás

Ha egy kísérlet során az A esemény bekövetkezését, ill. be nem következését vizsgáljuk – azaz alternatív, két kimenetelű eseményről beszélünk -, s az A esemény bekövetkezési valószínűsége P(A) = p, és a kísérletet n-szer egymástól függetlenül megismételjük, akkor ha a vizsgált ξ valószínűségi változó az A esemény bekövetkezésének száma, a ξ valószínűség-eloszlását binomiális eloszlásnak nevezzük, s az alábbi összefüggéssel határozhatjuk meg:

knkk qp

k

nkPp −

=== )(ξ , ahol q = 1-p

5 A fejezet Csernyák L.(szerk.): Valószínűségszámítás, Tankönyvkiadó, Budapest, 1990; Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985; Banks, J.: Principles of Quality Control, Wiley, New York, 1989, megfelelő fejezeteinek a felhasználásával készült.

Page 27: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

27

Az eloszlás várható értéke és szórásnégyzete: M(ξ) = np, D2(ξ) = npq. A binomiális eloszlást a gyakorlatban elsősorban a visszatevéses mintavétel során alkalmazzuk, ill. bizonyos feltételek esetén a hipergeometrikus eloszlás helyettesítésére. Ha p(n+1) szorzat egész szám, akkor az eloszlásnak két módusza van, az (n+1)p-1 és az (n+1)p helyen. Ha p(n+1) nem egész, akkor az eloszlás unimodális és a módusz az (n+1)p egész része. Ha n nagy, akkor az eloszlás módusza az eloszlás várható értékéhez közeli szám, azaz a binomiális eloszlás legnagyobb valószínűséggel a várható értékéhez közeli értéket vesz fel. Példa: A Felvillanyozzuk Kft. 24 speciális karácsonyfaégőt csomagol egy dobozba. A gyártás során a selejtarány 0,25. Átvételkor minden egyes kartonból 5 égőt vesznek ki visszatevéses mintavétellel. A megrendelő nem veszi át a tételt, ha hibás égőt talál a dobozban. Mekkora az átvétel valószínűsége? n = 5 k = 0 p = 0,25

( ) 2373,025,0125,00

5)0( 50

0 =−

=== pP ξ

Hány selejtet tartalmaz a minta a legnagyobb valószínűséggel, s mekkora ez a valószínűség? p(n+1) = 1,5 → p(n+1) egész része = 1

( ) 3955,025,0125,01

5)1( 151

1 =−

=== −pP ξ

Mekkora annak a valószínűsége, hogy a mintában legfeljebb 1 selejtes égő lesz? n = 5 k = 0 v. 1 → P(ξ≤1) = p0 + p1 = 0,2373 + 0,3955 = 0,6328 p = 0,25 Adjuk meg a mintában levő selejt számának várható értékét és szórását! M(ξ) = np = 5⋅0,25 = 1,25 D2(ξ) = npq = 5⋅0,25⋅0,75 = 0,9375 → D(ξ) = 0,9682

II.2.d Hipergeometrikus eloszlás

Ha visszatevés nélkül n elemű mintát veszünk egy N elemszámú sokaságból, melyben s a nem megfelelő egyedek száma, valamint a megfigyelt ξ valószínűségi változó a mintában található selejtes darabok száma, akkor ξ valószínűség-eloszlása hipergeometrikus eloszlással írható le.

−−

===

n

N

kn

sN

k

s

kPpk )(ξ

Az eloszlás várható értéke és szórásnégyzete: M(ξ) = np,

−−−−=

1

11)1()(2

N

npnpD ξ ,

ahol N

sp = .

Page 28: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

28

Ha ugyanabból a sokaságból visszatevéssel, illetve visszatevés nélkül veszünk n elemű mintát, akkor a mintában levő selejtes darabok számának várható értéke ugyanakkora, de a visszatevés nélküli mintavétel esetén a szórás kisebb. Ha n<<N, akkor a szórások közelítőleg megegyeznek. Ezért a gyakorlatban a nehezen kezelhető hipergeometrikus eloszlást a binomiális eloszlással közelítjük. Példa: Tegyük fel, hogy az előző vállalatnál a dobozokból 4 égőt veszünk ki, s elfogadjuk a tételt, ha nem találunk köztük hibás égőt. Ha az egyik dobozban a hibás égők száma 3, akkor mi a valószínűsége, hogy nem vesszük át a dobozt? N =24 s = 3 n = 4 k = 0

Az átvétel valószínűsége ≈ 0,56, azaz a doboz elutasításának valószínűsége 1-0,56=0,44.

II.2.e Poisson-eloszlás

Diszkrét eloszlások közül ez az eloszlás az egyik leggyakrabban előforduló eloszlás a gyakorlatban. A Poisson-eloszlást a kis valószínűségű, vagyis ritka események eloszlástörvényének is nevezik, mivel ezzel az eloszlással írhatók le az ún. véletlen pontelhelyezkedések. Az egyenesen, síkon, térben véletlenszerűen elhelyezkedő pontok esetén egy adott tartományba eső pontok száma, vagy a véletlenszerű időpontokban bekövetkező eseményeknél adott időtartam alatt bekövetkező események száma igen gyakran Poisson-eloszlású. Ilyen eloszlás például e jegyzetben a gépelési hibák száma (Legalábbis nagyon remélem, hogy ez ritka eseménynek tekinthető, s így valóban Poisson eloszlással modellezhető.) Az eloszlás valószínűség-eloszlás függvénye:

λλξ −=== ek

kPpk

k !)( , ahol λ>0 valós szám, az eloszlás paramétere; k = 1, 2, 3, ….

Az eloszlás várható értéke és szórásnégyzete: M(ξ) = λ, D2(ξ) = λ. A Poisson-eloszlás segítségével bizonyos esetekben közelíthetjük a binomiális eloszlást. Ha n elég nagy és p kicsi, akkor aránylag kis k értékekre a binomiális eloszlást a λ = np paraméterű Poisson-eloszlás megfelelő tagjaival közelíthetjük. Az eloszlás módusza, ha λ egész szám, akkor az eloszlás bimodális mo1 = λ-1 és mo2 = λ. Ha λ nem egész szám, akkor a módusz λ egész részénél van, az eloszlás unimodális. Ez azt jelenti, hogy a Poisson-eloszlás legnagyobb valószínűséggel a várható értékét, vagy ahhoz közeli (annál kisebb) értéket vesz fel.

5632,0

4

24

4

21

0

3

)0(0 =

=== ξPp

Page 29: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

29

Példa: Egy mobilszolgáltató társaságnál az ország egy ritkán lakott területén egy adott cellából kezdeményezett hívások száma naponta átlagosan 5 hívás. Mi a valószínűsége, hogy naponta legalább 3, legfeljebb 7 hívást kezdeményeznek ebből a cellából? λ = 5 k = 3, 4, 5, 6, 7 P(3≤ξ≤7) = p3+p4+p5+p6+p7 ≈ 0,1404 + 0,1755 + 0,1755 +0,1462 +0,1044 = 0,742 Hány hívást kezdeményeznek naponta a legnagyobb valószínűséggel, és mekkora ez a valószínűség? Mivel λ egész szám, ezért a λ-1 és a λ bekövetkezésének a valószínűsége a legnagyobb, azaz naponta 4 vagy 5 hívást kezdeményeznek a legnagyobb valószínűséggel, s ez a valószínűség: p4 = p5 = 0,1755.

II.3 Folytonos elméleti eloszlások6

II.3.a Folytonos egyenletes eloszlás

A folytonos egyenletes eloszlás a gyakorlatban ritkán fordul elő. Legfőbb alkalmazási területe a különböző eloszlású valószínűségi változók számítógépes szimulációja. Egy ξ folytonos valószínűségi változó a véges hosszúságú (a,b) intervallumon (ahol a<b) egyenletes eloszlású, ha sűrűségfüggvénye:

⟨⟨−

=

gyébként 0,

bxa ha , 1

a xha ,0

)(

e

abxf

Az egyenletes eloszlás eloszlásfüggvénye:

≤⟨−−

=

b xha 1,

bxa ha ,

a xha ,0

)( ab

axxF

Az egyenletes eloszlás várható értéke: M(ξ) = (a+b)/2 Az egyenletes eloszlás szórása:

12

)()(

2abD

−=ξ

6 A fejezet Csernyák L.(szerk.): Valószínűségszámítás, Tankönyvkiadó, Budapest, 1990; Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985; Banks, J.: Principles of Quality Control, Wiley, New York, 1989, megfelelő fejezeteinek a felhasználásával készült.

Page 30: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

30

II.3.b Exponenciális eloszlás

Exponenciális eloszlás leginkább bizonyos véletlen hosszúságú időtartamok eloszlásaként lép fel. Exponenciális eloszlással írható le például egy olyan berendezésnek ill. alkatrésznek az élettartama, hibamentes működési ideje, melynek tönkremenetelét nem kopás vagy természetes elhasználódás okozza, hanem váratlan törés szakadás illetve egyéb véletlen ok. Az exponenciális eloszlású valószínűségi változó sűrűségfüggvénye:

f x( )

,

=⟨

0 ha x 0

e ha x 0- xλ λ , ahol λ>0

eloszlásfüggvénye:

F x( )

,

=⟨

− ≥

0

1

ha x 0

e ha x 0- xλ

várható értéke M(ξ) = 1/λ és szórása: D(ξ) = 1/λ. Példa: A Felvillanyozzuk Kft. speciális karácsonyfaégőinek átlagos élettartama a gyári mérések szerint 250 üzemóra. Mennyi annak a valószínűsége, hogy egy égő éppen a 100-adik órában megy tönkre? M(ξ) = 1/λ = 250 óra → λ = 1/250 = 0,004 1/óra

P(99 < ξ < 100) = F(100) – F(99) = 003,067,0673,0)1(1 25099

250100

=−=−−− −−ee

Mennyi annak a valószínűsége, hogy egy égő 250 üzemóra előtt tönkremegy?

P(ξ < 250) = F(250) = 632,011 1250

250

1

≈−=− −−ee

Legfeljebb hány órát működik az égők fele? A keresett érték az eloszlás mediánja.

P(ξ < me) = F(me) = 5,01 250

1

=−− em

e → me = 173,3 óra

II.3.c Normális (Gauss-) eloszlás

A leggyakoribb eloszlás a gyakorlati életben a menedzsment területén előforduló elméleti eloszlások közül. Ha egy valószínűségi változó értékét nagyszámú, egymástól függetlenül ható véletlen tényező határozza meg úgy, hogy az egyes tényezők külön-külön csak igen kis mértékben járulnak hozzá az összes véletlen hatásból eredő ingadozáshoz, és az egyes tényezők hatásai összeadódnak, akkor általában normális eloszlású valószínűségi változót kapunk. (Lásd később a központi határeloszlás tételt.)

Page 31: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

31

Normális eloszlással írható le például: • arányos skálán mérhető termékjellemzők (például: szélesség, hosszúság,

vastagság, tömeg, összetétel) és technológiai paraméterek (például: hőmérséklet, nyomás, sebesség) matematikai modellezése,

• egyéb, több tényező összegződése révén előálló mennyiség eloszlásának modellezése (például: testmagasság, munkabérek, eseményidő a hálótervezésben, élettartam, javítási idő),

• véletlen jellegű mérési hibák matematikai leírása, • technológiai folyamatok irányítási algoritmusának kialakítása (például:

számtani átlag alapján történő szabályozás). A normális eloszlású valószínűségi változó sűrűségfüggvénye:

2

2

2

)(

2

1)( σ

µ

πσ

−−

=x

exf , ahol -∞<x<∞ ,

eloszlásfüggvénye:

dxexFx x

∫∞−

−−=

02

2

2

)(

02

1)( σ

µ

πσ

várható értéke: M(ζ) = µ és szórása: D (ζ) = σ. Az F(x) függvény nem elemi függvény, értékeit táblázat alapján határozhatjuk meg. A µ, σ paraméterű normális eloszlást röviden N(µ, σ)–val jelöljük. A µ=0, σ=1 paraméterű normális eloszlású valószínűségi változót standard normális eloszlásúnak nevezzük. Normális eloszlás esetén ennek a standard normális eloszlásnak az eloszlásfüggvény értékei találhatóak meg táblázatban, s tetszőleges N(µ, σ)-ra vonatkozó valószínűségeket az N(0,1) táblázat segítségével határozzuk meg. A normális eloszlással történő gyakorlati számításokat jelentősen megkönnyítjük, ha az

σµ−= x

z

transzformációval az x változó helyett bevezetjük a z változót, s az így kapott. standard normális eloszlás valószínűségi függvényeivel számolunk. A standard normális eloszlás jelentőségét az adja, hogy bármely N(µ, σ) eloszlás F(x) eloszlásfüggvénye mindig kifejezhető az N(0,1) eloszlás Φ(z) eloszlásfüggvényével: F(x) = Φ(z) Mivel a standard normális eloszlás 0 körül szimmetrikus, ezért:

Φ(-z) = 1 - Φ(z) Példa: Határozzuk meg annak valószínűségét, hogy az N(µ, σ) eloszlású valószínűségi változó a várható értékétől legfeljebb szórásnyira, két szórásnyira, három szórásnyira tér el! P(µ-σ < ξ < µ+σ) = F(µ+σ) – F(µ-σ) =

1)1(2))1(1()1()1()1( −Φ=Φ−−Φ=−Φ−Φ=

−−Φ−

−+Φσ

µσµσ

µσµ=

P(µ-σ < ξ < µ+σ) = 2⋅0,8413 –1 = 0,6826

Page 32: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

32

A fenti számolási menetet alkalmazva 2 ill. 3-szoros szórásnyira való eltérésre az alábbi eredmények adódnak: P(µ-2σ < ξ < µ+2σ) = 2⋅0,9772 –1 = 0,9544, P(µ-3σ < ξ < µ+3σ) = 2⋅0,99865 –1 = 0,9973, Vagyis a ξ a várható értékétől legfeljebb szórásnyira kb. 0,68, legfeljebb két szórásnyira kb. 0,95 ill. legfeljebb három szórásnyira kb. 0,997 valószínűséggel tér el. A normális eloszlás fenti tulajdonságát nevezzük „háromszigma szabálynak”. Ezt mutatja a 9. ábra.

µ-3σ µ-2σ µ-1σ µ µ+1σ µ+2σ µ+3σ 68,26 % 95,44 % 99,73 %

9. ábra: A „háromszigma szabály”

Példa: Egy gép által készített alkatrész hossza normális eloszlású, melynek várható értéke 20 cm, szórása 0,4 cm. Mi a valószínűsége, hogy az alkatrész hossza az előírástól legfeljebb 0,6 cm-rel tér el? P(19,4 < ξ < 20,6) = F(20,6) – F(19,4) =

1)5,1(2)5,1()5,1(4,0

204,19

4,0

206,20 −Φ=−Φ−Φ=

−Φ−

−Φ =

= 2⋅0,9332 –1 = 0,8664 Milyen szórással kell dolgoznia a gépnek, hogy 98%-ban jó alkatrészt készítsen, ha a tűrés ±0,5 cm? P(19,5 < ξ < 20,5) = F(20,5) – F(19,5) = 0,98

98,01)5,0

(2205,19205,20 =−Φ=

−Φ−

−Φσσσ

99,05,0 =

Φσ

Page 33: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

33

A standard normális eloszlás táblázat alapján:

33,25,0 ≈

σ → σ ≈ 0,21

Tehát kb. 0,21 cm-es szórás esetén a gép által gyártott alkatrészek 98%-a megfelelő méretű.

II.4 A nagy számok törvényei7

A valószínűségszámítás gyakorlati felhasználhatóságának elméleti hátterét azok a tételek alkotják, amelyeket a nagy számok törvényei néven ismerünk. Ezek a törvények lényegében azt fejezik ki, hogy a véletlen jelenséggel kapcsolatos valószínűségeloszlás tulajdonságai annál jobban közelítik az előző fejezetekben tárgyalt elméleti jellemzőket, minél nagyobb számú megfigyelésre támaszkodunk. Több ilyen tétel is ismeretes, ezek közül mi csak néhány kiemelkedően fontosat említünk.

II.4.a Nagy számok törvényének Bernoulli-féle alakja

A valószínűség fogalmának bevezetésekor hivatkoztunk arra a tapasztalati tényre, hogy a relatív gyakoriság nagyszámú független kísérlet esetén bizonyos stabilitást mutat. Ez a tény teszi lehetővé a gyakorlatban a valószínűség „mérését”, egy többször megismételhető véletlen esemény valószínűsége kísérletileg mindig meghatározható a gyakorlatot kielégítő pontossággal. A relatív gyakoriság és a valószínűség közötti összefüggést először Jacob Bernoulli fogalmazta meg a 17. és 18. század fordulója táján. Ezt a tételt szokás „a nagy számok törvényének” nevezni. Bernoulli tétele: Ha egy kísérlet során megfigyelt A esemény bekövetkezési valószínűsége p, az eseményre vonatkozó n független kísérlet során az esemény gyakorisága fA, s ε tetszőleges pozitív szám, akkor

( )2

1

εε

n

ppp

n

fP A −≤

≥− .

A tétel szerint tehát bármely kis pozitív ε esetén, ha a kísérletek száma (n) - ε-tól függően – elég nagy, akkor kicsi annak a valószínűsége, hogy az esemény relatív gyakorisága (fA/n) az esemény valószínűségétől (p) abszolút értékben legalább ε-nyira eltérjen, vagyis a relatív gyakoriság bizonyos stabilitást mutat. A gyakorlati problémáknál általában p és q értékek nem ismertek, hiszen sokszor éppen azért végzünk kísérleteket, hogy egy véletlen esemény ismeretlen valószínűségét becsülhessük. Ekkor a fenti egyenlőtlenség helyett, annak ún. gyengébb változatát, a

241ε

εn

pn

fP A ≤

≥−

egyenlőtlenséget tudjuk csak alkalmazni. Ez abból adódik, hogy a pq szorzat akkor maximális, ha p=0,5 (és így q=0,5), ezért biztosan teljesül, hogy pq ≤ 0,25.

7 A fejezet Csernyák L.(szerk.): Valószínűségszámítás, Tankönyvkiadó, Budapest, 1990; Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985; megfelelő fejezeteinek a felhasználásával készült.

Page 34: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

34

II.4.b Központi határeloszlás tétele

A központi határeloszlás tétele a sok véletlen komponens különféle függvényeinek (például összegének, szorzatának, maximumának) aszimptotikus eloszlásaival foglalkozó határeloszlás-tételek közül a legfontosabb a gyakorlat számára. A tétel magyarázatot ad arra, hogy miért találkozunk oly gyakran a természet és a társadalom jelenségeinek törvényszerűségeit vizsgálva a normális eloszlással. A központi határeloszlás tétele értelmében, ha η1, η2, ....., ηn, azonos eloszlású, véges M(ηi) várható értékű és véges D(ηi) szórású független valószínűségi változók, akkor a belőlük képzett ξ = η1+ η2+ .....+ ηn valószínűségi változó eloszlása n→ ∞ esetén nM(ηi) várható

értékű, ( ) nD iη szórású normális eloszlás.

A tapasztalat azt mutatja, hogy már aránylag kis n esetén is az előbbiekben felsorolt tulajdonságokkal rendelkező valószínűségi változók összegéből képzett ξ valószínűségi változó közelítőleg normális eloszlásúnak tekinthető. (10. ábra)

10. ábra: A dobott számok összegének valószínűség-eloszlása

Page 35: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

35

II.5 Tapasztalati (empirikus) eloszlásfüggvény

A ξ valószínűségi változóra végzett véges sok (n elemű) megfigyelés eredményét (ξ1, ξ2, …, ξn) statisztikai mintának nevezzük. Az n számú kísérlet tényleges elvégzése során mindegyik ξi mintaelem egy konkrét számértéket vesz fel (ξ1=x1, ξ2=x2, …, ξn=xn). (Ugyancsak statisztikai mintának nevezzük az x1, x2, …, xn értékhalmazt is.) Definíció: Az Fn(x) tapasztalati (empirikus) eloszlásfüggvény valamely x helyen, az x-nél kisebb megfigyelések számának relatív gyakorisága:

( ) ∑<

=xx

n

in

xF 11

.

Legyen a ξ valószínűségi változó eloszlásfüggvénye P(ξ<x) = F(x). A nagy számok törvénye (Bernoulli-tétele) szerint a ξ<x esemény relatív gyakorisága a mintaszám növekedésével ezen esemény valószínűségéhez közelít, ezért

( ) ( )( ) ( ) ( )( )22 4

11

εεε

nn

xFxFxFxFP n ≤−≤≥− .

Az empirikus eloszlásfüggvény a minta elemszámának növekedésével minden x-re egyenletesen konvergál az F(x) eloszlásfüggvényhez. Ezt a tényt fejezi ki Glivenko-tétele, melyet szokás a matematikai statisztika alaptételének is nevezni. Glivenko-tétele: Legyen ξ1, ξ2, …, ξn a ξ valószínűségi változóra vonatkozó n elemű statisztikai minta, és legyen F(x) ξ eloszlásfüggvénye. Legyen Fn(x) a minta tapasztalati eloszlásfüggvénye, továbbá ∆n az elméleti és a tapasztalati eloszlásfüggvények közötti abszolút eltérés maximuma, azaz ∆n = max|Fn(x) – F(x)|, ekkor ∆n 1 valószínűséggel egyenletesen 0-hoz konvergál. A tétel lényegében azt mondja ki, hogy elég nagy minta esetén a tapasztalati eloszlásfüggvény értéke minden x-re tetszőleges közel van F(x) értékéhez, és n növelésével mindenütt annak közelében marad. Amikor valamely valószínűségi változó eloszlására következtetünk mintavétel útján, akkor eljárásunk jogosultsága Glivenko-tételén alapszik.

Page 36: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

36

III. Mintavétel

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Page 37: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

37

III.1 A matematikai statisztika tárgya8

A matematikai statisztika a valószínűségszámítás önálló fejezete, amely a gyakorlat számára igen nagy jelentőségű. A matematikai statisztika tárgya a véletlen tömegjelenségekben rejlő statisztikai törvényszerűségek vizsgálata. A valószínűségelméletben ismertnek tételeztük fel valamely változó eloszlásfüggvényét és annak paramétereit, ezek birtokában válaszoltunk valószínűségi jellegű kérdésekre. A gyakorlatban (és a matematikai statisztikában) azonban arra a kérdésre keressük a választ, hogy pl. bizonyos típusú házgyári panel esetében mi a valószínűsége, hogy a hosszabbik oldal hosszát jelölő ξ valószínűségi változó értéke [399,401) intervallumba esik. Tapasztalatból tudjuk, hogy a panel hossza (ξ) normális eloszlású valószínűségi változó. Nem tudjuk azonban, hogy az adott gyártási technológia alkalmazásakor milyen µ várható értékű és σ szórású normális eloszlású valószínűségi változóval számolhatunk. A paraméterek ismerete nélkül a kérdéses valószínűséget nem tudjuk kiszámítani. Ahhoz, hogy ezek alapján a paramétereket meghatározhassuk, meg kell mérnünk az adott típusú panelből minél több darabnak a hosszabbik oldalát. A matematikai statisztika foglalkozik azzal a kérdéssel, hogy a kapott mérési eredményekből hogyan kaphatjuk meg pl. a várható értéket. Mint látni fogjuk nem arról van szó, hogy pontosan kiszámoljuk a keresett elméleti értéket (paramétert), hanem meg kell elégednünk annak közelítő meghatározásával, becslésével. Sokszor konkrét feltevést, hipotézist szeretnénk megvizsgálni, eldönteni, hogy a tapasztalati adatok alapján hipotézisünk elfogadható-e, vagy ellenkezőleg az adatok nem támasztják alá feltevésünket, elvetjük hipotézisünket. Valamely hipotézis helyességének eldöntésével foglalkozik a matematikai statisztika hipotézisvizsgálatról szóló fejezete. A becsléselmélet mellett a hipotézisvizsgálat a matematikai statisztika másik nagy problémaköre, amelynek alapjául ugyancsak megfigyelési (mérési) adatok szolgálnak. Minthogy a gyakorlatban mindig véges számú minta alapján számolunk, a helyes döntést 100%-os biztonsággal nem tudjuk megadni. A matematikai statisztika megállapítja a hibás döntés meghozatalának valószínűségét, és olyan módszereket szolgáltat, amelyek alkalmazása esetén a hibás döntés viszonylag ritkán fordul elő. A mondottak alapján a matematikai statisztika alapvető feladatát nagy általánosságban így fogalmazhatjuk meg: következtetés tapasztalati (megfigyelési, mérési) adatokból események ismeretlen valószínűségeire, valószínűségi változók ismeretlen eloszlásfüggvényére vagy azok paramétereire. A matematikai statisztika lényegét foglalja össze a 11. ábra.

8 A fejezet Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985 felhasználásával készült.

Page 38: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

38

Mintavételi alapelvek

SokaságSokaság

MintaMinta

MintavételMintavétel

KövetkeztetésKövetkeztetés

F(x), M(F(x), M(ξξ),),D(D(ξξ) ) ……..

FFnn(x),(x),MeMe, s*..., s*...

11. ábra: Mintavételi alapelvek

III.2 Mintavételi hiba9

A vizsgálat tárgyát képező egységek összességét, halmazát statisztikai sokaságnak, vagy röviden sokaságnak nevezzük.

A statisztikai minta valamely valószínűségi változóra vonatkozó véges számú független kísérlet vagy megfigyelés (mérés) eredménye: véges sok, azonos eloszlású független valószínűségi változó együttese. Az egyes megfigyelési eredményeket a minta elemeinek, a megfigyelések számát a minta nagyságának vagy elemszámának nevezzük10

Mint láttuk a matematikai statisztika lényege, hogy a sokaságnak csak egy részét (a mintát) vizsgáljuk, ezért a statisztikai módszerek alkalmazásakor sohasem (kivéve természetesen a 100%-os mintavételt, de az már nem matematikai statisztika) lehetünk biztosak a döntésünkben. Következtetésünk természetesen alapvetően a mintán, a mintából meghatározott jellemzőkön alapul. Ugyanakkor mi nem a minta, hanem az egész sokaság tulajdonságaira vagyunk kíváncsiak, azaz a részleges megfigyelések eredményeiből következtetünk a teljes sokaságra. A statisztikai mintavételek és az ebből származó adatokat felhasználó elemzések, következtetések tehát mindig tartalmaznak hibákat. A hiba szó jelentése ebben az esetben kissé eltér a hétköznapi szóhasználatban megszokottól. A statisztikai hiba nem jelent szükségképpen valamilyen tévedést, nem megfelelő munkavégzést, figyelmetlenséget stb. hiszen a leggondosabban elvégzett mintavétel és elemzés is tartalmaz hibákat, melyek egy része elkerülhetetlen. A statisztikai hiba, aminek egy része a módszertan sajátosságaiból (mintavétel, tömörítés, közelítés, becslés stb.) adódik, a statisztika szükségszerű velejárója. A mintavétellel kapcsolatos hibák alapvetően két nagy csoportba sorolhatók. Egyik részük a mintával kapcsolatos teendőkhöz, az adatgyűjtéshez kapcsolódik, s független attól, hogy teljes körű vagy részleges-e az adatgyűjtés. Ilyen hibák adódhatnak abból, hogy a vizsgálni kívánt sokaságot nem tudjuk teljesen vagy helyesen áttekinteni, pontatlan az adatgyűjtés (kérdőív, a mérés stb.), hibásan rögzítik az adatokat stb. Ezek nagy része elsősorban emberi figyelmetlenségből, nem kellő körültekintésből, hibából (a szó hétköznapi értelmében), félreértésből stb. származik. Az ilyen hibák tehát függetlenek attól, hogy a teljes

9 A fejezet Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996 felhasználásával készült. 10 Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985

Page 39: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

39

sokaságot vizsgáljuk-e, vagy mintavételt alkalmazunk, ezért ezeket nem mintavételi hibának nevezzük. A hibák másik forrása az, hogy a részleges vizsgálatok (mintavétel) esetén pusztán abból a tényből adódóan, hogy nem a teljes sokaságot figyeljük meg, hiba adódhat. Ezt a hibát a továbbiakban mintavételi hibának nevezzük. A mintavétel tervezésekor – nem lebecsülve a nem mintavételi hiba jelentőségét – elsősorban a jól mérhető, számszerűsíthető mintavételi hibából indulunk ki, és olyan eljárásokat keresünk, amelyek mellett a mintavételi hiba a lehető legkisebb. A mintavételi hiba a sokaság jellegén, az alkalmazott mintavételi eljáráson és a szóban forgó mutatószám milyenségén túlmenően alapvetően a mintanagyságtól függ, ahogy azt a 12. ábra is mutatja:

mintanagyság

mintavételihiba

mintanagyság

mintavételihiba

12. ábra: A mintanagyság és a mintavételi hiba kapcsolata

Az ábrából látható, hogy a pontosság és az olcsóság (kicsi mintaszám) egymásnak ellentmondó követelmények. A mintavételek tervezésének éppen ez a kiindulópontja.

III.3 Mintavételi eljárások11

A mintavétel alapkérdéseivel (független, reprezentatív minták, véletlen mintavétel, visszatevéses, visszatevés nélküli mintavétel, stb.), a mintanagyság meghatározásával az előző félévben foglalkoztunk. Most a gyakorlatban általában alkalmazott mintavételi eljárásokat tekintjük át röviden. A statisztikai minta fenti definíciója szerint a minta elemeinek azonos eloszlásúnak és függetlennek kell(ene) lenniük. E feltételeket a gyakorlati mintavételi feladatok során csak viszonylag ritkán lehet pontosan teljesíteni, mivel ez nem csak a mintavételi stratégiától (visszatevéses v. visszatevés nélküli), hanem a sokaság jellegétől is függ. Például a nagy elemszámú homogén sokaságból vett (pl. folyamatos tömegtermelés minőségi ellenőrzését szolgáló) véletlen minták jó közelítésben ilyennek tekinthetők, még akkor is, ha a kiválasztás visszatevés nélkül történik. Azt már láttuk korábban, hogy a mintavétellel kapcsolatos legalapvetőbb elvárást, a reprezentatív mintákat, főképp a véletlen kiválasztás biztosítja. Ezért először ezeket a véletlenen alapuló mintavételi terveket tekintjük át, majd megemlítünk néhány gyakorlatban használt nemvéletlen mintavételi eljárást is.

III.3.a Egyszerű véletlen mintavétel

Ez a legegyszerűbb mintavételi eljárás. Egyszerű véletlen mintavételt használunk homogén, véges elemszámú sokaság esetén, amikor a mintát visszatevés nélkül választjuk ki, minden

11 A fejezet Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996 felhasználásával készült.

Page 40: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

40

lehetséges n elemű minta kiválasztásának azonos valószínűséget biztosítva. N elemű

sokaságból összesen

n

N különböző összetételű mintát kaphatunk, melyek előfordulási

valószínűsége azonos. Mint már említettük, a gyakorlatban a vizsgált sokaságok ritkán homogének, ezért tiszta alkalmazása viszonylag ritka, de jó kiindulópontul szolgál az összetettebb eljárások tárgyalásához. Emellett egyfajta viszonyítási alapul szolgál, a további eljárások pontosságát, költségét stb. általában az egyszerű véletlen mintához hasonlítjuk. Az egyszerű véletlen minta készítése általában a sokaság elemeit tartalmazó komplett lista segítségével történik. Ennek összeállítása az első feladat. A következő lépés a mintanagyság meghatározása, amelyet a pontossági követelmények, a sokaság szórása, valamint gyakorlati szempontok (pl. költségkeret) határoznak meg. A minta kiválasztása ezután a lista alapján véletlenszerűen (véletlenszám-táblázat, illetve számítógépes véletlenszám-generátor) történik. Természetesen a mintavétel gyakorlati megvalósítása során a véletlen mintavételt más módon is próbáljuk közelíteni. Gyakran alkalmazzák a szisztematikus kiválasztást, amelynek lényege az, hogy ha n elemű mintát kívánnak venni, egy N elemű sokaságból, akkor először meghatározzák a k=N/n lépésközt, majd egyetlen véletlen kiindulópontból (k0) egymás után felveszik a k lépésközt. Így az első mintaelem a k0-adik sokasági elem lesz, a második a k0+k-dik, és így tovább. Ha a lista végére értünk, akkor a számolást a sokaság elejétől folytatjuk. Ez az eljárás rendkívül egyszerű, hiszen a minta így gyorsan és mechanikusan kiválasztható. Könnyen belátható, hogy ha a lista a vizsgált tulajdonság, jellemző (statisztikában használt fogalommal: ismérv) szerint véletlenszerűen van sorba rendezve, akkor a szisztematikus kiválasztás megegyezik a véletlen kiválasztással. Ha például egy ABC sorrendben felvett listánk van a Minőségmenedzsment I. éves hallgatókról, akiknek az előző félévi statisztika tudását (osztályzatait) szeretnénk mintavétel segítségével megvizsgálni, akkor a szisztematikus kiválasztás megegyezik a véletlen kiválasztással, hiszen nagyon valószínű, hogy a nevek kezdőbetűi és a kapott osztályzat között nincs sztochasztikus összefüggés. Más a helyzet azonban, ha a két ismérv sztochasztikus kapcsolatban van egymással. Ha a hallgatók a félév során látogatott órák száma szerint vannak sorbarendezve, s ebből a listából választunk szisztematikus mintavétellel a statisztika tudás becslésére, akkor a kapott minta nem a véletlen minta tulajdonságaival fog rendelkezni. (Feltételezve természetesen, hogy az órán való részvétel és a vizsgajegy között van valamilyen – pozitív vagy negatív – kapcsolat.) A legnagyobb hibák akkor adódnak, ha a lista a vizsgált ismérv szerint periodikus hullámzást mutat. Ilyen esetben a szisztematikus kiválasztás félrevezető eredményeket adhat.

III.3.b Rétegzett mintavétel

A rétegzett mintavétel alkalmazása elsősorban akkor célszerű, ha a sokaság heterogén, s előzetes információink vannak arra nézve, hogy ezt a sokaságot hogyan lehet - a vizsgált ismérv szempontjából – homogén, de legalábbis kevésbé heterogén csoportokba sorolni. Ha jól választottuk meg a rétegképző ismérvet, a rétegzett mintavétel azonos mintanagyság esetén általában kisebb mintavételi hibát eredményez, mint az egyszerű véletlen kiválasztás. Másként fogalmazva, ha azonos pontosságot akarunk elérni egy egyszerű véletlen és egy rétegzett mintavétel segítségével, akkor az egyszerű véletlen mintavétel esetén ehhez nagyobb minta, és így nagyobb költségek szükségesek. A gyakorlati tapasztalatok azt mutatják, hogy jól végrehajtott rétegzéssel az eredeti mintanagyság tört része (harmada, negyede) is elegendő a megfelelő pontosság eléréséhez.

Page 41: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

41

Rétegzett mintavétel esetén az elsődleges cél – azaz, hogy a heterogenitást is figyelembe vevő mintából megbízható következtetéseket tudjunk levonni – mellett természetesen következtetéseket szeretnénk megfogalmazni az egyes részsokaságok jellemzőire is. Alkalmazása többnyire szintén listák felhasználásával történik, sőt feltételezi a rétegenkénti listák ismeretét is. Rétegzett mintavétel során először is a sokaságot többé-kevésbé homogén rétegekbe soroljuk be úgy, hogy a rétegek átfedésmentesen és teljesen fedjék a sokaságot, majd az egyes rétegeken belül, egymástól függetlenül egyszerű véletlen mintavételt hajtunk végre. Annak meghatározására, hogy a teljes mintaszámot hogyan osszuk szét az egyes rétegek között, azaz az egyes rétegekből vett minták elemszáma mekkora legyen, több módszer is létezik:

• Egyenletes elosztás. Ennek lényege, hogy minden egyes rétegbe azonos számú mintaelem kerüljön. Ennek az elosztásnak a fő előnye, hogy egyszerű, semmilyen komoly tervezési, szervezési előkészítést nem igényel, végrehajtása egyszerű. Másrészt, ha végeredményként az egyes rétegek mutatóira is kíváncsiak vagyunk, ennél az elosztásnál az egyes rétegek mintavételi hibáinak összege minimális.

• Arányos elosztás. Lényege, hogy a mintába a rétegek elemszámának megfelelő

arányba választjuk meg az elemszámot, kétszer nagyobb rétegből kétszer nagyobb mintát veszünk. Előnye szintén az egyszerűség. További előnyös tulajdonság, hogy a mintában ugyanazok a súlyarányok érvényesülnek, mint a sokaságban. Végül kedvező tulajdonsága az arányos elosztással kapott mintának, hogy ha a rétegenkénti elméleti (sokasági) szórásokat nem ismerjük, illetőleg azonosnak tekintjük, akkor az alapvető mutatók esetében optimálisnak tekinthető, azaz az ebből számított mutatók mintavételi hibája minimális. Ezért ez az elosztás a gyakorlat számára kivételesen fontos.

• Neyman-féle optimális elosztás. Alkalmazásához előre ismernünk kell

rétegenként az elméleti (sokasági) szórásokat. Ekkor rögzített mintanagyság esetén kedvezőbb tulajdonságú mintát kapunk, ha a nagyobb szóródású rétegekből nagyobb, a kisebb szóródásúakból kisebb mintát veszünk. Fontos tulajdonsága ennek az elosztásnak, hogy a főátlagot ilyen mintából számítva (adott mintaszám mellett) minimális mintavételi hibához jutunk. Innen az optimális elnevezés. Hátránya viszont, hogy végrehajtása általában nem egyszerű, hiszen nehéz megbízható előzetes információkat nyerni a rétegenkénti szórásra.

• Költségoptimális elosztás. Ez az elosztás feltételezi, hogy a sokasági szórások

ismerete mellett előre ismerjük az egyes rétegek megfigyelési egységköltségeit is.

III.3.c Csoportos mintavétel

Csoportos mintavételt homogén, véges sokaságokból való mintavételkor használunk, olyankor, amikor a sokasági elemek teljes listája nem áll rendelkezésre, de nagyobb összetartozó egységekre (csoportokra) rendelkezésre áll a lista. Ugyancsak csoportos mintavételt alkalmazunk olyan esetekben, amikor a csoportok (pl. területek) koncentráltságuk következtében viszonylag olcsóbban figyelhetők meg, mint hasonló számosságú, de nem koncentráltan előforduló egyedek. Csoportos mintavétel esetén a csoportok közül választunk egyszerű véletlen mintavétellel, majd az így kiválasztott csoportot teljes körűen megfigyeljük. Ha az általános iskolás gyerekek fogmosási szokásait szeretnénk megvizsgálni, akkor az egyszerű véletlen mintavétel azt jelentené, hogy az összes általános iskolás gyerek közül

Page 42: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

42

kellene választani, ami nem egyszerű feladat, nem beszélve arról, hogy milyen utazási vagy egyéb költséggel járna egy-egy tanulót megkérdezni az ország különböző településein. Ehelyett sokkal egyszerűbb, ha az általános iskolák közül választunk véletlenszerűen (ilyen lista létezik, s viszonylag könnyen hozzáférhető), majd a kiválasztott iskola valamennyi tanulóját megkérdezzük. A csoportos mintavétel általában egyszerűsíti, és olcsóbbá teszi a mintavételt az azonos nagyságú véletlen mintához képest. A csoportos minta pontosságának lényeges meghatározója a csoporton belüli homogenitás ill. heterogenitás. Ha ugyanis nagy a csoporton belüli homogenitás, akkor a csoportos mintavétel azáltal, hogy a kiválasztott csoportok minden elemét megfigyeli, sok felesleges megfigyelést tartalmaz, ami adott mintanagyság esetén rontja a pontosságot és a hatásosságot.

III.3.d Többlépcsős mintavétel

A többlépcsős mintavételt hasonló esetekben használjuk, mint a csoportos mintavételt, a különbség mindössze annyi, hogy a többlépcsős esetben több lépésen keresztül jutunk el a megfigyelési egységekig. A legegyszerűbb és leggyakoribb eljárás a kétlépcsős mintavétel, amikor az első lépésben csoportos mintavételt alkalmazunk, majd a – csoportos mintavétellel ellentétben – mintába került csoportokból is (többnyire egyszerű véletlen) mintát veszünk. Alkalmazásához lényegében ugyanazok a feltételek szükségesek, mint a csoportos kiválasztás esetén, de előnyös tulajdonsága az, hogy, többé-kevésbé homogén csoportok teljeskörű – és ennélfogva redundáns – megfigyelése helyett ebben a lépésben is mintára támaszkodik, így általában azonos mintanagyság esetén kisebb mintahibákat eredményez, mint a csoportos mintavétel.

III.3.e Nemvéletlen mintavételi eljárások

Az eddig tárgyalt mintavételi módszerek a véletlen kiválasztáson alapultak, ezzel biztosítva a minta kedvező tulajdonságait, reprezentativitását. Vannak azonban a gyakorlatban kialakult olyan eljárások, melyek nem a véletlen kiválasztáson alapulnak, ezért ezek a minták nem tekinthetők statisztikai mintának. Az így kapott mintáknak hátrányos tulajdonságaik vannak. Ezek leglényegesebbje az, hogy esetükben általában nincs biztosítva az, hogy a sokaságra valóban jellemzők legyenek, így félrevezető következtetések forrásai lehetnek. Ugyancsak nem lehetséges ilyen minták esetén a mintából számított jellemzők hibáját meghatározni, azaz a bizonytalanságot, a tévedés várható nagyságát becsülni. Mindazonáltal a nemvéletlen eljárásokat viszonylag széles körben alkalmazzák, elsősorban azért, mert végrehajtásuk egyszerűbb, és esetenként összehasonlíthatatlanul olcsóbb, mint egy korrekten megtervezett és végrehajtott véletlen mintavétel. Főleg igénytelen felvételek (gyors elővizsgálatok) esetén alkalmazhatók. Az alábbiakban röviden bemutatjuk a nemvéletlen mintavételi eljárások főbb módszereit: • A szisztematikus kiválasztásról már volt szó az egyszerű véletlen kiválasztással

kapcsolatban. Láttuk azonban, hogy bizonyos esetekben – főleg időbeli megfigyelések esetén – a periodicitás miatt kerülendő. Az ilyenkor kapott minta nem tekinthető véletlen mintának.

• A másik eléggé elterjedt módszer a kvótás kiválasztás. Ennek lényege, hogy a felvételt

készítő személyek (kérdező biztosok) megkapják előre, hogy milyen összetételű mintához kell jutniuk, de előre adott kereteken belül rájuk van bízva az, hogy ezeket véletlen kiválasztással kitöltsék. Ne felejtsük el azonban, hogy a szubjektív, ötletszerű kiválasztás nem azonos a tervezett véletlen kiválasztással.

Page 43: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

43

• A következő nem véletlen eljárás a koncentrált kiválasztás. Ennek lényege, hogy erősen koncentrált sokaságok esetén, ahol tehát viszonylag kevés egyed rendelkezik nagy befolyással a sokasági jellemző kialakításában, ezeknek nagyobb esélyt adunk a mintába való bekerülésre. A fogyasztói árindex számításánál például, úgy választják ki az ún. reprezentásokat, hogy azok a forgalom döntő hányadát képviseljék. Ezek alapján a cukor árindexét célszerű a legjellemzőbb, legnagyobb forgalmat jelentő csomagolt kilós kristálycukor árindexéhez (is) kötni. Ez a termék tehát mindenféleképpen bekerül a mintába, ezért nem lehet véletlen kiválasztásról beszélni.

• Inkább érdekessége, mintsem jelentősége miatt említjük a hólabda kiválasztást, amelyet

ritka és nehezen számbavehető sokaságok esetén alkalmaznak. A mintavétel során kiindulnak néhány kiválasztott egyedből, majd ezek mindegyike ismeretségi körében keresi a következő mintaelemeket, és az új egyedek szintén továbbadják a kérdőíveket, illetőleg segítenek újabb egyedeket bevenni a mintába.

Összefoglalás Az eddigiek során áttekintettük a mintavétel tervezése során alkalmazott főbb véletlen és nemvéletlen eljárásokat. Ezek mindegyike külön-külön fontos módszer, de a gyakorlatban az említett eljárásokat többnyire kombináltan alkalmazzák. Az egyik ilyen kombinált alkalmazás lényege az, hogy a helyes mintavétel kialakításához szükséges információkat egy előzetes, általában kisebb igényű és költségű mintavétellel biztosítják. Ezeket szokták előzetes mintavételnek nevezni. Ezek leggyakrabban a sokaság homogenitását ill. heterogenitását, a homogén rétegek kialakulásának, kialakításának feltételeit igyekeznek felmérni. A két- illetve többfázisú mintavételt gyakran alkalmazzák a minőségellenőrzés, -szabályozás területén. A késztermék ellenőrzés gyakori módja a szekvenciális mintavétel, amelynek lényege az, hogy az első lépcsőben végrehajtott és értékelt mintavétel eredményétől függően végeznek további vizsgálatokat. Külön problémát jelent a gyártásközi ellenőrzés megtervezése, ahol az esetleges veszélyes hibák mielőbbi felderítése folyamatos ellenőrzést, mintavételt igényel. Ebben az esetben a mintavétel tervezése elsősorban a mintanagyság és a mintavétel időperiódusának meghatározását jelenti.

Page 44: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

44

IV. Leíró statisztika

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Page 45: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

45

IV.1 A leíró statisztika helye, szerepe a statisztika világában

A számszerű információ, annak mérése és elemzése alapvető szerepet játszik a társadalmi és gazdasági jelenségek elemzésében. E számszerű adatok a legtöbb esetben azzal a sajátossággal rendelkeznek, hogy a megfigyelésük, a feldolgozásuk, elemzésük és az elemzés eredményeinek felhasználása tudományos módszereket igényel. A statisztika a tömegesen előforduló jelenségekre, folyamatokra vonatkozó információk összegyűjtésének, leírásának, elemzésének, értékelésének és közlésének tudományos módszertana. A nemzetközi irodalomban elterjedt csoportosítás szerint megkülönböztetünk:

• a leíró statisztikát, amelynek célja a vizsgálat tárgyát képező jelenség tömör, számszerű jellemzése az adatok elemzése és rendezése alapján (pl. 10 évente tartott népszámlálások adatainak feldolgozása);

• míg a következtető statisztika célja a mintából történő következtetés és általánosítás a teljes sokaságra vonatkozóan (pl. néhány ezer háztartás jövedelmi adataiból megfelelő pontossággal megbecsülhető, hogy a magyar lakosság körében milyen jövedelmi különbségek vannak), vagyis a jelenségekre, folyamatokra vonatkozóan olyan megállapításokat tehetünk, amelyek nem csak a közvetlen megfigyelésen alapulnak.

• A statisztikai döntéselmélet a véletlen környezet által bekövetkező események figyelembevétele mellett, több lehetséges cselekvési lehetőség közül az optimálisnak vélt kiválasztásához ad számszerű információkat (pl. beruházási döntések, új termékek bevezetésére vonatkozó döntések stb.).

A leíró statisztika a megfigyelt adatok bemutatását, összefoglaló jellemzését tűzi ki célul, és ehhez az elemzéshez sokoldalú eszköztárt kínál, ebben a fejezetben célunk ennek az eszköztárnak a bemutatása.

IV.2 A statisztikai leírás célja, módszerei

A leíró statisztika a numerikus információk összegyűjtését, az információk összegzését, tömör jellemzését szolgáló módszereket foglal magában, legfontosabb területei:

• adatgyűjtés • adatok ábrázolása • adatok csoportosítása, osztályozása • adatokkal végzett egyszerűbb aritmetikai műveletek • eredmények megjelenítése

A statisztikai jellemzőket általában három fő csoportba soroljuk, éppen az alapján, hogy az adatok milyen jellegzetességét ragadják meg:

• középértékek • ingadozásmutatók • az eloszlás alakjára jellemző egyéb mérőszámok

Az egyedi mérésekből származó adatok lehetnek diszkrétek és folytonosak.

Page 46: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

46

A diszkrét adatok szükségképpen ugrásszerűen változnak. Például a számlálás alapján nyert adatok diszkrét típusúak (pl. téves telefonhívások száma, balesetek száma, adott időszak alatt bekövetkező gépmeghibásodások száma stb.). A folytonos adatok általában mérésből származnak. Jellemzőjük, hogy egy adott intervallumon belül elvileg bármilyen értéket felvehetnek. A mérés korlátai miatt ezek az adatok is ugrásszerűen változnak, de az ugrások nagysága a mérőeszköztől függ, maguk az adatok lényegüket tekintve folytonosak (pl. átmérő, nyúlás, gépkocsi abroncsok futásteljesítménye, nedvességtartalom).

IV.3 Az adatok ábrázolása

Néhány példa:

A hiba típusaSzabvány jelölése

GyakoriságKumulált

gyakoriságRelatív

gyakoriságKumulált relatív

gyakoriság

gömb alakú gázzárvány 2011 78 78 53,06% 53,06%gázzárvány-halmaz 2013 26 104 17,69% 70,75%átolvadási hiány 402 14 118 9,52% 80,27%összeolvadási hiány 401 12 130 8,16% 88,44%gyökátfolyás 504 4 134 2,72% 91,16%

hernyó alakú gázzárvány2016 3 137 2,04% 93,20%

gyökoldali szélkiolvadás5013 3 140 2,04% 95,24%

egy oldalról hegesztett kötésben átolvadási hiány 4021 2 142 1,36% 96,60%helyi szélkiolvadás éles bemetszés nélkül 515 2 144 1,36% 97,96%

alapanyag-varrat közötti összeolvadási hiány

4011 1 145 0,68% 98,64%wolfrám zárvány 3041 1 146 0,68% 99,32%egyenetlen varratfelület 514 1 147 0,68% 100,00%összesen: 147 100,00%

13. ábra: Az adatok táblázatba rendezése

14. ábra: Oszlopdiagram

Page 47: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

47

15. ábra: Kördiagram

16. ábra: Sávdiagram

17. ábra: Vonaldiagram

Page 48: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

48

18. ábra: Adatok ábrázolása piktogram segítségével

Az összes szőlőtermelés felhasználásaAz összes szőlőtermelés felhasználása

Page 49: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

49

IV.4 Tapasztalati eloszlások

Az adatok ábrázolásának általános lépései a következők:

1. Osztálybasorolás (folytonos adatok és nagyszámú diszkrét megfigyelés esetén), 2. A gyakoriságok (fi) megállapítása. (Gyakoriság a sokaságban levő azonos

tulajdonságú (azonos osztályba tartozó) elemek száma.) 3. A relatív gyakoriságok (gi) megállapítása:

gf

nii=

4. Az összegzett (kumulált) gyakoriságok (fi’ ), illetve összegzett relatív gyakoriságok

(gi’ ) megállapítása, 5. Gyakorisági táblázat készítése (fi , gi , fi’ , gi’ adataiból), 6. A gyakorisági (relatív gyakorisági), illetve összegzett gyakorisági (relatív gyakorisági)

hisztogramok (folytonos adatok esetén a poligon és az ogiva) felvétele (tapasztalati eloszlások elkészítése),

7. Grafikus ábrázolás. Feladat: Egy folyamatos üzemben 24 órán keresztül feljegyezték a gépleállások számát. A leállásokra vonatkozóan az alábbi értékek adódtak óránkénti megoszlásban:

Óra 1 2 3 4 5 6 7 8 9 10 11 12 Leállások száma

5 3 1 2 0 3 4 5 2 6 1 1

Óra 13 14 15 16 17 18 19 20 21 22 23 24 Leállások száma

4 0 2 3 2 0 2 3 1 4 1 6

1. Táblázat: 24 óra alatti gépleállások alakulása A példa adatai a következő gyakorisági táblázatba és hisztogramba rendezhetők:

leállások száma óránként az előfordulások gyakorisága (f i)

relatív gyakoriság (gi)

0 3 0,125 1 5 0,208 2 5 0,208 3 4 0,168 4 3 0,125 5 2 0,083 6 2 0,083

összesen 24 1,000 2. Táblázat

Page 50: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

50

19. ábra: Gyakoriságok ábrázolása diszkrét adatok esetén A kumulált (összegzett) gyakorisági táblázat és hisztogram:

leállások száma kumulált gyakoriság (fi’) kumulált relatív gyakoriság (gi

’) 0 3 0,125 1 8 0,333 2 13 0,541 3 17 0,709 4 20 0,834 5 22 0,917 6 24 1,000

3. Táblázat

20. ábra: Kumulált relatív gyakoriságok ábrázolása diszkrét adatok esetén

Page 51: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

51

Feladat: Mint későbbi tanulmányaink (Vállalati pénzügyek) során látni fogjuk, gazdasági elemzéseinknél gyakran szükség van a részvényektől elvárt hozam becslésére. (A részvények elvárt hozama időben viszonylag stabil, így a jövőre vonatkozó becsléseinket múltbeli adatainkra alapozhatjuk). A Budapesti Értéktőzsde Részvényindexét (BUX) – az ideiglenes index némi változtatásával és 1991-ig visszafelé is meghatározva – 1995 január 1-i hatállyal vezették be. Az index bázisa az 1991. január 2-án számított 1000 pont. Egy 5 éves időszak havi hozamainak értékeit az alábbi táblázatban foglaltuk össze.

dátum BUX[%] dátum BUX[%]

február 1. -7,54 november 1. 2,03

március 1. -0,17 december 2. 12,51

április 5. -11,02 január 6. 32,3

május 2. -2,5 február 3. 2,44

június 1. -8,24 március 3. -2,91

július 1. 4,91 április 1. 10,03

augusztus 1. 13,01 május 5. 3,79

szeptember 1. -8,45 június 2. 12,9

október 3. 16,88 július 1. 15,99

november 1. -5,08 augusztus 1. -8,2

december 1. -4,89 szeptember 2. 6,34

január 5. -18,98 október 1. -7,26

február 1. 4,05 november 3. -6,75

március 1. 1,62 december 1. 20,24

április 3. 11,68 január 7. -7,22

május 2. 5,44 február 2. 11,27

június 1. -4,79 március 2. 4,84

július 3. 2,06 április 1. -1,21

augusztus 1. 5,16 május 4. -17,48

szeptember 1. 1,81 június 2. 10,63

október 2. -6,05 július 1. 3,45

november 1. -0,93 augusztus 3. -36,06

december 1. 2,92 szeptember 1. -12,97

január 4. 35,26 október 1. 26,91

február 1. 7,81 november 2. 12,53

március 1. 9,75 december 1. 5,51

április 1. 7,67 január 7. 3,16

május 2. 11,06 február 1. -13,63

június 3. 12,39 március 1. -2,37

július 1. -12,85 április 1. 9,02

augusztus 1. 21,26 május 3. 4,58

szeptember 3. 18,57 június 1. 4,59

október 1. 6,46

4. Táblázat Dolgozzuk fel a havi hozam adatokat leíró statisztikai eszközökkel!

Page 52: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

52

1NÖsszesen

gkfkXk*Xk1Xk0

gif iXi*Xi1Xi0

g2f2X2*X21X20

g1f1X1*X11X10

határa

gyakoriságfelsőalsó

relatívabszolútOsztály-közép

Az Y szerint képzett osztály

1NÖsszesen

gkfkXk*Xk1Xk0

gif iXi*Xi1Xi0

g2f2X2*X21X20

g1f1X1*X11X10

határa

gyakoriságfelsőalsó

relatívabszolútOsztály-közép

Az Y szerint képzett osztály

N

fg i

i =( )102

1iii XXX +=∗

21. ábra: Gyakorisági sor Ahol:

• Y (adatainkat jellemző) mennyiségi ismérv, • Adathalmazunkból k db osztályt képzünk, • A 0-s index az osztály alsó határát, az 1-es index pedig az osztályköz felső határát

jelenti, • Xi

* az osztályközép, • fi az abszolút vagy tapasztalati gyakoriság, gi pedig a relatív gyakoriság.

Mérlegelendő szempontok az osztályozásnál:

• Mi a célunk az osztályozással? • A teljes értékközt hány rész-értékközre bontsuk fel, vagyis hány osztályt alakítsunk

ki?12 • Az osztályhatárok megállapításánál, kialakításánál milyen szempontokat célszerű

figyelembe venni? A fenti példánk alapján a gyakoriság táblázat:

osztályhatárok f i f’ i gi [%] g’ i [%] -40,00 ≤ x <-30,00 1 1 1,54 1,54 -30,00 ≤ x <-20,00 0 1 0,00 1,54 -20,00 ≤ x <-10,00 6 7 9,23 10,77 -10,00 ≤ x < 0,00 17 24 26,15 36,92 0,00 ≤ x < 10,00 23 47 35,38 72,30 10,00 ≤ x < 20,00 13 60 20,00 92,30 20,00 ≤ x < 30,00 3 63 4,62 96,92 30,00 ≤ x < 40,00 2 65 3,08 100,00

összesen 65 100,00 5. Táblázat

12 A szakirodalomban szereplő javaslatok az osztályok számára (k) vonatkozóan:

nk >2 , illetve nk lg3,31 ⋅+=

Page 53: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

53

A gyakorisági hisztogram: Az egyes értékközök felé emelt téglalapok területe arányos az egyes osztályokhoz tartozó tapasztalati gyakoriságokkal. A piros vonallal jelölt függvényt sűrűségfüggvénynek nevezzük.

22. ábra: Sűrűségfüggvény A kumulált relatív gyakorisági hisztogram:

%05,12s

%19,3x

65n

* =

=

=

23. ábra: Eloszlásfüggvény A kumulált gyakoriságok grafikus ábrázolással nyert képét tapasztalati eloszlásfüggvénynek is szokás nevezni. A folytonos adatok eloszlásfüggvényét folytonos vonallal is összeköthetjük, és az így kapott görbét ogivának nevezzük. Ez azt mutatja meg, hogy megközelítően milyen lenne a tapasztalati eloszlásfüggvény, ha az osztályközöket minden határon túl csökkentenénk, az osztályközökbe eső adatok számát pedig minden határon túl növelnénk. Az ogivát felhasználhatjuk egy adott értéknél kisebb értékek számának vagy relatív gyakoriságának meghatározására. Fordítva is eljárhatunk, vagyis megállapíthatjuk azt az értéket, amelyik alá adott relatív gyakorisággal esnek az adatok. Az ilyen értékeket kvantiliseknek nevezzük.

Page 54: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

54

IV.5 Tapasztalati eloszlások középérték mutatói

A középérték mutatók a gyakorisági eloszlás helyzetét egyetlen, az adatokkal azonos mértékegységű számértékkel jellemzik. E középértékekkel kapcsolatos elvárásaink, hogy legyenek:

• Közepes helyzetűek • Tipikusak • Egyértelműen meghatározhatóak • Könnyen értelmezhetőek

A középérték-mutatóknak két nagy csoportja ismeretes:

• Helyzeti középértékek: az adatok közötti elhelyezkedésüknél fogva jellemzik a vizsgált gyakorisági eloszlás helyzetét.

• Számított középértékek: az adatokkal kapcsolatos számszerű összefüggésük révén jellemzik vizsgált gyakorisági eloszlás helyzetét.

Az alábbiakban bemutatásra kerülő középérték mutatók a medián, a módusz, a számtani átlag, a harmonikus átlag, a mértani átlag és a négyzetes átlag.

IV.5.a Medián (Me)

Jellemzői: helyzeti középérték, közepes helyzetű. A medián a változó azon számértéke, amelynél az összes előforduló számérték fele kisebb, fele pedig nagyobb, tehát a rangsorba állított sokasági számértékeket két egyenlő gyakoriságú osztályra bontja. Röviden: a nagyságrend szerint rendezett adatok középső értéke (páros számú adat esetén a két középső érték átlaga).

Példa:

6, 8, 4, 9, 7, 3, 5, 3, 4, 5, 6, 7, 8, 9 Me=6 4, 9, 7, 8, 11, 5, 4, 5, 7, 8, 9, 11 Me=7,5 7, 9, 3, 10, 5, 2, 5, 2, 3, 5, 5, 7, 9, 10 Me=5

Ha a BUX index korábbi, 65 havi hozamadatait vesszük alapul, akkor e 65 adatot sorba állítva, a rangsor 33. tagja lesz a medián, hiszen ennél 32 kisebb, és 32 nagyobb érték lesz a rangsorban, ez pedig 3,79.

1 -36,06 11 -7,54 21 -2,37 31 3,16 41 5,51 51 11,27 61 20,242 -18,98 12 -7,26 22 -1,21 32 3,45 42 6,34 52 11,68 62 21,263 -17,48 13 -7,22 23 -0,93 33 3,79 43 6,46 53 12,39 63 26,914 -13,63 14 -6,75 24 -0,17 34 4,05 44 7,67 54 12,51 64 32,35 -12,97 15 -6,05 25 1,62 35 4,58 45 7,81 55 12,53 65 35,266 -12,85 16 -5,08 26 1,81 36 4,59 46 9,02 56 12,97 -11,02 17 -4,89 27 2,03 37 4,84 47 9,75 57 13,018 -8,45 18 -4,79 28 2,06 38 4,91 48 10,03 58 15,999 -8,24 19 -2,91 29 2,44 39 5,16 49 10,63 59 16,88

10 -8,2 20 -2,5 30 2,92 40 5,44 50 11,06 60 18,57

Page 55: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

55

Osztályközös gyakorisági sor esetén a medián az alábbi formulával becsülhető:

meme

me

me hf

fN

XeM ⋅−

+=−

'1

0,2ˆ

ahol me annak a legelső osztályköznek a sorszáma, amelyre igaz, hogy

2' N

fme ≥

és Xme,0 az me sorszámú osztályköz alsó határa, és a hme pedig ennek az osztálynak az osztályközhosszúsága, ami egyszerűen a felső és alsó osztályhatár értékének a különbsége. Példa: Vegyük a korábbi BUX-indexes példánkat, és tegyük fel, hogy csak a gyakorisági táblázat áll rendelkezésünkre, és nem ismerjük egyenként az összes hozamadatot. Nézzük meg, hogy ilyen esetben hogyan becsülhető a medián!

osztályhatárok f i f’ i gi [%] g’ i [%] -40,00 ≤ x <-30,00 1 1 1,54 1,54 -30,00 ≤ x <-20,00 0 1 0,00 1,54 -20,00 ≤ x <-10,00 6 7 9,23 10,77 -10,00 ≤ x < 0,00 17 24 26,15 36,92 0,00 ≤ x < 10,00 23 47 35,38 72,30 10,00 ≤ x < 20,00 13 60 20,00 92,30 20,00 ≤ x < 30,00 3 63 4,62 96,92 30,00 ≤ x < 40,00 2 65 3,08 100,00

összesen 65 100,00

2' N

fme ≥ N/2=32,5 a mediánt tartalmazó osztály az ötödik osztály: 0,01 ≤ x < 10.

69,3)00,000,10(23

245,3200,02ˆ

'1

0, =−⋅−+=⋅−

+=−

meme

me

me hf

fN

XeM

A medián előnye, hogy mindig egyértelműen meghatározható, és mivel valódi középérték, így érzéketlen az adathalmazunkban szereplő szélsőértékekre, amely szélsőségesen nagy vagy kicsi értékeket általában a véletlen szeszélyei alakítják, és nem függ a többi ismérvértéktől sem. Ha az adathalmazunkban sok az egyforma ismérvérték, akkor sem tanácsos használni.

Page 56: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

56

IV.5.b Módusz (Mo)

A módusz – a mediánhoz hasonlóan – helyzeti középérték. A módusz nem mindig határozható meg egyértelműen, és nem is mindig létezik. Diszkrét változó esetén a változó leggyakrabban előforduló értéke (korábbi példánkban az óránkénti 1 és 2 leállás gyakorisága egyaránt 5-5 volt).

leállások száma óránként az előfordulások gyakorisága 0 3 1 5 2 5 3 4 4 3 5 2 6 2

összesen 24 Folytonos ismérv esetén a módusz a gyakorisági görbe maximum helye. Folytonos változó esetén a mediánhoz hasonló módon osztályközös gyakorisági sorból is becsülhető.

mofa

amo h

dd

dXoM ⋅

++= 0,ˆ

Ebben a képletben mo a móduszt tartalmazó osztályköz sorszáma, da és df

1−−= momoa ffd 1+−= momof ffd

A móduszt mindig az az osztályköz tartalmazza, amelyikhez a hisztogram legmagasabb oszlopa tartozik13.

osztályhatárok f i f’ i gi [%] g’ i [%] -40,00 ≤ x <-30,00 1 1 1,54 1,54 -30,00 ≤ x <-20,00 0 1 0,00 1,54 -20,00 ≤ x <-10,00 6 7 9,23 10,77 -10,00 ≤ x < 0,00 17 24 26,15 36,92 0,00 ≤ x < 10,00 23 47 35,38 72,30 10,00 ≤ x < 20,00 13 60 20,00 92,30 20,00 ≤ x < 30,00 3 63 4,62 96,92 30,00 ≤ x < 40,00 2 65 3,08 100,00

összesen 65 100,00 Folytonos ismérv esetén a móduszt a legnagyobb gyakoriságú osztály tartalmazza:

13 Megjegyzés: néha a módusz becslésének egyszerűen a móduszt tartalmazó osztályköz osztályközepét tekintik (példánkban ez 5,00 lenne), ezt nyers módusznak hívják. Bárhogyan is határozzuk meg a móduszt, az arra kapott közelítő érték esetleges, mert függ az osztályközök számától és hosszától.

Page 57: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

57

75,3)00,000,10()1323()1723(

)1723(00,0ˆ 0, =−⋅

−+−−+=⋅

++= mo

fa

amo h

dd

dXoM

A módusz előnye, hogy a mediánhoz hasonlóan nem függ sem az összes, sem a kiugró ismérvértékektől. A módusz hátránya, hogy nem határozható meg mindig egyértelműen, és nem is mindig létezik.

IV.5.c Számtani átlag ( )x

A leggyakrabban használt középértékmutató: az „átlag”, számított középérték. Az a szám, amellyel az átlagolandó számértékeket helyettesítve azok összege változatlan marad. Számítása:

∑∑

∑∑

=

=

=

= ===r

iiir

ii

r

iii

n

ii

xgf

xf

n

xx

1

1

11

ahol: xi = az i. tag számértéke xi

*= az i. osztály osztályközepe f i = az i. osztály gyakorisága gi = az i. osztály relatív gyakorisága r = osztályok száma

Diszkrét példa:

leállások száma óránként az előfordulások gyakorisága 0 3 1 5 2 5 3 4 4 3 5 2 6 2

összesen 24

54,224

262534435251306

0

6

0 =⋅+⋅+⋅+⋅+⋅+⋅+⋅=⋅

=∑

=

=

ii

ii

i

f

xfx

Folytonos példa: Vegyük ismét a korábbi BUX-indexes példánkat! Ha a rendelkezésre álló 65 egyedi adatunkból számítjuk ki a számtani átlagot:

19,365

37,20765

59,458,402,9...)02,11()17,0(54,765

65

1 ==++++−+−+−==∑

=iix

x %-ot kapunk.

Page 58: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

58

Az osztályközös gyakorisági táblázatunkat alapul véve is becsülhetjük a számtani átlagot:

osztályhatárok f i f’ i gi [%] g’ i [%] -40,00 ≤ x <-30,00 1 1 1,54 1,54 -30,00 ≤ x <-20,00 0 1 0,00 1,54 -20,00 ≤ x <-10,00 6 7 9,23 10,77 -10,00 ≤ x < 0,00 17 24 26,15 36,92 0,00 ≤ x < 10,00 23 47 35,38 72,30 10,00 ≤ x < 20,00 13 60 20,00 92,30 20,00 ≤ x < 30,00 3 63 4,62 96,92 30,00 ≤ x < 40,00 2 65 3,08 100,00

összesen 65 100,00

77,300,350308,000,250462,000,1520,0

00,53538,0)00,5(2615,0)00,15(0923,0)00,25(0)00,35(0154,0

77,365

00,35200,25300,151300,523

65

)00,5(17)00,15(6)00,25(0)00,35(1

8

1

8

1

8

1

=⋅+⋅+⋅+

+⋅+−⋅+−⋅+−⋅+−⋅==

=⋅+⋅+⋅+⋅+

+−⋅+−⋅+−⋅+−⋅==

=

=

=

iii

ii

iii

xgx

f

xfx

Ebben az esetben a két eredmény (3,19 és 3,77) közötti eltérés összefüggésben van a sokaság számosságával, az osztályközök hosszával, és az osztályközepek megválasztásával. A számtani átlag előnye, hogy bármely alapadathalmazból egyértelműen meghatározható, minden alapadatot felhasznál. A hátránya – a módusszal és mediánnal szemben –, hogy érzékeny a szélsőértékekre.

IV.5.d Egyéb átlagfajták

Harmonikus átlag :)x( h Az a szám, amellyel az átlagolandó értékeket helyettesítve ezek reciprokainak összege változatlan marad. Számítása:

∑=

=

=

== r

i ii

r

ii

n

i i

h

xf

f

x

nx

1

1

1

11

Alkalmazása: Leggyakrabban akkor használjuk, ha az értékek reciprokainak összege értelmezhető. Ilyen esetekkel elsősorban a leíró statisztikai viszonyszámok és indexek számításánál találkozunk.

Page 59: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

59

Mértani átlag :)x( g Az a szám, amellyel az átlagolandó értékeket helyettesítve azok szorzata változatlan marad. Számítása:

∑== ∗i if f

in

ig xxx ππ

ahol:π (produktum) az összeszorzás jele.

Egy n tagú sokaság x1, x2, …, xn megfigyelt értékeinek mértani átlagát úgy számítjuk ki, hogy az értékeket összeszorozzuk, és a szorzatból annyiadik gyököt vonunk, ahány értéket összeszoroztunk14. Alkalmazása: A mértani átlagot akkor használjuk, ha az értékek szorzata értelmezhető, illetve az átlagolandó értékek exponenciálisan nőnek vagy csökkennek. Leggyakrabban az időbeli fejlődés átlagos ütemének vizsgálatakor használjuk. Idősorok elemzése során (pl. termelés évenkénti alakulása, tőzsdeindex havi változása, stb.) általában az időszakról időszakra bekövetkezett növekedést, vagy csökkenést vizsgáljuk.

Négyzetes átlag :)x( q Az a szám, amellyel az átlagolandó értékeket helyettesítve azok négyzetösszege változatlan marad. Számítása:

∑∑

=

=

=

⋅== r

ii

r

iii

n

ii

q

f

xf

n

xx

1

11

2 2

Egy n tagú sokaság x1, x2, …, xn értékeiből a négyzetes átlagot úgy számítjuk ki, hogy az átlagolandó értékek négyzeteinek számtani átlagát vesszük és ebből négyzetgyököt vonunk. Természeténél fogva a négyzetes átlag a kiugróan magas értékekre reagál érzékenyen. Alkalmazása: A négyzetes átlag alkalmazására leginkább akkor kerül sor, amikor az értékek között pozitív és negatív értékek egyaránt előfordulnak, de az előjeleknek a vizsgálat szempontjából nincs jelentőségük, az értékek abszolút nagyságát kívánjuk a középértékekkel jellemezni. Tipikus alkalmazási területe a szórásszámítás.

IV.5.e Választás a középértékek között

Bebizonyítható, hogy ugyanazon pozitív xi értékekből számított különböző fajta átlagok között a következő nagyságrendi reláció áll fenn:

maxmin xxxxxx qgh ≤≤≤≤≤

14 Megjegyzés: ha az értékek között 0 is szerepel, akkor a mértani átlagot nem használhatjuk.

Page 60: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

60

A harmonikus és a mértani átlag a nagyon alacsony, a négyzetes átlag a magas értékekre mutat fokozott érzékenységet. Az átlagolandó értékek jellege, és az átlag számításához rendelkezésre álló információ együttesen határozza meg, hogy milyen esetben melyik átlagfajtát célszerű használni. A választás során érdemes mérlegelni a következőket:

• Egyértelműen meghatározható-e? • Az összes rendelkezésre álló adattól függ-e vagy sem? • Mennyire érzékeny a szélsőségesen nagy vagy kicsi értékekre? • Mekkora és milyen módon értelmezhető hibával képes helyettesíteni az alapadatokat?

24. ábra: Középértékek összehasonlítása

IV.5.f Kvantilisek

Eddig egyenlő osztályköz-hosszúságú gyakorisági sorokat képeztünk, az ilyen osztályközök relatív gyakoriságai eltértek egymástól. Lehetőség van olyan osztályhatárok keresésére, amelyek egyenlő relatív gyakoriságokat fognak közre. Az ilyen osztályközök – általában – nem egyenlő hosszúságúak. Ezen osztályhatárok megállapításához használjuk a kvantiliseket. A kvantilisek azok az értékek, amelyek különböző adott arányokban bontják fel az adathalmazt. A p-edrendű kvantilis az eloszlást p : 1-p arányban osztja ketté. Meghatározásuk úgy történik, hogy adatainkat nagyság szerint növekvő sorrendbe rendezzük (rangsort készítünk), majd az értékeket k számú egyenlő gyakoriságú csoportra osztjuk, és az egyes csoportok felső határán lévő ismérvértékeket vesszük. Ezek lesznek a kvantilis értékek. A különböző számú csoportba rendezéshez a kvantilisek konkrét elnevezései tartoznak. Ha az adatokat két részre osztjuk, akkor a mediánt (Me) kapjuk. Négy részre való osztásnál kvartiliseket (Qi, i=1,2,3) ad, öt rész esetén kvintiliseket (Ki, i=1, 2, 3, 4), tíz rész esetén deciliseket (Di, i=1,2,…,9) száz részre való osztásnál percentiliseket (Pi, i=1,2,3,…,99) nyerünk. Ha például az egyetemre jelentkezők pontszámát értékelve 112 pont a hatodik decilis érték, ez azt jelenti, hogy a jelentkezők hatvan százaléka 112 pontnál kevesebbel, 40%-a pedig többel rendelkezik.

x Me Mo xMe Mo

Page 61: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

61

P1, P2, …,P991,2,…,99PiPercentilis100

D1, D2, … D91,2,…,9DiDecilis10

K 1, K2, K3, K 4

1,2,3,4,K iKvintilis5

Q1, Q2, Q31,2,3QiKvartilis4

Me1-Medián2

Lehetséges kvantilisek

i lehetséges értéke

Általános jelölés

Elnevezésk

P1, P2, …,P991,2,…,99PiPercentilis100

D1, D2, … D91,2,…,9DiDecilis10

K 1, K2, K3, K 4

1,2,3,4,K iKvintilis5

Q1, Q2, Q31,2,3QiKvartilis4

Me1-Medián2

Lehetséges kvantilisek

i lehetséges értéke

Általános jelölés

Elnevezésk

P1, P2, …,P991,2,…,99PiPercentilis100

D1, D2, … D91,2,…,9DiDecilis10

K 1, K2, K3, K 4

1,2,3,4,K iKvintilis5

Q1, Q2, Q31,2,3QiKvartilis4

Me1-Medián2

Lehetséges kvantilisek

i lehetséges értéke

Általános jelölés

Elnevezésk

P1, P2, …,P991,2,…,99PiPercentilis100

D1, D2, … D91,2,…,9DiDecilis10

K 1, K2, K3, K 4

1,2,3,4,K iKvintilis5

Q1, Q2, Q31,2,3QiKvartilis4

Me1-Medián2

Lehetséges kvantilisek

i lehetséges értéke

Általános jelölés

Elnevezésk

P1, P2, …,P991,2,…,99PiPercentilis100

D1, D2, … D91,2,…,9DiDecilis10

K 1, K2, K3, K 4

1,2,3,4,K iKvintilis5

Q1, Q2, Q31,2,3QiKvartilis4

Me1-Medián2

Lehetséges kvantilisek

i lehetséges értéke

Általános jelölés

Elnevezésk

P1, P2, …,P991,2,…,99PiPercentilis100

D1, D2, … D91,2,…,9DiDecilis10

K 1, K2, K3, K 4

1,2,3,4,K iKvintilis5

Q1, Q2, Q31,2,3QiKvartilis4

Me1-Medián2

Lehetséges kvantilisek

i lehetséges értéke

Általános jelölés

Elnevezésk

6. Táblázat: A leggyakrabban használt kvantilisek

Példa:

1 -36,06 11 -7,54 21 -2,37 31 3,16 41 5,51 51 11,27 61 20,242 -18,98 12 -7,26 22 -1,21 32 3,45 42 6,34 52 11,68 62 21,263 -17,48 13 -7,22 23 -0,93 33 3,79 43 6,46 53 12,39 63 26,914 -13,63 14 -6,75 24 -0,17 34 4,05 44 7,67 54 12,51 64 32,35 -12,97 15 -6,05 25 1,62 35 4,58 45 7,81 55 12,53 65 35,266 -12,85 16 -5,08 26 1,81 36 4,59 46 9,02 56 12,97 -11,02 17 -4,89 27 2,03 37 4,84 47 9,75 57 13,018 -8,45 18 -4,79 28 2,06 38 4,91 48 10,03 58 15,999 -8,24 19 -2,91 29 2,44 39 5,16 49 10,63 59 16,88

10 -8,2 20 -2,5 30 2,92 40 5,44 50 11,06 60 18,57 Számítása: Rangsorba rendezett adataink i/k-ik tagja.

)1(/ += Nk

is ki Értéke: [ ] [ ] [ ])(

/// 1//∗∗

+∗ −+=

kikiki sskiski XXsXX

A BUX-indexes példánk alapján számítsuk ki a következő kvantiliseket! Alsó kvartilis:

5,16)651(41

4/1 =+⋅=s

Tehát az alsó kvartilisünk a rangsorba rendezett 65 db havi hozamadat 16,5-ik tagja. Számítása:

[ ] [ ] [ ] 985,4))08,5(89,4(5,008,5)(4/14/14/1 14/11 −=−−−⋅+−=−+= ∗∗

+∗

sss XXsXQ

(egyszerűbb számítás: egyszerűen a rangsor 16. és 17. értékének számtani átlaga) Értelmezése: a rangsorba rendezett adatok 1/4-e kisebb, mint -4,985, és 3/4-e pedig nagyobb. Felső kvartilis:

5,49)651(43

4/3 =+⋅=s

Tehát a felső kvartilisünk a rangsorba rendezett 65 db havi hozamadat 49,5-ik tagja.

[ ] [ ] [ ] 845,10)63,1006,11(5,063,10)(4/34/34/3 14/33 =−⋅+=−+= ∗∗

+∗

sss XXsXQ

Page 62: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

62

Értelmezése: a rangsorba rendezett adatok 3/4-e kisebb, mint 10,845, és 1/4-e pedig nagyobb. Alsó decilis

6,6)651(101

10/1 =+⋅=s

[ ] [ ] [ ] 752,11))85,12(02,11(6,085,12)(10/110/110/1 110/11 −=−−−⋅+−=−+= ∗∗

+∗

sss XXsXD

Értelmezése: a rangsorba rendezett adatok 1/10-e kisebb, mint -11,752, és 9/10-e pedig nagyobb. Felső decilis:

4,59)651(109

10/9 =+⋅=s

[ ] [ ] [ ] 556,17)88,1657,18(4,088,16)(10/910/910/9 110/99 =−⋅+=−+= ∗∗

+∗

sss XXsXD

Értelmezése: a rangsorba rendezett adatok 9/10-e kisebb, mint 17,556, és 1/10-e pedig nagyobb.

IV.6 Az ingadozás mérőszámai

A rendelkezésre álló adathalmazunkban szereplő értékek változékonysága, szóródása kétféleképpen is megragadható: az egyes értékek egymás közötti különbségein, vagy pedig az egyes értékeknek egy kitüntetett értéktől (középérték) való eltérésein keresztül. A másik csoportosítási lehetőség: léteznek abszolút és relatív ingadozásmutatók. Az abszolút szóródási mutatók mértékegysége ugyanaz, mint az alapadatoké. A relatív szóródási mutatók elvonatkoztatnak az eredeti mértékegységtől, és különböző ismérvértékek szóródásának az összehasonlítását szolgálják. A most bemutatásra kerülő legfontosabb ingadozásmutatók: a terjedelem, az interkvantilis terjedelem, az átlagos abszolút különbség, az átlagos abszolút eltérés, a tapasztalati szórás, a korrigált tapasztalati szórás és a relatív szórás.

IV.6.a Terjedelem (R)

Az adathalmazban szereplő legnagyobb és legkisebb adat különbsége. Számítása:

minmax XXR −=

Előnye a könnyű számítás, hátránya, hogy csak a két legszélsőségesebb ismérvértéktől függ. A hátránya miatt gyakran használják az interkvantilis terjedelemmutatót, mivel a két szélső k-adrendű kvantilis jelentősen csökkenti a véletlennek a szélsőértékeket alakító szerepét. Pl. Az interkvartilis terjedelemmutató a felső és alsó kvartilis különbségeként adódik:

132/1 QQR −=

Vegyük ismét a korábbi BUX-indexes példánkat, és számítsuk ki a terjedelmet:

32,71)06,36(26,35 =−−=R

Page 63: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

63

Az interkvartilis terjedelem: 83,15)985,4(845,102/1 =−−=R

IV.6.b Átlagos abszolút különbség (G)

Ez a szóródási mutató a minden lehetséges módon párba állított értékek különbségeinek abszolút értékéből számított számtani átlag. Ez a G ingadozásmutató azt mutatja meg, hogy az x ismérv értékei átlagosan mennyire különböznek egymástól. Mértékegysége ugyanaz, mint az alapadatoké.

∑∑= =

−−

=N

i

N

jji XX

NNG

1 1)1(1

ahol N az adatok számát jelenti. Speciális felhasználási területe a koncentrációelemzés, hátránya, hogy számítása meglehetősen kényelmetlen. Mivel a BUX-indexes példában meglehetősen kényelmetlen számítani, így egy egyszerűbb példán keresztül mutatjuk be: Példa: Véletlenszerűen kiválasztunk 5 MBA hallgatót, és kiszámítjuk a Kvantitatív módszerek tárgy vizsgáján elért eredményük átlagos abszolút különbségét. Az elért pontok: 45, 52, 76, 87, 92

45 52 76 87 92 45 0 7 31 42 47

52 7 0 24 35 40

76 31 24 0 11 16

87 42 35 11 0 5

92 47 40 16 5 0 7. Táblázat

8,25)15(5

516 =−

=G , azaz az 5 MBA hallgató Kvantitatív módszerek tárgy vizsgán elért pontja

átlagosan 25,8 ponttal tér el egymástól.

IV.6.c Átlagos abszolút eltérés (∆∆∆∆)

Az átlagos abszolút eltérés az ingadozásmutatók azon csoportjába tartozik, amelyek a szóródást az értékeknek egy kitüntetett értéktől való eltéréseire támaszkodva jellemzik. Tulajdonképpen az egyes értékek és a számtani átlag különbségeinek abszolút értékeiből számított számtani átlag. Számítása:

∑=

∑=∆

=

==r

ii

r

iii

n

ii

f

df

n

d

1

11

Page 64: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

64

ahol: xxd ii −= A képlet második részéből látható, hogy ez a mutató is becsülhető osztályközös gyakorisági sorból a tapasztalati gyakoriságok felhasználásával. Ebben az esetben a di eltérések számításánál az osztályközepeket kell alapul vennünk. A BUX-indexes példánk átlagos abszolút eltérése: (Az egyedi adatokból számított számtani átlagot felhasználva)

93,865

19,359,4...19,317,019,354,71 =−++−−+−−=∑

=∆ =

n

dn

ii

Azaz az egyes hozamadatok átlagosan 8,93%-kal térnek el a számtani átlagtól.

IV.6.d Tapasztalati szórás (s), korrigált tapasztalati szórás (s*)

Ahogy a számtani átlag „az átlag”, úgy a tapasztalati és a korrigált tapasztalati szórás „a szórás”. A szórás az adathalmazunk változékonyságának legfontosabb mérőszáma. Nagyon hasonlít az előbbi mutatóhoz, és jelentése is hasonló: annyiban tér el, hogy a di eltérések előjelét nem abszolút érték képzésével, hanem négyzetre emeléssel „oldja meg”, majd a négyzetreemelést gyökvonással „teszi jóvá”.

A szórás az átlagtól vett di eltérések négyzetes átlaga. Ennek megfelelően azt mutatja, hogy az értékek mennyire térnek el a számtani átlagtól. Számítása:

( )=

∑==

∑=

∑=

−∗

=∑=

−=

n

n

i id

r

i if

ix

ixif

n

n

ix

ix

s

r

12

1

12)(

1

2

( )1

2

1*

−∑= =

n

xxs

i

n

i

BUX-indexes példánk szórása az egyedi adatokból számolva (az egyenkénti adatokból számított számtani átlagtól való átlagos eltérést mérve):

( )( ) ( ) ( ) ( )

95,1164

19,359,419,358,4...19,317,019,354,7

1n

n

1i

2x

ix

*s2222

=−+−++−−+−−=−

∑=

−=

Page 65: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

65

Osztályközös gyakorisági sorból becsülve:

osztályhatárok f i f’ i gi [%] g’ i [%] -40,00 ≤ x <-30,00 1 1 1,54 1,54 -30,00 ≤ x <-20,00 0 1 0,00 1,54 -20,00 ≤ x <-10,00 6 7 9,23 10,77 -10,00 ≤ x < 0,00 17 24 26,15 36,92 0,00 ≤ x < 10,00 23 47 35,38 72,30 10,00 ≤ x < 20,00 13 60 20,00 92,30 20,00 ≤ x < 30,00 3 63 4,62 96,92 30,00 ≤ x < 40,00 2 65 3,08 100,00

összesen 65 100,00 (Gyakorisági sorból becsült számtani átlaggal)

34,1265

)77,335(2)77,325(3...)77,325(60)77,335(1

1

12

2222

8

8

≈−⋅+−⋅++−−⋅++−−⋅=∑=

∑==

i if

i idifs

IV.6.e Relatív szórás (v)

A szórás és a számtani átlag hányadosa. Elsősorban különböző sokaságok vagy ismérvek szóródásának összehasonlítására használják. A relatív szórás úgy is értelmezhető, mint az értékek átlagtól vett átlagos eltérése, ezért minél kisebb a relatív szórás, a számtani átlag annál jobban jellemzi az alapadatokat.

Számítása:

[ ]%100⋅=X

sv

IV.7 Az eloszlás alakját jellemző egyéb mutatószámok

A gyakorisági eloszlások alakmutatói annak tömör és számszerű jellemzésére szolgálnak, hogy azok milyen tekintetben és milyen mértékben térnek el az ebből a szempontból etalonnak tekintett normális eloszlás jellegzetes gyakorisági görbéjétől (a haranggörbétől)15. Az eltérések fajtái:

• az etalonnak tekintett normális eloszlás haranggörbéjéhez képest bal ill. jobb oldali aszimmetria;

• a gyakorisági eloszlás ábrájának csúcsosabb, vagy lapultabb, mint a normális eloszlásé.

15 Megjegyzés: mivel a normális eloszlás egy móduszú, így ennek az összehasonlításnak csak szintén egy móduszú gyakorisági eloszlások esetén van értelme. Ha egy gyakorisági görbének több módusza van, akkor az arra enged következtetni bennünket, hogy az elemzést a sokaság részekre bontásával célszerű folytatni, mert az eddig megismert mutatószámok nem alkalmasak a vizsgált jelenség tömör, számszerű jellemzésére.

Page 66: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

66

25. ábra: Eloszlások alakjának lehetséges eltérése a normál eloszlástól

IV.7.a Aszimmetria mutató

A bal oldali aszimmetriával rendelkező eloszlások grafikus ábrája a módusztól jobbra hosszan elnyúlik. Ennek megfelelően a jobb oldali aszimmetriát mutató eloszlásokat pedig balra hosszan elnyúló eloszlásoknak nevezik16. Többféle aszimmetria mérőszám létezik, mi ezek közül most egyet mutatunk be: Pearson-féle mutatószám:

s

MexP

)(3 −⋅=

A Pearson-féle mutatószám mérsékelten aszimmetrikus eloszlásoknál nem szokott 1-nél nagyobb lenni. Ez a mutató az átlag és a medián különbségére alapozza az aszimmetria jellemzését17. Nézzük a BUX-indexes példánkat! (egyedi adatokból indulunk ki, és nem osztályközös gyakorisági sorból)

15,005,12

)79,319,3(3)(3 −=−⋅=−⋅=s

MexP

Enyhe jobb oldali aszimmetria18 (25. ábra).

16 A társadalmi-gazdasági jelenségek elemzésekor általában bal oldali aszimmetriával találkozunk. Ennek oka, hogy a 0 érték, vagy a vizsgált társadalmi-gazdasági jelenség természetéből adódóan valamilyen minimális érték kemény alsó korlátot képez, míg felülről nem létezik ilyen korlát. Pl. a jövedelmek vagy a vagyon nagyságának eloszlása tipikusan bal oldali aszimmetriát mutat. 17 A mérsékelt bal vagy jobb oldali aszimmetriát mutató gyakorisági sorok esetén a medián többnyire harmadolja a módusz és az átlag közötti távolságot úgy, hogy az átlaghoz esik közelebb. A Pearson-féle mutatószám valójában az átlag és a módusz különbségére alapozza az aszimmetria jellemzését, de a medián könnyebben becsülhető osztályközös gyakorisági sorból, mint a módusz. 18 A mutató pozitív értéke bal oldali, negatív értéke pedig jobb oldali aszimmetriára utal.

Page 67: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

67

IV.7.b Csúcsossági mutató

A csúcsossági mutatók közül is egy mutatót emelünk ki. Ez a mutató azon a megfigyelésen alapszik, hogy minél csúcsosabb egy eloszlás, annál kisebb a felső és alsó kvartilis különbségének a fele a két szélső decilis különbségéhez viszonyítva. Normális eloszlás esetén ennek értéke 0,263, ami a mutató értékeléséhez ad támpontot. Minél lapultabb a vizsgált gyakorisági eloszlás, annál nagyobb K értéket kapunk. A BUX-indexes példánk csúcsosságának kiszámításához felhasználjuk a korábban kiszámított kvartiliseket és deciliseket:

27,0616,58

83,15

))752,11(556,17(2

)985,4(845,10

)(2 19

13 ==−−⋅

−−=−⋅

−=DD

QQK

Esetünkben valamivel laposabb a gyakorisági eloszlás, mint a normális eloszlásé. Összefoglalás: A gyakorisági eloszlások helyzetének, szóródásának és alakjának jellemzésére szolgáló mutatószámok közül gyakorlati szempontból az átlag és a szórás a legfontosabb. Az átlag és a szórás ismeretében a valószínűségszámítás egyes eredményeire támaszkodva elég jó becslés adható arra, hogy az értékek milyen intervallumon belül ingadoznak. Ha az átlag és a szórás mellett még ismert néhány alkalmasan megválasztott kvantilis, vagy az aszimmetria és a csúcsosság valamilyen mutatószáma is, egészen jól felvázolható a vizsgált gyakorisági eloszlás grafikus képe még akkor is, ha sem az alapadatokat, sem a gyakorisági sort nem ismerjük.

Page 68: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

68

IV.8 Esettanulmány – leíró statisztikai elemzés

Végezzük el a 8. Táblázat alapján 100 MBA hallgató bérének leíró statisztikai elemzését! Ssz. BrBér/hó Pozíció Nem Életkor Ssz. BrBér/hó Pozíció NemÉletkor

1 300 Felső Férfi 28 51 350 Beoszt. Férfi 292 810 Felső Férfi 43 52 222 Beoszt. Férfi 313 220 Közép Nő 28 53 900 Közép Nő 384 500 Közép Férfi 44 54 120 Beoszt. Férfi 335 250 Beoszt. Nő 25 55 400 Felső Férfi 456 375 Beoszt. Férfi 36 56 450 Közép Férfi 367 210 Beoszt. Nő 28 57 340 Közép Férfi 458 145 Beoszt. Nő 27 58 320 Közép Férfi 329 100 Beoszt. Nő 26 59 200 Közép Férfi 32

10 400 Beoszt. Nő 28 60 730 Közép Férfi 4011 110 Beoszt. Férfi 24 61 300 Felső Férfi 3812 350 Közép Nő 40 62 210 Beoszt. Férfi 3213 164 Beoszt. Nő 30 63 451 Közép Férfi 3614 104 Közép Nő 29 64 103 Beoszt. Nő 2515 340 Beoszt. Férfi 39 65 65 Felső Férfi 4616 650 Közép Férfi 25 66 230 Beoszt. Nő 3317 250 Felső Nő 36 67 340 Beoszt. Férfi 3118 600 Közép Férfi 28 68 255 Beoszt. Férfi 3419 1000 Felső Férfi 41 69 600 Közép Férfi 3520 331 Beoszt. Férfi 33 70 425 Közép Nő 3521 500 Felső Nő 39 71 320 Közép Nő 3522 278 Beoszt. Férfi 30 72 195 Beoszt. Nő 2723 1100 Felső Férfi 53 73 707 Közép Férfi 4024 835 Felső Nő 39 74 225 Beoszt. Férfi 3125 240 Beoszt. Férfi 31 75 400 Közép Férfi 5026 450 Beoszt. Nő 26 76 342 Beoszt. Férfi 3327 400 Beoszt. Nő 28 77 200 Közép Férfi 2928 350 Felső Férfi 33 78 370 Közép Férfi 4529 550 Beoszt. Férfi 26 79 575 Beoszt. Férfi 2930 80 Felső Férfi 44 80 500 Felső Férfi 3231 700 Beoszt. Férfi 28 81 510 Felső Férfi 2532 250 Közép Férfi 34 82 90 Közép Férfi 3133 400 Beoszt. Nő 32 83 120 Felső Nő 4234 355 Közép Férfi 38 84 810 Felső Férfi 4535 380 Beoszt. Nő 27 85 80 Beoszt. Nő 2736 450 Felső Nő 34 86 250 Beoszt. Nő 3237 330 Beoszt. Nő 26 87 260 Beoszt. Nő 2738 520 Közép Férfi 39 88 700 Felső Férfi 4239 150 Beoszt. Nő 33 89 550 Közép Férfi 2840 800 Közép Nő 45 90 500 Beoszt. Férfi 2641 790 Közép Nő 33 91 275 Beoszt. Férfi 3142 330 Közép Férfi 26 92 900 Felső Férfi 4043 390 Közép Nő 30 93 280 Közép Férfi 3744 850 Felső Férfi 33 94 182 Beoszt. Nő 3045 500 Beoszt. Nő 30 95 250 Közép Nő 2646 370 Beoszt. Nő 31 96 350 Felső Férfi 4847 400 Közép Nő 34 97 200 Közép Nő 2548 350 Beoszt. Nő 45 98 625 Közép Férfi 3349 65 Beoszt. Nő 25 99 250 Beoszt. Férfi 2850 70 Felső Férfi 35 100 720 Beoszt. Nő 29

8. Táblázat

Page 69: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

69

A leíró statisztikai elemzés menete: 1. Osztályok számának meghatározása. (egy lehetséges módszer)

0

minmax0

02

k

YYh

Nk

−=

>

15085,1477

651100

1001282

0

7

≈=−=

>=

h

2. Gyakorisági táblázat

osztályhatárok f i gi f i’ gi’ 65 215 22 0,22 22 0,22

215 365 33 0,33 55 0,55 365 515 22 0,22 77 0,77 515 665 8 0,08 85 0,85 665 815 9 0,09 94 0,94 815 965 4 0,04 98 0,98 965 1115 2 0,02 100 1,00

Összesen: 100 1,00 9. Táblázat

Egy kicsit „gyakorlatiasabb” osztályba sorolással:

Legyen h0 = 110 k0 = 10

osztályhatárok f i gi f i’ gi’ 65 175 15 0,15 15 0,15

175 285 23 0,23 38 0,38 285 395 22 0,22 60 0,6 395 505 16 0,16 76 0,76 505 615 7 0,07 83 0,83 615 725 6 0,06 89 0,89 725 835 5 0,05 94 0,94 835 945 4 0,04 98 0,98 945 1055 1 0,01 99 0,99

1055 1165 1 0,01 100 1,00 Összesen: 100 1,00

10. Táblázat 3. Medián

350)350350(5,0350

5,50)1100(21

2/1

=−+=

=+=

Me

s

Medián becslése a gyakorisági táblázat (2. osztályba sorolást alkalmazva) alapján

Page 70: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

70

34511022

3850285ˆ

2

!

'1

0,

=⋅−+=

⋅−

+=−

eM

Nf

hf

fN

xeM

me

meme

me

me

4. Kvartilisek meghatározása

500)500500(75,0500

75,75)1100(43

25,226)225230(25,0225

25,25)1100(41

3

4/3

1

4/1

=−⋅+=

=+=

=−⋅+=

=+=

Q

s

Q

s

5. Módusz mo=2

273110)2223()1523(

1523175ˆ

ˆ

1

1

0,

=⋅−+−

−+=

−=−=

⋅+

+=

+

oM

ffd

ffd

hdd

dxoM

momof

momoa

mofa

amo

6. Számtani átlag

8,392100

39280

100

1110110001...2302312015 ==⋅+⋅++⋅+⋅=Σ

Σ=∗

i

ii

f

xfY

Page 71: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

71

Becslés gyakorisági táblázatból: Osztályhatárok Osztályközép f i f iY i

65 175 120 15 1800 175 285 230 23 5290 285 395 340 22 7480 395 505 450 16 7200 505 615 560 7 3920 615 725 670 6 4020 725 835 780 5 3900 835 945 890 4 3560 945 1055 1000 1 1000

1055 1165 1110 1 1110 Összesen: 100 39280

11. Táblázat

7. Grafikus ábrázolás, hisztogram 7 osztályba sorolva:

Hisztogram

0

5

10

15

20

25

30

35

215

365

515

665

815

965

1115

Tová

bb

Gya

koris

ág

26. ábra

10 osztályba sorolva:

Hisztogram

0

5

10

15

20

25

175

285

395

505

615

725

834

945

1055

1165

Továb

b

Gya

koris

ág

27. ábra

Page 72: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

72

8. Terjedelem

1035651100minmax =−=−= xxR

Interkvartilis terjedelemmutató

75,27325,226500135,0 =−=−= QQR

9. Átlagos abszolút eltérés:

8,17964=∑ id

65,1798,17964100

111 ===−= ∑∑ ii dN

xxN

δ

10. Tapasztalati szórás

93,23099

8,5279635

1n

)xx(s

8,229100

8,5279635

n

)xx(s

8,5279635)xx(

2N

1ii

2N

1ii

2N

1ii

==−

−=

==−

=

=−

=∗

=

=

Becslés a gyakorisági táblázat segítségével:

Osztályhatárok Osztályközép f i f iY i di di2 f i·di

2 65 175 120 15 1800 -272,8 74419,84 1116298

175 285 230 23 5290 -162,8 26503,84 609588,3 285 395 340 22 7480 -52,8 2787,84 61332,48 395 505 450 16 7200 57,2 3271,84 52349,44 505 615 560 7 3920 167,2 27955,84 195690,9 615 725 670 6 4020 277,2 76839,84 461039 725 835 780 5 3900 387,2 149923,8 749619,2 835 945 890 4 3560 497,2 247207,8 988831,4 945 1055 1000 1 1000 607,2 368691,8 368691,8

1055 1165 1110 1 1110 717,2 514375,8 514375,8 Összesen: 100 39280 5117816

12. Táblázat

Page 73: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

73

2,226100

5117816ˆ

5117816210

1

==

=⋅∑=

s

df ii

i

11. Relatív szórás

586,09,391

8,229 ===Y

sV

A relatív szórás önmagában nem árul el sok mindent. Ha egy másik évfolyam 100 főből álló mintájának relatív szórásával össze tudnánk hasonlítani, akkor a két relatív szórás közül a kisebbik esetén a számtani átlag jobban reprezentálja az alapadatokat. 12. Aszimmetria

5587,08,229

)3508,392(3)(3 =−=−=s

MexP

Mérsékelt bal oldali aszimmetria (jobbra elnyúló eloszlás). 13. Lapultság, csúcsosság

2034,0)111784(2

25,226500)(2

784)730790(9,0730

9,90)1100(109

111)110120(1,0110

1,10)1100(101

19

13

9

10/9

1

10/1

=−

−=−

−=

=−+=

=+=

=−+=

=+=

DD

QQK

D

s

D

s

Mivel 0,2034<0,263, csúcsosabb, mint a normál eloszlás.

Page 74: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

74

V. Becslés

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Page 75: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

75

Az előző fejezetben már említettük, hogy az elméleti eloszlásokkal történő számoláshoz elsősorban azok paramétereinek ismerete szükséges. A gyakorlatban egy adott probléma elemzésénél többnyire tapasztalatból tudjuk az eloszlás jellegét, de nem ismerjük az eloszlás alakját pontosan meghatározó paramétereket. Tudjuk például, hogy a labdarúgó mérkőzéseken a gólok száma jó közelítéssel Poisson-eloszlású. Ugyanilyen eloszlással írható le mondjuk a Tiszán egy év alatt levonuló árhullámok száma, csak éppen más λ paraméterrel. Minden – majdnem minden – elméleti eloszlásnak van(nak) paramétere(i), melyeket általában nem ismerünk, azokat a ξ-re vonatkozó statisztikai mintából kell közelítőleg meghatároznunk, becsülnünk, mert csak ezek ismeretében tudunk a vizsgált jelenséggel kapcsolatos valószínűségi kérdésekre válaszolni. Szintén a II. fejezetben vázoltuk fel a statisztikai következtetés logikai menetét, s annak első lépését, a mintavétel módszereit is áttekintettük. A második lépéssel, a mintából származó adatok feldolgozásával (tömörítésével, rendezésével, ábrázolásával stb.) a leíró statisztika foglalkozik, melyet szintén részletesen megismertünk. Már akkor említettük, hogy a mintából számított mutatókat (átlag, szórás, stb.) a sokasági jellemzőkre való következtetésre, az ismeretlen paraméterek becslésére (is) használjuk. Ebben az esetben tehát a mintából meghatározunk egy számértéket, s ezt a számot tekintjük az ismeretlen paraméter közelítő értékének. Ezt az eljárást nevezzük pontbecslésnek. Nem arról van tehát szó, hogy a mintából kiszámoljuk az ismeretlen paramétert. A mintából számolt mutatók értékei függnek a véletlentől, mintáról mintára változnak, így maguk is valószínűségi változónak tekinthetők. A mintából számolt mutatók eloszlását mintavételi eloszlásnak nevezzük. Annak megítélése, hogy a mintából számolt mutató (amit minta statisztikának vagy röviden statisztikának is neveznek) mikor tekinthető az ismeretlen elméleti paraméter „jó” becslésének, többféle szempontból történhet.

V.1 A becslés tulajdonságai19

Tudjuk, hogy a sokaság paramétereit általában több statisztikával is becsülhetjük. Így pl. a várható értéket - normális eloszlású alapsokaság esetében - a mintaátlaggal és a mediánnal is becsülhetjük, a szórást a minta szórásával, de a terjedelem segítségével is becsülhetjük stb. Természetesen felmerül a kérdés, hogy ezek közül melyik becslést kell választanunk. Hogy ilyen esetekben a legmegfelelőbb becslést választhassuk, kritériumokat kell felállítanunk arra vonatkozólag, hogy mikor fogadjunk el egy becslést jónak, illetve mikor tartsuk jobbnak az egyik becslést a másiknál. A statisztikai becslés Fisher-féle kritériumait az alábbiakban foglaljuk össze20.

V.1.a Torzítatlan becslés

A legfontosabb tulajdonság, amit egy „jónak” minősített becsléstől megkívánunk, hogy a becslés a szóban forgó paraméterérték körül ingadozzék. Pontosabban azt kívánjuk meg, hogy a becslés (az illető statisztika) várható értéke éppen a megfelelő paraméterérték legyen. Ha egy becslésre ez a követelmény teljesül, akkor torzítatlan becslésről beszélünk. Így pl. torzítatlan a becslés, ha a mintaátlagok várható értéke megegyezik az alapsokaság várható értékével: ( ) )(ξMxM = , vagy a korrigált tapasztalati szórásnégyzet várható értéke az

elméleti varianciával egyenlő: )()( 22* ξDsM = . Ez azonban nem igaz a tapasztalati

19 Kövesi J.: Kvantitatív módszerek, Oktatási segédanyag, BME MBA Mérnököknek program, Budapest, 1998 20 A V.1 részben található ábrák a STATISTICA for Windows programmal készültek

Page 76: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

76

szórásnégyzetre. A tapasztalati szórásnégyzet várható értéke (az elméleti varianciát az

egyszerűség kedvéért σ2-el jelölve): 222 11

1)( σσ

−=−=nn

nsM . Az empirikus

(tapasztalati) szórásnégyzet tehát elméleti variancia torzított becslése. Látható, hogy a „torzítás mértéke” függ a mintaszámtól, s a mintaszám növekedésével csökken. Az ilyen tulajdonságú becsléseket aszimptotikusan torzítatlan becslésnek nevezzük. A torzítatlanság nem azt jelenti, hogy egy adott mintából kapott becslés egyenlő az ismeretlen paraméterrel, sőt arra sem ad feleletet, hogy a mintából kapott becslés értéke közel, vagy távol esik-e a valódi paramétertől. A torzítatlanság esetében csupán abban lehetünk biztosak, hogy nincs semmiféle szisztematikus, egyirányú eltérés a becslés és a becsült paraméter között. Példa: Vizsgáljuk meg n = 3 elemű statisztikai minták alapján a kockadobás tapasztalati és korrigált tapasztalati szórását. (Az első fejezet 1.2.1 pontjában (ld. 9. o.) meghatároztuk a kockadobás elméleti szórását, s azt találtuk, hogy D(ξ) ≈ 1,71.) A kísérletet 50-szer megismételve a számított tapasztalati ill. korrigált tapasztalati szórásokat az alábbi ábrán (28. ábra) láthatjuk.

T_SZ3K_TSZ3

n=3 elemû minták szórásai

0.0

0.5

1.0

1.5

2.0

2.5

3.0

0 4 8 12 16 20 24 28 32 36 40 44 48

1,73

1,41

28. ábra: Tapasztalati szórások összehasonlítása

Az ábrán folytonos vonal mutatja a tapasztalati ill. szaggatott vonal a korrigált tapasztalati szórásokat a mintaszám függvényében. Vízszintes folytonos vonallal jelöltük a kétfajta szórás (50-50 elem) átlagát. A korrigált tapasztalati szórások átlaga 1,73, a tapasztalati szórásoké 1,41. Jól látható, hogy a korrigált tapasztalati szórások az elméleti (1,71) szórás körül ingadoznak (átlaguk közel esik az elméleti értékhez), míg a tapasztalati szórások átlaga 1,41, jóval nagyobb az eltérés az elméleti értéktől.

V.1.b Konzisztens becslés

Konzisztensnek (összetartónak) nevezzük a becslést akkor, ha ingadozása a becsült paraméter körül a minta elemszámának növelésével egyre csökken. A korábbiakban láttuk, hogy a

számtani átlag torzítatlan becslése a várható értéknek, s szórása nx

σσ = . Nyilvánvaló, hogy

n → ∞ esetén 0→xσ , vagyis a számtani átlag konzisztens becslése a várható értéknek.

Page 77: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

77

Példa: Az előző példához hasonlóan „kevésbé matematikai módon”, tapasztalati adatokból vizsgáljuk meg a kockadobás esetén a két empirikus szórás viselkedését a mintaszám növekedésének függvényében. A 29. ábra mutatja a kapott eredményeket. Az ábrán folytonos vízszintes vonal jelzi az elméleti értéket (D(ξ)≈1,71). Az ábrából egyértelműen látszik, hogy a mintaszám növekedésével mind a korrigált tapasztalati, mind a tapasztalati szórás az elméleti érték körül ingadozik (torzítatlan ill. aszimptotikusan torzítatlan becslés), s az ingadozás mértéke a mintaszám növekedésével egyre kisebb (konzisztens a becslés).

T_SZ_

K_T_SZ

Kockadobás szórása

0.8

1.2

1.6

2.0

0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100

29.: A kockadobás szórása a mintaszám függvényében (n=100)

Megfigyelhetjük, hogy kb. 30-35 elemű minták esetén a különbség a két szórás között, már gyakorlatilag elhanyagolható. A 30. ábraábrán csak az első 50 adatot ábrázolva, a két szórás közötti különbség jobban megfigyelhető.

30. ábra: A kockadobás szórása a mintaszám függvényében (n=50)

T_SZ_K_T_SZ

Kockadobás szórása

0.8

1.2

1.6

2.0

2.4

0 5 10 15 20 25 30 35 40 45 50

Page 78: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

78

V.1.c Hatásos becslés

Két becslés összehasonlításakor a hatásosság vagy más néven efficiencia kritériuma alapján döntjük el, hogy a kettő közül melyik a jobb. A hatásosságot nagyon fontos becslési kritériumnak tekintjük. Két becslés közül a kevésbé ingadozót nevezzük hatásosabbnak. Az ingadozás mértéke a szórás, ezért a becslések ingadozását is a szórásukkal jellemezzük. Tehát két becslés közül a kisebb szórású becslést tekintjük hatásosabbnak, jobbnak. Gyakran előfordul, hogy a torzítatlan becslések között van olyan, amelyiknek a szórása az összes többi becslés szórásánál kisebb (adott n mellett). Ekkor ezt a minimális szórású, torzítatlan becslést hatásosnak nevezzük, és a többi becslés hatásfokát ehhez mérjük.

Példa: A „szokott” módon, tapasztalati adatokból hasonlítsuk össze (n=5 elemű minták alapján) a kockadobás átlagát és mediánját. A kísérletet 50-szer megismételve, a minták átlagait és mediánjait a mutatja.

ATLMED

n=5 elemû minták átlaga és mediánja

0.5

1.5

2.5

3.5

4.5

5.5

6.5

0 5 10 15 20 25 30 35 40 45 50

31. ábra: A kockadobás átlaga és mediánja

Az ábrán szaggatott vonallal összekötve a négyzetek a mediánokat, s folytonos vonallal összekötve körök jelölik az egyes minták átlagait. Vízszintesen behúzott folytonos vonal a várható értéket mutatja (M(ξ) = 3,5). Megfigyelhetjük, hogy a medián is és az átlag is az elméleti érték körül ingadozik (torzítatlan becslések), ugyanakkor az átlagok eltérése, ingadozása kisebb, mint a mediánoké. Kiszámolva a két adatsor korrigált tapasztalati szórásait, az eredmények az alábbiak: 794,0* =átlags ; 320,1* =mediáns . Az átlag szórása valóban

kisebb, mint a mediáné, az adatok alapján kb. 40%-kal. Az átlag tehát hatásosabb becslés, mint a medián.

V.1.d Elégséges becslés:

Egy becslés elégséges, ha az lényegében minden információt tartalmaz a paraméterre vonatkozóan. Ez más szóval annyit jelent, nincs más olyan becslés, amelyik a paraméterről több információt szolgáltatna, mint az elégségesnek minősülő becslés.

Page 79: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

79

V.2 A pontbecslés módszerei

Az eddigiek során is használtunk különféle becslőfüggvényeket pontbecslés céljára, de ezeket csak „ösztönösen” választottuk. Így természetesen adódott, hogy pl. a várható értéket a mintából számított átlaggal vagy más középértékkel becsüljük. Ez az ún. analógia elve, ami azt jelenti, hogy a mintából a becsülendő jellemzővel megegyező tartalmú mutatót számítunk ki, és ennek segítségével becsüljük a megfelelő sokasági jellemzőt. Léteznek azonban olyan általános elvek, módszerek, amelyek segítségével olyan esetekben is tudunk jó tulajdonságú becslőfüggvényeket készíteni, amikor a megérzés vagy az analógia már nem segít. A legegyszerűbb grafikus becslést kivéve nem célunk ezek részletes ismertetése, csak röviden felsoroljuk illetve ismertetjük lényegüket21,22.

• Maximum-likelihood módszer (a legnagyobb valószínűség elve): az eljárás lényege az ún. likelihood függvény felállítása, amely nem más, mint a mintaelemek együttes sűrűségfüggvénye, s az ismeretlen paraméter becslésére azt a statisztikát használjuk, melyre ez a függvény maximális értéket vesz fel. Ez az egyik legjobb és leggyakrabban alkalmazott eljárás.

• Legkisebb négyzetek módszere: nem pusztán a statisztikai becslésre szolgáló

eljárás, hanem alkalmazható más becslési feladatok megoldására is. A módszer lényege, hogy egy elméleti modellnek (ez lehet egy eloszlás vagy sűrűségfüggvény, de lehet egy egyszerű konstans függvény is) a paramétereit határozza meg úgy, hogy a tényleges és a becsült paraméterekkel illesztett modellek négyzetes eltérése, azaz az eltérések négyzetösszege minimális legyen.

• Momentumok módszere abban áll, hogy ha k számú paramétert akarunk becsülni,

akkor az eloszlás első k számú elméleti momentumát egyenlővé tesszük a mintából számított tapasztalati momentumokkal. Ily módon az ismeretlen paraméterekre egyenletrendszert nyerünk, amely kedvező esetben megoldható.

• Grafikus paraméterbecslés: az előző matematikai eljárásokhoz képest, ez inkább

a gyakorlat számára könnyebben kezelhetőbb eljárás. Bár pontossága természetesen a grafikus ábrázolás adta lehetőségektől függ, de egyszerűsége miatt sokszor jól használható. Lényegük, hogy valamilyen módon (többnyire logaritmizálással) linearizáljuk az eloszlásfüggvényt, s az adatokat grafikusan ábrázolva az egyenes meredekségéből és/vagy tengelymetszetéből következtetünk az eloszlás ismeretlen paraméteré(ei)re.

21 Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985 22 Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996

Page 80: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

80

V.2.a Exponenciális eloszlás paraméterének grafikus becslése

Az exponenciális eloszlást viszonylag egyszerűen „kiegyenesíthetjük”. Az eloszlás eloszlásfüggvénye: xexF λ−−=1)( . Mindkét oldalból 1-et kivonva, (-1)-el megszorozva, majd az egyenletet logaritmizálva és újra megszorozva (–1)-gyel, az alábbi összefüggést kapjuk:

-ln[1-F(x)]= λx Ha x függvényében ábrázoljuk a baloldalon lévő kifejezést, egy egyenest kapunk, melynek tengelymetszete 0, iránytangense (meredeksége) éppen az ismeretlen λ paraméter (32. ábra).

-ln[1-F(x)]

x

αααα tgα ≈ λ

32. ábra: Exponenciális eloszlás λ paraméterének grafikus becslése

V.2.b Normális eloszlás paramétereinek grafikus becslése23

Normális eloszlás eloszlásfüggvényének „kiegyenesítése” már nem végezhető el egyszerű logaritmizálással, mivel az eloszlásfügvény elemi függvényét nem ismerjük. Speciális beosztású ordinátatengelyű koordinátarendszert alkalmazva azonban az eloszlásfüggvény képe linearizálható. A függőleges tengelyen az eloszlásfüggvény értékeit ábrázoljuk úgy, hogy az eloszlásfüggvény középértékéből (0,5) kiindulva az egységnyi távolság 1 szórásnyi legyen. Az egyszerűség kedvéért ábrázoljuk most a standard normális eloszlás eloszlásfüggvényét (Φ(u)). Tudjuk, hogy a függvény –3, -2, -1, 0, 1, 2, 3 helyen felvett értékei a következők 0,00135; 0,0228; 0,1587; 0,5; 0,8413; 0,9772 és 0,99865. Ábrázoljuk most ezeket a pontokat úgy, hogy a Φ(1) egy távolságegységgel feljebb a Φ(-1) egy távolságegységgel lejjebb, a Φ(2) 2 távolságegységgel feljebb a Φ(-2) 2 távolságegységgel lejjebb stb. kerüljön , mint a Φ(0) =0,5. Az ordináta tengely skálázása ezáltal egyenlőtlen lett, viszont így a Φ(u) függvény képe egyenes, ahol nyilván a többi érték is ezen az egyenesen fekvő pontot határoz meg (33. ábra)

23 Lukács O.: Matematikai statisztika, Példatár, Műszaki Könyvkiadó, Budapest, 1987

Page 81: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

81

-3 -2 -1 0 1 2 3

0,5

0,158

0,0228

0,0013

0,998

0,977

0,841

33. ábra: Gauss-papíros ábrázolás

Ha az x tengelyt most átskálázzuk (-3 helyébe -3σ, -2 helyébe -2σ stb. kerül), akkor az előző pontok egy 0 várható értékű, σ szórású normális eloszlású változó eloszlásfüggvényének a pontjai. Végül toljuk el az ordinátatengelyt eredeti helyzetével párhuzamosan az x tengely mentén -µ egységgel. Az így kapott koordinátarendszerben a µ várható értékű, σ szórású normális eloszlású változó F(x) eloszlásfüggvényének képe egyenes. Ha a minta adatai alapján kapott tapasztalati eloszlásfüggvényt az előbbi koordinátarendszerben (ún. Gauss-papíron) ábrázoljuk, normális eloszlás esetén a pontok közelítőleg egy egyenesre esnek. Behúzva az egyenest, a normális eloszlás tulajdonságait ismerve becsülhetjük az ismeretlen paramétereket. Az egyenes és a függőleges tengely (ill. gyakrabban az y = 0,5 ordináta érték) metszéspontjánál leolvasva az x tengely értékét kapjuk az eloszlás µ paraméterét. A 0,1587 ill. a 0,8413 y érték és az egyenes metszéspontjánál pedig a µ-σ ill. a µ+σ értékeket olvashatjuk le az x tengelyen, amiből a µ ismeretében σ könnyen meghatározható.

V.3 Intervallumbecslés

A becslésről szóló eddigi fejtegetéseink során az eloszlás valamely ismeretlen paraméterét egyetlen mennyiséggel, a mintaelemekből számított statisztika numerikus értékével, tehát egyetlen számadattal becsültük, azaz pontbecslést alkalmaztunk. Mivel a mintából számolt statisztika is valószínűségi változó, aktuális értéke általában eltér a becsült paramétertől. Ha sokszor (sok n-es mintából) végezzük a becslést, akkor a mintastatisztika értékei – torzítatlan becslés esetén – az elméleti érték körül szóródnak. A szóródás mértéke természetesen függ a minta nagyságától. Bár egyetlen mintából nem tudjuk megmondani a becsült paraméter pontos értékét, a mintastatisztika eloszlásának ismeretében (ezeket neveztük mintavételi eloszlásoknak) sokszor meg tudunk adni egy olyan intervallumot, amely az ismeretlen paramétert nagy – mondjuk 95%-os – valószínűséggel tartalmazza. Az ilyen intervallumot az adott paraméterre vonatkozó 95%-os konfidenciaintervallumnak (megbízhatósági intervallumnak) nevezzük. A továbbiakban a különböző paraméterekre vonatkozó intervallumbecsléssel foglalkozunk24

24 Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985

Page 82: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

82

V.3.a Konfidenciaintervallum a normális eloszlás várható értékére25

Tegyük fel, hogy a ξ valószínűségi változó N(µ,σ0) eloszlású, ahol σ0 szórás ismert. A µ paramétert statisztikai mintából a számtani átlaggal becsüljük. Tudjuk, hogy az átlag eloszlása

(mintavételi eloszlás) szintén normális eloszlású µ=)(xM várható értékkel, és n

D 0)(σ

ξ =

szórással. A normális eloszlás ismert tulajdonsága, az ún 2σ-szabály alapján az átlag értéke 95,44% valószínűséggel a várható érték ± 2 szórás tartományba, vagyis a

+−nn00 2,2

σµσµ intervallumba esik: 9544,022 00 =

+<<−n

xn

Pσµσµ .

Ha ismernénk tehát a µ várható értéket, és a számegyenesen megrajzolnánk a fenti intervallumot, akkor az n elemű minták számtani közepét kiszámolva 100 esetből kb. 95 mintaközép ebbe az intervallumba esik. Sajnos azonban µ értékét nem ismerjük (éppen ezt szeretnénk becsülni), a fenti intervallumot nem tudjuk megrajzolni. Rendezzük át az

összefüggést a következő formára: 9544,022 00 =

+<<−n

xn

xPσµσ

.

Ezen összefüggés valószínűségelméleti értelme a következő. Az ismeretlen µ paraméter nem valószínűségi változó, hanem egy állandó, a számegyenes egy adott pontja. Valószínűségi

változó viszont az

+−n

xn

x 00 2,2σσ

intervallum két végpontja. Azaz annak a

valószínűsége, hogy ez a véletlen helyzetű intervallum tartalmazza (lefedi) a µ pontot, közelítőleg 95%. (34. ábra)

34. ábra: Konfidenciaintervallumok a µ várható értékre

25 Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985

µ

Page 83: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

83

Az

+−n

xn

x 00 2,2σσ

intervallumot a normális eloszlás várható értékére vonatkozó 95%-

os (pontosabban 95,44%-os) konfidenciaintervallumnak nevezzük. Természetesen nem csak 95%-os intervallumot lehet szerkeszteni. Ha a sokaság elméleti szórása ismert (σ0), akkor az átlag mintavételi eloszlása lapján tetszőleges kicsiny α > 0 számhoz meghatározható olyan

zα/2 mennyiség, hogy a ασµσαα −=

+<<− 102/

02/

nzx

nzxP .

Normális eloszlás esetén tehát az

+−n

zxn

zx 02/

02/ ,

σσαα intervallum (1-α) szintű

konfidencia intervallum a µ várható értékre. Adott eloszlás esetén minél nagyobb a megbízhatósági szint (1-α), annál szélesebb intervallumot kapunk. Nagy biztonsággal csak viszonylag hosszabb intervallumról állíthatjuk, hogy valóban tartalmazza az ismeretlen paramétert. Mint látható az intervallum hossza függ még a minta nagyságától és az alapsokasági (σ0) szórástól. Az eddigiekben csak kétoldali intervallumról beszéltünk, mivel a gyakorlatban ez az elterjedtebb. Ha csak alsó vagy csak felső határokat kívánunk becsülni, akkor a követendő eljárás az eddigiekhez hasonló lesz. A részletek mellőzésével belátható, hogy felső korlát

esetén ασµ α −=

+< 10

nzxP kapható, ahol zα a standard normális eloszlás táblázatból

kereshető ki.[6] Azaz annak a valószínűsége, hogy az ismeretlen sokasági paraméter az

nzx 0σ

α+ érték alá esik, 1-α. Hasonló módon az alsó korlátra a ασµ α −=

−> 10

nzxP

összefüggést kapunk.

Példa: ROM chipek előállításánál az égetőkemence maximum hőmérsékletét vizsgálták. Korábbi vizsgálatok alapján tudják, hogy a folyamatban a maximum hőmérsékletek elméleti szórása 12 °C. A vizsgálat céljára 8 elemű véletlen mintát vettek és az átlag hőmérséklet 492 °C-ra adódot. Adjunk 95%-os szinten intervallumbecslést a kemence hőmérsékletének várható értékére! [5] n = 8 Cx °= 492 σ0= 12°C ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → zα/2 = 1,96

behelyettesítve a fenti összefüggésbe:

8

1296,1492

8

1296,1492 +<<− µ ,

483,68 < µ < 500,32

A ROM chipek érzékenysége miatt a chipeket nem szabad tartósan túl magas hőhatásnak kitenni, ezért a technológiát úgy kell beállítani, hogy a hőmérséklet hosszabb távon ne

Page 84: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

84

haladja meg az 500 °C-ot. A minta alapján – 95%-os megbízhatósággal - teljesíti-e ezt a feltételt az égetőkemence? n = 8 Cx °= 492 σ0= 12°C ε = 0,95 → α = 0,05 → egyoldali becslés → zα = 1,645

4998

12645,14920 ≈+=+<

nzx

σµ α °C

A fenti gondolatmenet nem csak a normális eloszlás várható értékének becslésére igaz, hanem a mintavételi eloszlás ismeretében egyéb paraméterek konfidenciaintervallumának meghatározására is. A továbbiakban – a részletes levezetés mellőzésével – a legfontosabb paraméterek intervallumbecsléseit mutatjuk be.

V.3.b Konfidenciaintervallum a normális eloszlás várható értékére, elméleti szórás ismeretlen26

Ebben az esetben továbbra is feltételezzük, hogy a sokaság N(µ,σ) eloszlású, de sem µ-t sem σ-t nem ismerjük. A problémát ezúttal az okozza, hogy bár az átlag továbbra is normális eloszlású, de az elméleti szórás nem ismert, így kénytelenek vagyunk a szórást a mintából

becsülni (s*), ennélfogva azn

x

σµ−

helyett kénytelenek vagyunk a ns

x*

µ− változót használni.

Ez viszont már nem normális eloszlású, hanem t- (Student-) eloszlású valószínűségi változó, v = n-1 szabadságfokkal. (A szabadságfokot szokták még DF-fel és néha f-fel is jelölni. Mi a továbbiakban elsősorban majd a DF jelölést használjuk.) A Student-eloszlás a normális eloszláshoz hasonlóan szimmetrikus eloszlás, az eloszlás egy paramétere az ún. szabadságfok (DF,v) jellemzi. A t-eloszlás ismeretében nézzük tehát az intervallumbecslés határainak meghatározását. Az előző esethez képest „csak” annyi a különbség, hogy normális eloszlás

helyett a t-eloszlást kell alkalmaznunk. ανµν αα −=

+<<− 1)()(

*

2/

*

2/n

stx

n

stxP

A tα/2(v) értéket a v = n-1 szabadságfokú t-eloszlás táblázatából kereshetjük ki. Az s* - az eddigieknek megfelelően – a korrigált tapasztalati szórást jelöli.

26 Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996

Page 85: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

85

Példa: Tegyük fel, hogy az előző – ROM égetőkemencés – példánál nem ismerjük az elméleti szórást, de továbbra is tudjuk, hogy a maximum hőmérsékletek normális eloszlással írhatók le. A nyolcelemű minta korrigált tapasztalati szórása s*= 4,5°C, az átlag továbbra is 492°C. Adjunk becslést 95%-os megbízhatósági szinten a kemence hőmérsékletének várható értékére!27 n = 8 Cx °= 492 s*= 4,5°C v (DF) = n –1 = 8 – 1 = 7 ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → tα/2 = 2,365

8

5,4365,2492

8

5,4365,2492 +<<− µ ,

488,24 < µ < 495,76

V.3.c Sokasági arány becslése28

A vizsgált egyedek (pl. férfiak aránya a népességen belül, a selejtes termékek aránya stb.) sokasági arányát jelöljük nagy P-vel. Ennek torzítatlan (pont)becslése a p = k/n relatív gyakoriság, ahol n a mintaszám, k a mintában talált „kedvező” esetek száma. Mivel n rögzített (nem valószínűségi változó), k binomiális eloszlást követ, így p is binomiális eloszlású lesz, M(p)= P várható értékkel és D2(p) = P(1-P)/n varianciával. Mivel az elméleti variancia eleve ismeretlen az sp

2 = p(1-p)/n értékkel becsüljük. A mintából számított p ismeretében a binomiális eloszlás táblázatából könnyen megkaphatjuk a keresett intervallumot. Ezt az eljárást azonban a gyakorlatban ritkán alkalmazzuk, mert diszkrét jellege meglehetősen pontatlanná teszi. Az első fejezetben láttuk, hogy bizonyos feltételek mellett a binomiális eloszlás jól közelíthető normális eloszlással. Ha például p közel van 0,5-hez, akkor már n=20 elemű minta is elegendő a normális közelítéshez. Kisebb p-nél természetesen nagyobb mintaszám kell a megfelelő közelítéshez, de gyakorlati szempontból n =30-40 elemű mintáknál már jól használható a normális eloszlással való helyettesítés. Ekkor a kétoldali konfidenciaintervallum:

ααα −=

−+<<−− 1)1()1(

2/2/ n

ppzpP

n

ppzpP

27 Banks, J.: Principles of Quality Control, Wiley, New York, 1989 28 Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996

Page 86: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

86

Példa: A Felvillanyozzuk Kft. napi termeléséből vett n = 200 elemű mintában a hibás égők száma 24 db. 95%-os megbízhatósági szint mellett adjunk intervallumbecslést a sokasági arányra. n = 200 p = 24/200 = 0,12 ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → zα/2 = 1,96

200

88,012,096,112,0

200

88,012,096,112,0

⋅+<<⋅− P

0,075 < P < 0,165

V.3.d Sokasági variancia becslése29,30

Ebben a részben a normális eloszlású sokaság szórásnégyzetének intervallumbecslését mutatjuk be. Ha a sokaság eloszlása nem normális, akkor még nagy minták esetén sem érvényes az itt következő intervallumbecslés. A σ2 (pont)becslésére használt tapasztalati és korrigált tapasztalati szórásnégyzetek közelítőleg az ún. χ2-eloszlással írhatók le. A χ2-eloszlás jellemzőit, alakját egy paramétere – a t-eloszláshoz hasonlóan – a szabadságfok határozza meg. Különböző χ2-eloszlásokat mutat a 35. ábra. Sajnálatos módon az eddig megszokott, kényelmes mintavételi eloszlásoktól eltérően, a χ2-eloszlás csak pozitív értékekre van értelmezve, nem szimmetrikus, de ettől eltekintve ugyanúgy használhatjuk intervallumbecslésre, mint a standard normál ill. a t-eloszlásokat. A szabadságfok növekedésével az eloszlás közelít a normális eloszláshoz, amit a későbbiekben a konfidencia intervallumok meghatározásánál is kihasználunk.

Chi-négyzet eloszlás sûrûségfüggvénye

0.0

0.1

0.2

0.3

0.4

0.5

0 2 4 6 8 10 12 14 16

DF = 2

DF = 4

DF = 7

f(x)

x

35. ábra: χ2-eloszlás sűrűségfüggvénye31

29 Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996 30 Sincich, T.:Statistics by Example, Dellen Publishing Company, San Fransisco, 1990 31 Készült a STATISTICA for Windows program segítségével

Page 87: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

87

Mivel az eloszlás nem szimmetrikus, kétoldali becslés esetén az eloszlás alsó és felső oldalán kijelölt α/2 valószínűség nem egyforma hosszúságú intervallumokat jelent, ennélfogva az előzőekben vizsgált esetekkel ellentétben a konfidenciaintervallum nem lesz szimmetrikus a pontbecslésre. Normális eloszlású valószínűségi változó ismeretlen varianciájának megbízhatósági intervallumát az alábbi összefüggéssel határozhatjuk meg:

( ) ( ) αχ

σχ αα

−=

−<<−

111

22/1

2*2

22/

2* snsnP

A 2

2/αχ és a 22/1 αχ − értékeket a v (ill. DF) = n-1 szabadságfokú χ2 táblázatból lehet

meghatározni. Ha a konfidenciahatárokat az eloszlás elméleti szórására szeretnénk vonatkoztatni, akkor mindkét határ pozitív előjelű négyzetgyökét kell képeznünk. Ha a σ

becslését a tapasztalati szórással végeztük, akkor a számlálóban (n-1) helyett n-nel szorozzuk a szórást. Példa: A Felvillanyozzuk Kft. karácsonyfaégőinek élettartamát n = 16 elemű mintából vizsgálva azt találták, hogy az élettartamok korrigált tapasztalati szórása 10 óra. Határozzuk meg az égők varianciájára ill szórására vontakozó 95%-os konfidenciahatárokat! n = 16 s*= 10 óra ν (DF) = n –1 = 16 – 1 = 15 ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → 1-α/2 = 0,975

( ) ( )26,6

10116

5,27

10116 22

2 −<<− σ

54,5 < σ2 < 239,6

7,38 < σ < 15,5

Nagy szabadsági fok (nagy mintaszám) esetén a χ2-eloszlás közelíthető normális eloszlással.

Ha a mintaszám n>30, akkor felhasználva azt az eredményt, hogy a ( )122 2 −− νχ

mennyiség közelítőleg standard normális eloszlású változó, adott α valószínűséghez tartozó

χ2α értéke kifejezhető a standard normális eloszlás zα értékéből: ( )22 12

2

1 −+= νχ αα z . 32

32 Spiegel, Murray R.: Statisztika: Elmélet és gyakorlat, Panem – McGraw-Hill, Budapest, 1995

Page 88: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

88

Példa: Tegyük fel, hogy az előző példában említett vizsgálatot n=50 elemű mintából végezték. 95%-os megbízhatósági szinten milyen intervallumban található az elméleti szórás? n = 50 s*= 10 óra ν (DF) = n –1 = 50 – 1 = 49 ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → 1-α/2 = 0,975

( ) ( )4,32

10150

4,71

10150 22

2 −<<− σ

68,6 < σ2 < 151,2

8,28 < σ < 12,3

Mivel n elég nagy, ezért a χ2 értékeket normális eloszlással közelítve azt kapjuk, hogy

( ) 72,69149296,12

1 22975,0 =−⋅+=χ ill.

( ) 11,31149296,12

1 22025,0 =−⋅+−=χ .

Ezeket behelyettesítve a konfidenciahatárok képletébe, a szórásranégyzetre ill szórásra az alábbi intervallumok adódnak:

70,3 < σ2 < 157,5

8,38 < σ < 12,55

V.3.e Konfidenciaintervallum két sokaság várható értékének különbségére, független mintavétel

Az V.3.a és az V.3.b fejezetekben megismerkedtünk egy normális eloszlású sokaság várható értékének becslésével. Az ott bemutatott gondolatmenetet felhasználva konfidenciaintervallumot szerkeszthetünk két sokaság várható értékének különbségére is. Adott megbízhatósági szint mellett választ kaphatunk arra a kérdésre, hogy mekkora intervallumban található a két középérték közötti eltérés. Tegyük fel például, hogy a férfiak és a nők fizetése, vagy két egyetem azonos szakán végzett hallgatók kezdő fizetése közötti különbséget szeretnénk megvizsgálni. Az ilyen és ehhez hasonló kérdésekre – többek között – konfidenciaintervallum szerkesztésével kaphatunk választ. Nem kell mást tennünk, csak a korábban megismert technikát alkalmaznunk a két várható érték különbségére. Ismerve a várható értékek különbségének mintavételi eloszlását, adott megbízhatósági szinthez megadhatjuk a konfidencia-határ(oka)t. Ismert sokasági szórások (ill. nagy mintaszám, n1 > 30 és n2 > 30) esetén a két számtani átlag különbségének mintavételi eloszlása

Page 89: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

89

közelítőleg normális eloszlású, µd = µ1 - µ2 várható értékkel, és 2

22

1

21

nnd

σσσ += szórással.

Ebben az esetben a konfidenciaintervallumot az alábbi összefüggéssel adhatjuk meg:

ασσµµσσαα −=

++−<−<+−− 1)()()(

2

22

1

21

2/21212

22

1

21

2/21 nnzxx

nnzxxP .

Ismeretlen de egyező sokasági szórások esetén a két számtani átlag különbségének mintavételi eloszlása n1+n2-2 szabadságfokú Student-(t-) eloszlású. Ekkor a konfidenciaintervallumot

αµµ αα −=

++−<−<

+−− 1

11)()(

11)(

21

22/2121

21

22/21 nn

stxxnn

stxxP pp

összefüggéssel számolhatjuk, ahol ( ) ( )

2nn

s1ns1ns

21

2*22

2*112

p −+−+−

= .

Példa A leíróstatisztikai elemzésnél használt 100 MBA hallgató adatai alapján szerkesszünk konfidenciaintervallumot a nők és férfiak fizetésének különbségére. 1-es index-el a férfiakat, 2-essel a nőket jelölve a számításhoz szükséges mintavételi adatok: n1 = 59 n2 = 41

1,4271 =x 2,3412 =x s1*= 237,3 s2*= 214,1

Bár nem ismert a sokasági szórás, de a mintaszám mindkét csoportban elég nagy, ezért

a normális eloszlással való közelítés megfelelő.

ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → zα/2 = 1,96

41

1,214

59

3,23796,1)2,3411,427()(

41

1,214

59

3,23796,1)2,3411,427(

22

21

22

+−−<−<+−− µµ ,

-3,3 < (µ1 - µ2) < 175,1.

A férfiak és nők fizetése közötti különbség 95%-os valószínűséggel -3,3 eFt és 175,1 eFt között van. Bár a férfiak fizetésének átlaga 85,9 eFt-al nagyobb a nők átlagos fizetésénél, de mivel az intervallum tartalmazza a 0 értéket is, ezen adatok alapján nem állíthatjuk, hogy ténylegesen magasabb a férfiak fizetése. Nagyobb mintaszámmal megismételve a vizsgálatot erősíthetjük a döntést, mivel a mintaszám növelésével csökken a konfidencia intervallum szélessége.

Page 90: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

90

V.3.f Két sokasági arány közötti különbség becslése

Két sokaságban egy adott jellemzővel vagy tulajdonsággal rendelkező egyedek arányát szeretnénk összehasonlítani, mint például a magas vérnyomásban szenvedők aránya a nős és nőtlen férfiak között, vagy a kandallóval rendelkező lakások aránya a budai és pesti kerületekben, vagy a vizsgát sikeresen teljesítők arányát az előadásra járó és nem járó hallgatók között, stb.. A mintabeli arányok különbségének (p1-p2) mintavételi eloszlása kellően nagy minták esetén közelítőleg normális eloszlású, µp = P1 – P2 várható értékkel és

2

22

1

11

n

qp

n

qpp +=σ szórással. Ekkor a konfidencia intervallum határai:

ααα −=

++−<−<+−− 1)()()(

2

22

1

11

22121

2

22

1

11

221 n

qp

n

qpzppPP

n

qp

n

qpzppP ,

ahol q1 = 1-p1 és q2 = 1-p2. A mintáknak kellően nagynak kell lenniük, hogy a fenti összefüggés érvényes legyen. Általános ökölszabályként akkor tekinthetjük elég nagynak a mintákat, ha az alábbi konfidencia-intervallumok nem tartalmazzák sem a 0-t sem az 1-et.

1

111 2

n

qpp ±

2

222 2

n

qpp ±

Példa Adjunk becslést 95%-os megbízhatósági szinten a 100 MBA hallgató adatai alapján, a 200 000 forint felett keresők arányának különbségére a férfiak és nők csoportjában. 1-es index-el a férfiakat, 2-essel a nőket jelölve a számításhoz szükséges mintavételi adatok: n1 = 59 n2 = 41 k1= 51 k2= 29 p1= 51/59 = 0,8644 p2= 29/41 = 0,7073 Először vizsgáljuk meg az intervallumbecslés feltételét, kellően nagyok-e a mintáink.

férfiakra: 0891,08644,059

1356,08644,028644,0 ±=⋅±

nőkre: 142,07073,041

2927,07073,027073,0 ±=⋅±

Egyik intervallum sem tartalmazza a 0-t vagy az 1-et, alkalmazhatjuk a nagymintás konfidenciaintervallum-szerkesztést. ε = 0,95 → α = 0,05 → kétoldali becslés: α/2 = 0,025 → zα/2 = 1,96

41

293,0707,0

59

136,0864,096,11571,0)(

41

293,0707,0

59

136,0864,096,11574,0 21

⋅+⋅+<−<⋅+⋅− PP

-0,007 < (P1 - P2) < 0,322.

95% valószínűséggel a 200 eFt felett kereső férfiak és nők aránya között 0 – 32,2% a különbség.

Page 91: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

91

V.3.g A minta elemszámának meghatározása

Konfidenciaintervallum szerkesztésénél eddig feltételeztük, hogy rendelkezésünkre áll egy adott elemszámú minta, s ennek segítségével kiszámoltuk az elméleti paramétert megadott valószínűséggel tartalmazó intervallum határait. Mint láttuk, a becslés pontosságát ilyenkor a szórás, a megbízhatósági szint mellett a mintaelemszám is befolyásolja. Közelítsük meg a problémát fordítva. Adott megbízhatósági szint, sokasági szórás mellett meghatározhatjuk, hogy mekkora mintára van szükség, hogy adott pontosságot (∆) tudjunk elérni. Normális eloszlású valószínűségi változó várható értékének becslésére ismert sokasági szórás esetén az alábbi összefüggést használtuk:

ασµσαα −=

+<<− 102/

02/

nzx

nzxP .

A konfidenciaintervallum szélességét a n

z 02/

σα=∆ tényező határozza meg. Adott hibahatárt

(∆) felvéve, az összefüggésből kifejezhető azaz n érték, melynél teljesül a megadott eltérés (természetesen adott megbízhatósági szint és szórás mellett). Átrendezve az összefüggést a szükséges mintaszámra a következő összefüggést kapjuk:

2

02/

=σαz

n .

A fenti összefüggésből látható, hogy a mintaszám négyzetesen arányos a sokasági szórással és a megbízhatósági szinttel, s fordítottan arányos a hibahatár (a szükséges pontosság) négyzetével. A gyakorlatban a sokasági szórás többnyire nem ismert, ilyenkor a mintaelemszám meghatározására használhatjuk a korábbi mintavételből becsült szórást. Példa Mekkora mintát kell vennünk, ha a férfi MBA hallgatók életkorát 95%-os megbízhatósági szint mellett, 2 év pontossággal szeretnénk megbecsülni? A korábbi mintavétel adatait felhasználva (ld. leíró statisztikai esettanulmány), a szórás s*=6,92 év.

4699,452

92,696,12

≈=

⋅=n

Mintanagyság meghatározása sokasági arány becslésénél:

pqz

n2

2/

= α

Ebben az esetben a sokasági szórás előzetes becslése szükséges, ha ez nem áll rendelkezésre p=q=0,5 valószínűséggel végzett becslést célszerű használni, mivel ekkor maximális a pq szorzat, ennél csak kisebb mintaszám adódhat a tényleges sokasági arány ismeretében. Mintanagyság meghatározása két várható érték különbségének becslésére:

( )22

21

2

221 σσα +

∆==

znn

Mintanagyság meghatározása két sokasági arány különbségének becslésére:

( )2211

2

221 qpqp

znn +

∆== α

Page 92: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

92

VI. Hipotézisvizsgálatok: nemparaméteres próbák

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Page 93: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

93

A hipotézisvizsgálat a becsléselmélet mellett, a mintából a sokaságra történő statisztikai következtetés másik fontos területe. Az előző fejezetben azt mutattuk be, hogy a minta alapján hogyan lehet közelítőleg meghatározni (becsülni) a sokaság bizonyos jellemzőit. Számos esetben azonban nemcsak egy paramétert szeretnénk meghatározni, hanem mondjuk két v. több paramétert összehasonlítani, konkrét szakmai kérdéseket szeretnénk eldönteni a tapasztalati adatok alapján. Így például kíváncsiak lehetünk arra, hogy a termelési folyamat bizonyos jellemzői (selejtarány, termék tulajdonságai, méretei stb.) megfelelnek-e az előírásnak, a sör töltési térfogata azonos-e a két (v. több) különböző töltősoron, vagy a telefonhívások száma valóban megnőtt-e az új reklámkampány hatására. Az ilyen jellegű kérdések mintavétel segítségével történő megválaszolása a statisztikai hipotézisvizsgálat területe. A mintavételi eredményekre támaszkodó következtetés, döntés természetes velejárója a bizonytalanság, a tévedés lehetősége. Ezért valahányszor mintából nyert adatokra támaszkodva kell választ adnunk a példaként megfogalmazott vagy ahhoz hasonló kérdésekre, valójában annak eldöntéséről van szó, hogy a mintavétel eredménye inkább cáfolja vagy inkább alátámasztja-e a feltett kérdésre adott igenlő választ. Ebben a fejezetben a hipotézisvizsgálatok általános kérdéseiről, valamint néhány konkrét módszerről lesz szó.

VI.1 A hipotézisvizsgálat általános menete33

Statisztikai hipotézisen a vizsgált sokaság(ok)ra (valószínűség-eloszlásra) vagy ennek paramétere(i)re vonatkozó valamilyen feltevést értünk. Ha ennek ellenőrzésére (ill. bizonyítására) mintát használunk, akkor statisztikai hipotézisvizsgálatról (statisztikai próbáról) beszélünk. Ebben az esetben – mivel a minta csak része a sokaságnak, de nem azonos vele – valamilyen hiba elkövetésének lehetősége mindig fennáll. Az elkövethető hiba kétféle lehet: elsőfajú hiba és másodfajú hiba. Az elsőfajú hibát csak igaz hipotézisek vizsgálata során követhetjük el. Akkor fordul elő, ha egy igaz hipotézist a minta adatai alapján nem fogadunk el. Az elsőfajú hiba elkövetésének valószínűségét αααα-val jelöljük, értéke egy adott próba során tetszőleges kicsinyre csökkenthető. A másodfajú hibát csak hamis hipotézisek vizsgálata során követhetünk el. Másodfajú hiba akkor jelentkezik, ha a hamis hipotézist a minta adatai alapján nem utasítjuk el. A másodfajú hiba valószínűségét ββββ-val jelöljük, s értéke egy adott próba során bármely konkrét – a feltett hipotetikustól eltérő – alapsokasági paraméterre vonatkozóan kiszámítható. A másodfajú hiba veszélye csökken a hipotetikus és a tényleges várható érték eltérésének növekedésével, viszont nő, ha adott próba esetén az elsőfajú hibát csökkentjük (36. ábra). Az első- és másodfajú hiba egyidejűleg csak a mintaelemek számának növelésével csökkenthető. A próbák tervezésénél és az eredmények értelmezése során ezekre tekintettel kell lennünk.

33 Kövesi J.: Kvantitatív módszerek, Oktatási segédanyag, BME MBA Mérnököknek program, Budapest, 1998

Page 94: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

94

Következtetés hibái

SokaságSokaság

A m

inta

minősí

tése

A m

inta

minősí

tése

a so

kasá

gról

a so

kasá

gról

„jó”„jó” „rossz”„rossz”

„jó”

„jó”

„ros

sz”

„ros

sz”

Nincs hibaNincs hibaεεεεεεεε

Nincs hibaNincs hibaee

ElsőfajúElsőfajúhiba, hiba, αααααααα

MásodfajúMásodfajúhiba, hiba, ββββββββ

Következtetés hibái

SokaságSokaság

A m

inta

minősí

tése

A m

inta

minősí

tése

a so

kasá

gról

a so

kasá

gról

„jó”„jó” „rossz”„rossz”

„jó”

„jó”

„ros

sz”

„ros

sz”

Nincs hibaNincs hibaεεεεεεεε

Nincs hibaNincs hibaee

ElsőfajúElsőfajúhiba, hiba, αααααααα

MásodfajúMásodfajúhiba, hiba, ββββββββ

36. ábra: A következtetés hibái

Példa: Egy szabályozott gyártási folyamatban a kritikus minőségi jellemző µ0=3,1 cm3, σ0=0,08 cm3 normális eloszlást követ. a.) Számolja ki a µ0 ± 2σ0 beavatkozási határok esetén n = 1 elemű mintavétel mellett az elsőfajú hiba valószínűségét! b.) Mekkora a másodfajú hiba valószínűsége, ha a várható érték µ1=3,3 cm3 -re változott?

Készítette: Erdei János

ABH=2,94 cmABH=2,94 cm33

FBH=3,26 cmFBH=3,26 cm33

α/2

α/2

Első-, másodfajú hiba számolása

P(ξ0<ABH) =

n = 1n = 1

=

−Φ08,0

1,394,2

µ0=3,1

=Φ(-2) = 2,28%2,28%

αααααααα = 2·2,28 = 4,56%4,56%

Készítette: Erdei János

Első-, másodfajú hiba számolása

ββββββββ=P(ABH<ξξξξ1<FBH) =

30,85%30,85%

ABH=2,94 cmABH=2,94 cm33

FBH=3,26 cmFBH=3,26 cm33

α/2

α/2 ββββn = 1n = 1

µ0=3,1 → µ1=3,3

=

−Φ−

−Φ08,0

3,394,208,0

3,326,3

( ) ( ) =−=−Φ−−Φ 6915,015,45,0

µ0±2σ0µµ00±±22σσ00

Készítette: Erdei János

ABH=2,94 cmABH=2,94 cm33

FBH=3,26 cmFBH=3,26 cm33

α/2

α/2

Első-, másodfajú hiba számolása

P(ξ0<ABH) =

n = 1n = 1

=

−Φ08,0

1,394,2

µ0=3,1

=Φ(-2) = 2,28%2,28%

αααααααα = 2·2,28 = 4,56%4,56%

Készítette: Erdei János

Első-, másodfajú hiba számolása

ββββββββ=P(ABH<ξξξξ1<FBH) =

30,85%30,85%

ABH=2,94 cmABH=2,94 cm33

FBH=3,26 cmFBH=3,26 cm33

α/2

α/2 ββββn = 1n = 1

µ0=3,1 → µ1=3,3

=

−Φ−

−Φ08,0

3,394,208,0

3,326,3

( ) ( ) =−=−Φ−−Φ 6915,015,45,0

µ0±2σ0µµ00±±22σσ00

Page 95: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

95

c.) Mekkora az első és másodfajú hiba valószínűsége, µ0 ± 3σ0 beavatkozási határok valamint n=1 és n=4 elemű mintavétel mellett?

Készítette: Erdei János

Első-, másodfajú hiba számolása

ABH=2,86 cmABH=2,86 cm33

FBH=3,34 cmFBH=3,34 cm33

n = 1n = 1

α/2

α/2

=

−Φ=08,0

1,386,22α

Φ(-3) = 0,13%

αααααααα = 0,26% = 0,26%

µ0=3,1 → µ1=3,3

=

−Φ−

−Φ=08,0

3,386,208,0

3,334,3β

( ) ( ) =−Φ−Φ 5,55,0 69,15%69,15%

µ0±3σ0µµ00±±33σσ00

Készítette: Erdei János

Első-, másodfajú hiba számolása

ABH=2,86 cmABH=2,86 cm33

FBH=3,34 cmFBH=3,34 cm33α/2

α/2n = 4n = 4

ABH=2,98 cmABH=2,98 cm33

FBH=3,22 cmFBH=3,22 cm33

04,04

08,0 ==xσ=

−Φ−

−Φ=04,0

3,398,204,0

3,322,3β

( ) ( ) =−Φ−−Φ= 82 2,28%2,28%

Készítette: Erdei János

Első-, másodfajú hiba számolása

ABH=2,86 cmABH=2,86 cm33

FBH=3,34 cmFBH=3,34 cm33

n = 1n = 1

α/2

α/2

=

−Φ=08,0

1,386,22α

Φ(-3) = 0,13%

αααααααα = 0,26% = 0,26%

µ0=3,1 → µ1=3,3

=

−Φ−

−Φ=08,0

3,386,208,0

3,334,3β

( ) ( ) =−Φ−Φ 5,55,0 69,15%69,15%

µ0±3σ0µµ00±±33σσ00

Készítette: Erdei János

Első-, másodfajú hiba számolása

ABH=2,86 cmABH=2,86 cm33

FBH=3,34 cmFBH=3,34 cm33α/2

α/2n = 4n = 4

ABH=2,98 cmABH=2,98 cm33

FBH=3,22 cmFBH=3,22 cm33

04,04

08,0 ==xσ=

−Φ−

−Φ=04,0

3,398,204,0

3,322,3β

( ) ( ) =−Φ−−Φ= 82 2,28%2,28%

Attól függően, hogy a feltételezésünk (hipotézisünk) mire vonatkozik, a statisztikai próbák két csoportját különböztethetjük meg. Ha a vizsgált valószínűségi változó eloszlása ismert, de ismeretlen paraméter(eke)t tartalmaz, akkor a hipotézisvizsgálat az ismeretlen paraméter(ek)re irányul. (Például a Gauss eloszlás µ paraméterére, azaz az eloszlás várható értékére.) Ekkor paraméteres próbáról beszélünk. Ha az eloszlás típusa nem ismert, akkor a feltevés magára az eloszlásra vonatkozik. (Például két vagy több valószínűségi változó eloszlása megegyezik-e; vagy feltehető-e, hogy a valószínűségi változó adott eloszlással írható le.) A hipotézisvizsgálatoknak ezt a csoportját nemparaméteres próbáknak nevezzük. A hipotézisvizsgálatok általános menetét röviden az alábbiakban vázolhatjuk: 1. Szakmai megfontolások alapján felállítjuk az igazolandó hipotézist, 2. Kiválasztjuk a legmegfelelőbb statisztikai próbát, 3. Felállítjuk az ún. nullhipotézist – jelölése: H0 – (ez gyakran, főleg a paraméteres

próbáknál, a szakmai feltételezés ellentéte) és az ún. alternatív vagy ellenhipotézist – jelölése: H1.

4. A hipotéziseket úgy kell megfogalmazni, hogy egyszerre ne lehessenek igazak, így a nullhipotézisről hozott döntésünk közvetetten a H1-re vonatkozó döntést is jelent. Mind a null-, mind az ellenhipotézis lehet egyszerű és összetett hipotézis. Egy hipotézist egyszerűnek mondunk, ha fennállásának feltételezése a sokaság eloszlását egyértelműen meghatározottá teszi. Egyszerű hipotézisre példa: M(ξ)=µ=500°C, mert normális eloszlásról lévén szó, a szórást ismerjük, így µ értéke az eloszlást egyértelműen meghatározza. A 450°C<M(ξ)=µ<500°C állítás ellenben összetett hipotézis, mert a hipotézist mindazon σ szórású normális eloszlások kielégítik, amelyek várható értéke 450 és 500 között van.

5. A továbbiakban azt tételezzük fel, hogy a nullhipotézis egyszerű, az ellenhipotézis pedig mindig összetett.

6. Meghatározzuk az elsőfajú hibát (szignifikancia szintet), a mintanagyságot, és végrehajtjuk a mintavételt.

7. Meghatározzuk az előző pontban választott feltételek melletti elfogadási, ill. elutasítási (kritikus) tartományokat. Elfogadási tartománynak nevezzük azt a tartományt,

Page 96: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

96

amelybe a nullhipotézis fennállása esetén αααα szignifikancia szint mellett a statisztikai jellemző számított értéke legalább εεεε=1-αααα valószínűséggel kerül. Az elutasítási tartomány viszont az, amelybe a nullhipotézis fennállása esetén, αααα szignifikancia szint mellett a jellemző számított értéke legfeljebb αααα valószínűséggel kerülhet. A kritikus tartomány lehet egyoldali vagy kétoldali (37. ábra). Kétoldali kritikus tartomány felvételére akkor kerül sor, ha a nullhipotézisben feltételezet helyzettől való eltérés ténye érdekel bennünket, s az eltérés iránya nem. Egyoldalú tartományt pedig akkor alkalmazunk, ha a H0-ban rögzített állapottól való meghatározott irányú eltérésre számítunk34.

elfogadási tartomány

elutasítási tartomány

elfogadási tartomány

elutasítási tartomány

37. ábra: Kritikus tartományok egy- és kétoldali esetben

8. Meghatározzuk a próbához szükséges jellemző számított értékét. A becsléselmélethez hasonlóan a minta adataiból egy meghatározott összefüggés (próbafüggvény) felhasználásával meghatározunk egy számértéket, amely H0 és bizonyos kiindulási feltételek fennállása esetén adott elméleti eloszlást követ, így értéke csak kis valószínűséggel (α) esik a kritikus tartományba.

9. Megvizsgáljuk, hogy a jellemző számított értéke az elfogadási illetve az elutasítási tartományba esik-e, és ez alapján döntünk a nullhipotézis elfogadásáról (vagy elutasításáról (38. ábra)

Készítette: Erdei János

Statisztikai próbák elve

f(χ2)

χ2

DF (szabadsági fok)

α

χ2kritχ2krit

χχχχ2 szám χχχχ2

szám

ε =1-α

P(χ2szám< χ2

krit(α)|H0 igaz) = 1-α = εP(χ2szám< χ2

krit(α)|H0 igaz) = 1-α = ε

Készítette: Erdei János

Statisztikai próbák elve

f(χ2)

χ2

DF (szabadsági fok)

α

χ2kritχ2krit

χχχχ2 szám χχχχ2

szám

ε =1-α

P(χ2szám< χ2

krit(α)|H0 igaz) = 1-α = εP(χ2szám< χ2

krit(α)|H0 igaz) = 1-α = ε

38. ábra: Döntés a nullhipotézisről

34 Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996

Page 97: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

97

10. Értelmezzük az előző pont eredményét a szakmai hipotézisre, és megtesszük a konkrét intézkedéseket a gyakorlatban,

A hipotézisvizsgálat logikája szerint tehát azt vizsgáljuk meg egy adott próbával, hogy a mintából kapott eredmény eltérése a hipotézistől a véletlennek tulajdonítható-e, vagy az eltérést a ténylegesen fennálló különbség okozza. Ha a mintából számított érték az elfogadási tartományba esik, akkor az adott szignifikancia szinten, az adott minta (minták) alapján az eltérést a véletlennek tulajdonítjuk, azaz statisztikailag nem tartjuk szignifikánsnak. Meg kell azonban jegyeznünk, hogy a statisztikailag szignifikáns eltérés nem azonos a gyakorlatilag jelentős eltéréssel. Lehet, hogy egy adott, vizsgált eltérésre mindkettő fennáll, de lehet, hogy csak az egyik. Előfordulhat tehát például, hogy egy statisztikailag szignifikáns eltérés gyakorlatilag nem minősül jelentősnek, ill. fordítva.

VI.2 Illeszkedésvizsgálat χχχχ2-próbával35

Az olyan statisztikai próbát, amelynek alapján arról döntünk, hogy valamely ξξξξ valószínűségi változó Fn (tapasztalati) eloszlása lehet-e adott F0 (elméleti) eloszlásfüggvénnyel jellemzett eloszlás, illeszkedésvizsgálatnak nevezzük. Ilyenkor tehát a H0 nullhipotézis:

H0: Fn = F0

Ha a nullhipotézis az eloszlás paramétereinek ismeretét is feltételezi, akkor tiszta illeszkedésvizsgálatról beszélünk. Ha viszont hipotézisünk csak az eloszlás jellegét (normalitás, exponencialitás stb.) tételezi fel, és a paramétereket a mintából kell becsülnünk, akkor becsléses illeszkedésvizsgálatot végzünk. Az illeszkedésvizsgálatra szolgáló próbák alkotják a nemparaméteres próbák egyik nagy csoportját. E próbák közül legelterjedtebb a χ2-próba és a Kolmogorov-próba. A χ2-próba mind diszkrét, mind folytonos eloszlások esetében alkalmazható, de nagy mintaelemszámot igényel. A próba segítségével azt tudjuk eldönteni, hogy adott szignifikancia szinten a tapasztalati gyakoriságok szignifikánsan eltérnek-e a feltételezett elméleti gyakoriságoktól, avagy az eltérés csupán a véletlen következménye. χ2-próbával történő illeszkedésvizsgálatnál az ún. próbastatisztikát (a számított értéket) az alábbi képlet szolgáltatja:

( )∑

=

−=

r

i i

ii

F

Ff

1

22χ

DF = r – l – l

ahol: DF: a szabadságfok, az eloszlás paramétere fi: a tapasztalati gyakoriság Fi: az elméleti gyakoriság l: a becsült paraméterek száma

35 Kövesi J.: Kvantitatív módszerek, Oktatási segédanyag, BME MBA Mérnököknek program, Budapest, 1998

Page 98: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

98

A Yates-féle korrekció: A korábbi fejezetekben láttuk, hogy amikor diszkrét adatokra folytonos eloszlások eredményeit alkalmazzuk, bizonyos folytonossági korrekciókat alkalmazhatunk. Hasonló korrekció létezik a χ2-eloszlás alkalmazása esetén is. Ez a korrekció

a fenti egyenlet ( )

∑=

−−=

r

i i

ii

F

Ff

1

2

2 5,0χ alakú módosítását igényli. Általában csak DF=1

szabadságfok esetén alkalmazzuk. Nagy minták esetén ugyanis a korrekcióval gyakorlatilag ugyanahhoz az eredményhez jutunk, mint korrekció nélkül, de a kritikus értékek körül bonyodalmak léphetnek fel. Kisebb minták esetén, amikor a várt gyakoriságok 5 és 10 közé esnek, legjobb, ha a χ2-nek mind a korrigált, mind a korrigálatlan értékét kiszámoljuk. Ha egy adott hipotézist tekintve mindkét érték alapján ugyanarra a következtetésre jutunk, akkor ritkán ütközünk nehézségekbe. Ha egymásnak ellentmondó következtetésre jutunk, akkor próbálkozhatunk a minta növelésével, vagy más módszert alkalmazhatunk36. Példa: A Tiszán egy adott időszakban levonuló árhullámok számát vizsgálva az elmúlt 68 év során, az alábbi eredményeket kapták: 30 év volt amikor nem volt árhullám, 25 olyan év volt, amikor 1 árhullám vonult le az adott időszakban, 9 év volt amikor 2 és 4 olyan év volt, amikor 3 vagy több árhullám következett be. Feltehető-e, hogy a folyón levonuló árhullámok száma modellezhető Poisson-eloszlással?37

árhullámok száma 0 1 2 3 v. több

gyakoriság [db] 30 25 9 4

λ=? nem ismerjük → a mintából kell becsülnünk Poisson-eloszlás esetén M(ξ)=λ ← x Mivel az elmúlt 68 év során a kérdéses időszakban összesen 55 árhullám volt: λ≈55/68 ≈ 0,8

Nullhipotézis felállítása: H0 = az árhullámok száma λ=0,8 paraméterű Poisson-eloszlású H1: az árhullámok száma nem λ=0,8 paraméterű Poisson-eloszlású

36 Spiegel, Murray R.: Statisztika: Elmélet és gyakorlat, Panem – McGraw-Hill, Budapest, 1995 37 Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985

Page 99: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

99

Mintavétel, adatok feldolgozása, kritikus érték meghatározása:

Ha az árhullámok száma valóban λ≈0,8 paraméterű Poisson-eloszlással írható le, akkor annak valószínűsége, hogy az adott időszakban nem lesz árhullám (Poisson-eloszlás táblázatából) 0, 4493, hogy 1 árhullám vonul le: 0,3595, hogy 2: 0,1438, s hogy 3 vagy több (1-az eddigiek összege): 0,0474. Az elméleti gyakoriságok ebből már „automatikusan” adódnak, hiszen ha 0,4493 valószínűséggel nincs árhullám az adott időszakban, akkor ez elméletileg 68 év során összesen 68⋅0,4493 = 30,55 alkalommal következik be. Hasonló módon a többi elméleti gyakoriságot kiszámolva az eredményeket az alábbi táblázat tartalmazza:

k f(k) p k F(k)

0 30 0,4493 30,55

1 25 0,3595 24,45

2 9 0,1438 9,78

3 v. több 4 0,0474 3,22

ΣΣΣΣ 68 1 68

DF=r-l-1=4-1-1=2 α=5% → táblázatból: χ2

elm.=5,99 Számított érték meghatározása:

( )27,0

22,3

78,0

78,9

78,0

45,24

55,0

55,30

55,3030 22222 ≈+++−=szχ

A számított és a kritikus érték összehasonlítása:

χ2elm.=5,99 >> χ2

sz=0,27

Döntés a nullhipotézisről: Mivel a számított érték jóval kisebb, mint a kritikus – a számított érték az elfogadási tartományba esik –, ezért 95%-os megbízhatósági szinten nincs okunk a H0-t elutasítani. A folyón levonuló árhullámok száma modellezhető λ=0,8 paraméterű Poisson-eloszlással.

VI.3 Illeszkedésvizsgálat Kolmogorov-próbával

A próba a χ2-próbához hasonlóan az elméleti és tapasztalati eloszlásfüggvény értékeinek összehasonlításán alapul. A hipotézisvizsgálatot természetesen adott szignifikancia szinten végezzük, és a hipotézist akkor vetjük el, ha ez az eltérés abszolút értékben egy megadott – kritikus – értéknél nagyobb.

Page 100: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

100

A próbastatisztika és a döntési kritérium:

kritn DtFtF >− )()(max

ahol Fn(t) a tapasztalati, F(t) az elméleti eloszlásfüggvény.

A különböző szignifikancia szintekhez tartozó kritikus értékek megtalálhatók az e próbához tartozó táblázatban.

A statisztikai próbát úgy végezzük, hogy az osztályokba sorolt adatokra minden osztály felső határához kiszámítjuk a tapasztalati eloszlásfüggvényt, vagyis a kumulált relatív gyakoriságot, ugyanezen felső határhoz az elméleti eloszlásfüggvény értékét, majd az összes osztályra a képlet szerint adódó maximális D eltérést összevetjük a táblázatból leolvasható, adott szignifikancia szinthez tartozó elméleti D értékkel. H0-t elfogadjuk, ha a számított érték kisebb az elméletinél. A próbához minél több osztályba kell sorolni az adatokat, de legalább 5 osztály szükséges. Szokás ezért úgy is eljárni, hogy minden egyes mért érték külön osztály legyen.

Egyszerűbben alkalmazható, mint a χ2–próba, és jobb eredményt is ad kis elemszámú mintákra, de csak folytonos eloszlásokra használható.

VI.4 χχχχ2-próba alkalmazása homogenitásvizsgálatra

Homogenitásvizsgálat segítségével eldönthetjük, hogy két valószínűségi változó azonos eloszlásúnak tekinthető-e. A közösnek feltételezett eloszlásfüggvény a próbában nem szerepel, s annak jellegére vonatkozóan semmilyen kikötésünk nincs. A nullhipotézisünk természetesen az, hogy a valószínűségi változó két sokaságon belüli eloszlása azonos, s az alternatív hipotézisünk ennek ellentéte, hogy a két szóban forgó eloszlás nem azonos. Diszkrét valószínűségi változó esetén a próba közvetlenül vagy csoportképzéssel elvégezhető, míg folytonos valószínűségi változó esetén az adatokat osztályokba kell sorolnunk. Célszerű az adatokat táblázatos formába rendezni. A táblázat elemi részeit celláknak nevezzük, amelyek bal felső sarkában az elméleti, jobb alsó sarkában a tényleges gyakoriságokat szokás feltüntetni. A sor ill. oszlop szerint összegzett gyakoriságokat marginális vagy peremgyakoriságoknak nevezzük. Az így összeállított táblázatot kontingencia-táblázatnak nevezzük. A két minta nagysága nem kell, hogy azonos legyen, de a vizsgált változó szerint mindkét mintán belül azonos osztályokat kell képezni. A próbastatisztika:

( )∑∑

= =

−=

r

i

s

j ij

ijij

F

Ff

1 1

2

ahol: N

ffF

jiij

•• ⋅= az elméleti gyakoriság

r : a sorok száma fi• : i-edik sor peremgyakorisága (sorösszege) f•j : j-edik oszlop peremgyakorisága (oszlopösszege) N : mintaszám DF=(r-1)·(s-1), ám mivel s=2 minden esetben, így DF=r-1

Page 101: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

101

Példa: Az engedéllyel rendelkező budai és pesti virágárusok közül egymástól függetlenül egy-egy mintát vettek a virágárak vizsgálata céljából. A két mintába került árusoktól - többek között - a rózsa szálankénti árát is megkérdezték. Vizsgáljuk meg 1%-os szignifikancia szinten annak a hipotézisnek a helyességét, hogy a rózsaárak nagyság szerinti eloszlása a budai és pesti virágárusok körében azonos. Az adatokat a következő táblázat tartalmazza38.

Ár [Ft/db]

budai [db]

pesti [db]

-55 3 5 56-65 22 6 66-75 18 18 76-85 15 21 86-95 6 18 96-105 6 10 106- 2 6

Nullhipotézis felállítása:

H0: Fbudai = Gpesti H1: Fbudai ≠ Gpesti

Mintavétel, adatok feldolgozása, kritikus érték meghatározása:

n1=72 n2=84 N=156 r=7 DF=r-1=7–1=6 α=0,01 χ2

krit=16,8 Sor- és oszlopösszegek kiszámítása: sorösszegek: f1• =8; f2• =28; f3• =36 stb.; az oszlopösszegek: f•1⋅ =72; f•2 =84 Elméleti gyakoriságok meghatározása: F11= 8⋅72/156=3,69 F12= 8⋅84/156=4,31 F21= 28⋅72/156=12,92 stb., az eredményeket az alábbi kontingencia táblázat mutatja:

3 3.69

5 4.31

8

22 12.92

6 15.08

28

18 16.62

18 19.38

36

15 16.62

21 19.38

36

6 11.08

18 12.92

24

6 7.38

10 8.62

16

2 3.69

6 4.31

8

72 84 156

38 Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996

Page 102: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

102

Számított érték meghatározása: χ2

szám=(3-3,69)2/3,69+0.111+6.375+5.465+0.115+0.099+0.157+0.135+2.327+1.995+ +0.260+0.223+0.776+0.665=18,83

A számított és a kritikus érték összehasonlítása:

χ2 szám=18,83 > χ2

krit=16,8

Döntés a nullhipotézisről: A számított érték a kritikus tartományba esik, ezért 1%-os szignifikancia szinten a két sokaság egyezését elutasítjuk.

VI.5 χχχχ2-próba alkalmazása függetlenségvizsgálatra

Az a kérdés, hogy két valószínűségi változó független-e egymástól vagy sem, kontingencia táblázat segítségével és χ2-próba alkalmazásával dönthető el. A χ2-próbával történő függetlenségvizsgálat valójában a diszkrét – minősítéses – ill. csoportosított (kategorizált) folytonos változók közötti kapcsolat vizsgálatára használható. Két (v. több) folytonos valószínűségi változó közötti kapcsolat vizsgálata, ill. a kapcsolat jellegének meghatározása a korreláció – és regresszióelemzés területe. A próba során hasonlóan járunk el, mint a homogenitásvizsgálatnál, „csak” a kontingencia táblázat mérete változ(hat)ik, nem feltétlenül két oszlopból áll (homogenitásvizsgálatnál mindig s=2 volt). Újabb különbség – bár a próba elvégzésében nem okoz eltérést –, hogy a homogenitásvizsgálatnál értelemszerűen ugyanazt a valószínűségi változót (pl. rózsa ára) hasonlítottuk össze két minta alapján, míg a függetlenségvizsgálatnál természetesen két teljesen különböző változó közötti kapcsolatot vizsgálunk (pl. van-e összefüggés a szem és a haj színe között, van-e kapcsolat a szülők iskolai végzettsége és a gyerekek iskolai végzettsége között stb.). A nullhipotézisünk természetesen az, hogy a két valószínűségi változó között nincs sztochasztikus kapcsolat, a két változó független egymástól, s az alternatív hipotézisünk ennek ellentéte, azaz a két változó nem független egymástól, közöttük sztochasztikus v. függvénykapcsolat van. Az egyes cellák elméleti gyakoriságait a marginális értékek felhasználásával becsüljük. A próbastatisztika:

( )∑∑

= =

−=

r

i

s

j ij

ijij

F

Ff

1 1

2

DF=(r-1)·(s-1)

Az elméleti gyakoriságok: N

ffF

jiij

•• ⋅= ,

ahol s: az oszlopok száma,

a többi jelölés pedig megegyezik a homogenitásvizsgálatnál (ld. előző pont) leírtakkal.

Page 103: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

103

Példa: Egy szociológiai vizsgálatban a mintába került személyektől megkérdezték a saját és szüleik iskolai végzettségét. A megkérdezettek és az apjuk iskolai végzettsége közötti összefüggést a következő táblázat tartalmazza. Vizsgáljuk meg 1%-os szignifikancia szinten, azt a nullhipotézist, hogy a megkérdezettek és apjuk iskolai végzettsége független egymástól39.

Apa iskolai végzettsége

Megkérdezett iskolai végzettsége Bef.-tlen alapfokú

Bef.-ett alapfokú

Közép-fokú

Felső-fokú

Befejezetlen alapfokú

429 441 489 76

Befejezett alapfokú

7 92 285 54

Középfokú 26 95 468 107 Felsőfokú 0 16 69 69

Nullhipotézis felállítása:

H0: az iskolai végzettségek függetlenek egymástól H1: az iskolai végzettségek nem függetlenek egymástól Mintavétel, adatok feldolgozása, kritikus érték meghatározása

N=2723 s=4 r=4

DF=(r-1)·(s-1)=3⋅3=9 α=0,01 χ2

krit=21,7 Sor- és oszlopösszegek kiszámítása: sorösszegek: f1• =1435; f2• =438; stb., az oszlopösszegek: f•1⋅ = 462; f•2 =644, stb. Elméleti gyakoriságok meghatározása: F11=1435·462/2723=244 F21=438·462/2723=74 : F12=1435·644/2723=339 F22=438·644/2723=104 stb.

39 Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996

Page 104: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

104

Az eredményeket az alábbi kontingencia táblázat mutatja:

Apa iskolai végzettsége

Megkérdezett iskolai végzettsége Bef.-tlen alapfokú

Bef.-ett alapfokú

Közép-fokú

Felső-fokú

ΣΣΣΣ

Befejezetlen alapfokú

429 244

441 339

489 691

76 161

1435

Befejezett alapfokú

7 74

92 104

285 211

54 49

438

Középfokú 26

118 95

165 468

335 107

78 696

Felsőfokú 0

26 16

36 69

74 69

18 154

ΣΣΣΣ 462 644 1311 306 2723

Számított érték meghatározása: χ2

szám=(429-244)2/244+…+2,8=710,4 A számított és a kritikus érték összehasonlítása:

χ2 szám=710,4 >> χ2

krit=21,7 Döntés a nullhipotézisről: A számított érték a kritikus tartományba esik, sokkal nagyobb, mint a kritikus érték, ezért 1%-os szignifikancia szinten a két változó függetlenségét elutasítjuk.

VI.5.a Asszociációs kapcsolat szorossága40

A függetlenség elutasítása esetén felvetődik a kérdés, hogy mennyire szoros a kapcsolat a két minőségi ismérv között. A χ2 –próba próbastatisztikájának képletéből jól látható, hogy a számított érték annál nagyobb, minél szorosabb az összefüggés a két ismérv között. A χ2

szám legkisebb értéke 0, amit akkor vesz fel, ha a tapasztalati és a feltételezett elméleti gyakoriság minden cellában azonos. Ekkor az X és Y ismérv független egymástól. A maximális értéket akkor éri el, ha minden sorban csak egyetlen 0-tól különböző érték szerepel, s ezek mind külön oszlopba tartoznak. Ekkor az X ismérv szerinti besorolás egyértelműen meghatározza az Y ismérv szerinti kategóriát is, azaz a két ismérv között determinisztikus a kapcsolat. Ekkor a számított érték N⋅min[(r-1),(c-1)]. Ezt a maximális értéket tekintve viszonyítási alapnak, a χ2

szám értékéből képezetünk egy mutatót, melynek értéke 0 és 1 közötti lehet. Minél közelebb van egyhez, annál szorosabb, minél közelebb 0-hoz, annál gyengébb a kapcsolat. Ezt a mutatószámot C-vel jelöljük, s Cramer-féle asszociációs együtthatónak hívjuk.

( ) ( )[ ]1,1min

2

−−=

crNC

χ,

ahol r a sorok, c az oszlopok száma, N pedig a mintaszám. 40 Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996

Page 105: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

105

Megjegyezzük, hogy a mutató értékelését megnehezíti, hogy a gyakorlatban a χ2 szám

maximális értékét csak speciális esetekben éri el. Egy-egy kontingencia táblázat adott peremei eltérő mértékben akadályozhatják azt, hogy χ2

elérje az elvi maximumát. Az asszociáció jellemzésére éppen ezért több mutatószám is létezik, melyek egyes esetekben pontosabban mutatják a kapcsolat mértékét.

Példa:

Az előző példa adatai alapján határozzuk meg az asszociációs együtthatót.

N=2723 χ2

szám=710,4 r=s=4 → q=4

.295,0)14(2723

4,710

)1(

2

=−

=−

=qN

,

ami azt mutatja, hogy laza a kapcsolat az apa és a gyermek iskolai végzettsége között.

VI.6 Sorozatpróba

A sorozatpróba kétkimenetelű (dichotóm) változók egymást követő megfigyeléseinek véletlenszerűségét vizsgáló statisztikai próba. Az egymást követő megfigyelések eredményeit feljegyezve az eredmények mint jelek egy sorozata szemléltethető. A próba a mintában előforduló ún. sorozatok számának vizsgálatán alapul. Egy sorozatnak az egymás után következő, megszakítás nélküli (csak az egyik vagy csak a másik eredményt jelölő szám illetve betű) jelszakaszt tekintjük. Például, egy 15 pénz feldobásból álló kísérlet eredményeként az alábbi jelsorozatot kaphatjuk:

I I F F F I F F I I I I F I F, Ahol I az „írás” és F a „fej” dobását jelöli. Ez a kísérlet N = 15 jelből áll, egy 2 jelből álló sorozattal kezdődik (két I), majd egy 3 fejből álló sorozat következik, és így tovább. Összesen 8 sorozat van a megfigyelt jelsorozatban. Véletlen jelenségről lévén szó, ezeknek a sorozatoknak a hossza is és adott N hosszúságú sorban a száma is valószínűségi változó. Ha túl nagy a sorozatok száma, az azt jelenti, hogy az egyik kimenetel bekövetkezése a következő kísérletben a másik kimenetel bekövetkezését vonja maga után, ha pedig túl kicsi, akkor, éppen ellenkezőleg, az egyik eset bekövetkezése a következő megfigyelésnél is ugyanolyan eset bekövetkezését valószínűsíti. Mindkét szélső esetben a véletlenszerűség megsértését tapasztalhatjuk. A próba végrehajtását ezért rendszerint kétoldali ellenhipotézissel végezzük. Nullhipotézisünk, hogy a folyamat, melyből a mintát kaptuk, véletlenszerű, ellenhipotézisünk, hogy a valószínűségi változók nem függetlenek vagy nem azonos eloszlásúak. A próbastatisztika értéke: r = a sorozatok száma a kísérletsorozatban. A próbastatisztika eloszlása nagyszámú sorozatnál asszimptotikusan normális eloszlású, kis mintaelemszámnál kombinatorikus úton előállítható, s külön erre a célra készített táblázatokból olvasható ki. Ha mindkét kimenetelre 10-nél nagyobb a megfigyelések száma, akkor r közelítésére az alábbi összefüggést használhatjuk:

12

21

21 ++

=nn

nnrµ ;

( )( ) ( )1

22

212

21

212121

−++−−=

nnnn

nnnnnnrσ ,

Page 106: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

106

ahol n1 az egyik kimenetel gyakorisága, n2 a másik kimenetel gyakorisága. (n = n1+n2, a megfigyelések száma).

Ebben az esetben a r

rr

rz

σµ−

= próbafüggvény N(0,1) standard normál eloszlást követ, ami

alapján már könnyen elvégezhető a hipotézisvizsgálat. Példa Véletlenszerűnek tekinthető-e egy előadáson egy sorban helyet foglaló férfiak (F) és nők (N) elhelyezkedése. A sorban egymás mellett ülők neme:

F, F, F, N, N, F, F, N, N, N, N, F, N, F, N, N, F, N, N, F, F, F, N, F, N, N. Megfigyelések száma: n = 26. Férfiak száma: n1 = 12 Nők száma: n2 = 14 Sorozatok száma: r = 14 Normális eloszlással való közelítéshez először határozzuk meg a várható értéket és a szórást:

92,1311412

14122 =++

⋅⋅=rµ

( )( ) ( ) 48,216,6

114121412

141214122141222

≈=−++

−−⋅⋅⋅⋅=rσ

5%-os szignifikancia szint mellett a próba elfogadási tartománya: -1,96 - 1,96. A zr értéke:

016,048,2

92,1314 =−=rz ,

Az elfogadási tartományba esik, a sorozat véletlenszerűségét 5%-os szignifikancia szint mellett elfogadjuk.

VI.7 Mann-Whitney próba

Tegyük fel, hogy szeretnénk megvizsgálni, hogy az MBA-re járó hallgatók esetén van-e különbség a 300 eFt alatt kereső, beosztott státuszban dolgozó férfiak és nők fizetése között. Amennyiben a fizetések normális eloszlással írhatók le, és a sokasági szórások nem különböznek a két csoportnál, ezt a vizsgálatot kétmintás t-próbával tudnánk elvégezni. A kétmintás t-próba nemparaméteres megfelelője a Mann-Whitney féle U-próba, amely két sokaság helyzetének különbségét vizsgálja két független minta alapján, vagy ami ezzel ekvivalens, hogy ugyanabból a sokaságból származnak-e a minták. Nullhipotézisünk, hogy a két eloszlás azonos: H0: F(x) = G(y). A próbát elvégezhetjük jobb vagy baloldali vagy kétoldali ellenhipotézissel szemben. Az ellenhipotézist többféleképpen is megfogalmazhatjuk. Felírhatjuk az ellenhipotézist valószínűségekre, magukra az eloszlásfüggvényekre, vagy (közel)azonos alakú eloszlásfüggvények esetén a várható értékekre (vagy mediánokra). Ez utóbbit használva az MBA hallgatók fizetésének

Page 107: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

107

vizsgálatánál ellenhipotézisünk: H1: M(x) ≠ M(y). A nullhipotézis helyességét a mintaelemek rangösszegén alapuló próbafüggvény segítségével vizsgálhatjuk. Összesen 24 beosztott keres 300 eFt-nál kevesebbet. (ld. leíró statisztikai esetpélda) Adataink az alábbiak:

Fizetés, eFt Nem Fizetés, eFt Nem 250 Nő 210 Férfi 210 Nő 103 Nő 145 Nő 230 Nő 100 Nő 255 Férfi 110 Férfi 195 Nő 164 Nő 225 Férfi 278 Férfi 80 Nő 240 Férfi 250 Nő 150 Nő 260 Nő 65 Nő 275 Férfi 222 Férfi 182 Nő 120 Férfi 250 Férfi

A rangszámok megállapításához rendezzük sorba az adatokat, s rendeljünk rangszámokat (sorszámokat) az egyes értékekhez. A rendezett mintánk és a rangszámok:

Fiz. Nem Rangszám Fiz. Nem Rangszám 65 Nő 1 210 Férfi 12,5 80 Nő 2 222 Férfi 14 100 Nő 3 225 Férfi 15 103 Nő 4 230 Nő 16 110 Férfi 5 240 Férfi 17 120 Férfi 6 250 Nő 19 145 Nő 7 250 Nő 19 150 Nő 8 250 Férfi 19 164 Nő 9 255 Férfi 21 182 Nő 10 260 Nő 22 195 Nő 11 275 Férfi 23 210 Nő 12,5 278 Férfi 24

Két esetben is azonosak a fizetések (azaz ún. kapcsolt rangok vannak), ilyenkor ezek mindegyikéhez a megfelelő rangszámok átlagát rendeljük. Ennek megfelelően mindkét 210 eFt-os fizetés a 12,5-es rangszámot [( 12+13)/2], míg a 3 db 250eFt-os fizetés mindegyike a 19-es rangszámot [(18+19+20)/3] kapja. Következő lépésként számítsuk ki mintánként a rangszámok összegét. RF(1) = 5+6+12,5+14+15+17+19+21+23+24 = 156,5. RN(2) = 1+2+3+4+7+8+9+10+11+12,5+16+19+19+22 = 143,5. A mintaszámok: n1 = 10, n2 = 14 Az U próbafüggvény az R1 rangösszegből az alábbi módon határozható meg:

111

21 R2

)1n(nnnU −

++= .

Page 108: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

108

(Az R2 rangösszegből hasonló módon kiszámolható egy másik U érték, melynek mintavételi eloszlása megegyezik az 1-esből számoltéval.) Ha a mintaszámok mindkét mintában kisebbek 10-nél, a kritikus értékeket külön erre a célra készített táblázatokból lehet leolvasni. Ha mindkét minta legalább 10 elemű, akkor U mintavételi eloszlása közelítőleg normális eloszlású,

2

nn 21U =µ várható értékkel és

12

)1nn(nn 21212U

++=σ varianciával. Ekkor a

U

UUz

σµ−

=

próbafüggvény N(0,1) standard normális eloszlású, melynek segítségével a próba könnyen elvégezhető. Ha a rangszámok között m féle kapcsolt rang fordul elő, akkor U varianciáját a

−++

−−++=σ

∑=

)1nn)(nn(

)kk(1nn

12

nn

2121

m

1ii

3i

21212

U

összefüggéssel számolhatjuk, ahol ki az i-edik féle kapcsolt rangszám előfordulásának gyakorisága. Példánkban az U értéke:

5,385,1562

)110(101410U =−++⋅=

Mivel mindkét minta elemszáma eléri a 10-et, a standard normális eloszlás felhasználásával döntünk a nullhipotézisről.

702

1410U =⋅=µ

62,288)11410)(1410(

)33()22(11410

12

1410 332U =

−++−+−−++⋅=σ

A próbastatisztika értéke:

85,117

705,38z −=−=

5%-os szignifikancia szint és kétoldali alternatív hipotézis mellett az elfogadási tartomány -1,96 – 1,96 között van. A számított érték éppen az alsó határ felett van, így a H0 hipotézist nincs okunk elutasítani. Megjegyezzük azonban, hogy a számított érték közel van a határhoz, egyoldalú alternatív hipotézisnél vagy 10%-os kétoldali próbánál már elutasítanánk H0-t. A biztosabb döntés érdekében célszerű a vizsgálatot nagyobb mintaszámmal megismételni.

Page 109: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

109

VII. Hipotézisvizsgálatok: paraméteres próbák

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Page 110: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

110

Az előző fejezetben elmondottak alapján, a paraméteres próbák szigorúbb alkalmazási feltételeket igényelnek (hiszen például eleve feltételezik az adott elméleti eloszlás ismeretét), ezért kevésbé széleskörűen alkalmazhatók. Általában arányos, esetleg intervallum skáláról származó adatokkal dolgozhatunk velük, viszont erősségük (a hamis nullhipotézis elutasításának valószínűsége) nagyobb, mint a nemparaméteres próbáké. A paraméteres próbák végrehajtásának általános menete, ill. az elkövethető kétféle hiba is (első-, másodfajú hiba) azonos az előző fejezetben tárgyaltakkal. Egy-egy konkrét hipotézisvizsgálat elvégzésére használható próbák csak a vizsgálat tárgyát képező nullhipotézisben, az alkalmazási feltételekben, a próbafüggvényben és annak eloszlásában térnek el egymástól, így a próbák elméletének, sajátos logikájának megismerése után gyakorlatilag bármilyen hipotézisvizsgálatot el tudunk végezni, csak az adott próba alkalmazási feltételeire kell kellő figyelmet fordítanunk. A továbbiakban ennek figyelembevételével tárgyaljuk a paraméteres próbákat. E próbák közül elsősorban a minőségügyi eljárásokban leggyakrabban alkalmazott, a normális eloszlás paramétereire vonatkozó statisztikai próbákat tekintjük át. A próbákat többféle szempont szerint csoportosíthatjuk. Elsősorban aszerint, hogy mire vonatkozik a nullhipotézis (szórásra, várható értékre), hány és mekkora minta szükséges a vizsgálathoz (egy-, két-, ill. többmintás próbák) és két mintás esetben milyen a minták közötti kapcsolat (független és páros próbák).

VII.1 Egymintás próbák

Az egymintás próbák mindig egy adott sokaság valamely jellemzőjére vonatkozó feltevések helyességének ellenőrzésére szolgálnak. Ennek érdekében a rendelkezésre álló egyetlen mintából meghatározott jellemzőt (átlag, tapasztalati szórás) valamely feltételezett, vagy kívánatosnak tartott állapothoz viszonyítjuk. Egymintás (átlag)próbával ellenőrizhetjük például, hogy a sör töltési térfogata az előírt 500ml (várható érték) körül ingadozik-e. Egymintás próbáknál a nullhipotézisünk az, hogy az adott elméleti jellemző (a várható érték vagy az elméleti szórás) egyenlő a feltételezett értékkel. Az előző példánál tehát a nullhipotézist így írhatjuk fel: H0: M(ξ)=µ=500 ml. Az alternatív hipotézis egy- (pl. µ>500 ml vagy µ<500 ml), vagy kétoldali (pl. µ≠500 ml) is lehet.

VII.1.a Szórásnégyzetre vonatkozó próba

A normális eloszlású sokaság varianciájára (szórására) vonatkozó H0: σ2=σ02 hipotézist a

( )20

22 *1

σχ sn

sz

−= próbastatisztikával vizsgálhatjuk, ahol n a mintaszám, s* pedig a mintából

számolt korrigált tapasztalati szórás. A próba alkalmazása során különösen fontos a sokaság normalitására vonatkozó feltétel betartása. Ekkor, H0 fennállása esetén a fenti próbafüggvény n-1 szabadságfokú χ2-eloszlást követ. A nullhipotézist egy- és kétoldali alternatívával szemben is vizsgálhatjuk. Figyelembe véve a χ2-eloszlás már ismert sajátosságait, a próba kritikus tartományai az alábbiak: 222

02

1 : αχχσσ >⇒> számH

21

220

21 : αχχσσ −<⇒< számH

22/

220

21 : αχχσσ <⇒≠ számH vagy 2

2/12

αχχ −>szám

Page 111: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

111

Példa: Egy élelmiszeripari cég egyik gyártósora margarint tölt műanyag dobozokba. A gyártósorról lekerülő dobozok nettó töltősúlya normális eloszlású 4 gramm szórással. Az előírás szerint a dobozok átlagos töltősúlyának 250 grammnak kell lenni. A gyártósorról lekerülő termékekből egy 10 elemű FAE mintát veszünk, amelyeknek grammban kifejezett töltősúlya a következő: 255, 242, 245, 253, 249, 251, 250, 255, 245, 246 gramm. Ellenőrizzük a minta felhasználásával a szórásra megfogalmazott nullhipotézis teljesülését 10%-os szignifikancia szinten! n=10 s*=4,508 gr→ s*2=20,32 gr2 H0: σ2=4 gr2 (valójában a nullhipotézisünk σ2≤4 gr2) H1: σ2>4 gr2 (egyoldali alternatív hipotézis) α=0,1, DF=n–1=10–1=9 → χα2=14,684 Elfogadási tartomány: 14,684>χ2

sz

A próbastatisztika értéke: 16

508,49 22 ⋅=szχ =11,431

χ2sz az elfogadási tartományba esik, H0-t 10%-os szignifikancia szinten elfogadjuk.

Kétoldali alternatív hipotézis esetén: H1: σ2≠4 gr2

α=0,05, DF=n–1=10–1=9 → 22/αχ =16,92; 2

2/1 αχ − =3,325

Elfogadási tartomány: 3,325 < χ2sz <16,92

Mivel a próbastatisztika értéke ez esetben is az elfogadási tartományba esik, H0-t 10%-os szignifikancia szinten elfogadjuk.

VII.1.b Várható értékre irányuló próbák

A feltételek függvényében több próbát is alkalmazhatunk. Nullhipotézisünk természetesen minden esetben: H0: µ=m0, vagyis a várható érték egy adott m0 értékkel egyenlő. Abban az esetben, ha ismerjük az alapsokasági szórást (σ0), vagy ha nem ismerjük, de nagy mintával dolgozunk (n>30 és a σ0-t a korrigált tapasztalati szórással becsüljük), egymintás z-próbával, ha nem ismerjük az alapsokasági szórást, és kis mintánk van, akkor egymintás t-próbával vizsgálhatjuk a fenti nullhipotézist. Szakmai feltevésünktől függően, mindkét próba esetén alkalmazhatunk egy- vagy kétoldali ellenhipotézist. A két statisztikai próbával kapcsolatos alapismereteket az alábbi táblázat foglalja össze.

Page 112: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

112

z-próba t-próba

egyoldali kétoldali egyoldali kétoldali

H0 µ=m0

H1 µ>m0 (µ<m0)

µ≠m0

µ>m0 (µ<m0)

µ≠m0

Próba-statisztika ns

x

n

xzsz *

0

µσ

µ −≈−= ns

xtsz *

µ−= (DF=n-1)

Elutasítási tartomány

zsz>zα (zsz<-zα)

zsz<-zα/2 vagy zsz>zα/2

tsz>tα (tsz<-tα)

tsz<-tα/2 vagy tsz>tα/2

Feltételek σ0 ismert v. n>30

13. Táblázat: Egymintás z- és egymintás t-próba Példa: Nézzük ismét az előző példát! Ismeretes, hogy egy élelmiszeripari cég egyik gyártósora margarint tölt műanyag dobozokba. A gyártósorról lekerülő dobozok nettó töltősúlya normális eloszlású 4 gramm szórással. Az előírás szerint a dobozok átlagos töltősúlyának 250 grammnak kell lenni. A gyártósorról lekerülő termékekből egy 10 elemű FAE mintát veszünk, amelyeknek grammban kifejezett töltősúlya a következő: 255, 242, 245, 253, 249, 251, 250, 255, 245, 246 gramm. Ellenőrizzük a minta felhasználásával az átlagos töltősúlyra megfogalmazott nullhipotézis teljesülését 10%-os szignifikancia szinten! n=10

grx 1,249= gr4=σ grH 250:0 =µ grH 250:1 <µ vagy grH 250:1 ≠µ

ismert az elméleti szórás → z-próbát használhatunk α=0,1

az egyoldali alternatív hipotézis kritikus értéke zα= –1,28 a kétoldali alternatív hipotézis kritikus értékei: zα/2= ±1,64

Az egyoldali alternatív hipotézis alapján meghatározott elfogadási tartomány: –1,28 < zsz A kétoldali alternatív hipotézis alapján meghatározott elfogadási tartomány: –1,64 < zsz < 1,64

A próbastatisztika értéke: 104

2501,249 −=szz = –0,0715

Mivel zsz az elfogadási tartományba esik (mindkét alternatív hipotézis esetén), ezért H0-t 10%-os szignifikancia szinten elfogadjuk, a dobozok átlagos töltősúlya 250 gramm.

Page 113: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

113

Példa: Ellenőrizzük az előző minta felhasználásával az átlagos töltősúlyra megfogalmazott nullhipotézis teljesülését 10%-os szignifikancia szinten úgy, hogy csak azt tudjuk, hogy a gyártósorról lekerülő dobozok nettó töltősúlya normális eloszlású (tehát az elméleti szórást nem ismerjük)! n=10

grx 1,249=

grs 508,4=∗ grH 250:0 =µ grH 250:1 <µ vagy grH 250:1 ≠µ

Nem ismert az elméleti szórás, n<30 → t-próbát használhatunk α=0,1, DF=n–1=10–1=9

az egyoldali alternatív hipotézis kritikus értéke tα= –1,383 a kétoldali alternatív hipotézis kritikus értékei: tα/2= ±1,833

Az egyoldali alternatív hipotézis alapján meghatározott elfogadási tartomány: –1,383 < tsz A kétoldali alternatív hipotézis alapján meghatározott elfogadási tartomány: –1,833 < tsz < +1,833

A próbastatisztika értéke: 10508,4

2501,249 −=szt = –0,631

A tsz mindkét alternatív hipotézis mellett az elfogadási tartományba esik, H0-t 5%-os szignifikancia szinten elfogadjuk, vagyis a dobozok átlagos töltősúlya 250 gramm.

VII.1.c Sokasági arányra irányuló nagymintás próba

Legyen a sokaság bizonyos tulajdonságú egységeinek aránya, illetve előfordulási valószínűsége P, és az arra vonatkozó nullhipotézis: H0: P=P0. Ilyen ellenőrzésre szoruló hipotézis lehet például az, hogy egy adott vizsgáztatónál a jeles vizsgázók aránya 10%, vagy hogy egy gyártási folyamatból kikerülő selejtes termékek aránya nem több, mint 2%, vagy hogy a felnőtt magyar népességben a túlsúlyosak aránya 50% egy adott időpontban. Ha a sokaságból vett minta olyan nagy, hogy

10)1(,min 00 ≥− PnnP

akkor a nullhipotézis helyessége az aszimptotikusan N(0,1) eloszlású

n

PP

Ppz

)1( 00

0

−−

=

próbafüggvény segítségével vizsgálható a megfelelő egy-, ill. kétoldali alternatívával szemben, ahol p a sokasági aránya torzítatlan becslőfüggvény. A becslésnél tanultakból

ismert, hogy a P sokasági arány torzítatlan becslőfüggvénye n

kp = , ahol k a bennünket

Page 114: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

114

érdeklő tulajdonságú mintaelemek száma. Nagy minta esetén az aránybecslések normális

eloszlást követnek p átlaggal és n

pp )1( 00 −szórással.

A próba tényleges végrehajtása megegyezik az átlagra vonatkozó próbáknál leírtakkal. Példa: Egy olvadó biztosítékokat gyártó cég feltételezi, hogy a működésképtelen biztosítékok aránya legfeljebb 0,1. Ezt a feltevést kell egy 144 elemű minta alapján megvizsgálnunk 5%-os szignifikancia szinten. A mintában a selejtes termékek száma 25. A nullhipotézis és az ellenhipotézis: H0: P=0,1 és H1: P>0,1 Legelőször azt ellenőrizzük, hogy a mintánk elég nagy-e a hipotézisvizsgálat előzőekben megismert módon való elvégzéséhez. Mivel 144·0,1=14>10 és 144·(1–0,1)=129,6>10, a nagymintás eljárás alkalmazható. A próba jobboldali kritikus tartománnyal hajtandó végre.

α=0,05, zα=1,64. Az egyoldali alternatív hipotézis alapján meghatározott elfogadási tartomány: zsz<1,64

A próbafüggvény adott mintára vonatkozó értéke:

94,2

144

9,01,0

1,0144

25

≈⋅

−=szz

Mivel a zsz>1,64, ezért a nullhipotézist, vagyis a gyártó cég feltételezését elvetjük, a selejtarány 5%-os szignifikancia szinten meghaladja a 10%-ot. Példa: Egy diákszervezet feltételezi, hogy a következő diáktanács-választáson a szavazatok legalább 30%-át biztosan megkapják. Visszautasítható-e ez a feltételezés 5%-os szignifikancia szinten úgy, hogy egy 65 elemű mintában 12-en szavaztak erre a diákszervezetre? H0: P=0,3 és H1: P<0,3

α=0,05, zα= –1,64

A próbafüggvény adott mintára vonatkozó értéke:

03,205684,0

1154,0

65

7,03,0

3,065

12

−=−=⋅

−=szz

Az egyoldali alternatív hipotézis alapján meghatározott elfogadási tartomány: zsz>–1,645

Mivel a próbafüggvényünk a kritikus tartományba esik, statisztikailag igazoltuk, hogy a diákszervezet feltételezése 5%-os szignifikancia szint mellett elvethető.

Page 115: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

115

VII.2 Kétmintás próbák

A két- és többmintás próbák – ideértve a meglehetősen speciális páros mintás próbákat is – annak a kérdésnek a vizsgálatára használhatók, hogy két vagy több – meghatározott szempontból eltérő (pl. különböző műszakok, gépek stb.) – sokaságban a vizsgált paraméterek (várható értékek, szórások) is különböznek-e egymástól. Míg tehát az egymintás próbák valamilyen feltételezett, előírt értékhez viszonyítják az egyetlen sokaságot, addig a többmintás próbák két vagy több sokaság egymással való összehasonlítására szolgálnak41. Kétmintás (átlag) próbával ellenőrizhetjük például, hogy két töltőgép azonos mennyiséget tölt-e a söröspalackokba. Többmintás próbáknál a nullhipotézisünk az, hogy az adott elméleti jellemzők (a várható értékek vagy az elméleti szórások) egyenlők egymással. Az előző példánál tehát a nullhipotézist így írhatjuk fel: H0: µ1=µ2. Az alternatív hipotézis általában egy vagy kétoldali is lehet, de néhány próbánál a gyakorlatban legtöbbször csak egy adott alternatívával szembeni vizsgálatot végzünk.

VII.2.a Két szórásnégyzet (szórás) összehasonlítása42

Szórásokra vonatkozó próbákat szórásnégyzetek segítségével végezhetünk. A szórásnégyzetekre vonatkozó próbák a normális alapeloszlástól való eltérésre sokkal érzékenyebbek, mint az átlagpróbák. Általános esetben – mivel a varianciák azonossága a várható értékek összehasonlítására leggyakrabban alkalmazott kétmintás t-próba feltétele – a szórásokra vonatkozó próbákat az átlagpróbák előtt célszerű elvégezni. Két független, ismeretlen várható értékű és szórású, normális eloszlást követő valószínűségi változó varianciáinak azonosságára vonatkozó hipotézisünket az ún. F-próbával ellenőrizhetjük. A két alaposzlásból vett n1 és n2 elemű minták 2*

1s illetve 2*2s korrigált

varianciái torzítatlan becslései az alapeloszlás 21σ illetve 2

2σ varianciáinak. A fenti feltételek

mellett a H0: σ12=σ2

2 nullhipotézist az 2*

2

2*1

s

sF = próbastatisztikával vizsgálhatjuk, ahol

s1*2>s2

*2. Ha H0 és a kiindulási feltételek teljesülnek, akkor az így képzett F érték az ún. Fisher-féle F-eloszlást követi, amely a számláló (DF1) és a nevező (DF2) szabadságfokától (DF1,2=n1,2 -1) függ. A számítást mindig úgy kell végeznünk, hogy a számlálóban a nagyobb variancia szerepeljen. Az F próbát ily módon mindig egyoldali próbaként végezzük, hiszen azt vizsgáljuk, hogy s1

*2 szignifikánsan nagyobb-e s2*2 értéknél, vagyis ellenhipotézisünk

H1: σ12>σ2

2. (Megjegyezzük, hogy az F-próbát baloldali és kétoldali alternatíva esetén is elvégezhetjük, de ez most nem témája jegyzetünknek.) Táblázataink is egyoldali próbára vonatkoznak (mégpedig Fα, DF1, DF2, kritikus értékeit adják meg).

41 Sincich, T.:Statistics by Example, Dellen Publishing Company, San Fransisco, 1990 42 Kövesi J.: Kvantitatív módszerek, Oktatási segédanyag, BME MBA Mérnököknek program, Budapest, 1998

Page 116: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

116

Példa: Egy bizonyos szerelési művelet elvégzésére egy üzem munkatársait két eltérő módszerrel tanították be. Egy idő után a kétféle módszerrel betanított munkások közül egymástól függetlenül egy-egy mintát vettek, s egy adott 8 órás műszakban minden munkásnak feljegyezték a teljesítményét. A két mintán belül a munkások átlagos teljesítménye és a teljesítmények szórása az alábbi módon alakult. Ellenőrizzük annak a hipotézisnek a helyességét 1%-os szignifikancia szinten és kétoldali alternatíva mellett, hogy az Y és X módon betanított munkások teljesítményének szórása egyforma!

A betanítás módszere

Mintanagyság Az egy műszak alatt összeszerelt darabok

Átlaga Szórása

Y 16 128 18

X 11 112 29

H0: σX2=σY

2 H1: σX

2>σY2

α=0,01 DF1=16–1=15 mivel „X” jelű minta szórása a nagyobb, ez kerül majd a számlálóba, DF2=11–1=10 → Fα=4,56

Elfogadási tartomány: Fsz < 4,56 A próbastatisztika értéke: Fsz=292/182=2,6 Mivel Fsz az elfogadási tartományba esik, H0-t 1%-os szignifikancia szinten elfogadjuk, azaz az alapsokasági szórások nem különböznek egymástól.

VII.2.b Két független minta várható értékének összehasonlítása

A minta függetlensége azt jelenti, hogy az egyik sokaságban egy elem mintába kerülése ill. be nem kerülése semmilyen módon nem befolyásolja a másik sokaságban az elemek mintába kerülésének valószínűségét. Az egymintás esethez hasonlóan ebben az esetben is több próba közül választhatunk. Nullhipotézisünk természetesen minden esetben: H0: µ1=µ2, vagyis a két várható érték egyenlő. Abban az esetben, ha ismerjük az alapsokasági szórásokat (σ1 és σ2), vagy ha nem ismerjük, de nagy mintával dolgozunk (n1>30 és n2>30, s az elméleti szórásokat a korrigált tapasztalati szórással becsüljük), kétmintás z-próbával, ha nem ismerjük az alapsokasági szórást, de feltehető a szórások egyezése, akkor kétmintás t-próbával vizsgálhatjuk a fenti nullhipotézist. Ha mindkét sokaság normális eloszlású, az elméleti szórásokat nem ismerjük, de a szórások különböznek egymástól, akkor a kétmintás t-próba nem alkalmazható, helyette a Welch-próbát használhatjuk. Szakmai feltevésünktől függően, mindhárom próba esetén alkalmazhatunk egy- vagy kétoldali ellenhipotézist. Az első két statisztikai próbával kapcsolatos alapismereteket az alábbi táblázat foglalja össze.

Page 117: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

117

z-próba t-próba

egyoldali kétoldali egyoldali kétoldali

H0 µ1=µ2

H1 µ1>µ2 (µ1<µ2)

µ1≠µ2

µ1>µ2 (µ1<µ2)

µ1≠µ2

Próba-statisztika

2

22

1

21

21

nn

xxzsz

σσ +

−= *

+

−=

21

2

21

11nns

xxt

p

sz **

Elutasítási tartomány

zsz>zα (zsz<-zα)

zsz<-zα/2 vagy zsz>zα/2

tsz>tα (tsz<-tα)

tsz<-tα/2 vagy tsz>tα/2

Feltételek σ1 és σ2 ismert v. n1 és n2>30 σ1=σ2

14. Táblázat *: ha elméleti szórások nem ismertek, de n1 és n2>30, akkor σ1

2≈s1*2és σ2

2≈s2*2

**: ahol 2

)1()1(

21

2*22

2*112

−+−+−

=nn

snsnsp , DF=n1+n2-2

Példa: Térjünk vissza az F-próbánál bemutatott példánkhoz! Most ellenőrizzük 1%-os szignifikancia szinten annak a hipotézisnek a helyességét az Y betanítási mód jobb az X-nél!

A betanítás módszere

Mintanagyság Az egy műszak alatt összeszerelt darabok

Átlaga Szórása

Y 16 128 18

X 11 112 29

H0: µY=µX

H1: µY>µX Az elméleti szórásokat nem ismerjük → kétmintás t-próbát használhatunk (az F-próbával már igazoltuk a két szórás egyezését) α=0,01 DF=16+11–2=25 → tα=2,485 Elfogadási tartomány: tsz<2,485

A próbastatisztika értéke: 21116

29)111(18)116( 222

−+−+−=ps =530,8

( ) 519,1

111

1618,530

112128 =+

−=szt

Page 118: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

118

Mivel tsz az elfogadási tartományba esik, H0-t 1%-os szignifikancia szinten elfogadjuk, nincs eltérés a két betanítási mód között.

Példa: Két gyártó egy-egy kávéfajtájának kiskereskedelmi egységárát (1 lb-ra vonatkoztatva) szeretnénk összehasonlítani. Véletlenszerű mintát véve országszerte e kávéfajtákat áruló boltok közül, s feldolgozva az adatokat, a kapott statisztikai jellemzőket a következő táblázat mutatja:

„A” „B”

Mintaszám 63 58

Átlag $2,98 $2,93

Korr. tap. szórás $0,11 $0,07

1%-os szignifikancia szinten feltehető-e, hogy az „A” típusú kávé drágább, mint a „B”? H0: µA=µB H1: µA>µB Az elméleti szórásokat nem ismerjük, de a mintaszám elég nagy mindkét mintában (nA, nB >30) → kétmintás z-próbát használhatunk α=0,01→ zα=2,34 Elfogadási tartomány: 2,34>zsz

A próbastatisztika értéke: 01,3

5807,0

6311,0

93,298,222

=+

−=szz

Mivel zsz az elutasítási tartományba esik, H0-t 1%-os szignifikancia szinten nem fogadjuk el, vagyis az „A” típusú kávé drágább, mint a „B”, 1%-os szignifikancia szinten nem tételezhető fel az átlagárak egyezése.

Welch-próba43

Mint korábban is utaltunk rá, ha a két alapsokasági szórás ismeretlen, s ráadásul nem tételezhető fel a két szórás egyezése (ill. az ezt vizsgáló statisztikai próba elutasítja a szórások egyezését, ld. később), akkor nem alkalmazhatjuk a kétmintás t-próbát. Ilyen esetekben a két sokaság várható értékének összehasonlítására a Welch-próbát használhatjuk, melynek próbastatisztikája:

2

2*2

1

2*1

21

n

s

n

s

xxt f

+

−= .

43 Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985

Page 119: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

119

Az f paraméter értékét a következő módon számíthatjuk ki. Legyen

2

2*2

1

2*1

2

2*2

ns

ns

ns

c+

= , ekkor

( )( )( ) ( )( )22

21

21

111

11

cncn

nnf

−−+−−−= . Ha a H0 hipotézis igaz, akkor a tf statisztika közelítőleg DF=f

szabadságfokú Student-(t-) eloszlású, vagyis adott ε = (1-α) megbízhatósági szinthez a t-táblázatból az f szabadságfoknak megfelelő kritikus érték könnyen meghatározható. Ha mindkét minta elemszáma elég nagy (>40), akkor a tf statisztika közelítőleg normális eloszlású, azaz a kritikus értékek a normális eloszlás táblázatából kereshető ki.

Példa: Tegyük fel, hogy a betanítások vizsgálatakor a szórások nem azonosak (ld. F-próba és kétmintás t-próba példája). Végezzük el így az összehasonlítást!

A betanítás módszere

Mintanagyság Az egy műszak alatt összeszerelt darabok

Átlaga Szórása

Y 16 128 18

X 11 112 29

H0: µX=µY H1: µX≠µY Az elméleti szórásokat nem ismerjük, és azt feltételeztük, hogy nem azonosak → Welch-próba α=0,01 DF=f = ? c=(292/11)/(182/16+292/11)=0,79 f=(16-1)(11-1)/((16-1)0,792+(11-1)(1-0,79)2)=15,3≈15 tα/2=2,947

Elfogadási tartomány: –2,947 < tsz < 2,947

11

29

16

18

11212822

+

−=ft =1,63

A próbastatisztika (tf) értéke tsz elfogadási tartományba esik, H0-t 1%-os szignifikancia szinten elfogadjuk.

VII.2.c Páros minták várható értékének összehasonlítása

Az eddig tárgyalt kétmintás statisztikai próbák alkalmazásánál fontos feltétel volt a minták függetlensége. Ez a feltétel a gyakorlatban legtöbbször teljesül, de vannak bizonyos speciális esetek, amikor a két minta elemei között van valamilyen kapcsolat. Az ún. páros minták esetén a mintaelemek nem függetlenek egymástól, „van bennük valamilyen közös tényező” (pl. ugyan az a mérőeszköz, ugyan azt az alkatrészt, embert stb. vizsgáljuk).

Page 120: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

120

Páros mintáknál tehát az egyik minta elemeinek kiválasztása maga után vonja a másik minta elemeinek kiválasztását, s így a két minta elemei nem tekinthetők egymástól függetleneknek. Az ilyen páros (összefüggő) sokaságokban a két sokaság (s ebből következően természetesen a minta) elemei egymással kölcsönös és egyértelmű megfeleltetésbe hozhatók. A páros elnevezés onnan származik, hogy a két sokaság egymáshoz rendelt egységeinek összessége egy elempárokból álló, egyetlen sokaságnak is tekinthető. Ha például két iskola tanulóinak testsúlyát szeretnénk összehasonlítani, akkor csak nehezen és mesterkélten képzelhető el a tanulók párokba rendezése, márcsak a két iskola létszámának különbsége miatt is. Ugyanakkor, ha egy új fogyókúra eljárás hatékonyságát szeretnénk értékelni, akkor célszerű ugyanazon személyek testsúlyát megmérni két időpontban, a fogyókúra előtt és után. Ebben az esetben annak megítélésére, hogy valóban csökkent-e a fogyókúra után a testsúly, már nem véletlenszerűen választunk a fogyókúrázók közül, az első minta elemei meghatározzák a második mintát is. Természetesen az összefüggő sokaságokból is vehetünk független mintákat, de ez általában nem célszerű, mert így elveszítjük az elempárok egyenkénti összehasonlításával nyerhető információt. Mivel a páros minták elemei egymásnak megfeleltethetők, így természetesen a két minta nagysága azonos. Az ilyen mintákat rendszerint oly módon kezeljük, hogy az egymásnak megfeleltethető elemeik különbségét (vagy hányadosát) képezzük, majd a továbbiakban e különbségeket (vagy hányadosokat) már egyetlen minta elemeinek tekintjük44. Páros minták várható értékeinek összehasonlítására is ezt az eljárást követjük. Képezzük a két minta különbségét, s ha a kapott eltérések eloszlása normális, akkor kiszámolva a különbségek átlagát és tapasztalati szórását, az így kapott minta alapján végezhetünk egy egymintás t-póbát annak megállapítására, hogy a különbségek szignifikánsan eltérnek-e nullától. (Természetesen nem csak a nullától való eltérést, azaz a két sokaság várható értékének egyezését, hanem egy adott különbség meglétét is vizsgálhatjuk.)

Képezve tehát páronként a különbségeket (di), majd a különbségek átlagát (d ) és korrigált tapasztalati szórását (∗ds ), a nullhipotézisünket, vagyis a két várható érték egyezését

(H0: µ1=µ2), az alábbi próbastatisztikával vizsgálhatjuk:

ns

dt

dsz ∗= . Ha H0 igaz, tsz értéke

DF=n-1 szabadságfokú t-eloszlást követ. A H0 hipotézis vizsgálatát egy- és kétoldali alternatívával szemben is vizsgálhatjuk.

Példa: Egy sportcipőket gyártó cég szeretné meghatározni, hogy egy új típusú cipő („A”) élettartama nagyobb-e az előzőtől („B”)? Felkértek tíz kocogót, hogy teszteljék a termékeket. Az eredményeket (az élettartamokat hetekben mérve) a következő táblázat mutatja (az élettartamok normális eloszlást követnek)45:

Kocogó 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. „A”cip ő 27 35 19 39 34 32 15 26 18 17 „B” cipő 23 28 16 31 38 30 17 22 15 16

44 Reimann J. – Tóth J.: Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest, 1985 45 Sincich, T.: Statistics by Example, Dellen Publishing Company, San Francisco, 1990

Page 121: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

121

95%-os megbízhatósági szinten vizsgálva feltehető-e az élettartamok különbözősége? H0: µ1=µ2 H1: µ1>µ2 n=10 Képezzük az eltéréseket:

1. 2. 3. 4. 5. 6. 7. 8. 9. 10. di 4 7 3 8 -4 2 -2 4 3 1

Az eltérések átlaga: d = 2,6 A különbségek korrigált tapasztalati szórása (∗

ds ): 3,66

α=0,05 DF=n–1=10–1=9 → tα=1,833 Elfogadási tartomány: tsz < 1,833

A próbastatisztika értéke: tsz=2,6/(3,66/√10)=2,25

Mivel tsz az elutasítási tartományba esik, H0-t 5%-os szignifikancia szinten nem fogadjuk el, azaz az új cipők élettartama valóban nagyobb, mint a régieké.

VII.2.d Aránypróba

Ebben az esetben a nullhipotézisünk a két sokasági arány egyezősége, azaz H0: P1=P2, az alternatív hipotézis pedig a vizsgált problémától függően lehet egy-, ill. kétoldali. A

+

−=

21

21

11

nnqp

ppzsz

próbafüggvényről bizonyítható, hogy nagy minták esetében standard normális eloszlást követ,

ahol 21

2211

nn

pnpnp

++= a vizsgált eseménynek a két minta egyesítésével nyert mintából

számított relatív gyakorisága és pq −=1 . Az egyesített mintából ugyanis így pontosabban becsülhető a H0 fennállása, mint a két mintából külön-külön. A próbafüggvény alapgondolata itt is megegyezik az előzőekkel, a két mintabeli becslés különbsége normális eloszlást követ, és ha igaz a nullhipotézis, akkor 0 átlaggal és a különbségre felírható standard hibával, ez utóbbi szerepel a próbafüggvény nevezőjében. A próba gyakorlati menete megegyezik az eddigiekben megismertekkel. Példa: Egy közvélemény-kutató cég 1000 elemű, állítása szerint az ország teljes felnőtt lakosságát reprezentáló FAE mintákkal dolgozik. Két – időben egymást két hónappal követő – közvélemény-kutatás eredménye szerint az egyik politikust a lakosság 62, ill. 68%-a tartotta rokonszenvesnek. 5%-os szignifikancia szinten állítható-e, hogy a lakosság rokonszenve növekedett az adott politikus iránt?

Page 122: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

122

H0: P1=P2 H1: P1<P2 α=0,05 → zα= –1,645 Elfogadási tartomány: zsz > –1,645

65,02

65,068,0

2000

68,0100062,01000

21

2211 =+=⋅+⋅=++=

nn

pnpnp ;

35,065,011 =−=−= pq A próbastatisztika értéke:

81,2021331,0

06,0

1000

1

1000

135,065,0

68,062,0

11

21

21 −=−

−=

+⋅⋅

−=

+

−=

nnqp

ppzsz

Mivel zsz<–1,645, ezért a H0 hipotézist 5%-os szignifikancia szinten elutasítjuk, vagyis a lakosság rokonszenve az adott politikus iránt növekedett. Példa: Egy távközlési szolgáltatónál a vezetők prémiumának egy részét a szolgáltatások elégedettségvizsgálatához kötik. Minden hónapban véletlenszerűen kiválasztott 1500 előfizetőt hív fel egy automata, és néhány kérdést tesz fel, a válaszokat rögzítik és összesítik. Az egyik hónapban 75%, a másik hónapban 78% volt az elégedettek aránya, ezért a prémium összegét növelték. Jogos volt-e a lépés? A kérdés arra vonatkozik, hogy szignifikánsan nőtt-e az elégedettek aránya. Legyen a szignifikancia szint most 1%. H0: P1=P2 H1: P1<P2 α=0,01 → zα= –2,34 Elfogadási tartomány: zsz > –2,34

765,02

78,075,0

3000

78,0150075,01500

21

2211 =+=⋅+⋅=++=

nn

pnpnp

235,0765,011 =−=−= pq

937,100024,0

03,0

1500

1

1500

1235,0765,0

78,075,0

11

21

21 −=−

−=

+⋅⋅

−=

+

−=

nnqp

ppzsz

Mivel a zsz > –2,34, így a H0 hipotézist elfogadjuk, azaz nem nőtt szignifikánsan az elégedettség, a vezetői prémium összegének növelése nem volt jogos.

Page 123: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

123

VII.3 Többmintás próbák

VII.3.a Több szórás összehasonlítására vonatkozó próbák46

Az F-próbát csak abban az esetben alkalmazzuk, ha két minta szórását hasonlítjuk össze. Ha több normális eloszlásból származó mintát kell összehasonlítanunk, akkor az ún. Bartlett-próbát vagy Cochran-próbát alkalmazzuk. Bartlett-próba Legyen r darab mintánk és a megfelelő mintadarabszámok n1, n2, ...., nr, a j-edik minta k-adik eleme xjk, a j-edik minta átlaga jx , korrigált tapasztalati szórásnégyzete 2*

js .

Számítsuk ki a következő mennyiséget:

−−= ∑

=

2*

1

22 log)1( log3026,2

j

r

jj snsf

Aχ , ahol

2*

1

2

1

)1(1

s , j

r

jj

r

jj sn

frnf −=−= ∑∑

== .

f

1

1n

1

)1r(3

11A

r

1j j

−−+= ∑

=

A fenti képletből nyert χ2 értéket a χ2-táblázatban az r-1 szabadságfokhoz tartozó kritikus (a megállapodás szerinti α szinthez tartozó) elméleti χ2 értékekkel kell összehasonlítani. Ha a táblázatban talált χ2 érték nem kisebb, mint a képlettel számított, akkor megmaradhatunk a nullhipotézisünk mellett (amely természetesen a szórások egyezését állítja), ellenkező esetben a próba szignifikáns eltérésre mutat (azaz legalább egy szórás szignifikánsan eltér a többitől), s így a nullhipotézist elvetjük, vagyis kijelentjük, hogy a minták nem tekinthetők egyforma szórású normális eloszlású sokaságból származóknak. Példa: Egy laboratóriumban próbatesteken keménységvizsgálatokat végeznek. 5 szériát vizsgálnak, és ezek szórásnégyzetét kívánják összehasonlítani. A keménységet Rockwellben mérik. Az alábbi táblázat feltünteti az összehasonlítandó szórásnégyzeteket, a mintadarabszámokat (mindjárt eggyel csökkentve, mert a számításban így szerepelnek) és a számításhoz szükséges részeredményeket.

j sj*2 log sj

*2 nj-1 (nj-1)sj*2 (nj-1) log sj

*2 1/(nj-1)

1 4,00 06021 84 336,00 50,5764 0,0119

2 2,59 0,4133 93 240,87 38,4369 0,0108

3 2,89 0,4609 39 112,71 17,9751 0,0256

4 5,86 0,7679 18 105,48 13,8222 0,0556

5 1,61 02069 15 24,15 3,1035 0,0667

∑ 249 819,21 123,9141 0,1706

46 Kövesi J.: Kvantitatív módszerek, Oktatási segédanyag, BME MBA Mérnököknek program, Budapest, 1998

Page 124: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

124

innen: f = 249 r=5 s2 = 3,28 szabadságfok = 4 A = 1,014 χ2 = 10,324 A számított χ2 érték a 95%-os szintnél található 9,49-nél nagyobb, tehát ekkora χ2 előfordulásának kevesebb a valószínűsége, mint 5% azonos szórású alapsokaságok esetén. Ezért az összehasonlítás eredményeképpen megállapíthatjuk, hogy a szórások közötti eltérések szignifikánsak. Cochran-próba E módszer segítségével azt dönthetjük el, hogy a szórások között talált legnagyobb érték tekinthető-e a többivel azonos eloszlásból származónak. A Cochran-próbát akkor alkalmazhatjuk, ha az alapeloszlás normális és a minták mind azonos darabszámúak. A közös mintadarabszámot most n-el jelöljük (a szabadságfok f=n-1), az r darab különböző minta korrigált szórásnégyzetét pedig ismét s1

*2, s2*2, …sr

*2 - tel, utóbbiak közül a legnagyobb legyen smax*

2. Kiszámítjuk a

222

21

2max

... rsss

sg

+++= próbastatisztikát.

A kiértékeléshez szükséges diagram segítségével a már ismert módon eldönthetjük, hogy a legnagyobb szórás jelentős mértékben különbözik-e a többitől. Ha a legnagyobb érték túllépi a számára megengedett határt, akkor nem tekinthetjük az összes alapsokaságot egyenlő szórásúnak. Ilyenkor vagy teljesen elejtjük a homogenitásra vonatkozó feltevésünket, vagy pedig csak ezt a kiugró szórással rendelkező mintát (vagy ha több minta szórása lépte át a szignifikancia-határt, mindegyik ilyent) kizárjuk a sokaságból és megvizsgáljuk, hogy a megmaradó sokaságra eredeti feltevésünk fenntartható-e. Ezt tehát semmi esetre sem tekinthetjük természetesnek, hanem a megmaradó sokaságra meg kell ismételnünk a Cochran-próbát, azaz g értékét a megmaradó adatokból újra ki kell számítani és r új értékének figyelembevételével összevetni az ábrával. A megmaradó sokaságot a szórás szempontjából homogénnek csak akkor tekinthetjük, ha az utoljára végzett Cochran-próba „nem szignifikáns” eredményt mutat.

Példa: Műselyem szakítóerő vizsgálatánál (n=10) kapott r=20 vizsgálat adataiból számolt korrigált tapasztalati szórások között, található-e kiugró érték? Az adatokat az alábbi táblázat mutatja:

i 1. 2. 3. 4. 5. 6. 7. 8. 9 10.

si*2 24,9 8,4 21,2 8,0 8,4 6,0 26,3 26,7 6,8 12,5

i 11. 12. 13. 14. 15. 16. 17. 18. 19. 20.

si*2 12,5 11,4 4,8 22,2 22,6 16,1 10,9 9,6 60,5 10,9

Page 125: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

125

H0: a szórások nem különböznek H1: a legnagyobb szórás (19. minta) különbözik a többitől α=0,05 DF (f)=n-1=10-1=9 r=20 gkr=0,136 smax*

2=60,5 g=60,5/(24,9+8,4+…+10,9)=60,5/330,7=0,183 A számított g érték nagyobb, mint a kritikus érték, így 5%-os szignifikancia szinten elutasítjuk H0-t, azaz a szórások egyezését.

VII.3.b Varianciaanalízis

A varianciaanalízis a matematikai statisztikai eljárások között kiemelkedő jelentőséggel bír. Nem csak egy „egyszerű” hipotézisvizsgálat, hanem bonyolult gyakorlati problémák (elsősorban kísérlettervek) elemzésére, értékelésére használható módszer. Ennek ellenére most a hipotézisvizsgálatok között tárgyaljuk, mivel a legegyszerűbb eset, az ún. egyszeres osztályozású varianciaanalízis, lényegében több normális eloszlású sokaság várható értékének összehasonlítására alkalmazható, azaz a H0: µ1=µ =…=µr nullhipotézis helyességének a sokaságokból egymástól függetlenül vett minták alapján történő ellenőrzésére szolgál. Ellenhipotézisünk minden esetben az lesz, hogy nem minden várható érték egyforma. A próba elvégzéséhez előfeltétel még – a normalitáson kívül –, hogy az ismeretlen alapsokasági szórások megegyezzenek (Cochran- v. Bartlet-próba segítségével ezt ellenőrizhetjük). A próba elvégzéséhez mindenekelőtt (természetesen a csoportok átlagának és szórásának meghatározása után, amelyek már a szórások egyezésének vizsgálatához is szükségesek) képezzük az összes megfigyelés számtani átlagát (x ), ami megegyezik a mintaátlagoknak

( x i) a minta elemszámával súlyozott számtani közepével: ∑∑∑== =

==r

i

ii

r

i

n

jij xn

nx

nx

i

11 1

11

Ahol: ni az i-edik minta elemszáma, n az összes minta elemszáma n=n1+n2+…+nr.

Ezek után képezzük az összes mért értéknek(xij) az összes adat átlagától(x ) való eltérésének a

négyzetösszegét az ún teljes négyzetösszeget: ( )∑∑= =

−r

i

n

jij

i

xx1 1

, amely két négyzetösszeg

összegére bontható.

Az egyik az ún. csoportok közötti ( )∑=

−r

i

ii xxn1

2 négyzetösszeg, amely a csoportok közti

eltéréseket magyarázza, méri, a másik a csoportokon belüli ( )∑∑= =

−r

i

n

j

iij

i

xx1 1

2 négyzetösszeg,

amely a csoportokon belüli eltéréseket, a véletlen hatásokat mutatja47.

Ha H0 igaz, s a kiindulási feltételek is teljesülnek, akkor bizonyítható, hogy a csoporton belüli négyzetösszeg χ2-eloszlású n-r szabadságfokkal, s a csoportok közötti négyzetösszeg

47 Lukács O.: Matematikai statisztika, Példatár, Műszaki Könyvkiadó, Budapest, 1987

Page 126: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

126

független a csoporton belüli négyzetösszegtől, és szintén χ2-eloszlású r-1 szabadságfokkal. Ha ez igaz, akkor a négyzetösszegek és a megfelelő szabadságfokok hányadosából képzett ún külső (sk

2) ill. belső (sb2) szórásnégyzetek egymástól függetlenek, s a közös várható értékük az

ismeretlen, de egyenlő alapsokasági szórás: M(sk2)=M(sb

2)=σ. A két szórás egyezésének vizsgálatával így ellenőrizhetjük eredeti hipotézisünket, a várható értékek azonosságát. Két szórás összehasonlítására a korábban megismert F-próba használható, képezve az F=sk

2/sb2 statisztikát, amely – H0 fennállása esetén – (r-1, n-r)

paraméterű F-eloszlású48. A varianciaanalízis eredményeinek összefoglalására gyakran alkalmazzák az ún. szórásfelbontó táblázatot, amit a varianciaanalízis angol nevének rövidítéséből ANOVA táblának is szokás nevezni. Az egyszeres osztályozású varianciaanalízis ANOVA táblájának felépítését mutatja a következő táblázat:

Négyzetösszeg neve

Négyzet-összegek

Szabad-ságfok

Szórás becslése

F érték p-érték

Csoportok közötti *

( )∑=

−r

i

ii xxn1

2 r-1 sk2 sk

2/sb2 p

Csoporton belüli **

( )∑∑= =

−r

i

n

j

iij

i

xx1 1

2 n-r sb2 - -

Teljes ( )∑∑= =

−r

i

n

jij

i

xx1 1

n-1 - - -

15. Táblázat: ANOVA tábla *: a kísérlettervezésből vett szóhasználattal szokták faktornak v. kezelésnek is nevezni ill. **: a csoporton belüli ingadozást hibának

Példa: Egy áruházláncnál megvizsgálták, hogy 3 boltjukban azonos-e az egy vásárlásnál fizetett összeg. Minden boltban kiválasztottak 6 véletlen mintát. A vásárláskor fizetett összegeket az alábbi táblázat mutatja (dollárban)49:

1. bolt 2. bolt 3. bolt

12,05 15,17 9,48

23,94 18,52 6,92

14,63 19,57 10,47

25,78 21,4 7,63

17,52 13,59 11,90

18,45 20,57 5,92

Feltételezve, hogy a kifizetések normális eloszlásúak, s szórásuk egyenlő, van-e különbség a 3 üzlet között?

48 Lukács O.: Matematikai statisztika, Példatár, Műszaki Könyvkiadó, Budapest, 1987 49 Curwin, J. – Slater, R.: Quantitative Methods for Business Decisions, Third Edition, Chapman & Hall, London, 1991

Page 127: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

127

H0: µ1=µ2=µ3 H1: legalább az egyik várható érték eltér a többitől n1=n2=n3=6 r=3 Az átlagok boltonként: $18,73 $18,14 $8,72 Az összes adat átlaga: $15,2 A számításokat elvégezve, az ANOVA tábla:

Négyzet-összegek

Szabad-ságfok

Szórás becslése

F érték p érték

Csoportok közötti

378,4 2 189,2 13,26 0,0005

Csoporton belüli

214,1 15 14,3 - -

Teljes 592,5 17 - - - Az Fsz számított értéke: 13,26. α=0,05 A számláló szabadságfoka: 2 A nevező szabadságfoka: 15 A kritikus érték: Fkr=3,68 Mivel Fsz>>Fkr, a H0 nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz az átlagok ill. legalább egy átlag szignifikánsan különbözik a többitől. Esetünkben ez értelemszerűen a 3. bolt, ahol az egy vásárlásnál kifizetett összeg nagysága átlagosan kevesebb, mint a fele a másik két bolt átlagánál.

Page 128: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

128

VIII. Korreláció- és regreszióelemzés

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Axiómák, alaptételek

Kombinatorika

Geometriai val.sz.

Val.szám. tételek

Elméleti eloszlások

Valószín űségelmélet

Mintavétel

Leíró statisztika

Becslés

Hipotézisvizsgálat

Összefüggésvizsgálat

Matematikai statisztika

Valószín űségszámítás

Page 129: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

129

VIII.1 Kapcsolatok jellege50

A társadalmi, a műszaki és a gazdasági jelenségek törvényszerűségeit nemcsak önmagunkban, hanem a jelenségekkel szoros kapcsolatban lévő más tényezők összefüggésében is vizsgálhatjuk. Az eddigi fejezetekben a véletlen tömegjelenségek leírását mindig egy már bekövetkezett állapot valószínűségelméleti, matematikai-statisztikai vizsgálatával végeztük el. Az összefüggésvizsgálatok során arra keressük a választ, hogy egy adott állapot milyen tényezők hatására jött létre, az egyes tényezők milyen mértékben befolyásolják a jelenség alakulását, a tényezők milyen szoros kapcsolatban vannak egymással. Két ismérv között háromféle kapcsolat lehetséges:

1. a két ismérv független egymástól (ha a változók között nincs összefüggés, vagyis az egyik ismérv szerinti hovatartozásból nem következtethetünk a másik ismérv változatára)

2. a két ismérv között sztochasztikus kapcsolat van 3. a két ismérv között függvényszerű (determinisztikus) kapcsolat van (ha az egyik

ismérv változata minden esetben a másik ismérv adott változatával fordul elő, azaz az egyik ismérv által felvett ismérvváltozat ismeretében egyértelműen lehet következtetni a másik ismérv által felvett értékre)

A sztochasztikus kapcsolat a függetlenség és a determinisztikus kapcsolat között foglal helyet. Ilyen kapcsolat esetén az egyik ismérv változathoz való tartozásból csak tendenciaszerűen, valószínűségi jelleggel következtethetünk a másik ismérvváltozatra. Más szóval a sztochasztikus kapcsolat lényege az, hogy a megfigyelt sokaság egységeinek egyik ismérv szerinti milyenségét, hovatartozását ismerve levonható ugyan bizonyos következtetés az egységek másik ismérv szerinti hovatartozásáról, de ez a következtetés nem teljesen egyértelmű (Pl. a munkanélkülivé válás esélye és az iskolai végzettség közötti kapcsolat vagy a biztonsági öv használata és a baleset súlyossága közötti kapcsolat). Az ismérvek közötti kapcsolat elemzésekor a következő három kérdésre keressük a választ:

1. Van-e kapcsolat a vizsgált ismérvek között? 2. Milyen szoros a kapcsolat? (a két szélsőség, vagyis a függetlenség és a függvényszerű

kapcsolat között hol helyezkedik el; egy kapcsolat annál lazább/gyengébb, minél közelebb van a függetlenséghez, és annál erősebbnek/szorosabbnak mondható, minél közelebb áll a függvényszerű kapcsolathoz)

3. Hogyan lehet felhasználni az ismérvek közötti kapcsolat természetének ismeretét arra, hogy egy adott egység bizonyos ismérvek szerinti milyenségéből következtessünk annak más ismérvek szerinti hovatartozására?

E kérdések megválaszolásának módja attól függ, hogy a sokaság egységeit egyidejűleg hány ismérv, illetve milyen fajta (milyen mérési szinten mért változók) szerint vizsgáljuk. Most kizárólag két ismérv fajtája (a változók mérési szintje) szerint a következő eseteket különböztetjük meg:

50 Az alfejezet Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996 felhasználásával készült.

Page 130: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

130

• asszociációs kapcsolat: az egymással kapcsolatban álló ismérvek minőségi vagy területi ismérvek (mindkét változó nominális mérési szintű)

• rangkorrelációs kapcsolat: mindkét változó sorrendi skálán mérhető. • vegyes kapcsolat: az egyik vizsgált ismérv mennyiségi ismérv, a másik területi vagy

minőségi ismérv (az egyik változót intervallum- vagy arányskálán, a másik változót meg nominális skálán mértük)

• korrelációs kapcsolat: mindkét vizsgált ismérv mennyiségi ismérv (mindkét változó intervallum- vagy arányskálán mérhető)

E négy eset megkülönböztetése azért fontos, mert az ismérvek közötti kapcsolat elemzésének három alapvető kérdése a megjelölt esetekben más-más eszközökkel vizsgálható.

VIII.2 A korrelációs kapcsolat szemléltetése

A nagyobb számítási munkát igénylő matematikai módszerek alkalmazása előtt a kapcsolat létezésére vonatkozó szakmai feltevésünket grafikus ábrázolással célszerű szemléltetni. Az ún. szóródás-diagramon az xi; yi értékpárok által meghatározott pontdiagram, illetve empirikus regressziófüggvény szemlélteti a kapcsolatot. A diagram segítségével elsődleges információt szerezhetünk a kapcsolat meglétéről vagy hiányáról, a kapcsolat szorosságáról, jellegéről és irányáról is.

39. ábra: Pontdiagramok

3 2 1 0-1-2-3

3

2

1

0

-1

-2

-3

Pozitív korreláció

R-Sq = 62.5 %

Y = -8.6E-02 + 0.690286X

-3 -2 -1 0 1 2 3

-3

-2

-1

0

1

2

3

Negatív korreláció

Y = 5.07E-02 - 0.647872X

R-Sq = 70.9 %

-2 -1 0 1 2

-3

-2

-1

0

1

2

3

Nincs korreláció

Y = -7.4E-02 + 0.208348X

R-Sq = 3.4 %

-3 -2 -1 0 1 2 3

0

10

20

30

40

Nem lineáris korreláció

Y = 12.0958 + 6.07684X + 1.16686X**2

R-Sq = 88.4 %

Page 131: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

131

Ha a pontok vonulási iránya (képzeletbeli tengelye) felfelé mutat, pozitív korrelációról beszélünk (növekvő xi értékekhez növekvő yi értékek tartoznak), ellenkező esetben a korreláció negatív. A görbevonali korreláció azt jelzi, hogy nem lehet minden korrelációt egyértelműen pozitívnak, vagy negatívnak tekinteni. Ha a pontok közel helyezkednek el egymáshoz (ill. a kapcsolat jellegét mutató függvényhez) szoros, ha távolabb, gyengébb kapcsolatot sejthetünk az ismérvek között.

VIII.3 Korreláció- és regressziószámítás51

A korreláció- és regressziószámítás a statisztika két, egymással szorosan összefüggő területét képezi. Ebben a fejezetben a mennyiségi ismérvek közötti kapcsolatvizsgálat eszközeivel fogunk megismerkedni. A mennyiségi ismérvek közötti sztochasztikus összefüggést korrelációnak nevezzük. Ilyen összefüggés van pl. a háztartások egy főre jutó jövedelme és egy főre jutó fogyasztása között, vagy pl. a termékek ára és a termék minőségét jellemző paraméterek között. A korrelációs kapcsolatok statisztikai módszerekkel végzett elemzésével nagymértékben gazdagíthatjuk a jelenségeikről és összefüggéseikről alkotott ismereteinket. A korrelációszámítás a magas szintű mérési skálákon mért változók kapcsolatainak vizsgálatával foglalkozik, elemzi a kapcsolat meglétét, szorosságát és irányát. A regressziószámítás az összefüggésekben lévő tendenciát vizsgálja, és a kapcsolat természetét valamilyen függvénnyel írja le. Így a kapcsolat megléte esetén annak formáját, jellegét, minőségi jellemzőit vizsgálja, és alkalmas arra, hogy a változók közötti kapcsolat segítségével mélyebb ismereteket szerezzünk a vizsgált változókról, illetve hogy a kapcsolat felhasználásával statisztikai következtetéseket vonjunk le. Hangsúlyozni kell azonban, hogy a korrelációs és regressziós számítás a kapcsolatot jellemzi, de semmit nem mond az oksági viszonyról. Tehát két, vagy több változó közötti sztochasztikus kapcsolat megállapításából nem következik, hogy a változók oksági összefüggésben vannak, azaz, hogy egyik tényező változása oka a másik tényező változásának. Az oksági kapcsolatot csak alapos szakmai és statisztikai vizsgálattal lehet megállapítani. Egy adott korrelációs összefüggés elemzésénél általában mind a két fajta vizsgálódásra szükség van, mivel a regresszió- és korrelációszámítással nyert információk más kérdésekre adnak választ, kiegészíthetik egymást. Általában megkülönböztetünk kétváltozós és többváltozós eseteket. Az előbbi esetben két változó kapcsolatát vizsgáljuk, mely két változó közül az egyik (legyen X) magyarázza a másik Y-nal jelölt eredményváltozó alakulását. A kétváltozós regresszióban így egy magyarázó változó áll szemben egy eredményváltozóval. Többváltozós esetben abból indulunk ki, hogy egy eredményváltozót több magyarázó változó ír le. A regressziószámítás lényege az, hogy egy jól definiált sokaságban két vagy több változó között sztochasztikus kapcsolatot tételezünk fel, és ezt a kapcsolatot szeretnénk leírni és megragadni annak érdekében, hogy a vizsgált sokaság tulajdonságait statisztikailag jobban megismerjük. Általában azzal a helyzettel állunk szemben, hogy a megfelelő sokasági összefüggéseket mintákból kell rekonstruálni.

51 Az alfejezet Hunyadi L. – Mundruczó Gy. – Vita L.: Statisztika, Aula Kiadó, Budapest, 1996, valamint Kerékgyártó Gy.né-Mundruczó Gy.- Sugár A.: Statisztikai módszerek és alkalmazásuk a gazdasági, üzleti elemzésekben, Aula Kiadó, Budapest, 1995 felhasználásával készült.

Page 132: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

132

A regressziószámítás során feltételezzük, hogy eredményváltozónk (Y) sztochasztikus kapcsolatban áll a magyarázó változókkal (X). Ennek általános formája:

),,...,,...,,( 21 εkj XXXXfY =

Ebben az esetben k számú magyarázó változót feltételeztünk, az ε maradékváltozó pedig azt fejezi ki, hogy a kapcsolat sztochasztikus, azaz a függvény szerves részét képezi egy valószínűségi változó is. Ennek az általános függvényformának a leggyakoribb és legkényelmesebben alkalmazható formája a lineáris regresszió. Ez az alak a többváltozós lineáris regressziós függvény általános alakja:

εβββββ +⋅++⋅++⋅+⋅+= kkjj XXXXY ......22110

Ebben az alakban k számú magyarázó változó, egy eredményváltozó és egy maradékváltozó van. A modellben k+1 számú paraméter van, hiszen a legelső paraméter az egyenlet konstans változójának együtthatója. Ezt az általános k+1 változós modellt gyakran alkalmazzuk a k=1 esetre, amikor tehát egy magyarázó változó, egy eredményváltozó és két paraméter jellemzi a kapcsolatot. Ezt az esetet nevezzük kétváltozós lineáris regressziós modellnek:

εββ +⋅+= 110 XY

Feltételezzük tehát, hogy az X magyarázó változó és az Y eredményváltozó között lineáris sztochasztikus kapcsolat van, és ez a kapcsolat a fenti formulával írható le. Az összefüggés sztochasztikus jellegéből következik, hogy pl. ha egy rakomány elszállításánál vizsgáljuk a szállítási idő és a távolság kapcsolatát, a szállítási távolság bármely rögzített értékéhez tartozó menetidők nem lesznek azonosak. A szállítás idejét ugyanis a távolságon kívül befolyásolja pl. a rakomány súlya, a gépkocsi típusa, az időjárási és útviszonyok, a forgalmi helyzet stb.

VIII.3.a A kétváltozós regressziós modell

A továbbiakban tehát a εββ +⋅+= 110 XY összefüggést szeretnénk egy n elemű halmazból

rekonstruálni. A sokaságból n elemű mintát veszünk, azaz minden egyes i-vel jelölt mintában rögzítjük a j-edik magyarázó változó xij tapasztalt értékét, és megfigyeljük a hozzájuk tartozó yi értéket. Így kis betűkkel a sokasági (nagybetűs) változók mintabeli megfigyeléseit jelöljük. Az i-edik megfigyelés a következő lesz:

iinijii yxxxx →,...,,...,2,1

Ez azt jelenti, hogy az i-edik megfigyelésben a k számú magyarázó változó befolyásolja az eredményváltozó alakulását. Ezeket a megfigyeléseket n-szer elvégezve a kapott eredményeket vektorokba és mátrixokba szoktuk rendezni. A minta adatainak célszerű rendezése a következő:

=

=

nk

k

k

nnn x

x

x

xx

xx

xx

X

y

y

y

yM

L

OMMM

L

L

M

2

1

21

2221

1211

2

1

1

1

1

, és

=

εε

εM

2

1

Page 133: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

133

A megfigyelt adatokra felírt regresszió a következő lesz:

εβ +⋅= Xy

ahol a már említett megfigyeléseken túlmenően

=

βββ

βM

2

1

0

az ismeretlen sokasági

paramétervektort jelenti. A fenti egyenlet a mintára vonatkozik, ahol tehát k számú magyarázó változó és az n számú megfigyelés mellett k+1 ismeretlen paraméter van. Azért k+1, mert az első, a 0β a

konstanshoz tartozik. Az X mátrix első, 0β -hoz tartozó oszlopában megjelenő 1-esek éppen

ezt a konstans változót jelentik. A β vektor a sokasági, ismeretlen paramétereket tartalmazza, amelyeket a mintából kell majd

becsülni. Az ε is n elemű vektor. Az egyenletünkből x és y megfigyelhető, a β és ε nem megfigyelhető mennyiségek, miközben a β ismeretlen, de nem valószínűségi változó, míg ε szintén ismeretlen, de valószínűségi változó. Végül, β mintából becsülhető, ε-nak viszont csak a realizációja ismerhető meg a minta alapján. Tegyük fel, hogy valamilyen módon elkészítettük egy adott mintából a paraméterek becslését

és azt β -val jelöljük. Ekkor:

βˆ ⋅= Xy

és eXy +⋅= β

Az első egyenlet szerint a mintából becsült paraméterekkel előállítható az eredményváltozó (azaz a regressziós egyenes értékeinek) becsült változata, ami általában nem fog egybeesni a valódi sokasági értékekkel, de nem fog egybeesni (pontonként) a megfelelő megfigyelésekkel sem. A második egyenlet ezzel szemben azt mondja, hogy a mintából számított (becsült) regressziós értékek és a tényleges megfigyelések egymástól egy e maradékvektorral (reziduum) térnek el. Ez a maradékvektor egy minta esetén a maradékváltozóknak a különböző megfigyelésekhez tartozó egy-egy realizációjának tekinthető, ismételt mintavétel esetén pedig maga is valószínűségi vektorváltozó. Ha e két egyenletet kivonjuk egymásból, megkapjuk a maradékvektor explicit felírását:

yye ˆ−= A mintabeli összefüggések és a sokasági összefüggések kapcsolatát mutatja az alábbi ábra:

Page 134: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

134

Y

Xxi

yi

XY ⋅+= 10 ββ

xy ⋅+= 10ˆˆˆ ββ

iy

Y

Xxi

yi

XY ⋅+= 10 ββ

xy ⋅+= 10ˆˆˆ ββ

iy

40. ábra: Összefüggések a lineáris regressziós modellben

Az ábrán a vastag vonal az ismeretlen sokasági regressziófüggvényt mutatja. Az egyetlen minta megfigyelési értékeit (yi) az ábrán a pontok jelképezik. Ezekre a pontokra illesztettük a mintából becsült regressziós egyenest (y ), amelynek ixX = pontjához az iy becsült érték

tartozik. A következő ábra a maradékváltozó és a reziduum közötti összefüggést ábrázolja: Y

Xxi

yi

iy

ieiε

)()( ii xyEyE =

Y

Xxi

yi

iy

ieiε

)()( ii xyEyE =

41. ábra: Összefüggések a lineáris regressziós modellben

Erről az ábráról jól látható, hogy a maradékváltozó ix -hez tartozó értéke a megfigyelt érték és

a sokasági regressziós egyenes megfelelő pontja közötti távolságot adja meg. Mivel iy

valószínűségi változó, iε is az, de míg iy megfigyelhető, addig iε nem. Az is látható, hogy

iε igazi mintajellemző, hiszen az i-edik megfigyelt y és a mintából becsült regressziós

egyenes távolságát adja meg. A regressziós elemzés menete a következőképpen foglalható össze: a sokaságból mintát veszünk, majd a minta birtokában elkészítjük az adatbázist és becslét adunk az ismeretlen paraméterekre. Ekkor valójában még csak a minta (megfigyelések) keretein belül maradunk. Először a mintán belül leíró elemzést végzünk, görbeillesztési feladatot oldunk meg,

Page 135: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

135

vizsgáljuk az illeszkedés jellemzőit, a változók közötti kapcsolat szorosságát, irányát. Ezt követően a mintára vonatkozó feltételek és dedukciós ismereteink alapján következtetünk a mintából a sokaságra: pontbecslést készítünk és jellemezzük azok tulajdonságait, majd intervallumbecslést adunk előre meghatározott megbízhatósággal, végül statisztikai hipotézisvizsgálattal ellenőrizzük eredményeinket. Ennek során kitérünk arra, hogy a modellfeltételek a minta alapján hihetőnek tűnnek-e, avagy a minta eleve cáfolja a feltételek fennállását. Ez utóbbi esetben új modell építését kezdjük el. Ha a modell túléli a teszteket, akkor a kapott becslési eredmények alapján értékelni, elemezni, esetleg előre jelezni is lehet a vizsgált jelenséget. Most rátértünk a kétváltozós regressziós modell tárgyalására: A továbbiakban először az εββ +⋅+= 110 XY sokasági összefüggést szeretnénk n elemű

megfigyeléshalmazból rekonstruálni, ahol a megfigyeléseket legcélszerűbben a következő mátrixformába rendezzük:

=

=

n

i

n

i

x

x

x

x

X

y

y

y

y

y

M

M

M

M

M

M

2

1

2

1

1

1

1

1

,

A becslés elsődleges célja a 1β paraméter, amely a regresszió talán legfontosabb mutatója. Nem szabad azonban elfeledkeznünk arról, hogy a regresszió alapértelmezésben tartalmaz tengelymetszetet, ami a konstans változó együtthatója ( 0β ).

A kétváltozós regressziós modell elemzését a β paraméterek pontbecslésével kezdjük. A becslésre a legkisebb négyzetek módszerét használjuk fel. A korábbiakkal összhangban azt

tételezzük fel, hogy a becsült paramétereink: 0β és 1β . Ezek meghatározásakor a legkisebb

négyzetek elve azt javasolja, hogy a modell illeszkedését mutató reziduális négyzetösszeget

minimalizáljuk, azaz keressük azokat a 0β és 1β paramétereket, amelyek mellett az

( ) 21

10

1

2 )ˆˆ(ˆ i

n

ii

n

iii xyyyg ⋅−−=−= ∑∑

==

ββ

négyzetösszeg minimális. Az ii yy ˆ− eltérések (reziduumok) négyzeteinek összege jól

jellemzi a ponthalmaz és a regressziós vonal kölcsönös viszonyát. A megoldáshoz a g függvényt deriváljuk az ismeretlen paraméterek szerint, majd a deriváltakat 0-val egyenlővé téve kapjuk a szélsőértékek helyét52:

0)ˆˆ(2ˆ 10

0

=⋅−−−=∂∂

∑ ii xyg βββ

és 0)ˆˆ(2ˆ 10

1

=⋅⋅−−−=∂∂

∑ iii xxyg βββ

Az egyenleteket átrendezve:

∑ ∑⋅+⋅= ii xny 10ˆˆ ββ

52 Egy kétváltozós függvény elsőrendű parciális deriváltjainak zérus volta csak szükséges feltétele a szélsőérték létezésének. Esetünkben azonban ez egyúttal elegendő feltétel is, mert a vizsgált függvény másodfokú, mindenhol nemnegatív, ezért van szélsőértéke és az csak minimum lehet, így a második deriváltak vizsgálata nem szükséges.

Page 136: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

136

2

10ˆˆ ∑∑∑ +=⋅ iiii xxyx ββ

Ha bevezetjük a yiyi dyyd =−= és xixi dxxd =−= jelöléseket, azaz a változókat saját

átlaguktól vett eltérésekkel helyettesítjük, akkor valójában a koordináta-rendszer kezdőpontját

toljuk el az ),( yx pontba. Az új koordináta-rendszerre való áttérés nem érinti a 1β -et, de

megváltozik a tengelymetszet. Ennek új értékét jelöljük 0β -lal. y

xx

y

y

xx

y

42. ábra: A koordináta rendszer transzformációja

Az új koordináta-rendszerben a normálegyenletek:

∑∑ ⋅+⋅= xy dnd 10

~~ ββ

∑ ∑ ∑β+β=⋅ 2x1x0yx d

~d

~dd

Mivel 0∑ ∑ == yx dd , a meredekségi paraméter:

∑∑ ⋅

=21

ˆx

yx

d

ddβ

A tengelymetszet pedig:

xy ⋅−= 10ˆˆ ββ

A kapott paraméterek az egy adott mintából számított regressziós együtthatók. Értelmezésük

egyszerű: a 1β jelentése az, hogy a magyarázó változó egységnyi növekedése a becsült eredményváltozó átlagosan hány egységnyi növekedésével/csökkenésével jár együtt. Az

ún. tengelymetszet paraméter, vagyis 0β jelentése az, hogy ha a magyarázó változó 0 értéket vesz fel, a modell szerint mekkora lesz az eredményváltozó értéke. A regressziós együtthatók természetes mértékegységben jellemzik a két változó kapcsolatát. Előfordul azonban, hogy a kapcsolat jobban leírható olyan mutatóval, amelyik azt mondja meg, hogy a magyarázó változó 1%-os növekedése az eredményváltozó hány %-os növekedésével/csökkenésével jár együtt. Erre a célra használható a rugalmasság mutatója:

Page 137: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

137

Y

X

X

Y

X

X

Y

YXYEL ⋅

∆∆=∆÷∆=),(

Ezt a formát szokták ívrugalmasságnak is nevezni, a gyakrabban használt pontrugalmasság végtelen kis elmozdulás esetén vizsgálja a változók kapcsolatának %-os formában kifejezhető mutatószámát:

Y

X

dX

dYXYEl ⋅=),(

Kétváltozós esetben az előző egyenletbe beírva a becsült regressziós paramétereket, a következő egyszerű formát kapjuk:

x

x

y

xxyEl

10

11

ˆˆ

ˆ

ˆ

ˆ),ˆ(

ββββ+

==

Az eredmény értékelésekor arra kell figyelni, hogy az nem állandó, hanem x függvénye, azaz lineáris regresszió esetén a változók kapcsolatát %-os formában kifejező rugalmassági mutató értéke attól is függ, hogy az elmozdulás milyen szintről történik. A rugalmassági együttható értelmezése: az x változó adott szintről kiinduló 1%-os növekedése mekkora növekedés jelent y -ban.53 A következő lépés az elemzés során a regressziós függvényértékek meghatározása. Ez a paraméterbecslések után adódik, hiszen:

xy 10ˆˆˆ ββ +=

Ez az egyenlet valójában a mintából számított regressziós függvényt adja meg, ami maga az ismeretlen és keresett sokasági regressziós függvény becslése. Csak a mintán belül maradva azonban ez a függvény alkalmas a megfigyelési pontokhoz tartozó regressziós függvényértékek számítására. Ennek tartalma az, hogy az adott megfigyelési pontban (az annak megfelelő x helyen) becsült modellünk szerint mi lenne a vizsgált eredményváltozó értéke. A függvény segítségével meghatározhatjuk az eredményváltozó értékét olyan x helyeken, amelyek belül vannak ugyan a vizsgálat tartományán, de közvetlen megfigyelés nincs rájuk. Ekkor interpolációt végzünk. Ha olyan pontokra becsülünk a függvénnyel, amelyek kívül esnek a megfigyelés tartományán, akkor extrapolációról beszélünk. Ezt bizonyos esetekben előrejelzésnek tekintjük, ami a regressziós modellszámítások fontos végeredménye.

53 Leggyakrabban keresleti, fogyasztási függvényeknél használják, a fogyasztás becslésekor, tervezésekor fontos mutatószám az ár-, ill. jövedelemrugalmassági együttható.

Page 138: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

138

x

Megfigyelési tartomány

Interpoláció

Extrapoláció

x

Megfigyelési tartomány

Interpoláció

Extrapoláció

43. ábra: Interpoláció és extrapoláció

A becsült regressziós függvény segítségével a megfigyelési pontokban meghatározhatjuk a reziduumok értékeit:

iii eyy =− ˆ

A reziduumok a megfigyelések és a becsült függvényértékek közötti különbséget adják. E maradékokat nem szabad sem jelölésben, sem tartalmilag összekeverni a regressziós modell maradékváltozójával. Ez utóbbi, amit az i-edik megfigyeléshez kapcsolódóan iε -vel

jelöltünk, egy meghatározott tulajdonságokkal rendelkező valószínűségi változó, előbbi pedig egy mintából számított érték. Az ei maradékok igen fontos szerepet játszanak a modellezésben: megmutatják, hogy a modell mennyire tudott közel jutni a valósághoz, hiszen ei kis értékei jó, nagy értékei pedig gyenge illeszkedésre utalnak, és ez egy igen fontos kritérium a modell megítélésekor. Ezért célszerű az ei maradékokból egy olyan mutatót képezni, amelyik tömören, egyetlen számértékbe sűrítve tartalmazza az illeszkedés jellemzőit. A maradékok összege erre nem alkalmas, hiszen azok algebrai összege 0. Leggyakrabban négyzetösszegüket képezik, ami valójában az eredeti megfigyelések és a becsült modellértékek eltérésének négyzetösszege:

∑=

=n

iieSSE

1

2

Az illeszkedés jellemzésére ennek a mutatónak a normált alakját használják. Ha ezt a négyzetösszeget n-nel elosztjuk, akkor a mintán belüli reziduális varianciát kapjuk meg, aminek négyzetgyöke a reziduális szórás:

)r1(sn

es 22

y

n

1i

2i

e −==∑

=

Ez a mutató egyfajta szóródásmutató, és a regressziós becslés során elkövetett hiba egyik gyakran alkalmazott mérőszáma. A reziduális szóródás becslésére az alábbi torzítatlan becslést is használják (regressziós becslés abszolút hibája):

2n

)yy(

2n

es

n

1i

2ii

n

1i

2i

e −

−=

−=

∑∑==∗

Page 139: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

139

Az ∗

es az Y egyedi értékeknek az Y regressziós függvény szerinti érték körüli ingadozását

fejezi ki. Értékét a gyakorlatban nem ismerjük, ezért a mintabeli adatok alapján becsüljük.

Ebben a képletben yye ii ˆ−= ”maradéktag”, vagy más néven becsült reziduum, ∑=

n

iie

1

2 az a

reziduális négyzetösszeg, amelynek nagyságát a legkisebb négyzetek módszerével történő becslés során minimalizáljuk. Elméleti megfontolásból, a torzítatlanság követelményének teljesülése végett a négyzetösszeget a szabadságfokkal korrigáljuk, ami jelen esetben (n-2). Így elérjük, hogy ∗

es torzítatlan becslőfüggvénye lesz az alapsokasági varianciának.

Kifejezi, hogy a regressziós becslések átlagosan mennyivel térnek el az eredményváltozó megfigyelt értékeitől. Mivel az analitikus regresszió az elméleti regresszió mintából számított becslése, ezért a

regressziófüggvény paraméterei ( 10ˆ,ˆ ββ ) a valóságos β0 és β1 paraméterek becsült értékei. A

mintából számított regressziós paraméterek – mint minden reprezentatív mintából származó becsült paraméter – szóródnak az elméleti értékek körül. Ezt a szóródást az együtthatók standard hibái fejezik ki. Így a regressziós együtthatók hibái:

∑+⋅=β 2

x

2

eˆd

x

n

1ss

0

∑=

β 2x

d

ss

1

A hiba másik forrása az, hogy a vizsgált ismérvek között sztochasztikus kapcsolat van (lásd

∗es ). Y-nak X szerinti regressziós becslése nem a tényleges Y értékeket, hanem annak csak az

X-től függő részét adja. A tényleges és a regressziófüggvénnyel becsült értékek eltérése miatt beszélhetünk a regressziófüggvény, illetve a regresszióértékek hibájáról. Az eltérések nagyságát értelemszerűen befolyásolja a kapcsolat szorossága. Szoros korreláció esetén a becsült értékek jól közelítik az eredményváltozó értékeit, laza kapcsolatnál viszont a kétféle érték között – az Y-t befolyásoló egyéb tényezők jelentős súlya miatt – nagy eltérések mutatkoznak.

VIII.3.b Korrelációs mérőszámok

A következő lépés a kapcsolat szorosságának és irányának a vizsgálata a mintán belül. Ennek során arra keressük a választ, hogy a két változó milyen szoros és milyen irányú kapcsolatban áll egymással. A mintából számított (becsült) kovariancia a magyarázó és az eredményváltozó között:

n

ddyx yx∑=),cov(

A vizsgált ismérvek függetlensége esetén a kovariancia 0 értéket vesz fel. Ha az ismérvek pozitív korrelációs kapcsolatban állnak egymással, vagyis X változó átlagnál magasabb (alacsonyabb) értékéhez az Y változónak is általában átlagnál magasabb (alacsonyabb) értéke

Page 140: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

140

tartozik, a kovariancia értéke pozitív előjelű lesz. Negatív korrelációnál a kovariancia előjele is negatív, mert ilyenkor tendenciájában igaz lesz, hogy amennyiben X értéke átlag alatti, Y értéke átlag feletti, azaz az átlagtól vett eltérések szorzata általában negatív lesz. A kovariancia mérőszáma a függetlenséget is jól jelzi, nagyságát azonban a változók mértékegysége befolyásolja. Célszerű a kapcsolat erősségének a mérésére normált, 0 és 1 intervallumban elhelyezkedő mérőszámot alkalmazni. Ilyen mérőszámot kapunk, ha a kovarianciát standardizált változók alapján számítjuk. A korábbiakhoz hasonlóan állíthatjuk elő a két változó mintabeli varianciáját:

n

dsx x

x∑== ∗

22)var( és

n

dsy y

y∑== ∗

22)var(

Ezek segítségével felírható a lineáris korrelációs együttható a két változóra:

∑ ∑∑

⋅=

⋅=

22)var()var(

),cov(

yx

yx

dd

dd

yx

yxr

A mintabeli r korrelációs együttható olyan -1 és +1 között elhelyezkedő mutatószám, amelyik 1-hez közeli abszolút értékei szoros, közel lineáris függvényszerű kapcsolatot, 0 körüli értékei a lineáris kapcsolat hiányát, ún. korrelálatlanságot jelentik. A korrelációs együttható pozitív értékei egy irányban mozgó, míg a negatív értékei ellentétes irányban mozgó változókat jelentenek. A korrelációs együttható a két változó kapcsolatának mérőszáma. A következő mutató a kétváltozós regressziós modell egészének illeszkedését méri. Ennek származtatásához írjuk fel a kétváltozós lineáris modellre vonatkozó varianciafelbontást. A belső négyzetösszeg szerepét a megfigyeléseknek a regressziós egyenestől vett eltéréseiből számított négyzetösszeg veszi át, a külső négyzetösszeget pedig a regressziós egyenes pontjainak saját átlaguktól vett eltérése határozza meg. A kettő összegeként adódik a teljes négyzetösszeg. Ebben az esetben a regressziós egyenes az, ami a csoportosítást végzi: a regressziós egyenesnek a megfelelő xi pontokhoz tartozó értékei alkotják a csoportátlagokat. Ha a megfigyelések pontosan rajta vannak az egyenesen, akkor a belső négyzetösszeg 0, és a teljes négyzetösszeget kizárólag a külső tényező, azaz a regresszió magyarázza. Ha ellenben a megfigyelések jócskán eltérnek a regressziós egyenestől, akkor a belső eltérés-négyzetösszeg nagy lesz, és tekintve, hogy a teljes négyzetösszeg állandó, a külső viszonylag kevesebbet magyaráz. A külső négyzetösszeget így regressziós, vagy magyarázott négyzetösszegnek is szokták nevezni, míg a belső négyzetösszeg az, amit nem tudunk a regresszióval magyarázni, a maradék-vagy hibanégyzetösszeg.

SSRSSESST +=

Ebből képezhető a determinációs együttható, ami megmutatja, hogy a regressziós modellel az yi adatokban meglévő variancia (bizonytalanság) hány %-a szüntethető meg:

SST

SSE

SST

SSRR −== 12

Page 141: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

141

Ezt a %-os értelmezésű mutatót a modell magyarázó erejének szokás nevezni. Értékei 0 és 1 között mozoghatnak: nagy, 1-hez közeli értékei jó illeszkedést, nagy magyarázó erőt, kis, 0-hoz közeli értékei gyenge modellteljesítményt jeleznek.

VIII.3.c Intervallumbecslés

A regressziós modell feltételeinek rögzítése és a paraméterek becslőfüggvényének kidolgozása után lehetővé válik, hogy összefüggést teremtsünk a mintából becsült paraméterek és az elméleti, alapsokasági paraméterek között. Így módunkban áll a gyakorlatban egyetlen mintából következtetni az alapsokasági paraméterekre. A regressziós paraméterek pontbecslése után intervallummbecslés is adható. Intervallumbecslést szoktunk adni a paraméterekre, és gyakrabban pedig a függvényértékekre (ez utóbbiaktól mi eltekintünk). Ami a paramétereket illeti, a priori felírhatók a becsléselméletből ismert összefüggések.

1ˆ2/1111 s)2n(tˆ)(Int βα−α− ⋅−±β=β

0ˆ2/1001 s)2n(tˆ)(Int βα−α− ⋅−±β=β

A konfidencia intervallumok értelmezése teljesen analóg azzal, amit korábban megismertünk: az itt számított intervallumok 95%-os megbízhatósággal lefedik az ismeretlen sokasági paramétert (α=5% mellett). A 95%-os megbízhatóság annyit jelent, hogy ismételt mintavétel esetében az esetek 95%-a olyan intervallumot eredményez, amelyik tartalmazza az ismeretlen jellemzőt.

VIII.3.d A regressziófüggvény eredményeinek ellenőrzése: hipotézisvizsgálatok

A regressziófüggvény illesztésének logikai feltétele, hogy a vizsgált változók között korrelációs kapcsolat legyen. Korreláció fennállása esetén a függvény regressziós együtthatója 0-tól különbözik. Előfordulhat azonban, hogy a korreláció hiánya esetén sem kapunk pontosan 0 értéket. A véletlen mintából származó eredményeket ugyanis a véletlen hatások is befolyásolják. E véletlen hatások következtében a regressziós együttható értéke akkor is eltérhet 0-tól, ha a két változó között semmilyen kapcsolat nincs. Ha az elméleti regressziót analitikus függvénnyel a mintából közelítjük, felvetődik a paraméterek hipotézisellenőrzésének gondolata. Így amennyiben a regressziószámítást mintavételi keretek közt értelmezzük, lehetőségünk van arra, hogy a mintából ellenőrizzünk egy sor feltevést, amelyek a számítások eredményének értékelését segítik. Hipotézisvizsgálattal ellenőrizhető az, hogy a magyarázó változó kapcsolatban áll-e az eredményváltozóval, annak magyarázatához érdemben hozzájárul-e. A másik fontos kérdés, hogy a magyarázó változó elegendően magyarázza-e az eredményváltozót, kell-e esetleg azon gondolkozni, hogy a jelenség jobb leírása érdekében további változókat kell felkutatni és beépíteni a modellbe. E két kérdés mellett fontos azt is vizsgálni, hogy vajon a modellezésnek a maradékváltozóra tett feltételei megerősíthetők- vagy elutasítandók-e (homoszkedaszticitás, autokorreláció mentesség, normális eloszlás). Ezek azok az alapkérdések, amelyet minden regressziós modellben vizsgálni kell.

Page 142: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

142

Paraméterek szeparált tesztelése Itt arra keressük a választ, hogy a paraméterek eleget tesznek-e valamiféle előre meghatározott korlátozásnak. Általában a hipotéziseink úgy írhatók fel, hogy

)0(110 :H β=β és )0(

110 :H β≠β

ahol az általunk feltételezett paraméterérték a )0(

1β -ban jelenik meg. Ezt a próbát akkor használhatjuk, ha a regressziós függvény sokasági meredekségére van ellenőrizni kívánt feltevésünk. Azonban többször ennél egyszerűbb a kérdés: ha ugyanis azt feltételezzük, hogy

0)0(1 =β , akkor a nullhipotézis elfogadása azt jelenti, hogy a meredekségi paraméter sokasági

értéke lehet 0, ami azt jelenti, hogy X alakulása nem befolyásolja Y-t, azaz a két változó között nincs a sokasági szinten is fennálló lineáris kapcsolat. Ez egyben azt is jelenti, hogy a kétváltozós regressziós modell nem jó, az eredményváltozót érdemesebb a saját átlagával, mintsem az aktuális X-szel becsülni. E próba hipotézisei:

0:H 10 =β és 0:H 10 ≠β

A paraméterek tesztelése t-próbával történik.

1

β

β&&s

t =

A próba menete az, hogy mintából kiszámoljuk a becsült paraméterértékeket, annak standard hibáját, és amennyiben ez a hányados a kritikus t-értékeken kívüli (elutasítási) tartományba esik, a nullhipotézist elutasítjuk, azaz elfogadjuk a kapcsolat létét, és megerősítjük X-et magyarázó változó szerepében. A számított értéket adott α szignifikancia szinten és (n-2) szabadságfokhoz tartozó kritikus értékhez viszonyítjuk. Amennyiben az empirikus t-érték az elfogadási tartományba esik, akkor nincs okunk elutasítani a nullhipotézist, ez pedig azt jelenti, hogy elvetjük az X-et, mint magyarázó változót, és/vagy másik magyarázatot keresünk, vagy pedig lemondunk a regressziós magyarázatról. Elvben teljesen hasonló t-próba készíthető a másik (β0) paraméterre is, bár ennek jelentősége kisebb, mivel nem tulajdonítanak neki magyarázó erőt a modellben, mint illeszkedést javító paramétert általában megtartják akkor is, ha sokasági értéke nem különbözik szignifikánsan 0-tól. Varianciaanalízis alkalmazása a regressziószámításban A regressziós együttható tesztelése mellett magának a regressziófüggvénynek a hipotézisellenőrzése is elvégezhető. Ez varianciaanalízissel történhet. A másik kérdés, amit hipotézisvizsgálattal szeretnénk megválaszolni az az, hogy vajon a regresszió minden hatást megragad-e, és a modell által adott magyarázat elégséges-e? Lineáris modellek esetében ez a kérdés általában úgy merül fel, hogy az R2 determinációs együttható elegendően nagy-e? Mivel kétváltozós esetben a determinációs együttható a korrelációs együttható négyzetével egyenlő, a determinációs együttható tesztelése is ekvivalens lesz annak vizsgálatával, hogy a két változó között van-e szignifikánsan 0-tól különböző kapcsolat. Ez pedig azt jelenti, hogy kétváltozós lineáris modell esetében ezt a feladatot a t-próba segítségével már megoldottuk.

Page 143: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

143

Most azonban mégis bemutatunk egy másik tesztet, ami varianciaanalízisen alapul. Ennek alkalmazása kétváltozós esetben egyszerű, többváltozós esetben elválik a t-próbától és a modell jóságát, az illeszkedést vizsgálja. Elsőként írjuk fel az eredményváltozó és a magyarázó változó közötti összefüggést az i-edik megfigyelésre:

iii eyy += ˆ

iii exy +⋅+= 10ˆˆ ββ

(vagyis a megfigyelt Y érték (X=xi) = az xi-hez tartozó regressziós becslés + a maradéktag) Megállapíthatjuk, hogy maradéktag összege nulla, ez az első (korábban bemutatott) normálegyenlet átrendezése után belátható:

∑ ∑= =

=⋅−−n

i

n

iiii exy

1 110 )ˆˆ( ββ

Ebből következik, hogy:

∑ ∑ ∑= = =

=⋅+=n

i

n

i

n

iiii yxy

1 1 110 ˆ)ˆˆ( ββ

Ez azt jelenti, hogy a regressziós becslések összege és ebből következően átlaga is megegyezik az eredményváltozó tényleges értékeinek összegével és átlagával. Az induló összefüggésünk, tehát az átlagtól vett eltérések alapján is felírható:

)ˆ()ˆ()( iiii yyyyyy −+−=−

Ez fontos összefüggés számunkra, mert kifejezi, hogy az eredményváltozó yi megfigyelt értékeinek átlagtól való eltérése két komponenssel magyarázható, egyrészt a becsült regressziófüggvény szóródásával, másrészt a maradéktag ingadozásával. Az eltérések összetevőkre bontása az eltérés-négyzetösszegekre is felírható:

∑∑ ∑== =

−+−=−n

iii

n

i

n

iii yyyyyy

1

2

1 1

22 )ˆ()ˆ()(

SSESSRSST += Különleges jelentősége van a reziduális négyzetösszegnek (SSE), mivel a megfigyelt yi értékeknek a regressziófüggvény körüli szóródását fejezi ki. Ha SSE=0, ez azt jelenti, hogy a függő változó teljes varianciája megmagyarázható a magyarázó változó segítségével. Minden megfigyelt yi érték a regressziófüggvényen helyezkedik el. Egyéb tényezőknek nincs hatása az eredményváltozóra, vagyis az ismérvek közötti kapcsolat determinisztikus. Ha SSE≠0, akkor a két ismérv között sztochasztikus kapcsolat áll fenn. Minél nagyobb a reziduális négyzetösszeg értéke, annál nagyobb a becslés hibája, mert a modellben nem szereplő egyéb magyarázó változók hatása annál nagyobb szerepet játszik a függő változó szóródásában. Nullhipotézisünk szerint a regresszió nem érvényes, a (kétváltozós esetben egyetlen) X magyarázó változó nem magyarázza az eredményváltozó alakulását, azaz paraméterének sokasági értéke (lehet) 0. A varianciaanalízis terminológiája szerint ez azt jelenti, hogy a magyarázó változó szerint képzett csoportok várható értékei nem térnek el egymástól, azaz a magyarázó változó együtthatója 0. A hipotézisünk az előzőhöz hasonlóan:

0:H 10 =β és 0:H 10 ≠β

Page 144: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

144

Most azonban a vizsgálat eszköze a varianciaanalízis lesz. Kihasználva, hogy a regressziós és a maradék négyzetösszegek 2χ -eloszlásúak és függetlenek, felírható egy olyan változó, amelyik eloszlását a nullhipotézis alatt ismerjük, ezért alkalmas próbafüggvénynek:

)2n,1(F~)2n/(SSE

1/SSRF −

−=

A próba végrehajtása egyszerű, hiszen a regressziós számításokból átvesszük a mintából számított négyzetösszegeket, kiszámoljuk a fenti próbafüggvény empirikus értékét, és azt összevetjük a megfelelő szabadsági fokú és megfelelő szignifikancia szinthez tartozó táblázatbeli (kritikus) értékkel. Ha az F értékünk nagyobb, mint a kritikus érték, a nullhipotézist elutasítjuk, ellenkező esetben erre nincs elég statisztikai bizonyítékunk, tehát elfogadjuk. Az elutasítás így a modell megerősítését (jóságát) jelenti, míg az elfogadás a modell elutasítását. A varianciaanalízis elterjedt módszere a statisztikának, így kialakult egy olyan táblázata, amely segítséget nyújt egyrészt a számítások elvégzéséhez, másrészt pedig az eredmények közlését is elősegíti.

16. Táblázat: Varianciaanalízis a kétváltozós lineáris regresszióban A variancia

forrása Négyzetösszeg Szabadsági fok Átlagos

négyzetösszeg F

Regresszió SSR 1

1

SSRMSR =

MSE

MSRF =

Maradék (hibatényező)

SSE n-2

2n

SSEMSE

−=

Teljes SST n-1

1n

SSTMST

−=

A szabadságfokokról a következőket kell tudni. Az SST szabadságfoka (n-1), mert számításához először a mintából az y -t, azaz egy paramétert kell számítani. A hibatényező négyzetösszegének (SSE) szabadságfoka (n-2). Ennek az a magyarázata, hogy számításához két paraméter ( )1,0 ββ becslése szükséges. A regresszióból becsült négyzetösszeg (SSR)

szabadságfoka pedig a szabadságfokok közötti additív összefüggésből következik. Korábban az illeszkedés jóságát a determinációs együtthatóval jellemeztük, ezért most a varianciaanalízis F-próbáját is kifejezzük ezzel a mutatóval. A determinációs együttható a

regressziós és a teljes eltérés négyzetösszeg hányadosa, azaz SST

SSE

SST

SSRR −== 12 . Ebből

egyszerű átalakításokkal adódik, hogy:

2

2

2

2

1)2(

)1()2(

)2/(

1/

R

Rn

RSST

RSSTn

nSSE

SSR

MSE

MSRF

−⋅−=

−⋅⋅⋅−=

−==

Az első összefüggés azt mutatja, hogy ha az MSE (a „belső” szórásnégyzet becslése) relatíve nagy az MSR-hez (a „külső” szórásnégyzet becsléséhez) képest, a regressziófüggvény rosszul illeszkedik a ponthalmazhoz, ami a változók közötti lineáris kapcsolat hiányára utal, és így a nullhipotézis elfogadását támasztja alá. A fordított eset a magyarázó változó és az eredményváltozó lineáris kapcsolatára utal. Ekkor az X és Y közötti lineáris kapcsolat hiányát megfogalmazó nullhipotézisnek ellentmond, és így az alternatív hipotézist támasztja alá.

Page 145: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

145

A második összefüggés azt mutatja, hogy a nagyobb determinációs együtthatók (melyek jobb illeszkedést jeleznek) nagyobb F-értékeket indukálnak, ami pedig az előzőek alapján a modell helyességének a bizonyítéka. Ez az eredmény tehát teljes mértékben konzisztens azzal a logikával, miszerint a jó illeszkedés egyben a jó modell kritériuma is. Miután áttekintettük a regressziós paraméterekre vonatkozó alapteszteket, megvizsgáljuk, hogy az induló modellfeltételeket hogyan lehet a mintából, illetve a becslések alapján ellenőrizni. Ennek során megnézzük, hogy az állandó szórás feltétele (homoszkedaszticitás) fenntartható-e, azután a maradékok elsőrendű autokorrelációjának meglétét, illetve hiányát teszteljük, végül a becsléseink alapján megvizsgáljuk, hogy a maradékváltozó normális eloszlására tett feltételezés tartható-e. A heteroszkedaszticitás és tesztelése A heteroszkdaszticitás a maradékváltozónak azt a tulajdonságát jelöli, hogy szórása (varianciája) nem állandó.

x

y

x

y

44. ábra: A heterokedaszticitás

Alapmodellünket ezidáig homoszkedaszticitás feltételezésével elemeztük. Eddigi eredményeink azonban némileg változnak, ha nem feltételezzük a továbbiakban a homoszkedaszticitást, ugyanis a paraméterbecslések varianciái és standard hibái torzítottak lesznek, aminél fogva az intervallumbecslések is, a tesztek pedig félrevezető eredményeket adnak. Ezért fontos kideríteni, hogy a modellfeltétel érvényes-e, és ha nem, akkor mi a teendő. A heteroszkedaszticitás vizsgálatára sokféle teszt létezik. Nincs egyetlen, általános érvényű próba, mindegyiknek van olyan kedvező tulajdonsága, ami miatt célszerű alkalmazni. Az alkalmazásuk során mérlegelni kell a heteroszkedaszticitás jellegét, és ennek figyelembevételével, lehetőleg több próba egyértelmű eredménye alapján kell a döntést meghozni. A továbbiakban mi a legegyszerűbb esetet, a jól elkülöníthető két csoportra vonatkozó heteroszkedaszticitást (a maradékoknak két jól elkülöníthető csoportja van, ahol a csoporton belül homoszkedaszticitás érvényes, pl. idősoros regresszió esetén), és annak is csak egy próbáját, a Goldfeld-Quandt tesztet vizsgáljuk meg. E próba alapötlete az, hogy a megfigyeléseket valamely változó szerint sorba rendezve a nagy, illetve a kis változóértékekhez tartozó maradékváltozók varianciái homoszkedasztikus esetben megegyeznek, heteroszkedasztikus esetben pedig eltérők. A próba két fontos pontja, hogy tudjuk, vagy sejtjük, hogy mi lehet az a dimenzió, amelynek mentén a

Page 146: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

146

heteroszkedaszticitás kialakul, másrészt pedig az, hogy mindössze két csoport megfigyeléseiből próbálunk következtetni az egyező, illetve eltérő varianciákra. Hipotézispárunk:

222

210 :H σ=σ=σ és 2

2211 :H σ≠σ

A tesztelést úgy végezzük el, hogy a kis X-ekhez tartozó eredményváltozó értékekből kialakítunk n1 megfigyelést, míg a nagy értékeihez tartozó elemekből egy n2 megfigyelést tartalmazó csoportot (célszerű közel egyenlő nagyságú csoportokat kialakítani), és mindkét megfigyelési halmazra ugyanazt a regressziós modellt illesztjük. A regressziós becslések (legkisebb négyzetes) maradékait e1-gyel és e2-vel jelöljük, a két

változó: 21

21e

σ∑ és

22

22e

σ∑ (n1-1, illetve n2-1 szabadságfokú χ2 eloszlást követve). Kihasználva,

hogy a nullhipotézis alatt a két variancia megegyezik, így a közös σ2 a törtből kiesik, a kapott (a két változó szabadságfokkal normált) hányadosa

)2n,2n(F~)2n(e

)2n(e21

122

221 −−

−−

∑∑

alakú lesz, a döntési szabály pedig egyszerű: ha a két regresszióból számított hányados a megfelelő szabadságfokú F-eloszlás α/2 és 1- α/2 rendű kvantilisein kívül esik, akkor elutasítjuk a varianciák egyezésére vonatkozó nullhipotézist, ellenkező esetben pedig a minta alapján nincs okunk elutasítani azt. Bár van a próbának néhány hiányossága és nehézsége, általánosan használható és kis minták esetében is egzakt eredményt ad. Az autokorreláció és tesztelése Autokorreláció alatt egy változónak a saját maga időben vagy térben különböző értékeivel vett korrelációját értjük. Egy szokásos lineáris korrelációról van szó, csak éppen nem különböző, hanem azonos változók máskor vagy máshol megfigyelt értékei között. Ráadásul elsőrendű autokorrelációt vizsgálunk, és magasabb rendű autokorrelációkkal nem is foglalkozunk (ez általában igaz a társadalmi és gazdasági jelenségekre). Leggyakoribb előfordulása az idősorokban figyelhető meg, ahol egy változó saját késleltetett értékeivel vett összefüggéseket méri. Az időbeli autokorreláció hiánya azt jelenti, hogy a vizsgált változó időbeli alakulása nem magyarázható saját korábbi értékeivel. A regressziós elemzés alapmodelljében a maradékváltozó autokorrelációját vizsgáljuk, hiszen kiinduló modellfeltételünk szerint a maradékváltozó nem tartalmaz autokorrelációt. Ennek a feltételnek az az értelme, hogy a maradéknak véletlenszerűnek kell lennie, nem szabad tartalmaznia szabályszerűséget, hiszen a szabályszerűséget a magyarázó változóknak kell megtestesíteniük. Ha ez nem igaz, akkor a paraméterekre vonatkozó pontbecsléseink nem lesznek minimális varianciájúak, a varianciabecslés torzított lesz, az intervallumbecslések és a tesztek torzítottá válnak. Az autokorreláció tesztelésére a legelterjedtebb próbát, a Durbin-Watson tesztet mutatjuk be, amely az elsőrendű korreláció tesztelésére alkalmas. A próba csak olyan esetekben használható, amikor a megfigyelések sorrendje kötött, pl. idősoros problémáknál. Ezekben az esetekben a sorrendiséget hangsúlyozandó a megfigyelések i indexét t-re cseréljük, így a t-edik megfigyeléshez tartozó egyenlet:

tt10t xy ε+β+β=

A maradékváltozó elsőrendű autokorrelációjának feltárására tekintsük az alábbi próbát:

ttt η+ε⋅ρ=ε

Page 147: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

147

Ez utóbbi egyenletben azt feltételezzük, hogy a maradékváltozó t-edik időpontbeli értéke (tε )

a lineáris regressziós egyenletben saját késleltetett értéke és egy jó tulajdonságú (0 várható értékű, homoszkedasztikus, autokorrelálatlan, normális eloszlású) véletlen változó (tη )

segítségével írható le. Jól látható, hogy ha a ρ elsőrendű autokorrelációs együttható 0, akkor a nevezett jó tulajdonságok ε-t is jellemzik, így az induló regressziós modell feltételei teljesülnek. Ha azonban ρ≠0, akkor az elsőrendű autokorrelációval és következményeivel számolnunk kell. Hipotéziseink:

0:H0 =ρ és 0:H1 ≠ρ

A próbafüggvénnyel nem közvetlenül a ρ-t, hanem annak egy transzformáltját teszteljük. A regressziós maradékokból definiáljuk a D-W próbafüggvényt:

=

=−−

=n

1t

2t

n

2t

21tt

e

)ee(d

Ennek eloszlása a d=2 pontra szimmetrikus, és a [0,4] intervallumban vehet fel értékeket. Az eloszlás általánosságban (x konkrét ismerete) nélkül nem adható meg, de alsó és felső közelítő értékei táblázatosan megadhatók. Ezáltal egy sávos teszt képezhető, amelynek alsó és felső kritikus értékei minden változószám és szignifikancia-szint mellett kitáblázhatók. A próba döntési szabálya bonyolultabb:

• ha a próbafüggvény (d) empirikus értéke a Ld0− tartományba esik, a döntés az, hogy a maradékváltozó szignifikáns mértékű pozitív autokorrelációt tartalmaz

• ha a próbafüggvény (d) empirikus értéke a UL dd − tartományba esik, a próba alapján

nem tudunk dönteni, ezt a tartományt semleges zónának nevezzük. Itt vagy a szignifikancia szinten változtatunk úgy, hogy döntési helyzetbe kerüljünk, vagy más próbafüggvényhez fordulunk.

• ha a próbafüggvény (d) empirikus értéke a )d4(d UU −− tartományba esik, a

nullhipotézist, azaz a maradékváltozónak elsőrendű autokorrelációtól való mentességét nem tudjuk elutasítani (ennek a tartománynak a közepe 2).

• ha a próbafüggvény (d) empirikus értéke a )d4()d4( LU −−− tartományba esik, ismét

semleges zónában vagyunk, nem tudunk dönteni. • ha a próbafüggvény (d) empirikus értéke a 4)d4( L −− tartományba esik, akkor

döntésünk szignifikáns negatív autokorreláció.

Page 148: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

148

H1: pozitív autokorreláció

0 42

? ?

H0: nincs autokorreláció

H1: negatív autokorreláció

dL dU 4-dL 4-dU

H1: pozitív autokorreláció

0 42

? ?

H0: nincs autokorreláció

H1: negatív autokorreláció

dL dU 4-dL 4-dU0 42

? ?

H0: nincs autokorreláció

H1: negatív autokorreláció

dL dU 4-dL 4-dU 45. ábra: A Durbin-Watson teszt döntési szabálya

Az autokorreláció jelenléte a maradékokban súlyos következményekkel bír, ezért ha ezt tapasztaljuk, védekeznünk kell ellene. A védekezés egyik módja, hogy módosítjuk a modellünket, és olyan változókat építünk be magyarázó változók gyanánt, amelyek „átveszik” az autokorrelációt, és nem hagyják azt a véletlen elemekben érvényesülni. Egy másik megoldás olyan adattranszformáció alkalmazása, amely kiszűri a hibát, és a maradékváltozót az eredeti feltételeknek megfelelően alakítja át. A normalitás tesztelése A modellfeltételek közül utolsónak a maradékváltozó normalitását vizsgáljuk. Amennyiben a normalitás nem áll fenn, mind az intervallumbecslések, mind a paraméterekre vonatkozó tesztek félrevezetők lesznek. A normalitás ellenőrzésére sokféle eljárás létezik. Erre alkalmas az általános illeszkedésvizsgálati próba is elegendő számú megfigyelés mellett. Előfordul azonban, hogy a gyakorlati regressziószámítási feladatok kisebbek annál, mintsem hogy elegendő számú cellát készítsünk, és minden cellában elegendő számú elemet tudjunk elhelyezni. Ezért sok más normalitásvizsgálati eszközt is kifejlesztettek, részben olyanokat, amelyek a kis mintákra is jó közelítő tulajdonságokkal rendelkeznek. Ezek közül most a grafikus normalitásvizsgálatot mutatjuk be, amely valójában vizuális eszköz egyes hipotézisek vizsgálatára. Ennélfogva a döntési szabály sem egyértelmű, ránézésre kell eldöntenünk, hogy az empirikus megfigyeléseinkből származó pontfelhő alakja megfelel-e valamiféle, az elmélet által sugallt alakzatnak. Az illeszkedésvizsgálatra szolgáló, leggyakrabban alkalmazott Q-Q tesztet mutatjuk be. Legyen Y valószínűségi változó, mely a nullhipotézis szerint F(y) eloszlásfüggvénnyel jellemezhető. A minta alapján az Fn(y) empirikus eloszlásfüggvény adódik, és azt kívánjuk vizsgálni, hogy az elméleti és az empirikus eloszlásfüggvények elég közel állnak-e egymáshoz. Vagyis eltérésük betudható-e a mintavételi ingadozásnak, avagy azt meghaladó szignifikáns mértékű. Amennyiben a két eloszlásfüggvény megegyezik (és F invertálható), akkor yyFFz n == − ))((1 , ahol z a kétszeresen transzformált megfigyelési

értékeket jelöli. Ha nullhipotézisünk igaz, akkor az oda-vissza transzformált megfigyelések és az eredeti megfigyelések pontpárjai éppen 45 fokos egyenesen, illetve akörül helyezkednek el. Ha tehát az ábra olyan, hogy a megfigyelések nagyobb

Page 149: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

149

szisztematikus eltérés nélkül szóródnak a megfelelő egyenes körül, a nullhipotézis elfogadható. Nullhipotézisünk az, hogy változónk Y~ ),( σµN eloszlású. Ekkor a szokásos

standardizálási lépés után a σ

µ−= Yz változó már standard normális eloszlást követ.

A próba gyakorlati végrehajtását illetően az egyetlen problémát az empirikus eloszlásfüggvény jelenti. Tekintsük az n21 y,...,y,y mintát és rendezzük nagyság szerint növekvő sorrendbe:

n/nn/2n/1 y...yy ≤≤≤

Az empirikus eloszlásfüggvény a következő lesz: 0)yY(P n/1 =<

n

1)yY(P n/2 =<

M

n

1j)yY(P n/j

−=<

M

n

1n)yY(P n/n

−=<

Az így kapott empirikus eloszlásfüggvény könnyen értelmezhető és számítható, ugyanakkor az eloszlás két végpontján nem tesz eleget az eloszlásfüggvénnyel szemben támasztott követelményeknek, ezért főleg kis minták esetében korrekcióra van szükség.

Egyes szerzők az 25,0n

375,0j)y(Fn +

−= empirikus eloszlásfüggvényt használják, míg mások

az egyszerűbb n

5,0j)y(Fn

−= eloszlásfüggvényt ajánlják. Mindkettő alkalmas arra, hogy

az eloszlásfüggvény két végét jobban igazítsa a megfelelő elméleti értékekhez. Ha az empirikus eloszlásfüggvény kész, akkor előállítjuk a z-értékeket az előbbi módon meghatározott empirikus eloszlásfüggvényre alkalmazott inverz transzformáció segítségével, majd az így kapott z-ket és a nekik megfelelő y-okat ábrázoljuk egy koordináta rendszerben. Ha az y változót standardizáltuk, akkor normális eloszlás feltételezése mellett egy origón átmenő, egységnyi meredekségű egyenes körül kell a pontoknak szóródniuk:

[ ] yyz =ΦΦ= − )(1 A próba inkább intuíción, mint egzakt döntésen alapul, de egy jó ábra a döntés hasznos eszköze lehet.

VIII.4 Példa korreláció- és regressziószámításra

Egy nagy forgalmat bonyolító használtgépkocsi-telepen különböző futásteljesítményű Suzuki típusú gépkocsik eladási árát figyelték meg, és ez alapján kerestek kapcsolatot a futásteljesítmény (X, ezer km) és az ár (Y, ezer Ft) között. Egy 12 elemű megfigyelés-sorozatban a futásteljesítmények előre rögzített értékeihez jegyezték fel a megfelelő eladási árakat.

Page 150: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

150

Megfigyelés sorszáma

x y

1 10 1500 2 20 1450 3 30 1480 4 40 1200 5 50 1100 6 60 1160 7 70 1200 8 80 950 9 90 800 10 100 770 11 110 830 12 120 760 Összes 780 13200

Vizsgálja meg, hogy leírható-e a kapcsolat lineáris regressziós modellel, jellemezze a kapcsolat szorosságát, tesztelje a modellt!

A futásteljesítmény és az eladási ár kapcsolata

0

200

400

600

800

1000

1200

1400

1600

0 20 40 60 80 100 120 140

ezer km

ezer

Ft

A futásteljesítmény és az eladási ár kapcsolata

0

200

400

600

800

1000

1200

1400

1600

0 20 40 60 80 100 120 140

ezer km

ezer

Ft

Az ábra alapján a linearitás feltételezése jogosnak tűnik. A magyarázó változó értékeit előre rögzítve választottuk meg, a többi modellfeltétel ellen egyelőre nincsenek érveink, ezért azokat átmenetileg feltételesen elfogadjuk. A paraméterek becslése az alábbiak szerint adódik. Mivel 65x = és 1100y = , így

378,714300

105500ˆ1 −=−=β és 5,157965378,71100ˆ

0 =⋅+=β

A regressziós egyenes egyenlete: x378,75,1579y ⋅−=

A paraméterek közül a meredekségi paraméter jelentése az, hogy ezer futott km-enként átlagosan 7,379 ezer Ft-tal csökken az eladási ár. A tengelymetszet-paraméter jelentése az, hogy modellünk szerint a 0 km-es (de használt) gépkocsik ára 1,5795 millió Ft. E paraméter

Page 151: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

151

kapcsán fontos kiemelni, hogy nem lehet neki minden esetben tárgyi jelentést tulajdonítani. Ebben a példában az x=0 pont közel esik a megfigyelési tartományhoz, így a tengelymetszet jól értelmezhető: a kocsi ára, amint elhagyta a telepet, azaz már nem új, 21 ezer Ft-tal csökken. Rugalmasság: a rugalmassági függvény a becsült regressziós egyenes alapján:

x378,75,1579

x378,7)x,y(El

−−=

Ez minden x esetében más és más értéket ad. Ha rögzítjük az x értékét valamilyen szinten (pl. átlagpontban), akkor az elaszticitás egy konkrét értékét kapjuk eredményként:

4360,065378,75,1579

65378,7)xx,y(El −=

⋅−⋅−==

Ez azt jelenti, hogy ha az átlagos futásteljesítményt jelentő 65 ezer km-es szintről kiindulva 1%-kal növeljük a futásteljesítményt, az eladási ár átlagosan 0,436%-kal csökken. Más pontokból kiindulva más rugalmassági értékeket kapunk. Az elemzés következő lépése, hogy kiszámítjuk a regressziós egyenes pontjainak értékét, majd a megfigyelt és a becsült értékek különbözeteként a reziduumokat.

x y e10 1500 -55 400 3025 160000 -22000 1506 -620 1450 -45 350 2025 122500 -15750 1432 1830 1480 -35 380 1225 144400 -13300 1358 12240 1200 -25 100 625 10000 -2500 1284 -8450 1100 -15 0 225 0 0 1211 -11160 1160 -5 60 25 3600 -300 1137 2370 1200 5 100 25 10000 500 1063 13780 950 15 -150 225 22500 -2250 989 -3990 800 25 -300 625 90000 -7500 915 -115

100 770 35 -330 1225 108900 -11550 842 -72110 830 45 -270 2025 72900 -12150 768 62120 760 55 -340 3025 115600 -18700 694 66780 13200 0 0 14300 860400 -105500 1

xd yd 2xd 2

yd ydd x ⋅ y

Az első sorban, az y oszlopban megjelenő 1506 ezer Ft azt jelenti, hogy modellünk szerint a 10 ezer km-t futott kocsik átlagosan ilyen áron kelnek el. A maradék oszlopában 1500-1506=-6 ezer Ft áll, ami azt jelenti, hogy a megfigyelésünkben szereplő gépkocsi az átlagos, modellből következő árnál 6 ezer Ft-tal olcsóbban kelt el, ami feltehetően egyebek közt az átlagosnál rosszabb műszaki állapotának tudható be. A reziduumok oszlopának algebrai összege 0, ami azt jelenti, hogy az egyenestől vett eltérések kioltják egymást. Amennyiben a regressziós egyenessel a megfigyelési intervallumon kívülre is szeretnénk következtetni, extrapolációt végzünk. Ha pl. azt vizsgáljuk, hogy várhatóan milyen áron kelnek el a 130 ezer km-t futott kocsik, akkor x=130-at behelyettesítve a regressziós egyenletbe:

36,620130378,75,1579y =⋅−= Tehát 130 ezer km futás után kb. 620 ezer Ft eladási árra lehet számítani.

Page 152: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

152

Emlékeznünk kell arra, hogy ezek a számítások mind azzal a feltétellel készültek, hogy az eladási árat csak a futásteljesítménnyel magyarázzuk. Az árnak emellett természetesen egy sor egyéb összetevője lehet (pl. a kocsi életkora, baleseteinek száma, milyen célokra használták stb.). Ezek persze lényeges tényezők, de a mostani példánkban rejtve maradnak és csupán a maradékváltozóban jelennek meg, mint az egyéb tényezők összetett hatása. A lineáris korrelációs együttható:

9511,086040014300

105500r −=

⋅−=

Az eredmény azt mutatja, hogy a vizsgált két változó között meglehetősen szoros, negatív irányú kapcsolat tapasztalható. A korrelációs együttható értéke közel áll a -1-hez, ami arra utal, hogy a regressziós egyenes jól illeszkedik a megfigyelési pontokhoz. A teljes négyzetösszeg SST nem más, mint ∑ = 860400d2

y . Ez bontható a regresszió által

magyarázott (SSR) és nem magyarázott (SSE) négyzetösszegekre.

77841914300)378,7(SSR 2 =⋅−= és ∑ == 4287452ieSSE

Látható, hogy a teljes négyzetösszeg nagy hányadát teszi ki a magyarázott négyzetösszeg.

9047,0860400

778419

SST

SSRR2 ===

Ez úgy értelmezhető, hogy az eladási árban tapasztalt eltérések 90%-át magyarázni tudjuk a kocsik futásteljesítményével. A modell magyarázó ereje 90,5%-os, ami jónak mondható. Így ez az illeszkedés jóságát leíró mutató azt sugallja, hogy modellünk jó, következtetések levonására alkalmas. Intervallumbecslés: A regressziós becslés során elkövetett hiba:

6,90212

82097

2n

SSEse =

−=

−=∗

Ez önmagában azt jelenti, hogy az egyes gépkocsik ára átlagosan mintegy 90 ezer Ft-tal tér el attól, amit a regressziós modellel becsülni tudnánk. A paraméterek standard hibája:

757,058,119

6,90s

1ˆ ==β és 75,55

143004225

121

6,90s0

ˆ =+⋅=β

Ezek tehát a paraméterek mintavételi szóródását kifejező mutatók. Ha megbízhatóságot 95%-os szinten rögzítjük, akkor 23,2)10(t 975,0 = , a keresett konfidencia

intervallumok: 688,1378,7757,023,2378,7)(Int 195,0 ±−=⋅±−=β

3,1245,157975,5523,25,1579)(Int 095,0 ±=⋅±=β

A paraméterek szeparált tesztelése továbbra is 5%-os szignifikancia szint mellett: A meredekségi paraméter tesztelése:

0:H 10 =β és 0:H 10 ≠β

Page 153: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

153

74,9757,0

378,7t sz1 −=−=

A tengelyparaméter tesztelése: 0:H 00 =β és 0:H 00 ≠β

73,2875,55

5,1579t sz0 ==

Ezeket az értékeket a 12-2=10 szabadsági fokú t-eloszlás megfelelő rendű kvantiliseivel kell összehasonlítani. Kétoldali próbáról van szó, így a )10(t 975,0 értéket táblázatból kell kikeresni.

A kritikus tartomány határai +2,23 és -2,23. Tekintve, hogy mindkét empirikus t-értékünk ennél abszolút értékben nagyobb, így ezen a szignifikancia szinten mindkét nullhipotézist elutasítjuk. A 1β esetében ez azt jelenti, hogy van számottevő, lényegi modellezhető kapcsolat a futásteljesítmény és az eladási ár között, tehát a futásteljesítmény, mint magyarázó változó releváns ebben a kapcsolatban. Varianciaanalízis: A nullhipotézisünk ezúttal is:

0:H 10 =β és 0:H 10 ≠β

A korábbi számításokból ismertek a négyzetösszegek értékei, így a varianciaanalízis táblája felírható: A variancia forrása

Négyzetösszeg Szabadságfok Átlagos négyzetösszeg

F

Regresszió 778419 1

1

778419MSR = 81,94

7,8209

778419F ==

Maradék 82097 10

10

82097MSE =

Teljes 860516 11

11

860516MST =

A táblázatból kiszámított empirikus F-értéket 5%-os szignifikancia szint esetén

96,4)10(F 95,0 = értékkel kell összehasonlítani. Mivel az empirikus próbafüggvény értéke

jóval meghaladja az elméletit, döntésünk a nullhipotézis igen határozott elutasítása, azaz statisztikailag nem támasztható alá az, hogy a különböző futásteljesítményű kocsik ára közt ne lenne szignifikáns különbség. Heteroszkedaszticitás tesztelése: A Suzuki árának és futásteljesítményének vizsgálatát bemutató regressziós modellben ellenőrizzük, hogy a maradékok alapján lehet-e heteroszkedaszticitást feltételezni a sokasági maradékváltozóban. Csak egy felosztást próbálunk ki: 6nn 21 ==

222

210 :H σ=σ=σ és 2

2211 :H σ≠σ

∑ =+++++= 351502311184122186e 2222222i

∑ =+++++= 4713066627211639137e 22222222

Page 154: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

154

746,047130

35150F ==

Ezt a számított értéket a (4,4) szabadságfokú F-eloszlás megfelelő kvantilis értékeivel kell egybevetni. 5%-os szignifikancia szinten:

=)4,4(F 975,0 és =)4,4(F 025,0

Így ezen a szignifikancia szinten nem tudjuk elutasítani a H0 hipotézist, azaz a homoszkedaszticitás kiinduló feltétele statisztikailag nem cáfolható. A normalitás tesztelése: A változó, amelyik normalitását tesztelni kívánjuk, az alábbi táblázatban megjelenő regressziós reziduum (e), ám az egyszerűség kedvéért értékeit saját szórásával osztottuk (standardizáltuk). Az így kapott standardizált reziduumokat (e~ ) nagyság szerint rendezzük (3. oszlop). A 4. oszlopba a kiigazított empirikus eloszlásfüggvény értékei kerültek, végül ezeket a standard normális eloszlás táblázatából visszakeresve kaptuk meg az 5. oszlop z értékeit.

sorszám reziduumok

Rendezett és standardizált reziduumok

Empirikus eloszlásfüggvény

Normális eloszlás esetén várt reziduumok

1 -116 -1,343 0,042 -1,73

2 -111 -1,285 0,125 -1,15

3 -84 -0,972 0,208 -0,81

4 -72 -0,833 0,292 -0,55

5 -39 -0,451 0,375 -0,32

6 -6 -0,069 0,458 -0,11

7 18 0,208 0,542 0,11

8 23 0,266 0,625 0,32

9 62 0,718 0,708 0,55

10 66 0,764 0,792 0,81

11 122 1,412 0,875 1,15

12 137 1,586 0,958 1,73

Page 155: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

155

A diagram vízszintes tengelyén a valódi (e~ ) értékeket, a függőleges tengelyen pedig a hozzájuk tartozó, normális eloszlás esetére feltételezett (z) értékeket tüntetjük fel. Mint látható, az ábra egy, a 45 fokos egyenes mentén véletlenül szóródó pontfelhőt rajzol ki, azaz az ábra megerősíti a normális eloszlásra vonatkozó feltételezéseinket.

A Q-Q diagram vázlatos képe

-2

-1,5

-1

-0,5

0

0,5

1

1,5

2

-2 -1 -1 0 1 1 2 2

rendezett és standardizált reziduumok

norm

ális

elo

szlá

s es

etén

vár

t rez

iduu

mok

Page 156: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

156

IX. Döntéselmélet54

54 A fejezet Kindler J.: A döntések logikája, Nehézipari Minisztérium, Továbbképzó Központ, Esztergom-Kenyérmező, 1974 valamint Szentpéteri Szabolcsné: Gazdasági döntések bizonytalanság esetén, Közgazdasági és Jogi Könyvkiadó, Budapest, 1980 felhasználásával készült.

Page 157: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

157

IX.1 Bevezetés

Alapvető menedzsment feladat a döntéshozatal. Bár Murphy törvényéből (Bloch, 1985) tudjuk, hogy egy jó menedzser tökéletes adathiányban is elboldogul, a gyakorlatban racionális döntéshozatalra törekedve igyekszünk megtalálni a legjobb megoldást. Ehhez különböző matematikai modelleket alkalmazunk. (Kalló, 2012) E fejezetben olyan típusú döntési problémákkal foglalkozunk, amelyeket a következőképpen írhatunk körül. Kitűzünk egy bizonyos célt, amelyet adott körülmények között el kell érnünk. A cél elérése érdekében kettő vagy több cselekvési lehetőség közül választhatunk. Tekintettel arra, hogy az általunk választható cselekvések eredményeiről vagy következményeiről nincsenek pontos ismereteink, kétségeink vannak, hogy vajon melyik cselekvési lehetőség vezet a kitűzött célhoz, tehát bizonytalanságban vagyunk. A bizonytalanság foka csökkenthető valamilyen információ megszerzésével, de ez az információ rendszerint pénzbe kerül. A fejezet elsődleges célja, hogy megismertessük a döntési problémák modern, kvantitatív megközelítésének alapvető módszereit. Először megvizsgáljuk, hogy milyen döntési körülmények között lehet dönteni. Ezek a körülmények, illetve feltételek: bizonyosság, kockázat, bizonytalanság és a konfliktus. A körülmények tisztázása után bemutatunk néhány kritériumot, amelyek segítségével közelebb kerülhetünk a döntési probléma megoldásához. A döntési körülmények tisztázása, valamint a megfelelő döntési kritérium megválasztása alapvető szerepet játszik abban, hogy a döntési problémák megoldásának különböző módszerei közül megtaláljuk a legalkalmasabbat.

IX.2 Esetpélda

Tekintsük az alábbi esetet: a Réz Megyei Fürdőigazgatóság (RÉF) egy újonnan felfedezett hőforrás környékén megvehetne 10 ha területet. E terület vételára 14 mFt. A RÉF szakértője, Dr. Vizy a következő pénzügyi évet vizsgálva úgy látja, hogy a 14 mFt befektetésére nincs más, különlegesen jó lehetőség. Ha nem veszik meg a telket, akkor bankba teszik a pénzt, mégpedig a Réz Megyei Bankba (RMB). Dr. Vizynek, mint döntéshozónak a telekvásárlási problémában két cselekvési lehetősége van:

1. a RÉF megveszi 14 mFt-ért a 10 ha területet; 2. betétbe teszi a 14 mFt-ot a bankban.

Réz megye tanácsának határozatától függ, hogy építenek-e utat a hőforrás felé, vagy sem. Dr. Vizy szerint a telkek értéke már az első évben 10%-ot emelkedik, ha az út a hőforrás felé épül, viszont 1%-kal csökken, ha a tanácsi határozat szerint másfelé lesz útépítés. Az RMB különleges bank, neki magának is érdeke fűződik a hőforrás felé vezető úthoz, mivel óriási területeket bérel a hőforrás környékén. Így az RMB-nél elhelyezett betétek különbözőképpen kamatoznak: az RMB 5,5% kamatot fizet évente, ha az új út a hőforrás felé vezet, és a szokásos 5%-ot fizeti, ha az út nem a hőforrás felé vezet. Dr. Vizy számára még egy egyszerű bankbetét esetén sem mindegy, hogy a lehetséges események közül melyik következik be. Bármelyik cselekvési lehetőségének pénzügyi következménye a két lehetséges tényállapot bekövetkezésétől függ, ahol:

1. az új út a hőforrás felé vezet; 2. az új út nem a hőforrás felé vezet.

Milyen döntést hozna Dr. Vizy, ha

Page 158: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

158

a.) nincs információja? b.) tökéletes információval rendelkezik? c.) közvéleménykutatók jelentésére támaszkodik?

IX.3 A döntési alapmodell

Egy döntési probléma tisztázása annak felismerésével kezdődik, hogy bizonyos cél elérése érdekében két vagy több cselekvési lehetőségünk van (erre már utaltunk a bevezetésben). Ilyen esetekben a döntéshozó személy vagy csoport szeretné a legkedvezőbb cselekvési lehetőséget kiválasztani valamilyen előre meghatározott kritérium alapján. Nézzük a kapcsolódó alapfogalmakat! Döntéshozatal: A döntéshozatal alapvető folyamat. Valamennyi emberi tevékenységgel egybefonódik, valamennyi emberi tevékenység döntési helyzetek elemzésével tanulmányozható. Néhány szilárd elvre támaszkodva feltárhatjuk azoknak a kritikus döntési elemeknek a halmazát, amelyek minden döntési problémában újra és újra megjelennek. Döntési helyzetnek nevezzük az olyan helyzeteket, amelyekben az egyén vagy csoport, azaz a döntést hozó legalább két cselekvési változat (cselekvési mód) közötti választás problémájával áll szemben. A döntés: választás legalább két cselekvési változat között. A döntési helyzet elemzésének különféle közelítései egy bizonyos modell felé mutatnak, amelyet döntési alapmodellnek nevezünk. A döntési alapmodell elemei viszonylag könnyen feltárhatók. Döntéshozó A döntési helyzet első eleme, a döntést hozó. Döntéshozónak nevezzük azt a személyt (vagy csoportot), aki a cselekvési változatok közül választ egyet. A döntéshozó választását, azaz döntését, az motiválja, hogy vannak céljai (de legalább egy célja), amelyeket – vagy amelyet – el akar érni. A cél elérésére több cselekvési változat közül választhat. Ha csak egyetlen cselekvési változatot tekint, akkor nem beszélünk döntésről, mert meghatározásunk értelmében a döntés választást jelent, márpedig választáshoz legalább két cselekvési változat kell. Cselekvési változatok, stratégiák: si (i=1, 2, … n) Egy cselekvési változat (cselekvési mód) a döntéshozó rendelkezésére álló erőforrások bizonyos formában való felhasználását jelenti. Más fogalmazásban, egy cselekvési változat a döntéshozó hatáskörébe tartozó szabályozható változók bizonyos módon való együttese. A lehetséges cselekvések összességét a döntési problémában cselekménytérnek nevezzük. A cselekvési változatoknak különböző következményeik vannak. Ha a cselekvési változatok következményei között nincs különbség, akkor döntési problémáról sem beszélhetünk, hiszen mindegyik azonos (vagy azonosnak tekintett) következménnyel jár. A következményeket másképpen a cselekvési változatok eredményeinek is nevezik. A több cselekvési változat önmagában is problémát jelent, és a választást még bonyolultabbá teszi az a tény, hogy a döntési problémák nagy részében a döntéshozó nem tudja pontosan megmondani, hogy cselekvései milyen következményekkel járnak.

Page 159: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

159

A cselekvési változatok azonban az esetek többségében nem határozzák meg egyértelműen következményeiket. Egy-egy cselekvési változat következménye nemcsak magától a cselekvéstől függ, hanem más tényezőktől, eseményektől is, vagyis a következményekre hatással vannak a döntéshozó által nem, vagy csak részlegesen szabályozható külső körülmények. Ezeket a külső körülményeket tényállapotoknak nevezzük. Tényállapotok: tj (j=1, 2, …, m) A tényállapotok olyan eseményeknek tekinthetők, amelyek nem a cselekvési változat tényezőinek hatására következnek be, de a cselekvési változat következményére hatással vannak. Egy tényállapotot (eseményt) a döntéshozó által nem (vagy csak részlegesen) szabályozható változók együttesének tekintünk. Ilyenek pl. egy piaci problémánál a keresleti viszonyok, de lehet természeti jelenség is pl. időjárással, földrengéssel kapcsolatos döntési problémáknál. Következmények, eredmények: oij (i=1, 2, … n; j=1, 2, …, m) A cselekvési változatok és tényállapotok együttesen határozzák meg a cselekvési változat következményét (eredményét). Egy következmény egy cselekvési változat és egy tényállapot együttes hatásának eredménye. Tényállapotok valószínűségei: p(ti) A külső körülmények, tényállapotok (események) jelenlétének vagy későbbi bekövetkezésének megállapítása vagy előrejelzése nem könnyű feladat. Rendszerint nem is tudjuk biztosan megmondani, hogy milyen tényállapot (esemény) van jelen, illetve milyen következik be később. Megállapításaink csak bizonyos valószínűséggel érvényesek. A cselekvési változatok és tényállapotok együttesen határozzák meg a következményeket és ezért a tényállapotok valószínűségei egyúttal a következmények valószínűségei is abban az esetben, ha a tényállapotok és cselekvési változatok egymástól függetlenek. A tényállapotok valószínűségeire vonatkozó megállapítások a döntési probléma fontos elemei. Döntési kritériumok: A fentiekben azonosított döntési tényezőkön kívül igen lényeges tényező még a döntési kritérium , amely alapján a lehetséges cselekvési változatok közül kiválasztjuk a megfelelőt. A döntési kritérium olyan előírás, amely megmondja, hogyan használjuk fel az előbbi információkat egyetlen cselekvési változat kiválasztására. A döntéshozó számára a bizonytalanság abból adódik, hogy nem ismeri teljesen a valóságos helyzetet, illetve a valóságnak azt a részét, amelyet nem befolyásolhat. Valójában mégis ezek az ellenőrizhetetlen tényezők alakítják a következményeket. Attól függően, hogy a döntéshozó rendelkezésére álló információk mennyire írják körül a lehetséges eseményeket, a döntés körülményeit a következő kategóriákba sorolhatjuk:

1. bizonytalanság; 2. kockázat; 3. bizonyosság; 4. konfliktus.

IX.4 A döntési mátrix

A döntés lényeges elemeinek ismertetése után rendezett formában feltárhatjuk a döntés statikus szerkezetét. A szerkezetet a döntéselemzésben használt két formával jellemzik: a

Page 160: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

160

döntési mátrix-szal és a döntési fával. A mátrix fogalma itt a legáltalánosabban értelmezendő: sorokból és oszlopokból álló táblázat. A sorokban a cselekvési változatok, az oszlopokban pedig a tényállapotok szerepelnek. Így a döntési mátrix szemléletesen kifejezi, hogy a cselekvési változatok és tényállapotok együttesen határozzák meg a következményeket. A döntési mátrix elemei – a következmények – szöveges leírások is lehetnek.

Döntési mátrix:

t1 t2 … … tm

s1 o11 o12 … … o1m

s2 o21 o22 … … o2m

: : : :

: : : :

sn on1 on2 … … onm

46. ábra

A legegyszerűbb döntési probléma két cselekvési változatot és két tényállapotot tartalmaz, ez együttesen négy következményt jelent.

Cselekvési lehetőségek

Tényállapotok t1 t2

feltételes következmények s1 1400 -140 s2 770 700

47. ábra

s1= a RÉF megveszi 14 mFt-ért a 10 ha területet s2 = a RÉF betétbe teszi a 14 mFt-ot a bankban t1 = az új út a hőforrás felé vezet t2 = az új út nem a hőforrás felé vezet Dr. Vizy lehetséges cselekvéseinek tehát négyféle következménye lehet:

1400000104,110,01014 6611 =⋅=⋅⋅=O

1400001014,001,01014 6612 −=⋅−=⋅⋅−=O

7700001077,0055,01014 6621 =⋅=⋅⋅=O

700000107,005,01014 6622 =⋅=⋅⋅=O

IX.5 A döntési folyamat logikája

A döntés szerkezetének feltárásával a döntéshozó látja a cselekvési változatokat következményeikkel együtt, s ezután döntése előtt (egy cselekvési változat kiválasztása a cselekvési változatok halmazából) gondolkodik, pontosabban szólva: átgondolja, vagy megfontolja, a szóban forgó, ismert szerkezetű, döntési problémát.

Page 161: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

161

A megfontolás során figyelembe veszi, hogy az egyes tényállapotok mekkora valószínűséggel következnek be (vagy vannak jelen). Ha a cselekvési változatok és a tényállapotok egymástól nem függetlenek, akkor a következmények valószínűségét tekinti. A függetlenséget úgy értelmezzük, hogy a cselekvési változatok nem változtatják meg a tényállapotok valószínűségeit. Kérdés, hogy miképpen határozzuk meg a tényállapotok bekövetkezésének (vagy a következményeknek) valószínűségét? A legegyszerűbb a döntést hozó korábbi tapasztalataira alapozott szubjektív becslés. A korábbi tapasztalatok nyomán megfogalmazott valószínűséget a priori valószínűségnek nevezik. A valószínűségek számszerű megfogalmazásában azonban a döntést hozó nem járhat el önkényesen. A valószínűségszámítás axiómáinak megfelelően kell a valószínűségek számértékeit hozzárendelni a tényállapotokhoz (vagy következményekhez). A tényállapotok egymást kizárják, továbbá ún. teljes eseményrendszert alkotnak, azaz valamelyik biztosan bekövetkezik közülük. A tényállapotok valószínűségei összegének tehát egyet kell adniuk (mivel a biztos esemény valószínűsége egy). A valószínűségi számérték megállapításának másik módja az új információk szerzése. Az információk mennyisége lehet teljes vagy részleges. Az esetek túlnyomó hányadában csak részleges információmennyiséget szerezhetünk. A részleges információmennyiség érdekes következménye, hogy a döntést erre alapozva fennáll a tévedés lehetősége. A tévedés – azaz hiba – kétféle típusú lehet. Igaz hipotézist utasítunk el, úgynevezett elsőfajú hibát vétünk, vagy hamis hipotézist fogadunk el igazként – másodfajú hibát követünk el. Részleges információt mindig mintavételes eljárással szerzünk. Ebben az esetben mindig fennáll a kétfajta hiba elkövetésének kockázata. A valószínűségi számérték megállapításának harmadik lehetősége az a priori és az új információk ötvözése. Erre nyújt lehetőséget az ún. Bayes-féle logika. A gondolat nagyjelentőségű: a tapasztalatokon nyugvó megállapítások módosítása az új információk tükrében. Belátható ugyanis, hogy a tapasztalati (korábbi tapasztalatokról van szó) információkat nem szabad (illetve nem célszerű) elvetni akkor, ha az új információk szerzésében korlátozottak vagyunk elvi vagy gyakorlati okok miatt. Előnyösebb tehát a „régi” és az „új” ötvözése. A Bayes-féle logika matematikai alapja a valószínűségszámításban szereplő Bayes-tétel. Egységes döntési kritérium nincs. Tudjuk, hogy vannak kifejezetten szubjektív (a rossz értelemben vett szubjektív) döntési kritériumok is. Ilyen például a tekintélyi elv kritériuma, amikor valaki a tekintélyt tekinti döntő kritériumnak (saját vagy mások tekintélyét), vagy ilyen az önkényesség (autark kritérium). A „rossz értelemben vett szubjektív” kifejezéssel arra utalunk, hogy ezek a kritériumok nem tartoznak a racionális kritériumok közé, de nem jelenti azt, hogy az ilyen döntési kritériumok mindig helytelenek. A döntési kritériumok döntési osztályonként változnak. Döntési osztályokat a tényállapotokra (vagy következményekre) vonatkozó valószínűségek alapján állítunk fel. Három döntési osztályt szokás megkülönböztetni: a bizonytalan, a kockázatos és a biztos döntések osztályát.

IX.6 Bizonytalan döntések osztálya

A döntési problémák megfogalmazásakor a bizonytalanság fogalmát értelmezhetjük szűkebb és tágabb értelemben is. Szűkebb értelemben vett bizonytalanságról akkor beszélünk, ha a döntéshozó semmit nem tud a lehetséges események bekövetkezéséről. Ez a fajta bizonytalanság tehát nemcsak azt jelenti, hogy a döntéshozó nem tudja, hogy melyik

Page 162: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

162

lehetséges tényállapot fog bekövetkezni, hanem a tényállapotokhoz tartozó valószínűségek is ismeretlenek számára. Tehát a bizonytalan döntések osztályába soroljuk azokat a döntési problémákat, amelyekben nem ismerjük a tényállapotok (illetve következmények) valószínűségeit. Vizsgálódásaink során az egyszerűség kedvéért vegyük úgy, hogy a döntéshozó minden esetben a maximális nyereség elérésére törekszik. Persze lehetnek más céljai is, de a bevezető jellegű problémák tárgyalásakor az általánosság megszorítása nélkül foglalkozhatunk nyereségmaximalizáló döntésekkel. Ilyen körülmények között a döntéshozónak választania kell valamilyen lehetséges cselekvést abban a reményben, hogy cselekvése révén maximális nyereséghez jut. Eközben a döntéshozó tisztában van azzal, hogy bizonyos események bekövetkezése esetén nem éri el a maximális nyereséget. Valójában tehát játszik valami ellen, legyen az a természet, piaci helyzet, egy új találmány sikere stb. Mit jelent ez? Azt, hogy a döntéshozónak tippelnie kell a nyereség reményében, de annak tudatában, hogy veszíthet is. Annak ellenére, hogy feltételünk értelmében a döntéshozó maximális nyereségre törekszik, különböző egyéniségű döntéshozók más és más kritériumot alkalmaznak a legjobb cselekvési lehetőség kiválasztására. A bizonytalan döntések osztályában nincs egységes döntési kritérium. A döntést hozó pszichológiai beállítottságától függően definiálhatunk döntési kritériumokat. A legismertebbek a Wald-féle, a maximax, a Savage-féle, a Hurwicz-féle és a Laplace-féle kritériumok. A Wald-kritériumot másképpen minimax (illetve maximin) kritériumnak is nevezik. A pesszimista és óvatos döntést hozó kritériuma. A pesszimista döntést hozó a legrosszabb következményt tekinti, de mivel óvatos is, igyekszik magát a lehető legrosszabbtól megvédeni. Eljárásának lényege: minden egyes cselekvési változat esetében a legrosszabb következményt tekintve ezek közül a legjobbat, azaz a relatíve legkisebb rosszat választja. Esetünkben a Wald kritériumnak megfelelően a RÉF bankba teszi a pénzét.

1400

770

-140

700

48. ábra: Wald-kritérium

A döntéshozó ezzel a kritériummal biztonságra törekszik. Azt a cselekvést választja, amellyel a legrosszabb esetben is jól jár, tekintet nélkül arra, hogy így esetleg kizárja a nagyobb nyereség lehetőségét. A maximax kritérium az optimista döntéshozó kritériuma, vagyis az olyan döntéshozóé, aki mindig a legjobbra számít. Minden cselekvési lehetőségnél azt nézi meg, hogy melyik a legjobb következmény, majd ezek közül is a legjobbat választja. A maximax kritérium értelmében az a cselekvés az optimális, amelyik a maximumot adja a maximális nyereségek közül, esetünkben a RÉF a telek vásárlása mellett dönt.

Page 163: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

163

49. ábra: Maximax kritérium

Ha a döntéshozó a maximax kritériumot alkalmazza, akkor a legkedvezőbb esemény bekövetkezése esetén a legnagyobb nyereségre számíthat, de tudatában van annak, hogy rosszabbul is járhat. A Savage kritérium az un. minimális regret kritériuma. (A regret angol szó, megbánást jelent.) Pszichológiai alapja az elmulasztott lehetőségen érzett megbánás. (A lottózók, illetve totózók gyakran vannak ilyen pszichológiai állapotban.) Bizonytalanság esetén a döntéshozó abban a kényelmetlen helyzetben van, hogy választania kell egy lehetséges cselekvést, mielőtt megtudná, hogy a lehetséges események közül melyik következik be. Ha a döntéshozó nem tartja kielégítőnek az előbbi kritériumok egyikét sem, akkor például úgy gondolkodhat, hogy a kifizetési táblázat ismeretében előregondol a jövőbe. Alaposan megvizsgálja, hogy mi történik az egyes lehetséges tényállapotok bekövetkezése esetén. A regret mértéke az adott körülmények közötti optimális (tehát a legjobb) és a tényleges döntés közötti különbség a következmények értékében mérve. A regretmátrixra ezután a Wald kritériumot alkalmazzuk: a legnagyobb regretek közül választjuk a legkisebbet (minimáljuk a maximumokat, innét a minimax elnevezése a Wald kritériumnak). Esetünkben a Savage kritériumot követve a RÉF bankba teszi inkább a pénzét telekvásárlás helyett:

50. ábra: Savage-kritérium

A maximin és a maximax kritériumokat joggal érheti az a bírálat, hogy túlságosan egyoldalúak. A maximin kritérium túl pesszimista, mert mindig a legrosszabb esemény bekövetkezésére számít, a maximax kritérium pedig túl optimista, mert csak a legkedvezőbb eseményt veszi figyelembe. A Hurwicz-féle kritérium az ún. optimizmus együtthatóval súlyozva számítja ki a legmegfelelőbb cselekvési változatot. Az optimizmus együttható az elnevezéssel asszociálódó „komolytalan” felhanggal ellentétben, egzakt matematikai gondolatmenet alapján határozható meg. Pszichológiai alapja a két végletes álláspont – a teljes pesszimizmus és a teljes

Page 164: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

164

optimizmus – közötti „arany középút” keresése. Ebben az esetben a döntéshozó egy φ optimizmus együtthatót határoz meg a [0,1] intervallumon belül. A φ ismeretében a pesszimizmus együttható értéke meghatározható: (1-φ). Ha egy adott S stratégia u1i, u2i, ..., uim hasznosságú következménnyel járhat, akkor a stratégia φ indexe kifejezhető:

iii mMs ⋅−+⋅= )1()( ϕϕϕ , ahol Mi az uij értékek között a legnagyobbat, az mi pedig a

legkisebbet jelenti. A döntéshozó a φ indexek sorrendjében preferálja az egyes stratégiákat, és az a cselekvési változat lesz optimális, amelyhez a legnagyobb Hurwicz-átlag tartozik. A két cselekvési változat között létezik indifferencia pont. Képezve mindkét cselekvési változat φ indexét, az alábbiakat kapjuk:

571,0

700)1(770)140()1(1400

)()( 21

=⋅−+⋅=−⋅−+⋅

=

ϕϕϕϕϕ

ϕϕ ss

Tehát, ha az optimizmus együttható értéke 0,571-nél nagyobb, akkor az s1 cselekvési változat (telek megvásárlása) az előnyösebb, míg 0,571-nél kisebb φ esetén a Hurwicz-kritériumot követő döntéshozó az s2 alternatívát választja. A Hurwicz-kritérium alkalmazásakor minden cselekvési lehetőség esetén csak a legkisebb és a legnagyobb következményértékeket vesszük figyelembe. Ez azt jelenti, hogy a Hurwicz-ábra úgy tünteti fel az egyes cselekvési lehetőségeket, mintha a megfelelő nyereség értékek lineárisan változnának a legkisebbtől a legnagyobbig, holott ez a valóságban általában nem így van. A Laplace-kritérium (átlagkritérium) alapja az elégtelen megokolás elvében gyökeredzik. Eszerint, ha nincs elégséges indokunk a különböző események bekövetkezési valószínűségének megállapítására, akkor a Laplace-féle álláspont szerint legcélszerűbb, ha minden egyes eseményt azonos valószínűséggel tekintünk. Példánkban:

5,0)()( 21 == tPtP

7357005,07705,0)(

6301405,014005,0)(

2

1

=⋅+⋅==⋅−⋅=

sM

sM

A vállalkozó a pénz bankba helyezése mellett dönt a Laplace-kritérium szerint. A bizonytalan döntések osztályára nincs egységes döntési kritérium, sőt láttuk, hogy azonos információbázison ellentétes döntésre is juthatunk. A bizonytalan döntések osztálya tudományos szempontból tekintve nem kezelhető minden szempontból kifogástalan egzaktsággal. A közhiedelemmel ellentétben ebbe a döntési osztályba kevés döntési probléma tartozik, mert valójában ritkán fordul elő, hogy egy döntéshozó semmit ne tudjon a kérdéses események bekövetkezési valószínűségéről, vagyis ritkán fordul elő teljes információhiány. Példa Az előbbiekben megismert döntési kritériumokat most nézzük végig egy komplexebb példán. Képzeljünk el egy nagy újságos pavilont, ahol mindenféle lapot árulnak, többek között egy Vasárnap című hetilapot is. A döntéshozó az újságárus. A Vasárnapot 3Ft-ért veszi és 5Ft-ért adja példányonként. A vasárnap nem eladott Vasárnapok tiszta veszteségnek tekinthetők, vasárnap éjfélre teljesen elértéktelenednek. Az újságos gondos üzletember, pontos kimutatásokat vezet az újságokról, évekre visszamenőleg őrzi feljegyzéseit. Az elmúlt 100 vasárnap a Vasárnap forgalma a következőképpen alakult.

Page 165: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

165

Eladott példányszám Hetek száma

16 5 17 10 18 12 19 16 20 10 21 20 22 16 23 6 24 5

Összesen 100 A táblázatból látható, hogy az újságos soha nem adott el 24-nél több és 16-nál kevesebb példányt a Vasárnapból a vizsgált időszakban. Miután nem valószínű, hogy a közeljövőben lényeges változás lenne a forgalomban, így megrendelései ezentúl is legalább 16 és legfeljebb 24 példány. Ez kilencféle lehetőség, melyiket válassza? Érdemes szavakkal leírni a nyereségfüggvényt:

• Ha az újságos x példányt rendel, és a kereslet ezt a példányszámot nem haladja meg, akkor a bevétele 5Ft minden eladott példányra, kiadása pedig 3 Ft minden megrendelt példányra.

• Ha x példányt rendel, de a kereslet nagyobb, mint a megrendelt példányszám, akkor csak annyi újságot tud eladni, amennyi van. Bevétele 5Ft minden megrendelt példányra és kiadása 3 Ft minden megrendelt példányra. Nyeresége tehát 2 Ft minden megrendelt (vagy eladott) példányra.

Döntési mátrixunk az alábbi: t=16 t=17 t=18 t=19 t=20 t=21 t=22 t=23 t=24 s=16 32 32 32 32 32 32 32 32 32 s=17 29 34 34 34 34 34 34 34 34 s=18 26 31 36 36 36 36 36 36 36 s=19 23 28 33 38 38 38 38 38 38 s=20 20 25 30 35 40 40 40 40 40 s=21 17 22 27 32 37 42 42 42 42 s=22 14 19 24 29 34 39 44 44 44 s=23 11 16 21 26 31 36 41 46 46 s=24 8 13 18 23 28 33 38 43 48 Wald (maximin) kritérium: Minden egyes cselekvési változat (sor) esetében a legrosszabb következményt tekinti (táblázat vastagon szedett és aláhúzott értékei), majd a legrosszabb következmények közül a legjobbat. t=16 t=17 t=18 t=19 t=20 t=21 t=22 t=23 t=24 s=16 32 32 32 32 32 32 32 32 32 s=17 29 34 34 34 34 34 34 34 34 s=18 26 31 36 36 36 36 36 36 36 s=19 23 28 33 38 38 38 38 38 38 s=20 20 25 30 35 40 40 40 40 40 s=21 17 22 27 32 37 42 42 42 42 s=22 14 19 24 29 34 39 44 44 44 s=23 11 16 21 26 31 36 41 46 46 s=24 8 13 18 23 28 33 38 43 48

Page 166: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

166

Ha az újságárus a Wald kritériumot alkalmazza, akkor optimális az a cselekvése, ha 16 példányt rendel. Ezzel biztosítja, hogy nyeresége nem lesz kevesebb, mint 32 Ft. Maximax kritérium: Minden cselekvési lehetőségnél a legjobb következményt tekinti, majd azok közül is a legjobbat választja. t=16 t=17 t=18 t=19 t=20 t=21 t=22 t=23 t=24 s=16 32 32 32 32 32 32 32 32 32 s=17 29 34 34 34 34 34 34 34 34 s=18 26 31 36 36 36 36 36 36 36 s=19 23 28 33 38 38 38 38 38 38 s=20 20 25 30 35 40 40 40 40 40 s=21 17 22 27 32 37 42 42 42 42 s=22 14 19 24 29 34 39 44 44 44 s=23 11 16 21 26 31 36 41 46 46 s=24 8 13 18 23 28 33 38 43 48 Az újságárus számára a maximax kritérium értelmében a 24 db az optimális cselekvés, vagyis ilyen gondolkodásmód mellett 24 példányt rendel a Vasárnapból, és ezzel nyeresége elérheti a 48 Ft-ot. Savage (regret) kritérium: t=16 t=17 t=18 t=19 t=20 t=21 t=22 t=23 t=24 s=16 0 2 4 6 8 10 12 14 16 s=17 3 0 2 4 6 8 10 12 14 s=18 6 3 0 2 4 6 8 10 12 s=19 9 6 3 0 2 4 6 8 10 s=20 12 9 6 3 0 2 4 6 8 s=21 15 12 9 6 3 0 2 4 6 s=22 18 15 12 9 6 3 0 2 4 s=23 21 18 15 12 9 6 3 0 2 s=24 24 21 18 15 12 9 6 3 0 Az elmulasztott nyereség nem más mint a következő két nyereség különbsége:

1. amennyi nyeresége akkor lett volna, ha tudja előre, hogy melyik a valódi tényállapot; 2. amennyi nyeresége a valóságban van.

Ha a döntéshozó eltalálja azt a cselekvési lehetőséget, amelyik a valódi esemény bekövetkezése esetén a legnagyobb nyereséget adja, akkor elmulasztott nyeresége 0. Az elkészített regret mátrixra alkalmazzuk a Wald kritériumot. Minden egyes cselekvési változatnál a legrosszabb következmények közül választja a legjobbat a döntéshozó. Az újságárus a Savage kritérium alkalmazásakor 19 példányt rendel, így legrosszabb esetben is csak 10 pénzegységnyi elmulasztott nyeresége lesz. Laplace kritérium: A döntéshozó minden egyes tényállapotnak azonos valószínűséget tulajdonít (1/9-et), amely egyúttal azt is jelenti, hogy a döntéshozó az egyes cselekvési lehetőségekhez tartozó nyereségek közönséges számtani átlagát választja döntési kritériumként:

Page 167: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

167

t=16 t=17 t=18 t=19 t=20 t=21 t=22 t=23 t=24 s=16 32 32 32 32 32 32 32 32 32 s=17 29 34 34 34 34 34 34 34 34 s=18 26 31 36 36 36 36 36 36 36 s=19 23 28 33 38 38 38 38 38 38 s=20 20 25 30 35 40 40 40 40 40 s=21 17 22 27 32 37 42 42 42 42 s=22 14 19 24 29 34 39 44 44 44 s=23 11 16 21 26 31 36 41 46 46 s=24 8 13 18 23 28 33 38 43 48

A nyereségek átlaga

s=16 32 s=17 33,44 s=18 34,33 s=19 34,67 s=20 34,44 s=21 33,66 s=22 32,33 s=23 30,44 s=24 28

Az újságosnak a Laplace kritérium értelmében 19 példányt érdemes rendelnie. Hurwicz-kritérium: Tegyük fel, hogy az újságárus 75%-os optimista, azaz φ=0,75. A következő táblázatban tüntetjük fel a cselekvési változatokhoz tartozó legnagyobb és legkisebb nyereségeket, a φ indexet (Hurwicz-átlagot), valamint ez utóbbi értékét φ=0,75 esetén.

Legnagyobb nyereség (M i)

Legkisebb nyereség (mi)

iii mMs ⋅−+⋅= )1()( ϕϕϕ 75,0),( =ϕϕ hasi

s=16 32 32 32 32 s=17 34 29 5φ+29 32,75 s=18 36 26 10φ+26 33,5 s=19 38 23 15φ+23 34,25 s=20 40 20 20φ+20 35,00 s=21 42 17 25φ+17 35,75 s=22 44 14 30φ+14 36,50 s=23 46 11 35φ+11 37,25 s=24 48 8 40φ+8 38

Esetünkben az optimális cselekvési változat 24 példány vásárlása. Az újságos döntési problémájában minden φ<0,6 értékre a 16 példány lesz az optimális, φ>0,6 esetén pedig a 24 példány a legjobb választás, míg a φ=0,6 esetén mindegyik cselekvési lehetőséghez ugyanaz a )( isϕ érték tartozik. Ez azt jelenti, hogy ha az újságos 60%-os

optimista, akkor a Hurwicz-kritérium értelmében bármelyik cselekvési lehetőség egyformán kedvező számára.

Page 168: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

168

IX.7 Kockázatos döntések osztálya

Ha a döntés következményeit befolyásoló lehetséges eseményekre vonatkozóan a döntéshozó csak részleges információval bír, akkor kockázattal áll szemben. A legtöbb valóságos döntési probléma a kockázatos döntések osztályába esik. Tudjuk, hogy bármelyik cselekvési változat esetén két vagy több tényállapot következhet be. A döntéshozó nem tudja, hogy a lehetséges események közül melyik következik be, de ismeri az események bekövetkezésére vonatkozó valószínűség-eloszlást. Így a kockázatos döntések osztályába tartoznak mindazok a döntések, amelyek esetében a tényállapotok (vagy következmények) valószínűségei ismertek, azaz ismeretes a valószínűség-eloszlásuk. A döntési probléma megoldása ilyenkor a következő:

1. választ egy döntési kritériumot; 2. értékeli az egyes cselekvési lehetőségeket; 3. a választott kritériumnak megfelelően kiválasztja az optimális cselekvési lehetőséget.

A kockázatos döntések osztályában alkalmazott döntési kritérium az ún. Bayes-féle kritérium , másnéven az optimális várható érték kritériuma. A várható érték a valószínűségszámítás igen pontosan kidolgozott fogalma. Bayes ismerte fel először – és fogalmazta meg egzakt módon –, hogy abban az esetben, ha a döntési problémában az „esélyeknek”, azaz valószínűségeknek szerepe van, akkor a döntést hozók az optimális várható érték alapján döntenek. Más szóval, azt a cselekvési változatot választják, amelyiknek a „várható kilátása” a legjobb.

IX.7.a A valószínűség, mint döntési kritérium

Az előzőekben tárgyalt kritériumok a pénzügyi következményeket vették alapul az optimális cselekvési változat meghatározásában. Most olyan kritériumokkal ismerkedünk meg, amelyek elsősorban a lehetséges események bekövetkezésének valószínűségeit veszik figyelembe. A legnagyobb valószínűség kritériuma (maximum likelihood kritérium): Adott P(ti) tényállapot valószínűségek mellett a döntéshozó a következőképpen alkalmazza ezt a kritériumot:

1. kiválasztja a valószínűségadatok maximumát; 2. ha ez a k-adik oszlopban van, akkor a k-adik oszlop nyereségadatai közül megkeresi a

legnagyobbat; 3. optimális lesz az a cselekvési változat, amelynek sorában ez a legnagyobb

nyereségadat szerepel. Példaként tekintsük ismét az újságárus döntési problémáját a Vasárnap című vasárnapi lap megrendeléseire vonatkozóan. Az újságárus pontos adatokkal rendelkezett az elmúlt 100 vasárnap keresleti viszonyairól. Ezekből az adatokból kiszámíthatjuk az egyes lehetséges eseményekhez tartozó relatív gyakoriságokat.

Page 169: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

169

Eladott

példányszám Hetek száma Relatív

gyakoriság 16 5 0,05 17 10 0,1 18 12 0,12 19 16 0,16 20 10 0,1 21 20 0,2 22 16 0,16 23 6 0,06 24 5 0,05

Összesen 100 1,00 Miután az újságárusnak semmi oka nincs arra, hogy a keresletben bármilyen változást tételezzen fel a közeljövőben, a relatív gyakoriságokat elfogadja az események valószínűségeként. A táblázatból látható, hogy bizonyos események bekövetkezésének nagyobb a valószínűsége, mint másoknak. A legnagyobb valószínűség a t=21 tényállapothoz tartozik, vagyis a t=21 tényállapot a legvalószínűbb. A legnagyobb valószínűség kritériumának alkalmazásakor a döntéshozó a pénzügyi következmények táblázatának csak azt a részét veszi figyelembe, amely a legvalószínűbb tényállapothoz tartozik, tehát a korábbi táblázatnak csak a t=21-es oszlopát nézzük.

t=21 s=16 32 s=17 34 s=18 36 s=19 38 s=20 40 s=21 42 s=22 39 s=23 36 s=24 33

A t=21 tényállapot bekövetkezése esetén a legnagyobb nyereség 42 Ft, ez egyúttal kijelöli az optimális cselekvési stratégiát, vagyis 21 példányt kell rendelnie az újságárusnak. A várható érték, mint kritérium: A legnagyobb valószínűség kritériuma csak azt az egy tényállapotot veszi figyelembe, amelyik a legnagyobb valószínűséggel következik be. Bizonyos esetekben kiszámíthatjuk az események várható értékét, ezáltal tekintetbe véve minden lehetséges eseményt a megfelelő valószínűséggel. A várható érték, mint kritérium természetesen csak akkor alkalmazható, ha a lehetséges események jól meghatározott számokkal adhatók meg, vagyis a nem döntési változó lehetséges értékei valóban számértékek. A kritérium alkalmazásának menete:

1. a döntéshozó kiszámítja a tényállapot várható értékét; 2. megkeresi a tényállapotnak azt az értékét, amelyik a legközelebb áll a várható

értékhez; 3. a tényállapot oszlopában megkeresi a legnagyobb értéket, amellyel kijelöli az

optimális cselekvési változatot.

Page 170: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

170

Az újságos esetében a tényállapot várható értéke a relatív gyakoriságok felhasználásával: 00,2005,02406,02316,02220,02110,02016,01912,01810,01705,016)( =⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅+⋅=tM

A várható kereslet tehát 20 példány a Vasárnapból.

t=20 s=16 32 s=17 34 s=18 36 s=19 38 s=20 40 s=21 37 s=22 34 s=23 31 s=24 28

Ennek megfelelően az újságárus most már csak a t=20-as tényállapotot veszi figyelembe, és végignézi a nyereségadatokat. A t=20 tényállapothoz tartozó nyereségadatok közül a legnagyobb a 40, ez az adat kijelöli az optimális cselekvést, vagyis 20 példányt kell rendelnie az újságárusnak. Megjegyezzük, hogy a várható érték általában nem egyenlő a valószínűségi változó valamelyik lehetséges értékével, itt ez csak véletlen. Az esetek többségében kerekítéssel kell számolni.

IX.7.b Kombinált kritériumok

Várható pénzérték (VP) kritérium: Ezt a kritériumot alkalmazva a döntéshozó kiszámítja minden egyes cselekvési lehetőség várható pénzértékét, és azt a cselekvést választja, amelyhez a legnagyobb ilyen érték tartozik. Ez a kritérium egyformán fontosnak tekinti a pénzügyi következményeket és e következmények bekövetkezésének valószínűségeit. Az újságárus problémájára visszatérve: válasszunk ki egy lehetséges cselekvési változatot, pl. hogy 24 példányt rendel az újságárus. A következő táblázatban kiszámítjuk az s=24-es cselekvési lehetőség várható pénzértékét. Ehhez felhasználjuk a korábbi táblázatunk s=24-es sorát, valamint a korábban a relatív gyakoriságok segítségével megadott valószínűségeket. Kereslet t=16 t=17 t=18 t=19 t=20 t=21 t=22 t=23 t=24 Összesen Következmények (s=24 esetében)

8 13 18 23 28 33 38 43 48

Valószínűségek (relatív gyakoriságok)

0,05 0,10 0,12 0,16 0,10 0,20 0,16 0,06 0,05 1,00

Részletszorzatok 0,40 1,30 2,16 3,68 2,80 6,60 6,08 2,58 2,40 VP=28 Ahhoz, hogy e kritérium segítségével meghatározzuk az optimális cselekvést minden egyes cselekvési lehetőséghez ki kell számolnunk a várható pénzértékeket. Miután a számítás technikája rendkívül egyszerű, a részletes számolás bemutatása nélkül közöljük a várható pénzértékeket.

Page 171: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

171

s=16 s=17 s=18 s=19 s=20 s=21 s=22 s=23 s=24 VP 32,00 33,75 35,00 35,65 35,50 34,85 33,20 30,75 28,00

A táblázatból látható, hogy a legnagyobb várható pénzértéke az s=19-es cselekvési változatnak van. Így a VP kritérium értelmében az újságárus akkor cselekszik optimálisan, ha 19 példányt rendel a Vasárnapból. Megjegyezzük, hogy az s=19-es cselekvéshez kiszámított 35,65 Ft várható nyereségérték nem fordul elő a táblázatban, tehát pontosan ennyi nyeresége nem lesz az újságárusnak a Vasárnapból. Ez természetes, hiszen a VP várható érték. A most következő vasárnapon, ha az újságos 19 példányt rendel, akkor nyeresége 23, 28, 33, vagy 38 Ft lesz. A VP kritérium felhasználja az összes rendelkezésre álló adatot (pénzértéket és valószínűséget), és ezáltal nyilvánvalóan alaposabb kritériumnak tekinthető, mint az előzőek. A pénzbeli következmények és a tényállapotok valószínűségeinek ismeretében célszerű a VP kritériumot alkalmazni. A várható elmulasztott pénzérték (VEP) kritériuma Az optimális döntés meghatározásához ez a kritérium is felhasználja a pénzbeli következményeket és a valószínűségeket. Az előző kritérium a nyereségadatokat dolgozza fel, a VEP kritérium pedig a lehetséges veszteségekkel vagy az elmulasztott nyereségekkel számol. A VEP kritérium alkalmazásakor a döntéshozó kiszámítja minden cselekvési lehetőséghez a várható lehetséges veszteségeket (ez a VEP), és azt a cselekvést választja, amelyhez a legkisebb VEP tartozik. Nézzük újból az újságárus problémáját! A következő táblázatban kiszámítjuk a VEP-eket, azaz a várható elmulasztott nyereséget 24 példány Vasárnap megrendelése esetén. Itt is felhasználjuk a relatív gyakoriságokat, mint a valószínűség becsléseit. Kereslet t=16 t=17 t=18 t=19 t=20 t=21 t=22 t=23 t=24 Összesen Elmulasztott nyereségek (s=24 esetében)

24 21 18 15 12 9 6 3 0

Valószínűségek (relatív gyakoriságok)

0,05 0,10 0,12 0,16 0,10 0,20 0,16 0,06 0,05 1,00

Részletszorzatok 1,20 2,10 2,16 2,40 1,20 1,80 0,96 0,18 0,00 VEP=12 A VEP kritérium alkalmazásához minden egyes cselekvési változat VEP-jét ismernünk kell. A számítások részletezése nélkül megadjuk az újságárus döntési problémájához tartozó VEP értékeket.

s=16 s=17 s=18 s=19 s=20 s=21 s=22 s=23 s=24 VEP 8,00 6,25 5,00 4,35 4,50 5,15 6,80 9,25 12,00

A VEP kritérium értelmében (is) s=19 az optimális cselekvés, ehhez tartozik a legkisebb várható elmulasztott nyereség. Természetesen a VP és a VEP kritérium ugyanazt az optimumot adja, hiszen azonos alapadatokból, azonos típusú értékelési rendszerrel jutnak optimális cselekvéshez. Ezért szokás VP-VEP kritériumról is beszélni.

Page 172: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

172

s=16 s=17 s=18 s=19 s=20 s=21 s=22 s=23 s=24

VP 32,00 33,75 35,00 35,65 35,50 34,85 33,20 30,75 28,00 VEP 8,00 6,25 5,00 4,35 4,50 5,15 6,80 9,25 12,00

VP+VEP 40,00 40,00 40,00 40,00 40,00 40,00 40,00 40,00 40,00

Látható, hogy minden cselekvési lehetőségre vonatkozóan a VP+VEP összeg ugyanannyi. A döntési problémák többségében a VP vagy VEP kritérium jobbnak mondható a többinél, mert csak ezek a kritériumok veszik egyszerre figyelembe mind a pénzügyi következményeket, mind pedig a lehetséges események bekövetkezésének valószínűségeit. A döntéshozó persze még a VP kritérium esetében sem tudhatja biztosan, hogy cselekvésének pontosan milyen anyagi következménye lesz, mert nem tudja, hogy a lehetséges tényállapotok közül melyik következik be, éppen ez jelenti a döntéshozó számára a bizonytalanságot. Nyilvánvaló, hogy ha lehetősége van, akkor a döntéshozó megpróbál újabb információt szerezni a bizonytalanság csökkentése érdekében. Kérdés, hogy mennyit érdemes új információkra költenie, és a megszerzett új információ hogyan befolyásolja jövőbeli cselekvéseit, valamint azok következményeit. Ebben az alfejezetben ezekkel a kérdésekkel foglalkozunk.

IX.7.c Kockázatos döntés az elsődleges információk alapján

Első példánkat (RÉF telekvásárlási döntési problémája) az alábbi döntési mátrixszal jellemeztük.

Cselekvési lehetőségek

Tényállapotok t1 t2

feltételes következmények s1 1400 -140 s2 770 700

Dr. Vizy számára a bizonytalanság azt jelenti, hogy nem tudhatja hogyan dönt a megyei tanács, merre fogják építeni az új utat (azaz t1 és t2 tényállapotok közül melyik következik be). Ez a bizonytalanság nem jelenti azt, hogy a döntéshozó teljes tudatlanásgban van, hiszen az útépítés problémája megyeszerte ismert, sokat hangoztatott és nyilvános vitákat kiváltó téma. A rendelkezésre álló információ alapján Dr. Vizynek már jól kialakult véleménye van, mégpedig az, hogy a hőforrás felé vezető út építésére az esély 3 az 1-hez a másfelé vezető úttal szemben. Dr. Vizy véleménye szerint a két lehetséges tényállapot bekövetkezésének valószínűsége:

P(t1)=0,75 P(t2)=0,25

Ezek a valószínűségek szubjektív valószínűségek. E valószínűségek birtokában kiegészíthetjük a táblázatot úgy, hogy feltüntetjük a tényállapotok bekövetkezésének valószínűségeit, és kiszámítjukmindkét cselekvési lehetőség várható pénzértékét a korábbi logikának megfelelően.

Page 173: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

173

Cselekvési lehetőségek

Tényállapotok VP kiszámítása t1 t2

feltételes következmények s1 1400 -140 1400·0,75-140·0,25=1015 s2 770 700 770·0,75+700·0,25=752,5

tényállapotok valószínűségei

0,75 0,25

A táblázatból látható, hogy ha a RÉF megveszi a 10ha összterületű telket, akkor cselekvésének várható pénzértéke 1 015 000 Ft. Ha a másik cselekvési lehetőséget választja (vagyis az RMB-nál bankbetétbe helyezi), akkor a várható pénzérték 752 500 Ft. Így a VP kritérium alapján a telekvásárlás az optimális cselekvési lehetőség, ehhez a maximális VP 1 015 000 Ft. Tekintettel arra, hogy ez a döntés (s1) választása kizárólag a meglévő adatok és információk alapján jött létre, a nyereségként várható 1 015 000 Ft-ot a rendelkezésre álló információk alapján hozott döntés várható pénzértékének nevezzük.

IX.7.d Teljes információ

Természetesen a döntési problémában fennálló bizonytalanság nem szűnt meg a VP-k meghatározásával, hiszen Dr. Vizy nem tudhatja, hogy cselekvésének következményeként mennyi lesz a valódi pénzérték. A valódi nyereség értéke attól függ, hogy t1 és t2 közül melyik következik be. A bizonytalanságon való elmélkedései közepette Dr. Vizy megtudja, hogy létezik a megyében egy „főszakértő”, aki 100%-os biztonsággal meg tudja mondani, hogy Réz megye tanácsa hogyan fog dönteni az útépítés ügyében. Ha ő azt állítja, hogy az új utat a hőforrás felé vezetik, akkor Dr. Vizy egészen biztos lehet abban, hogy az utat valóban arrafelé építik. Ez a tökéletes előrejelzés teljesen megszüntetné a bizonytalanságot, ha valamilyen módon hozzá lehetne jutni. Nyilvánvaló, hogy az illető nem osztogatja ingyen előrejelzéseit, sőt az is valószínű, hogy egy-egy ilyen előrejelzés óriási pénzekbe kerül. Dr. Vizy nem rohan azonnal a „főszakértőhöz”, hanem először végiggondolja, hogy mit is nyerhet azáltal, hogy megkapja az előrejelzést, mennyit volna érdemes érte fizetni, vagy inkább a meglévő információi alapján döntsön. Dr. Vizy a következőképpen okoskodik: „Ha felkeresném a főszakértőt és egyeztetnék vele, akkor nyilvánvalóan nem döntök a cselekvési lehetőségek kérdésében, amíg meg nem mondja, melyik esemény fog bekövetkezni. Ha azt mondja, hogy az utat a hőforrás felé építik (vagyis t1 tényállapot következik be), akkor a nyereségem 1,4 mFt, vagy 770000Ft aszerint, hogy melyik cselekvési lehetőséget választom. Természetesen úgy döntök, hogy a RÉF megveszi a telket, mivel ez hozza a nagyobb nyereséget, ha az új út a hőforrás felé vezet. Ha viszont a főszakértő előrejelzése szerint az új út nem a hőforrás felé épül (vagyis t2 tényállapot következik be), akkor vagy 140000Ft veszteségem lesz, vagy 700000Ft nyereségem aszerint, hogy hogyan döntök a cselekvési lehetőségekről. Nyilvánvalóan bankba teszem a pénzt, hiszen csak így jutok nyereséghez, ha az új út nem a hőforrás felé vezet.” Eddig tehát Dr. Vizy elhatározta, hogy a főszakértő előrejelzése szerint melyik cselekvési lehetőséget választja. Amennyiben a tökéletes előrejelzés t1, úgy s1 cselekvési lehetőséget választja, ha az előrejelzés t2, akkor s2 cselekvési lehetőséget választja. Most a következőképpen okoskodik tovább: „Miután a főszakértő előrejelzései teljesen biztosak, ő akkor és csak akkor mondja, hogy t1 következik be, ha valóban t1 következik be. Valamint akkor és csak akkor lesz t2 az előrejelzés, ha valóban t2 következik be. Ebből az

Page 174: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

174

következik, hogy annak a valószínűsége, hogy a főszakértő előrejelzése t1 lesz ugyanannyi, mint a t1 tényállapot bekövetkezésének a valószínűsége.

P(a tökéletes előrejelzés t1)=P(t1) Ugyanígy a másik lehetséges tényállapotra vonatkozóan is:

P(a tökéletes előrejelzés t2)=P(t2) Mivel szerintem a t1 bekövetkezésének valószínűsége 0,75 és t2 valószínűsége 0,25, ezért annak a valószínűsége, hogy a főszakértő előrejelzése t1 lesz, szintén 0,75, míg annak valószínűsége, hogy t2-t mond, 0.25. Már eldöntöttem, hogy t1 esetén s1-et választom, így biztos 1,4 mFt nyereséghez jutok, és t2 bekövetkezése esetén s2-őt, mivel biztos 700000Ft nyereséghez jutok. Ez azt jelenti, hogy 0,75 valószínűséggel 1,4 mFt nyereségem lesz, és 0,25 valószínűséggel 700000Ft nyereségem lesz. A főszakértő tökéletes előrejelzésének megszerzése esetén a várható nyereségem Ft-ban:

1400000·0,75+700000·0,25=1225000 Dr. Vizy okoskodásának lépéseit a következő táblázatban foglaltuk össze:

Lehetséges előrejelzés

Optimális cselekvés, ha ti következik be

Az optimális cselekvés pénzértéke

Az előrejelzés

valószínűsége

A VP(TI) kiszámítása

t1 s1 1400 0,75 1400·0,75=1050 t2 s2 700 0,25 700·0,25=175 Összeg 1,00 VP(TI)=1225

Az 1225 ezer Ft nem mást, mint a Dr. Vizy döntéséhez tartozó VP, ha úgy határoz, hogy felkeresi a főszakértőt és megszerzi a tökéletes előrejelzést. Az ilyen várható értéket nevezzük a teljes információ birtokában hozott döntés VP-jének. Látható, hogy a teljes információ birtokában elérhető 1225 ezer Ft várható nyereség több mint a rendelkezésre álló információ segítségével kapható 1015 ezer Ft várható nyereség. A tökéletes előrejelzésnek nyilvánvalóan nagy előnyei vannak, és érdemes ezeket az előnyöket kihasználni, ha a főszakértő nem kér sokat az előrejelzésért. Az olvasó természetesen tisztában van azzal, hogy ilyen főszakértő nem létezik, ugyanakkor a teljes információ lehetőségének tárgyalása igen fontos a döntési probléma alapos vizsgálatakor. Ha a főszakértő valóban létezne, akkor a döntéshozó előbb megkérdezné, hogy melyik tényállapot következik be, és azután választana a lehetséges cselekvések közül. Mivel a teljes információ valószínűleg nagyon sokba kerül, így a főszakértő megkérdezése nélkül kell a döntéshozónak kiszámítania a VP(TI) értéket, hogy elképzelése legyen arról, hogy mennyit ér a teljes információ. Ez azt jelenti, hogy a VP(TI) kiszámításakor a döntéshozó nem tudja, hogy melyik esemény következik be, hiszen még nem kapta meg a teljes információt, vagyis a bizonytalanság nem változik a VP(TI) kiszámításával.

IX.7.e A teljes információ várható értéke (TIV)

Az előzőekben kifejtettük, hogy a döntéshozó számára igen előnyös volna, ha hozzájutna a tökéletes előrejelzéshez, vagyis döntését a teljes információ birtokában hozhatná meg. A döntéshozónak pontosan tisztában kell lennie azzal, hogy mekkora ez az előny, azaz legfeljebb mekkora összeget érdemes kifizetnie a tökéletes előrejelzésért. Ezt a pénzértéket a teljes információ várható értékének nevezzük és TIV-vel jelöljük. A TIV kiszámítása VP-vel:

Page 175: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

175

Az előzőekben láttuk, hogy a VP kritérium igen egyszerű eszköz a teljes információ értékelésére. Példánkban Dr. Vizy számára a teljes információ alapján meghozott döntés várható pénzértéke:

VP(TI)=1225000Ft Míg a rendelkezésre álló információ birtokában hozott döntés VP-je:

VP=1015000Ft A két pénzérték különbsége: 210000Ft. Várható értékekben gondolkodva, ez az az érték, amennyivel a teljes információ többet ér, mint a rendelkezésre álló információ. Azaz Dr. Vizy legfeljebb 210000Ft-ot fizethet a főszakértőnek. Ha a főszakértő ennél kisebb összegért hajlandó nyilatkozni, akkor érdemes vele előrejelztetni. A teljes információ várható értéke (TIV) a két várható érték különbsége. Kiszámításakor a teljes információ birtokában hozott döntés VP-jéből kivonjuk a rendelkezésre álló információ birtokában hozott döntés VP-jét. A TIV gyakorlati jelentése az, hogy felső határt szab a döntéshozó számára arra az összegre vonatkozóan, amelyet bármilyen információért érdemes kifizetnie. A valóságban természetesen a teljes információ nem létezik, ettől függetlenül az információk költségének megítélése céljából a döntéshozónak ismernie kell a döntési problémához tartozó TIV értéket, mint az információszerzésre fordítható pénzérték felső határát.

IX.7.f Kockázatos döntés a pótlólagos információk alapján, nem teljes információ

Az előzőekben kiszámoltuk, hogy a RÉF döntési problémájában a TIV 210000Ft, és ezt az összeget bármilyen újabb információ megszerzésénél nem érdemes túllépni. Miután Dr. Vizy is tudja, hogy főszakértő nem létezik, így megpróbál egyéb kisegítő információkat szerezni. Működik a megyében egy közvéleménykutató, amelynek az irodáját Dr. Vizy felkeresi. A közvéleménykutató munkatársa, Beszédes Olivér elvállalja a munkát 115000 Ft-ért. A jelentés vagy azzal zárul, hogy a közvéleménykutató szerint az új út a hőforrás felé épül, vagy azzal, hogy a közvéleménykutató szerint az új út nem a hőforrás felé fog vezetni. Beszédes azt állítja, hogy bár ők általában igen jól dolgoznak, de munkájuk nem nevezhető tökéletesnek, előrejelzésük pontosságát 80-90%-osnak mondja. Ez azt jelenti, hogy amennyiben a megyei tanács határozata alapján az utat a hőforrás felé vezetik, 80% a valószínűsége, hogy a közvéleménykutató előrejelzése is a hőforrás felé vezető út lesz. 90%-os valószínűséggel jeleznek nem a hőforrás felé vezető útépítést, ha az út valóban nem a hőforrás felé épül. Dr. Vizy úgy gondolja, hogy mivel az előrejelzés díja jóval alatta marad a TIV-nek, érdemes lenne a közvéleménykutató jelentését megrendelni. Természetesen azonban ez az egyszerű költségösszehasonlítás még nem elegendő ahhoz, hogy Dr. Vizy eldöntse, hogy valóban megéri-e a közvéleménykutató munkája a 115000Ft-ot. Mivel a közvéleménykutató nem teljes információt szolgáltat, az előrejelzés költségét az előrejelzés által megadott nem teljes információ várható értékéhez kell mérni, így lehet eldönteni, hogy nem túl drága-e az új információ. Az új információ hatása a valószínűségekre Bizonytalan körülmények között létrejövő döntésében a döntéshozó azt az alapelvet tartja szem előtt, hogy a döntés kialakulásának időtartama alatt nyerhető bármely kiegészítő információ általában megváltoztatja a lehetséges események bekövetkezéséhez tartozó valószínűségeket.

Page 176: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

176

Térjünk vissza az eredeti példánkhoz! Mielőtt Dr. Vizy a közvéleménykutatóhoz fordult volna segítségért, már sok mindent tudott a telekvásárlási problémáról, vagyis rendelkezésére állt bizonyos mennyiségű információ. Ezeknek az ismereteknek a birtokában Dr. Vizy úgy ítélte meg a helyzetet, hogy sokkal valószínűbb az, ha az új utat a hőforrás felé vezetik majd, mint az, hogy nem arra építik. Gondolatainak következményeként jelölte ki az események bekövetkezésének valószínűségeit: P(t1)=0,75; P(t2)=0,25. Ezek a valószínűségek tehát a rendelkezésre álló információ tartalmát tükrözik, mielőtt még Dr. Vizy újabb információ megszerzéséhez folyamodik. Az ilyen valószínűségeket a priori valószínűségeknek neveztük. Az a priori valószínűségek mindig teljes eseményrendszerhez tartoznak. Vizsgáljuk meg először, hogyan változtatná meg a teljes információ Dr. Vizy a priori valószínűségeit. Mint láttuk a főszakértő kétféle tökéletes előrejelzést adhat aszerint, hogy melyik tényállapot következik be. Ha a főszakértő előrejelzése t1, akkor Dr. Vizy biztos lehet abban, hogy t1 bekövetkezik és ugyanúgy biztos lehet abban is, hogy t2 nem következik be. A feltételes valószínűségek jelölésmódját alkalmazva:

P(t1| a főszakértő előrejelzése t1)=1 P(t2| a főszakértő előrejelzése t1)=0

Mivel ezek a valószínűségek a teljes információ megszerzése után keletkeztek, a posteriori valószínűségeknek nevezzük őket. Az a posteriori valószínűségek is teljes eseményrendszerhez tartoznak. Abban az esetben tehát, ha a teljes információ t1 bekövetkezését jelenti, az eseményekhez rendelt valószínűségek megváltoznak, az a priori valószínűségek szerepét az a posteriori valószínűségek veszik át. A priori A posteriori P(t1)=0,75 P(t1| tökéletes előrejelzés: t1)=1 P(t2)=0,25 P(t2| tökéletes előrejelzés: t1)=0 Összeg: 1,00 1 Ha a tökéletes előrejelzés t2, akkor a döntéshozó biztos lehet abban, hogy t2 bekövetkezik, és t1 nem következik be. A priori A posteriori P(t1)=0,75 P(t1| tökéletes előrejelzés: t2)=0 P(t2)=0,25 P(t2| tökéletes előrejelzés: t2)=1 Összeg: 1,00 1 Így tehát a főszakértő kétféle előrejelzésének megfelelően két különböző a posteriori valószínűségeloszlást kaptunk. Az a tény, hogy az a posteriori valószínűségek értéke mindenütt 1 vagy 0, azt mutatja, hogy a teljes információ birtokában a döntési problémában megszűnt a bizonytalanság. Mint az előző számításokból jól látható, a lehetséges események bekövetkezéséhez tartozó a posteriori valószínűségeloszlások rendkívül egyszerűen adódnak, ha a döntéshozó teljes információt kap. A döntési probléma vizsgálata során a valóságban a döntéshozó csak nem teljes információt szerezhet. A nem teljes információ alapján az a posteriori valószínűségeket Bayes-tétele alapján számíthatjuk ki. Folytatva Dr. Vizy döntési problémájának vizsgálatát, tudjuk, hogy a t1 és t2 tényállapotokhoz rendelt a priori valószínűségek rendre 0,75 és 0,25. Amennyiben Dr. Vizy igényt tart rá, újabb információként megrendelheti a közvéleménykutató jelentését, amelyről azt állították, hogy

Page 177: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

177

80-90%-ban megbízható, vagyis ha a megyei tanács határozata alapján az új út a hőforrás felé vezet majd, akkor annak a valószínűsége, hogy a közvéleménykutató jelentése ezt a tényt jelzi előre 80%. Ha az új út nem a hőforrás felé épül, akkor annak a valószínűsége, hogy a jelentés éppen ezt az előrejelzést adja 90%. Legyen a jelölés a következő: z1: a közvéleménykutató előrejelzése szerint az új út a hőforrás felé épül z2: a közvéleménykutató előrejelzése szerint az új út nem a hőforrás felé épül A közvéleménykutató lehetséges előrejelzései teljes eseményrendszert alkotnak. z1-et és z2-őt az információ lehetséges kimeneteleinek nevezzük. Az információ kimenetelét a döntéshozó nem befolyásolhatja, z1 és z2 nem a döntési változó lehetséges értékei. Nézzük az ismert valószínűségeket! t1 a priori valószínűsége:

P(t1)=0,75 t2 a priori valószínűsége:

P(t2)=0,25 t1 bekövetkezése esetén a z1 előrejelzés valószínűsége:

P(z1|t1)=0,80 t1 bekövetkezése esetén a z2 előrejelzés valószínűsége:

P(z2|t1)=1–P(z1|t1)=1–0,80=0,20 t2 bekövetkezése esetén a z2 előrejelzés valószínűsége:

P(z2|t2)=0,90 t2 bekövetkezése esetén a z1 előrejelzés valószínűsége:

P(z1|t2)=1–P(z2|t2)=1–0,90=0,10

Tényállapotok Lehetséges előrejelzések Az események a priori valószínűségei z1 z2

t1 P(z1|t1)=0,80 P(z2|t1)=0,20 0,75 t2 P(z1|t2)=0,10 P(z2|t2)=0,90 0,25

Miután a közvéleménykutatást kétféle előrejelzés követheti (z1 vagy z2), az előrejelzés aszerint befolyásolja a lehetséges események valószínűségeit, hogy a közvéleménykutató jelentés a valóságban z1 és z2 közül melyik lehetséges információt tartalmazza. Ez azt jelenti, hogy Dr. Vizynek kétféle a posteriori valószínűségeloszlást kell figyelembe vennie ahhoz, hogy értékelhesse a közvéleménykutató jelentését. Az egyik a posteriori valószínűség z1 előrejelzése esetén adódik, a másik pedig z2 esetén. Az a posteriori valószínűségeloszlásokat Bayes-tétel segítségével számítjuk ki, miután adott P(zk|ti) és P(ti) valószínűségekből a P(ti| zk) valószínűségeket kell számítanunk. A következő táblázatban feltüntetjük, hogy z1 előrejelzése esetén a P(ti) a priori valószínűségekből milyen P(ti|z1) a posteriori valószínűségek adódnak.

Lehetséges tényállapotok

ti

A priori valószínűségek

P(ti)

Feltételes valószínűségek

P(z1|ti)

Együttes valószínűségek

P(ti∩z1)

A posteriori valószínűségek

P(ti|z1) t1 0,75 0,80 0,600 0,600/0,625=0,96 t2 0,25 0,10 0,025 0,025/0,625=0,04 Összeg 1,00 0,625=P(z1) 1,00

Page 178: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

178

A táblázatban feltüntetjük a lehetséges tényállapotokat, a hozzájuk tartozó a priori valószínűségeket, z1-nek mindkét lehetséges lehetséges eseményre vonatkozó feltételes valószínűségét. A Bayes-tétel alkalmazásához szükségesek a z1 és a megfelelő tényállapotok együttes bekövetkezésének valószínűségei. A két együttes valószínűség összege a teljes valószínűség tételének értelmében éppen z1 valószínűsége. P(z1) tehát annak a valószínűsége, hogy az előrejelzés z1 lesz, függetlenül attól, hogy a valóságban t1 és t2 közül melyik tényállapot következik be. Végül az utolsó oszlopban kiszámítjuk az a posteriori valószínűségeket. A táblázat 3. oszlopában szereplő P(z1|t1)=0,80 és P(z1|t2)=0,10 feltételes valószínűségek azt jelentik, hogy milyen esélye van annak, hogy az előrejelzés z1 lesz, ha t1 valóban bekövetkezne, illetve ha t2 valóban bekövetkezne. Vagyis ezek a valószínűségek az információ egyik lehetséges kimenetelének valószínűségei a különböző lehetséges tényállapotok bekövetkezése esetén. Úgy is fogalmazhatunk, hogy a 0,80 azt mutatja, mennyire valószínű az, hogy z1 előrejelzést kapunk, ha a valódi esemény t1. Ugyanígy a 0,10 azt mutatja, hogy mennyire valószínű az, hogy z1 előrejelzést kapunk, ha a valóságban t2 következik be. Az ilyen jellegű valószínűségeket likelihoodnak nevezzük. A 3. oszlopban szereplő likelihood adatok tehát különböző eseménytérben számított feltételes valószínűségek, így összegük természetesen általában nem 1. A következő táblázatban az információ másik (z2) lehetséges kimeneteléhez tartozó számításokat közöljük, azaz meghatározzuk a z2 esetén adódó a posteriori valószínűségeket is.

Lehetséges tényállapotok

ti

A priori valószínűségek

P(ti)

Feltételes valószínűségek

P(z2|ti)

Együttes valószínűségek

P(ti∩z2)

A posteriori valószínűségek

P(ti|z2) t1 0,75 0,20 0,150 0,150/0,375=0,4 t2 0,25 0,90 0,225 0,225/0,375=0,6 Összeg 1,00 0,375=P(z2) 1,0 A két táblázatból látható, hogy P(z1)+P(z2)=0,625+0,375=1,000, mivel az információ lehetséges kimenetelei teljes eseményrendszert alkotnak.

Lehetséges tényállapotok

ti

A priori valószínűségek

P(ti)

A posteriori valószínűségek P(ti|zk)

z1 z2

t1 0,75 0,96 0,40 t2 0,25 0,04 0,60

Összeg 1,00 1,00 1,00 Természetes, hogy ha az előrejelzés szerint az új utat a hőforrás felé építik (z1), akkor a t1 tényállapot bekövetkezésének a posteriori valószínűsége nagyobb lesz, mint az a priori. Megjegyezzük, hogy míg teljes információ esetén az összes a posteriori valószínűség értéke 1 vagy 0, a beszerezhető nem teljes információ esetén ezek a valószínűségek 0 és 1 között bármilyen értéket felvehetnek. A döntési probléma elemzésében a döntéshozó számára a bizonytalanság nem szűnt meg. A várható pénzérték kiszámítása nem teljes információ esetén Miután kiszámítottuk, hogy a beszerezhető információ milyen hatással van az a priori valószínűségekre (vagyis meghatároztuk a posteriori valószínűségeket), vizsgáljuk meg, hogy a nem teljes információ ismeretében s1 és s2 közül melyik az optimális cselekvési változat. Bontsuk fel az elemzést aszerint, hogy az előrejelzés z1 vagy z2.

Page 179: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

179

Amennyiben a közvéleménykutatási jelentés szerint az új utat a hőforrás felé építik (z1), a valószínűségek:

P(t1|z1)=0,96 P(t2|z1)=0,04

Tehát z1 előrejelzése esetén igen nagy a valószínűsége, hogy az új utat a hőforrás felé vezetik, de bármilyen nagy is a valószínűség, Dr. Vizy mégsem lehet biztos abban, hogy t1 bekövetkezik. Így a pénzügyi vizsgálatainál nem hagyhatja figyelmen kívül t2 esetleges bekövetkezését sem. Nem teljes információ esetében a VP kiszámításakor az a posteriori valószínűségeket szerepeltetjük. Az így kiszámított VP értékeket ezért a posteriori VP-knek nevezzük. Mindkét cselekvési lehetőség a posteriori VP-jének meghatározásában feltüntetjük azt is, hogy a nem teljes információ kimenetele z1: VP(s1|z1)=O11·P(t1|z1)+O12·P(t2|z1)=1400·0,96+(–140)·0,04=1338,4 VP(s2|z1)=O21·P(t1|z1)+O22·P(t2|z1)=770·0,96+700·0,04=767,2 Tehát z1 előrejelzése esetén az s1 cselekvéshez tartozó a posteriori VP érték 1338,4 ezer Ft, az s2 cselekvéshez tartozó a posteriori VP érték 767,2 ezer Ft. A VP kritérium értelmében Dr. Vizy z1 előrejelzése esetén az s1 cselekvési változatot fogja választani, azaz megveszik a telket. Hasonló módon számítjuk ki az a posteriori VP-ket z2 előrejelzése esetén. A számításhoz szükséges a posteriori valószínűségek:

P(t1|z2)=0,40 P(t2|z2)=0,60

VP(s1|z2)=O11·P(t1|z2)+O12·P(t2|z2)=1400·0,40+(–140)·0,60=476 VP(s2|z2)=O21·P(t1|z2)+O22·P(t2|z2)=770·0,40+700·0,60=728 Az a posteriori VP-k közül z2 előrejelzése esetén az s2 cselekvéshez tartozik nagyobb érték, Dr. Vizy tehát úgy dönt, hogy a RÉF ne vegye meg a telket, hanem a bankban betétként helyezzék el a pénzt, ha a közvéleménykutató jelentése szerint az új utat nem a hőforrás felé építik.

IX.7.g Kockázatos döntés az etikai neutralitás elve alapján:

A kockázatos döntések esetében igen figyelemreméltóak az un. etikai neutralitás elvéből levezethető következmények. (Az etikai neutralitás gondolatának kidolgozása Ramsey nevéhez fűződik.) Ha egy kockázatos döntési probléma esetében a döntést hozó közömbös (etikailag neutrális) a cselekvési változatok között, akkor a cselekvési változatok várható értékei számára azonosak. Ebből a magatartásból – a megfelelő számítási eljárással – kiszámíthatók az eseményekhez rendelt látens valószínűségek. Ekkor a közömbösség azt jelenti, hogy a döntést hozó számára a két cselekvési változat várható értéke azonos, tehát:

21 sMsM =

Nézzük meg, hogy ebben az esetben mekkora valószínűségértéket rendelt az egyes tényállapotokhoz – intuitíve és impliciten – a döntést hozó. Az ismeretlen valószínűségeket jelöljük a következőképpen:

Page 180: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

180

ptP =)( 1 ptPtP −=−= 1)(1)( 12

Ekkor az etikai neutralitás elve alapján felírt várható értékek azonossága kifejtve a következő:

1401540)1(1401400)( 1 −=−⋅−⋅= pppsM

pppsM ⋅+=−⋅+⋅= 70700)1(700770)( 2

%1,57

707001401540

)()( 21

=⋅+=−⋅

=

p

pp

sMsM

Így P(t1)=57,1% és P(t2)=42,9% M(s1)=M(s2)=739 970 Ft Ez azt is jelenti, hogy abban az esetben, ha a t1 tényállapot valószínűsége 57,1%-nál nagyobb, a telekvásárlás, mint cselekvési változat mindig előnyösebb, mint a pénz bankba helyezése. Látható egyúttal az is, hogy valójában egy látszólag bizonytalan döntési osztályba tartozó döntési probléma valójában a kockázatos döntési osztályba esik, hiszen a valószínűségek implicit jelenléte kimutatható.

IX.7.h Biztos döntések osztálya

A biztos döntések osztályába tartoznak mindazok a döntési problémák, amelyek esetében biztosan tudjuk, hogy egy cselekvési változat esetében melyik következmény lesz az eredmény. Ez kétféleképpen állhat elő: biztosan (tehát 1 valószínűséggel) tudjuk, hogy melyik tényállapot következik be, vagy pedig a cselekvési változathoz tartozó egyetlen eredmény (következmény) bekövetkezését tekintjük biztosnak. Gyakorlatilag a két eset azonos, mert ha csak egyetlen tényállapotot tekintünk biztosnak, akkor egy cselekvési változat és egy biztos tényállapot biztos körülményt határoz meg. Tehát bizonyosságról beszélhetünk olyan típusú döntési körülmények esetében, amelyekben a döntéshozó minden olyan tényezőt pontosan ismer, amely tényezők a következményeket befolyásolják. A döntéshozó teljes információval rendelkezik. Ha bizonyosság körülményei között kell dönteni, akkor a döntéshozó biztosan tudja, hogy a lehetséges események közül melyik következik be. Így a teljes információ birtokában pontosan meg tudja határozni, hogy az egyes cselekvési lehetőségekhez milyen következmények tartoznak. Ezután a döntési probléma már csak abból áll, hogy a döntéshozó minden egyes cselekvési lehetőséghez kiszámítja az ismert esemény bekövetkezéséből adódó következményt, majd kiválasztja azt a cselekvést, amely optimális, vagyis a döntéshozó számára a legelőnyösebb következménnyel jár. A biztos döntések osztályában használt döntési kritérium maximum vagy minimum kritérium . Az ilyen problémák megoldására dolgozták ki a matematikai programozás néven ismert eljárásokat, amelyekkel véges számú lépésben közvetlenül megtalálható, (illetve kiszámítható) a maximális (vagy minimális) eredményt nyújtó cselekvési változat. A matematikai programozás eljárásai közül a legismertebb a lineáris programozás, és röviden foglalkozunk majd a dinamikus programozással is.

Page 181: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

181

IX.7.i Döntés konfliktus esetén

Konfliktusról akkor beszélünk, ha a döntéshozó számára bármelyik lehetséges cselekvésének következménye attól függ, hogy ellenfele hogyan cselekszik. Ez az ellenfél most már nem a tényállapotok rendszere, hanem egy intelligens ellenfél. Ilyen problémában tehát több döntéhozó dolgozik egymás ellen és általában egymás rovására. Egyikük sem tudja, hogy végül melyik lehetséges következmény realizálódik. Ilyen helyzetek fordulnak elő pl. konkurens vállalatok esetében. Példaként tekintsünk egy egyszerűsített piaci helyzetet, ahol A és B üdítőitalgyártó cégek konkurenciáját vizsgáljuk. Mindkét cég ugyanattól a gyártól veszi a flakonokat. Az üveggyár most egy újfajta üdítőitalos palackot kínál megvételre mindkét cégnek. Az új palack drágább, mint a régi, de szebb. Az A cég illetékese a következőképpen okoskodik: ”Most kb. 100 pénzt keresek az üdítőn. (Azt, hogy mekkora a pénzegység, és milyen időszakra vonatkozik nem közölte velünk.) Nekem nagyon tetszik az új flakon, és biztos, hogy a vevőimnek is tetszene. Ha én áttérek az új flakonra, akkor 110 pénzt tudok keresni abban az esetben, ha B nem veszi meg az új flakont. Ha viszont B veszi meg a flakont, és nem én, akkor nyereségem 95-re csökken. Ha mindketten áttérünk az új flakonra, ez azt jelenti, hogy az áraink kicsit emelkednek, forgalmunk talán kicsit csökken, ez kb. 98 pénzegység nyereséget jelentene számomra.” A gondolatmenet alapján készíthetünk az A cég számára egy feltételes kifizetési táblázatot. Ez a táblázat világosan mutatja, hogy A döntésének következményei nemcsak az általa választott cselekvéstől függnek, hanem attól is, hogy B hogyan cselekszik.

B cselekvése A cselekvése áttér az új

üvegre nem tér át

áttér az új flakonra 98 95 nem tér át 110 100

Hasonló módon képzelhetünk el egy B számára készíthető feltételes kifizetési táblázatot. B cselekvéseinek következményei is függnek mind a saját, mind a konkurens vállalat cselekvéseitől. Ha a döntési problémánál konfliktus jellemzi a körülményeket, akkor a játékelmélet hívható a problémák megoldásához segítségül. Mi csak azokkal a döntési problémákkal foglalkoztunk jelen tárgy keretei között, amelyekkben kockázat, ill. bizonytalanság szerepel.

Page 182: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

182

X. Komplex rendszerek összemérési problémai, rangmódszerek alkalmazása55

55 A fejezet Kindler József – Papp Ottó: Komplex rendszerek vizsgálata, Műszaki Könyvkiadó, Budapest, 1977 vonatkozó fejezeteinek a felhasználásával készült.

Page 183: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

183

X.1 Bevezetés

A gépkocsi-, vagy lakásvásárlástól kezdve egy adott munkakörre jelentkezők közötti választásokon át, egészen a szépségversenyekig igen sok olyan „problémát” találunk, ahol komplex rendszerek (gépkocsik, lakások, jelentkezők, szépségverseny résztvevői) közötti döntés problémájával állunk szemben. A döntés választást jelent, azonban ehhez szükség van a szóban forgó ún. komplex rendszerek rendezésére. E rendezéssel kapcsolatban számos kérdés merül fel. Ha döntésünket az általában egzaktnak tekintett számszerű alapra kívánjuk helyezni, akkor azonnal – peremfeltételként – felmerülnek a számszerűsítés, mérés elvi kérdései. Ha ezeket tisztáztuk, a következőkkel kell szembenéznünk:

• Hogyan választjuk meg az összemérendő komplex rendszerek közös tulajdonságait? Ha ugyanis egy komplex rendszer végtelen sok tulajdonsággal rendelkezik és mi ezekből csak egy véges tulajdonsághalmazt tudunk érthető módon kezelni, akkor ezeket milyen szempontok figyelembevételével választjuk ki?

• Feltéve, hogy a tulajdonsághalmazt megválasztottuk, hogyan súlyozzuk ezeket, hogyan állapítsuk meg a jelentőségüket. Pl. gépkocsi vásárlás esetén a választott tulajdonsághalmaz (pl. ár, végsebesség, kényelem, fogyasztás, szervizelhetőség stb.) az egyes döntéshozók értékelésében nem azonos súlyúak. Az egyik vásárló számára nagyobb súlya van az árnak, mint a kényelemnek, a másik esetében pedig éppen fordított a helyzet. Mindenképpen felmerül a kérdés: hogyan határozhatjuk meg az egyes tulajdonságok súlyát, jelentőségét?

• Ha az előbbi problémát megoldottuk, akkor hogyan végezzük el az egyes tulajdonságok szerinti rendezést, majd ezután az együttesen tekintett tulajdonsághalmaz szerinti rendezést?

• A komplex rendszerek külön-külön tekintett tulajdonságok szerinti rendezése adhat egyértelmű sorrendet. Ha azonban egyidejűleg több tulajdonság szerint kell a rendezést végezni, akkor az egyértelmű rendezéssel is bajok vannak: ami az egyik szempontból jobb, az a másikból rosszabb, vagyis előnyök és hátrányok egyaránt és egyidejűleg szerepelhetnek. Milyen elvek alapján és hogyan állapítjuk meg ilyenkor a kompromisszumot?

• Az előző pontokhoz társulnak még a számszerűsítési, mérési kérdések módszertani szempontból is.

Látjuk, hogy több problémát kell megoldanunk, mielőtt azonban a fenti kérdések megválaszolására rátérnénk, elsőként a korszerű mérés- és skálaelmélet alapjait foglaljuk össze.

Page 184: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

184

X.2 A mérés, a mérési skálák56

Stevens 1951-es definíciója szerint: „a mérés számok hozzárendelése objektumokhoz, azok tulajdonságaihoz, eseményekhez szabályoknak valamilyen halmaza szerint.” A skála a mérési eredmények értelmezéséhez szükséges információkat rögzíti. A mérés során alkalmazott számsoroktól elvárt tulajdonságok alapján négy különböző skálatípust különböztetünk meg: névleges (nominális), sorrendi/rangsor (ordinális), intervallum- és arányskálát. A mérési skálákat, a mérés szintjét a hozzárendelési szabályok határozzák meg. Mindegyik skálát invarianciájának mértékével lehet jellemezni, vagyis azokkal a transzformációkkal, amelyek a skála struktúráját változatlanul hagyják. Mielőtt az egyes skálákat – ismétlésképpen – részletesebben ismertetnénk, a számokból alkotható formális rendszerek néhány lényeges vonását kell megvizsgálnunk. A számok különféle relációk és műveletek szerint alkothatnak formális rendszert. A rendszert alkotó relációk és műveletek közül az egyenlőség, a sorrendiség és az additivitás minősül lényegesnek a mérési skálák meghatározása szempontjából. Az egyenlőséget, a sorrendiséget és az additivitást a következő axiómák szerint írhatjuk le:

l. vagy A=B vagy A≠B 2. ha A=B, akkor B=A 3. ha A=B és B=C, akkor A=C 4. ha A>B, akkor B<A 5. ha A>B és B>C, akkor A>C 6. ha A=P és B>0, akkor A+B>P 7. A+B=B+A 8. ha A=P és B=Q, akkor A+B=P+Q 9. (A+B)+C=A+(B+C)

Az 1.-3. axióma az egyenlőség, a 4-5. a sorrendiség, a 6-9. az additivitás (összeadás) axiómái. Ezeket az axiómákat használjuk a mérési skálák megkülönböztetésére, vagyis a hozzárendelési szabályok a fenti axiómákban fejeződnek ki.

X.2.a Névleges (nominális) skála

A névleges skála (vagy másképpen fogalmazva a névleges mérés szintje) a számok legkötetlenebb hozzárendelését jelenti. A névleges skálán az egyenlőség az egyedüli reláció az 1.-3. axiómának megfelelően. A névleges mérés szintjén valamilyen objektum (dolog) megjelölésére (megnevezésére) számot használunk, megjegyezve, hogy szóval vagy betűvel való jelölés is megfelelő lenne. Ebben az esetben a számok csak azonosításra szolgálnak, a mérés során hozzárendelt számoktól csak a megkülönböztethetőséget követeljük meg. A névleges számhozzárendelésnek két típusát ismerjük:

• az egyedi dolgok azonosító számozása; • osztályok azonosítása (az egyes osztályokon belül lévő dolgok azonos számot

kapnak).

56 Dr. Kindler József –Dr. Papp Ottó: Komplex rendszerek vizsgálata, Műszaki Könyvkiadó, Budapest, 1977 alapján

Page 185: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

185

A névleges skálán a számok hozzárendelése teljesen kötetlen, és így a számok bármilyen transzformációja alkalmazható anélkül, hogy a skála leíró pontosságából veszítene. A jelölésre tehát bármilyen szám megfelel. A névleges skála a legegyszerűbb mérési forma. A hozzárendelési szabály ebben az esetben a következő: ne rendeljünk azonos számokat különböző osztályokhoz (dolgokhoz) vagy különböző számokat azonos osztályokhoz (dolgokhoz, jelenségekhez, személyekhez stb.). Az egyedi típusú névleges skálán nyert számokból értelmesen levezethető egyedüli statisztikai jellemző a megszámozott egyedek száma. Az osztály típusú esetben meghatározhatjuk az egyes osztályokban lévő egyedek számát, vagyis a gyakoriságokat. Meghatározhatjuk továbbá a legnagyobb gyakoriságú osztályt, a móduszt.

X.2.b Sorrendi (ordinális skála)

A névleges skála továbbfejlesztésének legegyszerűbb lépése, ha két dolgot valamilyen közös tulajdonság alapján hasonlítunk össze. A sorrendi skála megalkotásához a számok azonossági tulajdonságát kifejező axiómákat a számok sorrendiségét tükröző 4. és 5. axiómával egészítjük ki. A sorrendi skála a dolgok viszonylagos helyét is meghatározza, azaz rendezi azokat. A gyakorlatban számos olyan eset van, amikor a megfigyelendő dolgokat valamilyen közös tulajdonságuk alapján hasonlítjuk össze és állítjuk sorrendbe, vagy másképpen kifejezve rangsort készítünk. Hangsúlyoznunk kell, hogy a sorrendi skálán mért dolgoknak egy közös tulajdonság szerint kell összehasonlíthatóknak és tranzitívnak lenni. A sorrendi skála az egyenlőségen kívül a kisebb (<) és nagyobb (>) relációkat is tartalmazza. Ha a tranzitivitás hiányzik, akkor körsorrendről beszélünk (pl. A csapat legyőzi B-t, B csapat C-t, de C csapat legyőzi A-t). Az egyszerű sorrendi skálán mért dolgokhoz különböző – nagyobb vagy kisebb – sorszámokat rendelünk. Bármilyen „sorrendmegőrző” transzformáció a skálát változatlanul hagyja, ezért bármelyik monoton növekvő függvény szerint transzformálhatunk. A sorrendet jelölő mindegyik számhoz hozzáadhatunk egy állandó számot, vagy vehetjük a sorszámok logaritmusát, négyzetét, stb. A sorrendi skálán mért dolgok nincsenek egymástól egyenlő távolságra, vagyis az egymást követő intervallumok nem azonos nagyságúak. Ezért a sorrendi skála számaival csak azokat a műveleteket végezhetjük, amelyek nem tételezik fel az intervallumok azonosságát. Például a két közismert statisztikai jellemzőt – a számtani átlagot és szórást – szigorúan véve nem számíthatjuk ki a sorrendi mérés szintjén nyert számokból. Igaz ugyan, hogy ezeket a statisztikai jellemzőket gyakorlatilag sokszor eredményesen használhatjuk, mégis sorrendi skála esetében a következtetéseket illetően igen óvatosan kell eljárnunk. A sorrendi mérésből nyert számokkal tehát csak azok a műveletek végezhetők, amelyek a skálainvariancia követelményének megfelelnek. A statisztikai műveletek közül tehát alkalmazhatjuk a névleges mérésre engedélyezett műveleteket, továbbá számíthatunk mediánt, kvantiliseket és rangkorrelációs együtthatót. Megjegyezzük, hogy jelenleg számos gazdasági, társadalomtudományi jelenséget csak sorrendi skálán mérhetünk. Az így kapott számok gyakran magasabb szintű mérésnek tűnnek, s ezért sajnos gyakori a nem engedélyezett műveletek alkalmazása, amelynek eredménye a homályos vagy félrevezető értelmezés.

Page 186: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

186

X.2.c Intervallumskála

Ha skálánk rendelkezik a sorrendi skála tulajdonságaival, továbbá a skálán lévő bármelyik két szám különbsége ismert és meghatározott nagyságú, akkor intervallumskáláról beszélünk. Az intervallumskálát a közös és állandó mértékegység jellemzi és a számokat ennek alapján rendeljük a sorba rendezett dolgokhoz. Az intervallumskálán számszerűen egyenlő különbségek a valóságban is egyenlők. Például a 35°C és 45°C közötti hőmérséklet különbség ténylegesen egyenlő a 87°C és 97°C közötti különbséggel. Egy intervallumskálán tehát bármely két intervallum aránya független a mértékegységtől és a nullponttól. Az intervallumskála nullpontját és mértékegységét szabadon választjuk meg. Következésképpen a skálát egy konstans hozzáadása nem változtatja meg, így tehát bármelyik intervallumskála x′=a·x+b transzformációja megengedett (ha a≠0). Az intervallumskála nem felel meg a 6-9. axiómákban megfogalmazott additivitási követelménynek, ezért egyik aritmetikai művelet sem alkalmazható, mert a kivonás, a szorzás és az osztás az összeadásból származtatható. Ha azonban az intervallumskála értékeinek különbségét tekintjük, a különbségek már rendelkeznek az additivitási tulajdonsággal, és így ezek az arányok összehasonlításra is alkalmasak. Egy intervallumskálán tehát bármelyik két intervallum aránya független a mértékegységtől és a nullponttól. Intervallumskálán mérjük a naptári időt, a tengerszint feletti magasságot, bizonyos pszichológiai, pszichofizikai jelenségeket, az intelligenciát, a szélességi-hosszúsági köröket, a vízállást stb. Az intervallumskálán nyert adatokból a mértani átlag és a relatív szórás kivételével valamennyi statisztikai jellemző és mutató számítható.

X.2.d Arányskála (abszolút skála)

Az arányskála rendelkezik az előbbi skálák összes tulajdonságával, valamint a 6-9. axiómákban megfogalmazott additivitási tulajdonsággal is. Az arányskálának valódi nullpontja van és bármelyik két pontjának aránya független a mértékegységtől. Az arányskálának mindig van abszolút nullpontja még akkor is, ha ezt gyakorlatilag nem lehet elérni (pl. a hőmérséklet abszolút nullpontja). Az arányskála számszerű értékei egy konstans értékkel való szorzással transzformálhatók:

x′′′′=c·x ahol c bármilyen nullától különböző szám. Egy mérésnek a másikhoz való aránya változatlan marad akkor is, ha a skála az engedélyezett transzformációnak megfelelően változik (pl. két különböző tárgy hosszát centiméterben és hüvelykben mérve a centiméter- és hüvelykarányok azonosak). Tömeget, hosszúságot, villamos ellenállást, általában a klasszikus műszaki tulajdonságokat stb. arányskálán mérjük. Az arányskálák a műszaki és természettudományokban gyakoriak, míg a gazdaság-, társadalomtudományok területén ritkán használatosak. Arányskálán kapott számokkal az összes arimetikai és statisztikai művelet elvégezhető.

Page 187: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

187

X.3 Komplex rendszerek összemérési problémái

Komplex rendszernek tekintünk minden olyan rendszert, amelyet egyidejűleg több tulajdonság (értékelési tényező alapján) minősítünk57. Definíciónk értelmében tehát komplex rendszer minden olyan rendszer, amelyet egyidejűleg több tulajdonsága alapján tekintünk. Mivel a komplex rendszerek vizsgálatának célja az összemérésen nyugvó értékelő rendezés, ezért a tulajdonság fogalma helyett célszerűbb az értékelési tényező fogalmának használata. Az értékelési tényező így olyan tulajdonság, amelyet nem önmagában, hanem az értékelés folyamatában tekintünk. Csak ebben az értelemben beszélhetünk egy-egy tulajdonság jelentőségéről, fontosságáról, súlyáról.

X.3.a Az értékelési tényezők súlyozása

Kinek a számára, melyik értékelési tényező, milyen mértékben fontos? A kérdésre nincs általános válasz, hiszen az értékelés mindig emberek, vagy emberek csoportjai szempontjából történik, s mivel az emberek érdekei és céljai egymástól eltérnek, sőt olykor egymásnak ellentmondanak, ezért egy és ugyanazon jelenséget különbözőképpen értékelnek. Nyilvánvaló, hogy pl. ipari termékek előállításakor a műszaki szakemberek általában más tényezőket tartanak fontosnak, mint a gazdasági szakemberek. A végfelhasználók között is vannak olyanok, akinek az ár nem számít, és vannak olyanok, akiknél ez rendkívül fontos szempont. Tartós fogyasztási cikkek esetében egyesek a megbízhatóságot, mások viszont az esztétikai megjelenést tartják fontosabb értékelési tényezőnek. A példákat hosszasan lehetne sorolni, de csak a mindennapi tapasztalatot írnánk le. Az értékelési tényezők eltérő súlyozása ugyanis közismert, noha az esetek többségében nem tudatosan érvényesül. Talán ez a rejtettség az oka annak, hogy a fontosság, vagy más néven a súlyozás kérdésével viszonylag ritkán találkozunk. A téma tárgyalásához először be kell vezetnünk a preferenciareláció fogalmát. A preferenciareláció a megelőzési reláció speciális változata, ahol a megelőzés megállapítása előnyben részesítés alapján történik. A preferenciareláció jele: →. Ha a→b (a preferált b-hez), akkor ennek a jelentése az, hogy a döntéshozó a-t előnyben részesíti b-vel szemben, tehát a-t a döntéshozó többre értékeli, ezért azt fogja választani. A preferenciareláció mindig értékelést fejez ki. A preferenciareláció tulajdonságai:

a) a→a hamis (irreflexivitás) b) ha a→b igaz, akkor b→a hamis (aszimmetria) c) ha a→b és b→c igaz, akkor a→c is igaz (tranzitivitás) d) ha a és b azonos preferáltságú, akkor a→b és b→a közül az egyik igaz (trichotómia).

A tranzitivitásnak kitüntetett jelentősége van, ez fejezi ki a következetes döntés követelményét. Ha ugyanis valaki a-t fontosabbnak minősíti b-nél, és b-t pedig fontosabbnak c-nél, akkor, ha következetes, akkor a-t fontosabbnak kell ítélnie c-nél. Ámbár ez a követelmény magától értetődőnek és problémamentesnek látszik, látni fogjuk, hogy valójában mégsem az.

57 Így tehát, ha egy gépkocsinak csak az árát tekintjük, akkor a gépkocsi definíciónk szerint nem komplex rendszer. Ha azonban az ára mellett még a fogyasztását is figyelembe vesszük, akkor meghatározásunk értelmében már komplex rendszernek minősítjük.

Page 188: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

188

Mérés- és skálaelméleti ismereteink birtokában rátérünk a súlyozás problémájának tárgyalására.

X.3.b Súlyozás sorrendi skálán

Esetünkben az értékelési tényezők relatív, tehát egymáshoz viszonyított súlyának a megállapítása a feladatunk oly módon, hogy a tranzitivitás követelményének eleget tegyünk. Ha az értékelési tényezők súlyát sorrendi skálán kívánjuk mérni, akkor először az értékelési tényezők preferenciasorrendjét kell megállapítanunk, majd ezután valamilyen konvenció szerint a preferenciarelációra rendezett értékelési tényezőkhöz kell a számokat hozzárendelnünk. Az értékelési tényezők rangsorolása Az értékelési tényezők rangsorolásánál, preferencia sorrendjének megállapításánál két módszert kell megemlítenünk: a közvetlen rangsorolást és a páros összehasonlítás módszerét. A közvetlen rangsorolás a köznapi gyakorlatban ismert sorszámozásnak felel meg. Itt a szóban forgó dolgokat közvetlenül rangsoroljuk, és közvetlenül rendeljük hozzájuk a rangszámokat, amelyeket a köznyelv sorszámoknak nevez. A gyakorlatban ebben az esetben a dolgok közvetlen rangsorolása és a számok hozzárendelése egybeolvad, illetve tudatosan nem válik szét. A közvetlen rangsorolás előnye, hogy egyszerű eljárástechnikája révén az összehasonlítandó alternatívák együttes áttekintése után, helyezési számok (rangszámok) megadásával gyorsan lefolytatható. Hátránya viszont, hogy nem ad felvilágosítást az értékelő személyek véleményének megbízhatóságáról, következetességéről. Ebben az esetben nem tudjuk megállapítani a tranzitivitás követelményének megsértését, mert ezt a közvetlen rangsorolás elfedi. A közvetlen rangsorolás további hátránya, hogy az így kialakított sorrend első és utolsó tagja a biztos, a köztes rangszámokat kapó értékelési tényezők sorrendje pedig bizonytalan, így nem kapunk semmiféle felvilágosítást az egyéni értékrendek megbízhatóságáról. Közvetett rangsoroláshoz, az egyéni értékrendek közvetett megismeréséhez az ún. páros összehasonlítás módszerének alkalmazásával juthatunk el. Ez az eljárás az alternatívák közvetett, páronkénti összehasonlításán alapul. Az eljárás alkalmazása ott indokolt, ahol több értékelési tényezővel kell számolnunk, s azok fontossága, súlya eltér egymástól. A különböző értékelési tényezők súlyozását a szubjektív megfontolások torzíthatják. Az értékelés minél megbízhatóbb elvégzését a matematikai módszerek felhasználásával lehet biztosítani. Ekkor az eredményt a páronként felállított elemek közötti preferencia-döntésekre vezetjük vissza. A súlyszámokat úgy határozzuk meg, hogy az értékelési tényezőket páronként összehasonlítva eldöntjük, melyiket preferáljuk, melyiket tartjuk fontosabbnak, és a döntéseket értékeljük. A páros összehasonlítás módszerének tárgyalásához visszanyúlunk a preferenciareláció fogalmához. Egy értékelő személy (döntéshozó) bármely két: a és b értékelési tényező esetén háromféle értékelést adhat meg: • a-t előnyben részesíti (preferálja) b-vel szemben: a→b, vagy • a-t és b-t azonos fontosságúnak (indifferensnek) tekinti: a↔b, vagy • b-t preferálja a-val szemben: b→a. Kendall angol matematikus javaslatára a preferenciareláció tranzitivitására, ill. intranzitivitására (a tranzitivitás megsértésére) egyszerűbb jelölésmódot javasol. Az eredeti írásmód szerint a tranzitivitást a következőképpen írjuk fel: ha a→b és b→c, akkor a→c,

Page 189: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

189

vagyis, ha a fontosabb b-nél és b fontosabb c-nél, akkor a is fontosabb c-nél. Kendall javaslata szerint a három dolgot háromszög alakban rendezzük el. Az ilyen elrendezést hármasnak vagy triádnak nevezzük. A preferenciareláció tranzitivitása vagy intranzitivitása szerint a hármas kétféle lehet. A tranzitivitást kifejező eredőhármas:

a b

c

a b

c Az intranzitivitást (inkonzisztenciát) kifejező körhármas:

A páros összehasonlítás módszerének lépéssorozata

Tételezzük fel, hogy n számú dologból elkészítjük az 2

)1( −⋅ nnszámú lehetséges párosokat, és

a döntéshozó az egyes párosokban kifejezi preferenciáját, tehát azt kell eldöntenie, hogy egy-egy párban melyik dolgot preferálja. (Az értékelést végzők a párok mindegyikénél aláhúzással jelölik az általuk fontosabbnak ítélt tényezőt.) Preferenciáiból meghatározhatjuk az inkonzisztens triádok számát. Mivel bizonyítható, hogy a körhármasok maximális száma páratlan számú n esetében:

24

3

)max(

nnd páratlann

−==

Páros számú n esetében:

24

43

)max(

nnd párosn

−==

Ha egy adott esetben meg tudjuk határozni a d körhármasok tényleges számát, szemben a körhármasok dmax maximális számával, akkor a kettő hányadosaként megkapjuk az intranzitivitást (inkonzisztenciát, következetlenséget) mutató arányszámot. Általában azonban nem ezt szokták megadni, hanem ezt az arányszámot 1-ből levonva.

max

1d

dK −=

Így a K következetességi mutató a következő képletbe foglalható (felhasználva a K-ra vonatkozó korábbi képletünket):

nn

dK

−−=

3

241 , páratlan n esetében

nn

dK

4

241

3 −−= , páros n esetében

Ha K=1, akkor ez azt jelenti, hogy nincs jelen körhármas, tehát a szóban forgó döntéshozó teljesen következetes, vagyis egyetlen esetben sem sértette meg a tranzitivitás követelményét. Ha a páros összehasonlítás eljárásában a preferenciagyakoriságot a-val jelöljük, vagyis a azt jelenti, hogy az összes párosban hányszor preferált az adott dolog, akkor könnyen belátható, hogy az a preferenciagyakoriság, az r rangszám és az n között fennáll az alábbi összefüggés: n=a+r.

Page 190: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

190

Ha feltételezzük, hogy értékelési tényezőt páros összehasonlítással preferálunk, és hogy az E2 értékelési tényező preferenciagyakorisága , ebben az esetben az értékelési tényező rangszáma: . Mivel a következetesség mértéke fontos információt jelent, és ezt csak a páros összehasonlítás eljárásával tudjuk feltárni, ezért érthető módon a páros összehasonlítást sok esetben előnyben részesítjük a közvetlen rangsorolással szemben. A páros összehasonlítás a súlyszámképzés gyakorisága miatt az egyik leggyakrabban alkalmazott technika. Tekintve, hogy időigényes, de jól tipizálható technika, egy számítógépes program elkészítése, támogatása jelentős időmegtakarítást és pontos alkalmazást eredményezhet.

X.3.c A következetesség szignifikancia vizsgálata

A páros összehasonlítás során felvilágosítást kapunk az összehasonlításokat végző személy következetességéről és preferenciáinak konzisztens voltáról. Láttuk, hogy ennek mértékét a körhármasok számával mérjük. A szignifikanciavizsgálathoz n>7 esetén a χ2-eloszlást használhatjuk, mert n (a páros összehasonlítás elemeinek száma) növekedésével d eloszlása ehhez közelít58. Ekkor a szabadságfokokat, és χ

2 értékét a következőképpen számítjuk ki:

2)4(

)2()1(

−−⋅−⋅=

n

nnnDF

DFdn

n+

+−

−=

2

1

34

1

4

82χ

Az eloszlás azonban d nagyobb értékeitől a kisebb értékekig terjedő valószínűségeket adja meg, és ezért annak a valószínűségét, hogy d legalább a táblázatban feltüntetett konkrét értéket éri el a χ2 valószínűségek komplementere adja, vagyis a táblázatbeli valószínűségeket le kell vonni 1-ből. Példa Tételezzük fel, hogy n=7 elemre páros összehasonlítással d=13 körhármast találtunk. Ha a χ

2 eloszlást használjuk, akkor előbbi képleteink alapján:

33,239

567

)4(

)2()1(2

=⋅⋅=−

−⋅−⋅=n

nnnDF

33,1333,234

)5,01375,8(8

2

1

34

1

4

82 =++−⋅=+

+−

−= DFd

n

A χ2 eloszlás táblázatában ez a χ

2 érték kb. 95%-os szignifikancia szintnek felel meg, és ennek komplementerét véve 1-0,95=0,05, vagyis 5% d szignifikancia szintje. A kapott eredmény szerint tehát legfeljebb ekkora a valószínűsége annak, hogy a d=13 körhármast véletlenszerűen kaptuk. Mivel ennek kicsi a valószínűsége, gyakorlatilag úgy döntünk, hogy az összehasonlításokban d=13 körhármas nem a véletlen műve, az illető döntéshozó szignifikánsan következetlen, ill. a következetlenség komplementerét – a következetességet –

58 n=2-7-ig a szignifikancia vizsgálatot egy speciális táblázat alapján végezzük, amely annak valószínűségeit mutatja, hogy az egyes n-ek mellett legalább d számú körhármast kapunk a preferenciák véletlenszerű eloszlásánál.

Page 191: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

191

nézzük: következetessége nem szignifikáns, hanem igen nagy valószínűséggel a véletlen műve.

X.3.d Súlyozás intervallumskálán

Az értékelési tényezők intervallumskálán való mérése azt jelenti, hogy nemcsak arra vonatkozóan kapunk információt, hogy az egyik értékelési tényező preferáltabb-e, mint a másik, hanem azt is meg tudjuk mondani, hogy mennyivel. Voltaképpen tehát a preferenciák intenzitásának intervallumszintű méréséről van szó. Egyszerű közvetlen becslés Az egyszerű közvetlen becslés közismert és gyakran használt eljárás, amelyet többféle változatban használnak. Feltételezzük, hogy az értékelési tényezők teljes preferenciasúlya 1, tehát egységnyinek vesszük. Ennek alapján minden értékelési tényező súlyszámát egyszerű közvetlen becsléssel meghatározzuk oly módon, hogy azok összege 1 legyen. A becslést megkönnyíti, ha az értékelési tényezők preferencia-sorrendjét előzetesen megállapítjuk. Ebből megtudjuk, hogy melyik súlyszámnak kell nagyobbnak lennie. Tegyük fel, hogy 5 értékelési tényezőt kell súlyoznunk egyszerű közvetlen becsléssel. A preferencia-sorrend a következő:

E2→E5→E1→E3→E4 Az egyszerű közvetlen becsléssel megállapított súlyszámok az alábbiak:

E2 0,45 E5 0,30 E1 0,15 E3 0,08 E4 0,02 összesen 1,00

Semmi akadálya nincs annak, hogy a súlyszámok összegének a 100-at válasszuk. Ebben az esetben %-os formát is választhatunk. Statisztikai értelemben megoszlási viszonyszámokat határozunk meg. Sokszor alkalmazzák az ún. pontozásos módszert, amely az egyszerű közvetlen becslés egyik változatának tekinthető. A fentiek alapján semmi különbség nincsen, nem %-okról, hanem pontokról beszélünk. Ekkor 100 pontot kell felosztani az értékelési tényezők között a becsült súlynak megfelelően. Az eljárás előnye az alkalmazás egyszerűségében rejlik, hátránya, hogy a becslés hibájáról és a megbízhatóságáról nincs információnk. Jogosan merül fel a kérdés: A becslést végző személy saját rendszerében következetesen járt-e el? A válasz nemleges, ezzel a módszerrel nem jutunk megbízhatónak tekinthető intervallumszintű súlyszámokhoz. Churchmann-Ackoff-féle eljárás Az eljárás alapgondolata és kivitelezése egyszerű. Tételezzük fel, hogy van négy különböző hosszúságú pálcánk, és nem áll rendelkezésre semmiféle mérőeszköz. Szeretnénk meghatározni a pálcák relatív hosszát. Az egyik lehetséges eljárás szerint a pálcákat nagyság szerinti sorrendbe állítjuk. Jelöljük a leghosszabb pálcát A-val, a második leghosszabbat B-vel, a harmadikat C-vel és a legrövidebbet D-vel. Tegyük fel, hogy A értékének 100%-ot veszünk, és külön-külön megbecsüljük B, C és D értékét A-hoz viszonyítva. A következő eredményeket kapjuk: B=60%, C=30%, D=20%. Ezután a B, C és D pálcákat egymáshoz illesztve az így kapott B+C+D hosszúságot hasonlítjuk össze A-val. Ha eredeti becslésünk helyes volt, úgy ennek a becslésnek 110%-kal egyenlőnek lennie. Ha az összehasonlítás nem

Page 192: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

192

kielégítő, akkor az eredeti becslést módosítanunk kell. A következő lépésben A-t B+C-vel hasonlítjuk össze és B+C-nek 90%-nak kell lennie. Ezzel az összehasonlítással ismét ellenőrizhetnénk eredeti becsléseinket. Végül B-t hasonlítanánk össze C+D-vel és B-nek C+D 120%-ának kell lennie. Az eljárás lényegében a relatív becslések módszeres ellenőrzéséből áll, és ezt az egymást követő összehasonlításokkal végezzük. Fontos kiemelni, hogy az eljárás sorrendi skálából indul ki, hiszen az első lépés az értékelési tényezők preferencia-sorrendjének a megállapítása. Mérés- és skálaelméleti szempontból tehát arról van szó, hogy a sorrendi skáláról a mérési szint emelésével intervallumskálára lépünk át. Guilford-féle eljárás Az intervallumskálán való súlyozásnak többféle eljárása ismert, ezek közül a Guilford-féle eljárást ismertetjük, mert pszichológiai és matematikai szempontból a legmegalapozottabb eljárás. Az eljárás alapja a már ismertetett páros összehasonlítás, amellyel sorrendi skálán már rangsorolni tudjuk az értékelési tényezőket. A kérdés most az, hogy a páros összehasonlítás alapján lehetőségünk van-e magasabb szintű, azaz intervallumskálán való súlyozásra? A kérdésre a választ az egy személy által többször vagy több személy által egyszer megismételt páros összehasonlítások eredményeinek vizsgálatával adhatjuk meg. A Guilford-féle eljárás a standardizált normális eloszlást használja a transzformálás során, technikailag pedig a páros összehasonlítás módszerét. Egyetlen döntéshozó esetén mutatjuk be az eljárást. Tegyük fel, hogy a döntéshozó olyan döntési helyzetben van, hogy összesen 10 értékelési tényezőt kell súlyozni intervallumskálán.

1. A döntéshozó elkészíti a tíz értékelési tényezőből készíthető összes lehetséges párt.

Ezek száma az 2

)1( −⋅ nn összefüggés alapján esetünkben 45

2

910 =⋅.

2. Valamennyi párban a döntéshozó aláhúzással jelöli meg, hogy melyik értékelési tényezőt preferálja. Elméleti megfontolásokból kiindulva nincs megengedve az azonos preferálás.

3. Összeállítja a preferencia-táblázatot, ahol a sorokban és oszlopokban egyaránt az értékelési tényezők szerepelnek. Az egyes sorok és oszlopok találkozásánál megjelöli az adott páros preferenciaviszonyát azzal a konvencióval, hogy a mezőben található jel a sornak megfelelő tényező preferálását jelenti az adott oszlopnak megfelelő tényezőhöz viszonyítva. Példaként álljon itt az alábbi táblázat! A táblázatból látható, hogy az E1 tényező preferált az összes többi értékelési tényezővel szemben, az E5 értékelési tényező pedig az E1 és E3 kivételével az összes többi tényezővel szemben.

Ej E1 E2 E3 E4 E5 E6 E7 E8 E9 E10 a a2 p u E1 x 1 1 1 1 1 1 1 1 1 9 81 0,95 +1,64 E2 x 1 1 1 1 1 5 25 0,55 +0,13 E3 x 1 1 1 1 1 1 6 36 0,65 +0,39 E4 1 x 1 1 1 1 5 25 0,55 +0,13 E5 1 1 x 1 1 1 1 1 7 49 0,75 +0,67 E6 x 1 1 1 3 9 0,35 -0,39 E7 1 x 1 1 1 4 16 0,45 -0,13 E8 x 0 0 0,05 -1,64 E9 1 1 x 2 4 0,25 -0,67 E10 1 1 1 1 x 4 16 0,45 -0,13 Σ 0 4 3 4 2 6 5 9 7 5 45 261

Az a oszlopban található számok azt mutatják, hogy a páronkénti összehasonlításokban az adott sornak megfelelő értékelési tényező hányszor volt preferálva a többihez viszonyítva.

Page 193: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

193

Az a számérték tehát az adott értékelési tényező preferenciagyakorisága. Az oszlopösszegek pedig a hátrányok összegét mutatják. Egy adott értékelési tényező esetében a sorösszegnek és oszlopösszegnek az (n–1) számértéket kell kiadnia. Az a

oszlop összege pedig 452

)1( =−⋅ nn.

Mivel a preferenciareláció feltétlen tranzitivitását nem írtuk elő, így elvileg feltételezhető, hogy a döntéshozó preferenciái között vannak inkonzisztens körhármasok is. Kiszámítjuk a döntéshozó konzisztencia-mutatóját. 4. Kiszámítjuk tehát a konzisztencia-mutató számértékét, páros számú eredményhalmaz

esetében: nn

dK

4

241

3 −−= , ahol d az inkonzisztens körhármasok száma.

A d-t az alábbi formula segítségével számítjuk ki: 212

)12()1(2∑−−⋅−⋅=

annnd .

Esetünkben: 122

261

12

19910 =−⋅⋅=d , ebből 70,0401000

12241 =

−⋅−=K

5. Meghatározzuk a preferencia arányokat (p) a következő módon:

n

ap

5,0+=

6. A preferencia arányokat a standardizált normális eloszlás u értékeivé transzformáljuk, ezek az u értékek szerepelnek a táblázatunk utolsó oszlopában. Az u értékek jelentik egyúttal az intervallumskálánk skálaértékeit. Mivel intervallumskáláról van szó, ezért a kényelmesebben használható 0 kezdőpontú és 100 végpontértékű skálává alakíthatjuk át. Ehhez a következő transzformációt kell végrehajtani:

100minmax

min⋅

−−

=ii

i

uu

uuZ

Példa: a legnagyobb skálaértéke az E1 értékelési tényezőnek van: +1,64, a legkisebb E8-nak: -1,64. A +1,64-nek a 100 számértéket feleltetjük meg, a -1,64-nek a nullát. A többi u skálaértéket ennek megfelelően rendezzük interpolálással. Így pl. az E5 értékelési tényező

u=+0,67 értékének a százas rendezésben a 5,70100)64,1(64,1

)64,1(67,0 =⋅−−+−−+=Z skálaérték felel

meg. Ezeket a skálaértékeket tekintjük az értékelési tényezők súlyszámainak. Látjuk szemléletesen, hogy az E1 kiugróan jelentős az E8 pedig kevéssé jelentős a döntéshozónk értékítéletében. Rá kell azonban mutatni arra, hogy nincs objektív fizikai megfelelőnk annak eldöntésére, hogy a döntéshozó fenti skálában tükröződő mért értékei objektíven minek felelnek meg. Összevethetnénk más döntéshozónknak ugyanebben a döntési helyzetben hozott – és az előzőekben leírt eljárás alapján számított – mért értékeivel vagy esetleg valamilyen alapon már előzőleg kimunkált és standardnak tekintett értékkel.

Page 194: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

194

0

10

20

30

40

50

60

70

80

90

100 E1

E8

E5

E3

E2, E4

E7, E10

E6

E9

0

10

20

30

40

50

60

70

80

90

100 E1

E8

E5

E3

E2, E4

E7, E10

E6

E9

A skála intervallumszintű, tehát nem jogosít fel olyan következtetésekre, hogy pl. az E1 tényező (100) kétszer nagyobb súlyú, mint az E7 (46). A súlyszámok ugyanis kisebb-nagyobb távolságokat jelölnek egy kontiniuumon, és a páros összehasonlítás módszerével kapott skálaértékekkel ezeket a relatív távolságokat lehet mérni. Így tehát az E1 és E7 tényező vonatkozásában annyit mondhatunk, hogy a döntéshozó értékelésében az E7 tényező félúton helyezkedik el E1 és E8 között. Láttuk, hogy esetünkben a döntéshozó a páronkénti összehasonlításokban nem volt következetes, és feltételezhető, hogy inkonzisztenciája véletlen hatások következménye. Nagyobb mintával javítani lehet az eredmények megbízhatóságát, ezért mindegyik párossal többszörös, ismételt összehasonlítást lehet végezni. Ez háromféleképpen valósulhat meg:

1. egyetlen döntéshozó mindegyik párost többször megítéli, 2. több döntéshozó mindegyik párost egyszer megítéli, 3. több döntéshozó mindegyik párost többször megítéli.

Éppen a 2. esetnek van esetünkben nagy gyakorlati jelentősége a csoportos döntésekkel kapcsolatban.

X.4 Csoportos döntés

X.4.a Teljes egyetértés és teljes ellentét

Rövid kitéréssel felvázoljuk az egyetértés mérésének matematikai és logikai lényegét. Tételezzük fel, hogy öt értékelési tényezőt közvetlenül rangsorolunk és a rangszámokat az első öt természetes szám jelenti. Feltételezzük továbbá, hogy minden rangsorolás esetében a döntéshozók teljes mértékben következetesek, tehát körhármasokat nem kell feltételeznünk. Példaként tekintsünk két döntéshozót (X és Y), akik közvetlen rangsorolással a preferenciáikat az alábbi módon fejezik ki:

döntéshozó E1 E2 E3 E4 E5 X 1 2 3 4 5 Y 5 4 3 2 1 R 6 6 6 6 6

Page 195: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

195

Bizonyítható, hogy ebben az esetben X és Y között maximális a véleményeltérés, és ezt az esetet teljes ellentétnek nevezzük. Az eltérések négyzetösszege ugyanis csak abban az esetben maximális, ha a két rangszámsor fordított sorrendben van felírva. (Az eltérések négyzetösszegét úgy számítjuk ki, hogy X rangszámaiból kivonjuk Y megfelelő rangszámait, a különbségeket négyzetre emeljük, majd összegezzük.) Könnyen belátható, hogy egy harmadik döntéshozó belépésével nem tudunk előállítani olyan rangszámsort, hogy a Z döntéshozó X-szel és Y-nal is teljes ellentétben legyen. Így a maximális véleményeltérés, azaz teljes ellentét kizárólag csak két döntéshozó között lehetséges. Megfordítva nem ez a helyzet, vagyis teljes egyetértés elvileg akárhány döntéshozó között lehetséges, persze ennek annál kisebb a valószínűsége, minél több döntéshozó között vizsgáljuk az egyetértés mértékét.

döntéshozó E1 E2 E3 E4 E5 X 1 2 3 4 5 Y 1 2 3 4 5 R 2 4 6 8 10

Hogyan mérjük az egyetértést? Az előbbi rangszámainkból látjuk, hogy előállítottunk egy R mennyiséget, amely X és Y megfelelő rangszámainak összegét jelenti. Azt is látjuk, hogy az R mennyiségek a teljes ellentét esetében egyformák, azaz ingadozásuk nulla. Teljes egyetértés esetében pedig az R mennyiségek ingadozása maximális. Ha előállítunk egy mérőszámot az R mennyiségek ingadozásának mérésére, akkor megalapoztuk az egyetértés mérését.

2)(∑ −=∆j

jj RR

ahol ∆ a négyzetes eltérés, Rj az egyes rangszám összegek, 2

)1( +⋅= nkRj a rangszám-

összegek számtani átlaga, ahol k a döntéshozók száma, n az értékelési tényezők száma. Vagyis a ∆ teljes ellentét esetében 0, teljes egyetértés esetén pedig a maximális értékét veszi fel. A teljes egyetértés ∆max értékét közvetlenül kiszámíthatjuk a következő összefüggés alapján:

12

)( 32

max

nnk −⋅=∆

ahol k a döntéshozók száma, n az értékelési tényezők száma. A teljes egyetértés ∆max értékéhez viszonyítjuk a tényleges ∆ értéket. A kapott viszonyszám (W) a Kendall-féle rangkonkordencia együttható:

)(

1232

max nnkW

−⋅∆⋅=

∆∆=

W értéke teljes egyetértés esetén 1, teljes ellentét esetében 0. Természetesen fennáll a lehetősége annak, hogy a véletlen következtében kapunk W>0 értéket. Tisztán matematikai szempontból tekintve W tulajdonképpen egy többváltozós rangkorrelációs együttható, ezért el kell végezni W szignifikancia vizsgálatát, amelyet majd a következő alfejezetben mutatunk be. A Kendall-féle módszer alkalmazásában két változatot különböztetünk meg: a normál esetet, amikor az egyes értékelési tényezők szerinti preferencia-sorrendben nincsenek azonos rangszámok, vagyis az adott értékelési tényező szempontjából a szóban forgó komplex rendszerek preferáltsága különböző. A másik változat a rangszámegyezések esete, másnéven kötések előfordulása.

Page 196: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

196

Páros összehasonlításnál az azonos preferálásnak kicsi a valószínűsége, ha az értékelési tényező csak sorrendi skálán mérhető, és így a preferálásra vonatkozó döntést közvetlen megítélés alapján hozzuk. Ha azonban az értékelési tényező intervallum- vagy sorrendi skálán mérhető, akkor az azonos preferálás valószínűsége nagyobb. Például, az ár, mint értékelési tényező arányskálán mérhető, és előfordulhat, hogy két összemérendő rendszernek azonos az ára. Ilyen és hasonló esetekben előfordul rangszámegyezés. A rangszámegyezésre a következő konvenciót használjuk: az azonosnak minősülő dolgok azoknak a rangszámoknak a számtani átlagát kapják rangszámként, amelyeket akkor kapnának, ha nem volnának azonosak59. Normál eset (nincs kötés) A Kendall-együttható (W) kiszámításához először meghatározzuk a komplex rendszerek rangszámait az egyes értékelési tényezők szerint. Ezután a rangszámokat k soros és n oszlopos táblázatba rendezzük, ahol k az értékelési tényezők számát, n pedig a komplex rendszerek számát jelenti. Megállapítjuk az Ri rangszámösszegeket, kiszámítjuk a rangszámösszegek Ri átlagát, majd kiszámítjuk a rangszámösszegek szóródását mutató ∆ négyzetes eltérést:

2)(∑ −=∆j

jj RR

Kiszámítjuk ∆ maximális értékét, ami esetünkben a 100%-os korrelációt mutatja, jelentése most pedig az, hogy valamennyi értékelési tényező szempontjából azonos a komplex rendszerek preferencia-sorrendje. Ebben az esetben tehát a komplex rendszerek között van abszolút első, vagyis olyan rendszer, amelyik valamennyi értékelési tényező szempontjából preferált a többihez, azaz ún. szuperrendszer. Elméletileg lehetséges, a tapasztalataink szerint azonban ritkán fordul elő. A W rangkonkordencia együtthatót a normál esetre a következőképpen számítottuk:

)(

1232 nnk

Wm −⋅

∆⋅=∆∆=

Példa 6 komplex rendszert három értékelési tényező szerint rangsorolunk. A kapott rangszámokat táblázatba rendezzük:

T1 T2 T3 T4 T5 T6 E1 1 6 3 2 5 4 E2 1 5 4 3 6 2 E3 3 4 5 2 6 1 Ri 5 15 12 7 16 7

Számítások:

5,102

)16(3

2

)1( =+⋅=+⋅= nkRj

59 Öt gépkocsit, mint komplex rendszert tekintünk az Ár értékelési tényező szempontjából. Az ár (Ft-ban kifejezve) arányskálán mérhető, és a gépkocsik ár szerinti preferenciasorrendje: T1=5 000 000 T2=7 400 000 T3=8 500 000 T4=8 500 000 T5=10 000 000 Látjuk, hogy a T3 és T4 rendszerek azonosan preferáltak. Ha a preferenciasorrendet sorrendi skálán és rangszámokkal fejezzük ki, akkor a fenti konvenciónak megfelelően a preferenciasorrend és a megfelelő rangszámok:

T1 → T2 → T3 ↔ T4 → T5 1 2 3,5 3,5 5

Page 197: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

197

5,119)5,107()5,1016()5,107()5,1012()5,1015()5,105()( 2222222 =−+−+−+−+−+−=−=∆ ∑j

jj RR

758,0)66(3

5,11912

)(

123232

=−⋅

⋅=−⋅

∆⋅=∆∆=

nnkW

m

Rangszámegyezés esete (van kötés) Ha a rangsorokban kötések fordulnak elő, akkor ezek torzító hatását korrekcióval kell figyelembe vennünk. A korrekciós tényező a következő:

12

)( 3∑ −= d

ttL

ahol t az egy kötésben lévő azonos rangszámok száma, d a kötések száma egy rangsorban. A korrekciós tényező beépítésével rangkonkordencia együtthatónk a következőképpen módosul:

∑⋅−−⋅⋅

∆=

L

LknnkW

)(121 32

Példa 10 komplex rendszert mérünk össze három értékelési tényező alapján. A rangsorolás után összeállítjuk a rangszám-táblázatot:

5,162

)110(3

2

)1( =+⋅=+⋅= nkRj

591)5,165,26(...)5,169()5,165,6()5,165,5()( 22222 =−++−+−+−=−=∆ ∑j

jj RR

T1 T2 T3 T4 T5 T6 T7 T8 T9 T10

E1 1 4,5 2 4,5 3 7,5 6 9 7,5 10 E2 2,5 1 2,5 4,5 4,5 8 9 6,5 10 6,5 E3 2 1 4,5 4,5 4,5 4,5 8 8 8 10 Ri 5,5 6,5 9 13,5 12 20 23 23,5 25,5 26,5

Rangszám-táblázatunkból kitűnik, hogy a kötések aránya nagy, s ezért W kiszámításában a korrigált formulát kell használni. Az E1 értékelési tényező szerinti rangsorban két kötés van (d=2). Az egyik két 4,5 értékű rangszám, a másikban ugyancsak két 7,5 értékű rangszám. Ezért mindkét kötésben t=2.

112

)22()22(

12

)( 333

1=−+−=

−=∑

dE

ttL

Az E2 értékelési tényező szerinti rangsorban három kötés szerepel (d=3), és mindegyikben két kötött rangszámot találunk, ezért t=2 mindhárom esetben.

5,112

)22()22()22(

12

)( 3333

2=−+−+−=

−=∑

dE

ttL

Az E3 szerinti rangsorban két kötés van. Az egyikben négy rangszám (4,5), tehát t=4, a másikban három kötött rangszám (8), tehát t=3.

712

)33()44(

12

)( 333

3=−+−=

−=∑

dE

ttL

Ismerjük tehát L értékeit és kiszámíthatjuk összegüket:

Page 198: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

198

5,975,11 =++=∑L

L

W korrigált értéke:

828,05,93)1010(3

121

591

)(121 2232

=⋅−−⋅⋅

=⋅−−⋅⋅

∆=∑

L

LknnkW

Páros összehasonlítás esetén (amikor nem kötjük ki a teljes következetességet) az egyetértés mérőszámának kiszámítása már jóval bonyolultabb. Itt is csak a számításokhoz szükséges képleteket közöljük, az egyetértési együttható jelölésére a ν-t használjuk:

1

22

2 −

Γ=nm

ν

ahol m a döntéshozók száma, n az értékelési tényezők száma, a képletben szereplő Г kiszámítása:

∑ ∑

+⋅−=Γ

222 nm

m γγ

ahol γ az aggregált preferenciatáblázat átlója alatti mezők gyakoriságait jelenti és csak az átló alatti mezőre értendő az összegzés is.

X.4.b A Kendall-féle rangkonkordancia együttható szignifikancia vizsgálata

Tudjuk, hogy szingifikancia vizsgálatok esetében mindig valamilyen alapfeltevést (nullhipotézist) vizsgálunk, és ha ezt a vizsgálat eredményeképpen elvetjük, akkor automatikusan elfogadjuk a nullhipotézisünkkel szembenálló, ún. alternatív vagy ellenhipotézist. A W szignifikancia vizsgálata során tehát a W=0 nullhipotézist vizsgáljuk, vagyis azt, hogy nincs korreláció a vizsgált rangsorok között. Ha a W rangkonkordancia együtthatót az egyetértés mérésére használjuk, akkor a nullhipotézisünkben azt tételezzük fel, hogy nincs egyetértés a rangsorolók között, vagyis W 0-nál nagyobb értéke a véletlennek tulajdonítható. Ha ezt a nullhipotézist a szignifikancia vizsgálat eredményeképpen elvetjük, akkor elfogadjuk az ellenhipotézist, amely szerint nem a véletlennek tekintjük W adott és 0-nál nagyobb értékét, hanem az egyetértésnek tulajdonítjuk. W szignifikancia vizsgálata a számításban szereplő ∆ mennyiség eloszlására épül. A rangszámok lehetséges permutációinak száma egy rangsor esetében n!, k számú rangsorra viszont (n!)k. Az összes lehetséges rangsorból meghatározható ∆ eloszlása és ennek alapján elvégezhető a szignifikancia vizsgálat. A szignifikancia vizsgálat elvégzéséhez kapcsolódó táblázatok megtalálhatóak a képletgyűjteményben. A képletgyűjtemény egyes táblázatai 0,05 és 0,01 szignifikancia szintekre adja meg a ∆ kritikus küszöbszámait k=3,4,…,20-ig és n=3,4,…,7-ig terjedő értékekre. A döntési szabály: ha a ténylegesen kiszámított ∆ érték nagyobb vagy egyenlő a táblázatbeli kritikus értéknél, akkor a nullhipotézist az adott szignifikancia szinten elvetjük. Példa Tételezzük fel, hogy k=3 rangsoroló n=6 tényező rangsorát készítette el. Kiszámítottuk ∆ értékét: 119,5. A k=3 és n=6 értékeknél található kritikus küszöbszám 5%-os szignifikancia szinten 103,9. Mivel ∆ tényleges értéke nagyobb a kritikus küszöbszámnál, ezért a nullhipotézist elvetjük, és W számított értékét (W=0,758) szignifikánsnak tekintjük.

Page 199: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

199

n>7 esetén az előbb említett táblázatok nem használhatóak, de tudjuk, hogy az alábbi mennyiség DF=n–1 szabadsági fokkal χ2-eloszlást követ, ezért a χ2-eloszlás másik táblázatban szereplő küszöbszámait használhatjuk:

)1(

122

+⋅⋅∆=nnk

χ

Bizonyítható, hogy

Wnknnk

)1()1(

12 −=+⋅⋅

és ezért az összefüggés jobb oldalán szereplő mennyiséget használjuk a χ2 számítására. Példa Három értékelési tényező alapján tíz komplex rendszert mérünk össze a Kendall módszerrel, vagyis k=3 rangsorunk van n=10 rendszerre, DF=9. A rangkonkordencia együttható W=0,828.

4,22828,093)1(2 =⋅⋅=−= Wnkχ A táblázatban DF=9 szabadságfoknál 1%-os szignifikancia szinten a kritikus küszöbszám: 21,7. Tényleges χ2-értékünk 22,4, ami nagyobb a küszöbszámnál, ezért elvetjük a nullhipotézist, és W=0,828 értéket erősen szignifikánsnak minősítjük. Az előző kötés nélküli esetben elvégezve a szignifikancia vizsgálatot megállapítható, hogy W=0,758 szignifikáns, azaz nem tulajdonítható a véletlennek. Tételezzük fel, hogy előzetes W*=0,5 szignifikáns rangkonkordencia együtthatót tűztünk ki küszöbszámként azzal, hogy a ténylegesen számolt rangkonkordencia együtthatónak ennél nagyobbnak kell lennie ahhoz, hogy az Ri rangszámösszegeket használjuk a komplex rendszerek végső preferencia-sorrendjének meghatározására. Esetünkben W>W*, tehát a hat komplex rendszer végső preferencia-sorrendje:

T1→T4↔T6→T3→T2→T5

Látjuk, hogy T4 és T6 az adott információk alapján azonosan preferált. Ha köztük is preferencia-különbséget kívánunk tenni, akkor további információk és vizsgálatok szükségesek. Az előzőekben látott rangszámegyezéssel élő példa esetében is elvégezzük a W szignifikancia vizsgálatát. A komplex rendszerek végső preferencia-sorrendjét ebben az esetben is a kiválasztott küszöbszám figyelembevételével döntjük el. Ha ebben az esetben is W*=0,50 küszöbszámot választottuk volna, akkor Ri alapján a preferencia-sorrend:

T1→T2→T3→T5→T4→T6→T7→T8→T9→T10

A fentiekben említett módszerek alkalmazása meglehetősen sokrétű, felhasználható a teljesítményértékelési rendszer egyes szempontjainak rangsorolásához és súlyozásához (így a motivációs és javadalmazási rendszer megalapozásához is), beruházási döntések vizsgálatához, vállalati célok kialakításához, vagy például a brainstorming alapokkal bíró nominális csoportok módszerének alkalmazása során előállt ötletek súlyozásához.

X.5 Spearman-féle rangkorreláció

A módszer a lineáris korrelációs együttható speciális esetének tekinthető. A kapcsolat szorosságának mérésére a két változó rangszámainak különbségét használjuk fel:

Page 200: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

200

nn

dr

n

ii

s −

⋅−=∑

=3

1

261

ahol di = Rx–Ry, az x és y rangjainak különbsége; n a mintaszám. Értéke –1 és +1 közé eshet. Ha értéke 1, akkor az a két rangszám-sorozat tökéletes egyezését jelzi, míg ha értéke -1, a kétféle sorozat fordítottja egymásnak. Ha értéke 0, akkor a két rangsor között nincs kapcsolat. Kapcsolt rangok estén az rs kiszámítása a következőképpen módosul:

−−⋅

−−

−+−−=

Yx

iiYx

s

TnnTnn

dTTnnr

2)(6

12)(

6

1

)()(6

1

33

23

,

ahol

∑=

−=i

jjj ttT

1

3 )(12

1,

ahol t a kapcsolt rangok száma, j=1,2,3,…,i az azonos rangú csoportok száma. A rangkorrelációs együttható szignifikancia vizsgálata: Az rs -re is ellenőrizhető az a nullhipotézis (H0), hogy a populációbeli korrelációs együttható 0 az alábbi t–statisztikával:

21

2

sssz r

nrt

−−=

amely n–2 szabadságfokú t–eloszlást követ. Ha az így kiszámított t nagyobb a táblázatbeli kritikus értéknél, akkor az rs értékét a két változó kapcsolatának a jellemzésére használhatjuk, vagyis elvetjük a nullhipotézist, és azt mondjuk, hogy a rangkorrelációs együttható rs, különbözik 0-tól. Ellenkező esetben nincs valós kapcsolat a két változó között. Példa: Egy presztízsvizsgálat alkalmával 8 foglalkozást rangsoroltattak két eltérő társadalmi csoport tagjaival.

Foglalkozás R X RY (RX-RY)2

Orvos 1 1 0

Ügyvéd 2 2 0

Agronómus 3 4 1

Idegenvezető 4 6 4

Olvasztár 7 7 0

Rendőr 6 5 1

Anyagmozgató 8 8 0

Katonatiszt 5 3 4

Összesen 36 36 10

Határozzuk meg a két rangsor közötti rangkorreláció mértékét!

881,0504

601

88

1061

61

331 =−=

−⋅−=

⋅−=∑

=

nn

dr

n

ii

s

A két rangsor között szoros a kapcsolat.

Page 201: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

201

Példa: Ismételjük meg az előző számítást úgy, hogy van rangszámegyezés!

Foglalkozás R X RY (RX-RY)2

Orvos 1 1 0

Ügyvéd 2 2 0

Agronómus 3 4 1

Idegenvezető 4 6 4

Olvasztár 7 7,5 0,25

Rendőr 5,5 5 0,25

Anyagmozgató 8 7,5 0,25

Katonatiszt 5,5 3 6,25

Összesen 36 36 12

855,083

71

1)88(6

11)88(

6

1

121)88(6

1

2)(6

12)(

6

1

)()(6

1

233

3

33

23

==

−−⋅

−−

−−−=

−−⋅

−−

−+−−=

Yx

iiYx

s

TnnTnn

dTTnnr

2

1)22(

12

1 3 =−== Yx TT

A két rangsor között szoros a kapcsolat. Végezzük el a rangkorrelációs együttható szignifikancia vizsgálatát 5%-os szignifikancia szinten!

H0: rs=0 H1: rs≠0

α=0,05, a kritikus értékek: tα/2=t0,975= ±2,447

038,4855,01

6855,0

1

222

=−

=−−=

sssz r

nrt

Mivel a számított érték az elutasítási tartományba esik, így a nullhipotézist elutasítjuk, azaz a

rangkorrelációs együttható különbözik 0-tól, valós kapcsolat van a két rangsor között.

Page 202: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

202

XI. Bevezetés a menedzsment lágy számítási módszereibe

Page 203: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

203

XI.1 Üzleti folyamatok jóságának, megbízhatóságának értelmezése

A továbbiakban üzleti folyamat alatt olyan gyűjtőfogalmat értünk, amely egy vállalkozás tágabb értelemben vett működéséhez szükséges, illetve az üzleti működést szolgáló bármely folyamatot magában foglalhatja. Így például üzleti folyamatnak tekintjük egy vállalat emberi erőforrás kiválasztási folyamatát csakúgy, mint azt a folyamatot, amellyel egy szolgáltató vállalkozás a vevői elégedettségét értékeli. Ilyen üzleti folyamatok vizsgálata esetén – amikor a gyártási és szolgáltatási folyamatokon túl, a működéshez szükséges kiegészítő és támogató tevékenységekhez kötődő folyamatokat is figyelembe vesszük – egy folyamat jósága, megbízhatósága nehezen ragadható meg. A felmerülő nehézségeknek több forrása azonosítható. Ezek közül elsősorban az üzleti folyamatok jóságának, megbízhatóságának értelmezésével, mérésével és értékelésével foglalkozunk, és a kvantitatív tárgyalási mód fontosságát szem előtt tartva mutatjuk be azokat a módszereket és eljárásokat, amelyek lehetővé teszik a fenti nehézségek alternatív kezelését.

XI.1.a Karakterisztikák és attribútumok mutatószám alapú mérése

Egy termék megbízhatósági jellemzőinek ismeretében képet kaphatunk a termék előállítási folyamatának megbízhatóságáról, ugyanakkor nehezebb a feladatunk akkor, amikor egy szolgáltatási vagy klasszikus értelemben vett nem termelő folyamat megbízhatóságát szeretnénk jellemezni. Ezekben az esetekben, amikor a fenti meghatározás értelmében vett üzleti folyamatokról beszélünk, a megbízhatóság-elmélet klasszikus meghatározásai nem – vagy csak korlátozott mértékben – teszik lehetővé, hogy egy vizsgált folyamat megbízhatóságát jellemezzük. Ilyenkor hajlamosak vagyunk egy folyamat megbízhatósága alatt inkább valamiféle jóságot, vagy valamilyen teljesítmény célhoz képest mért elért teljesítményt érteni. Ez a gyakorlatban általában azt jelenti, hogy a vizsgált folyamathoz olyan mérhető mutatószámokat rendelünk, amelyekkel a folyamat jellemző karakterisztikái vagy attribútumai számszerűen leírhatók és rajtuk keresztül a folyamat jósága kvantifikálható, illetve az a mért értékek alapján minősíthető vagy értékelhető. Karakterisztikák és attribútumok mutatószámokkal történő mérése – a mérhetőség iránti igényből fakadóan – a menedzsment nagyon széles körben alkalmazott módszerei közé tartozik. Üzleti folyamatok karakterisztikáinak vagy attribútumainak mutatószámok segítségével történő mérési módszerei általában olyan jellemzőkkel bírnak, illetve olyan feltételezésekkel élnek, amelyek alapján a módszerek jósága, megbízhatósága, az eredmények interpretálhatósága és az ezeken alapuló menedzsment döntések konzisztenciája megkérdőjelezhető. A mutatószámok mérése esetén legalább az alábbi bizonytalanságokkal kell számolnunk.

• A mérés szubjektív elemei. • A mérőrendszer ismételhetőségével és reprodukálhatóságával kapcsolatos problémák. • A mért és a vállalat szervezete által érzékelt jóság, megbízhatóság eltérése.

XI.1.b A mérések eredményeinek értékelése

Az üzleti gyakorlatban üzleti folyamatok karakterisztikáinak és attribútumainak mérése önmagában nem elegendő, a mérésen túl szükséges olyan, a mért értékeket felhasználó értékelési módszerek alkalmazása, amelyek az üzleti folyamatok jóságát, megbízhatóságát úgy képesek értékelni, hogy az értékelés eredményei összhangban vannak a vállalkozás szervezete által az üzleti folyamatokhoz társított, észlelt jósággal, megbízhatósággal. Az ilyen értékelési módszereket a továbbiakban megbízhatóság alapú értékelési módszereknek nevezzük. Az 51. ábra egy olyan sémát mutat, amely alapján egy üzleti

Page 204: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

204

folyamat jóságát, megbízhatóságát értékelhetjük. E séma szerint az értékelés a következő lépésekből álló.

1.) A folyamat jellemző karakterisztikájának vagy attribútumának kijelölése. Ez voltaképpen egy üzleti folyamat valamely jellemzőjének kiválasztását jelenti. Ilyen jellemző például a munkatársak humán teljesítménye.

2.) A kiválasztott karakterisztikához vagy attribútumhoz mutatószám hozzárendelése. Példaként ilyen az a mesterségesen létrehozott mutató, amelynek segítségével a korábbi példában bemutatott munkakörelemzésre épülő teljesítmény mérési módszer alkalmazásával egy munkatárs teljesítményét egyetlen számértékbe sűrítve fejezzük ki.

3.) A meghatározott mutatószám mérése. Ez nem más, mint a mutatószám konkrét értékeinek kijelölése a mérési skálán. A fenti, humán teljesítmény mérésére vonatkozó példában ez az egyes munkatársakhoz tartozó mutató nagyságának meghatározását jelenti a 0-tól 100 pontig terjedő mérőskálán.

4.) A mutatószám mért értékeinek megbízhatóság alapú értékelése. A cél az, hogy a vállalkozás a mért értékek alapján konzisztens döntéseket tudjon hozni. Ehhez a mért értékek minősítése, értékelése szükséges, mégpedig úgy, hogy az értékelés eredményei összhangban legyenek a vállalkozás szervezete által az üzleti folyamatokhoz társított, észlelt jósággal, megbízhatósággal. Ilyen értékelés például az, amikor a mért humán teljesítményt alapul véve egy munkatárs teljesítményét megfelelőnek vagy nem megfelelőnek minősítjük.

51. ábra: Üzleti folyamatok karakterisztikáinak vagy attribútumainak mérése és megbízhatóság alapú

Üzleti folyamat karakterisztikájának vagy attribútumának kijelölése

A kiválasztott karakterisztikához vagy

attribútumhoz mutatószám hozzárendelése

A meghatározott

mutatószám mérése

A mutatószám mért értékeinek megbízhatóság

alapú értékelése

Page 205: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

205

XI.2 Üzleti folyamatok jóságának, megbízhatóságának fuzzy alapú értékelése

Tekintsünk egy m mutatószámot, amellyel egy üzleti folyamat valamely attribútumát vagy karakterisztikáját mértjük. Ha a folyamat jóságáról, megbízhatóságáról szeretnék képet kapni, akkor az Hiba! A hivatkozási forrás nem található.. ábra szerinti séma alapján egy olyan értékelést végzünk, amelynek alapja az m mért érték. Tudjuk, hogy a mérés során fellépő különböző torzító hatások eredményeként előálló mutatóérték alapján történő értékelés és az erre épülő döntés inkonzisztens lehet. Másrészről, még ha maga a mérés tökéletesen mentes is lenne a bemutatott torzításoktól, akkor is fennállna az értékelő személy vagy személyek elkerülhetetlenül szubjektív megközelítéséből adódó bizonytalanság. Fontos látni, hogy itt nem a mutatószám mérésének szubjektív voltáról van szó, hanem a mutatószám mért értékeinek szubjektív értékeléséről. Olyan ez, mintha például egy tökéletesen működő mérőeszköz segítségével mérnénk emberek magasságát, majd a mérési eredmények alapján értékelnénk azt, hogy kik a magas emberek. Kétségtelen, hogy a legtöbben egy 200 cm magasságú személyről azt mondanák, hogy magas, és ugyanígy a legtöbben egy 150 cm magas felnőttet nem tartanának magasnak. Sokkal nehezebb azonban a helyzet akkor, ha egy 178 cm vagy egy 182 cm magas személyről kell eldöntenünk, hogy magas-e. Nagyon sok, ezzel analógnak mondható problémával találkozhatunk a vállalati és üzleti gyakorlatban. Ha például m egy munkatárs humán teljesítményének egy rögzített és ismert teljesítménymérési módszer szerinti mért értéke, m lehetséges értékei a 0 és 100 közötti valós számok, és feltételezzük, hogy nagyobb m értékek nagyobb teljesítményekhez tartoznak, akkor egy 99-es mért értékkel rendelkező személy teljesítményét általában igen jónak, míg egy mindössze 3-as mért értékkel rendelkező munkatárs teljesítményét általában igen gyengének tekintenénk. Nehézséget okozhat azonban annak eldöntése, hogy egy 78-as mért teljesítményértékkel rendelkező kolléga teljesítménye megfelelő-e. Célunk az, hogy a mért magasságok, illetve teljesítmények alapján egy konkrét mért magasságot, illetve teljesítményt értékelni tudjunk, azaz például el tudjuk dönteni, hogy egy személy magas-e, illetve egy munkatárs teljesítménye megfelelő-e. Általánosan, a célunk az, hogy az m mutatószámot egy üzleti folyamat valamely karakterisztikájának vagy attribútumának mérőszámaként tekintve a mért m értékek alapján a folyamat jóságát vagy megbízhatóságát értékeljük, majd az értékelés eredményeit alapul véve hozzunk döntést. Az értékelés szubjektivitásából adódó bizonytalanságot pedig alapvetően kétféle módon kezelhetjük: vagy olyan „szabályokat” alkalmazunk, melyek az effajta bizonytalanságot kizárják, vagy pedig olyan módszereket használunk, melyek alkalmasak a bizonytalanság kezelésére. Az első, tradicionálisnak mondható megközelítés megvalósítása egyszerűen megtörténhet a klasszikus halmazelmélet jól ismert módszereinek alkalmazásával, míg a második megközelítéshez a fuzzy halmazok elméletét alkalmazom.

XI.2.a Tradicionális megközelítés

Legyen M az m mutatószám lehetséges értékeinek halmaza. A tradicionális megközelítés lényege abban áll, hogy az m mutatószám lehetséges értékei alapján éles határt húzunk a megbízható (jó) és nem megbízható (nem jó) tartományok között, azaz m-re vonatkozóan megadjuk a megfelelő és nem megfelelő értékek tartományait. Ekkor voltaképpen az m mutatószám alapján megbízhatónak, jónak tekinthető folyamatot halmazként definiáljuk. Jelöljük ezt a halmazt RM -rel. RM az M alaphalmaz egy élesen definiált részhalmaza, amely – több más megadási mód mellett – karakterisztikus függvényével is megadható. Az M

Page 206: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

206

alaphalmazon az MM R ⊆ halmaz karakterisztikus függvénye a 1;0: →MRMµ leképezés,

amelyet így definiálunk (Szendrei, 1996):

∈∉

.ha1,

ha0,=)(

R

RM Mm

Mmm

A RMµ függvénynek M az értelmezési tartománya, az értékkészlete pedig a 1;0 kételemű

halmaz, és )(mRMµ értéke 1, ha RMm∈ , illetve )(m

RMµ értéke 0, ha RMm∉ . Fontos

hangsúlyozni, hogy a karakterisztikus függvény egy alaphalmazt képez le a 1;0 kételemű halmazba, amelyet egy értékelő halmaznak tekinthetünk. Az értékelő halmaz kételemű, így a halmazhoz tartozás élesen definiált, azaz az M univerzum tetszőleges eleméről eldönthető, hogy hozzá tartozik-e az RM halmazhoz vagy sem. A vállalati, üzleti gyakorlatban a mutatószámok lehetséges értékei általában racionális számok vagy olyan valós számok, amelyek tényleges mérése egy racionális skálán történik. Nem okoz azonban zavart, ugyanakkor a téma tárgyalását megkönnyíti, ha a mutatószámokat valós számoknak tekintjük. A továbbiakban élünk ezzel a feltételezéssel. Ezek alapján az M alaphalmaz többnyire a számegyenes, vagy annak valamely részhalmaza. Az üzleti gyakorlatban az RM halmaz éles kijelölésének alapvetően két tipikusnak mondható fő esetével találkozhatunk. I. RM -t egy m-re vonatkozó < vagy ≤ , illetve > vagy ≥ reláció határozza meg

I.a) RM -t egy m-re vonatkozó ≥ reláció határozza meg. Például egy munkatárs mért humán teljesítménye megfelelő, ha teljesítményének mért értéke 80 pont vagy annál nagyobb. Ebben az esetben a megfelelő teljesítmények halmazát az 80=Tm pontos

küszöbérték határozza meg. RM karakterisztikus függvényének grafikonját az 52. ábra mutatja.

52. ábra: ≥ relációval kijelölt halmaz karakterisztikus függvényének grafikonja

I.b) RM -t egy m-re vonatkozó > reláció határozza meg. Például a vállalkozás jövedelmezősége megfelelő, ha az üzemi üzleti eredmény az árbevétel 10%-át meghaladja. Természetesen a vállalkozás igyekszik eredményét maximalizálni, de ha az árbevétel az %10=Tm -nál nagyobb, akkor az már elfogadható, megfelelő. Az 53.

ábra az így meghatározott RM halmaz karakterisztikus függvényének grafikonját mutatja.

0

Tm m

1

Page 207: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

207

53. ábra: > relációval kijelölt halmaz karakterisztikus függvényének grafikonja Az RM halmaz < relációval történő kijelölésére jó példa a megfelelő minőség selejtaránnyal

történő meghatározása. A minőség megfelelő, ha a selejtarány az %1=Tm -nál kisebb. A cél persze a selejtarány minimalizálása, ideális esetben pedig a nulla selejtarány elérése. A 54. ábra az RM halmaz karakterisztikus függvényének grafikonját szemlélteti.

54. ábra: < relációval kijelölt halmaz karakterisztikus függvényének grafikonja

I.c) Az RM halmazt egy m-re vonatkozó ≤ reláció jelöli ki. Egy vállalkozás szolgáltatási színvonala elfogadható, ha a határidőre le nem szállított szolgáltatások aránya nem nagyobb, mint %2=Tm . A 61. ábrán az így meghatározott RM halmaz karakterisztikus függvényének grafikonja látható.

0

Tm m

1

0

Tm m

1

Page 208: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

208

55. ábra: ≤ relációval kijelölt halmaz karakterisztikus függvényének grafikonja II. RM -t a számegyenes egy intervalluma jelöli ki Ilyen esetek például a következők.

II.a) A raktárban található csomagolóanyag készlet nagysága megfelelő, ha annak értéke 2000 és 3000 USA Dollár között van. Ha a készlet túl kicsi, akkor az veszélyeztetheti a termelés folyamatosságát, ha túl nagy, akkor a készletre lekötött tőke és a készlettartási költségek lehetnek szükségtelenül nagyok.

II.b) A forrasztáshoz használt forraszpaszta mennyisége egy érintkezőn megfelelő, ha a forraszpaszta magassága 100 és 120 mikron között van. Ha a forraszpaszta magassága 100 mikronnál kisebb, akkor jó eséllyel nem jön létre megfelelő forraszkötés, ha pedig a forraszpaszta magassága 120 mikronnál nagyobb, akkor fennáll a rövidzár keletkezésének veszélye.

II.c) Egy termelő vállalat esetében a bérelt munkaerő aránya akkor megfelelő, ha az 20% és 30% között van. Ha ez az arány 20% alatt van, akkor a vállalat számára túlzottan merev munkaerő struktúra alakul ki, ha pedig az arány 30% felett van, akkor a munkaerő költségek válnak túlzottan magassá.

A II.a), II.b) és II.c) esetekben az RM halmazokhoz tartozó karakterisztikus függvények

grafikonjainak alakja a 56. ábrán látható grafikonhoz hasonló. ( )1Tm és ( )2

Tm az RM halmazt kijelölő intervallum kezdő- és végpontjai. A fenti példák mindegyikében zárt intervallum jelöli ki az RM halmazt, de természetesen olyan esetek is elképzelhetők, amikor az RM halmazt valamely vagy mindkét végéről nyitott intervallum jelöli ki.

0

Tm m

1

Page 209: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

209

56. ábra: (Zárt) Intervallummal kijelölt halmaz karakterisztikus függvényének grafikonja Ha az M alaphalmaz (mérési skála) véges, akkor az RM halmaz éles kijelölésének I-es

típusú módozatai esetén is egy intervallum határozza meg az RM halmazt. Ezekben az

esetekben az intervallum egyik végpontját az RM -t kijelölő reláció határozza meg, a másikat pedig a kijelölő reláció függvényében az alaphalmaz legkisebb felső vagy legnagyobb alsó korlátja adja. Másrészről az RM halmaz intervallummal történő éles kijelölése nem más, mint a halmaz két megfelelő < vagy ≤ , illetve > vagy ≥ relációval történő kijelölése. Ez persze azt jelenti, hogy

RM II-es típusú megadása voltaképpen nem más, mint két megfelelő I-es típusú kijelölés alkalmazása, azaz a két megadási módszer között nincs igazi különbség. Ez valóban így is van, az RM halmaz tipikusnak mondott két fő megadási módjának megkülönböztetését csupán praktikus szempontok indokolják, ugyanis a mindennapi üzleti gyakorlatban főként e két meghatározási móddal találkozhatunk. Elméleti szempontból érdemes még egy harmadik esetet is megemlíteni, nevezetesen azt, amikor az RM halmazt a számegyenes egy pontja jelöli ki. Ennek az esetnek azonban az üzleti gyakorlatban nincs jelentősége, ugyanis nagyon ritkán fordul elő az, hogy egy mutatószám egyetlen egy értékét tekintik csak elfogadhatónak, megfelelőnek.

XI.2.b Fuzzy megközelítés

Tegyük fel, hogy a fenti példában bemutatott humán teljesítmény értékelése úgy történik, hogy a teljesítmény akkor megfelelő, ha annak mért m értéke legalább 80 pont. Ekkor a megfelelő teljesítmények élesen meghatározott RM halmazának karakterisztikus függvénye:

≥ ,ha1,

<ha0,=)(

T

TM mm

mmm

ahol 80=Tm . A karakterisztikus függvény a 79 helyen 0 értéket vesz fel, azaz a 79-es mért érték nem tartozik a megfelelő teljesítmények halmazába. Akkor ez a teljesítmény valóban nem megfelelő? Jelenti-e ez azt, hogy a munkatárs teljesítménye nem értékes a vállalkozás számára, vagy nem járul hozzá a vállalkozás sikeréhez? Választ keresve ezekre a kérdésekre juthatunk el arra a felismerésre, hogy ebben az esetben a kétértékű karakterisztikus függvény szerinti értékelés túlzottan szigorú. Tudjuk, hogy a 79-es

( )2Tm

0 ( )1Tm m

1

Page 210: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

210

pontértékű teljesítmény egy absztrakció, egy mesterségesen létrehozott rendszer által adott eredmény, voltaképpen egy szigorúan alkalmazott szabály eredménye. Tudva azt, hogy a küszöbérték 80 pont, a 79-es pontértékű teljesítményről sokan talán azt mondanák, hogy „majdnem jó”, „majdnem megfelelő”, „nem rossz”, vagy „közel jó”. Ezek a minősítések hétköznapi nyelvhasználatunkban ugyanazt a jóságot írják körül, de matematikai értelemben véve nem precíz módon, hanem határozatlanul és pontatlanul. Ez a határozatlanság és pontatlanság azonban az emberi gondolkodás és hétköznapi nyelvhasználat természetéből fakad (Negoita, 1985). Mindennapi fogalmaink, melyekkel a világot leírjuk, meglehetősen pontatlanok, gyengén definiáltak. Gondoljunk például a „Szép virág”, a „Jó autó” vagy az „Idős ember” kijelentésekre. A vállalatok, vállalkozások világában is lépten-nyomon találkozhatunk olyan minősítő kijelentésekkel, mint a „Megbízható beszállító”, „Stratégiai partner”, „Közepesen jövedelmező üzlet”, „Hatékony gyártási folyamat”, „Közepes teljesítmény” vagy „Elfogadható profit”. Ezek a minősítések elnagyoltak és pontatlanok, de mégis széles körben használtak és mindenki által elfogadottak. Ha megpróbálunk precízek lenni, és ennek érdekében mérhető mutatószámokat rendelünk a felsorolt jellemzőkhöz és mérjük azokat, akkor a számszerűsítés révén nagyobb egzaktságot és egyértelmű minősíthetőséget, értékelhetőséget remélünk. Ez azonban a legtöbb esetben nem teljesül, mint ahogy azt a humán teljesítmény minősítésével foglalkozó példa is alátámasztja. Ennek oka az, hogy világunk alapvetően fuzzy, életlen, pontatlan, ezért a hagyományos, kétértékű karakterisztikus függvény szerinti minősítés túlzottan korlátozó (Zimmermann, 2001). Vegyük például a fent említett közepesen jövedelmező üzlet kijelentést. Ha a közepesen jövedelmező üzletek halmazát a profitráta, mint mutatószám alapján élesen definiáljuk, például úgy hogy egy üzlet pontosan akkor tartozik a közepesen jövedelmező üzletek halmazához, ha annak profitrátája 5% és 10% között van, akkor az így meghatározott halmaz karakterisztikus függvényének grafikonja a 57. ábra szerinti.

57. ábra: Az élesen definiált közepesen jövedelmező üzletek halmaz karakterisztikus függvényének grafikonja A karakterisztikus függvény a közepesen jövedelmező üzletek halmazához tartozás mértékét adja meg minden profitrátára: ez a mérték pedig csak a 0 vagy 1 érték valamelyike lehet. Ezen éles definíció szerint egy 4,8%-os vagy egy 10,1%-s profitrátájú üzletet már nem tekintenénk közepesen jövedelmezőnek. Hétköznapi gondolkodásunk szerint azonban inkább közel, vagy majdnem közepesen jövedelmezőnek tekintenénk ezeket az üzleteket, és általában ugyanezt mondanánk egy 5%-nál csak kicsivel nagyobb és 10-nál csak kicsivel kisebb profitrátájú üzletről is. Az emberi természetből fakadó fuzzy megközelítés (Kosko, 1993) alapján, inkább egy a 58. vagy 59. ábrán látható halmazhoz tartozási függvénygrafikon valamelyikéhez hasonlóan sorolunk egy üzletet a közepesen jövedelmezők közé. Ezek szerint hajlunk arra, hogy a halmazhoz tartozás mértékét ne csak az 1 (halmazhoz tartozik) és a 0 (nem tartozik a

10% 0

5% Profitráta

1

Page 211: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

211

halmazhoz) értékekkel adjuk meg. Ezek a függvények, szemben a karakterisztikus függvénnyel, a halmazhoz tartozás mértékét a 0 és 1 közötti folytonos skálán fejezik ki úgy, hogy minél nagyobb a függvényérték, annál nagyobb a halmazhoz tartozás mértéke. A két bemutatott függvénygörbe csupán példákat mutat lehetséges halmazhoz tartozási definíciókra, természetesen, a gyakorlati alkalmazásokban nagyon sokféle, igen változatos alakú függvénygörbe felhasználható a halmazhoz tartozás mértékének kifejezésére. Ezek közül, a téma irodalmában széles körben alkalmazott és hivatkozott típusokat – a teljesség igénye nélkül – a következő alfejezetben mutatjuk be.

58. ábra: Fuzzy értelemben vett közepesen jövedelmező üzletek halmazának egy lehetséges halmazhoz tartozási függvénygrafikonja

59. ábra: Fuzzy értelemben vett közepesen jövedelmező üzletek halmazának egy lehetséges halmazhoz tartozási függvénygrafikonja

Zadeh (1965) a fuzzy halmazok és az azokat definiáló tagsági függvények fogalmainak bevezetésével az információ reprezentálásának egy olyan módját teremtette meg, amely jobban harmonizál az emberi fogalom- és nyelvhasználattal, mint a kétértékű karakterisztikus függvényekre és az általuk definiálható éles (klasszikus) halmazokra építő tradicionális megközelítés. Az eddigi jelöléseket alkalmazva egy m mutatószám lehetséges értékeinek M halmazán, mint alaphalmazon értelmezett megbízható (jó) folyamatok ( )F

RM fuzzy halmaza Retter Gyula (2006: 21-23.) nyomán az ( ) ( ) ( )( ) MmmmM F

MF

R R∈= |,µ

0 10% 5% Profitráta

1

0 10% 5% Profitráta

1

Page 212: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

212

rendezett párokból álló halmaz, ahol ( ) [ ]1,0: →MF

M Rµ .

A ( )FM R

µ leképezést az ( )FRM fuzzy halmaz tagsági függvényének (halmazhoz tartozási

függvényének) nevezzük. A tagsági függvény tulajdonképpen a 1;0: →M

RMµ

karakterisztikus függvény általánosítása, áttérés a kételemű 1,0 értékelő halmazról a [ ]1,0

intervallumra. Az ( )FRM fuzzy halmaz az ( ) ( )( )mm F

M Rµ, rendezett párokból áll, azaz az M

alaphalmaz minden m elemének van egy ( ) ( )mFM R

µ tagsági értéke a [ ]1,0 intervallumban. Ez a

tagsági érték adja meg, hogy egy m elemnek mekkora a halmazhoz tartozási mértéke. Zadeh (1973) a halmazhoz tartozás mértékének kifejezésére a logikai 0 és 1 értékek használata helyett bevezette a [0,1] intervallumon folytonos logikai értékeket, és ezzel a klasszikus (kétértékű) logikát fuzzy logikára terjesztette ki. A fuzzy logika alapját az úgynevezett nyelvi változók képezik. A nyelvi változók olyan változók, amelynek értékei általában olyan szavak (vagy fuzzy számok) mint a kicsi, közepes, nagy, stb., s ezeket a változókat fuzzy halmazok, illetve az azokat meghatározó tagsági függvények modellezik. A 60. ábra a profitráta, mint mutatószám alapján, a gyengén, közepesen és jól jövedelmező üzletek lehetséges fuzzy halmazait mutatja be. Itt a nyelvi változó a jövedelmezőség, melyet a profitrátával mérünk, és lehetséges fuzzy értékei a „gyenge”, a „közepes”, és a „jó”.

60. ábra: Gyengén, közepesen és jól jövedelmező üzletek, mint fuzzy halmazok tagsági függvényeinek grafikonjai Fuzzy halmazok szélső esetei megfelelnek a klasszikus halmazelmélet határeseteinek (Retter, 2002):

i.) Az M alaphalmaz ( )FMµ tagsági függvénye olyan, hogy minden Mm∈ esetén

( ) ( ) 1=mFMµ , azaz az alaphalmaz minden eleme 1 tagsági értékkel az

alaphalmazhoz tartozik. ii.) Egy H fuzzy halmaz üres halmaz, ha minden Mm∈ esetén a ( ) ( )mF

Hµ tagsági függvényérték nulla.

A fuzzy halmazok értelmezésével adott egy matematikai eszköz, amelynek segítségével az üzleti gyakorlatban a mutatószámokkal mért karakterisztikák vagy attribútumok alapján az üzleti folyamatok jósága, megbízhatósága értékelhető, miközben az említett értékelési bizonytalanságok – a tagsági értékek segítségével – kezelhetők. A megbízható üzleti folyamatok fuzzy halmazként történő értelmezése lehetővé teszi, hogy e folyamatok jóságát, megbízhatóságát mért mutatószámok alapján úgy értékeljük, hogy egyrészt kezeljük az

gyenge közepes jó

0 10% 5% Profitráta

1

Page 213: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

213

értékelés bizonytalanságait, másrészt az értékelés eredménye összhangban van a vállalkozás által észlelt értékekkel. A hétköznapokban és az üzleti világban egyaránt nagyon sok elnagyolt és pontatlan kijelentéssel, minősítéssel, értékeléssel találkozunk, ezért azt mondhatjuk, hogy világunk alapvetően fuzzy. A fuzzy halmazok elmélete azonban matematikai szempontból teljesen egzakt tagsági függvényeket alkalmaz, így maga a felhasznált eszköztár már egyáltalán nem fuzzy, hiszen „defuzzyfikálja”, matematizálja a fuzzy világot (Van Leekwijck és Kerre, 1999). A tagsági függvény az, amellyel a mért m értékekhez hozzárendeljük azok megbízható (jó) halmazhoz tartozásuk mértékét, ez pedig azt jelenti, hogy a tagsági függvény egyúttal a folyamat jóságát, megbízhatóságát értékelő függvény is. Az m mutatószám lehetséges értékeinek M halmazán értelmezett E értékelő függvény alatt mindig egy ]1;0[: →ME

( )mEma leképezést értünk. Egy értékelő függvény segítségével voltaképpen egy transzformációt végzünk a mérési skáláról a [ ]1,0 értékelési skálára. Ezzel lehetővé válik, hogy egy üzleti folyamatot – a kiválasztott karakterisztikához vagy attribútumhoz rendelt mérőszám értékei alapján – értékelési kategóriákba soroljunk úgy, hogy az értékelő függvény helyettesítési értékei alapján meg tudjuk mondani, hogy a folyamat mekkora mértékben tartozik az egyes értékelési kategóriához. A legegyszerűbb esetben csak egy megbízható (jó) és egy nem megbízható (nem jó) kategóriát különböztetünk meg. A kérdés az, hogy egy konkrét üzleti folyamat esetén a folyamat karakterisztikájához vagy attribútumához társított mutatószám alapján hogyan határozzuk meg a megbízható (jó) halmaz tagsági függvényét. Általánosságban, adott feladathoz alkalmas tagsági függvény megtalálásának alapvetően két útja van (Retter, 2006:23). Az egyik lehetőség az, hogy szakértői ismeretek alapján határozzuk meg a függvény jellegét, majd annak paramétereit úgy hangoljuk, hogy az a konkrét alkalmazás esetén előre rögzített kritériumoknak eleget tegyen. A másik lehetőség az, hogy mérési vagy megfigyelési adatokból indulunk ki, és többnyire neurális hálózatokra valamint genetikus algoritmusokra épülő módszerek segítségével adjuk meg a tagsági függvényt60. A következő fejezetben a legismertebb tagsági függvény típusokat mutatjuk be röviden. Széles körben alkalmazott tagsági függvények Legyen az X alaphalmaz az [ ]βα , intervallum a valós számegyenesen, H pedig egy fuzzy halmaz az X alaphalmazon. Ekkor H egy 1-dimenziós fuzzy halmaz. 1-dimenziós fuzzy halmazok legismertebb tagsági függvény típusai Mandal et al. (2008), Retter (2006: 25-28.), és Johanyák és Kovács (2004) alapján a következők. Háromszög tagsági függvény A H fuzzy halmaz háromszög (trianguláris) tagsági függvénye az a , b , c paraméterekkel ( Xx∈ ):

60 E témakör egy jó áttekintését adja Johanyák és Kovács Sz. (2004) munkája, melyben tagsági függvények megválasztási szempontjai mellett a függvények jellemzőinek meghatározási módszereit is tárgyalják.

Page 214: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

214

( )

<

≤<−−

≤<−−

=

xc

cxbbc

xc

bxaab

ax

ax

xFTriH

ha ,0

ha ,

ha ,

ha ,0

)(,µ

A 67. ábrán egy trianguláris tagsági függvény grafikonja látható. A háromszög alakú, egyenes szakaszokból álló függvénygörbe törési pontjai az a , b , c helyeken vannak.

61. ábra: Háromszög (trianguláris) tagsági függvény grafikonja Trapéz tagsági függvény A H fuzzy halmaz trapéz tagsági függvénye az a , b , c , d paraméterekkel ( Xx∈ ):

( )

<

≤<−−

≤<

≤<−−

=

xd

dxccd

xd

cxb

bxaab

ax

ax

xFTrapH

ha ,0

ha ,

ha ,1

ha ,

ha ,0

)(,µ

A 62. ábra egy trapéz tagsági függvény grafikonját szemlélteti.

c b 0

a x

1

Page 215: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

215

62. ábra: Trapéz tagsági függvény grafikonja Gauss tagsági függvény A H fuzzy halmaz Gauss tagsági függvénye a c ésσ ( )0>σ paraméterekkel ( Xx∈ ):

( )2

2

1

, )(

−−= σµ

cx

FGaussH ex

63. ábra: Gauss tagsági függvénygörbe A c paraméter a Gauss görbe középpontját, a pozitív σ szórás paraméter a függvény szélességét adja meg (63. ábra) Harang (Bell) tagsági függvény A H fuzzy halmaz általánosított harang (Bell) tagsági függvénye az a , b , c paraméterekkel ( Xx∈ ):

( )b

FBellH

a

cxx

2,

1

1)(

−+=µ

c 0

x

1

d c b 0

a x

1

Page 216: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

216

64. ábra: Általános harang tagsági függvény grafikonja A 64. ábra egy általános harang tagsági függvény grafikonját, és a függvény paramétereinek

geometriai jelentését mutatja. A függvénygörbe meredeksége a ac + helyen a

b

2− . Érdemes

megjegyezni, hogy a függvény a nullát, mint helyettesítési értéket sehol nem veszi fel, a pozitív és negatív végtelenben vett határértékei viszont nullával egyenlők. Ez azonban a függvény gyakorlati alkalmazhatóságát nem befolyásolja. Szigmoid tagsági függvény A H fuzzy halmaz szigmoid tagsági függvénye az a és b paraméterekkel ( Xx∈ ):

( )( )bxa

FSzigmoidH

ex −−+

=1

1)(,µ

A 71. ábrán két, b paraméterében egyenlő, és a paraméterében egyenlő abszolút értékű, de ellenkező előjelű szigmoid tagsági görbe látható. 0>a esetén a görbe S-alakú, és a függvény növekvő, 0<a esetén a görbe Z-alakú, és a tagsági függvény csökkenő. Mindkét függvény helyettesítési értéke 0,5 a b helyen. A függvénygörbe meredeksége a b helyen .4/a Érdemes megjegyezni, hogy a függvény a 0 és 1 értékeket csak határértékben veszi fel.

65. ábra: Szigmoid tagsági függvények grafikonjai A háromszög, a trapéz, a Gauss, a harang és a szigmoid tagsági függvények voltaképpen fuzzy intervallumokat jelölnek ki a számegyenesen. A trianguláris és trapéz függvények alkalmazásának előnye e függvények egyszerűségéből adódik, ezek ugyanis lineáris, illetve konstans értékű részekből épülnek fel, így számítási szempontból könnyű a kezelésük.

a<0

a>0

b

0,5

0 x

1

c+a c-a c

0,5

0 x

1

Page 217: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

217

Bizonyos alkalmazásokban, ahol szükséges e függvények deriváltjainak előállítása, gondot okoz, hogy nem mindenütt deriválhatóak (pl. a háromszög függvény nem deriválható az a , b , c helyeken). Ezzel szemben a Gauss, az általános harang és a szigmoid tagsági függvények ugyan nem lineárisak, de mindenütt deriválhatóak. Ha egy 1 dimenziós fuzzy halmazt egy fuzzy értelemben vett relációval adunk meg, akkor erre – más lehetséges tagsági függvények mellett – használhatjuk e függvények egyik, az adott relációnak megfelelő oldalát. Hasonlóan, mint ahogy egy élesen definiált intervallum karakterisztikus függvénye előállítható két reláció alapján kijelölt éles halmaz karakterisztikus függvények segítségével, egy fuzzy intervallum tagsági függvénye is előállítható két fuzzy relációt reprezentáló tagsági függvényből, ahogy ezt a 72. ábrán látható példa mutatja.

66. ábra: Fuzzy intervallum, mint két fuzzy reláció szuperpozíciója A 66. ábra szerinti felbontási lehetőség előnye abban áll, hogy konkrét alkalmazási feladat esetén elegendő az x≥ a és b≥ x relációkhoz tartozó tagsági függvényeket megadni, és ezek segítségével az ],[ ba fuzzy intervallum tagsági függvénye már előállítható.

=

b 0

a x

1

Fuzzy b≥ x≥ a

0 a x

1

0 b x

1

+ =

Fuzzy x≥ a Fuzzy b≥ x

Page 218: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

218

XI.3 Fuzzy alkalmazások az üzleti tudományok területén

Általánosan elmondható, hogy a fuzzy elmélet Zadeh 1965-ös korszakalkotó cikkének megjelenése óta óriási fejlődésen ment keresztül, és az elmélet eredményeinek rengeteg alkalmazása ismert. Az alkalmazások jelentős része elsősorban műszaki területekre koncentrálódik, de az 1980-as évektől kezdődően egyre több kutatás témáját képezi a fuzzy elmélet alkalmazása a gazdaságtan, a szervezéstudományok és a menedzsment, azaz átfogóan az üzleti tudományok területein. Bíztató, hogy az alkalmazott kutatások és publikációk száma egyre növekszik ezeken a területeken, és egyre színesebb és érdekesebb alkalmazási esetek látnak napvilágot. Néhány alkalmazási terület a teljesség igénye nélkül:

• Optimalizálás bizonytalan paraméterekkel a termelés- és szolgáltatásmenedzsmentben • Emberi erőforrás tervezése bizonytalan információkkal • Egészségbiztosítási rendszerek finanszírozási döntései fuzzy logika alkalmazásával • Fuzzy kognitív térképek alkalmazása komplex (sokváltozós) ökoszisztémák

célértékeinek meghatározására • Fuzzy alapú osztályozási módszerek a marketingben • Projekttevékenységek fuzzy alapú ütemezése • Beszállítók kiválasztási kritériumainak meghatározása fuzzy halmazok segítségével.

Page 219: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

219

XII. Felhasznált irodalom

Banks, J.(1989): Principles of Quality Control, Wiley, New York

Bloch, A.(1985): Murphy törvénykönyve, avagy miért romlik el minden?, Gondolat Kiadó, Budapest

Curwin, J. – Slater, R.(1991): Quantitative Methods for Business Decisions, Third Edition, Chapman & Hall, London

Csernyák L.(szerk.) (1990): Valószínűségszámítás, Tankönyvkiadó, Budapest

Fleming, M. C. - Nellis, J. G. (1991): The Essence of Statistics for Business, Prentice Hall, New York

Gáspár L. – Temesi J. (1999): Lineáris programozási gyakorlatok, Nemzeti Tankönyvkiadó Rt., Budapest

Hunyadi L. – Mundruczó Gy. – Vita L. (1996): Statisztika, Aula Kiadó, Budapest

Johanyák, Zs. Cs., Kovács Sz. (2004): A fuzzy tagsági függvény megválasztásáról. A GAMF Közleményei, Kecskemét, XIX. Évfolyam, pp. 73-84.

Kalló N.: (2012): A modellezés menedzsmentcélú alkalmazása, In: Topár J. (szerk.) A műszaki menedzsment aktuális kérdései, Műszaki Kiadó, Budapest

Kaufmann, A. –Faure, R. (1969): Bevezetés az operációkutatásba, Műszaki Könyvkiadó, Budapest

Kaufmann, A. (1968): Az operációkutatás módszerei és modelljei, Műszaki Könyvkiadó, Budapest

Kindler J. – Papp O. (1977): Komplex rendszerek vizsgálata, Műszaki Könyvkiadó, Budapest

Kindler, J. (1974): A döntések logikája, Nehézipari Minisztérium, Továbbképző Központ, Esztergom-Kenyérmező

Kindler, J. (1969): A Kendall-féle egyetértési együttható és alkalmazásai, kézirat, Budapest

Kindler, J.(1978): Többtényezős döntések elmélete és gyakorlata, kézirat, Budapest

Kosko, B. (1993): Fuzzy Thinking: The New Science of Fuzzy Logic. Hyperion, New York, pp. 121-156.

Kövesi J. (1998): A menedzsment kvantitatív módszerei I., Rang-módszerek alkalmazása, oktatási segédanyag, Budapest

Kövesi J.(1998): Kvantitatív módszerek, Oktatási segédanyag, BME MBA Mérnököknek program, Budapest

Kövesi J. (2001): Kvantitatív módszerek, Oktatási segédanyag, BME MBA Mérnököknek program, Budapest

Lukács O. (1987): Matematikai statisztika, Példatár, Műszaki Könyvkiadó, Budapest, 1987

Mandal, S. N., Choudhury, J. P., De D., Chaudhuri, S. R. B. (2008): Roll of Membership functions in Fuzzy Logic for Prediction of Shoot Length of Mustard Plant Based on Residual Analysis, World Academy of Science, Engineering and Technology 38

Page 220: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

220

Negoita, C.onstantin V. (1985): Expert Systems and Fuzzy Systems. The Benjamin/Cummings Publishing Company, Inc., California, pp. 47-67.

Retter, Gy. (2002): Fuzzy rendszerek. 1. kötet. Oktatási Segédlet, Budapesti Műszaki és Gazdasátudományi Egyetem Villamos Gépek és Hajtások Tanszék, pp. 20-21.

Retter, Gy. (2006): Fuzzy, neurális genetikus, kaotikus rendszerek. Bevezetés a „lágy számítás” módszereibe. Akadémiai Kiadó, Budapest, 432 pp.

Reimann J. – Tóth J. (1985): Valószínűségszámítás és matematikai statisztika, Tankönyvkiadó, Budapest

Sincich, T. (1990):Statistics by Example, Dellen Publishing Company, San Fransisco

Spiegel, Murray R. (1995): Statisztika: Elmélet és gyakorlat, Panem – McGraw-Hill, Budapest

Szabó G. Cs. (szerk.) (1994): Alkalmazott statisztika I., Műegyetemi Kiadó, Budapest, 1994

Szendrei, Á. (1996): Diszkrét matematika, logika, algebra, kombinatorika. JATE Bolyai Intézet, Szeged, 39. o.

Temesi J. – Varró Z. (2007): Operációkutatás, Aula Kiadó, Budapest

Van Leekwijck, W., Kerre, E. E. (1999): Defuzzification: criteria and classification. Fuzzy Sets and Systems, Vol. 108, Issue 2, pp. 159-178

Zadeh, L. A. (1965): Fuzzy Sets. Information and Control, 8. pp. 338-353.

Zadeh, L. A. (1973): Outline of a New Approach to the Analysis of Complex System and Decision Processes, IEEE Transactions on Systems, Man, and Cybernetics, SMC-3, 28-44.

Zimmermann, H-J. (2001): Fuzzy set theory – and its applications. Kluwer Academic Publisher, Massachusetts, pp.1-15.

Page 221: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

221

XIII. Függelék: táblázatok

I. táblázat: Binomiális eloszlás II. táblázat: Poisson-eloszlás

III. táblázat: Standard normális eloszlás IV. táblázat: χ2-eloszlás V. táblázat: Student-eloszlás (t-eloszlás)

VI. táblázat: F-eloszlás (α=0,05) VII. táblázat: F-eloszlás (α=0,01)

VIII. táblázat: Cochran-próba (α=0,05) IX. táblázat: Cochran-próba (α=0,01)

Page 222: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

222

I. táblázat: Binomiális eloszlás

p n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 1 0 0,9500 0,9000 0,8500 0,8000 0,7500 0,7000 0,6500 0,6000 0,5500 0,5000 1 0,0500 0,1000 0,1500 0,2000 0,2500 0,3000 0,3500 0,4000 0,4500 0,5000 2 0 0,9025 0,8100 0,7225 0,6400 0,5625 0,4900 0,4225 0,3600 0,3025 0,2500 1 0,0950 0,1800 0,2550 0,3200 0,3750 0,4200 0,4550 0,4800 0,4950 0,5000 2 0,0025 0,0100 0,0225 0,0400 0,0625 0,0900 0,1225 0,1600 0,2025 0,2500 3 0 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2746 0,2160 0,1664 0,1250 1 0,1354 0,2430 0,3251 0,3840 0,4219 0,4410 0,4436 0,4320 0,4084 0,3750 2 0,0071 0,0270 0,0574 0,0960 0,1406 0,1890 0,2389 0,2880 0,3341 0,3750 3 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0429 0,0640 0,0911 0,1250 4 0 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1785 0,1296 0,0915 0,0625 1 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3845 0,3456 0,2995 0,2500 2 0,0135 0,0486 0,0975 0,1536 0,2109 0,2646 0,3105 0,3456 0,3675 0,3750 3 0,0005 0,0036 0,0115 0,0256 0,0469 0,0756 0,1115 0,1536 0,2005 0,2500 4 0,0000 0,0001 0,0005 0,0016 0,0039 0,0081 0,0150 0,0256 0,0410 0,0625 5 0 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1160 0,0778 0,0503 0,0313 1 0,2036 0,3281 0,3915 0,4096 0,3955 0,3602 0,3124 0,2592 0,2059 0,1563 2 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3364 0,3456 0,3369 0,3125 3 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1811 0,2304 0,2757 0,3125 4 0,0000 0,0005 0,0022 0,0064 0,0146 0,0284 0,0488 0,0768 0,1128 0,1563 5 0,0000 0,0000 0,0001 0,0003 0,0010 0,0024 0,0053 0,0102 0,0185 0,0313 6 0 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0754 0,0467 0,0277 0,0156 1 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2437 0,1866 0,1359 0,0938 2 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3280 0,3110 0,2780 0,2344 3 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2355 0,2765 0,3032 0,3125 4 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0951 0,1382 0,1861 0,2344 5 0,0000 0,0001 0,0004 0,0015 0,0044 0,0102 0,0205 0,0369 0,0609 0,0938 6 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0018 0,0041 0,0083 0,0156 7 0 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0490 0,0280 0,0152 0,0078 1 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,1848 0,1306 0,0872 0,0547 2 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,2985 0,2613 0,2140 0,1641 3 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2679 0,2903 0,2918 0,2734 4 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1442 0,1935 0,2388 0,2734 5 0,0000 0,0002 0,0012 0,0043 0,0115 0,0250 0,0466 0,0774 0,1172 0,1641 6 0,0000 0,0000 0,0001 0,0004 0,0013 0,0036 0,0084 0,0172 0,0320 0,0547 7 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0006 0,0016 0,0037 0,0078 8 0 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0319 0,0168 0,0084 0,0039 1 0,2793 0,3826 0,3847 0,3355 0,2670 0,1977 0,1373 0,0896 0,0548 0,0313 2 0,0515 0,1488 0,2376 0,2936 0,3115 0,2965 0,2587 0,2090 0,1569 0,1094 3 0,0054 0,0331 0,0839 0,1468 0,2076 0,2541 0,2786 0,2787 0,2568 0,2188 4 0,0004 0,0046 0,0185 0,0459 0,0865 0,1361 0,1875 0,2322 0,2627 0,2734 5 0,0000 0,0004 0,0026 0,0092 0,0231 0,0467 0,0808 0,1239 0,1719 0,2188 6 0,0000 0,0000 0,0002 0,0011 0,0038 0,0100 0,0217 0,0413 0,0703 0,1094 7 0,0000 0,0000 0,0000 0,0001 0,0004 0,0012 0,0033 0,0079 0,0164 0,0313 8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0017 0,0039

Page 223: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

223

p

n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 9 0 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0207 0,0101 0,0046 0,0020 1 0,2985 0,3874 0,3679 0,3020 0,2253 0,1556 0,1004 0,0605 0,0339 0,0176 2 0,0629 0,1722 0,2597 0,3020 0,3003 0,2668 0,2162 0,1612 0,1110 0,0703 3 0,0077 0,0446 0,1069 0,1762 0,2336 0,2668 0,2716 0,2508 0,2119 0,1641 4 0,0006 0,0074 0,0283 0,0661 0,1168 0,1715 0,2194 0,2508 0,2600 0,2461 5 0,0000 0,0008 0,0050 0,0165 0,0389 0,0735 0,1181 0,1672 0,2128 0,2461 6 0,0000 0,0001 0,0006 0,0028 0,0087 0,0210 0,0424 0,0743 0,1160 0,1641 7 0,0000 0,0000 0,0000 0,0003 0,0012 0,0039 0,0098 0,0212 0,0407 0,0703 8 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0013 0,0035 0,0083 0,0176 9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0008 0,0020

10 0 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0135 0,0060 0,0025 0,0010 1 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0725 0,0403 0,0207 0,0098 2 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1757 0,1209 0,0763 0,0439 3 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2522 0,2150 0,1665 0,1172 4 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2377 0,2508 0,2384 0,2051 5 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1536 0,2007 0,2340 0,2461 6 0,0000 0,0001 0,0012 0,0055 0,0162 0,0368 0,0689 0,1115 0,1596 0,2051 7 0,0000 0,0000 0,0001 0,0008 0,0031 0,0090 0,0212 0,0425 0,0746 0,1172 8 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0043 0,0106 0,0229 0,0439 9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016 0,0042 0,0098 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010

11 0 0,5688 0,3138 0,1673 0,0859 0,0422 0,0198 0,0088 0,0036 0,0014 0,0005 1 0,3293 0,3835 0,3248 0,2362 0,1549 0,0932 0,0518 0,0266 0,0125 0,0054 2 0,0867 0,2131 0,2866 0,2953 0,2581 0,1998 0,1395 0,0887 0,0513 0,0269 3 0,0137 0,0710 0,1517 0,2215 0,2581 0,2568 0,2254 0,1774 0,1259 0,0806 4 0,0014 0,0158 0,0536 0,1107 0,1721 0,2201 0,2428 0,2365 0,2060 0,1611 5 0,0001 0,0025 0,0132 0,0388 0,0803 0,1321 0,1830 0,2207 0,2360 0,2256 6 0,0000 0,0003 0,0023 0,0097 0,0268 0,0566 0,0985 0,1471 0,1931 0,2256 7 0,0000 0,0000 0,0003 0,0017 0,0064 0,0173 0,0379 0,0701 0,1128 0,1611 8 0,0000 0,0000 0,0000 0,0002 0,0011 0,0037 0,0102 0,0234 0,0462 0,0806 9 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018 0,0052 0,0126 0,0269 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0007 0,0021 0,0054 11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0005

12 0 0,5404 0,2824 0,1422 0,0687 0,0317 0,0138 0,0057 0,0022 0,0008 0,0002 1 0,3413 0,3766 0,3012 0,2062 0,1267 0,0712 0,0368 0,0174 0,0075 0,0029 2 0,0988 0,2301 0,2924 0,2835 0,2323 0,1678 0,1088 0,0639 0,0339 0,0161 3 0,0173 0,0852 0,1720 0,2362 0,2581 0,2397 0,1954 0,1419 0,0923 0,0537 4 0,0021 0,0213 0,0683 0,1329 0,1936 0,2311 0,2367 0,2128 0,1700 0,1208 5 0,0002 0,0038 0,0193 0,0532 0,1032 0,1585 0,2039 0,2270 0,2225 0,1934 6 0,0000 0,0005 0,0040 0,0155 0,0401 0,0792 0,1281 0,1766 0,2124 0,2256 7 0,0000 0,0000 0,0006 0,0033 0,0115 0,0291 0,0591 0,1009 0,1489 0,1934 8 0,0000 0,0000 0,0001 0,0005 0,0024 0,0078 0,0199 0,0420 0,0762 0,1208 9 0,0000 0,0000 0,0000 0,0001 0,0004 0,0015 0,0048 0,0125 0,0277 0,0537 10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0008 0,0025 0,0068 0,0161 11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0029 12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002

Page 224: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

224

p

n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50

13 0 0,5133 0,2542 0,1209 0,0550 0,0238 0,0097 0,0037 0,0013 0,0004 0,0001 1 0,3512 0,3672 0,2774 0,1787 0,1029 0,0540 0,0259 0,0113 0,0045 0,0016 2 0,1109 0,2448 0,2937 0,2680 0,2059 0,1388 0,0836 0,0453 0,0220 0,0095 3 0,0214 0,0997 0,1900 0,2457 0,2517 0,2181 0,1651 0,1107 0,0660 0,0349 4 0,0028 0,0277 0,0838 0,1535 0,2097 0,2337 0,2222 0,1845 0,1350 0,0873 5 0,0003 0,0055 0,0266 0,0691 0,1258 0,1803 0,2154 0,2214 0,1989 0,1571 6 0,0000 0,0008 0,0063 0,0230 0,0559 0,1030 0,1546 0,1968 0,2169 0,2095 7 0,0000 0,0001 0,0011 0,0058 0,0186 0,0442 0,0833 0,1312 0,1775 0,2095 8 0,0000 0,0000 0,0001 0,0011 0,0047 0,0142 0,0336 0,0656 0,1089 0,1571 9 0,0000 0,0000 0,0000 0,0001 0,0009 0,0034 0,0101 0,0243 0,0495 0,0873 10 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0022 0,0065 0,0162 0,0349 11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0012 0,0036 0,0095 12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0016 13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001

14 0 0,4877 0,2288 0,1028 0,0440 0,0178 0,0068 0,0024 0,0008 0,0002 0,0001 1 0,3593 0,3559 0,2539 0,1539 0,0832 0,0407 0,0181 0,0073 0,0027 0,0009 2 0,1229 0,2570 0,2912 0,2501 0,1802 0,1134 0,0634 0,0317 0,0141 0,0056 3 0,0259 0,1142 0,2056 0,2501 0,2402 0,1943 0,1366 0,0845 0,0462 0,0222 4 0,0037 0,0349 0,0998 0,1720 0,2202 0,2290 0,2022 0,1549 0,1040 0,0611 5 0,0004 0,0078 0,0352 0,0860 0,1468 0,1963 0,2178 0,2066 0,1701 0,1222 6 0,0000 0,0013 0,0093 0,0322 0,0734 0,1262 0,1759 0,2066 0,2088 0,1833 7 0,0000 0,0002 0,0019 0,0092 0,0280 0,0618 0,1082 0,1574 0,1952 0,2095 8 0,0000 0,0000 0,0003 0,0020 0,0082 0,0232 0,0510 0,0918 0,1398 0,1833 9 0,0000 0,0000 0,0000 0,0003 0,0018 0,0066 0,0183 0,0408 0,0762 0,1222 10 0,0000 0,0000 0,0000 0,0000 0,0003 0,0014 0,0049 0,0136 0,0312 0,0611 11 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0033 0,0093 0,0222 12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0019 0,0056 13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0009 14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001

15 0 0,4633 0,2059 0,0874 0,0352 0,0134 0,0047 0,0016 0,0005 0,0001 0,0000 1 0,3658 0,3432 0,2312 0,1319 0,0668 0,0305 0,0126 0,0047 0,0016 0,0005 2 0,1348 0,2669 0,2856 0,2309 0,1559 0,0916 0,0476 0,0219 0,0090 0,0032 3 0,0307 0,1285 0,2184 0,2501 0,2252 0,1700 0,1110 0,0634 0,0318 0,0139 4 0,0049 0,0428 0,1156 0,1876 0,2252 0,2186 0,1792 0,1268 0,0780 0,0417 5 0,0006 0,0105 0,0449 0,1032 0,1651 0,2061 0,2123 0,1859 0,1404 0,0916 6 0,0000 0,0019 0,0132 0,0430 0,0917 0,1472 0,1906 0,2066 0,1914 0,1527 7 0,0000 0,0003 0,0030 0,0138 0,0393 0,0811 0,1319 0,1771 0,2013 0,1964 8 0,0000 0,0000 0,0005 0,0035 0,0131 0,0348 0,0710 0,1181 0,1647 0,1964 9 0,0000 0,0000 0,0001 0,0007 0,0034 0,0116 0,0298 0,0612 0,1048 0,1527 10 0,0000 0,0000 0,0000 0,0001 0,0007 0,0030 0,0096 0,0245 0,0515 0,0916 11 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0074 0,0191 0,0417 12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0016 0,0052 0,0139 13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0032 14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

Page 225: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

225

p

n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50 16 0 0,4401 0,1853 0,0743 0,0281 0,0100 0,0033 0,0010 0,0003 0,0001 0,0000

1 0,3706 0,3294 0,2097 0,1126 0,0535 0,0228 0,0087 0,0030 0,0009 0,0002 2 0,1463 0,2745 0,2775 0,2111 0,1336 0,0732 0,0353 0,0150 0,0056 0,0018 3 0,0359 0,1423 0,2285 0,2463 0,2079 0,1465 0,0888 0,0468 0,0215 0,0085 4 0,0061 0,0514 0,1311 0,2001 0,2252 0,2040 0,1553 0,1014 0,0572 0,0278 5 0,0008 0,0137 0,0555 0,1201 0,1802 0,2099 0,2008 0,1623 0,1123 0,0667 6 0,0001 0,0028 0,0180 0,0550 0,1101 0,1649 0,1982 0,1983 0,1684 0,1222 7 0,0000 0,0004 0,0045 0,0197 0,0524 0,1010 0,1524 0,1889 0,1969 0,1746 8 0,0000 0,0001 0,0009 0,0055 0,0197 0,0487 0,0923 0,1417 0,1812 0,1964 9 0,0000 0,0000 0,0001 0,0012 0,0058 0,0185 0,0442 0,0840 0,1318 0,1746 10 0,0000 0,0000 0,0000 0,0002 0,0014 0,0056 0,0167 0,0392 0,0755 0,1222 11 0,0000 0,0000 0,0000 0,0000 0,0002 0,0013 0,0049 0,0142 0,0337 0,0667 12 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0040 0,0115 0,0278 13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0008 0,0029 0,0085 14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018 15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

17 0 0,4181 0,1668 0,0631 0,0225 0,0075 0,0023 0,0007 0,0002 0,0000 0,0000 1 0,3741 0,3150 0,1893 0,0957 0,0426 0,0169 0,0060 0,0019 0,0005 0,0001 2 0,1575 0,2800 0,2673 0,1914 0,1136 0,0581 0,0260 0,0102 0,0035 0,0010 3 0,0415 0,1556 0,2359 0,2393 0,1893 0,1245 0,0701 0,0341 0,0144 0,0052 4 0,0076 0,0605 0,1457 0,2093 0,2209 0,1868 0,1320 0,0796 0,0411 0,0182 5 0,0010 0,0175 0,0668 0,1361 0,1914 0,2081 0,1849 0,1379 0,0875 0,0472 6 0,0001 0,0039 0,0236 0,0680 0,1276 0,1784 0,1991 0,1839 0,1432 0,0944 7 0,0000 0,0007 0,0065 0,0267 0,0668 0,1201 0,1685 0,1927 0,1841 0,1484 8 0,0000 0,0001 0,0014 0,0084 0,0279 0,0644 0,1134 0,1606 0,1883 0,1855 9 0,0000 0,0000 0,0003 0,0021 0,0093 0,0276 0,0611 0,1070 0,1540 0,1855 10 0,0000 0,0000 0,0000 0,0004 0,0025 0,0095 0,0263 0,0571 0,1008 0,1484 11 0,0000 0,0000 0,0000 0,0001 0,0005 0,0026 0,0090 0,0242 0,0525 0,0944 12 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0081 0,0215 0,0472 13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0021 0,0068 0,0182 14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0016 0,0052 15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

18 0 0,3972 0,1501 0,0536 0,0180 0,0056 0,0016 0,0004 0,0001 0,0000 0,0000 1 0,3763 0,3002 0,1704 0,0811 0,0338 0,0126 0,0042 0,0012 0,0003 0,0001 2 0,1683 0,2835 0,2556 0,1723 0,0958 0,0458 0,0190 0,0069 0,0022 0,0006 3 0,0473 0,1680 0,2406 0,2297 0,1704 0,1046 0,0547 0,0246 0,0095 0,0031 4 0,0093 0,0700 0,1592 0,2153 0,2130 0,1681 0,1104 0,0614 0,0291 0,0117 5 0,0014 0,0218 0,0787 0,1507 0,1988 0,2017 0,1664 0,1146 0,0666 0,0327 6 0,0002 0,0052 0,0301 0,0816 0,1436 0,1873 0,1941 0,1655 0,1181 0,0708 7 0,0000 0,0010 0,0091 0,0350 0,0820 0,1376 0,1792 0,1892 0,1657 0,1214 8 0,0000 0,0002 0,0022 0,0120 0,0376 0,0811 0,1327 0,1734 0,1864 0,1669 9 0,0000 0,0000 0,0004 0,0033 0,0139 0,0386 0,0794 0,1284 0,1694 0,1855 10 0,0000 0,0000 0,0001 0,0008 0,0042 0,0149 0,0385 0,0771 0,1248 0,1669 11 0,0000 0,0000 0,0000 0,0001 0,0010 0,0046 0,0151 0,0374 0,0742 0,1214 12 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0047 0,0145 0,0354 0,0708 13 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0045 0,0134 0,0327 14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 0,0039 0,0117 15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0009 0,0031 16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

p

Page 226: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

226

n k 0,05 0,10 0,15 0,20 0,25 0,30 0,35 0,40 0,45 0,50

19 0 0,3774 0,1351 0,0456 0,0144 0,0042 0,0011 0,0003 0,0001 0,0000 0,0000 1 0,3774 0,2852 0,1529 0,0685 0,0268 0,0093 0,0029 0,0008 0,0002 0,0000 2 0,1787 0,2852 0,2428 0,1540 0,0803 0,0358 0,0138 0,0046 0,0013 0,0003 3 0,0533 0,1796 0,2428 0,2182 0,1517 0,0869 0,0422 0,0175 0,0062 0,0018 4 0,0112 0,0798 0,1714 0,2182 0,2023 0,1491 0,0909 0,0467 0,0203 0,0074 5 0,0018 0,0266 0,0907 0,1636 0,2023 0,1916 0,1468 0,0933 0,0497 0,0222 6 0,0002 0,0069 0,0374 0,0955 0,1574 0,1916 0,1844 0,1451 0,0949 0,0518 7 0,0000 0,0014 0,0122 0,0443 0,0974 0,1525 0,1844 0,1797 0,1443 0,0961 8 0,0000 0,0002 0,0032 0,0166 0,0487 0,0981 0,1489 0,1797 0,1771 0,1442 9 0,0000 0,0000 0,0007 0,0051 0,0198 0,0514 0,0980 0,1464 0,1771 0,1762 10 0,0000 0,0000 0,0001 0,0013 0,0066 0,0220 0,0528 0,0976 0,1449 0,1762 11 0,0000 0,0000 0,0000 0,0003 0,0018 0,0077 0,0233 0,0532 0,0970 0,1442 12 0,0000 0,0000 0,0000 0,0000 0,0004 0,0022 0,0083 0,0237 0,0529 0,0961 13 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0024 0,0085 0,0233 0,0518 14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0006 0,0024 0,0082 0,0222 15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0022 0,0074 16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0005 0,0018 17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 19 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

20 0 0,3585 0,1216 0,0388 0,0115 0,0032 0,0008 0,0002 0,0000 0,0000 0,0000 1 0,3774 0,2702 0,1368 0,0576 0,0211 0,0068 0,0020 0,0005 0,0001 0,0000 2 0,1887 0,2852 0,2293 0,1369 0,0669 0,0278 0,0100 0,0031 0,0008 0,0002 3 0,0596 0,1901 0,2428 0,2054 0,1339 0,0716 0,0323 0,0123 0,0040 0,0011 4 0,0133 0,0898 0,1821 0,2182 0,1897 0,1304 0,0738 0,0350 0,0139 0,0046 5 0,0022 0,0319 0,1028 0,1746 0,2023 0,1789 0,1272 0,0746 0,0365 0,0148 6 0,0003 0,0089 0,0454 0,1091 0,1686 0,1916 0,1712 0,1244 0,0746 0,0370 7 0,0000 0,0020 0,0160 0,0545 0,1124 0,1643 0,1844 0,1659 0,1221 0,0739 8 0,0000 0,0004 0,0046 0,0222 0,0609 0,1144 0,1614 0,1797 0,1623 0,1201 9 0,0000 0,0001 0,0011 0,0074 0,0271 0,0654 0,1158 0,1597 0,1771 0,1602 10 0,0000 0,0000 0,0002 0,0020 0,0099 0,0308 0,0686 0,1171 0,1593 0,1762 11 0,0000 0,0000 0,0000 0,0005 0,0030 0,0120 0,0336 0,0710 0,1185 0,1602 12 0,0000 0,0000 0,0000 0,0001 0,0008 0,0039 0,0136 0,0355 0,0727 0,1201 13 0,0000 0,0000 0,0000 0,0000 0,0002 0,0010 0,0045 0,0146 0,0366 0,0739 14 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0012 0,0049 0,0150 0,0370 15 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0049 0,0148 16 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0003 0,0013 0,0046 17 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 0,0011 18 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0002 19 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 20 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

Page 227: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

227

II. táblázat. Poisson-eloszlás

λ k 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0 0,904 0,818 0,740 0,670 0,606 0,548 0,496 0,449 0,406 0,3671 0,090 0,163 0,222 0,268 0,303 0,329 0,347 0,359 0,365 0,3672 0,004 0,016 0,033 0,053 0,075 0,098 0,121 0,143 0,164 0,1833 0,000 0,001 0,003 0,007 0,012 0,019 0,028 0,038 0,049 0,0614 0,000 0,000 0,000 0,000 0,001 0,003 0,005 0,007 0,011 0,0155 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,0036 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0007 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

λ

k 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 0 0,332 0,301 0,272 0,246 0,223 0,201 0,182 0,165 0,149 0,1351 0,366 0,361 0,354 0,345 0,334 0,323 0,310 0,297 0,284 0,2702 0,201 0,216 0,230 0,241 0,251 0,258 0,264 0,267 0,270 0,2703 0,073 0,086 0,099 0,112 0,125 0,137 0,149 0,160 0,171 0,1804 0,020 0,026 0,032 0,039 0,047 0,055 0,063 0,072 0,081 0,0905 0,004 0,006 0,008 0,011 0,014 0,017 0,021 0,026 0,030 0,0366 0,000 0,001 0,001 0,002 0,003 0,004 0,006 0,007 0,009 0,0127 0,000 0,000 0,000 0,000 0,000 0,001 0,001 0,002 0,002 0,0038 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0009 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

λ k 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 0 0,122 0,110 0,100 0,090 0,082 0,074 0,067 0,060 0,055 0,0491 0,257 0,243 0,230 0,217 0,205 0,193 0,181 0,170 0,159 0,1492 0,270 0,268 0,265 0,261 0,256 0,251 0,245 0,238 0,231 0,2243 0,189 0,196 0,203 0,209 0,213 0,217 0,220 0,222 0,223 0,2244 0,099 0,108 0,116 0,125 0,133 0,141 0,148 0,155 0,162 0,1685 0,041 0,047 0,053 0,060 0,066 0,073 0,080 0,087 0,094 0,1006 0,014 0,017 0,020 0,024 0,027 0,031 0,036 0,040 0,045 0,0507 0,004 0,005 0,006 0,008 0,009 0,011 0,013 0,016 0,018 0,0218 0,001 0,001 0,001 0,002 0,003 0,003 0,004 0,005 0,006 0,0089 0,000 0,000 0,000 0,000 0,000 0,001 0,001 0,001 0,002 0,002

10 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00011 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00012 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

λ k 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 0 0,045 0,040 0,036 0,033 0,030 0,027 0,024 0,022 0,020 0,0181 0,139 0,130 0,121 0,113 0,105 0,098 0,091 0,085 0,078 0,0732 0,216 0,208 0,200 0,192 0,185 0,177 0,169 0,161 0,153 0,1463 0,223 0,222 0,220 0,218 0,215 0,212 0,208 0,204 0,200 0,1954 0,173 0,178 0,182 0,185 0,188 0,191 0,193 0,194 0,195 0,1955 0,107 0,114 0,120 0,126 0,132 0,137 0,142 0,147 0,152 0,1566 0,055 0,060 0,066 0,071 0,077 0,082 0,088 0,093 0,098 0,1047 0,024 0,027 0,031 0,034 0,038 0,042 0,046 0,050 0,055 0,0598 0,009 0,011 0,012 0,014 0,016 0,019 0,021 0,024 0,026 0,029

Page 228: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

228

9 0,003 0,004 0,004 0,005 0,006 0,007 0,008 0,010 0,011 0,013

10 0,001 0,001 0,001 0,001 0,002 0,002 0,003 0,003 0,004 0,00511 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,001 0,001 0,00112 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00013 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00014 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

λ k 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0 0 0,016 0,015 0,013 0,012 0,011 0,010 0,009 0,008 0,007 0,0061 0,067 0,063 0,058 0,054 0,050 0,046 0,042 0,039 0,036 0,0332 0,139 0,132 0,125 0,118 0,112 0,106 0,100 0,094 0,089 0,0843 0,190 0,185 0,179 0,174 0,168 0,163 0,157 0,151 0,146 0,1404 0,195 0,194 0,193 0,191 0,189 0,187 0,184 0,182 0,178 0,1755 0,160 0,163 0,166 0,168 0,170 0,172 0,173 0,174 0,175 0,1756 0,109 0,114 0,119 0,123 0,128 0,132 0,136 0,139 0,143 0,1467 0,064 0,068 0,073 0,077 0,082 0,086 0,091 0,095 0,100 0,1048 0,032 0,036 0,039 0,042 0,046 0,050 0,053 0,057 0,061 0,0659 0,015 0,016 0,018 0,020 0,023 0,025 0,028 0,030 0,033 0,036

10 0,006 0,007 0,008 0,009 0,010 0,011 0,013 0,014 0,016 0,01811 0,002 0,002 0,003 0,003 0,004 0,004 0,005 0,006 0,007 0,00812 0,000 0,000 0,001 0,001 0,001 0,001 0,002 0,002 0,003 0,00313 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,00114 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00015 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

λ k 5,1 5,2 5,3 5,4 5,5 5,6 5,7 5,8 5,9 6,0 0 0,006 0,005 0,005 0,004 0,004 0,003 0,003 0,003 0,002 0,0021 0,031 0,028 0,026 0,024 0,022 0,020 0,019 0,017 0,016 0,0142 0,079 0,074 0,070 0,065 0,061 0,058 0,054 0,050 0,047 0,0443 0,134 0,129 0,123 0,118 0,113 0,108 0,103 0,098 0,093 0,0894 0,171 0,168 0,164 0,160 0,155 0,151 0,147 0,142 0,138 0,1335 0,175 0,174 0,174 0,172 0,171 0,169 0,167 0,165 0,163 0,1606 0,149 0,151 0,153 0,155 0,157 0,158 0,159 0,160 0,160 0,1607 0,108 0,112 0,116 0,120 0,123 0,126 0,129 0,132 0,135 0,1378 0,069 0,073 0,077 0,081 0,084 0,088 0,092 0,096 0,099 0,1039 0,039 0,042 0,045 0,048 0,051 0,055 0,058 0,062 0,065 0,068

10 0,020 0,022 0,024 0,026 0,028 0,030 0,033 0,035 0,038 0,04111 0,009 0,010 0,011 0,012 0,014 0,015 0,017 0,019 0,020 0,02212 0,003 0,004 0,005 0,005 0,006 0,007 0,008 0,009 0,010 0,01113 0,001 0,001 0,002 0,002 0,002 0,003 0,003 0,004 0,004 0,00514 0,000 0,000 0,000 0,000 0,001 0,001 0,001 0,001 0,001 0,00215 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00016 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00017 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

λ k 6,1 6,2 6,3 6,4 6,5 6,6 6,7 6,8 6,9 7,0 0 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,0001 0,013 0,012 0,011 0,010 0,009 0,009 0,008 0,007 0,007 0,0062 0,041 0,039 0,036 0,034 0,031 0,029 0,027 0,025 0,024 0,0223 0,084 0,080 0,076 0,072 0,068 0,065 0,061 0,058 0,055 0,052

Page 229: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

229

4 0,129 0,124 0,120 0,116 0,111 0,107 0,103 0,099 0,095 0,0915 0,157 0,154 0,151 0,148 0,145 0,142 0,138 0,134 0,131 0,1276 0,160 0,160 0,159 0,158 0,157 0,156 0,154 0,152 0,151 0,1497 0,139 0,141 0,143 0,145 0,146 0,147 0,148 0,148 0,148 0,1498 0,106 0,109 0,113 0,116 0,118 0,121 0,124 0,126 0,128 0,1309 0,072 0,075 0,079 0,082 0,085 0,089 0,092 0,095 0,098 0,101

10 0,044 0,046 0,049 0,052 0,055 0,058 0,061 0,064 0,067 0,07111 0,024 0,026 0,028 0,030 0,033 0,035 0,037 0,040 0,042 0,04512 0,012 0,013 0,015 0,016 0,017 0,019 0,021 0,022 0,024 0,02613 0,005 0,006 0,007 0,008 0,008 0,009 0,010 0,011 0,013 0,01414 0,002 0,002 0,003 0,003 0,004 0,004 0,005 0,005 0,006 0,00715 0,001 0,001 0,001 0,001 0,001 0,002 0,002 0,002 0,002 0,00316 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,001 0,001 0,00117 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00018 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00019 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

λ k 7,1 7,2 7,3 7,4 7,5 7,6 7,7 7,8 7,9 8,0 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0001 0,005 0,005 0,004 0,004 0,004 0,003 0,003 0,003 0,002 0,0022 0,020 0,019 0,018 0,016 0,015 0,014 0,013 0,012 0,011 0,0103 0,049 0,046 0,043 0,041 0,038 0,036 0,034 0,032 0,030 0,0284 0,087 0,083 0,079 0,076 0,072 0,069 0,066 0,063 0,060 0,0575 0,124 0,120 0,116 0,113 0,109 0,105 0,102 0,098 0,095 0,0916 0,146 0,144 0,142 0,139 0,136 0,133 0,131 0,128 0,125 0,1227 0,148 0,148 0,148 0,147 0,146 0,145 0,144 0,142 0,141 0,1398 0,132 0,133 0,135 0,136 0,137 0,138 0,138 0,139 0,139 0,1399 0,104 0,107 0,109 0,112 0,114 0,116 0,118 0,120 0,122 0,124

10 0,074 0,077 0,080 0,082 0,085 0,088 0,091 0,094 0,096 0,09911 0,047 0,050 0,053 0,055 0,058 0,061 0,064 0,066 0,069 0,07212 0,028 0,030 0,032 0,034 0,036 0,038 0,041 0,043 0,045 0,04813 0,015 0,016 0,018 0,019 0,021 0,022 0,024 0,026 0,027 0,02914 0,007 0,008 0,009 0,010 0,011 0,012 0,013 0,014 0,015 0,01615 0,003 0,004 0,004 0,005 0,005 0,006 0,006 0,007 0,008 0,00916 0,001 0,001 0,002 0,002 0,002 0,003 0,003 0,003 0,004 0,00417 0,000 0,000 0,000 0,001 0,001 0,001 0,001 0,001 0,001 0,00218 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00019 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00020 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00021 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

λ k 8,1 8,2 8,3 8,4 8,5 8,6 8,7 8,8 8,9 9,0 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0001 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,0012 0,010 0,009 0,008 0,007 0,007 0,006 0,006 0,005 0,005 0,0053 0,026 0,025 0,023 0,022 0,020 0,019 0,018 0,017 0,016 0,0154 0,054 0,051 0,049 0,046 0,044 0,042 0,039 0,037 0,035 0,0335 0,088 0,084 0,081 0,078 0,075 0,072 0,069 0,066 0,063 0,0606 0,119 0,116 0,112 0,109 0,106 0,103 0,100 0,097 0,094 0,091

Page 230: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

230

7 0,137 0,135 0,133 0,131 0,129 0,127 0,124 0,122 0,119 0,1178 0,139 0,139 0,138 0,138 0,137 0,136 0,135 0,134 0,133 0,1319 0,125 0,126 0,128 0,129 0,129 0,130 0,131 0,131 0,131 0,131

10 0,101 0,104 0,106 0,108 0,110 0,112 0,114 0,115 0,117 0,11811 0,074 0,077 0,080 0,082 0,085 0,087 0,090 0,092 0,094 0,09712 0,050 0,053 0,055 0,057 0,060 0,062 0,065 0,067 0,070 0,07213 0,031 0,033 0,035 0,037 0,039 0,041 0,043 0,045 0,048 0,05014 0,018 0,019 0,021 0,022 0,024 0,025 0,027 0,028 0,030 0,03215 0,009 0,010 0,011 0,012 0,013 0,014 0,015 0,016 0,018 0,01916 0,005 0,005 0,006 0,006 0,007 0,007 0,008 0,009 0,010 0,01017 0,002 0,002 0,002 0,003 0,003 0,004 0,004 0,004 0,005 0,00518 0,001 0,001 0,001 0,001 0,001 0,001 0,002 0,002 0,002 0,00219 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,001 0,001 0,00120 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00021 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00022 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

λ k 9,1 9,2 9,3 9,4 9,5 9,6 9,7 9,8 9,9 10,0 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0002 0,004 0,004 0,004 0,003 0,003 0,003 0,002 0,002 0,002 0,0023 0,014 0,013 0,012 0,011 0,010 0,010 0,009 0,008 0,008 0,0074 0,031 0,030 0,028 0,026 0,025 0,024 0,022 0,021 0,020 0,0185 0,058 0,055 0,053 0,050 0,048 0,046 0,043 0,041 0,039 0,0376 0,088 0,085 0,082 0,079 0,076 0,073 0,070 0,068 0,065 0,0637 0,114 0,111 0,109 0,106 0,103 0,101 0,098 0,095 0,092 0,0908 0,130 0,128 0,126 0,125 0,123 0,121 0,119 0,117 0,114 0,1129 0,131 0,131 0,131 0,130 0,130 0,129 0,128 0,127 0,126 0,125

10 0,119 0,121 0,121 0,122 0,123 0,124 0,124 0,124 0,125 0,12511 0,099 0,101 0,103 0,104 0,106 0,108 0,109 0,111 0,112 0,11312 0,075 0,077 0,079 0,082 0,084 0,086 0,088 0,090 0,092 0,09413 0,052 0,054 0,057 0,059 0,061 0,064 0,066 0,068 0,070 0,07214 0,034 0,036 0,038 0,039 0,041 0,043 0,045 0,047 0,050 0,05215 0,020 0,022 0,023 0,025 0,026 0,028 0,029 0,031 0,033 0,03416 0,011 0,012 0,013 0,014 0,015 0,016 0,018 0,019 0,020 0,02117 0,006 0,006 0,007 0,008 0,008 0,009 0,010 0,011 0,011 0,01218 0,003 0,003 0,003 0,004 0,004 0,005 0,005 0,006 0,006 0,00719 0,001 0,001 0,001 0,002 0,002 0,002 0,002 0,003 0,003 0,00320 0,000 0,000 0,000 0,001 0,001 0,001 0,001 0,001 0,001 0,00121 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00022 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00023 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00024 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

Page 231: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

231

λ

k 11,0 12,0 13,0 14,0 15,0 16,0 17,0 18,0 19,0 20,0 0 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0002 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0003 0,003 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,0004 0,010 0,005 0,002 0,001 0,000 0,000 0,000 0,000 0,000 0,0005 0,022 0,012 0,007 0,003 0,001 0,001 0,000 0,000 0,000 0,0006 0,041 0,025 0,015 0,008 0,004 0,002 0,001 0,000 0,000 0,0007 0,064 0,043 0,028 0,017 0,010 0,006 0,003 0,001 0,001 0,0008 0,088 0,065 0,045 0,030 0,019 0,012 0,007 0,004 0,002 0,0019 0,108 0,087 0,066 0,047 0,032 0,021 0,013 0,008 0,005 0,002

10 0,119 0,104 0,085 0,066 0,048 0,034 0,023 0,015 0,009 0,00511 0,119 0,114 0,101 0,084 0,066 0,049 0,035 0,024 0,016 0,01012 0,109 0,114 0,109 0,098 0,082 0,066 0,050 0,036 0,025 0,01713 0,092 0,105 0,109 0,106 0,095 0,081 0,065 0,050 0,037 0,02714 0,072 0,090 0,102 0,106 0,102 0,093 0,080 0,065 0,051 0,03815 0,053 0,072 0,088 0,098 0,102 0,099 0,090 0,078 0,065 0,05116 0,036 0,054 0,071 0,086 0,096 0,099 0,096 0,088 0,077 0,06417 0,023 0,038 0,055 0,071 0,084 0,093 0,096 0,093 0,086 0,07618 0,014 0,025 0,039 0,055 0,070 0,083 0,090 0,093 0,091 0,08419 0,008 0,016 0,027 0,040 0,055 0,069 0,081 0,088 0,091 0,08820 0,004 0,009 0,017 0,028 0,041 0,055 0,069 0,079 0,086 0,08821 0,002 0,005 0,010 0,019 0,029 0,042 0,056 0,068 0,078 0,08422 0,001 0,003 0,006 0,012 0,020 0,031 0,043 0,056 0,067 0,07623 0,000 0,001 0,003 0,007 0,013 0,021 0,032 0,043 0,055 0,06624 0,000 0,000 0,002 0,004 0,008 0,014 0,022 0,032 0,044 0,05525 0,000 0,000 0,001 0,002 0,005 0,009 0,015 0,023 0,033 0,04426 0,000 0,000 0,000 0,001 0,002 0,005 0,010 0,016 0,024 0,03427 0,000 0,000 0,000 0,000 0,001 0,003 0,006 0,010 0,017 0,02528 0,000 0,000 0,000 0,000 0,000 0,001 0,003 0,007 0,011 0,01829 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,004 0,007 0,01230 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,002 0,004 0,00831 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,003 0,00532 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,00333 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,001 0,00234 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00135 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00036 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00037 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00038 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,00039 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

Page 232: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

232

0

u ΦΦΦΦ(u) u ΦΦΦΦ(u) u ΦΦΦΦ(u) u ΦΦΦΦ(u) u ΦΦΦΦ(u) 0.00 0.500000 0.52 0.698468 1.04 0.850830 1.56 0.940620 2.14 0.983823 0.01 0.503989 0.53 0.701944 1.05 0.853141 1.57 0.941792 2.16 0.984614 0.02 0.507978 0.54 0.705401 1.06 0.855428 1.58 0.942947 2.18 0.985371 0.03 0.511966 0.55 0.708840 1.07 0.857690 1.59 0.944083 2.20 0.986097 0.04 0.515953 0.56 0.712260 1.08 0.859929 1.60 0.945201 2.22 0.986791 0.05 0.519939 0.57 0.715661 1.09 0.862143 1.61 0.946301 2.24 0.987455 0.06 0.523922 0.58 0.719043 1.10 0.864334 1.62 0.947384 2.26 0.988089 0.07 0.527903 0.59 0.722405 1.11 0.866500 1.63 0.948449 2.28 0.988696 0.08 0.531881 0.60 0.725747 1.12 0.868643 1.64 0.949497 2.30 0.989276 0.09 0.535856 0.61 0.729069 1.13 0.870762 1.65 0.950529 2.32 0.989830 0.10 0.539828 0.62 0.732371 1.14 0.872857 1.66 0.951543 2.34 0.990358 0.11 0.543795 0.63 0.735653 1.15 0.874928 1.67 0.952540 2.36 0.990863 0.12 0.547758 0.64 0.738914 1.16 0.876976 1.68 0.953521 2.38 0.991344 0.13 0.551717 0.65 0.742154 1.17 0.879000 1.69 0.954486 2.40 0.991802 0.14 0.555670 0.66 0.745373 1.18 0.881000 1.70 0.955435 2.42 0.992240 0.15 0.559618 0.67 0.748571 1.19 0.882977 1.71 0.956367 2.44 0.992656 0.16 0.563559 0.68 0.751748 1.20 0.884930 1.72 0.957284 2.46 0.993053 0.17 0.567495 0.69 0.754903 1.21 0.886861 1.73 0.958185 2.48 0.993431 0.18 0.571424 0.70 0.758036 1.22 0.888768 1.74 0.959070 2.50 0.993790 0.19 0.575345 0.71 0.761148 1.23 0.890651 1.75 0.959941 2.52 0.994132 0.20 0.579260 0.72 0.764237 1.24 0.892512 1.76 0.960796 2.54 0.994457 0.21 0.583166 0.73 0.767305 1.25 0.894350 1.77 0.961636 2.56 0.994766 0.22 0.587064 0.74 0.770350 1.26 0.896165 1.78 0.962462 2.58 0.995060 0.23 0.590954 0.75 0.773373 1.27 0.897958 1.79 0.963273 2.60 0.995339 0.24 0.594835 0.76 0.776373 1.28 0.899727 1.80 0.964070 2.62 0.995604 0.25 0.598706 0.77 0.779350 1.29 0.901475 1.81 0.964852 2.64 0.995855 0.26 0.602568 0.78 0.782305 1.30 0.903200 1.82 0.965620 2.66 0.996093 0.27 0.606420 0.79 0.785236 1.31 0.904902 1.83 0.966375 2.68 0.996319 0.28 0.610261 0.80 0.788145 1.32 0.906582 1.84 0.967116 2.70 0.996533 0.29 0.614092 0.81 0.791030 1.33 0.908241 1.85 0.967843 2.72 0.996736 0.30 0.617911 0.82 0.793892 1.34 0.909877 1.86 0.968557 2.74 0.996928 0.31 0.621720 0.83 0.796731 1.35 0.911492 1.87 0.969258 2.76 0.997110 0.32 0.625516 0.84 0.799546 1.36 0.913085 1.88 0.969946 2.78 0.997282 0.33 0.629300 0.85 0.802337 1.37 0.914657 1.89 0.970621 2.80 0.997445 0.34 0.633072 0.86 0.805105 1.38 0.916207 1.90 0.971283 2.82 0.997599 0.35 0.636831 0.87 0.807850 1.39 0.917736 1.91 0.971933 2.84 0.997744 0.36 0.640576 0.88 0.810570 1.40 0.919243 1.92 0.972571 2.86 0.997882 0.37 0.644309 0.89 0.813267 1.41 0.920730 1.93 0.973197 2.88 0.998012 0.38 0.648027 0.90 0.815940 1.42 0.922196 1.94 0.973810 2.90 0.998134 0.39 0.651732 0.91 0.818589 1.43 0.923641 1.95 0.974412 2.92 0.998250 0.40 0.655422 0.92 0.821214 1.44 0.925066 1.96 0.975002 2.94 0.998359 0.41 0.659097 0.93 0.823814 1.45 0.926471 1.97 0.975581 2.96 0.998462 0.42 0.662757 0.94 0.826391 1.46 0.927855 1.98 0.976148 2.98 0.998559 0.43 0.666402 0.95 0.828944 1.47 0.929219 1.99 0.976705 3.00 0.998650 0.44 0.670031 0.96 0.831472 1.48 0.930563 2.00 0.977250 3.20 0.999313 0.45 0.673645 0.97 0.833977 1.49 0.931888 2.01 0.9778 3.40 0.999663 0.46 0.677242 0.98 0.836457 1.50 0.933193 2.02 0.978308 3.60 0.999841 0.47 0.680822 0.99 0.838913 1.51 0.934478 2.04 0.979325 3.80 0.999928 0.48 0.684386 1.00 0.841345 1.52 0.935745 2.06 0.980301 4.00 0.999968 0.49 0.687933 1.01 0.843752 1.53 0.936992 2.08 0.981237 0.50 0.691462 1.02 0.846136 1.54 0.938220 2.10 0.982136 0.51 0.694974 1.03 0.848495 1.55 0.939429 2.12 0.982997

III. táblázat Standard normális eloszlású valószínűségi változó eloszlásfüggvényének táblázata

( ) ( )uu Φ−=−Φ 1

Page 233: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

233

αααα

DF 0.005 0.01 0.025 0.05 0.1 0.25 0.5 0.75 0.9 0.95 0.975 0.99 0.995 1 7.879 6.635 5.024 3.841 2.706 1.323 0.455 0.102 0.016 0.004 0.001 0.000 0.000

2 10.597 9.210 7.378 5.991 4.605 2.773 1.386 0.575 0.211 0.103 0.051 0.020 0.010

3 12.838 11.345 9.348 7.815 6.251 4.108 2.366 1.213 0.584 0.352 0.216 0.115 0.072

4 14.860 13.277 11.143 9.488 7.779 5.385 3.357 1.923 1.064 0.711 0.484 0.297 0.207

5 16.750 15.086 12.832 11.070 9.236 6.626 4.351 2.675 1.610 1.145 0.831 0.554 0.412

6 18.548 16.812 14.449 12.592 10.645 7.841 5.348 3.455 2.204 1.635 1.237 0.872 0.676

7 20.278 18.475 16.013 14.067 12.017 9.037 6.346 4.255 2.833 2.167 1.690 1.239 0.989

8 21.955 20.090 17.535 15.507 13.362 10.219 7.344 5.071 3.490 2.733 2.180 1.647 1.344

9 23.589 21.666 19.023 16.919 14.684 11.389 8.343 5.899 4.168 3.325 2.700 2.088 1.735

10 25.188 23.209 20.483 18.307 15.987 12.549 9.342 6.737 4.865 3.940 3.247 2.558 2.156

11 26.757 24.725 21.920 19.675 17.275 13.701 10.341 7.584 5.578 4.575 3.816 3.053 2.603

12 28.300 26.217 23.337 21.026 18.549 14.845 11.340 8.438 6.304 5.226 4.404 3.571 3.074

13 29.819 27.688 24.736 22.362 19.812 15.984 12.340 9.299 7.041 5.892 5.009 4.107 3.565

14 31.319 29.141 26.119 23.685 21.064 17.117 13.339 10.165 7.790 6.571 5.629 4.660 4.075

15 32.801 30.578 27.488 24.996 22.307 18.245 14.339 11.037 8.547 7.261 6.262 5.229 4.601

16 34.267 32.000 28.845 26.296 23.542 19.369 15.338 11.912 9.312 7.962 6.908 5.812 5.142

17 35.718 33.409 30.191 27.587 24.769 20.489 16.338 12.792 10.085 8.672 7.564 6.408 5.697

18 37.156 34.805 31.526 28.869 25.989 21.605 17.338 13.675 10.865 9.390 8.231 7.015 6.265

19 38.582 36.191 32.852 30.144 27.204 22.718 18.338 14.562 11.651 10.117 8.907 7.633 6.844

20 39.997 37.566 34.170 31.410 28.412 23.828 19.337 15.452 12.443 10.851 9.591 8.260 7.434

21 41.401 38.932 35.479 32.671 29.615 24.935 20.337 16.344 13.240 11.591 10.283 8.897 8.034

22 42.796 40.289 36.781 33.924 30.813 26.039 21.337 17.240 14.041 12.338 10.982 9.542 8.643

23 44.181 41.638 38.076 35.172 32.007 27.141 22.337 18.137 14.848 13.091 11.689 10.196 9.260

24 45.558 42.980 39.364 36.415 33.196 28.241 23.337 19.037 15.659 13.848 12.401 10.856 9.886

25 46.928 44.314 40.646 37.652 34.382 29.339 24.337 19.939 16.473 14.611 13.120 11.524 10.520

26 48.290 45.642 41.923 38.885 35.563 30.435 25.336 20.843 17.292 15.379 13.844 12.198 11.160

27 49.645 46.963 43.195 40.113 36.741 31.528 26.336 21.749 18.114 16.151 14.573 12.878 11.808

28 50.994 48.278 44.461 41.337 37.916 32.620 27.336 22.657 18.939 16.928 15.308 13.565 12.461

29 52.335 49.588 45.722 42.557 39.087 33.711 28.336 23.567 19.768 17.708 16.047 14.256 13.121

30 53.672 50.892 46.979 43.773 40.256 34.800 29.336 24.478 20.599 18.493 16.791 14.953 13.787

40 66.766 63.691 59.342 55.758 51.805 45.616 39.335 33.660 29.051 26.509 24.433 22.164 20.707

50 79.490 76.154 71.420 67.505 63.167 56.334 49.335 42.942 37.689 34.764 32.357 29.707 27.991

60 91.952 88.379 83.298 79.082 74.397 66.981 59.335 52.294 46.459 43.188 40.482 37.485 35.534

70 104.22 100.43 95.023 90.531 85.527 77.577 69.334 61.698 55.329 51.739 48.758 45.442 43.275

80 116.32 112.33 106.63 101.88 96.578 88.130 79.334 71.145 64.278 60.391 57.153 53.540 51.172

90 128.30 124.12 118.14 113.15 107.57 98.650 89.334 80.625 73.291 69.126 65.647 61.754 59.196

100 140.17 135.81 129.56 124.34 118.50 109.14 99.334 90.133 82.358 77.929 74.222 70.065 67.328

α χχχχ2-eloszlás

IV. táblázat

Page 234: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

234

tα DF t0.995 t0.99 t0.975 t0.95 t0.90 t0.80 t0.75 t0.70 t0.60

1 63.657 31.821 12.706 6.314 3.078 1.376 1.000 0.727 0.325 2 9.925 6.965 4.303 2.920 1.886 1.061 0.817 0.617 0.289 3 5.841 4.541 3.182 2.353 1.638 0.978 0.765 0.584 0.277 4 4.604 3.747 2.776 2.132 1.533 0.941 0.741 0.569 0.271 5 4.032 3.365 2.571 2.015 1.476 0.920 0.727 0.559 0.267 6 3.707 3.143 2.447 1.943 1.440 0.906 0.718 0.553 0.265 7 3.499 2.998 2.365 1.895 1.415 0.896 0.711 0.549 0.263 8 3.355 2.896 2.306 1.860 1.397 0.889 0.706 0.546 0.262 9 3.250 2.821 2.262 1.833 1.383 0.883 0.703 0.543 0.261 10 3.169 2.764 2.228 1.812 1.372 0.879 0.700 0.542 0.260 11 3.106 2.718 2.201 1.796 1.363 0.876 0.697 0.540 0.260 12 3.055 2.681 2.179 1.782 1.356 0.873 0.695 0.539 0.259 13 3.012 2.650 2.160 1.771 1.350 0.870 0.694 0.538 0.259 14 2.977 2.624 2.145 1.761 1.345 0.868 0.692 0.537 0.258 15 2.947 2.602 2.131 1.753 1.341 0.866 0.691 0.536 0.258 16 2.921 2.583 2.120 1.746 1.337 0.865 0.690 0.535 0.258 17 2.898 2.567 2.110 1.740 1.333 0.863 0.689 0.534 0.257 18 2.878 2.552 2.101 1.734 1.330 0.862 0.688 0.534 0.257 19 2.861 2.539 2.093 1.729 1.328 0.861 0.688 0.533 0.257 20 2.845 2.528 2.086 1.725 1.325 0.860 0.687 0.533 0.257 21 2.831 2.518 2.080 1.721 1.323 0.859 0.686 0.532 0.257 22 2.819 2.508 2.074 1.717 1.321 0.858 0.686 0.532 0.256 23 2.807 2.500 2.069 1.714 1.319 0.858 0.685 0.532 0.256 24 2.797 2.492 2.064 1.711 1.318 0.857 0.685 0.531 0.256 25 2.787 2.485 2.060 1.708 1.316 0.856 0.684 0.531 0.256 26 2.779 2.479 2.056 1.706 1.315 0.856 0.684 0.531 0.256 27 2.771 2.473 2.052 1.703 1.314 0.855 0.684 0.531 0.256 28 2.763 2.467 2.048 1.701 1.313 0.855 0.683 0.530 0.256 29 2.756 2.462 2.045 1.699 1.311 0.854 0.683 0.530 0.256 30 2.750 2.457 2.042 1.697 1.310 0.854 0.683 0.530 0.256 35 2.724 2.438 2.030 1.690 1.306 0.852 0.682 0.529 0.255 40 2.704 2.423 2.021 1.684 1.303 0.851 0.681 0.529 0.255 50 2.678 2.403 2.009 1.676 1.299 0.849 0.679 0.528 0.255 60 2.660 2.390 2.000 1.671 1.296 0.848 0.679 0.527 0.254 120 2.617 2.358 1.980 1.658 1.289 0.845 0.677 0.526 0.254 ∞ 2.576 2.326 1.960 1.645 1.282 0.842 0.674 0.524 0.253

V. táblázat Student- (t-) eloszlás

Page 235: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

235

DF1

DF2 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞∞∞∞

1 161 199 216 225 230 234 237 239 241 242 244 246 248 249 250 251 252 253 254

2 18.5 19.0 19.2 19.3 19.3 19.3 19.4 19.4 19.4 19.40 19.4 19.4 19.5 19.5 19.5 19.5 19.5 19.5 19.5

3 10.1 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 8.70 8.67 8.64 8.62 8.59 8.57 8.55 8.53

4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5.86 6.04 5.77 5.75 5.72 5.69 5.66 5.63

5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 4.62 4.95 4.53 4.50 4.46 4.43 4.40 4.37

6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 3.94 4.53 3.84 3.81 3.77 3.74 3.70 3.67

7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 3.51 4.12 3.41 3.38 3.34 3.30 3.27 3.23

8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 3.22 3.84 3.12 3.08 3.04 3.01 2.97 2.93

9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 3.01 3.86 2.90 2.86 2.83 2.79 2.75 2.71

10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 2.85 3.71 2.74 2.70 2.66 2.62 2.58 2.54

11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 2.72 3.59 2.61 2.57 2.53 2.49 2.45 2.40

12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 2.62 3.49 2.51 2.47 2.43 2.38 2.34 2.30

13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60 2.53 3.41 2.42 2.38 2.34 2.30 2.25 2.21

14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 2.46 3.34 2.35 2.31 2.27 2.22 2.18 2.13

15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 2.40 3.29 2.29 2.25 2.20 2.16 2.11 2.07

16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 2.35 3.24 2.24 2.19 2.15 2.11 2.06 2.01

17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 2.31 3.20 2.19 2.15 2.10 2.06 2.01 1.96

18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 2.27 3.16 2.15 2.11 2.06 2.02 1.97 1.92

19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 2.23 3.13 2.11 2.07 2.03 1.98 1.93 1.88

20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 2.20 3.10 2.08 2.04 1.99 1.95 1.90 1.84

21 4.32 3.47 3.07 2.84 2.68 2.57 2.49 2.42 2.37 2.32 2.25 2.18 3.07 2.05 2.01 1.96 1.92 1.87 1.81

22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 2.15 3.05 2.03 1.98 1.94 1.89 1.84 1.78

23 4.28 3.42 3.03 2.80 2.64 2.53 2.44 2.37 2.32 2.27 2.20 2.13 3.03 2.01 1.96 1.91 1.86 1.81 1.76

24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 2.11 3.01 1.98 1.94 1.89 1.84 1.79 1.73

25 4.24 3.39 2.99 2.76 2.60 2.49 2.40 2.34 2.28 2.24 2.16 2.09 2.99 1.96 1.92 1.87 1.82 1.77 1.71

26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 2.07 3.37 1.95 1.90 1.85 1.80 1.75 1.69

27 4.21 3.35 2.96 2.73 2.57 2.46 2.37 2.31 2.25 2.20 2.13 2.06 2.96 1.93 1.88 1.84 1.79 1.73 1.67

28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 2.04 3.34 1.91 1.87 1.82 1.77 1.71 1.65

29 4.18 3.33 2.93 2.70 2.55 2.43 2.35 2.28 2.22 2.18 2.10 2.03 2.93 1.90 1.85 1.81 1.75 1.70 1.64

30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 2.01 3.32 1.89 1.84 1.79 1.74 1.68 1.62

40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 1.92 2.84 1.79 1.74 1.69 1.64 1.58 1.51

60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 1.84 3.15 1.70 1.65 1.59 1.53 1.47 1.39

120 3.92 3.07 2.68 2.45 2.29 2.18 2.09 2.02 1.96 1.91 1.83 1.75 2.68 1.61 1.55 1.50 1.43 1.35 1.25

∞∞∞∞ 3.84 3.00 2.61 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.75 1.67 3.00 1.52 1.46 1.39 1.32 1.22 1.03

α=0.0

F

F-eloszlás (αααα = 0,05)

VI. táblázat

α=0,05

Page 236: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

236

DF1 DF2

1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞∞∞∞

1 4052 4999 5404 5624 5764 5859 5928 5981 6022 6056 6107 6157 6209 6234 6260 6286 6313 6340 6366

2 98.5 99.0 99.2 99.3 99.3 99.3 99.4 99.4 99.4 99.4 99.4 99.4 99.4 99.5 99.5 99.5 99.5 99.5 99.5

3 34.1 30.8 29.5 28.7 28.2 27.9 27.7 27.5 27.3 27.2 27.1 26.9 26.7 26.6 26.5 26.4 26.3 26.2 26.1

4 21.2 18.0 16.7 16.0 15.5 15.2 15.0 14.8 14.7 14.5 14.4 14.2 14.0 13.9 13.8 13.7 13.7 13.6 13.5

5 16.3 13.3 12.1 11.4 11.0 10.7 10.5 10.3 10.2 10.1 9.9 9.7 9.6 9.5 9.4 9.3 9.2 9.1 9.0

6 13.7 10.9 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 7.56 7.40 7.31 7.23 7.14 7.06 6.97 6.88

7 12.2 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 6.31 6.16 6.07 5.99 5.91 5.82 5.74 5.65

8 11.3 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 5.52 5.36 5.28 5.20 5.12 5.03 4.95 4.86

9 10.6 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 4.96 4.81 4.73 4.65 4.57 4.48 4.40 4.31

10 10.0 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 4.56 4.41 4.33 4.25 4.17 4.08 4.00 3.91

11 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 4.25 4.10 4.02 3.94 3.86 3.78 3.69 3.60

12 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 4.01 3.86 3.78 3.70 3.62 3.54 3.45 3.36

13 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 3.82 3.66 3.59 3.51 3.43 3.34 3.25 3.17

14 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.80 3.66 3.51 3.43 3.35 3.27 3.18 3.09 3.00

15 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 3.52 3.37 3.29 3.21 3.13 3.05 2.96 2.87

16 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 3.41 3.26 3.18 3.10 3.02 2.93 2.84 2.75

17 8.40 6.11 5.19 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 3.31 3.16 3.08 3.00 2.92 2.83 2.75 2.65

18 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 3.23 3.08 3.00 2.92 2.84 2.75 2.66 2.57

19 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 3.15 3.00 2.92 2.84 2.76 2.67 2.58 2.49

20 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 3.09 2.94 2.86 2.78 2.69 2.61 2.52 2.42

21 8.02 5.78 4.87 4.37 4.04 3.81 3.64 3.51 3.40 3.31 3.17 3.03 2.88 2.80 2.72 2.64 2.55 2.46 2.36

22 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 2.98 2.83 2.75 2.67 2.58 2.50 2.40 2.31

23 7.88 5.66 4.76 4.26 3.94 3.71 3.54 3.41 3.30 3.21 3.07 2.93 2.78 2.70 2.62 2.54 2.45 2.35 2.26

24 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 2.89 2.74 2.66 2.58 2.49 2.40 2.31 2.21

25 7.77 5.57 4.68 4.18 3.85 3.63 3.46 3.32 3.22 3.13 2.99 2.85 2.70 2.62 2.54 2.45 2.36 2.27 2.17

26 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 2.81 2.66 2.58 2.50 2.42 2.33 2.23 2.13

27 7.68 5.49 4.60 4.11 3.78 3.56 3.39 3.26 3.15 3.06 2.93 2.78 2.63 2.55 2.47 2.38 2.29 2.20 2.10

28 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 2.75 2.60 2.52 2.44 2.35 2.26 2.17 2.07

29 7.60 5.42 4.54 4.04 3.73 3.50 3.33 3.20 3.09 3.00 2.87 2.73 2.57 2.49 2.41 2.33 2.23 2.14 2.04

30 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 2.70 2.55 2.47 2.39 2.30 2.21 2.11 2.01

40 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 2.52 2.37 2.29 2.20 2.11 2.02 1.92 1.81

60 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 2.35 2.20 2.12 2.03 1.94 1.84 1.73 1.60

120 6.85 4.79 3.95 3.48 3.17 2.96 2.79 2.66 2.56 2.47 2.34 2.19 2.03 1.95 1.86 1.76 1.66 1.53 1.38

∞∞∞∞ 6.64 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.19 2.04 1.88 1.79 1.70 1.59 1.47 1.33 1.04

α=0.0

F

F-eloszlás (αααα = 0,01)

VII. táblázat

α=0,01

Page 237: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

VIII. táblázat: Cohran-próba ( α=5%) r

DF 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120

1 - 0,96 0,91 0,85 0,79 0,72 0,68 0,64 0,59 0,55 0,48 0,39 0,34 0,28 0,23 0,17 0,10 2 0,98 0,89 0,76 0,69 0,63 0,57 0,52 0,48 0,45 0,395 0,34 0,28 0,24 0,20 0,16 0,115 0,067 3 0,96 0,82 0,68 0,61 0,55 0,50 0,44 0,42 0,38 0,335 0,285 0,23 0,20 0,16 0,13 0,092 0,053 4 0,92 0,77 0,63 0,56 0,495 0,44 0,39 0,37 0,34 0,295 0,245 0,20 0,17 0,14 0,11 0,078 0,043 5 0,90 0,73 0,58 0,52 0,455 0,40 0,36 0,335 0,31 0,27 0,22 0,18 0,15 0,125 0,098 0,068 0,038 6 0,86 0,70 0,56 0,48 0,42 0,37 0,335 0,31 0,29 0,245 0,20 0,165 0,135 0,11 0,087 0,06 0,033 7 0,85 0,68 0,53 0,46 0,40 0,355 0,32 0,295 0,27 0,23 0,19 0,155 0,13 0,105 0,083 0,057 0,031 8 0,83 0,65 0,52 0,44 0,38 0,34 0,305 0,28 0,255 0,22 0,18 0,145 0,12 0,098 0,076 0,052 0,039 9 0,81 0,63 0,50 0,42 0,37 0,325 0,29 0,27 0,245 0,21 0,17 0,135 0,115 0,092 0,07 0,049 0,038 10 0,79 0,61 0,48 0,41 0,355 0,31 0,28 0,26 0,235 0,20 0,16 0,13 0,11 0,088 0,067 0,047 0,036 12 0,77 0,58 0,46 0,39 0,34 0,29 0,27 0,245 0,225 0,19 0,15 0,122 0,105 0,082 0,063 0,043 0,034 14 0,75 0,56 0,445 0,375 0,33 0,28 0,255 0,235 0,215 0,18 0,145 0,115 0,098 0,078 0,058 0,041 0,033 16 0,73 0,54 0,43 0,365 0,315 0,27 0,25 0,225 0,205 0,175 0,138 0,11 0,092 0,075 0,055 0,040 0,032 18 0,72 0,53 0,42 0,355 0,305 0,26 0,245 0,22 0,20 0,17 0,133 0,105 0,09 0,072 0,053 0,038 0,031 20 0,70 0,52 0,41 0,35 0,295 0,255 0,235 0,215 0,195 0,165 0,13 0,10 0,087 0,07 0,051 0,037 0,0305 25 0,68 0,51 0,395 0,34 0,29 0,245 0,23 0,205 0,185 0,155 0,122 0,098 0,083 0,067 0,050 0,036 0,03 30 0,67 0,49 0,38 0,33 0,28 0,235 0,215 0,20 0,175 0,145 0,118 0,092 0,08 0,063 0,048 0,034 0,03 40 0,65 0,47 0,365 0,31 0,265 0,22 0,205 0,185 0,16 0,135 0,11 0,085 0,074 0,058 0,045 0,032 0,029 50 0,63 0,44 0,35 0,295 0,25 0,21 0,195 0,175 0,15 0,125 0,105 0,08 0,07 0,055 0,043 0,03 0,028 60 0,61 0,43 0,34 0,285 0,24 0,205 0,185 0,165 0,145 0,12 0,098 0,075 0,065 0,052 0,04 0,028 0,027 90 0,58 0,41 0,32 0,265 0,225 0,19 0,17 0,15 0,13 0,11 0,09 0,07 0,058 0,047 0,037 0,026 0,025 120 0,56 0,39 0,30 0,25 0,215 0,175 0,16 0,14 0,125 0,10 0,085 0,065 0,055 0,044 0,035 0,024 0,024 240 0,53 0,37 0,28 0,225 0,19 0,16 0,14 0,13 0,11 0,09 0,075 0,055 0,048 0,038 0,03 0,02 0,022 ∞ 0,49 0,33 0,25 0,19 0,17 0,135 0,12 0,11 0,095 0,075 0,065 0,049 0,042 0,032 0,025 0,018 0,01

Page 238: Kvantijegyzet MSc 2013 v1 - ESTIEM Wiki...5 I. Valószín űségszámítási alapok 1 Axiómák, alaptételek Kombinatorika Geometriai val.sz. Val.szám. tételek Elméleti eloszlások

238

IX. táblázat: Cohran-próba (α=1%) r

DF 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120

1 - 0,96 0,94 0,93 0,88 0,83 0,78 0,74 0,69 0,65 0,56 0,46 0,42 0,355 0,29 0,205 0,125 2 1,00 0,92 0,85 0,80 0,72 0,67 0,62 0,58 0,54 0,48 0,41 0,34 0,295 0,255 0,20 0,145 0,089 3 0,98 0,87 0,78 0,70 0,63 0,57 0,53 0,48 0,45 0,41 0,34 0,28 0,235 0,205 0,158 0,115 0,07 4 0,97 0,84 0,71 0,63 0,56 0,51 0,46 0,425 0,395 0,355 0,295 0,24 0,205 0,17 0,135 0,095 0,057 5 0,95 0,80 0,67 0,58 0,51 0,46 0,425 0,39 0,36 0,32 0,265 0,21 0,18 0,152 0,12 0,085 0,05 6 0,93 0,77 0,64 0,55 0,48 0,43 0,39 0,36 0,33 0,29 0,24 0,19 0,16 0,138 0,11 0,075 0,043 7 0,91 0,75 0,62 0,52 0,45 0,41 0,37 0,34 0,31 0,275 0,225 0,175 0,15 0,13 0,10 0,07 0,04 8 0,90 0,72 0,59 0,49 0,43 0,385 0,35 0,32 0,295 0,255 0,21 0,165 0,14 0,12 0,093 0,064 0,036 9 0,88 0,69 0,57 0,47 0,42 0,37 0,335 0,305 0,28 0,245 0,195 0,155 0,135 0,112 0,087 0,059 0,033

10 0,87 0,68 0,55 0,46 0,40 0,36 0,32 0,29 0,27 0,23 0,19 0,15 0,13 0,108 0,083 0,056 0,031 12 0,85 0,65 0,53 0,44 0,38 0,34 0,305 0,27 0,25 0,22 0,175 0,138 0,12 0,098 0,076 0,051 0,028 14 0,83 0,63 0,50 0,42 0,36 0,315 0,29 0,255 0,235 0,205 0,165 0,13 0,112 0,092 0,07 0,047 0,026 16 0,81 0,61 0,48 0,41 0,35 0,305 0,27 0,245 0,225 0,195 0,155 0,123 0,108 0,087 0,066 0,045 0,024 18 0,80 0,59 0,47 0,39 0,34 0,3 0,265 0,235 0,22 0,19 0,15 0,12 0,103 0,085 0,064 0,043 0,023 20 0,78 0,58 0,46 0,38 0,33 0,29 0,255 0,225 0,21 0,18 0,145 0,115 0,098 0,082 0,06 0,041 0,022 25 0,76 0,56 0,44 0,37 0,31 0,27 0,245 0,215 0,20 0,17 0,135 0,11 0,094 0,077 0,058 0,039 0,02 30 0,75 0,53 0,42 0,35 0,30 0,255 0,23 0,2 0,185 0,16 0,13 0,105 0,088 0,072 0,053 0,037 0,019 40 0,71 0,51 0,40 0,33 0,275 0,235 0,21 0,19 0,17 0,15 0,12 0,095 0,08 0,066 0,05 0,034 0,018 50 0,69 0,48 0,38 0,315 0,26 0,22 0,20 0,175 0,16 0,14 0,112 0,09 0,075 0,06 0,047 0,032 0,017 60 0,68 0,47 0,36 0,305 0,25 0,21 0,19 0,165 0,15 0,13 0,107 0,085 0,07 0,057 0,045 0,03 0,016 90 0,65 0,44 0,34 0,28 0,23 0,19 0,17 0,15 0,138 0,12 0,095 0,076 0,062 0,05 0,04 0,027 0,015 120 0,62 0,42 0,315 0,26 0,215 0,18 0,16 0,14 0,13 0,11 0,087 0,07 0,057 0,047 0,036 0,025 0,014 240 0,57 0,38 0,28 0,235 0,19 0,155 0,14 0,125 0,115 0,038 0,076 0,06 0,05 0,04 0,03 0,022 0,012 ∞ 0,52 0,32 0,25 0,20 0,17 0,135 0,125 0,11 0,098 0,025 0,062 0,049 0,041 0,034 0,024 0,018 0,01