Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
1
Budapesti Műszaki és Gazdaságtudományi Egyetem
Gazdaság- és Társadalomtudományi Kar
Üzleti Tudományok Intézet
Menedzsment és Vállalatgazdaságtan Tanszék
Gazdaságstatisztika példatár
Megoldásokkal
E példatár a Gazdaságstatisztika című tárgyhoz a Gazdálkodási és
menedzsment (BA), Műszaki menedzser (BSc), Nemzetközi
gazdálkodás (BA), valamint az Alkalmazott közgazdaságtan (BA)
alapszakok részére készült.
Erdei János
Nagy Jenő Bence
Dr. Tóth Zsuzsanna Eszter
Budapest,
2013
2
Tartalomjegyzék
I. Leíró statisztika ....................................................................................................................... 3 II. Standardizálás ...................................................................................................................... 12 III. Indexszámítás ..................................................................................................................... 16 IV. Heterogén sokaság ............................................................................................................. 20 V. Valószínűségi változó. Elméleti eloszlások ........................................................................ 24
Binomiális eloszlás ............................................................................................................... 24 Poisson-eloszlás ................................................................................................................... 27
Exponenciális eloszlás .......................................................................................................... 30 Normális eloszlás ................................................................................................................. 32
VI. Becslés ............................................................................................................................... 38 VII. Hipotézisvizsgálatok ......................................................................................................... 45
Nemparaméteres próbák ....................................................................................................... 45
Paraméteres próbák .............................................................................................................. 50 Paraméteres és nemparaméteres feladatok ........................................................................... 60
VIII. Korreláció- és regresszióelemzés, idősorelemzés ........................................................... 64 Idősorok elemzése ................................................................................................................ 64
Kétváltozós lineáris korreláció- és regresszióelemzés ......................................................... 68 IX. Felhasznált irodalmak ........................................................................................................ 76
3
I. Leíró statisztika
1. A táblázat a Budapesti Értéktőzsde hivatalos indexének (BUX) száz napi záró értékéből
számított hozamadatait tartalmazza. Készítse el az alábbi adatbázis részletes leíró
statisztikai elemzését!
Napi hozamok
0,01896 0,00613 0,01091 -0,01742 0,01328 0,02415 0,00805 0,00754 0,0011 -0,00312
0,0846 0,00186 -0,00024 -0,02076 0,01011 0,00476 0,00611 -0,00015 0,03295 -0,00782
0,0529 0,0102 0,0081 -0,0567 0,02865 -0,01836 -0,01001 0,0146 0,01182 0,00729
-0,01877 0,00845 0,00448 0,00602 0,01818 0,00567 0,0018 0,01303 0,01192 0,00104
0,00121 0,01508 -0,00322 0,019 -0,01281 -0,00413 -0,00676 0,00611 0,02417 -0,00365
-0,01759 0,03565 0,02769 0,02964 -0,01967 0,00654 0,00272 -0,01123 0,0253 -0,01055
-0,01255 0,02841 0,04391 0,0581 -0,03858 0,00319 -0,00307 -0,00145 -0,00922 0,00016
0,01269 0,01359 -0,00271 -0,00041 0,02758 0,0008 0,00438 0,01244 0,0044 0,00709
0,00622 0,02758 -0,01226 0,0022 -0,00043 0,00483 0,01527 0,00432 0,02801 -0,00711
0,00248 0,03258 -0,01609 0,00087 0,02823 0,0143 0,01493 -0,00391 -0,01541 0,00524
Rangsor (oszloponként)
-0,0567 -0,01281 -0,00413 -0,00024 0,0022 0,00524 0,00754 0,01269 0,01896 0,02841
-0,03858 -0,01255 -0,00391 -0,00015 0,00248 0,00567 0,00805 0,01303 0,019 0,02865
-0,02076 -0,01226 -0,00365 0,00016 0,00272 0,00602 0,0081 0,01328 0,02415 0,02964
-0,01967 -0,01123 -0,00322 0,0008 0,00319 0,00611 0,00845 0,01359 0,02417 0,03258
-0,01877 -0,01055 -0,00312 0,00087 0,00432 0,00611 0,01011 0,0143 0,0253 0,03295
-0,01836 -0,01001 -0,00307 0,00104 0,00438 0,00613 0,0102 0,0146 0,02758 0,03565
-0,01759 -0,00922 -0,00271 0,0011 0,0044 0,00622 0,01091 0,01493 0,02758 0,04391
-0,01742 -0,00782 -0,00145 0,00121 0,00448 0,00654 0,01182 0,01508 0,02769 0,0529
-0,01609 -0,00711 -0,00043 0,0018 0,00476 0,00709 0,01192 0,01527 0,02801 0,0581
-0,01541 -0,00676 -0,00041 0,00186 0,00483 0,00729 0,01244 0,01818 0,02823 0,0846
Megoldás:
1. Osztályok számának meghatározása (egy lehetséges módszer)
Nk02 12827
0
minmax0
k
YYh
0202,002018,0
7
)05670,0(08460,00
h
4
2. Gyakorisági táblázat
oszályközhosszúság fi gi fi' gi'
-0,0567 -0,0365 2 2,00% 2 0,02
-0,0365 -0,0163 6 6,00% 8 0,08
-0,0163 0,0039 36 36,00% 44 0,44
0,0039 0,0241 38 38,00% 82 0,82
0,0241 0,0443 15 15,00% 97 0,97
0,0443 0,0645 2 2,00% 99 0,99
0,0645 0,0847 1 1,00% 100 1
100
3. Kvartilisek meghatározása
Az adatok egyenkénti ismeretéből kiindulva:
0031075,0)00312,0(00307,025,000312,0
25,2511004
1
1
4/1
Q
s
Tehát ennél az értéknél az adatok ¼ része kisebb, ¾ része pedig nagyobb.
014525,00143,00146,075,00143,0
75,7511004
3
3
4/3
Q
s
Ennél az értéknél az adatok ¾ része kisebb, ¼ része pedig nagyobb.
4. Medián
A medián nem más, mint a középső kvartilis:
005035,000483,000524,05,000483,0ˆ5,5011002
12/1 eMs
A medián a két középső érték átlaga:
005035,0)00524,000483,0(2
1Me
A medián becsülhető a gyakorisági táblázat alapján:
me
me
me
me hf
fN
YeM
'
1
0,2ˆ
2
' Nfme
00709,00202,038
44500039,0ˆ
eM
5. Módusz
A 4. osztály a modális osztály, mert ebben a legnagyobb a tapasztalati gyakoriság:
5
mo
fa
amo h
dd
dYoM
0,
ˆ 1 momoa ffd 1 momof ffd
005516,00202,0
15383638
36380039,0ˆ
oM
6. Számtani átlag
Az egyenként ismert adatokból számítva:
0066541,0100
66541,0
100
0846,0...)03858,0()0567,0(
x
A gyakorisági táblázatban szereplő információk alapján történő becslés:
007536,0100
7536,0
100
10746,020544,0...6)0264,0(2)0466,0(
x
Osztály Alsó határ
Felső határ osztályközép
gyakoriság (fi) osztályközép *fi di=osztályközép-Xátl.becsült di2 fidi2
1. -0,0567 -0,0365 -0,0466 2 -0,0932 -0,054136 0,0029307 0,005861
2. -0,0365 -0,0163 -0,0264 6 -0,1584 -0,033936 0,0011517 0,00691
3. -0,0163 0,0039 -0,0062 36 -0,2232 -0,013736 0,0001887 0,006792
4. 0,0039 0,0241 0,014 38 0,532 0,006464 0,0000418 0,001588
5. 0,0241 0,0443 0,0342 15 0,513 0,026664 0,0007110 0,010665
6. 0,0443 0,0645 0,0544 2 0,1088 0,046864 0,0021962 0,004392
7. 0,0645 0,0847 0,0746 1 0,0746 0,067064 0,0044976 0,004498
összesen 100 0,7536 0,040706
A táblázat utolsó három oszlopa a tapasztalati szórás becsléséhez szolgáltat majd információt!
7. Terjedelem
1413,0)0567,0(0846,0minmax YYR
8. Interkvartilis terjedelemmutató
0176325,0)0031075,0(014525,0135,0 QQR
9. Korrigált tapasztalati szórások
Adatok egyenkénti ismeretéből kiindulva:
0188,099
0,03531115
99
)0066541,0x(
99
d
99
)xx(
s
100
1j
2
j
100
1j
2
j
100
1j
2
j
Korrigált tapasztalati szórás becslése gyakorisági táblázat alapján:
0,020277
99
0,040706
111
7
1
2
1
1
2
r
i
i
i
ii
r
i
i
r
i
ii
f
df
f
xxf
s
6
11. Grafikus ábrázolás, hisztogram
Gyakorisági hisztogram
2
6
3638
15
21
0
5
10
15
20
25
30
35
40
1. 2. 3. 4. 5. 6. 7.
Osztály sorszáma
Tap
aszta
lati
gyako
riság
Kumulált relatív gyakorisági hisztogram
0,020,08
0,44
0,82
0,97 0,99 1
0
0,2
0,4
0,6
0,8
1
1,2
1. 2. 3. 4. 5. 6. 7.
Osztály sorszáma
Ku
mu
lált
rela
tív g
yako
riság
7
2. A 100 g-os Omnia kávé töltési folyamatának két különböző napon mért nettó
tömegértékei az alábbiak (a mérések a gyártási folyamatot követve, sorrendben
történtek, kb. 1/2 óra alatt, egy négymérleges Hesser gép 2.sz. mérlegének töltését
figyelve):
egyik nap:
101,8 100,7 101,0 101,2 100,1 100,4 100,5 100,2 103,3 100,1
101,1 102,2 101,2 101,2 101,3 101,1 100,9 101,3 101,2 102,1
101,3 101,7 100,6 100,6 101,5 102,8 101,8 101,4 101,8 102,3
100,6 101,4 99,7 101,3 101,4 101,2 100,2 102,1 101,9 101,0
101,4 101,8 100,9 102,4 100,8 100,6 101,3 101,4 102,1 101,4
másik nap:
100,4 99,3 100,5 100,2 100,7 100,4 99,6 100,3 99,4 101,2
100,2 100,3 99,6 100,2 100,1 98,6 101,3 99,1 99,5 100,3
98,5 100,2 100,4 99,8 100,4 99,7 100,0 101,2 100,8 98,7
99,7 99,8 98,1 101,6 100,5 99,9 100,2 101,4 100,3 99,6
99,0 100,7 99,2 100,5 102,2 100,1 100,8 100,2 100,3 99,8
Végezze el a statisztikai-szakmai elemzést! Számítsa ki az eloszlás statisztikai paramétereit!
Mekkora a valószínűsége a tűréshatárokon való kivülesésnek, ha az alsó tűréshatár 98g, a
felső tűréshatár pedig 102g?
Megoldás:
Lásd külön.
3. Egy üdítőitalokat forgalmazó cég budapesti részlegénél dolgozó 26 értékesítési képviselő
2005. január havi teljesítménye (kiszállított mennyiség, ezer rekesz):
15,6 26,8 13,5 8,8 13,3 20,2 13,7 15,7 24,7
8,5 19,1 16,6 19,2 18,7 16,1 20,5 14,2 13,2
15,9 13,1 18,8 33,6 34,7 16,9 14,8 21,8
Számítsuk ki az átlagos teljesítményt, határozzuk meg a mediánt! Számítsuk ki az ismert
szóródási mérőszámokat! Jellemezzük az eloszlás aszimmetriáját a Pearson-féle
mutatóval!
Megoldás:
Rangsor
8,5 8,8 13,1 13,2 13,3 13,5 13,7 14,2 14,8 15,6 15,7 15,9
16,1 16,6 16,9 18,7 18,8 19,1 19,2 20,2 20,5 21,8 24,7 26,8
33,6 34,7
8
A, Számítsuk ki az átlagos teljesítményt, határozzuk meg a mediánt!
Átlagos teljesítmény meghatározása számtani átlaggal:
ezerN
xxxx n 18
26
7,346,33...5,8...21
18 ezer rekesz az átlagos teljesítmény.
Medián:
16,1 16,616,35
2Me
16,35 ezer rekesznél többet teljesített az értékesítési képviselők fele, a másik fele
kevesebbet.
B, Számítsuk ki az ismert szóródási mérőszámokat!
Terjedelem
2,265,87,34minmax XXR
Szórás
2128,626
)187,34()186,33(...)185,8( 222
s
Korrigált tapasztalati szórás
335,625
)187,34()186,33(...)185,8( 222
s
Átlagosan 6,335 ezer rekesszel tér el az egyes képviselők teljesítménye az átlagostól.
Relatív szórás:
345157,018
2128,6V
Az egyes képviselők teljesítményének az átlagostól való átlagos eltérése 34,51%.
Interkvartilis terjedelemmutató:
625,665,13275,20
275,20)2,205,20(25,02,20
25,20)126(4
3
65,13)5,137,13(75,05,13
75,6)126(4
1
132/1
3
4/3
1
4/1
QQR
Q
s
Q
s
9
Az értékesítési képviselők negyedének a teljesítménye 13,65 ezer rekesznél alacsonyabb,
háromnegyedüké magasabb (Q1). Az értékesítési képviselők háromnegyedének
teljesítménye 20,275 ezer rekesznél alacsonyabb, egynegyedüké magasabb (Q3).
Az interkvartilis terjedelemmutató azt fejezi ki, hogy az értékesítési képviselők felének
teljesítménye 6,625 ezer rekesznyi sávban helyezkedik el.
C, Jellemezzük az eloszlás aszimmetriáját a Pearson-féle mutatószám segítségével!
79,021,6
)35,1618(3)(3
s
MexP
Erősebb (de még mérsékelt) baloldali aszimmetria.
D, Készítsünk gyakorisági sort, és becsüljük meg a móduszt!
02
kN , kb. 5 osztályt célszerű készíteni.
24,55
5,87,340
h
Legyen 5,4 (kerekítéssel) az osztályköz-hosszúság!
Osztályhatár Gyakoriság
8,5≤x<13,9 7
13,9≤x<19,3 12
19,3≤x<24,7 3
24,7≤x<30,1 2
30,1≤x<35,5 2
Összesen: 26
82,154,5)312()712(
7129,13ˆ
oM
Az értékesített mennyiségek a 15,82 ezer rekesz körül tömörülnek.
10
4. Minőségellenőrzés keretében vizsgálták egy adott típushoz tartozó elektromos habverők
élettartamát. A 120 megfigyelés eredménye:
Élettartam (év) Megfigyelések száma (db)
5,0≤x<5,5 8
5,5≤x<6,0 28
6,0≤x<6,5 50
6,5≤x<7,0 24
7,0≤x<7,5 10
Összesen 120
Ábrázoljuk a gyakorisági sort! Számítsuk ki a helyzeti középértékeket, az átlagot, a
szórást, az aszimmetria egyik mérőszámát!
Megoldás:
a) Ábrázoljuk a gyakorisági sort!
gyakorisági hisztogram
0
10
20
30
40
50
60
5,0-5,5 5,5-6,0 6,0-6,5 6,5-7,0 7,0-7,5
osztályok
meg
fig
yelé
sek s
zám
a
b) Számítsuk ki a helyzeti középértékeket, az átlagot, a szórást, az aszimmetria egyik
mérőszámát!
Élettartam (év) Megfigyelések száma (db)
(gyakoriságok)
Kumulált gyakoriság
5,0≤x<5,5 8 8
5,5≤x<6,0 28 36
6,0≤x<6,5 50 86
6,5≤x<7,0 24 110
7,0≤x<7,5 10 120
Összesen 120
11
2 2
60 366 *0,5 6,24
50
226 *0,5 6,23
22 26
8*5,25 ... 10*7,256,25
120
8(5,25 6,25) ... 10*(7,25 6,25)0,508
120
3*(6,25 6,24)0,059
0,508
Me
Mo
x
s
P
Enyhe bal oldali aszimmetria.
12
II. Standardizálás
1. Egy országban a monopolhelyzetben lévő vízellátó költségalapon határozza meg az árait
(ahol a vízellátás fajlagos költségei alacsonyabbak, ott az árak is alacsonyabbak). Két
jelentős különbség adódik, egyrészt a városokban fajlagosan olcsóbb az ellátás, hiszen
kisebb a szállítási költség, másrészt a nagyfogyasztók ellátása fajlagosan szintén
olcsóbb, mint a kisfogyasztóké.
A tarifák (Ft/köméter) és a fogyasztási arányok (a köbméter százalékában) 2002-ben:
A fogyasztás
jellege
Fogyasztás megoszlása (%) Tarifa (Ft/m3)
Város Község Város Község
Lakossági 30 60 700 900
Nem lakossági 70 40 500 600
Összesen 100 100
Elemezze a városok és községek közötti átlagos tarifadíj különbségét és az erre ható
tényezőket!
Megoldás:
Ami adott: viszonyítási alapok (B), és a részviszonyszámok (Vj).
Összetett viszonyszámok számítása:
Községre:
7806004,09006,01
11
1
j
jj
B
VBV Ft/m
3
Városra:
5605007,07003,00
00
0
j
jj
B
VBV Ft/m
3
22056078001 VVK Ft/m3, vagyis a községben átlagosan ennyivel magasabb a
tarifadíj. Nézzük meg, hogy ez a 220 Ft/m3 eltérés a község javára minek tudható be, vagyis
kiszámítjuk a részhatás és összetételhatás különbséget:
Részhatás különbség, amely a megfelelő részviszonyszámok eltérésére vezethető vissza:
160620780)5004,07006,0(780'1
01
1
11
1
B
VB
B
VBK Ft/m
3, vagyis a
220Ft/m3 átlagos tarifadíj különbségből 160 Ft/m
3 a részviszonyszámok (tarifa: Ft/m
3)
eltérésére vezethető vissza. Nézzük meg a táblázatunkat alaposabban: látjuk, hogy mind a
lakossági, mind pedig a nem lakossági fogyasztás esetében magasabb a községben a tarifa.
Összetételhatás-különbség:
60560620"0
00
1
01
0
B
VB
B
VBK Ft/m
3, vagyis a 220Ft/m
3 átlagos tarifadíj
különbségből 60Ft/m3 eltérést magyaráz a két sokaság (város és község) eltérő (fogyasztási)
13
szerkezete. Ez elsősorban annak tudható be, hogy a községben magasabb az egyébként is
drágább tarifájú lakossági fogyasztás aránya (30% a városban és 60% a községben), és
alacsonyabb az olcsóbb tarifájú nem lakossági fogyasztás aránya (40% mindössze a városok
70%-os ugyanilyen arányával).
2. Egy sportszergyártó cég két értékesítési helyére vonatkozóan ismert az egy eladóra jutó
forgalom az egyes években, és a forgalom megoszlása 2006-ban:
Osztály
A forgalom megoszlása 2006-ban,
%
(A1)
Egy eladóra jutó forgalom, ezer Ft
(vagyis ezer Ft/fő, másképpen
forgalom/fő)
2005 (V0) 2006 (V1)
Virág utcai üzlet 56,7 1382 1678
Napsugár utcai
üzlet
43,3 1151 1327
Együtt 1209
Elemezze az egy eladóra jutó forgalom változását, és az arra ható tényezőket!
Készítsen szöveges értékelést is!
Megoldás:
Az egy eladóra jutó forgalom (ezer Ft/fő) a viszonyszám, ahol a forgalom az A, a
viszonyítandó adat, az eladók száma pedig a B, a viszonyítási alap.
Ami ismert az az A1, valamint a V0 és a V1. Továbbá ismert a 0. időszakra vonatkozó
összetett viszonyszám is, ami pedig nem ismert, az 1. időszakra vonatkozó összetett
viszonyszám:
57,15050006642,0
1
1327
433,0
1678
567,0
1
1
1
1
1
1
1
j
j
j
j
j
V
A
A
B
AV , így megkaptuk a két üzletre
együttesen értelmezett összetett viszonyszámot 2006-ra. Ebből már könnyen számítható a két
összetett viszonyszám hányadosa:
245,11209
57,1505
0
1 V
VI , ez az érték azt jelenti, hogy 24,5%-kal nőtt az egy eladóra jutó
forgalom 2005-höz képest. Nézzük meg ennek okait közelebbről! A meglévő adatok alapján
kötött a helyzetünk, hogy melyik súlyozású részhatás és összetételhatás különbséget tudjuk
számolni. A képletgyűjtemény segítségével azonban kiokoskodható, hogy a tárgyidőszaki
súlyozású részhatás különbség számításához állnak rendelkezésre az adatok:
187,18425,0
1
1151/1327
433,0
1382/1678
567,0
1'
1
1
1
i
A
AI , ez azt jelenti, hogy ha csak a
megfelelő (két üzlet esetében rendelkezésre álló) részviszonyszámok (vagyis az egy eladóra
jutó forgalom) eltéréseit nézzük, akkor azt látjuk érdekes módon, hogy mindkét üzlet esetében
nőtt az egy eladóra jutó forgalom (1382 1678, és 1151 1327). Így a részviszonyszámok
eltéréseit nézve, az 18,7%-os növekedést indokolt volna összességében. Ám ennek ellenére
nagyobb növekedést könyvelhettünk el az összetett viszonyszámok hányadosának
értékelésekor.
14
Az összetételhatás különbség pedig a meglévő információk birtokában könnyen számítható:
049,1187,1
245,1
'"
1
0 I
II , vagyis a két sokaság (2005-ös és 2006-os sokaság) eltérő szerkezete
(vagyis az eladói létszám megoszlásának változása a két üzlet között) közel 5%-os növekedést
indokol az egy eladóra jutó forgalom változásában. Erről most több információnk nincsen,
hiszen a 2005-ös forgalom megoszlásokat az üzletek között nem látjuk és az alkalmazotti
létszámok arányait sem ismerjük.
3. Hasonlítsuk össze az alábbi két ágazatban foglalkoztatottak átlagkeresetét! Mutassuk ki
a két ágazatban foglalkoztatottak átlagkeresetének különbségét kialakító tényezők
hatását! Az alkalmazásban állók létszáma és havi bruttó keresete 1999. januártól
szeptemberig.
Állománycsoport Gépipar Vegyipar
Létszám %-os
megoszlása
Kereset (ezer
Ft)
Létszám %-os
megoszlása
Kereset (ezer
Ft)
Fizikai
foglalkozásúak 79,6 66,8 67,6 77,1
Szellemi
foglalkozásúak 20,4 136,3 32,4 164,6
Összesen 100,0 81,0 100,0 105,5
Megoldás:
A főátlagok különbsége (vegyipar – gépipar):
5,240,815,105 K ezer Ft
Az egyes állománycsoportok szerinti keresetkülönbség hatása (standard adatsor: vegyipar
létszámösszetétele)
2,163,895,105)63,136324,08,66676,0(5,105' K ezer Ft
Az állománycsoportok szerinti összetétel-különbség hatása (standard adatsor a gépipari
állománycsoportonkénti átlagkeresetek)
3,80,813,89" K ezer Ft
Összefüggés: 24,5=16,2+8,3 ezer Ft.
A vegyiparban az átlagkereset 24500 Ft-tal magasabb, mint a gépiparban. Ezt az eltérést két
azonos irányba ható tényező magyarázza. A fizikai foglalkozásúak 10 300Ft-tal, a szellemi
foglalkozásúak 28 300 Ft-tal, a foglalkoztatottak pedig átlagosan 16 200 Ft-tal keresnek
többet a vegyiparban a másik ágazathoz képest. A két ágazat létszámösszetételében is jelentős
eltérést mutatkozik. Ebből adódóan a vegyiparban 8300 Ft-tal magasabb az átlagkereset, mint
a gépiparban, ugyanis ebben az ágazatban nagyobb arányt képviselnek a magasabb keresetű
szellemi foglalkozásúak, mint a gépiparban.
15
4. Elemezzük az alábbi táblázatban megadott adatok alapján a fajlagos anyagfelhasználás
(100 Ft árbevételre jutó felhasználás) változását! Egy lifteket gyártó és javító cégnél az
anyagfelhasználás és az árbevétel alakulása (ezer Ft):
Tevékenység Anyagfelhasználás Árbevétel
1991. 1999. 1991. 1999.
Termelés 185670 709080 288750 1089200
Javítás 24410 93200 61650 228400
Karbantartás 1820 8720 72700 334400
Összesen 211900 811000 423100 1652000
Megoldás:
Számítás:
Anyaghányad (V)= Anyagfelhasználás (A) / árbevétel (B)
100 Ft árbevételre jutó anyagfelhasználás
1991. 1999. százalék
Termelés 64,3 65,1 101,2
Javítás 39,59 40,81 103,1
Karbantartás 2,5 2,61 104,4
Összesen: 50,08 49,09
%9808,50
09,49I
%5,10116,799139
811000
025,03344003959,0228400643,01089200
811000'
01
1
01
11
jj
j
jj
jj
VB
A
VB
VBI
%6,965008,0:1652000
16,799139:"
0
00
1
01
j
jj
j
jj
B
VB
B
VBI
Összefüggés: 0,98=1,015·0,966
A vállalatnál a 100Ft árbevételre jutó anyagfelhasználás 1999-ben 1991-hez képest
összességében 2%-kal csökkent. Az egyes tevékenységekre számított anyaghányadok rendre
nőttek, átlagosan 1,5%-os az emelkedés. A struktúraváltozásnak viszont ellentétes hatása volt,
ugyanis a kisebb anyagigényű tevékenység, a karbantartás aránya nőtt az árbevételen belül,
ennek hatására a vállalatra számított anyaghányad 3,4%-kal csökkent.
16
III. Indexszámítás
1. Egy sütöde háromféle terméket termel. Ezekre vonatkozóan az alábbi adatok állnak
rendelkezésre:
Termék A termelés értéke
1996-ban (ezer Ft)
Az árak A forgalom
értékének
alakulása 1996/1995 (%)
Házi kenyér 600 129 110
Rozskenyér 800 118 124
Péksütemény 100 124 115
Együtt 1500
Számítson érték-, ár- és volumenindexet a sütöde termelésére vonatkozóan! Állapítsa meg,
hogy a termelés értékének növekedéséből hány Ft volt az árváltozás és a volumenváltozás
hatása!
Megoldás:
Termék
A termelés
értéke 1996-
ban (ezer Ft)
Az árak (ip)
A forgalom
értékének
(iv)
A termelt
mennyiség (iq)
alakulása 1996/1995 (%)
Házi kenyér 600 129 110 0,853
Rozskenyér 800 118 124 1,051
Péksütemény 100 124 115 0,927
Együtt 1500
174,1572,1277
1500
15,1
100
24,1
800
1,1
600
100800600
11
11
00
11
0
1
v
V
i
pq
pq
pq
pq
v
vI
Vagyis a termelés értéke 17,4%-kal nőtt 1995-höz képest a termékek összességére
vonatkozóan.
226,172,1223
1500
24,1
100
18,1
800
29,1
600
100800600
11
11
01
111
p
p
i
pq
pq
pq
pqI
Ha az árak változását vizsgáljuk csak (és a termelt mennyiségét nem), akkor azt látjuk, hogy
ez önmagában átlagosan 22,6%-os növekedést indokol a termékek összességére vonatkozóan.
9576,0226,1
174,11
0 p
vq
I
II
Ez azt jelenti, hogy ha csak a termelt mennyiség változását vizsgáljuk, és az árak változását
nem vizsgáljuk, akkor az 4,24%-os csökkenést indokolna a termelés értékének változásában.
A két hatás együttes eredménye az értékindexben megtestesülő változás.
17
Különbségfelbontás (amit eddig elosztottunk egymással az indexekben, azokat most kivonjuk
egymásból, vagyis a számlálóból a nevezőt):
852,5328,276428,222
28,27672,12231500
428,222572,12771500
10
0111
1
0011
pvq
p
v
KKK
pqpqK
pqpqK
Az első érték a termelési érték változását mutatja pénzösszegben, a második az árváltozás hatását pénzértékben kifejezve, a harmadik pedig a volumenváltozás hatását szintén
pénzösszegben kifejezve.
2. Egy ruházati kereskedelmi vállalat 2005 évi forgalmára vonatkozó adatok:
Cikkcsoport
A forgalom
értéke 2005-
ben (MFt)
Árváltozás Mennyiség
változása
2004-hez viszonyítva (%)
Férfiöltöny 420 +100 -5
Férfikabát 300 +10 +5
Férfiing 270 +20 -20
Együtt 990
Határozza meg a 2004. évi árbevételt!
Számítsa ki, hogy hány százalékkal emelkedtek a vállalatnál az árak!
Átlagosan hány százalékkal változott az értékesítés mennyisége?
Megoldás:
Nézzük meg, hogy milyen információkat hordoz a feladat! Látható, hogy a feladatban
közvetett módon adottak az egyedi ár- és volumenindexek, és a kettőből számíthatók az
egyedi értékindexek:
Cikkcsoport
A forgalom
értéke 2005-
ben (MFt)
Árindex Volumenindex Értékindex
2004-hez viszonyítva
Férfiöltöny 420 2,0 0,95 1,9
Férfikabát 300 1,1 1,05 1,155
Férfiing 270 1,2 0,8 0,96
Együtt 990
Ezeket az adatokat felhasználva kiszámítjuk a forgalom értékét (árbevételt) 2004-ben:
04,76225,28174,25905,22196,0
270
155,1
300
9,1
4201100
vi
pqpq
A meglévő adatainkból számítható a tárgyidőszaki súlyozású árindex, és a bázisidőszaki
súlyozású volumenindex:
18
%9393,0332,1065
990
398,104,762
990
398,172,707
990
22572,272210
990
2,1
270
1,1
300
2
420
990
1
0
11
111
p
vq
p
p
I
II
i
pq
pqI
Az árak a termékek összességére vonatkozóan 39,8%-kal emelkedtek. A mennyiség a
termékek összességére vonatkozóan pedig 7%-kal csökkent.
3. Anglia és Magyarország élelmiszerfogyasztását jellemző néhány adat 2004-ből:
Termék Kiskereskedelmi eladási ár Egy lakosra jutó fogyasztás
Anglia (₤) Magyarország (Ft) Anglia Magyarország
Tojás (db) 0,2 19,3 240 340
Cukor (kg) 2,5 189,6 34,7 34,5
Burgonya (kg) 1,89 178,4 60,5 58,7
Az élelmiszerek ezen csoportján hasonlítsa össze az angol és a magyar egy főre jutó
fogyasztás mennyiségét és a valuták vásárlóerejét!
Megoldás:
Az élelmiszerek e csoportján hasonlítsa össze az angol és a magyar egy főre jutó fogyasztás
mennyiségét és a valuták vásárlóerejét!
1,06790646,11,0712)/(
0646,1095,249
193,265
943,1105,8648
943,11025,8668
89,15,605,27,342,0240
89,17,585,25,342,0340)/(
1,071222004,32
23575,28
2,1079312,65794632
08,104726541,25626
4,1785,606,1897,343,19240
4,1787,586,1895,343,19340)/(
AMI
AMI
AMI
F
q
A
q
M
q
A termékek ezen körét vizsgálva az egy főre jutó magyar fogyasztás 106,79%-a az angol egy
főre jutó fogyasztásnak, vagyis az egy főre jutó fogyasztás Magyarországon 6,79%-kal
magasabb az angolnál.
622,883478,888975,88)/(
3478,88095,249
22007
89,15,605,27,342,0240
4,1785,606,1897,343,19240)/(
88,8975193,265
23575
89,17,585,25,342,0340
4,1787,586,1895,343,19340)/(
AMI
AMI
AMI
F
p
A
p
M
p
A termékek ezen körén egy font vásárlóereje átlagosan 88,622 Ft vásárlóerejével egyenértékű.
19
4. Egy vállalat három termékére vonatkozó adatok:
Termék Termelési érték a tárgyévben, ezer Ft Volumenváltozás
folyó áron (q1p1) bázisévi áron (q1p0) bázisév=100% (iq)
A 500 600 110
B 600 500 115
C 900 800 100
Összesen 2000 1900
Határozza meg a termelés értékindexét! Számítsa ki mindkét súlyozású ár- és
volumenindexeket!
Megoldás:
Termék
Termelési érték a
tárgyévben, ezer Ft
Árváltozás Volumenváltozás egyedi
értékindex
folyó áron
(q1p1)
bázisévi
áron (q1p0)
bázisév=100%
(01
11p
pq
pqi
)
bázisév=100% (iq) iv
A 500 600 0,833 110 0,9163
B 600 500 1,2 115 1,38
C 900 800 1,125 100 1,125
Összesen 2000 1900
1,0535066,1
123,1
066,11876,285
2000
900521,7391454,5455
2000
90015,1
600
1,1
500
2000
123,1455,1780
2000
125,1
900
38,1
600
9163,0
500
2000I
1,0526321900
2000I
1,0672741780,237
1900
80078,43445,545
1900
1
800
15,1
500
1,1
600
1900
1
0
11
11
10
111
11
11
00
11
V
01
111
p
01
01
00
010
q
vp
q
q
v
q
q
I
II
i
pq
pq
pq
pqI
i
pq
pq
pq
pq
pq
pq
i
pq
pq
pq
pqI
A termelés értékindexe: 1,123, amely azt jelenti, hogy a termékek összességére vonatkozóan a
termelés értéke 12,3%-kal nőtt.
Az árindexeket megvizsgálva azt látjuk, hogy a termékek összességére vonatkozóan az árak
kb. 5 %-kal emelkedtek a bázisévhez képest.
A volumenindexek szerint pedig a termelt mennyiség változása a termékek összességére
vonatkozóan kb. 6 %-kal emelkedett.
20
IV. Heterogén sokaság
1. Egy pénzintézet vállalati pénzügyi területre keres megfelelő szakembereket. A
jelentkezés feltétele a felsőfokú végzettség volt. Az állás meghirdetése után, a kiválasztás
és az első körös megbeszélés alapján 32 jelentkező vehetett részt a második körben,
vagyis a pszichológiai, szakmai és pályaalkalmassági kérdéseket tartalmazó tesztíráson.
A maximálisan 100 pontos teszten elért eredmények nemek szerint csoportosítva:
Pályázó neme A teszten elért pontszám
Férfi 85,66,50,78,51,72,76,64,65,95,42,58,92,81,69,89,74,72,59
Nő 84,58, 80,82,80, 97,59,91,76,80,96,85,77
Jellemezze a tesztet írók homogenitását, állapítsa meg, hogy milyen szoros a kapcsolat a
pályázó neme és a teszt eredménye között!
Megoldás
A pontszám szerinti szóródást két részre kell bontani, a „Pályázó neme” ismérvhez
kapcsolódó külső szórásra és a más tényezőkhöz kapcsolható belső szóródásra az
SST=SSK+SSB összefüggés alapján.
2
1 1
2
11
2
1
)()()(
M
j
N
i
jij
M
j
jj
M
j
N
i
ij
jj
YYYYNYY
Az ehhez szükséges számítások:
A pályázó
neme
Pályázók
száma
A teszten
elért átlagos
pontszám
Szórás
(részsokaságok
tapasztalati szórása)
Férfi 19 70,42 14,19
Nő 13 80,38 11,30
Összesen 32 74,47 13,98
Látható, hogy aránylag nagy a különbség a férfiak és a nők átlagpontszámai között.
Önmagában ez azonban nem jelent erős kapcsolatot, és az is látszik, hogy nagy a nem
ismérven belüli szóródás.
Bontsuk fel a teljes eltérés-négyzetösszeget a példa elején felírt módon.
SST=SSK+SSB
Ahol SSK=22 )47,7438,80(13)47,7442,70(19 = 766,26
SSB pedig a csoportonkénti eltérés-négyzetösszegek összege, ami a szórásokból
„visszaszámolható”:
SSB= 22 30,111319,1419 = 3824,63 + 1659,08 = 5483,7
SST = SSK +SSB= 766,26 + 5483,7 = 6249,96
21
A szórásnégyzet felbontása:
366,171948,23314,195
09,1389,498,13
///
222
222
222
NSSTNSSBNSSK TBK
BK
A kapcsolat szorosságának jellemzése:
35,01226,0
1226,0314,195
948,23
26,6249
26,7662
H
H
Azaz a pályázó neme 12,26%-ban magyarázza a pontszámok szórásnégyzetét. A pályázó
nemének ismerete 12,26%-kal csökkenti a teszt eredményével kapcsolatos bizonytalanságot.
A két ismérv között a közepesnél gyengébb kapcsolat van.
2. Valamely lakástakarék szövetkezet ügyfelei szerződésben vállalják, hogy négy éven
keresztül egy meghatározott összeget takarítanak meg. A megtakarítási időszak végén
jogosult az ügyfél az összegyűlt megtakarítás, a kamat és az évenként kapott állami
támogatás összegének megfelelő kedvezményes hitelre. A megtakarítási szakaszban a
késedelemnek nincs közvetlen konzekvenciája, viszont a hitelfelvétel ideje kitolódik. A
szövetkezet egy évvel ezelőtt kötött szerződései közül a hátralékban lévő ügyfelek néhány
adata:
Ügyfél lakhelye Szerződések
megoszlása
Késedelem ideje (hónap)
Átlag Szórás
Város 20 7,0 3,5
Kisváros 16 7,5 3,2
Község 64 5,3 4,5
Összesen 100
Számítsa ki az átlagos késedelmi időt, és a késedelmi idő szórását!
Mennyiben magyarázza a késedelmi idő ingadozását az ügyfél lakhelye?
Részátlagok és a részszórások adottak, a feladatunk a főátlag és a teljes szórás számítása, azon
belül is a belső szórás és a külső szórás számítása.
Főátlag:
992,5392,32,14,13,564,05,716,00,72,0 Y , vagyis az ügyfelek átlagosan
5,992 hónap késésben vannak.
128971,4
0484,1796,126384,145,25,464,02,316,05,32,0 2221
2
2
B
m
j
jj
BN
N
22
0,934631
873536,0478864,064,0274064,216,0016064,12,0
)992,53,5(64,0)992,55,7(16,0)992,50,7(2,0
)(222
2
12
K
j
M
j
j
KN
YYN
4,87%0,04874192194,17
873536,0
92194,17873536,00484,17
2
2
H
T
3. A következő táblázat egy társasház háztartásainak megoszlását tartalmazza a 15 évesnél
idősebb háztartástagok gazdasági aktivitása és a 2006. évi első félévi villamosenergia-
fogyasztás szerint:
A háztartás
tagjainak gazdasági
aktivitása
Háztartások
száma
Átlagos
villamosenergia-fogyasztás
(kWh)
Aktív 37 1108
Inaktív 13 919
Vegyes 18 1115
Összesen 68
Ismeretes, hogy az egyes háztartások által felhasznált energia mennyisége átlagosan 221
kWh-val különbözik a társasházra jellemző átlagtól. Állapítsa meg, hogy a háztartások
jellege befolyásolja-e a villamosenergia-fogyasztást!
Megoldás:
A feladatunk a H2
és H mutatók kiszámítása és értelmezése. Induljunk ki abból, hogy milyen
adatok állnak a rendelkezésünkre.
A feladatban adottak az egyes részsokaságokhoz tartozó részátlagok. Ezek segítségével
számítható a főátlag:
7,107368
73013
68
11151891913110837
x
A feladatban továbbá adott az egyes háztartások által felhasznált energiamennyiségnek a
társasházi átlagtól (főátlagtól) vett átlagos eltérése, ez a teljes szórás: 4884122122
A főátlag és a részátlagok ismeretében számítható a külső szórás:
9,5666
27,759,5666
68
)7,10731115(18)7,1073919(13)7,10731108(37)YY(N
N
1
2
K
2222
M
1j
jjK
A két szórásnégyzet ismeretében már könnyű kiszámítani a két keresett mutatót:
A varianciahányados: 116,048841
9,56662 H , vagyis a villamosenergia-fogyasztást 11,6%-ban
magyarázza a háztartás jellege (aktív, inaktív, vegyes).
23
Szóráshányados mutató: 34,0116,02 HH , amely a kapcsolat szorosságának a
megítélésére szolgál a két ismérv, vagyis a villamosenergia-fogyasztás (mennyiségi ismérv)
és a háztartás jellege (minőségi ismérv) között, tehát a vegyes kapcsolat szorosságát jelző
mutató. Értéke közelebb van most a 0-hoz, mint az 1-hez, így közepesen gyenge kapcsolat
jellemzi a fenti két ismérvet.
4. Egy budapesti vállalatnál a foglalkoztatottak körében felmérték a közlekedésre fordított
napi időt. Az eredményeket az alábbi táblázat tartalmazza:
Állandó lakóhely Foglalkoztatottak
megoszlása (%)
A közlekedésre fordított
idő napi átlaga (perc)
Budapest 60 60
Vidék 40 80
Összesen 100
A vállalat egészénél az egyes dolgozók közlekedésre fordított ideje átlagosan 40%-kal tér el
az átlagtól. Számítsa ki és értelmezze a H2 és a H mutatót!
Megoldás:
A feladat megoldása az előzőhöz hasonlóan történik.
Ebben a feladatban is adottak az egyes részsokaságokhoz tartozó részátlagok: 60 és 80 perc.
Ki kell számítanunk a főátlagot: 681
804,0606,0
x
Így ki tudjuk számítani a külső szórást ismét:
96
79,996)6880(4,0)6860(6,0)()(1
2
222
1
2
1
K
M
j
j
jM
j
jjK YYN
NYYN
N
A teljes szórás pedig a pluszmondatban „rejtőzik”: azért teljes szórás ismét, mert az egyes
dolgozók közlekedésre fordított ideje (ezeket egyenként nem ismerjük) és a főátlag közötti
eltérésekre épít. A teljes szórás relatív szórás formában adott: 2,2768
4,0
xV
84,7392,27 22
13,084,739
962 H , vagyis 13%-ban magyarázza az állandó lakóhely a közlekedésre fordított
idő mennyiségét.
36,013,0 H , közepesen gyenge kapcsolat van az állandó lakhely és a közlekedésre
fordított idő között.
24
V. Valószínűségi változó. Elméleti eloszlások
Binomiális eloszlás
1. Valaki találomra kitölt egy totószelvényt. Mennyi a valószínűsége annak, hogy az első
hét mérkőzéshez az 1, 2, x lehetőségek közül legalább 5 helyre egyest választ?
Megoldás:
Legyen A az az esemény, hogy a szelvényt kitöltő egy mérkőzéshez 1-est ír.
3/23/111)(
3/1)(
pqAP
így
pAP
A ξ valószínűségi változó jelentse az n=7 db mérkőzéshez beírt egyesek számát.
)7,...,1,0(3
2
3
1)(
7
7
k
k
nqp
k
nkPp
kk
kk
k
Az az esemény, hogy az első hét mérkőzéshez legalább öt helyre 1-es kerül három, egymást
kizáró esemény összegeként fogható fel: vagy öt, vagy hat, vagy hét helyre ír egyest a fogadó.
Ezek a valószínűségek a binomiális eloszlás táblázatának segítségével (n=7; p=0,3 és 0,35
értékeit átlagolva (vagy egyszerűen a 0,35-höz tartozó értéket alapul véve); k=5,6,7) a
következők:
0422,00004,0006,00358,0765 ppp
Tehát kb. 4,22% a valószínűsége annak, hogy legalább öt helyre 1-es kerül.
2. Mennyi a valószínűsége annak, hogy ha egy családban 10 gyerek születik, akkor
közülük éppen öt fiú lesz?
Megoldás:
Annak az eseménynek a valószínűsége, hogy fiú születik legyen az A esemény.
2/1)( pAp
A leány születésének valószínűsége:
2/11)( qpAp
A ξ valószínűségi változó jelentse az n=10 gyermek közül a fiúk számát. Annak az
eseménynek a valószínűsége, hogy a ξ=5:
%61,242461,05 p (binomiális eloszlás táblázata: n=10, p=0,5, k=5)
25
3. Egy üzemben elektromos biztosítékokat gyártanak. A tapasztalat szerint átlagban ezek
15%-a hibás. Számítsuk ki annak a valószínűségét, hogy 10 darab véletlenszerűen
kiválasztott biztosíték között
a) nincs selejtes,
b) legalább egy selejtes van,
c) nincs 1-nél több selejtes!
Megoldás:
p=0,15
Annak a valószínűsége, hogy 10 kiválasztott darab között nem lesz selejtes: 0,1969
(táblázatban: p=0,15; n=10; k=0)
Annak a valószínűsége, hogy 10 kiválasztott darab között legalább egy selejtes van (vagyis 1
vagy annál több): ezt úgy is értelmezhetjük, mint azt a valószínűséget, amely a 10 darab
közötti 0 selejt ellentett eseménye: 1-0,1969=0,8031
Annak a valószínűsége, hogy nincs 1-nél több selejtes, vagyis 0 vagy 1 selejtes van a 10
között: 0,1969+0,3474=0,5443 (táblázat alapján p=0,15; n=10; k=0,1)
4. Fej vagy írás játékkal kapcsolatos két eseményt tekintünk. Az egyik esemény: négy
dobásból 3 fej, a másik: nyolc dobásból 5 fej. Állapítsuk meg, hogy melyik esemény
valószínűsége nagyobb szabályos pénzdarab használata esetén!
Megoldás:
Legyen A az az esemény, hogy négy dobásból 3 a fej, és B pedig, hogy nyolc dobásból 5 a fej.
Egy dobás esetén a fej dobásának valószínűsége: p=1/2
P(A)=0,25 (táblázatból: p=0,5; n=4; k=3)
P(B)=0,2188
Tehát nagyobb az esélye annak, hogy négy dobásból háromszor dobunk fejet, mint annak,
hogy nyolc dobásból ötször.
5. Egy biztosító társaság egyetemistáknak kínál gépkocsi biztosításokat, s a korábbi évek
tapasztalatai szerint a biztosítottak 3%-a okozott balesetet. Feltételezve, hogy nem
változtak meg a körülmények, mekkora a valószínűsége, hogy az adott biztosítónál
szerződött 300 egyetemista közül legfeljebb 5 okoz balesetet ebben az évben?
Megoldás:
A feladat binomiális eloszlás közelítése Poisson-eloszlással, mivel p elég kicsi, és n elég
nagy.
p=0,03
n=300
Így a Poisson-eloszlás paramétere: 903,0300 pn
Most már csak a Poisson táblázatból kell a megfelelő értékeket kikeresni: a legfeljebb 5
egyetemista okoz baleset, az azt jelenti, hogy vagy 0, vagy 1, vagy 2, vagy 3, vagy 4 vagy 5:
p0+p1+p2+p3+p4+p5=0+0,001+0,005+0,015+0,033+0,060=0,114, vagyis 11,4% a
valószínűsége annak, hogy a szerződött 300 egyetemista közül legfeljebb 5 okoz balesetet.
26
6. Tegyük fel, hogy korábbi évek tapasztalatai alapján egy ügynök általában minden 5.
érdeklődőnek tud eladni egy adott terméket. Egy átlagos héten 20 érdeklődővel beszél.
Mennyi a heti eladás várható értéke? Mekkora a heti eladás szórása? Az ügynök külön
prémiumot kap, ha egy héten 8-nál több terméket ad el. Mekkora ennek a
valószínűsége?
Megoldás:
p=0,2
788,18,02,020)1()(
42,020)(
ppnD
pnM
A harmadik kérdés megválaszolásához a binomiális táblázatra van szükségünk:
n=20, p=0,2; a k>8 valószínűségeket kell összeadnunk:
p9+p10+p11+p12=0,0074+0,0020+0,0005+0,0001=0,01 (mivel az összes többi valószínűség a
táblázatban 0).
Megjegyzés: A példa megoldása arra a feltételezésre épít, hogy az ügynök hetenként pontosan
20 érdeklődővel beszél. Amennyiben a 20 érdeklődőt nem tekintenénk konstansnak, akkor
már a feladatot Poisson eloszlással oldhatjuk meg.
7. Az UEFA szigorú előírásai alapján állít elő a Minőségi Bőr Kft. labdarugó labdákat 500
darabos tételekben. Az átadás-átvételi eljárás során két előírás szerint járhatunk el:
a) két 10 darabos mintában egyetlen hibás darab sem lehet,
b) három 20 darabos mintában mintánként legfeljebb 1 darab selejtes lehet.
Melyik eljárást választaná az UEFA és melyiket a Minőségi Bőr Kft. helyében, ha a
selejtarány várhatóan 5 %?
Megoldás:
a) 5987,0)0( 0 pP 0,59872=0,3584 UEFA
b) 3585,0)0( 0 pP , 3774,0)1( 1 pP p0+p1=0,7359 0,73593=0,4 Kft.
8. Egy hagyományos repülőgépet négy egymástól független motor hajt. Hosszútávú
vizsgálatok azt mutatják, hogy egy motor repülés közbeni meghibásodásának
valószínűsége 5%. A repülőgép még be tudja fejezni az utat, ha 3 motor működik.
Mekkora a valószínűsége egy adott repülőúton, hogy
a) nem történik motor hiba?
b) legfeljebb 1 motor hiba történik?
c) motorhiba miatt lezuhan a gép?
Megoldás:
a) n=4, k=0, p=0,05 p0=0,8145
b) vagy 0 vagy 1 motorhiba történik: p0+p1=0,8145+0,1715=0,986
c) ez azt jelenti, hogy legalább 2 meghibásodás történik, vagyis vagy 2 vagy 3 vagy 4
meghibásodás áll elő: p2+p3+p4=0,0135+0,0005+0=0,014
27
Poisson-eloszlás
1. Kalácssütéskor 1 kg tésztába 30 szem mazsolát tesznek. Mennyi a valószínűsége, hogy
egy 5 dkg-os szeletben kettőnél több mazsolaszem lesz? (Feltételezzük, hogy a mazsolák
száma Poisson-eloszlást követ.)
Megoldás:
Egy 5 dkg-os tésztába átlagosan 30/20, azaz 1,5 mazsolaszem (=λ) jut. Annak a
valószínűségét, hogy a mazsolaszemek száma 2-nél nagyobb úgy fogjuk kiszámítani, hogy
kikeressük a Poisson-eloszlás táblázatából, hogy mennyi a valószínűsége annak, hogy (k=) 0,
1 és 2 mazsola van benne, majd e valószínűségek összegét kivonjuk egyből: P=1-
(0,223+0,334+0,251)=0,192
Tehát 19,2% a valószínűsége annak, hogy az 5 dkg-os szeletben kettőnél több mazsola van.
2. Egy nyomdai korrektúrában 400 oldalon átlagosan 400 sajtóhiba van. A tapasztalat
szerint egy anyagrészben lévő hibák számának eloszlása csak az anyagrész hosszától
függ. Mennyi a valószínűsége annak, hogy egy találomra kiemelt oldalon legalább
három sajtóhiba van?
Megoldás:
A ξ valószínűségi változó az egy oldalon lévő sajtóhibák számát veszi fel. A ξ valószínűségi
változó Poisson-eloszlású, paramétere az egy oldalra eső hibák várható értéke: 1400
400
Annak az eseménynek a valószínűségét, hogy egy oldalon legalább három sajtóhiba van, az
ellentett események valószínűségei közötti összefüggéssel számítjuk ki. Háromnál kevesebb
sajtóhiba egy kiszemelt oldalon úgy következhet be, hogy a ξ valószínűségi változó 0, 1 és 2
értéket veszi fel. Ezek az esetek kizárják egymást, így összegük valószínűsége: p0+p1+p2.
Ezek a valószínűségek a Poisson-eloszlás táblázatból kikereshetők (λ=1, k=0, 1, 2)
P(ξ≥3)=1-(p0+p1+p2)=1-(0,367+0,367+0,183)=0,083
3. Egy augusztusi éjszakán átlagosan 10 percenként észlelhető csillaghullás. Mennyi
annak a valószínűsége, hogy egy negyedóra alatt két csillaghullást látunk?
(Feltételezzük, hogy a csillaghullások száma Poisson-eloszlást követ.)
Megoldás:
Ha 10 percenként átlagosan 1 csillaghullás érzékelhető, akkor 15 percenként 1,5 lesz az
átlagos csillaghullás, vagyis λ=1,5. Annak valószínűsége, hogy ezalatt az idő alatt két
csillaghullást látunk: p=0,251 (táblázatból: λ=1,5; k=2)
4. Egy elektronikus műszer 1000 alkatrészből áll. Egy alkatrész a többitől függetlenül
0,001 valószínűséggel romlik el egy év alatt. Mennyi a valószínűsége annak, hogy
legalább két alkatrész romlik el egy év alatt?
Megoldás:
Tulajdonképpen binomiális eloszlással kellene számolnunk. Mivel azonban az alkatrészek
száma (n=1000) elég nagy (n>30), a p=0,001 valószínűség pedig nagyon kicsi, így bevezetjük
a 1001,01000 pn paramétert, és a binomiális eloszlás tagjait a megfelelő Poisson-
eloszlásból kapott tagokkal közelítjük.
A legalább két alkatrész elromlási eseményének ellentettje, hogy kettőnél kevesebb alkatrész
romlik el, vagyis hogy vagy 0 vagy 1 alkatrész romlik el. Ezek az esetek egymást kizárják, és
összegük valószínűségét ezek valószínűségének összege adja:
28
734,0367,0367,010 pp (Poisson-eloszlás táblázatból, λ=1, k=0,1)
Így a legalább két alkatrész meghibásodásának valószínűsége:
266,0734,01)(1 10 pp
Tehát kb. 26,6% a valószínűsége annak, hogy a műszer alkatrészei közül legalább kettő
elromlik egy év alatt.
5. Egy telefonközponthoz 600 előfizető tartozik. Tegyük fel, hogy 0,005 a valószínűsége
annak, hogy valamelyik előfizető egy meghatározott órában kapcsolást kér. Mennyi a
valószínűsége annak, hogy abban az órában épp 4 előfizető kér vonalat?
Megoldás:
Itt is binomiális eloszlással kellene számolnunk, de n=600 elég nagy és p=0,005 pedig elég
kicsi ahhoz, hogy a binomiális eloszlást a Poisson-eloszlással közelítsük.
3005,0600 pn
168,04 p (Poisson-eloszlás táblázatból: λ=3, k=4)
Tehát 16,8% a valószínűsége annak, hogy az adott órában éppen 4 előfizető kér kapcsolást.
6. Egy orsózógépen 100 munkaóra alatt átlagosan 3 szakadás következik be. Mennyi a
valószínűsége annak, hogy egy ilyen időtartam alatt a szakadások száma túllépi az
átlagot? (A szakadások Poisson-eloszlás szerint következnek be.)
Megoldás:
A vizsgált időtartam alatt bekövetkező szakadások száma legyen a ξ valószínűségi változó
értéke. Ez Poisson-eloszlású, paramétere a vizsgált időtartam alatti szakadások átlagos száma,
vagyis 3.
3)( M
Itt is fordítva gondolkodunk. A kérdés az, hogy mi a valószínűsége, hogy 3-nál több szakadás
következik be. Ennek ellentettjét könnyebb számolni, vagyis annak a valószínűségét keressük,
hogy 3 vagy annál kevesebb szakadás következik be. A Poisson-eloszlás táblázatának
segítségével már csak ki kell keresni az értékeket (λ=3; k=0, 1, 2, 3)
646,0224,0224,0149,0049,03210 pppp
Így annak a valószínűsége, hogy 3-nál több szakadás következik be:
354,0646,01)3(1)3( pp
29
Vagyis 35,4% a valószínűsége annak, hogy a szakadások száma 100 óra alatt meghaladja a 3-
at.
7. Egy készülék meghibásodásainak átlagos száma 10000 működési óra alatt 10.
Határozzuk meg annak a valószínűségét, hogy a készülék 200 működési óra alatt nem
romlik el!
Megoldás:
10000 működési óra alatt 10 meghibásodás 2,010000
10200)( M
k=0-nál és λ=0,2-nél a táblázatból )0( P =0,8187
8. Egy készülék szavatossági ideje egy év. A készülék 2000 darab azonos, különlegesen
megbízható elemet tartalmaz, amelyek a szavatossági idő alatt egymástól függetlenül
0,0005 valószínűséggel romlanak el. A szavatosság alapján a gyártó vállalat az egy éven
belül bekövetkezett meghibásodások javítására esetenként a teljes ár 1/4 részét fizeti
vissza. Ha a javítások száma az év során eléri az ötöt, akkor a gyártó vállalat a már
kifizetett négy javítási költségen felül a teljes árat is visszafizeti. Számítsuk ki, hogy
előreláthatólag az eredeti vételár hány százaléka marad a gyártó vállalatnál!
Megoldás:
Mivel n elég nagy és p elég kicsi, így a binomiális eloszlást közelítjük a Poisson eloszlással.
10005,02000 pn
Táblázatból kikeressük a megfelelő pk értékeket:
pk Lehetséges bevétel
p0=0,3679 +1
p1=0,3679 +3/4
p2=0,1839 +1/2
p3=0,0613 +1/4
p4=0,0153 0
p5=0,0031 -1
748,00031,0100613,04
11839,0
2
13679,0
4
313679,0)( M
Tehát a vállalat a szavatosságra kb. 25%-ot fordít.
9. 100 méter hosszú szövetanyagon átlagosan 5 hibát találtunk, s a mérések a szövethibák
számát Poisson eloszlásúnak mutatták. 300 méter hosszú szövetet 4 méter hosszú
terítékekre osztanak. Minden 4 méteres darabból egy-egy öltöny készül. A hibátlan
öltönyt darabonként 40000 forintért árusítják, a szövethibásat 30000 forintért.
Várhatóan hány hibátlan van a 300 méteres szövetvégből készült öltönyök között?
Mennyi az öltönyök eladásából származó árbevétel?
Megoldás:
Várhatóan hány hibátlan van a 300 méteres szövetvégből készült öltönyök között?
(mennyi a valószínűsége, hogy 4 méter szövetben nem találunk szövethibát?)
30
Jelölje a valószínűségi változó a hibák számát a 4 méter szövetben.
Először határozzuk meg eloszlás paraméterét.
2,0)4/100/(5M
k=0
%87,81!0
2,00 2,02,0
0
eeP
A 300 méteres szövetvégből összesen 75 darab öltönyt lehet készíteni. A 75 darabból
várhatóan 61 darab hibátlan öltöny készül. (75·0,8187)
A hibátlan öltönyt darabonként 40000 forintért árusítják, a szövethibásat 30000 forintért.
Mennyi az öltönyök eladásából származó árbevétel?
Az árbevétel várhatóan: (61·40.000)+(14·30.000)=2.860.000 Ft
Exponenciális eloszlás
1. Bizonyos típusú izzólámpák tönkremeneteléig eltelt égési időtartam hosszát tekintsük
valószínűségi változónak. Megállapították, hogy ez a valószínűségi változó
exponenciális eloszlást követ, és szórása 1000 óra. Határozzuk meg a valószínűségi
változó várható értékét! Számítsuk ki annak a valószínűségét, hogy egy kiválasztott
izzólámpa 3000 órán belül nem megy tönkre!
Megoldás:
Mivel a ξ valószínűségi változó várható értéke és szórása megegyezik (mivel exponenciális
eloszlást követ), így:
óra
óraMD
1
1000
1
10001
)()(
Az az esemény, hogy egy izzólámpa 3000 órán belül nem megy tönkre, azt jelenti, hogy a
ξ≥3000. Ennek valószínűsége:
05,0)1(1)3000(1)3000(1)3000( 33000
1000
1
eeFPP
Tehát kb. 5% a valószínűsége annak, hogy egy izzólámpa legalább 3000 órán át hibátlanul
világít.
2. Egy intézet külföldről rendel könyveket. Az ehhez szükséges devizára várni kell, a
tapasztalatok alapján ½ évet. A várakozási idő exponenciális eloszlású. Mennyi a
valószínűsége annak, hogy az intézet egy negyedéven belül megkapja a könyveket?
31
Megoldás:
Exponenciális esetben M(ξ)=1/λ=1/2, így λ=2.
39347,011)4
1( 2
1
4
12
eeP
Így közel 39% az esélye annak, hogy az intézet egy negyedéven belül megkapja a könyveket.
3. Egy szövőgép automatikusan megáll, ha legalább egy fonalszakadás történik. Legyen ξ
a gép megindulásától az első fonalszakadásig eltelt idő. A ξ-re tett megfigyelések szerint
az exponenciális eloszlású, várható értéke 2,5 óra. Mekkora a valószínűsége annak,
hogy egy munkanap alatt, amely 8 órából áll, a gép egyszer sem áll fonalszakadás
miatt?
Megoldás:
Exponenciális esetben M(ξ)=1/λ=2,5, így λ=0,4
0408,011)8(1)8( 2,384,0 eePP
4,08% a valószínűsége annak, hogy az adott munkanapon nem lesz fonalszakadás.
4. Egy szövőgép 400 szállal dolgozik. Az egyes szálak élettartama, tehát amíg el nem
szakad, exponenciális eloszlású, minden szálra ugyanazzal a λ=1/150
paraméterértékkel, és feltehető, hogy a szakadások egymástól függetlenek. Mennyi a
valószínűsége annak, hogy a gép fonalszakadás miatt a megindulástól számított 3 órán
belül megáll?
Megoldás:
A ξi az i-edik szál élettartama. A gép akkor áll le, ha van olyan szál, amely 3 órán belül
elszakad, azaz, ha ξ1, ξ2, …, ξ400 valószínűségi változók legkisebbike kisebb 3-nál. Jelöljük η-
vel a ξ1, ξ2, …, ξ400 valószínűségi változók legkisebbikét: ),...,,min( 40021
A feladatunk a P(η<3) valószínűség meghatározása. Ez a valószínűség így is felírható
(felhasználva a szakadások egymástól való függetlenségét):
)3(...)3()3(1
)3,...,3,3(1)3),...,,(min(1)3(1)3(
40021
4002140021
PPP
PPPP
50
13
150
1
)3(1)3(
eePP ii
9993,09802,01)(1)3( 40040050
1
eP
A keresett esemény tehát majdnem biztosan (99,993% valószínűséggel) bekövetkezik.
5. Egy üzletbe átlagosan 30 vevő érkezik óránként. Mennyi annak a valószínűsége, hogy
két egymás után érkező vevő ideje között eltelt idő 2 percnél több. Mennyi a
valószínűsége, hogy ez az időtartam 3 percnél kevesebb? Mekkora a valószínűsége
annak, hogy ez az időtartam 1 és 3 perc közé esik?
Megoldás:
Az óránként beérkező vevők számát Poisson-eloszlásúnak tekintjük. Mivel 2 vevő beérkezése
között eltelt idő átlagosan 2 perc, az exponenciális eloszlás paramétere: λ=1/2.
A kérdéses valószínűségek:
32
1. 368,011)2(1)2( 12
2
1
eePP
2. 7769,01)3(3
2
1
eP
3. 3834,011)31( 2
3
2
1
2
1
2
3
eeeeP
6. Egy automatizált gépsor hibamentes működésének valószínűsége 120 működési órára
0,9. Tegyük fel, hogy a működési idő exponenciális eloszlású. Számítsa ki a
meghibásodási rátát és a működési idő várható értékét, valamint annak a
valószínűségét, hogy a gépsor a 150. és a 200. óra között meghibásodik.
Megoldás:
A meghibásodási ráta, vagyis az eloszlás paramétere:
4
120120
1078,89,0ln120
9,01,011,0)120(9,0)120(19,0)120(
eeFFP
11391078,8
11)(
4
M óra a működési idő várható értéke.
03765,0
11)150()200()200150( 2001078,81501078,81501078,82001078,8 4444
eeeeFFP
Így 3,765% annak a valószínűsége, hogy a gépsor a 150. és a 200. óra között meghibásodik.
7. Számítsa ki az F(x=1/) eloszlásfüggvény értéket!
Megoldás:
6321,0111)( 1
1
eeexF x
, vagyis 63,21%.
Normális eloszlás
1. Egy vállalatnál az alkalmazottak heti bére normális eloszlású $100 várható értékkel és
$10 szórással. Mekkora a valószínűsége, hogy egy találomra kiválasztott dolgozó
a) 95 és 135 dollár között keres?
b) 112,5 dollárnál többet keres?
c) 80 dollárnál kevesebbet keres?
d) Mekkora heti fizetést kapnak a legjobban kereső 20%-ba tartozó dolgozók közül
a legkevesebbet keresők?
Megoldás:
a) 95 és 135 dollár között keres:
691212,0691462,0199975,0)5,0(1
)5,3()5,0()5,3()10
10095()
10
100135()95()135()13595(
FFP
Tehát 69,12% annak a valószínűsége, hogy valaki 95 és 135 dollár között keres.
b) 112,5 dollárnál többet keres:
33
10565,089435,01)25,1(1)10
1005,112(1)5,112(1)5,112(
FP
Vagyis 10,56% a valószínűsége annak, hogy 112,5 dollárnál valaki többet keres.
c) 80 dollárnál kevesebbet keres:
02275,097725,01)2()10
10080()80()80(
FP
Vagyis 2,275% a valószínűsége annak, hogy valaki 80 dollárnál kevesebbet keres.
d) Mekkora heti fizetést kapnak a legjobban kereső 20%-ba tartozó dolgozók közül a
legkevesebbet keresők?
2,0)( xP 2,0)(1 xF 8,0)( xF 8,0)10
100(
x u=0,84
10
10084,0
x x=108,4 dollár felett keres a legjobban fizetett 20%.
2. Egy vizsgálat szerint a felnőtt korú férfiak testmagassága N(174cm 7cm) eloszlást
követ.
Határozza meg annak a valószínűségét, hogy egy véletlenszerűen kiválasztott férfi
testmagassága:
a) nagyobb, mint 190 cm,
b) 170 és 185 cm közé esik,
c) mekkora a testmagasság szórása, ha tudjuk, hogy a férfiak 5%-ának a
testmagassága 168 cm alatt van?
Megoldás:
a) nagyobb, mint 190 cm,
%13,1011304,0
988696,01)28,2(1)7
174190(1)190(1)190(1)190(
FPP
3. 170 és 185 cm közé esik,
%74,656574,0715661,01941792,0)57,0(1)57,1(
)57,0()57,1()7
174170()
7
174185()170()185()185170(
FFP
4. mekkora a testmagasság szórása, ha tudjuk, hogy a férfiak 5%-ának a testmagassága 168
cm alatt van?
34
66,3174168
64,1
64,195,0)(05,0)(05,0)174168
(
05,0)168(
05,0)168(
uuu
F
P
3. Egy termék élettartama N(13év; 1év) eloszlású.
a) Teljesíti-e az élettartam azt az elvárást, hogy a 11 évnél korábban
meghibásodó termékek aránya legfeljebb 1% legyen?
b) Ha nem, akkor hogyan kell megváltoztatni a várható értéket, ill. a szórást,
hogy teljesítsék az előírást?
c) Termékfejlesztés eredményeképpen egy új termék élettartama N(16év; 0,9év)
eloszlással jellemezhető. Mekkora garanciális időt adjon a cég ahhoz, hogy a
termékek legfeljebb 5%-a menjen tönkre a garancia alatt?
Megoldás:
a) Teljesíti-e az élettartam azt az elvárást, hogy a 11 évnél korábban meghibásodó termékek
aránya legfeljebb 1% legyen?
%28,202275,097725,01)2(1)2()1
1311()11()11(
FP
Nem teljesíti az elvárást, hiszen a 11 évnél korábban meghibásodó termékek aránya 2,28%.
b) Ha nem, akkor hogyan kell megváltoztatni a várható értéket, ill. a szórást, hogy teljesítsék
az előírást?
(A várható értéknek nyilván nagyobbnak, a szórásnak pedig kisebbnek kell majd lennie.)
Várható érték változtatása:
év
uuuFP
34,1334,21
11
34,299,0)(01,0)(01,0)1
11(01,0)11()11(
Szórás változtatása:
85,034,21311
01,0)1311
(
c) Termékfejlesztés eredményeképpen egy új termék élettartama N(16év; 0,9év) eloszlással
jellemezhető. Mekkora garanciális időt adjon a cég ahhoz, hogy a termékek legfeljebb
5%-a menjen tönkre a garancia alatt?
35
évxx
uuu
xxFxP
52,1464,19,0
1664,195,0)(05,0)(
05,0)9,0
16(05,0)()(
14,52 év garanciát kellene adnia a cégnek.
4. A munkapadról kikerülő termék hossza normális eloszlású valószínűségi változó
μ=20cm és σ=0,2cm paraméterekkel. Mekkora annak a valószínűsége, hogy egy termék
hossza 19,7 és 20,3 közé esik? Milyen pontosságot biztosíthatunk 0,95 valószínűséggel a
munkadarabok hosszára?
Megoldás:
8664,0
933193,01933193,0)5,1()5,1()2,0
207,19()
2,0
203,20()3,207,19(
P
Tegyük fel, hogy a munkadarabnak μ=20cm-es mérettől való eltérése x cm. Így a feltétel
szerint:
392,096,12,0
975,0)2,0
(
95,01)2,0
(2)2,0
(1)2,0
(
)2,0
()2,0
()2,0
2020()
2,0
2020()2020(
xx
x
xxx
xxxxxxP
Tehát 95%-os valószínűséggel állíthatjuk, hogy a hosszeltérés 4 mm-nél nem lesz nagyobb.
5. Valamely szolgáltató vállalathoz naponta beérkező megrendelések ξ száma a
tapasztalatok szerint közelítőleg normális eloszlásúnak tekinthető σ=10 szórással.
Mekkora a megrendelések várható száma, ha tudjuk, hogy 1,0)20( P ?
Megoldás:
9,3229,110
20
9,0)10
20(
1,0)10
20()20(
P
A naponta beérkező megrendelések átlagos száma 33.
36
6. Bizonyos típusú rádiócsöveket, amelyeknek az élettartama normális eloszlású, μ=160 és
σ=20 óra paraméterekkel, négyesével dobozokba csomagolnak. Mennyi a valószínűsége
annak, hogy egy ilyen dobozban lévő 4 cső mindegyike 180 óránál tovább fog működni?
Mennyi annak a valószínűsége, hogy a 4 cső közül kettőt kivéve, az egyik 180 óránál
tovább fog működni a másik meg nem?
Megoldás:
Annak a valószínűsége, hogy egy cső működési ideje 180 óránál nagyobb lesz:
158655,0841345,01)1(1)20
160180(1)180(1)180(
PP
A két kérdésre adandó felelethez figyelembe kell venni, hogy a 4 cső között azok száma,
amelyeknek a működési ideje 180 óránál nagyobb, binomiális eloszlású, ahol p=0,158655.
Így a keresett valószínűségek a binomiális eloszlás táblázat segítségével könnyen
meghatározhatók:
Annak a valószínűsége, hogy a 4 cső mindegyike működik: 0,0005 (táblázatban p=0,15; n=4;
k=4).
Annak valószínűsége, hogy a 4 csőből 2-őt kivéve az egyik tovább működik, a másik meg
nem: 0,255 (táblázatban p=0,15; n=2; k=1)
7. A Jólfizetünk Rt. új üzeménél megvizsgálták a dolgozók fizetését, s azt találták, hogy a
fizetés N(135000Ft, 10000Ft) eloszlású. Legnagyobb versenytársuk közelben működő
üzeménél azt tapasztalták, hogy 115 000 Ft-nál a dolgozók legfeljebb 1%-a kap
kevesebbet. Teljesíti-e az új üzem ezt az elvárást?
Ha nem, mekkora legyen a szórás ill. a várható érték hogy teljesítsék? A bérfejlesztés
után megismételve a vizsgálatot a fizetések eloszlása N(140000Ft, 8000Ft). Legfeljebb
mennyit keres a cégnél a legrosszabbul kereső 5%?
Megoldás:
02275,097725,01)2()10000
135000115000()115000()115000(
FP
Az új üzem nem teljesíti az elvárást, ugyanis a 115 000 Ft alatt keresők aránya meghaladja az
1%-ot, hiszen azok aránya 2,275%.
Várható érték változtatása:
01,0)10000
115000()115000()115000(
újFP
u=-2,34
10000
11500034,2
új
μúj=138400Ft
Szórás változtatása:
01,0)135000115000
()115000()115000(
új
FP
u=-2,34
új
13500011500034,2
σúj=8547Ft
37
Legfeljebb mennyit keres a cégnél a legrosszabbul kereső 5%?
05,0)( xP 05,0)( xF 05,0)8000
140000(
x u=-1,65
8000
14000065,1
x
x=126800Ft, vagyis a legrosszabbul kereső 5% között 126800Ft-ot keres a legjobban fizetett
alkalmazott.
8. Export konyak töltésénél az 510 ml alatti palackok aránya legfeljebb 3% lehet.
Megvizsgáltak egy n=20000 db-os tételt: x =532,4 ml, =6 ml. Határozzuk meg az
optimális töltési szintet.
Mekkora az adott tételnél a töltési veszteség értéke, ha á=1000 Ft/palack?
Megoldás:
)6
510()510(03,0)510(
FP u=-1,88 μ=521,28 az optimális töltési szint. A
töltési veszteség mértéke: 22240020000)28,5214,532( 64,42628,521
222400 palacknyi
túltöltés, aminek a következménye 426640Ft töltési veszteség.
9. A bélszínrolót négyesével csomagolják tasakokba. A rolók súlya N(50gr., 5gr.) eloszlást
követ. Mekkora a valószínűsége annak, hogy a tasak valamennyi rolója 55 grammnál
nehezebb?
Megoldás:
Első lépésben azt számoljuk ki, hogy mi a valószínűsége annak, hogy egyetlen darab
bélszínroló súlya nagyobb, mint 55 gramm.
158655,0841345,01)1(1)5
5055(1)55(1)55(
FP , vagyis 15,86%.
Annak a valószínűsége, hogy a csomagban mind a 4 rolónak a súlya nagyobb, mint 55
gramm, ennek a negyedik hatványa lesz:
0006336,0158655,0 4 , vagyis mindösszesen 0,06336% a valószínűsége.
38
VI. Becslés
1. Egy mosóporgyárban az egyik adagolóautomata 500g tömegű mosóport tölt
papírdobozokba. A gép által töltött dobozokból vett minta adatai: 483g; 502g; 498g;
496g; 502g; 494g; 491g; 505g; 486g.
A gép által töltött tömeg normális eloszlású, 8g szórással. Határozza meg a gép által
töltött dobozok tömegének konfidencia intervallumát 98%-os megbízhatósági szint
mellett!
Megoldás: várható érték becslése intervallummal ismert elméleti szórás esetén
46,50198,488
3
834,222,495
3
834,222,495
34,2
1)(
22,4959
486505491494502496498502483
8
%2
01,02/
02/
02/
zz
nzx
nzxP
gx
g
2. Egy vállalatnál 2500 kereskedő dolgozik, s a vállalat szeretné megbecsülni, hogy évente
átlagosan hány kilométert autózik egy kereskedő. Korábbi felmérésekből ismert, hogy az
egy kereskedő által megtett út normális eloszlású 5000 km szórással. Véletlenszerűen
kiválasztva 25 gépkocsit, azt találták, hogy átlagosan 14000 km-t futottak egy év alatt.
Adjunk 95%-os megbízhatóságú intervallumbecslést a várható értékre!
Megoldás:
n=25
km
kmx
5000
14000
0
A feladat a várható érték becslése ismert alapsokasági szórás esetén.
10
2/
0
2/n
zxn
zxP
1596012040
25
500096,114000
25
500096,114000
5%-os szignifikancia szinten a futott km várható értéke 12040 és 15960 km között van.
3. Egy gyártó egy bizonyos instant kávé egy adott napon érvényes kiskereskedelmi árát
szeretné felmérni, s ezért országszerte véletlen mintavétellel kiválasztottak 45 boltot. A
felmérés után azt találták, hogy a kávé átlagára 1,95 dollár, 27 cent szórással. Adjunk
99%-os becslést a várható értékre!
39
n=45
%1
27,0
95,1
s
x
A feladat a várható érték becslése ismeretlen alapsokasági szórás esetében.
1)()(
*
2/
*
2/n
stx
n
stxP
0583,28417,1
1083,095,11083,095,1
45
27,0691,295,1
45
27,0691,295,1
1%-os szignifikancia szinten az instant kávé kiskereskedelmi árának várható értéke 1,8417 és
2,0583 dollár közé becsülhető.
4. Egy vezeték nélküli, újratölthető csavarhúzókat gyártó vállalatnál felmérve a
csavarhúzók működési idejét, azt normális eloszlásúnak találták. 15 csavarhúzó
élettartamát megvizsgálva az átlag működési idő 8900 óra, s a szórás 500 óra. Adjuk
meg a várható érték 95%-os konfidencia intervallumát. A cég az új
reklámkampányában ki szeretné emelni, hogy a csavarhúzók 99%-a egy adott
élettartamnál tovább működik. Maximum mekkora működési időt mondjon, ha nem
akarja becsapni a vásárlókat?
n=15
500
8900
s
x
Az első feladat a várható érték becslése ismeretlen alapsokasági szórás esetén:
1)()(
*
2/
*
2/n
stx
n
stxP
92,917608,8623
92,276890092,2768900
15
500145,28900
15
500145,28900
Az élettartam várható értéke a mintánk alapján 8623 és 9176 óra közé becsülhető 5%-os
szignifikancia szinten.
A második feladat egyoldali becslés 1%-os szignifikancia szinten:
1n
stxP
24,8561
15
500624,28900
A várható érték 1%-os szignifikancia szinten biztos nagyobb lesz, mint 8561,24 óra.
40
5. Hesser-rendszerű töltőgépen első alkalommal töltenek 200g névleges tömegű újfajta
enzimes mosóport. A töltőgép szórásának meghatározására 25 elemű mintát vettek,
amelynek korrigált tapasztalati szórásnégyzete 144g2. Várhatóan milyen szórással
tölthető nagy tömegben a mosópor?
Megoldás:
A feladat a szórás becslése:
n=25
gs 12
Legyen a szignifikancia szint 5%!
111
2
2/1
2*2
2
2/
2* snsnP
694,1637,9
68,278796,87
401,12
14424
364,39
14424
2
2
A mosópor a megadott mintabeli tapasztalatok alapján 5%-os szignifikancia szinten várhatóan
9,37g és 16,694g közötti szórással tölthető nagy tömegben.
6. Egy kutató laboratórium valamely 6 éves korban beadandó védőoltás dózisának
beállításához 100 véletlenül kiválasztott gyermek testsúlyát mérte meg. A testsúly
normális eloszlású változónak tekinthető.
Testsúly,
kg
Gyerekek
száma, db
15,1 – 17 4
17,1 - 19 20
19,1 – 21 55
21,1 – 23 14
23,1 - 25 7
Összesen 100
Becsülje meg 95%-os megbízhatósággal a 6 éves gyermekek várható testsúlyát és a 21
kg-nál súlyosabb gyerekek arányát!
Megoldás: a várható testsúly becsléséhez szükségünk van a 100 elemű minta számtani
átlagára és korrigált tapasztalati szórására, hiszen adott minta alapján kívánunk következtetést
levonni a sokaságra (a 6 éves gyermekek sokaságára) vonatkozóan.
Ezek becslése osztályközös gyakorisági sorból történik a leíró statisztikai fejezetben tanult
képletek segítségével.
41
05,20100
05,247....05,182005,164
1
1
r
i
i
i
r
i
i
f
xf
x
77,115,3
99
)05,2005,24(7...)05,2005,18(20)05,2005,16(4
1
)(222
1
1
2
*
r
i
i
r
i
ii
f
xxf
s
1)()(
*
2/
*
2/n
stx
n
stxP
4,207,19
35,005,2035,005,20
100
77,198,105,20
100
77,198,105,20
Vagyis a 100 elemű mintánk adatai alapján a 6 éves gyermekek várható testsúlya 19,7 és 20,4
kg közé esik 5%-os szignifikancia szinten.
A 21kg-nál nehezebbek arányának becsléséhez természetesen az aránybecslés képletére van
szükségünk:
1
)1()1(2/2/
n
ppzpP
n
ppzpP
Ehhez p=kedvező eset/összes eset, vagyis p=21/100=0,21
2898,01302,0
0798,021,00798,021,0
100
79,021,096,121,0
100
79,021,096,121,0
P
P
P
5%-os szignifikancia szinten a 21kg-nál nehezebb 6 éves gyerekek aránya 13,02 és 28,98%
közé becsülhető.
42
7. Egy csővágó automata gépnek 1200mm hosszú csődarabokat kell levágnia. A
gyártásközi ellenőrzés feladata, hogy megállapítsa, hogy a gép által gyártott darabok
hosszmérete megfelel-e az előírásoknak. Előző adatfelvételekből ismert, hogy a gép által
gyártott csődarabok hossza normális eloszlású valószínűségi változó 3mm szórással. A
gyártásközi ellenőrzésre kiválasztottak egy 16 elemű mintát. A csődarabok hossza a
mintában:
1208 1204 1202 1202 1194
1195 1205 1194 1197 1193
1205 1202 1191 1195 1194
1187
a.) 90%-os megbízhatósági szinten adjon intervallumbecslést a csődarabok
hosszának várható értékére!
b.) A minta alapján feltételezhető-e (95%-os megbízhatósági szinten), hogy a gép
szórása nem haladja meg a korábbi felvételek során kapott értéket?
Megoldás:
Első lépésben a feladat a várható érték becslése ismert sokasági szórás esetén:
10
2/
0
2/n
zxn
zxP
119816
1187...12041208
x
23,119977,1196
23,1119823,11198
16
364,11198
16
364,11198
A csődarabok hossza 1196,77mm és 1199,23mm közé becsülhető 10%-os szignifikancia
szinten.
Második lépésben egymintás hipotézisvizsgálatról (szóráspróbáról) van szó, ehhez ki kell
számítanunk a minta korrigált tapasztalati szórását1:
022,615
)11981187(...)11981204()11981208(
1
)(222
16
1
2
n
xx
s i
i
2
0
2
1
2
0
2
0
:
:
H
H
A próbafüggvény:
44,60
3
022,615*12
2
2
0
22
snsz
222
0
2
1 : számH
1 Megjegyezzük, hogy a feladat b) része egyoldali szórásbecslésként is elvégezhető.
43
996,242 Mivel a számított érték>kritikus érték, ezért elutasítjuk a H0 hipotézist, vagyis a minta alapján
azt látjuk, hogy a gép szórása meghaladja a korábbi felvételek során kapott értéket.
8. Egy vállalat szervezetének átvilágításakor 1500 szervezeti alkalmazott közül 225
munkatársat véletlenszerűen kiválasztottak, és több kérdés mellett megkérdezték tőlük,
hogy mekkora fizetést tartanának kielégítőnek. A válaszok átlaga havi bruttó 250 ezer
forint, 113 ezer forint szórással.
Becsüljük meg 95 és 99%-os megbízhatósággal, mekkora havi bruttó bérkifizetésre kell
a cégnek felkészülnie, ha a kielégítőnek vélt szintet szeretné biztosítani!
Megoldás:
n=225
113000
250000
s
x
α=5%
Kétoldali:
1)()(
*
2/
*
2/n
stx
n
stxP
33,26476576,235234
33,1476525000033,14765250000
225
11300096,1250000
225
11300096,1250000
A végeredményt megszorozzuk az 1500 alkalmazottal, hiszen az eddigi eredmény egyetlen
alkalmazottra vonatkoztatható:
352 852 140Ft és 397 147 995Ft közötti havi bruttó bérkifizetésre kell 5%-os szignifikancia
szinten felkészülnie a vállalatnak.
α=1%
1)()(
*
2/
*
2/n
stx
n
stxP
87,26940513,230594
87,1940525000087,19405250000
225
113000576,2250000
225
113000576,2250000
Így 345 891 195Ft és 404 108 805Ft közötti havi bruttó bérkifizetésre kell 1%-os
szignifikancia szinten felkészülnie a vállalatnak.
44
9. Minőségellenőrzés keretében vizsgálták egy adott típushoz tartozó elektromos habverők
élettartamát. A 120 megfigyelés eredménye:
Élettartam (év) Megfigyelések száma (db)
5,0≤x<5,5 8
5,5≤x<6,0 28
6,0≤x<6,5 50
6,5≤x<7,0 24
7,0≤x<7,5 10
Összesen 120
90%-os megbízhatósági szinten adjunk becslést az elektromos habverők élettartamára és az
élettartam szórására! Becsüljük meg ugyanekkora szignifikancia szint mellett a 6 évnél
hosszabb ideig működő elektromos habverők arányát!
Megoldás: várható érték becslése ismeretlen elméleti szórás esetén.
Az intervallumbecslést meg kell, hogy előzze az átlag és a szórás becslése (leíró statisztika).
25,6120
25,710....75,52825,58
1
1
r
i
i
i
r
i
i
f
xf
x
51,026,0
119
)25,625,7(10...)25,675,5(28)25,625,5(8
1
)(222
1
1
2
*
r
i
i
r
i
ii
f
xxf
s
327,6173,6
120
51,0658,125,6
120
51,0658,125,6
%10
1)( 2/2/
n
stx
n
stxP
A habverők élettartama 6,173 és 6,327 év között van 10%-os szignifikancia szinten.
Szórás becslése:
63,0499,0
397,02489,0
929,77
51,0119
34,124
51,0119
111
2
22
2
2
2/1
2*2
2
2/
2*
snsnP
45
A sokasági szórás 0,499 és 0,63 év közé becsülhető 10%-os szignifikancia szinten.
Sokasági arány becslése:
7,0120
102450
n
kp
1
)1()1(2/2/
n
ppzpP
n
ppzpP
7686,06314,0
120
3,07,064,17,0
120
3,07,064,17,0
P
P
Vagyis a 6 évnél tovább működő habverők aránya 63,14% és 76,86% között található 10%-os
szignifikancia szinten.
VII. Hipotézisvizsgálatok
Nemparaméteres próbák
1. Egy érmét 200-szor feldobva 115 alkalommal fej 85-ször írás az eredmény. Vizsgálja
meg 5%-os szinten azt a hipotézist, hogy az érme szabályos! (α=5%)
Megoldás:
Illeszkedésvizsgálat χ2-próbával:
Hipotézisek felállítása:
H0: szabályos, azaz diszkrét egyenletes eloszlás
H1: nem diszkrét egyenletes eloszlás
=0,05 DF=2-1=1 2
kr= 3,841
Számított érték meghatározása:
Osztályok fk pk Fk 2
i
fej 115 0,5 100 2,25
írás 85 0,5 100 2,25
200 1,0 200 4,5
2
kr=3,841 < 2
sz=4,5
A számított érték nagyobb, mint a kritikus.
A nullhipotézist, =0,05 szignifikancia szinten elutasítjuk, vagyis az érme nem szabályos.
2. Egy adott évben az építőipari vállalatoknál bekövetkező halálos balesetek száma a
következőképpen alakult:
Balesetek
száma
0 1 2 3 4 5 6 7 8 9
Vállalatok
száma
3 17 26 16 18 9 3 5 0 1
Leírható-e a balesetek száma Poisson-eloszlással? (α=10%)
Megoldás: illeszkedésvizsgálat
46
=? nem ismerjük a mintából kell becsülnünk
Poisson-eloszlás esetén M()= x (számtani átlag segítségével becsüljük –
pontbecslés)
302,398
19...26217130
Nullhipotézis felállítása:
H0 : a balesetek száma =3 paraméterű Poisson-eloszlású
H1: a balesetek száma nem =3 paraméterű Poisson-eloszlású
A számított érték meghatározásához szükségünk van az elméleti gyakoriságokra (F(k)),
amelyeket az alábbi táblázat és a Poisson táblázat segítségével számíthatunk ki. Érdemes az
utolsó 3 osztályt összevonni tekintettel arra, hogy 8 baleset egyetlen vállalatnál sem fordult
elő.
k f(k) pk F(k)
0 3 0,050 4,879
1 17 0,149 14,637
2 26 0,224 21,952
3 16 0,224 21,952
4 18 0,168 16,467
5 9 0,101 9,88
6 vagy
több
9 0,084 8,224
98 1 98
DF=r--1=7-1-1=5
=10% táblázatból: 2
elm.=9,236
Számított érték meghatározása:
76,3
224,8
)224,89(...
637,14
)637,1417(
879,4
879,43 222
2
sz
A számított és a kritikus érték összehasonlítása:
2
elm.=9,236 >> 2
sz=3,76
Döntés a nullhipotézisről:
Mivel a számított érték kisebb, mint a kritikus – a számított érték az elfogadási tartományba
esik –, ezért 90%-os megbízhatósági szinten nincs okunk a H0-t elutasítani. A balesetek száma
modellezhető =3 paraméterű Poisson-eloszlással.
47
3. Egy presszó tulajdonosa szerint a különböző erősségű világos sörök közül a hölgyek a
gyengébb söröket kedvelik. Sejtésének igazolására felmérést végzett, melynek eredménye
a következő táblázatban látható. Igaza van a tulajdonosnak? (α=5%)
Sör erőssége
Erős Közepes Gyenge
Férfi 20 50 30
Nő 10 55 35
Megoldás:
Függetlenségvizsgálat χ2-próbával:
H0: függetlenek (!!!!)
H1: nem függetlenek
=0,05 DF=(2-1)·(3-1)=2
2
kr=5,99
Kontingencia táblázat:
tap.gyak
elm.gyak
Erős Közepes Gyenge
Férfi 20
15.00
50
52.50
30
32.50
100
Nő 10
15.00
55
52.50
35
32.50
100
30 105 65 200
Számított érték:
χ2
sz=1,667+0,119+0,192+1,667+0,119+0,192=3,956
Számított érték kisebb, mint a kritikus érték, a H0 nullhipotézist =0,05 szignifikancia szinten
elfogadjuk, vagyis a sör erőssége és a nem között nincs összefüggés.
4. Vizsgáljuk meg, hogy a Tisza Szegednél mért évi maximális vízállásai ugyanazt az
eloszlást követték-e 1876-1925 között, mint 1926-tól 1975-ig! A méterben megadott
adatok az alábbiak (α=10%):
Gyakoriság
1876-1925
Gyakoriság
1926-1975
V < 5 5 10
5 V <6 11 11
6 V <7 13 13
7 V <8 13 10
8 < V 8 6
48
Megoldás: homogenitás-vizsgálat
H0: a két időszak maximális vízállásainak eloszlása azonos
H1: a két időszak maximális vízállásainak eloszlása nem azonos
=0,10 DF=5-1=4 2
kr=7,78
Kontingencia táblázat:
C1 C2 Total
1 5
7.50
10
7.50
15
2 11
11.00
11
11.00
22
3 13
13.00
13
13.00
26
4 13
11.50
10
11.50
23
5 8
7.00
6
7.00
14
Total 50 50 100
Számított érték:
χ2
sz=0,833+0,833+0,000+0,000+0,000+0,000+0,196+0,196+0,143+0,143=2,344
Számított érték kisebb, mint a kritikus érté, a H0 nullhipotézist =0,1 szignifikancia szinten
elfogadjuk, a két időszak maximális vízállásainak eloszlása azonos.
5. Egy vállalatnál az átlagos heti túlóra-kifizetéseket vizsgálták. 80 véletlenszerűen
kiválasztott dolgozó adatai alapján az átlagos túlórafizetés az alábbi eloszlást mutatja:
Heti túlórabér [font] munkások
száma
T < 1 19
1 T < 2 29
2 T < 5 17
5 T < 10 12
10 < T 3
Leírhatók-e a heti-túlórakifizetések normális eloszlással?
Megoldás:
Illeszkedésvizsgálat
H0: normális eloszlás N(?;?)
H1: nem normális eloszlás
A hipotézisek felállításához szükség van az átlag és a szórás becslésére (lásd: leíró
statisztika):
átlag: 380
240
80
35,12...295,1195,0
x
tap.gyak
elm.gyak
49
szórás: 886,8180
)35,12(3...)35,1(29)35,0(19 2222*
s s*=2,98
Így már pontosan meg tudjuk fogalmazni a hipotéziseinket:
H0: a heti túlóra kifizetés normális eloszlású N(3,0;2,98) paraméterekkel
H1: a heti túlóra kifizetés nem N(3,0;2,98) paraméterű normális eloszlású
becsült paraméterek száma: 2
=0,10 DF=r-1-2=5-3=2
2
kr=4,61
Számított érték meghatározása:
Osztályok fk pk Fk 2
i
– 1 19 0,251 20,0907 0,059
1 – 2 29 0,1175 9,4003 40,865
2 – 5 17 0,3802 30,4183 5,919
5 – 10 12 0,2417 19,3362 1,289
10 – 3 0,00943 0,7545 !!
80 1 80 48,136
DF=r-1-2=4-3=1
2
kr=2,71
2
sz=48,14
A számított érték nagyobb, mint a kritikus, a nullhipotézist =0,1 szignifikancia szinten
elutasítjuk, azaz a heti túlóra kifizetés nem tekinthető N(3,0; 2,962) normális eloszlásúnak.
6. Egy termelési folyamatban 4 gép működik 3 műszakban. Véletlen mintát véve a hibás
termékekből, gépek és műszakok szerint csoportosították őket. Az eredményt az alábbi
táblázat mutatja.
Műszak Gépek
A B C D
I. 10 11 8 9
II. 16 9 13 11
III. 12 9 14 9
Van-e kapcsolat a selejtnagysága szerint a gépek és műszakok között? (α=10%)
Megoldás:
Függetlenségvizsgálat χ2-próbával:
H0: függetlenek (!!!!)
H1: nem függetlenek
50
=0,1 DF=(3-1)·(4-1)=6
2
kr=10,645
Kontingencia táblázat:
tap.gyak
elm.gyak
Műszak gépek Gyak.
A B C D
I. 10
11,023
11
8,41
8
10,15
9
8,41
38
II. 16
14,21
9
10,85
13
13,1
11
10,85
49
III. 12
12,76
9
9,74
14
11,76
9
9,74
44
Gyakoriság 38 29 35 29 131
Számított érték:
χ2
sz=0,095+0,7976+0,455+0,0414+0,2255+0,315+0,000763+0,002074+0,0453+0,05622+
+0,4267+0,05622=2,517
Számított érték kisebb, mint a kritikus érték, a H0 nullhipotézist =0,1 szignifikancia szinten
elfogadjuk, vagyis a gépek és a műszakok függetlenek egymástól.
Paraméteres próbák
1. Egy liter „A” márkájú benzin felhasználásával öt hasonló gépkocsi azonos feltételek
mellett 11,5, 12,3, 10,2, 11,7 és 10,8 km-t tettek meg. Ugyanezek az autók a „B”
márkájú benzinnel 10,3, 9,8, 11,4, 10,1 és 10,7 km-t mentek. Vizsgálja meg, hogy az 1l-
rel megtehető km-ek számát tekintve az „A” márka jobb-e, mint a „B”?
Megoldás: kétmintás próba, a minták nem függetlenek!
páros t-próba
A benzin B benzin di különbség
11,5 10,3 1,2
12,3 9,8 2,5
10,2 11,4 -1,2
11,7 10,1 1,6
10,8 10,7 0,1
51
H0: A=B (d=)
H1: A>B (d>)
n=5 84,05
1,06,12,15,22,1
d
43,14
)84,01,0(...)84,05,2()84,02,1( 222
ds
DF=4 α=5% tkrit=2,13
3135,15/43,1
84,0
/
ns
dt
d
sz
H0-t elfogadjuk 95%-os megbízhatósági szinten, vagyis a két márka között nincsen
különbség.
2. Egy szárazelemeket gyártó vállalatnál megvizsgálták egy új típusú elemfajta
élettartamát. A korábbi elemek élettartama 299 óra volt. Véletlen mintavétellel
kiválasztva 200 új elemet, az átlagos élettartamuk 300 óra volt, 8óra szórással. Valóban
megnőtt az elemek élettartama?
Megoldás:
Bár σ nem ismert, de n>30 egymintás z-próba
H0: =299h
H1: >299h
α=1% zα=2,33
n=200 hx 300 s*=8h
200/8
299300szz 1,77
Mivel zsz<zα, ezért H0-t elfogadjuk 99%-os megbízhatósági szinten, azaz nem nőtt meg az
elemek élettartama.
3. Egy betongyárban 4 cementgyárból (A, B, C, D) vásárolnak cementet. A cement
minőségét próbakockák gyártásával ellenőrzik. A beérkező „500-as cement”
szállítmányokból mintát véve a próbakockák nyomószilárdság adatai [kg/cm2-ben] az
alábbiak
A szállító: 512, 716, 668, 726, 580
B szállító: 516, 664, 614, 586, 590
C szállító: 542, 684, 722, 600, 642
D szállító: 566, 744, 546, 610, 672.
Van-e különbség a szállítók között?
52
Megoldás:
Varianciaanalízis, előtte Cohran-próba (!)
H0: A=B=D=C
H1: legalább egy eltér
α=5%
n=5 f(DF)=4 r=4 gkrit=0,63
n átlag s*
A 5 640,4 92,112
B 5 594,0 53,535
C 5 638,0 70,442
D 5 627,6 81,061
gszámított= 37,0061,81442,70535,53112,92
112,92
... 2222
2
22
2
2
1
2
max
rsss
sg
H0-t 95%-os megbízhatósági szinten elfogadjuk. Mehetünk tovább a varianciaanalízisre.
H0: A=B=C=D
H1: legalább egy eltér
Négyzetösszeg
neve
Négyzet-
összegek
Szabad-
ságfok
Szórás
becslése
F érték p-érték
Csoportok
közötti *
r
i
ii xxn1
2
r-1 sk2 sk
2/sb
2 p
Csoporton
belüli **
r
i
n
j
iij
i
xx1 1
2 n-r sb2 - -
Teljes
r
1i
n
1j
2
ij
i
xx
n-1 - - -
A csoportok közötti négyzetösszeg kiszámításához szükség van a főátlagra, ezt pedig a
részátlagok segítségével könnyen előállítható, de súlyozni kell:
62520
6,6275638559454,6405
x
A csoportok közötti négyzetösszeg:
25,6872)6257,627(5)625638(5)625594(5)6254,640(5 2222
1
2
r
i
ii xxn
A csoportokon belüli négyzetösszegek az egyes csoportokhoz tartozó szórások segítségével
könnyen számítható, a szórás képlete:
53
1
)( 2
1
n
xx
s
n
j
iij
, a feladatunk, hogy a gyök alatt lévő tört számlálóját előállítsuk minden
csoport esetében a már kiszámolt szórások segítségével )1()(22
1
nsxxn
j
iij
A beszállító csoporton belüli négyzetösszege így: 33938,5
B beszállító: 11464
C beszállító: 19848,3
D beszállító: 26283,5
Ez összesen: 91534,3
Minden rendelkezésre áll a táblázatunkhoz, és a végső próba elvégzéséhez:
Négyzetösszeg
neve
Négyzet-
összegek
Szabad-
ságfok
Szórás
becslése
F érték p-érték
Csoportok
közötti *
6872,25 4-1=3 sk2=2290,75 sk
2/sb
2=
0,4
p
Csoporton
belüli **
91534,3 20-4=16 sb2=5720,9 - -
Teljes 98406,55 20-1=19 - - -
α=5% DFszámláló=3 DFnevező=16 Fkrit=3,24
Mivel Fsz=0,4<Fkrit=3,24 H0-t elfogadjuk 95%-os megbízhatósági szinten, azaz a
beszállítóktól származó próbakockák minősége (nyomószilárdsági adatai) között nincs
különbség.
4. Kétféle oldat (A és B) pH értékét szeretnénk összehasonlítani. Hatelemű mintát
elemezve az A oldatból 7,52-es átlagos pH értéket kaptunk 0,024 szórással. Ötelemű
minta alapján a B oldat átlagos pH értéke 7,49 volt 0,032 szórással. Vizsgálja meg, hogy
van-e különbség a két oldat pH értékében!
Megoldás:
Kétmintás t-próba, amely előtt F-próbát kell végeznünk:
H0: A=B
H1: A<B
α=5% DFszámláló=4 DFnevező=5 Fkrit=5,19
78,1024,0
032,02
2
számF
H0-t 95%-os megbízhatósági szinten elfogadjuk, rátérhetünk a t-próbára:
54
H0: A=B
H1: AB
=0,05 DF=6+5-2=9 t/2=2,26
0007751,0265
032,04024,05
2
)1()1( 22
21
2*
22
2*
112
nn
snsnsp
78,10002842,0
03,0
)5
1
6
1(0007751,0
49,752,7
1121
2
21
nns
xxt
p
sz
H0-t 95%-os megbízhatósági szinten elfogadjuk, azaz nincs különbség a két oldat pH értéke
között.
5. Egy fővárosi kerületben a 2000 májusában házasságot kötő párok közül véletlenszerűen
kiválasztottak 12 párt, és a párok mindkét tagját külön-külön megkérdezték, hogy hány
gyermeket terveznek. Az eredmények a következők (a tervezett gyermekek száma a 12
házaspárnál):
Házaspár
sorszáma
1 2 3 4 5 6 7 8 9 10 11 12
Feleség 4 2 2 2 0 1 2 3 2 5 2 1
Férj 3 2 3 2 1 0 2 1 0 3 3 0
Vizsgáljuk meg, hogy 5%-os szignifikancia szinten van-e különbség a feleség és a férj
által tervezett gyerekszám között!
Megoldás:
Kétmintás, páros t-próba Képezzük páronként a különbségeket:
Házaspár
sorszáma
1 2 3 4 5 6 7 8 9 10 11 12
Feleség 4 2 2 2 0 1 2 3 2 5 2 1
Férj 3 2 3 2 1 0 2 1 0 3 3 0
di 1 0 -1 0 -1 1 0 2 2 2 -1 1
H0: μférj=μfeleség (μd=0)
H1: μférj<μfeleség (μd>0)
A különbségek átlaga, és szórása:
5,012
6
12
1...101
d
167,111
)5,01(...)5,00()5,01( 222
ds
DF=11 α=5% tkrit=1,796
55
48,112/167,1
5,0
/
ns
dt
d
sz
H0-t elfogadjuk 95%-os megbízhatósági szinten, azaz nincs különbség a férj és a feleség által
vállalni kívánt gyerekszám között.
6. Az előző példában szereplő hőmérsékletszabályozók minősítésével kapcsolatos
vizsgálatokat a gyártó és vevő jelenlétében vett véletlen mintákon végezték, és a
méréseket mindkét műszeren azonos személy – a KERMI egy szakembere – végezte. A
vizsgálatsorozat első tíz műszerén végzett mérésének tényleges eredményei az alábbiak
voltak (Gy: a gyártó műszerén, M: a megrendelő műszerén mért értékeket mutatja):
1 2 3 4 5 6 7 8 9 10
Gy 119,7 117,4 121,0 118,8 122,4 119,0 117,8 118,9 122,7 119,8
M 120,9 119,8 122,4 120,1 123,4 123,6 119,1 118,9 124,5 120,6
Van-e szignifikáns eltérés a két méréssorozat eredményei között 1%-os szignifikancia
szinten?
Megoldás:
A minta páros, ugyanis a méréseket mindkét műszeren azonos személy végezte.
Képezzük a di különbségeket:
1 2 3 4 5 6 7 8 9 10
Gy 119,7 117,4 121,0 118,8 122,4 119,0 117,8 118,9 122,7 119,8
M 120,9 119,8 122,4 120,1 123,4 123,6 119,1 118,9 124,5 120,6
dm-gy 1,2 2,4 1,4 1,3 1 4,6 1,3 0 1,8 0,8
H0: )0( dmgy
H1: )0( dmgy
A különbségek átlaga és szórása:
58,110
8,15
10
8,0....4,14,22,1
d
23,19
)58,18,0(...)58,14,2()58,12,1( 222
ds
DF=9 α=1% tkrit=2,821
06,410/23,1
58,1
/
ns
dt
d
sz
Mivel tsz>tkrit, ezért H0-t 99%-os megbízhatósági szinten elutasítjuk, vagyis van szignifikáns
eltérés a két méréssorozat eredményei között.
56
7. Egy automata gépsor által töltött dobozokból 10 elemű mintát veszünk. A mintába
került 10 doboz grammban kifejezett töltősúlya a következő: 255g, 242g, 245g, 253g,
249g, 251g, 250g, 255g, 245g, 246g.
Ellenőrizzük, hogy a gépsor teljesíti-e a 250g várható értékű specifikációt 1%-os
szignifikancia szinten!
Megoldás:
egymintás t-próba, n<30
H0: μ=250
H1: μ≠250
0
995,02/
222
25,363,025,3
25,3
63,010/51,4
2501,249
/
51,49
9,182
110
)1,249246(...)1,249242()1,249255(
1,24910
2491
10
246245...242255
Hmivel
ttt
ns
xt
s
x
kr
sz
Azaz 1%-os szignifikancia szinten a gépsor teljesíti a 250g várható értékű specifikációt.
8. Két iskolában (A és B) a tanulók intelligencia szintjét hasonlítják össze. Mindkét
iskolából 25-25 fős véletlen mintát vettek. A két minta adataiból a számítások
eredményei:
4,13
112
18
117
B
B
A
A
s
x
s
x
Vizsgáljuk meg 1%-os szignifikancia szinten, hogy van-e eltérés a két iskola tanulóinak
intelligencia szintje között!
Megoldás:
1. F-próba
0
2
2
2
2
1
0
66,2
804,14,13
18
:
:
HFF
F
s
sF
H
H
krsz
kr
B
Asz
BA
BA
57
2. kétmintás t-próba
0
2
222
1
0
403,2
114,1142,20
5
)25
1
25
1(78,251
112117
)11
(
78,25148
4,13241824
:
:
Htt
tt
nns
xxt
s
H
H
krsz
kr
BA
p
BAsz
p
BA
BA
1%-os szignifikancia szinten nincs eltérés a két iskola tanulóinak intelligencia szintje között.
9. Egy konzervgyárban két automata tölt lekvárt 0,5 literes üvegekbe. A gyártásközi
ellenőrzés során véletlen mintát vettek mindkét gépről. A mintákra vonatkozó
eredmények:
Gép Mintaelem-szám Átlagos töltési
mennyiség, ml
Töltési tömeg
szórása, ml
I. 32 503 8,2
II. 37 495 7,6
Döntse el 5%-os szignifikancia szinten, hogy tekinthető-e azonosnak a két gépen a töltési
tömeg szórása és átlaga!
Megoldás:
a) szórások egyezőségének vizsgálata: F-próba
0
2
2
2
2
1
0
79,1
164,16,7
2,8
:
:
HFF
F
s
sF
H
H
krsz
kr
B
Asz
BA
BA
A két gépen a töltési tömeg szórása azonosnak tekinthető 5%-os szignifikancia szinten.
b) átlagok egyezőségének vizsgálata: kétmintás z-próba, mivel nA, nB >30
58
1
2222
1
0
64,195,0)(%5
188,456,11,2
8
37
6,7
32
2,8
495503
:
:
Hzz
zz
nn
xxz
H
H
krsz
kr
B
B
A
A
BAsz
BA
BA
1
1
0
96,1
96,1975,0)(025,02/%5
188,4
:
:
:_
Hz
zz
z
H
H
megoldásMásik
sz
kr
sz
BA
BA
A két gépen a töltési tömeg átlaga nem tekinthető azonosnak 5%-os szignifikancia szinten.
11. Egy kutatás során azt vizsgálták, hogy az üzleti környezetet hogyan ítélik meg az egyes
vállalkozások vezetői. A kérdőíves vizsgálat során a vállalkozások mérete alapján 3
csoportba (A, B, C) sorolták a megkérdezett vezetőket, akik válaszait egy 100 pontos
skálán értékelték. Az értékelési skálán kapott pontszámok normális eloszlásúnak
tekinthetők.
A vizsgálat során mindhárom kategóriában 8 vállalkozást kérdeztek meg.
Vállalkozás méret A. Kis- és
mikrovállalkozások
B. Közepes vállalatok C. Nagyvállalatok
45 63 62
39 66 65
52 61 61
43 68 74
51 72 69
43 64 66
47 58 70
48 60 69
Átlag 46 64 67
Korrigált tap. szórás 4,375 4,567 4,342
Vizsgálja meg, hogy a vállalatméret szerinti csoportok között van-e eltérés a kapott
pontszámok között!
Megoldás:
A példa kérdése az átlagpontszámok összevetésére irányul. Több mintáról, illetve mintán
belüli csoportokról van szó, így a várható érték összehasonlítása egyszeres osztályozású
variancia-analízissel végezhető el. A variancia, mint próba elvégzéséhez előfeltétel, a vizsgált
jellemző normalitása, valamint az alapsokasági szórások egyezősége. Az előbbi feltételről
szól a példa, az utóbbiról nem. Ezért a variancia-analízis elvégzése előtt a szórások egyezését
59
is vizsgálni szükséges. Ehhez Cohran-próbát választhatunk, mivel a csoportokon belül a
mintaelemek száma azonos.
A példa megadta a csoportok átlagát és szórását, így azokat nem kell most kiszámolni.
Cohran-próba
H0: a szórások nem különböznek
H1: a legnagyobb szórás (2. részminta, a B csoport) különbözik a többitől
=0,05 DF=n-1=8-1=7
r=3 gkr=0,68
smax*2=20,857
gs
s s sr
max
...
2
12
22 2
gsz=20,857/(19,143+20,857+18,857) =0,354
A számított g érték kisebb, mint a kritikus érték, így 5%-os szignifikancia szinten elfogadjuk
H0-t, vagyis az alapsokasági szórások megegyezőeknek tekinthetők.
Variancia-analízis:
H0: A=B =C
H1: legalább az egyik várható érték eltér a többitől
A főátlag: 59 pont
Belső szórás:
r
i
n
j
iij
i
xx1 1
2
Ennek kiszámítását most a csoportok megadott szórásainak „visszafejtésével”
végezzük el.
4124,342 4,567 4,3757)18()18()18( 2222*2*2* CBA sssSSB
sb2= 412/(24-3) = 19,619
Külső szórás:
r
i
ii xxn1
2
2064)5967(8)5964(8)5946(8 222 SSK
sk2= 2064/(3-1)= 1032
Az Fsz számított értéke:
Fsz = sk2/sb
2 = 52,6
Az F eloszlás szerinti kritikus érték meghatározása:
=0,05 A számláló szabadságfoka: 3-1=2
A nevező szabadságfoka: 24-3=21
60
A kritikus érték: Fkr=3,47
Döntés:
Mivel Fsz>>Fkr, a H0 nullhipotézist 5%-os szignifikancia szinten elutasítjuk, azaz az átlagok
ill. legalább egy átlag szignifikánsan különbözik a többitől. (Itt ez értelemszerűen a kis- és
mikrovállalkozások csoportja.) Vagyis az üzleti környezet megítélése a különböző méretű
vállalkozások vezetői körében eltérőnek tekinthető.
Paraméteres és nemparaméteres feladatok
1. Véletlenszerűen kiválasztott 120 db mikrohullámú sütő élettartam szerinti megoszlását
mutatja a következő táblázat:
Élettartam, év db
-5 8
5-6 28
6-7 44
7-8 25
8- 15
Összesen 120
A mintából számított jellemzők:
évs
évx
67,0
36,6
a) 5%-os szignifikancia szinten ellenőrizze azt az állítást, hogy mikrohullámú sütők
élettartama normális eloszlást követ!
b) Teljesül-e 5%-os szignifikancia szinten az a minőségi előírás, hogy az élettartam
átlaga meg kell, hogy haladja a 6 évet!
Megoldás:
a) Illeszkedésvizsgálat
H0: a mikrohullámú sütők élettartama N(6,36; 0,67) eloszlást követ
H1: a mikrohullámú sütők élettartama nem N(6,36; 0,67) eloszlást követ
Élettartam, év fi pi Fi χszám2
-5 8 0,022 2,64 10,88
5-6 28 0,2725 32,7 0,67
6-7 44 0,5344 64,13 6,31
7-8 25 0,1637 19,64 1,45
8- 15 0,0073 0,876 227,7
Összesen 120 1 120 247,1
61
%73,00073,0992656,01)8(1)8(1)8(
%37,161637,0828944,0992656,0
828944,0)44,2(828944,0)67,0
36,68()7()8()87(
%44,535344,02945,0828944,0
2945,0)95,0(2945,0)67,0
36,67()6()7()76(
%25,272725,0022,0705401,01022,0)54,0(1022,0)54,0(
022,0)67,0
36,66(022,0)6()5()6()65(
%2,2022,0
978,01)03,2(1)03,2()67,0
36,65()5()5(
FPP
FFP
FFP
FFFP
FP
1
22
2
22
1
22
21251
991,5
01,2477,22745,131,67,32
)7,3228(
64,2
)64,28()(
H
lrDF
F
Ff
krszám
kr
n
i i
iiszám
A mikrohullámú sütők élettartama 5%-os szignifikancia szinten nem N(6,36; 0,67) eloszlású.
b) PARAMÉTERES! egymintás z-próba, mert n>30
1
1
0
64,1
64,195,0)(
%5
9,5
120
67,0
636,6
6:
6:
Hz
zz
zz
n
s
xz
H
H
sz
kr
kr
sz
5%-os szignifikancia szinten az élettartam átlaga meghaladja a 6 évet.
62
2. Egy sörgyártó vállalatnál a sör névleges térfogata 500ml kell, hogy legyen, és a térfogat
szórása legfeljebb 10ml lehet. Egy 100 elemű véletlen mintából ellenőrzik a
szállítmányt. A minta adatai a következők:
Térfogat, ml db
-480 5
480-490 20
490-500 30
500-510 24
510-520 16
520- 5
Összesen 100
A mintából számított jellemzők:
mls
mlx
6,12
1,499
a) 5%-os szignifikancia szinten tesztelje azt a hipotézist, hogy a betöltött sör térfogat
szerinti eloszlása normálisnak tekinthető!
b) A minta alapján ellenőrizze az átlagos töltősúlyra vonatkozó hipotézis teljesülését!
Megoldás:
a) Illeszkedésvizsgálat
H0: a sör névleges térfogata N(499,1; 12,6) eloszlást követ
H1: a sör névleges térfogata nem N(499,1; 12,6) eloszlást követ
Térfogat,
ml
fi pi Fi χszám2
-480 5 0,0643 6,43 0,318
480-490 20 0,1715 17,15 0,474
490-500 30 0,29227 29,22 0,021
500-510 24 0,2772 27,72 0,5
510-520 16 0,1464 14,64 0,126
520- 5 0,0485 4,85 0,00464
Összesen 100 1 100
Ahol f a tapasztalati gyakoriság, F pedig az elméleti gyakoriság (Fi=pi·Σfi).
63
%85,4048457,0951543,01)520(1)520(1)520(
%64,1414644,0805105,0951543,0
805105,0)66,1(805105,0)6,12
1,499520()510()520()520510(
%72,27277205,05279,0805105,0
5279,0)86,0(5279,0)6,12
1,499510()500()510()510500(
%22,292922,0235763,05279,0
235763,0)07,0(235763,0)6,12
1,499500()490()500()500490(
%15,171715,00643,0235763,00643,0)764237,01(0643,0)72,0(10643,0)72,0(
0643,0)6,12
1,499490(0643,0)490()480()490()490480(
%43,60643,0
935745,01)52,1(1)52,1()6,12
1,499480()480()480(
FPP
FFP
FFP
FFP
FFFP
FP
0
22
2
22
1
22
31261
815,7
444,100464,0126,05,0021,015,17
)15,1720(
43,6
)43,65()(
H
lrDF
F
Ff
krszám
kr
n
i i
iiszám
5%-os szignifikancia szinten a sör névleges térfogata N(499,1; 12,6) eloszlást követ.
b) PARAMÉTERES! egymintás z-próba, mert n>30
0
2/
1
0
96,1714,096,1
96,1)975,0(
%5
714,0
100
6,12
5001,499
500:
500:
Hzzz
zzz
n
s
xz
H
H
krszkr
krkr
sz
5%-os szignifikancia szinten az átlagos töltési térfogat 500ml.
(Megjegyzés: az ellenhipotézis lehetne μ<500 is, mivel a minta alapján az átlag 499,1.)
64
VIII. Korreláció- és regresszióelemzés, idősorelemzés
Idősorok elemzése
1. Vendégek számának alakulása egy sportcentrumban:
Év Negyedév Látogatók
száma (ezer fő)
1996 I. 42
II. 68
III. 142
IV. 88
1997 I. 46
II. 74
III. 142
IV. 76
1998 I. 54
II. 76
III. 144
IV. 70
1999 I. 54
II. 82
III. 150
IV. 76
2000 I. 52
II. 86
III. 156
IV. 80
Ábrázolja az idősor adatait!
Számítsa ki és ábrázolja a mozgóátlagolású trend értékeit!
Számítsa ki a szezonalitást jellemző mutatószámokat!
Megoldás:
Az adatokat ábrázolva látható, hogy szezonális ingadozás található az adatsorban. Jellemzően
a III. negyedévekben több látogató jön a sportcentrumban. Az eltérések kb. azonos
nagyságúak, így célszerű az additív modellt választani.
0
50
100
150
200
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
65
Mivel negyedéves adatok ismétlődnek az adatsorban, 4 tagú mozgóátlagokat képzünk a
szezonális ingadozások „kisimítására”. A centírozott mozgóátlagokat az alábbi táblázat
tartalmazza (példaként az első mozgóátlag értéke: (0,5·42+68+142+88+0,5·46)/4 = 85,5):
N.év. yi cMA(4) yi-cMA(4)
I. 42
II. 68
III. 142 85,5 56,5
IV. 88 86,75 1,25
I. 46 87,5 -41,5
II. 74 86 -12
III. 142 85,5 56,5
IV. 76 86,75 -10,75
I. 54 87,25 -33,25
II. 76 86,75 -10,75
III. 144 86 58
IV. 70 86,75 -16,75
I. 54 88,25 -34,25
II. 82 89,75 -7,75
III. 150 90,25 59,75
IV. 76 90,5 -14,5
I. 52 91,75 -39,75
II. 86 93 -7
III. 156
IV. 80
A mozgóátlagok enyhén emelkedő alapirányzatot mutatnak.
A szezonális eltérések meghatározására képezzük a trend, azaz a mozgóátlagok, és a
megfigyelt adatok különbségét. (Táblázat utolsó oszlopa.)
Az egyes negyedévekben az átlagos eltérés a trendtől (sI = (-41,5 - 33,25 – 34,25 – 39,75)/4 =
-37,1875, ami azt jelenti, hogy az első negyedévben átlagosan 37.187,5 látogatóval kevesebb
szokott jönni)
I. -37,1875
II. -9,375
III. 57,6875
IV. -10,1875
Korrekciós tényező 0,234375
Korrigált szezonális eltérés:
I. -37,421875
II. -9,609375
III. 57,453125
IV. -10,421875
66
Az egyes negyedévek szezonális eltéseinek átlaga 0,2344, ami 0-tól nagyobb, ezért ezzel az
értékkel korrigáljuk a szezonindexeket. Az így kapott szezonális eltéréseket használhatjuk a
szezonális ingadozások jellemzésére.
2. Egy kereskedelmi vállalat forgalmának alakulása (mFt):
Negyedév Év
1998 1999 2000
I. 16 20 22
II. 18 24 28
III. 22 30 36
IV: 27 40 53
Ábrázolja az idősor adatait!
Számítsa ki és ábrázolja a mozgóátlagolású trend értékeit!
Számítsa ki a szezonalitást jellemző mutatószámokat!
Megoldás:
Az adatokat ábrázolva látható, hogy szezonális ingadozás található az adatsorban. Jellemzően
a IV. negyedévekben a legnagyobb a forgalom, majd az első negyedévben jelentősen
visszaesik. Az eltérések azonban egyre növekvő mértékűek az idő előrehaladásával, ezért
célszerű a multiplikatív modellt használni.
0
10
20
30
40
50
60
1 2 3 4 5 6 7 8 9 10 11 12
A mozgóátlagok enyhén emelkedő alapirányzatot mutatnak.
A szezonindexek meghatározására képezzük a trend, azaz a mozgóátlagok, és a megfigyelt
adatok hányadosát. (Táblázat utolsó oszlopa.)
Az egyes negyedévekben az eltérés a trendtől az alábbi táblázatban található.
Például sI = (0,8247+0,7154)/2 =0,77005, ami azt jelenti, hogy az első negyedév forgalma
77%-a az átlagos értéknek. (Megjegyezzük, hogy néhány szakirodalom a szezonális eltérések
kiszámolására multiplikatív modellnél a mértani átlagot javasolja, de a tárgy keretében a
számtani átlaggal történő számolást alkalmazzuk.)
67
Ssz. yi cMA(4) yi/yátl.
I 16
II 18
III 22 21,25 1,0353
IV 27 22,5 1,2
I 20 24,25 0,8247
II 24 26,875 0,8930
III 30 28,75 1,0435
IV 40 29,5 1,3559
I 22 30,75 0,7154
II 28 33,125 0,8453
III 36
IV 53
sI 0,77005
sII 0,86915
sIII 1,03940
sIV 1,27795
Átl.: 0,9891
Korrigált szezonindexek:
sI 0,7785
sII 0,8787
sIII 1,0508
sIV 1,2920
Az egyes negyedévek szezonindexeinek átlaga 0,9891, ami 1-től eltérő, ezért ezzel az értékkel
korrigáljuk a nyers szezonindexeket. Az így kapott szezonindexeket használhatjuk a
szezonális ingadozások jellemzésére.
68
Kétváltozós lineáris korreláció- és regresszióelemzés
1. Egy 10 elemű minta alapján vizsgálták a Suzuki Sedan 1.3GL típusú gépkocsik életkora
és eladási ára közötti kapcsolatot.
Életkor (év) 3 1 6 4 4 5 0 1 7 2
Eladási ár (ezer Ft) 1720 1800 1350 1600 1500 1550 2000 1750 1300 1700
Határozza meg a két ismérv kapcsolatát leíró lineáris regressziófüggvényt!
Számítsa ki a kovarianciát, a lineáris korrelációs együtthatót, a regresszióbecslés
relatív hibáját!
Tesztelje a regressziófüggvényt 5%-os szignifikanciaszinten!
Becsülje meg a 8 éves gépkocsik eladási árát 95%-os megbízhatósági szinten!
Megoldás:
A minta adatait az alábbi táblázat segítségével dolgozzuk fel. A számítások lépései és további
részletei a táblázat után találhatóak.
xi yi ixd
iyd ii yx dd 2
ixd 2
iyd iy ii yy ˆ ei2
3 1720 -0,3 93 -27,9 0,09 8649 1653,4 66,58 4432,9
1 1800 -2,3 173 -397,9 5,29 29929 1829,3 -29,34 860,8
6 1350 2,7 -277 -747,9 7,29 76729 1389,5 -39,54 1563,4
4 1600 0,7 -27 -18,9 0,49 729 1565,5 34,54 1193,0
4 1500 0,7 -127 -88,9 0,49 16129 1565,5 -65,46 4285,0
5 1550 1,7 -77 -130,9 2,89 5929 1477,5 72,50 5256,3
0 2000 -3,3 373 -1230,9 10,89 139129 1917,3 82,70 6839,3
1 1750 -2,3 123 -282,9 5,29 15129 1829,3 -79,34 6294,8
7 1300 3,7 -327 -1209,9 13,69 106929 1301,6 -1,58 2,5
2 1700 -1,3 73 -94,9 1,69 5329 1741,4 -41,38 1712,3
Össz. 33 16270 0 0 -4231 48,1 404610 -0,32 32440
A kétváltozós kapcsolatban értelemszerűen az eladási árat tekintsük függő változónak,
amelyet a gépkocsi életkorával kívánunk magyarázni. A szokásos jelölésrendszer alapján a
gépkocsi évben kifejezett életkorát jelöljük x változónak, az eladási ára y változónak. A fenti
táblázatban a megadott minta adatait az első két oszlopban tüntetjük fel, majd azok utolsó
sorban történt összegzésüket követően kiszámoljuk az átlagokat:
n=10 x 33 x 3,3
y 16270 y 1627
Az átlagok felhasználásával számíthatjuk a ixd és
iyd eltéréseket, azok szorzatait (ii yx dd ) és
négyzeteit. (2
ixd , 2
iyd ). Ez utóbbiak legalsó sorban történő összegzésével a yxdd , 2
xd ,
2
yd mennyiségeket kapjuk meg. Ezek olyan mellékszámítások, melyek a továbbiakban
69
számított jellemzők könnyebb kalkulációját segítik elő. Elsőként a regressziós egyenes
paramétereit határozzuk meg:
2
1
2
11
x
yx
n
i
x
n
i
yx
d
dd
d
dd
b
i
ii
= -4231/48,1 = -87,96
A b1 regressziós paraméter (a regressziós egyenes meredeksége) megmutatja, hogy a
magyarázó változó egységnyi változása mekkora változást okoz az eredményváltozóban. Ez
ebben a példában azt jelenti, hogy az egy évvel idősebb személygépkocsik várhatóan 87 960
forinttal lesznek olcsóbbak.
10 bxyb = 1627+87,96*3,3 = 1917,3
A b0 paraméter (vagy tengelymetszet paraméter) azt mutatja meg, hogy az x=0 pontban
mekkora a regressziós egyenes értéke, vagyis milyen magasan metszi a regressziós egyenes a
koordináta rendszer függőleges (y) tengelyét. A b0 paraméternek csak akkor van gyakorlatban
értelme, ha a regressziós egyenest az x=0 pont körül értelmezhetjük. Ebben a példában ennek
van értelme. A b0 azt fejezi ki, hogy a nulla éves (x=0) korú gépkocsik ára a regressziós
modellünk szerint 1917,3 ezer forint.
Ezek alapján felírhatjuk a regressziós becslőfüggvényt:
xy 96,873,1917ˆ
A regressziós becslőfüggvény alapján elkészíthető a táblázat utolsó három oszlopa. Ezek
közül az első a regressziós becslőfüggvénynek az egyes xi értékhez tartózó becsléseit
tartalmazza. A második oszlopban a tényleges yi értékek és azok becslései közötti eltérést,
vagyis a maradékváltozó értékeit, a reziduumot számítjuk. ( iii yye ˆ ) Az utolsó oszlopban
pedig a reziduumok négyzete szerepel. ( 2
ie )
Kovariancia számítása:
n
dd
n
dd
yxyx
n
i
yx ii 1),cov( = -423,1
A kovariancia a két vizsgált változó együttmozgását számszerűsíti. A gépkocsik életkora és
eladási ára közötti kovariancia -423,1. Ennek előjele negatív, ami azt jelenti, hogy a két
változó ellentétes mozgású.
A lineáris korrelációs együttható számítása:
70
22)var()var(
),cov(
yx
yx
xy
dd
dd
yx
yxr
r = -4231/gyök(48,1*404610) = -0,959
A korreláció megmutatja a két változó közötti kapcsolat szorosságát. Mivel a számított
korreláció -1 közelében van, megállapítható, hogy egy elég erős ellentétes irányú kapcsolat
van a gépkocsik kora és eladási ára között.
A regresszióbecslés relatív hibáját két lépésben határozhatjuk meg. Először a regressziós
becslés hibáját (az u.n. standard hibát) határozzuk meg ( es ), majd abból relatív szórást
képezve kapjuk meg a regressziós becslés relatív hibáját.
2
1
2
n
e
s
n
i
i
e = 63,68 eFt
A regressziós becslés hibája ( es ) azt mutatja meg, hogy az y változó egyes értékei átlagosan
mennyire ingadoznak a minta alapján elkészített regressziós becslésekhez képest.
y
sV e
e 0,039
A regresszió-becslés relatív hibája szintén a regressziós becslés hibáját adja meg, de az y
változó átlagos értékéhez viszonyítottan.
A regressziós együttható tesztelése során azt vizsgáljuk egy t-próba segítségével, hogy a
mintából számított b1 regressziós paraméter érteke szignifikánsan különbözik-e nullától.
Ugyanis ha a nullától nem különbözik, vagyis elképzelhető, hogy mintavételi hiba folytán
kaptunk nullától különböző értéket, akkor a két változó között nincs kapcsolat. Ez azt
jelentené, hogy regressziós modellünknek nincs értelme.
0: 10 H
0: 11 H
A próbafüggvény
11
11 0
bb
szs
b
s
bt
módon írható fel, amely igaz nullhipotézis
esetén 2 nDF szabadságfokú t (Student) eloszlást követ.
Amennyiben a t-próba számított értéke az elutasítási tartományba esik, vagyis a H1 alternatív
hipotézist fogadjuk el, úgy valós lineáris regressziós összefüggést tételezhetünk fel a
gépjárművek életkora és az eladási áruk között.
A b1 regressziós együttható standard hibája (1bs ) a következőképpen számítható ki:
n
i
x
eb
d
ss
1
2
11
= 9,18
71
82102 nDF
%5
A hipotézisvizsgálatot kétoldali módon végezzük el:
31,2)8()( 975,02/1 DFtDFttkrit
11
11 0
bb
szs
b
s
bt
= -87,96/9,18 = -9,58 <-2,31
H0-t elutasítjuk. A regressziófüggvény b1 együtthatója különbözik nullától. A gépkocsik
életkora és az áruk között összefüggés van.
A 8 éves gépkocsik eladási árának becslése:
Először készítsük el a regressziós becslőfüggvény segítségével a 8 éves gépkocsik árának
pontbecslését.
6,1213896,873,191796,873,1917ˆ xy
A feladat szerint azonban 95 %-os megbízhatóságú intervallumbecslést kell készíteni a 8 éves
gépkocsik árára. Ez azt jelenti, hogy a 8 éves gépkocsik átlagos árát szeretnénk megtudni. Az
intervallum közepét az előbb számított pontbecslés adja, a konfidenciaintervallumot az Y
változó x=8 esetén becsülhető átlagos értékének standard hibájából a következőképpen
számoljuk:
62,47
1,48
09,22
10
168,63
1,48
)3,38(
10
168,63
1 2
ˆ2
2
ˆ 8*
y
x
iey s
d
xx
nss
2ˆˆ
21
nDFsty y
1106,121362,4731,26,1213
6,13238ˆ6,1103 xyM
A 8 éves gépkocsik árának várható értéke 1103,6 és 1323,6 ezer forint között van 95%-os
megbízhatósággal.│
Amennyiben a példa szövegét úgy értelmezzük, hogy egy konkrét 8 éves gépjármű korát
szeretnénk megbecsülni, akkor a Y változó x=8 helyen vett standard hibáját egyedi értékekre
a következők szerint számítjuk:
52,79
1,48
09,22
10
1168,63
11
8*ˆ2
2
ˆ
Y
x
ieY
sd
xx
nss
Az egyedi értékekre vonatkozó konfidencia-intervallumot az előbbihez hasonlóan számoljuk a
most számított standard hiba felhasználásával:
2ˆ ˆ
21
nDFstyY
72
7,1836,121352,7931,26,1213
13971030 8 Y
Egy 8 éves gépkocsi ára 95%-os megbízhatósággal 1103,6 és 1323,6 ezer forint között
várható.
2. Kilenc kereskedelmi vállalatnál vizsgálták az árbevétel és az eredmény közötti
kapcsolatot.
Árbevétel (x) Eredmény (y)
millió Ft
440 12
469 14
518 14
644 21
750 25
890 35
999 44
1228 55
1262 50
Ismertek továbbá az alábbi részeredmények:
Részeredmények
yxdd 41118
2
xd 789850
2
yd 2188
2
ˆ yyi 47,5
2
yy 2188
a) Írja fel a lineáris regressziófüggvényt és értelmezze a b1 paramétert!
b) Határozza meg, hogy a bruttó árbevétel hány százalékban magyarázza az eredmény
szóródását!
c) Vizsgálja meg az eredmény árbevétel-rugalmasságát az átlagos szinten! Értelmezze az
eredményt!
d) Adjon konfidenciaintervallumot 95%-os megbízhatósági szinten az 1000 millió Ft-os
árbevételhez tartozó eredmény nagyságára!
e) Vizsgálja meg, hogy a regressziófüggvény szignifikáns-e!
73
Megoldás:
a) Regressziós egyenes paramétereinek kiszámítása
2
1
2
11
x
yx
n
i
x
n
i
yx
d
dd
d
dd
b
i
ii
10
bxyb
y=-11,65+0,052x
b) A determinációs együtthatót, az árbevétel magyarázó erejét az eredmény szóródásában
a következőképpen határozhatjuk meg:
2
y
2
e
2
y
2
y2
s
s1
s
sy,xr =
SST
SSE
SST
SSR1
n
i
i yySST1
2
n
i
i yySSR1
2ˆ
n
i
ii yySSE1
2ˆ
978,0
2188
5,471
ˆ
11
1
2
1
2
2
n
i
i
n
i
ii
yy
yy
SST
SSEr
Az eredmény szóródását 97,8 %-ban magyarázza az árbevétel.
A determinációs együtthatót kétváltozós lineáris regresszió esetén a korrelációs együttható
négyzeteként is számíthatjuk.
c) Az eredmény árbevétel szerinti rugalmasságát számoljuk x átlagos értéke mellett.
xbb
xb
y
xbxyEl
10
11
ˆ,ˆ
Az x -ot a regressziós becslőfüggvénybe helyettesítve esetén y értékét kapjuk
39,130
052,0800,ˆ 1
y
xbxyEl
x =800 y =30 b1= 0,052
Az eredmény rugalmassága az árbevétel szerint x =800 pont körül úgy alakul, hogy az
árbevétel 1 %-os változására az eredmény 1,39%-kal változik.
d) Az x=1000 millió forintos árbevételhez tartozó átlagos eredményt becsüljük 95%-os
konfidenciaszint mellett.
Pontbecslés y-ra: 35,401000052,065,11ˆ y mFt
74
t(DF=7 ; α=0,975)=2,36
605,229
5,47
2
1
2
n
e
s
n
i
i
e
0476,1
789850
)8001000(
9
1605,2
1 2
ˆ2
2
ˆ 1000*
y
x
iey s
d
xx
nss
37,877<Y(1000)<42,823
e)
H0: 1=0 H1: 10
tsz=0,052/0,0029=17,93 t(7 ; 0,975)=2,36
A regressziófüggvény szignifikáns.
3. Közlekedésbiztonsági kutatók méréseket végeztek arra, hogy mennyire lassítja az
alkohol a vezetők reakcióit. 10 ittas személy adatai láthatók az alábbi táblázatban.
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Átlag
Véralkohol szint ‰ 4,5 4,8 5,1 3,2 1,1 0,8 6,7 5,2 4,4 5,0 4,08
Reakció idő (sec.) 2 2,2 2,4 1,7 1,0 1,3 3,0 2,7 1,4 3,1 2,08
A következő adatok ismeretesek:
yxdd= 10,316
2
yd 4,776 2
xd 31,216
2
ie= 1,3669
es 0,4133 )8(975,0 DFt
2,306
Kérdések:
a) Határozza meg a közötti kétváltozós kapcsolat lineáris korrelációs együtthatóját!
b) Határozza meg és értelmezze a kétváltozós modell determinációs együtthatóját!
c) Írja fel a véralkoholszint és a reakcióidő közötti lineáris regressziós egyenes egyenletét!
d) Készítsen intervallumbecslést a regressziós meredekségre 95%-os megbízhatósági szint
mellett.
Megoldás:
a)
22
yx
yx
xy
dd
ddr xyr 0,84487
b) R2=0,84487
2=0,7138
A determinációs együttható értéke: 0,7138
A reakcióidő szóródását a véralkoholszint 71,38 %-ban magyarázza.
c) Határozzuk meg a regressziós paramétereket:
75
2
1
2
11
x
yx
n
i
x
n
i
yx
d
dd
d
dd
b
i
ii
10
bxyb
Az Y és X közötti lineáris regressziós egyenes egyenlete: 0,7316833047,0ˆ xy
d) b1=0,33047 a regressziós paraméter pontbecslése
t(DF=8 ; α=0,975)=2,306
2
1
2
n
e
s
n
i
i
e
n
i
x
eb
d
ss
1
2
11
=0,0739
Intervallumbecslés a 1b együtthatóra 95%-os megbízhatósági szint mellett:
17058,033047,00,0739306,233047,0
76
IX. Felhasznált irodalmak
Denkinger Géza: Valószínűségszámítási gyakorlatok, Tankönyvkiadó, Budapest,
1977
Szabó Gábor Csaba – Szűts István: Matematikai statisztika példatár I-II.,
Tankönyvkiadó, Budapest, 1987.
Solt György: Valószínűségszámítás. Műszaki Könyvkiadó, Budapest, 1973
Ay János – Kupcsik József: Általános statisztika példatár. Közgazdasági és Jogi
Könyvkiadó, Budapest, 1961
Juhász Györgyné – Sándorné Kriszt Éva: Statisztika II. távoktatással (főiskolai
jegyzet). Távoktatási Universitas Alapítvány, 2002
Hunyadi László – Vita László: Statisztika közgazdászoknak. Központi Statisztikai
Hivatal, Budapest, 2002
Kerékgyártó Györgyné – Mundruczó György – Sugár András: Statisztikai
módszerek és alkalmazásuk a gazdasági, üzleti elemzésekben. Aula kiadó,
Budapest, 2001