Upload
isti93
View
207
Download
3
Embed Size (px)
DESCRIPTION
statisztika
Citation preview
STATISZTIKA 1.
KÉPLETGYŰJTEMÉNY BCE alapfogalmak egy ismérv szerinti elemzés két ismérv szerinti elemzés standardizálás indexszámítás idősorok
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
2
1. ALAPFOGALMAK 1.1.Ismérvek típusai TERÜLETI, IDŐBELI, MINŐSÉGI, MENNYISÉGI.
1.2.Viszonyszámok
B
AV =
MINŐSÉGI Nominális (névleges) A sokaság elemeit valamilyen tulajdonságok szerinti csoportokba soroljuk, de a csoportok közt nincs semmiféle rangsor példák: az áldozatok halálának oka a terroristák nemzetisége
Ordinális (sorrendi) A csoportok között már felállítható sorrendiség példák: a hotelek besorolása (** *** **** *****) a vizsgázók jegyei (1, 2, 3, 4, 5 ) MENNYISÉGI Intervallum A sokaság elemeit itt már valamilyen mértékegység szerint osztályozzuk, de csak a „mennyivel több?” kérdésre tudunk válaszolni, a „hányszoros?”-ra nem példák: hőmérséklet (tegnap -5 fok volt, ma 0 fok, hányszor melegebb van?)
Arány Itt is mértékegység szerinti az osztályozás, de a „hányszoros?” kérdésre is tudunk válaszolni (mindig 0-tól kezdünk mérni) példák: életkor testmagasság
SÚLYOZOTT SZÁMTANI ÁTLAG: A súlyok B1 B2 stb.
21
2211
BB
BVBVV
+⋅+⋅= több tagra
∑∑ ⋅
=i
ii
B
BVV
SÚLYOZOTT HARMONIKUS ÁTLAG: A súlyok A1 A2 stb.
2
2
1
1
21
V
A
V
AAA
V+
+= több tagra
∑
∑=
i
i
i
V
A
AV
MÉRTANI ÁTLAG:
21 VVV ⋅= több tagra n
n
iVV ∏=1
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
3
2. EGY ISMÉRV SZERINTI ELEMZÉS 2.1. Adatok
20 23 alsó kvartilis=23,5 24 24 24 medián=24,5 25 27 30 felső kvartilis=31,5 31 32 módusz=24
átlag: 26=Y
Szórás a teljes populációra
( )∑
−=
N
YY i
2
σ
A teljes populációból vett n elemű minta szórása
( )∑ −
−=
1
2
n
YYs i
( ) ( ) ( ) ( )10
...2426242623262026 2222 +−+−+−+−=σ
( ) ( ) ( ) ( )9
...2426242623262026 2222 +−+−+−+−=S
2.2. Adatsorok
OSZTÁLYKÖZÖK
Osztályközép: iY
GYAKORISÁG
if
KUMULÁLT GYAKORISÁG
if ′
RELATÍV GYAKORISÁG
ig
KUMULÁLT RELATÍV GYAKORISÁG
ig ′
ÉRTÉKÖSSZEG
iS
RELATÍV ÉRT.ÖSSZ.
iZ
0-9 51 =Y 200 200 200/2000 200/2000 5·200 5·200/S
10-19 152 =Y 400 600 400/2000 600/2000 15·400 15·400/S
20-29 253 =Y 500 Me 1100 500/2000 1100/2000 25·500 25·500/S
30-39 354 =Y 600 Mo 1700 600/2000 1700/2000 35·600 35·600/S
40-49 455 =Y 300 2000 300/2000 2000/2000 45·300 45·300/S
2000==∑ Nf i SS i =∑
Becsült átlag
∑∑ == iiii gY
N
fYY
272000
...400152005 =+⋅+⋅=Y
Becsült medián
meme
me
hf
fN
meMe12 −′−
+=
=me a mediánt tartalmazó osztályköz alsó határa,
=meh a mediánt tartalmazó osztályköz hossza
20500
6002
2000
20−
+=Me
Becsült módusz
mohkk
kmoMo
21
1
++=
=mo a móduszt tartalmazó osztályköz alsó határa
11 −−= momo ffk 12 +−= momo ffk
20300100
10030
++=Mo
Becsült szórás a teljes populációra: Relatív szórás:
( ) ( )∑∑ −=−
= iiii gYY
N
fYY 22
σ Y
Vσ= ( ) ( )
2000
...4001527200527 22 +⋅−+⋅−=σ
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
4
2.3. A Lorenz-görbe Azt fejezi ki, hogy a gyakoriság egy adott százalékához az összérték hány százaléka tartozik. Az x tengelyen tehát a kumulált relatív gyakoriságot, míg az y tengelyen a kumulált relatív értékösszeget mérjük.
N
VZHI i
122 +==∑
2.4. Alakmutatók
Pearson-féle mérőszámok
σMeY
P−= 3 σ
MoXA
−=
F-mutatók
( ) ( )( ) ( )19
191,0 DMeMeD
DMeMeDF
−+−−−−=
( ) ( )( ) ( )13
1325,0 QMeMeQ
QMeMeQF
−+−−−−=
′iZ
ig′
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
5
3. KÉT ISMÉRV SZERINTI ELEMZÉS 3.1. Mindkét ismérv minőségi: ASSZOCIÁCIÓS KAPCSOLAT
1C 2C …
jC … Total
1R 11f 12f … jf1 … •1f
2R 21f 22f … jf2 … •2f
… … … … … …
iR 1if 2if … ijf … •if
… … … … … … Total
1•f 2•f jf• N
N
fff ji
ij••∗ ⋅
=
( )∑ ∗
∗−=
ij
ijij
f
ff2
2χ
Cramer-féle asszociációs együttható
{ })1();1(min
2
−−⋅=
crNC
χ
Csuprov-féle asszociációs együttható
11
2
−⋅−⋅=Γ
crN
χ
Yule-féle asszociációs együttható
21122211
21122211
ffff
ffffY
⋅+⋅⋅−⋅
=
1C 2C …
jC … Total
1R 11f 12f … jf1 … •1f
2R 21f 22f … jf2 … •2f
… … … … … …
iR 1if 2if … ijf … •if
… … … … … … Total
1•f 2•f jf• N
1C 2C Total
1R 11f 12f •1f
2R 21f 22f •2f Total
1•f 2•f N
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
6
3.2. Az egyik ismérv minőségi, a másik mennyiségi: VEGYES KAPCSOLAT
MENNYI- SÉGI
MINŐSÉGI ÖSSZ.
1C 2C …
1R 1Y 11f 12f …
2R 2Y 21f 22f …
… … … … …
iR iY 1if 2if …
ÖSSZ. 1N 2N jN N
OSZTÁLYKÖZEPEK MENNYI- SÉGI
MINŐSÉGI ÖSSZ.
1C 2C …
1R 1Y 11f 12f …
2R 2Y 21f 22f …
… … … … …
iR iY 1if 2if …
ÖSSZ. 1N 2N jN N
MENNYI- SÉGI
MINŐSÉGI ÖSSZ.
1C 2C …
1R 1Y 11f 12f …
2R 2Y 21f 22f …
… … … … …
iR iY 1if 2if …
ÖSSZ. 1N 2N jN N
Részátlag
∑∑==
==jj N
i j
iijN
i j
ijj N
Yf
N
YY
11
Rész-szórás
( ) ( )∑∑==
−⋅=−⋅=jj N
ijiij
j
N
ijij
jj YYf
NYY
N 1
2
1
2 11σ
Belső szórás azt adja meg, hogy az egyes elemek át-lagosan mennyivel térnek el a saját részátlaguktól:
( ) ∑∑∑== =
⋅=−⋅=M
jjj
M
j
N
ijijB N
NYY
N
j
1
2
1 1
2 11 σσ
Belső eltérés-négyzetösszeg SSB (sum of squares belső)
( )∑∑= =
−=M
j
N
ijij
j
YYSSB1 1
2
Főátlag
∑∑∑∑= == =
==jj N
ii
M
jij
M
j
N
iij Yf
NY
NY
1 11 1
11
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
7
222KB σσσ += SSKSSBSST +=
A relatív hibacsökkenés, vagyis a PRE kiszámolására a következő képlet van forgalomban:
22
2
2
2
2
22
1 HSST
SSK
SST
SSBSSTPRE KBB ==−=−==−=
σσ
σσ
σσσ
Ha PRE=0 akkor a két ismérv független Ha PRE=1 akkor a két ismérv közt függvényszerű kapcsolat van. Ha pedig PRE értéke valahol nulla és egy között van, akkor a kapcsolat nem független és nem is függvényszerű, tehát sztochasztikus. Amikor a két ismérv független
0=PRE 0=SSK 02 =Kσ 22Bσσ =
Amikor a két ismérv kapcsolata függvényszerű 1=PRE 0=SSB 02 =Bσ 22 σσ =K
MENNYI- SÉGI
MINŐSÉGI ÖSSZ.
1C 2C …
1R 1Y 11f 12f …
2R 2Y 21f 22f …
… … … … …
iR iY 1if 2if …
ÖSSZ. 1N 2N jN N
MENNYI- SÉGI
MINŐSÉGI ÖSSZ.
1C 2C …
1R 1Y 11f 12f …
2R 2Y 21f 22f …
… … … … …
iR iY 1if 2if …
ÖSSZ. 1N 2N jN N
Külső szórás azt adja meg, hogy a részátlagok átlagosan mennyivel térnek el a főátlagtól:
( )∑=
−⋅=M
jjjK YYN
N 1
21σ
Külső eltérés-négyzetösszeg SSK (sum of squares külső)
( )∑=
−⋅=M
jjj YYNSSK
1
2
Teljes szórás azt adja meg, hogy az egyes elemek átlago-san mennyivel térnek el a főátlagtól:
( )∑∑= =
−⋅=M
j
N
iij
j
YYN 1 1
21σ
Teljes eltérés-négyzetösszeg SST (sum of squares teljes)
( )∑∑= =
−=M
j
N
iij
j
YYSST1 1
2
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
8
3.3. Mindkét ismérv mennyiségi: KORRELÁCIÓS KAPCSOLAT
( )∑ ∑ −= 22 XXXd
( )∑ ∑ −= 22 YYYd
( )( )∑∑ −−=⋅ YYXXdYdX
Lineáris korrelációs együttható
∑∑∑
⋅
⋅=
YdXd
dYdXr
22
Kovariancia
N
dYdXYXC ∑ ⋅
==),(
A regressziós egyenes egyenlete:
XY ⋅+= 10ˆˆˆ ββ ahol
∑∑ ⋅
=Xd
dYdX21̂β és XY ⋅−= 10
ˆˆ ββ
X-nek az Y-ra vonatkozó determinációs hányadosa
)(
)(2
22
X
XKYX σ
ση =
Y-nak az X-re vonatkozó determinációs hányadosa
)(
)(2
22
Y
YKXY σ
ση =
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
9
4. STANDARDIZÁLÁS
4.1.A különbségfelbontás EGYIK IZÉ MÁSIK IZÉ
0A
0B
0
00 B
AV =
1A
1B
1
11 B
AV =
01 VVk −=
ÖSSZ:
∑ 0A
∑ 0B ∑∑=
0
00 B
AV
∑ 1A
∑ 1B ∑∑=
1
11 B
AV
01 VVK −=
FŐÁTLAGOK KÜLÖNBSÉGE
01 VVK −=
RÉSZHATÁS KÜLÖNBSÉG (részhatás=V ilyenkor az összetételhatás=B a standard)
∑∑
∑∑
∑∑
∑∑ ⋅
=−⋅
=⋅
−⋅
=′−′=′STD
STD
STD
STD
STD
STD
STD
STD
B
kB
B
VVB
B
VB
B
VBVVK
)( 010101
ÖSSZETÉTELHATÁS KÜLÖNBSÉG (összetételhatás=B ilyenkor a részhatás=V a standard, de mindig a másik, ha az előbb
1B volt akkor most 0V ha pedig 0B volt, most 1V )
∑∑
∑∑ ⋅
−⋅
=′′−′′=′′0
0
1
101 B
VB
B
VBVVK STDSTD
4.2. A hányadosfelbontás EGYIK IZÉ MÁSIK IZÉ
0A
0B
0
00 B
AV =
1A
1B
1
11 B
AV =
0
1
V
Vi =
ÖSSZ:
∑ 0A
∑ 0B ∑∑=
0
00 B
AV
∑ 1A
∑ 1B ∑∑=
1
11 B
AV
0
1
V
VI =
FŐÁTLAG INDEX
0
1
V
VI =
RÉSZHATÁS INDEX (részhatás=V ilyenkor az összetételhatás=B a standard és általában 1B )
∑
∑∑∑
∑∑
∑∑ =
⋅⋅
=⋅⋅
=′′
=′
i
AA
VB
VB
B
VB
B
VB
V
VI
1
1
01
11
1
01
1
11
0
1 :
ÖSSZETÉTELHATÁS INDEX (összetételhatás=B ilyenkor a részhatás=V a standard, de mindig a másik, ezért 0V )
∑∑
∑∑ ⋅⋅
=′′′′
=′′0
00
1
01
0
1 :B
VB
B
VB
V
VI
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
10
5. INDEXEK
5.1. Egyedi ár- volumen- és értékindexek
0
1
p
pi p =
0
1
q
qiq = qpv ii
qp
qpi ⋅==
00
11
5.2. Ár- és volumenindexek
Ár
P
Volumen
q
Bázis időszaki
0
Árindex Laspeyres /bázisidőszak szerinti/
∑∑=
0
00
q
qI p
0
1
p
p
Volumenindex Laspeyres /bázisidőszak szerinti/
∑∑=
0
1
q
q
0
00
p
pI q
Tárgy
időszaki
1
Árindex Paasche /tárgyidőszak szerinti/
∑∑=
1
11
q
qI p
0
1
p
p
Volumenindex Paasche /tárgyidőszak szerinti/
∑∑=
0
1
q
q
1
11
p
pI q
5.3. A Fischer-féle árindex és volumenindex:
10pp
Fp III ⋅= 10
qqFq III ⋅=
5.4. Az értékindex:
Fq
Fppqqpv IIIIII
qp
qpI ⋅=⋅=⋅==
∑∑ 0101
00
11 amiből
0
1
0
1
q
q
p
p
I
I
I
I=
5.5. Az indexek átlagformái 5.6. Vásárlóerő-paritás
∑∑=
AB
AAA
qp
qpBAPPP )/(
∑∑=
BB
BAB
qp
qpBAPPP )/(
)/()/()/( BAPPPBAPPPBAPPP BAF ⋅=
∑∑
∑
∑∑∑ ⋅
==⋅
=0
0
01
01
00
000
v
iv
i
qp
qp
qp
iqpI p
p
pp
∑∑
∑
∑∑∑ ⋅
==⋅
=0
0
10
10
00
000
v
iv
i
qp
qp
qp
iqpI q
q
∑
∑
∑
∑∑∑ ==
⋅=
pp
pp
i
v
v
i
qp
qp
qp
iqpI
1
1
11
11
10
101
∑
∑
∑
∑∑∑ ==
⋅=
i
v
v
i
qp
qp
qp
iqpI
1
1
11
11
01
011
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
11
6. IDŐSOROK 6.1.Állapotidősor és tartamidősor
ÁLLAPOTIDŐSOR
TARTAMIDŐSOR
Változás mértéke
111
−−=
−= ∑
n
yy
n
dd nt
11
1
−−=
−= ∑
n
yy
n
dd nt
Változás üteme 1
1
1
2
−−
=
== ∏ nnn
n
tt y
yll 1
1
1
2
−−
=
== ∏ nnn
n
tt y
yll
Átlag
12
...2 21
−
+++=
n
yy
y
y
n
k n
yyyy n+++= ...21
6.2. Mozgóátlagok Ha a tagok száma páratlan:
12
......ˆ 11
+++++++= ++−−
k
yyyyyy kttttkt
t
Ha pedig a tagok száma páros
k
yyyy
y
y
ktttt
kt
t 22
......2ˆ
11+
+−− ++++++
=
6.3. Lineáris és exponenciális trend
Lineáris trend
ty ⋅+= 10ˆ ββ Lineáris trend normálegyenletei
∑∑==
+⋅=n
t
n
tt tny
110
1
ββ ∑∑∑===
+⋅=⋅n
t
n
t
n
tt ttyt
1
21
10
1
ββ
Exponenciális trend
ty 10ˆ ββ ⋅=
10 lnlnˆln ββ ⋅+= ty
© www.mateking.hu STATISZTIKA 1. KÉPLETGYŰJTEMÉNY
12
6.4. Szezonális eltérés lineáris trend esetén
( )pn
yys
pn
iijij
j /
ˆ/
1∑
=−
=
6.5. Korrigált szezonális eltérés lineáris trend esetén
sss jj −=(
6.6. Szezonindex exponenciális trend esetén
pn
y
y
s
pn
i ij
ij
j /
ˆ
/
1∑
=∗
=
6.7. Korrigált szezonindex exponenciális trend esetén
s
ss j
j
∗∗ =(
ÉVEK=i
SZEZONOK=j (szezonfajták száma p)
j=1 j=2 j=3 …
i=1 11
y 21
y 31
y 41
y
i=2 12
y 22
y 32
y 42
y
i=3 13
y 23
y 33
y 43
y
… 14
y 24
y 34
y 44
y