10
VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY Katedra statistiky a pravděpodobnosti STATISTIKA VZORCE PRO 4ST201 a 4ST210 verze 2018 poslední aktualizace: 1. 9. 2018 KSTP 2018 DODATEČNÉ ÚPRAVY:

STATISTIKA · 2019-08-12 · matematická statistika 5 Testování statistických hypotéz Střední hodnota normálního rozdělení H 0 H 1 Testové kritérium Kritický obor =

  • Upload
    others

  • View
    12

  • Download
    0

Embed Size (px)

Citation preview

VYSOKÁ ŠKOLA EKONOMICKÁ V PRAZE FAKULTA INFORMATIKY A STATISTIKY

Katedra statistiky a pravděpodobnosti

STATISTIKA

VZORCE PRO 4ST201 a 4ST210

verze 2018 poslední aktualizace: 1. 9. 2018

KSTP 2018

pozharsky

DODATEČNÉ ÚPRAVY:

1

Popisná statistika = i

inpn

1=

=k

ii

n n 1

1=

=k

ii

p i = 1, 2, ..., k

(1) (2) ( )

( )

( ) ( 1)

0 1

...

, , 1,

,2

+

= +

+= =

P

P P

n

P P z P

z zP P

x x xx x x nP z nP

x xx nP z

P

1==

n

ii

xx

n 1

1

=

=

=

k

i ii

k

ii

x nx

n

1==

k

i ii

x x p

1

1=

=

H n

i i

nx

x

1

1

=

=

=

k

ii

H ki

i i

nx

nx

1

1

=

=

H k

i

i i

xpx

1 21=

= = n

nnG i ni

x x x x ... x

R = xmax − xmin

2

2 1( )

=−

=

n

ii

x

x xs

n

22

1 12 2 2

n n

i ii i

x

x xs x x

n n= =

= − = −

2

12

1

( )=

=

−=

k

i ii

x k

ii

x x ns

n

22

1 12 2 2

1 1

k k

i i i ii i

x k k

i ii i

x n x ns x x

n n

= =

= =

= − = −

2 2

1( )

=

= −k

x i ii

s x x p 2 2 2 2 2

1 1( )

k k

x i i i ii i

s x x x p x p= =

= − = −

2 2

1 12 2 2

1 1

( )= =

= =

−= + = +

k k

ix i i ii i

x x k k

i ii i

s n x x ns s s

n n 1

1

k

i ii

k

ii

x nx

n

=

=

=

2 2 2

1 1( )

k k

x ix i i ii i

s s p x x p= =

= + − 1=

= k

i ii

x x p

2=x xs s = xx

svx

9pravdepodosnost samaietnosticam sumausiasreteetnosti

masinger

Sumahadnot praomorpronetietnosti

ba kvazengaril.progaritmetidigpramer primer harmonianj

primerfretietnosti

harmonicaprimer

harmonica roiseng

primer Ivarposet

geometringI

praomers

variantroapeti amooningpremer

prostg'tprostgrozptglrozptglcug

poetougtvavlvazeng.rsrozptgl vaz

engrozptglcugpoetoug.fi

tray roaptglrelietnosti

rozptg.la Cujpoetougrel.ietnosti tray

rozklad primerprimera

rozptglarozkladyvozptg.la

primerproimeiacnet.eetn.si cnet.eetn.si

smerodatna variantsachgikat Koeficient

2

Pravděpodobnost Počet pravděpodobnosti

( ) =mP An

( ) 1 ( )P A P A= −

P(A B) ≤ min(P(A), P(B)) P(A B) = P(A) P(B) P(A B) = P(A) + P(B) − P(A B) P(A B) = P(A) + P(B) Náhodné veličiny P(x) = P(X = x) F(x) = P(X x) = ( )

j

jx x

P x

1 2

1 2 2 1( ) ( ) ( ) ( )

= = −x x x

P x X x P x F x F x

( ) ( )= x

E X x P x 2

22 2( ) ( ) ( ) ( ) ( ) = − = −

x xD X E X E X x P x xP x

( ) ( )=f x F x ( ) 1

= f x dx F(x) = P(X x) = ( )−x

f t dt

P(x1 < X x2) = =2

1

)(x

x

dxxf F(x2) − F(x1)

xP , 0 < P < 1 ( )PF x P = 1 ( )−=Px F P

( ) ( )

= E X x f x dx 2

2 )()()(

−=

−dxxxfdxxfxXD ( )D X =

Pravděpodobnostní rozdělení Alternativní rozdělení A()

( ) 11( ) −= −x xP x x = 0, 1, 0 1

E(X) = ( ) ( )1 = −D X

Binomické rozdělení Bi(n,)

( ) (1 ) − = −

x n xn

P xx

x = 0, 1, 2, ..., n, 0 1 n N,

( ) ( ) ( )1 = = −E X n D X n

Poissonovo rozdělení Po()

( ) −=x

P x ex!

x = 0, 1, ... , > 0,

E(X) = D(X) =

doplnekpravdepod.sn.stiinspinnivijevg Cyevopaengseeingpoietsev praninzo preening 2J2eivistepravdepodornost jerry

sjednocenislaiitelugibjevao t.sgednocenineslaeiteingohjeua.NT neza

uislejevg.tn9pravdepodobnosthi distribainikankce

Eunice

hespojitestredna nahvetoinghodnotah rozptgi

hastotapraudepodornosti distribaeniEunice

spojitehah.ve

E1hystrednrhodnotarozptgljhornihran.ie smirodatndw godonglka

d.lnihran.ie

T konstantnipvavdepodobnostpraudep.d.snosiniFunke

stream'T ans.dnota

rozptglpravdep.d.sno.tw

Eunice

stiedui rozptglns.dnotag

pravdep.d.sno.twEunice

stieduins.dnotagrozptgl

pravděpodobnost

3

Hypergeometrické rozdělení Hg(M, N, n)

( )

− − =

M N Mx n x

P xNn

, ( ) 0= − +x max ,M N n , ..., min(M, n), 1 ≤ n < N, 1 ≤ M < N

( ) = ME X nN

( ) 11

− = − − M M N nD X nN N N

Normované normální rozdělení N(0,1)

=XU - u E(U) = 0 D(U) = 1

( ) 1 ( ) = − −u u 1−= −P Pu u Normální rozdělení N(µ,2)

- x , - µ , 2 > 0 E(X) = D(X) = 2

=xu ( ) ( ) xF x u

− = =

= +P Px u

1 21 2( )

− −− = =

x xXP x X x P 1 2 2 1( ) ( ) ( ) = −P u U u u u

Chí-kvadrát rozdělení 2() 0, x N Rozdělení t (Studentovo) t() - x , N tP(ν) = −t1-P(ν) F rozdělení (Fisherovo – Snedecorovo) F(1,2) 1 20x , , N

1 21 2 1

1( )( , )

=PP

F ,F

praudep.d.snoe.twEunice

stieduin tozptglyns.dnota

strednthodnota

rozptyl lIi

streidnihodnota rozp.bg

MsI II

Ipooervoimetabalkg

4

Matematická statistika 2

1( )

1=

−=

n

ii

X XS

n

Bodové a intervalové odhady parametrů (teoretické intervaly spolehlivosti)

střední hodnota =ˆ X

=N NX normální rozdělení

a) 2 známý

1 2 1 2 1 − −

− = −

/ /P X u X un n

1 1 −

− = −

P X u ,n

1 1P X un −

= −

b) 2 neznámý

1 2 1 2 1/ /S SP X t X tn n − −

− = −

T ~ t(n – 1)

1 1SP X t ,n −

− = −

1 1 − = −

SP X tn

obecné rozdělení, 2 neznámý, velký výběr (n > 30)

1 2 1 2( ) 1/ /S SP X u E X X un n − −

− = −

1 ( ) 1 − − = −

SP X u E X ,n

1( ) 1SP E X X un −

= −

rozptyl 2 (normální rozdělení) 2 2 = S Parametr alternativního rozdělení (odhad relativní četnosti základního souboru)

= P

=N NP

1 2 1 2(1 ) (1 ) 1/ /

P P P PP P u P un n − −

− −− = −

1(1 ) 1P PP P u

n −

−− = −

1

(1 ) 1 −

− = −

P PP P un

vcjberova

smerodatnaodchglkaysmerodatnaodchg.ua

hladinarginamnosti

IT fJ O oboastraningintervall spolehlivosti

primer Kvantil Ysmerodatnachg.ba

Levostraung int spolehlivosti pravostranngint spolehlivosti

Pooetstapaevolnosti

I oboastraningintervalI spolehlivosti

preemeir Krantistudentroadetent

Levostraung int spolehlivosti pravostranngint spolehlivosti

Levostraung int spolehlivosti pravostranngint spolehlivosti

pod Kranti

Levostraung int spolehlivosti pravostranngint spolehlivosti

matematická statistika

5

Testování statistických hypotéz Střední hodnota normálního rozdělení

H0 H1 Testové kritérium Kritický obor = 0 > 0

< 0 0

2 známý

0−

=XU n U ~ N(0,1)

W ={u; u u1-} W ={u; u -u1-} W ={u; u u1-/2}

2 neznámý

0−=

XT nS

T ~ t(n – 1)

W ={t; t t1-} W ={t; t -t1-} W ={t; t t1-/2}

Střední hodnota, obecné rozdělení, velký výběr

H0 H1 Testové kritérium Kritický obor E(X) =0 E(X) > 0

E(X) < 0 E(X) 0

2 neznámý (n > 30)

0−=

XU nS

U ≈ N(0,1)

W ={u; u u1-} W ={u; u -u1-} W ={u; u u1-/2}

Parametr alternativního rozdělení (velké výběry)

H0 H1 Testové kritérium Kritický obor = 0

> 0 < 0 0

0

0 0(1 )

=−

PU

n

U ≈ N(0,1) W ={u; u u1-} W ={u; u -u1-} W ={u; u u1-/2}

Rovnost středních hodnot dvou rozdělení velké nezávislé výběry

H0 H1 Testové kritérium Kritický obor E(X1) = E(X2) E(X1) − E(X2) = 0

E(X1) > E(X2) E(X1) < E(X2) E(X1) E(X2)

12 a 2

2 neznámé 1 22 2

1 2

1 2

X XUS Sn n

−=

+ U ≈ N(0,1)

W ={u; u u1-} W ={u; u -u1-} W ={u; u u1-/2}

závislé výběry z normálního rozdělení (párový t-test)

H0 H1 Testové kritérium Kritický obor 1 = 2 1 − 2 = 0

1 > 2 1 < 2 1 2

=D

nDTS

T ~ t(n – 1)

Di = X1i – X2i, i = 1, 2, ..., n

W ={t; t t1-} W ={t; t -t1-} W ={t; t t1-/2}

Chí-kvadrát test dobré shody

H0 a H1 Testové kritérium Kritický obor H0: j = 0,j j = 1, …, k H1: non H0

20 ,

1 0 ,

( )=

−=

k j j

j j

n nG

n G ≈ 2(k −1) W ={g; g 2

1-}

5 jn

O Krantiprimer edpInamdarwho

roadElenismer.oachg.no

Ohypotengp I

Podil

primer

rogstad

Preet

premernoidiference PociziroimeExcel

Poietstapaevolnosti

ceikovgpEYD.era.uangp.atYetstapnavolnosti

6

Analýza závislostí Kontingenční tabulka (r x s)

1 1 1 1+ +

= = = == = =

r s r s

ij i ji j i j

n n n n i jij

n nn

n+ + = 5 ijn

H0 H1 Testové kritérium Kritický obor znaky jsou nezávislé

non H0 2

1 1

( / )/

+ +

= = + +

−=

r sij i j

i j i j

n n n nG

n n n G ≈ 2((r − 1)(s − 1))

W ={g; g ≥ 21-}

=+GC

G n

( 1)=

−GV

n m, m = min (r, s)

Tabulka 2 2 2

11 22 12 21

1 1 2 2

( )n n n n nGn n n n+ + + +

−=

Analýza rozptylu

( )2

1 1= =

= −jnk

y jij i

S y y = Sy.m + Sy.ν ( )2

.1=

= −k

y m j jj

S y y n ( )2

.1 1

= =

= −jnk

y ji jj i

S y y

2 y.m

y

SP

S=

H0 H1 Testové kritérium Kritický obor 1 = 2 = ...=k non H0

.

.

1−=

y m

y v

SkF Sn k

F ~ F(k – 1, n – k)

W ={F; F F1-α}

Regrese a korelace regresní přímka y = 0 + 1x + ,

0 1 0 1ˆ ˆˆ , Y b b x y x = + = +

0 1

2, 0 1

1minimum ( )

n

i ii

y x =

− −

( )( )1 .

n

i ii

xy

x x y ys xy x y

n=

− −= = −

( )1 1 2 22 22

.ˆ xyi i i i

xi i

sn y x x y xy x ybsx xn x x

− −

= = = =−−

2

0 0 12 2ˆ ˆ

( )i i i i i

i i

y x y x xb y x

n x x

−= = = −

Jiné regresní funkce 2 20 1 2 0 1 2

ˆ ˆ ˆˆ,Y b b x b x y x x = + + = + +

0 1 1 2 2 0 1 1 2 2ˆ ˆ ˆ ˆˆ... , ...k k k kY b b x b x b x y x x x = + + + + = + + + +

gamaitehoiadkagysamas.te

hosloupcestapne

volnostip.ie't

ia

dkaolpoietsioapca.PEarsonaovkoefiiientkoutiugence aameravkoeficientkoutingence

Zjednodasenjvzorec.pro

abalkg2x2mguskapinovgsoaietitverce

ceikovgs.oacetitva.ca iunitroskapinovg

Pomerdeterminace soaietetuerce

poietskapinrovnoststrodurch I rstapnevoinostihodns.it

colkovjpoetKonstanta smernice

nahodnesbika

parabola

vicenasobnareg.fmloe

analýza závislostí

7

( )2

1== −

n

y ii

S y y ( )2

== −

n

T ii

S y y ( )2 2

1 1ˆˆ

= == − =

n n

R i i ii i

S y y

Sy = ST + SR 2 =−

RR

Ss

n p sR = 2=

−R

RS

sn p

2 2 T

y

SR IS

= = 2 2 2 11 (1 )ADJ ADJnI R In p−

= = − −−

Test hypotézy o regresním parametru

H0 H1 Testové kritérium Kritický obor j = 0 j 0

j

j

ˆ

ˆT

s

= T ~ t(n – p)

W ={t; t ≥ t1-/2}

Test o modelu p = k + 1

H0 H1 Testové kritérium Kritický obor 0 = c 1 = 0 ... k = 0

non H0

1−=

T

R

SpF Sn p

F ~ F(p – 1, n – p)

W = {F; F ≥ F1-}

korelační koeficient

( )( )1 1 1

2 2 2 22 2 2 2

1 1 1 1( ) ( )

= = =

= = = =

−−

= = = =− −− −

n n n

i i i ixyi i i

yx xy n n n nx y

i i i ii i i i

n x y x y sxy x yr rs sx x y yn x x n y y

H0 H1 Testové kritérium Kritický obor ρXY = 0 ρXY 0

2

2

1xy

xy

r nT

r

−=

− T ~ t(n –2)

W ={t; t ≥ t1-/2}

readaalnisoacetctveroaoceikovgsoacetetve.ca Te.veokgsoacet

ctveroaokoefiiientlndexdeterminaoe apravengkoefii.int

lndexdeterminaoePoc

etstapnoavolnosti

pocetreg.koefiaenta

teoretiokgs.itveroaopocetstapnoavoin.si IFisherovorozdeleni

readaaln.s.aeitverouo

tfpTpocetstapnoavoinosti

festrginamnostiKordhoeficientu

8

Časové řady

1==

T

tt

yy

T

12 31 2 1

12

1 1... 2 22 2 2

1 1

−−

=

++ + + ++ + += =

− −

T

T Tt T

t

y yy y y y y y yy

T T2 31 2 1

1 2 1

1 2 1

...2 2 2

...

−−

++ ++ + +

=+ + +

T TT

T

y yy y y yd d dy

d d d

yt = yt − yt−1 2 1

1 1

= −

= =− −

T

tt T

y y yyT T

1−

= tt

t

yk

y 1 12 3

1

...− −= = TT TTyk k k ky

1 = −t tk 1 = −k

Dekompozice časové řady yt = Tt + Ct + St + t yt = Tt Ct St t Modelování trendu Trendové funkce Tt = 0 + 1t 0 1

ˆ ˆˆ = +tT t Tt = 0 + 1t + 2t2 20 1 2ˆ ˆ ˆˆ = + +tT t t

MSE =

2

1ˆ( )

T

t tt

y y

T=

( )21

2

2

1

ˆ ˆ

ˆ

T

t tt

T

tt

DW

−=

=

−=

Klouzavé průměry

m = 2p + 1 1 1... ...ˆ − − + ++ + + + + += = t p t t t t p

t ty y y y y

T ym

m = 2p ( )1 1 1 11ˆ 2 ... 2 2 2 ... 2

2 − − + − + + − += = + + + + + + + +t t t p t p t t t t p t pT y y y y y y y ym

Modelování sezónnosti Regresní metoda s umělými proměnnými (lineární trend, sezónnost délky 4) yt = Tt + St + εt = 0 + 1t + 1D1t + 2D2t + 3D3t + 4D4t + t

yt* = 0

* + 1*t + 1

*D1t + 2*D2t + 3

*D3t + t

* * *1 2 3ˆ ˆ ˆˆ

4 + +

=s ˆ ˆ ˆ ˆ, 1, 2, 3 = = − =j j jS s j 4 4ˆ ˆ ˆ= = −S s *

0 0ˆ ˆ ˆ = + s

1

ˆ 0=

=s

jj

S

aritmetickj chronologickgproimeirprimer is

ckronologiokgvazengp.name

absolatnipirrastek pramanjarsolatnipirrastekb mirgdgnamikg

Koeficientrasta praomerngroeficientrasta

isrelativnipiiraster pramangrelativnipinaster

Aditivni Maltiplikativni

parabola

primka

preemernoietvercovachyba

prostes

centrovani

natueptepositat

aj.tasez.si.ika IEturkisezinnisbika upravencikonstanta

soaietseasbiekso

9

Indexní analýza Individuální indexy jednoduché

=Qpq

IQ Iq Ip=

11 0

0

= = −pIp p p pp

11 0

0

= = −qIq q q qq

11 0

0

= = −QIQ Q Q QQ

/1 2/1 3/2 / 11

...tt t t

yI I I Iy −= = /1

/ 11 1/1

t tt t

t t

y IIy I−

− −

= =

Individuální indexy složené

1 0 1Σ

10 0

.= = =

q

q Iq q qI qq q

Iq

1 0q q q = −

1 1 1 0 1Σ

10 0 0 0

.= = = =

Q

Q p q IQ Q QI QQ p q Q

IQ

1 0 = − Q Q Q

1

1 1 1 1

1 11 1

0 0 0 00

00 0

0

QQ p q Qq qp pIpQ p q Qp

Qq qp

= = = =

1 1 0 01 0

1 0

= − = −

p q p qp p p

q q

Souhrnné indexy 1 0 0 0 0( )

0 0 0 0 0

. .= = =

L p q Ip p q Ip QIp

p q p q Q 1 1 1 1 1( )

1 1 10 1

= = =

P p q p q QIp p q Qp q

Ip Ip

( ) ( ) ( ).=F L PIp Ip Ip

0 1 0 0 0( )

0 0 0 0 0

. .= = =

L p q Iq p q Iq QIq

p q p q Q 1 1 1 1 1( )

1 1 11 0

= = =

P p q p q QIq p q Qp q

Iq Iq

( ) ( ) ( )= F L PIq Iq Iq

Irisacena minister

I moistencenorg index indexindex treby

Baking Ietezovgindex

g gindex

is11Fishercerindex

11 IKshetraindex