65
abc MATEMATIKA 2 VERJETNOST IN STATISTIKA

abc

  • Upload
    may

  • View
    55

  • Download
    0

Embed Size (px)

DESCRIPTION

MATEMATIKA 2. abc     . VERJETNOST IN STATISTIKA. VERJETNOST IN STATISTIKA. OSNOVNI POJMI. OSNOVE TEORIJE VERJETNOSTI. V tednu je sedem dni . Kolik šna je verjetnost, da bo jutri petek?. - PowerPoint PPT Presentation

Citation preview

abc

MATEMATIKA 2

VERJETNOST IN STATISTIKA

MATEMATIKA 2

VERJETNOST IN STATISTIKA OSNOVNI POJMI

2

OSNOVE TEORIJE VERJETNOSTI

V tednu je sedem dni. Kolikšna je verjetnost, da bo jutri petek?

Verjetnost, da sta na letalu dve bombi je neprimerno manjša kot verjetnost, da je na letalu ena bomba. Za koliko se zmanjša verjetnost, da je na letalu bomba, če eno bombo prinesemo s seboj?

Polovici razreda se pouk zaključi ob dvanajstih, polovici pa ob dveh. Torej se jim pouk v povprečju zaključi ob sedmih ( (12+2)/2=7 ).

Kolikšna je verjetnost, da pri 100 metih kovanca dobimo 50 cifer? 1, 0.5 ali kaj drugega?

Statistično je dokazano, da večja, ko je teža mladostnika, višja je njegova stopnja izobrazbe. Torej čim več jejte!

MATEMATIKA 2

VERJETNOST IN STATISTIKA OSNOVNI POJMI

3

Teorija verjetnosti obravnava situacije, ki jim pravimo poskusi in pri katerih je izid odvisen od naključja.

Prostor izidov je množica vseh izidov nekega poskusa.

Med vožnjo na faks pelje študent mimo treh semaforjev. Pri vsakem se bodisi ustavi (R) ali pa pelje brez ustavljanja (Z). Prostor izidov je { ZZZ , ZZR , ZRZ , RZZ , ZRR , RZR , RRZ ,RRR }.

Letna količina padavin v nekem kraju je zelo odvisna od naključja. Če jo gledamo kot izid poskusa je prostor izidov množica vseh pozitivnih realnih števil {t | t 0}.

Uvrstitev tekmovalca na kolesarski dirki ‘Franja’ je izid pri poskusu - tekmi - in za prostor izidov vzamemo množico {1,2,...,N}, kjer je N število udeležencev. Ker se število udeležencev iz leta v leto spreminja, je bolj

smiselno vzeti za prostor izidov množico vseh naravnih števil {1,2,3,...}.

Podmnožicam prostora izidov pravimo dogodki.

Dogodek, da se študent ustavi pri drugem semaforju je {ZRZ,ZRR,RRZ,RRR}. Dogodek,da se kolesar uvrsti med prvih deset je {1,2,3,4,5,6,7,8,9,10}. Interval [500,1200] ustreza dogodku, da pade med 500 in 1000 milimetrov dežja.

MATEMATIKA 2

VERJETNOST IN STATISTIKA OSNOVNI POJMI

4

dogodka sta nezdružljiva, če je njun produkt nemogoč dogodek: npr., da se študent hkrati ustavi in ne ustavi na prvem semaforju.

Na dogodkih izvajamo iste operacije kot na množicah (unija, presek,komplement...), le da jih drugače imenujemo.

SLOVARelement izid

množica dogodek

unija vsota

presek produkt

komplement nasprotni dogodek

prazna množica nemogoč dogodek

cela množica gotov dogodek

tuji množici nezdružljiva dogodka

ZZZ,ZZR,ZRZ,RZZ,ZRR,RZR,RRZ,RRR

A+B je dogodek, da se študent ustavi na prvem, ali na drugem semaforju ali pa na obeh:

A+B={RZZ,RZR,ZRZ,ZRR,RRZ,RRR}

A je dogodek, da se študent ustavi na prvem, B pa, da se ustavi na drugem semaforju:

A={RZZ,RZR,RRZ,RRR}, B={ZRZ,ZRR,RRZ,RRR}

AB je dogodek, da se študent ustavi na prvem in na drugem semaforju: AB={RRZ,RRR}

G={ZZZ,ZZR,ZRZ,RZZ,ZRR,RZR,RRZ,RRR}

N=∅

A je dogodek, da se študent ne ustavi na prvem semaforju A ={ZRZ,ZZR,ZZZ,ZRR}.

MATEMATIKA 2

VERJETNOST IN STATISTIKA OSNOVNI POJMI

5

Verjetnost je funkcija, ki vsakemu dogodku A priredi število P(A)[0,1] tako, da velja:

BA

A BAB

GA A( ) 1 ( )P A P A

( ) ( ) ( )AB N P A B P A P B

( ) 1P G

Verjetnost vsote nezdružljivih dogodkov je enaka vsoti njunih verjetnosti

Verjetnost gotovega dogodka je 1.

( ) ( ) ( )

( ) 1

P A P A P A A

P G

( ) ( ) ( ) ( )P A B P A P B P AB

Računska pravila:

( ) 0P N

( ) ( )A B P A P B ( ) ( ) ( )

( )

P B P A P B A

P A

MATEMATIKA 2

VERJETNOST IN STATISTIKA DEFINICIJE VERJETNOSTI

6

Naj bo pri metu kocke A dogodek, da pade sodo število pik. Po klasični definicija: P(A)=½, ker je A={2,4,6} v množici izidov {1,2,3,4,5,6}, za katere privzamemo, da so enako verjetni.

Statistična definicija: P(A) je frekvenca metov s sodim številom pik pri velikem številu metov kocke.

Po 1000 metih kovanca dobimo 700 grbov

pri 1001. metu sta oba izida enako verjetna

pri 1001. metu je bolj verjetno, da pade grb

klasično

statistično

Klasična definicija verjetnosti Če ima poskus končno število enako verjetnih izidov, potem je

( )število izidov v dogodku

število vseh izidovA

P A

Statistična definicija verjetnosti Frekvenca dogodka A pri n ponovitvah poskusa je

P(A) je limita frekvenc dogodka A pri velikem številu ponovitev poskusa.

število poskusov z izidom An

Za uporabo je odločilna verjetnost, ‘izmerjena’ po statistični definiciji. Klasična definicija je lahko kvečjemu dober približek.

MATEMATIKA 2

VERJETNOST IN STATISTIKA DEFINICIJE VERJETNOSTI

7

Kovanec s premerom 2 cm vržemo na tla pokrita s ploščicami s stranico 10 cm. Kolikšna je verjetnost dogodka A, da kovanec ne pade na stik dveh ploščic?

P(A)=82/102=0.64=64%

Včasih izidov ne moremo prešteti, lahko pa jih predstavimo geometrično. V tem primeru je klasična definicija verjetnosti P(A) opredeljena kot razmerje med velikostjo (dolžino, ploščino, prostornino...) množice A in velikostjo množice vseh izidov.

Tudi pri tem pristopu se klasična in statistična definicija razlikujeta:

Klasično: če je r čas trajanja rdeče luči na semaforju, z pa čas trajanja zelene luči, potem je verjetnost, da se voznik ustavi enaka r/(r+z).

Statistično: verjetnost je razmerje med številom ustavljanj in številom vseh voženj pri dovolj velikemu številu voženj.

Kolikšna je verjetnost, da se bo voznik ustavil pri nekem semaforju?

MATEMATIKA 2

VERJETNOST IN STATISTIKA POGOJNA VERJETNOST

8

POGOJNA VERJETNOST

Voznik se vsak dan vozi po isti poti in se jezi, da na nekem semaforju skoraj vsakič pripelje na rdečo luč. Sčasoma ugotovi, da v povprečju le enkrat na vsakih pet voženj pripelje na zeleno. Ali lahko sklepa, da je rdeči interval štirikrat daljši od zelenega?

Po opazovanju semaforja ugotovi, da sta rdeča in zelena prižgani enako dolgo časa. Kako je potem mogoče, da vedno pripelje na rdečo?

Izkaže se, da na svoji poti pelj mimo dveh semaforjev. Na prvega pripelje povsem naključno, mimo pa gre le pri zeleni luči. Semaforja sta pa tako (ne)vsklajena, da se v času, ko pripelje do drugega ravno prižge rdeča luč.

Izid na drugem semaforju je pogojen z izidom na prvem semaforju.

MATEMATIKA 2

VERJETNOST IN STATISTIKA POGOJNA VERJETNOST

9

A,B dogodka ( P(B)≠ 0 )

Pogojna verjetnost dogodka A pri pogoju B je delež dogodka A med poskusi, pri katerih se zgodi dogodek B.

Pri kontroli kakovosti v tovarni 30% izdelkov ocenijo kot prvovrstne, 50% kot drugovrstne, ostale pa kot neuporabne. V trgovino seveda pošljejo le uporabne izdelke. Kolikšna je verjetnost, da je naključno izbrani izdelek v trgovini prvovrsten?

A: izdelek je prvovrstenU: izdelek je uporabenZanima nas P(A|U).

P(AU)=P(A)=30 %P(U)=80 %P(A|U)=30/80=0.375=37.5 %

( )( | )

( )

P ABP A B

P B

( ) ( | ) ( )

( ) ( | )

P AB P A B P B

P A P B A

S pomočjo pogojne verjetnosti izrazimo verjetnost, da se dva dogodka zgodita hkrati:

Iz vrečke, v kateri so 3 rdeče in 2 beli kroglici, zaporedoma brez gledanja izvlečemo dve kroglici . Kolikšna je verjetnost, da sta obe rdeči?

A: prvič izvlečemo rdečo kroglicoB: drugič izvlečemo rdečo kroglico

3 2( ) , ( )

5 4P A P B A 3 2

( )5 4

3

10P AB

MATEMATIKA 2

VERJETNOST IN STATISTIKA POGOJNA VERJETNOST

10

S pomočjo pogojne verjetnosti lahko izračunamo verjetnost dogodka, ki je rezultat dvo- ali večstopenjskega poskusa:

Iz škatle s petimi rdečimi in tremi belimi kroglicami na slepo prenesemo dve kroglici v škatlo, v kateri so tri rdeče in tri bele kroglice. Nato iz druge škatle izvlečemo eno kroglico. Kolikšna je verjetnost, da je rdeča?

možnosti na 1. koraku možnosti na 2. koraku

prenesemo dve beli kroglici

prenesemo dve rdeči kroglici

prenesemo eno rdečo in eno belo kroglico

izvlečemo belo kroglico

izvlečemo rdečo kroglico

3 2 6

8 7 56P

5 4 20

8 7 56P

3 5 5 3 30

8 7 8 7 56P

3

8P

5

8P

4

8P

6 3 20 5 30 4 238( )

56 8 56 8 560.531

8 448P R

? ?

MATEMATIKA 2

VERJETNOST IN STATISTIKA POGOJNA VERJETNOST

11

V splošnem najprej določimo vse možnosti na prvem koraku: H1,H2,...,Hn in njihove verjetnosti P(H1),P(H2),...,P(Hn).

Nato določimo pogojne verjetnosti, da se dogodek A zgodi pri vsaki od teh možnosti P(A|H1),P(A|H2),...,P(A|Hn).

formula o popolni verjetnosti

P(Hi|A)=P(AHi )/P(A)= P(A|Hi ).P(Hi

)/P(A)

Bayesova formula

Včasih nas zanima, po kateri poti je prišlo do opaženega izida:

1 1 2 2( ) ( ) ( | ) ( ) ( | ) ... ( ) ( | )n nP A P H P A H P H P A H P H P A H

( | ) ( )( | )

( )i i

i

P A H P HP H A

P A

MATEMATIKA 2

VERJETNOST IN STATISTIKA NEODVISNI DOGODKI

12

A je neodvisen od B, če je P(A|B)=P(A).

Iz škatle, v kateri imamo 7 polnih in 3 prazne baterije naključno vzamemo dve. Naj bo A dogodek, da je prva baterija polna, B pa dogodek, da je druga baterija polna. Ali sta dogodka A in B neodvisna?

7 6,

7 6 3 7 710 93 7 10 9 10 9 10

,10 9

P A P B| A P B

P A P B| A

A in B sta neodvisna P(AB)=P(A).P(B)

P(A|B)=P(A) P(AB)=P(A)P(B)

ODVISNOST IN NEODVISNOST DOGODKOV

ni neodvisen od P B P B| A B A

Zgled razkrije razliko med izbiranjem vzorca z vračanjem in izbiranjem brez vračanja.

MATEMATIKA 2

VERJETNOST IN STATISTIKA POGOJNA VERJETNOST

13

V skupini je n oseb. Kolikšna je verjetnost, da imata dve rojstni dan na isti dan?

47 oseb P(A)>95%⇒

Lažje obravnavamo nasprotni dogodek, da so vsi rojstni dnevi različni.

364 3642 : 1

3650.003

365drugi nima rojstni dan na isti dan kot prvi imata skupni rojstni dann P P

364 3633 :

365 365364 363

1365 3

0. 086

05

drugi nima rojstni dan na isti dan kot prvi in tretji ne kot prvi in drugi

dva od treh imata skupni rojstni dan

n P

P

364 363 3624 : 1

365 3650.016

365dva od štirih imata skupni rojstni dann P

364 363 366

1365 365 365

dva od tih imata skupni rojstni dan

n

P n

23 oseb P(A)⇒ >50%

32 oseb P(A)>75%⇒

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

14

Če vržemo dve kocki, dobimo za vsoto pik število med 2 in 12, vendar te vsote ne moremo vnaprej napovedati, saj je odvisna od naključja. Podobno velja za število šestic v dveh metih.

Primeri količin odvisnih od naključja:• število potnikov mestnega avtobusa, ki izstopijo na postaji• število metov potrebnih, da igralec z določene razdalje zadane koš• število bonbonov v vrečki• življenjska doba žarnice• teža hlebca kruha ……

Slučajna spremenljivka je funkcija, katere vrednosti so odvisne od naključja.

Določata jo: zaloga vrednosti = nabor vrednosti, ki jih lahko zavzame, in porazdelitev = verjetnost, da zavzame eno ali več vrednosti iz zaloge

SLUČAJNE SPREMENLJIVKE

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

15

Pri metu dveh kock je možnih 36 različnih in enako verjetnih izidov. Če z V označimo vsoto pik, dobimo slučajno spremenljivko z vrednostmi 2,…,12 in porazdelitvijo:

12 12

362

3 11363

4 10364

5 9365

6 836

67

36

P(V ) P(V )

P(V ) P(V )

P(V ) P(V )

P(V ) P(V )

P(V ) P(V )

P(V )

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

16

Slučajna spremenljivka X je diskretna, če zavzame končno ali največ števno mnogo vrednosti x1, x2, x3,...

Njena porazdelitev je povsem določena s funkcijo pX( xi )=P ( X=xi ).Običajno naštejemo le neničelne vrednosti: p(x1),p(x2),p(x3),...

enakomerna porazdelitev • X zavzame vrednosti x1, x2,..., xn

• pX (x)=1/n, če je x {∈ x1, x2,... xn} pX (x)=0, sicer

Število pik pri metu kocke je enakomerno porazdeljeno: zaloga vrednosti je {1,2,3,4,5,6}, vse vrednosti imajo verjetnost 1/6.

0 ( ) 1 ( ) 1 i ii

p x p x Velja:

Primeri diskretnih porazdelitev

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

17

binomska porazdelitev Poskus ponovimo n-krat: naj bo vsakič verjetnost uspeha enaka p (in verjetnost neuspeha 1-p).

(npr. žogo vržemo 10-krat na koš; zadanemo z verjetnostjo 70%)

Slučajna spremenljivka B naj bo število uspešnih poskusov. Kako je porazdeljena?

(tj. kolikšna je verjetnost, da bomo imeli k zadetkov?)

1 k n-kB

np (k) P(B k) p ( p)

k

6 410(6) 0 7 0 3 0 200 20

6p . . . %

npr. verjetnost, da koš zadanemo natanko 6-krat je

• Zaloga vrednosti spremenljivke B je {0,1,2,...,n}

• Privzamemo, da so izidi poskusov medsebojno neodvisni.

Obstaja različnih zaporedij k uspešnih in (n-k) neuspešnih poskusov;

verjetnost vsakega zaporedja je pk(1-p)n-k .

n

k

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

18

Porazdelitev spremenljivke B za n=10 in p=0.7: b(10,0.7)

binomska porazdelitev b(n,p)

b(20,0.4) b(100,0.65)

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

19

Lastnosti binomske porazdelitve b(n,p): značilna zvonasta oblika grafa maksimum pri n.p (približno) za velike n so vse verjetnosti zelo majhne ali celo zanemarljive • tedaj je bolj smiselno verjetnosti opazovati kumulativno: P(B ≤ k) ali intervalsko: P(j ≤ B ≤ k)

Žogo vržemo na koš 100-krat, pri čemer je verjetnost zadetka 70%.Kolikšna je verjetnost, da bomo zadeli več kot 65-krat?

100100

66

10065 100 0 7 0 3 0 837 83.7%k k

k

P( B ) . . .k

računanje je zelo zamudno in numerično zahtevno

Kaj je bolj verjetno: da bomo v 10 metih zadeli 10-krat ali v 100 metih več kot 80-krat?

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

20

geometrična porazdelitev

Ponavljamo poskus pri katerem je verjetnostjo uspeha p. Slučajna spremenljivka G naj bo število poskusov, potrebnih za prvi uspeh. Kako je porazdeljena?

p=0.2

• Zaloga vrednosti spremenljivke G je {1,2,3,... }

• P(G=k)=p.(1-p)k-1

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

21

Poissonova porazdelitev

Poissonova porazdelitev P(a) • zaloga: {0,1,2,3,... } • porazdelitev:

( )k

-aap k e

k!

Uporaba: modeliranje emisije -delcev v danem časovnem intervalu modeliranje časovnih vrst (vrste pred bančnimi okenci, gostota prometa, obremenitve telefonskega omrežja) modeliranje redkih nesreč v zavarovalništvu (npr. čebelji piki, padci pod tušem) . . . .

Če je a=n.p majhen, je Poissonova porazdelitev zelo dober približek za binomsko porazdelitev.

n.p=a, n →

binomska porazdelitev b(n,p): 1k n-knP(B k) p ( p)

k

1 1 1 11 1 1 1

1 2

k n k n -kkk n-kn n(n - ) (n - k ) a a a n(n - ) (n - k ) a a

p ( p) k k n n k! n n n n n

e-a 1 1k

-aa ek!

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

22

ZVEZNE SLUČAJNE SPREMENLJIVKE

Kadar je zaloga slučajne spremenljivke X neštevna (npr. življenjska doba žarnice), potem ne moremo našteti verjetnosti posameznih izidov in jim povrhu običajno sploh ne moremo pripisati pozitivne verjetnosti.

Pomagamo si s kumulativno verjetnostjo: P(X ≤ x) = verjetnost, da X zavzame vrednost največ x (npr. da žarnica pregori po x urah)

FX(x) = P(X ≤ x) je (kumulativna) porazdelitvena funkcija spremenljivke X

Porazdelitvena funkcija slučajne spremenljivke je • naraščajoča • na (-,) zraste od 0 do 1

Spremenljivka X je zvezna če je njena porazdelitvena funkcija FX zvezna.

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

23

Kumulativne porazdelitve diskretne in zvezne slučajne spremenljivke

Če je spremenljivka X zvezna, potem obstaja funkcija pX(x), da jex

X XF (x) p (t) dt

pX(x) je gostota slučajne spremenljivke X

0 1 1X X p (x) p (t) dt

Za gostoto slučajne spremenljivke velja:

Kjer je pX zvezna je pX=FX ’.

( )b

Xa

P a X b p (x) dx

S pX računamo podobno, kot z diskretno gostoto, le da vsote nadomestimo z integrali: P(a≤X ≤ b) = verjetnost, da X zavzame vrednost med a in b (da je življenjska doba žarnice med a in b ur)

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

24

Primeri zveznih porazdelitev

enakomerna porazdelitev

1 0 1

0 sicerx

p(x)

na [0,1], gostota:

1

0 sicer

a x bp(x) b a

na [a,b], gostota:

0 1

1

a b

ab1

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

25

eksponentna porazdelitev

0 0

0-ax

xp(x)

a e x

Podobna Poissonovi; uporaba pri modeliranju življenjske dobe, modeliranju vpliva mamil na živčne receptorje, napovedovanju potresov...

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

26

Normalna porazdelitev N(a,) 2

1

21

2

x-a-

σp(x) eσ π

gostota:

zvonasta oblika maksimum pri a simetrična glede na a eksponetno pada proti 0

( 1,0.5)N

( 0.5,0.7)N

(1,0.25)N

gostota porazdelitve N(0,) za različne :(0,1)N

(0,0.5)N

(0,0.25)N

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

27

N(0,1) je standardizirana normalna porazdelitev; njena gostota je

2

21

2

x-

(x) eπ

)

1N(a,σ

x - ap x

σ σ

vse normalne porazdelitve lahko izrazimo s pomočjo standardizirane

Kumulativna porazdelitvena funkcija standardizirane normalne porazdelitve

2

20 1

1

2

x t-

N( , )-

F (x) e dtπ

F x

x

Tudi vse kumulativne normalne porazdelitve lahko izrazimo s standardizirano:

0

)

1

1N(a,σ)

x x

N(a,σ- -

x-a

N , )

σ

-(

t - aF (x) p (t) dt dt

σ σ

(u) x - a

du

1

x a

t au

σ

du dtσ

t - x

u -

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

28

0 1 2 3 4 5 6 7 8 9

0.0 0.0000 0.0039 0.0079 0.0119 0.0159 0.0199 0.0239 0.0279 0.0318 0.03580.1 0.0398 0.0437 0.0477 0.0517 0.0556 0.0596 0.0635 0.0674 0.0714 0.07530.2 0.0792 0.0831 0.0870 0.0909 0.0948 0.0987 0.1025 0.1064 0.1102 0.11400.3 0.1179 0.1217 0.1255 0.1293 0.1330 0.1368 0.1405 0.1443 0.1480 0.15170.4 0.1554 0.1590 0.1627 0.1664 0.1700 0.1736 0.1772 0.1808 0.1843 0.1879

0.5 0.1914 0.1949 0.1984 0.2019 0.2054 0.2088 0.2122 0.2156 0.2190 0.22240.6 0.2257 0.2290 0.2323 0.2356 0.2389 0.2421 0.2453 0.2485 0.2517 0.25490.7 0.2580 0.2611 0.2642 0.2673 0.2703 0.2733 0.2763 0.2793 0.2823 0.28520.8 0.2881 0.2910 0.2938 0.2967 0.2995 0.3023 0.3051 0.3078 0.3105 0.31320.9 0.3159 0.3185 0.3212 0.3238 0.3263 0.3289 0.3314 0.3339 0.3364 0.3389

1.0 0.3413 0.3437 0.3461 0.3484 0.3508 0.3531 0.3554 0.3576 0.3599 0.36211.1 0.3643 0.3665 0.3686 0.3707 0.3728 0.3749 0.3769 0.3789 0.3809 0.38291.2 0.3849 0.3868 0.3887 0.3906 0.3925 0.3943 0.3961 0.3979 0.3997 0.40141.3 0.4031 0.4049 0.4065 0.4082 0.4098 0.4114 0.4130 0.4146 0.4162 0.41771.4 0.4192 0.4207 0.4221 0.4236 0.4250 0.4264 0.4278 0.4292 0.4305 0.4318

1.5 0.4331 0.4344 0.4357 0.4369 0.4382 0.4394 0.4406 0.4417 0.4429 0.44401.6 0.4452 0.4463 0.4473 0.4484 0.4494 0.4505 0.4515 0.4525 0.4535 0.45441.7 0.4554 0.4563 0.4572 0.4581 0.4590 0.4599 0.4607 0.4616 0.4624 0.46321.8 0.4640 0.4648 0.4656 0.4663 0.4671 0.4678 0.4685 0.4692 0.4699 0.47061.9 0.4712 0.4719 0.4725 0.4731 0.4738 0.4744 0.4750 0.4755 0.4761 0.4767

2.0 0.4772 0.4777 0.4783 0.4788 0.4793 0.4798 0.4803 0.4807 0.4812 0.48162.1 0.4821 0.4825 0.4829 0.4834 0.4838 0.4842 0.4846 0.4849 0.4853 0.48572.2 0.4860 0.4864 0.4867 0.4871 0.4874 0.4877 0.4880 0.4883 0.4886 0.48892.3 0.4892 0.4895 0.4898 0.4900 0.4903 0.4906 0.4908 0.4911 0.4913 0.49152.4 0.4918 0.4920 0.4922 0.4924 0.4926 0.4928 0.4930 0.4932 0.4934 0.4936

2.5 0.4937 0.4939 0.4941 0.4942 0.4944 0.4946 0.4947 0.4949 0.4950 0.49522.6 0.4953 0.4954 0.4956 0.4957 0.4958 0.4959 0.4960 0.4962 0.4963 0.49642.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4971 0.4972 0.49732.8 0.4974 0.4975 0.4975 0.4976 0.4977 0.4978 0.4978 0.4979 0.4980 0.49802.9 0.4981 0.4981 0.4982 0.4983 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986

3.0 0.4986 0.4986 0.4987 0.4987 0.4988 0.4988 0.4988 0.4989 0.4989 0.4989

Funkcija (F x) je liha, zato so tabelirane le njene vrednosti za pozitivne x.

(1.02)=0.3461

F(-0.89)=0.5+( - 0.89)=0.1868

Če je X standardizirano normalna N(0,1), je 1 2 2 1P(x X x ) (x ) (x )

Če pa je X normalna N(a,s), je 2 11 2

x a x aP(x X x )

σ σ

2

2

0

1

2

x t-

(x) e dtπ

Integral gostote ni elementarna funkcija – v praksi si pomagamo s tabelami za funkcijo 0 1

1

2N( , )F x x

(-0.89)= - (0.89)= - 0.3132

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

29

X porazdeljena po N(a,):

(1 ( 0 6821 2 61a σ- a a - σ - a

P(a - σ X a σ) - ) - - ) ( )σ σ

.

0 9542 2 2 42 P(a - σ X a σ ) .( ) 0 9973 3 2 23 P(a - σ X a σ) . ( )

Slučajna spremenljivka X je porazdeljena po zakonu N(1.5,0.2). Kolikšna je verjetnost, da X zavzame vrednost med 1 in 1.5?

1 5 1 5 1 1 5

0 2 0 21 49.1 5 0 ( 2.5) 2 5 0 4937 37%. - . - .

. . P( X . ) ( ) ( ) Φ( ) ( . ) .

a

68%

95.4%

2 2

99.7%

3 3

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

30

1 ( , )Normalna porazdelitev je dober približek za binomsko porazdelit ev N np, np( - p) b n p

b(10,0.4)N(4,1.55)

b(20,0.6)N(12,2.19) b(100,0.2

)N(20,4)

2 11 2integralska:

x - np x - npP(x X x ) Φ Φ

npq npq

Laplaceova ocena za binomsko porazdelitev b(n,p) (q=1- p):

2

21 1

2lokaln a:

(k-np)-

k n-k npqn k - np p q e

k π npq npq npq

Žogo vržemo na koš 100-krat, pri čemer je verjetnost zadetka 70%. Kolikšna je verjetnost, da bomo zadeli več kot 65-krat?

100100

66

10065 100 0 7 0 3 0 837 83.7%k k

k

P( B ) . . .k

100 100 0.7 66 100 0.765 100 6.54 0.87 0.5 0.3078

100 0.7 0.3 100 0.7 0.380.8%

- -P( B )

MATEMATIKA 2

VERJETNOST IN STATISTIKA SLUČAJNE SPREMENLJIVKE

31

Primerjava binomske, Poissonove in normalne porazdelitve

Normalna porazdelitev je običajno boljši približek za binomsko kot Poissonova.

Ko je produkt n.p majhen (in n dovolj velik) pa je Poissonov približek boljši.

b(50,0.4)

P(20)

b(100,0.02)

P(2)

N(2,1.4)

N(20,3.46)

MATEMATIKA 2

VERJETNOST IN STATISTIKA POVPREČNA VREDNOST

32

POVPREČNA VREDNOST

X diskretna, vrednosti xk, gostota p(xk) X zvezna, gostota p(x)

( )k kk

E(X) x p x povprečna vrednost spremenljivke X

E X x p x dx

Na ruleti so številke od 1 do 36 ter še 0 in 00. Kdor vloži 1 EUR na sode, dobi ali zgubi 1 EUR glede na to ali kroglica pade na sodo oziroma liho številko.

18 201 1

38

1

1938E(X)

Kdor vloži 1 EUR na izbrano številko (npr. 25) dobi 36 EUR, če kroglica pade na 25, v nasprotnem pa zgubi 1 EUR.

1 3736 1

38

1

3838E(X)

0.01

0 0

0.01 0- x

xp(x)

e x

Življenjska doba žarnice je porazdeljena eksponentno. Kolikšna je, v povprečju, njena življenjska doba?

0.01

0

0.01 0.01

0 0

0.01

0

0.01

1 10.01

0.01 0.011 1

0.100

01 0.01 ur

- x

- x - x

- x

E(X) x e dx

- x e e dx

- e

Dobiček X : +1 z verjetnostjo 18/38 -1 z verjetnostjo 20/38.

Povprečni dobiček:

Povprečni dobiček:

MATEMATIKA 2

VERJETNOST IN STATISTIKA POVPREČNA VREDNOST

33

V neki tovarni je približno en izdelek od desetih pokvarjen. Vsak dan izdelke pregledujejo enega po enega dokler ne najdejo pokvarjenega. Koliko izdelkov morajo v povprečju pregledati?

1

1

1 k-

k

E(X) k p ( - p)

trik:

12

0 1

12 2

1

1 1

1 11 1

11 1

k k-

k k

k-

k

x k x- x - x

k ( - p)p- ( - p)

1

p

Povprečno morajo dnevno pregledati po 10 izdelkov.

Igralec na ruleti igra po naslednjem sistemu. Vsakič igra igro z verjetnostjo 0.5 (npr. stavi na rdeče, izidov 0 in 00 ne štejemo). Najprej vloži 1 EUR; če izgubi, podvoji vložek in to ponavlja, dokler ne zmaga; ob vsaki zmagi je na dobičku 1 EUR (zaporedja vložkov so 1-2, 1-2-4, 1-2-4-8, 1-2-4-8-16 itn.). Po zmagi spet začne z 1 EUR ...Ali je to zanesljiva pot do zaslužka?

10

12

2k

kk

E(X)

Povprečna vrednost slučajne spremenljivke X ni definirana!‘Sistem’ zahteva neskončno zalogo denarja (in možnost za neomejene stave).

Naj bo X količina denarja vložena pri zadnji igri (tisti, v kateri igralec zmaga).Zaloga vrednosti X je {1,2,4,8,...}, tj. {2k; k=0,1,2,3,...}; porazdelitev je P(X=2k)=2-(k+1).

X je geometrično porazdeljena s p=0.1:

MATEMATIKA 2

VERJETNOST IN STATISTIKA RAZPRŠENOST

34

RAZPRŠENOST

Razpršenost je povprečje odklonov spremenljivke od njene povprečne vrednosti:

2k k

k

D(X) (x m) p(x ) 2D(X) (x m) p(x) dx

m=E(X)

praktična formula:

2D(X) E X E X razpršenost (varianca, disperzija)

2 2( ) ( )D(X) E X E X

2

2 2 2

2 2

2 2 22

2

2

2

D(X) (x - m) p(x) dx (x - mx m ) p(x) dx

x p(x) dx - m x p(x) dx m p(x) dx

E(X ) - m m E(X ) - m

MATEMATIKA 2

VERJETNOST IN STATISTIKA RAZPRŠENOST

35

σ(X) D(X) standardni odklon slučajne spremenljivke X

2D aX b a D X

σ aX b a σ X

1 1 1 1 1 1 21( ) 1 2 3 4 5 6 3.5

6 6 6 6 6 6 6E X

2 1 1 1 1 1 1 91( ) 1 4 9 16 25 36

6 6 6 6 6 6 6E X

291 21 35

( )6 6 2

2. 21

9D X

Kako je razpršeno število pik pri metu kocke?

2.92 1.71Standardni odklon pri metu kocke je

2 2

22 2 2

22 2

2

D aX b E aX b E aX b

E a X abX b aE X b

a E X E X

MATEMATIKA 2

VERJETNOST IN STATISTIKA POVPREČNA VREDNOST IN RAZPRŠENOST

36

E(X)=n.

p

D(X)=n.p. q

: 0,1,2,..., , 1, -Binomska porazdelitev zaloga (kjer je )k n-kk

nn p p q q p

kb n p

: 0,1,2,3,... ,Poissonova porazdelitev zaloga k

-ak

ap P

k!a e

E(X)=a

D(X)=a

POVPREČNA VREDNOST IN RAZPRŠENOST NEKATERIH POMEMBNIH PORAZDELITEV

2 2

0 0

( ) ( )Sešteti moramo in n n

k n-k k n-k

k k

n nE X k p q E X k p q

k k

0

( )vpeljemo pomožno funkcijo n

n k n-k k

k

npx q p q x

k

1 1

0

(( ) ) ( )n

k n-k k n n

k

nk p q x px q n px q p

k

1

0

1 ( 1 ) n

k n-k n

k

nx k p q n p q p np

k

2 2 2

0

( 1) (( ) ) ( 1)( )n

k n-k k n n

k

nk k p q x px q n n px q p

k

2 1 2 2 2

0

1 ( 1)( 1 ) n

k n-k n

k

nx k p q n n p q p np n p npq

k

1

0 0 0

( )! ! !

k k k

x x x a a a

k k k

x x ae k e e k e a e e a

k k k

22 2 2 2

0 0 0

( 1) ( )! ! !

k k k

x a a

k k k

x a ae k k k k e a k e a a

k k k

MATEMATIKA 2

VERJETNOST IN STATISTIKA POVPREČNA VREDNOST IN RAZPRŠENOST

37

2

1

21 1: , ,

2,Normalna porazdelitev zaloga

x-a-

σ x - ap(x) e

σπa

σN

σ

=0(liha funkcija)

=1

E(X)=a

=1=0

D(X)= 2

(X)=

1( )

x - aE X x dx

σ σ

( )t a t dt t t dt a t dt

1

, x a

t dt dx

2 2 2 2 21( ) 2

x - ax dx t a t dt t t dt a t t dt a t dt

σ σ

2 2 2 2( )t t t dt a a

( ) ( )

u t du dt

dv t t dt v t

a

MATEMATIKA 2

VERJETNOST IN STATISTIKA POVPREČNA VREDNOST IN RAZPRŠENOST

38

enakomerna 1,2,...,n

1( ) ( [ , ]) b ap x x a b

12

n 2 112

n 2 112

n

binomska b(n,p) 0,1,2,...,n ( ) (1 )k n knp k p p

k

np (1 )np p (1 )np p

geometrijska 1,2,3,... 1( ) (1 )kp k p p 1p 2

1 p

p

1 pp

Poissonova P(a) 0,1,2,... !( )k aa

kp k e a a a

enakomerna [ , ]a b 2a b 2( )

12b a ( )

2 3

b a

eksponentna [0, ) ( ) axp x ae

1( ) np k

1a

1a2

1a

normalna N(a,s) ( , ) 2121

2( )

x a

p x e

a 2

porazdelitev zaloga gostota E(X) D(X) s(X)

disk

retn

ezv

ezne

MATEMATIKA 2

VERJETNOST IN STATISTIKA SKUPNE PORAZDELITVE

39

KOVARIANCA

X,Y neodvisna ⇒ X,Y nekorelirana ⇔ D(X+Y)=D(X)+D(Y)

X,Y sta nekorelirana, če je K(X,Y)=0

22

2 2

2

2

D X Y E X Y E X Y E X E X Y E Y

E X E X Y E Y X E X Y E Y

D X D Y E X E X Y E Y

( ) ( ) ( ) 2 ,D X Y D X D Y K X Y

1 2 1

3 31 18

12

8

12

8 8 8

1

8

8

8

2 18 8

0

1

0 1 2 3

0

0

x y\ 1 3 3 1 121 2 3

2 8 8 8 8

7 6 1

88 8

E(X) E(Y)

K(X,Y)

1 1 2 12 8 8 8

0 1 2 3:porazdelitev XY

X in Y sta korelirana (in torej tudi odvisna)

1 2 1 71 2 3

8 8 8 8E(XY)

,

kovarianca spremenljivk in

K X Y E X E X Y E Y E XY E X E Y

X Y

MATEMATIKA 2

VERJETNOST IN STATISTIKA SKUPNE PORAZDELITVE

40

korelacijski koeficient K X,Y X E X Y E Y

r X,Y Eσ X σ Y σ X σ Y

2 2

1 12 1

2 8 8

1 1 3 3 1 3( 1 4 9 3 (

2 2 8 8 8 21

82

0 28 73

od prej: E(X) E(Y) K(X,Y)

E(X ) σ X) E(Y ) σ Y)

r(X,Y) .

10 2 2X E X Y E Y

D r X,Yσ X σ(Y)

r X,Y

10 2 2 r(X,Y) X E X Y E Y

D r(X,Y) σ X σ Y

1 2 1

3 31 18

12

8

12

8 8 8

1

8

8

8

2 18 8

0

1

0 1 2 3

0

0

x y\

0, 1X E X E X E X X E X X

Eσ X σ X σ X σ X

spremenljivke

(ima povprečje 0 in standardni odklon 1

standardizacija

)

X E XX

σ X

1r X,Y

1 0 .

X E X Y E Y X E X Y E Yr X,Y D konst

σ X σ(Y) σ X σ(Y)

1 in sta linearno odvisna r X,Y X Y

MATEMATIKA 2

VERJETNOST IN STATISTIKA STATISTIKA

41

STATISTIKA

Formulacija problema:

opazujemo neko množico (končno ali neskončno), ki ji pravimo populacija; (npr. prebivalci Slovenije, izdelki neke tovarne, bolniki z neko boleznijo, delnice na borzi, izidi na ruleti)

vsak element populacije ima neko merljivo lastnost X; (npr. starost, kakovost izdelka, učinek zdravila, cena delnice)

vrednost X je zaradi nekega razloga (velikost populacije, način ali cena ugotavljanja, ...) znana le na delu populacije, ki mu pravimo vzorec;

Osnovni problem statistike: Kaj lahko povemo o lastnosti X na podlagi njenih vrednosti na vzorcu?

MATEMATIKA 2

VERJETNOST IN STATISTIKA VZORČENJE

42

Včasih skušamo reprezentativnost doseči z dirigiranim vzorčenjem (npr. onesnaženje običajno merijo na stalnih lokacijah). Obstaja nevarnost, da je takšno vzorčenje pristransko.

Če je vzorec naključno izbran, so vrednosti X na vzorcu slučajna spremenljivka. Enako velja za vse druge količine (povprečja, standardni odkloni...), ki jih izpeljemo iz teh vrednosti.

Idealni vzorec je reprezentativen v smislu, da se značilnosti X na vzorcu se ujemajo z značilnostmi na celotni populaciji. Pri naključnem vzorcu lahko določimo verjetnost, da je reprezentativen.

Omejili se bomo na primere, ko je izbira vzorca povsem naključna. To pomeni, da vzorec izbiramo zaporedoma in pri tem imajo vsi elementi populacije enako verjetnost, da se znajdejo v vzorcu.

VZORČENJE

(gre torej za izbiro z vračanjem; če je velikost vzorca majhna v primerjavi z velikostjo populacije smemo izbirati brez vračanja)

MATEMATIKA 2

VERJETNOST IN STATISTIKA STATISTIČNI PARAMETRI

43

Populacijski parametri:

velikost populacije: N

vrednosti X na populaciji: x1,x2,...,xN

1

1 N

kk

xN

populacijsko povprečje:

22

1

1 N

kk

σ x m N

populacijska razpršenost:

Vzorčni parametri:

velikost vzorca: n

vrednosti X na vzorcu: X1,X2,...,Xn

vzorčno povprečje:

1

1 n

kk

X Xn

vzorčna razpršenost:

22

1

1

1

n

kk

s X X n -

MATEMATIKA 2

VERJETNOST IN STATISTIKA STATISTIČNI PARAMETRI

44

POVPREČNA VREDNOST IN RAZPRŠENOST VZORČNIH PARAMETROV

vzorec velikosti 1: E(Xk)= (populacijsko povprečje )

D(Xk)= 2 (populacijska razpršenost)

1 1

1 1n n

k kk k

E( X ) E X E(X ) μ n n

2

(σ σ

D( X ) , σ X )n n

vzorec velikosti n:

korekcijski faktor za primer relativno velikega vzorca

(enostavno vzorčenje)

E( X ) μ

2 2 11

1 1

σ N - n σ n -D( X ) -

n N - n N -

2

21 1

1 1n n

k kk k

σD( X ) D X D(X )

n n n

(vzorčenje z vračanjem)

MATEMATIKA 2

VERJETNOST IN STATISTIKA STATISTIČNI PARAMETRI

45

2

1

1:Izračun

n

kk

E X X n

2 2 2 2

22 2 2 2 2

k k kE(X ) D(X ) E(X ) σ μσ

E( X ) D( X ) E( X ) μn

2 22

1 1

1 1n n

k kk k

E X X E(X ) E( X )n n

2 2 2 22 2 2

1 1 1 1 1

1 1 1 1 12 2

n n n n n

k k k k k kk k k k k

X X X XX X X X X X X Xn n n n n

Povprečna vrednost količine na množici vseh vzorcev ni enaka 2.

Pravimo, da gre za pristransko oceno populacijske razpršenosti.

2

1

1 n

kk

X X n

E(s2)= 2

2

2 2 2 21nσ

σ μ μ n

Pri dovolj velikih vzorcih je razlika zanemarljiva, pri majhnih vzorcih pa ne,

zato kot mero vzorčne razpršenosti vzamemo 22

1

1

1

n

kk

s X X n

2

11

1

Povzetek:

1. vzorčno povprečje je nepristranska ocena za populacijsko povprečje

2. standardni odklon pri tej oceni je (oz. , kadar je vzorec relativno velik)

3. vzorčna razpršenost j

X

nNn n

s

2e nepristranska ocena za populacijsko razpršenost

MATEMATIKA 2

VERJETNOST IN STATISTIKA OPISOVANJE PODATKOV

46

rezultati kolokvija

40196848592831302525363941886660573794449098592992556443545287343674618054

0

1

2

3

4

5

6

7

8

9

1-10 11-20 21-30 31-40 41-50 51-60 61-70 71-80 81-90 91-100

0

1

2

3

4

5

6

1-5 6-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50 51-55 56-60 61-65 66-70 71-75 76-80 81-85 86-90 91-95

0

1

2

3

1 11 21 31 41 51 61 71 81 91

53.9722.16

Xs

52.8321.95

Xs

53.1721.93

Xs

intervali dolžine 5

intervali dolžine 10

Običajno tvorimo 10-20 kategorij. Zaželjeno je, da je v večini kategoriji vsaj 5 enot. Pri računanju povprečja in razpršenosti upoštevamo sredine intervalov.

MATEMATIKA 2

VERJETNOST IN STATISTIKA OCENJEVANJE PARAMETROV

47

INTERVALSKO OCENJEVANJE

Vzorčno povprečje in razpršenost sta primerna približka za populacijsko povprečje in razpršenost. Kolikšna je natančnost teh približkov?

Simulirali smo 10 zaporedij po 100 metov kocke in dobili naslednjo tabelo:

1.simulacija 5 5 6 3 2 6 4 6 4 3 5 4 5 4 2 6 6 1 4 2 6 6 5 2 5 4 3 5 1 5 6 6 3 2 2 6 6 6 1 3 3 6 4 1 4 1 3 6 4 1 6 2 1 2 1 4 6 5 3 1 1 4 6 1 4 5 4 6 4 2 3 6 3 3 4 2 6 3 2 6 4 5 3 1 1 4 1 6 1 6 3 5 1 1 1 3 2 2 2 2

2.simulacija 1 4 6 4 5 4 6 2 6 1 4 4 2 4 6 2 1 2 3 6 2 1 3 1 5 2 6 5 1 3 2 1 1 1 5 3 5 3 1 6 5 2 4 5 2 6 1 3 5 4 5 4 1 6 1 6 4 1 2 2 4 4 6 2 5 3 2 3 6 5 2 5 4 5 3 3 1 2 4 2 3 1 2 6 4 4 6 5 4 4 3 4 5 2 3 3 2 6 6 4

3.simulacija 4 5 5 4 6 6 3 5 6 2 2 5 5 4 6 1 6 4 5 5 4 1 5 2 6 3 3 5 5 4 4 2 4 5 4 4 2 6 6 5 2 6 4 4 5 5 6 1 2 5 2 5 6 6 6 3 6 4 4 2 5 1 6 3 4 1 3 5 2 1 3 1 3 5 2 2 2 5 5 4 6 6 4 6 5 3 1 3 6 1 4 5 4 4 5 5 3 2 4 1

4.simulacija 6 1 5 6 4 2 6 5 3 3 4 1 2 3 5 4 2 2 3 6 6 5 2 6 1 1 1 6 2 1 5 1 5 3 4 1 6 2 6 3 2 6 2 6 1 6 6 1 1 2 3 3 5 6 5 2 5 1 1 3 1 6 5 2 1 1 6 1 6 2 6 6 2 5 2 2 5 4 3 6 5 6 4 5 2 6 1 6 4 4 1 1 3 1 3 1 1 5 5 1

5.simulacija 2 3 3 5 5 1 4 4 4 1 6 6 6 4 3 5 6 3 3 5 5 2 3 5 3 3 6 2 5 4 2 4 2 4 2 5 4 5 1 1 2 3 5 4 4 1 4 5 4 4 2 5 2 5 4 5 4 1 3 5 6 4 5 1 1 2 3 4 6 2 5 6 5 1 6 6 5 5 1 4 5 4 6 4 2 5 2 2 5 2 1 2 5 2 4 5 4 2 6 3

6.simulacija 1 4 1 2 3 1 6 1 3 6 6 5 6 1 3 2 2 2 2 2 4 2 2 2 2 6 3 5 5 4 1 2 6 3 2 3 4 1 6 1 5 1 1 4 5 1 1 2 4 1 2 4 1 5 5 4 6 6 5 5 5 1 1 3 2 6 4 1 5 4 1 1 2 5 6 4 6 5 6 4 2 3 4 4 1 3 6 4 5 1 4 1 6 1 3 1 3 3 5 5

7.simulacija 4 2 4 4 2 5 5 2 3 1 1 6 4 3 1 6 6 6 4 1 6 2 4 5 4 5 4 1 5 6 3 2 3 6 4 2 3 4 6 5 1 5 4 4 5 5 2 4 5 1 5 2 2 1 1 3 3 4 2 5 5 2 4 3 3 5 5 3 3 5 2 5 1 1 4 3 5 4 2 2 6 1 4 6 3 5 2 2 2 2 3 6 6 4 6 2 4 3 4 1

8.simulacija 2 6 2 2 5 4 4 1 3 4 5 2 1 6 6 1 5 4 1 1 4 1 6 3 6 5 5 6 5 3 5 1 6 3 1 4 2 1 6 4 3 5 3 4 6 5 2 3 4 3 1 2 3 2 4 1 4 5 1 4 2 6 2 4 2 4 3 6 2 4 3 1 5 5 6 5 1 2 5 2 5 1 1 2 6 3 1 3 6 2 3 5 3 3 6 3 4 1 4 4

9.simulacija 2 5 5 3 2 3 2 1 3 5 3 5 6 6 3 3 2 5 2 3 6 2 2 6 5 4 6 6 3 2 4 2 1 6 5 2 3 2 2 1 1 6 3 1 1 4 1 2 4 2 5 2 5 2 6 4 6 1 3 5 1 5 1 4 4 2 3 5 6 2 2 3 2 4 5 6 3 5 6 4 3 3 2 5 6 3 2 3 3 4 6 1 1 4 2 2 5 1 6 4

10.simulacija 5 5 3 2 6 4 2 4 5 4 1 3 3 4 1 3 4 1 6 4 1 1 4 6 3 5 1 2 5 6 4 3 6 3 1 1 6 5 1 1 5 5 3 3 1 2 3 6 4 5 2 6 1 5 2 5 5 2 6 4 4 3 4 1 3 5 6 1 3 3 2 6 4 5 4 5 2 2 1 2 4 3 6 4 2 5 4 3 2 2 5 3 6 2 4 3 4 4 3 5

3.59 1.800 3.47 1.687 3.94 1.605 3.44 1.930 3.68 1.567 3.28 1.789 3.53 1.602 3.43 1.692 3.42 1.668 3.50 1.609

X s

Kaj lahko sklepamo o dejanski povprečni vrednosti in standardnemu odklonu?

MATEMATIKA 2

VERJETNOST IN STATISTIKA OCENJEVANJE PARAMETROV

48

Razsevni diagram za povprečja in standardne odklone simulacij.

Dejanska vrednost: =3.5, =1.708

Povprečje simulacij: =3.53, =1.695

...pač pa lahko določimo interval, za katerega je zelo verjetno, da vsebuje iskani populacijski parameter.

Osnovni problem je: kako na podlagi vzorčnih parametrov oceniti dejanske populacijske parametre?

Pri numeričnih metodah določimo približek in oceno za napako približka. Dejanska vrednost je nekje na intervalu okoli približka.

Na podlagi vzorca ni mogoče sklepati o parametrih populacije s 100% zanesljivostjo,...

MATEMATIKA 2

VERJETNOST IN STATISTIKA OCENJEVANJE PARAMETROV

49

2 2 2 0 9544X - a

P n .σ

2 295 44

σ σP X a X . %

n n

XNa vzorcu velikosti n dobimo vrednosti X1,X2,...,Xn in izračunamo njihovo povprečje

Naj bo količina X normalno porazdeljena na celotni populaciji z neznanim povprečjem a. Zaradi enostavnosti privzemimo, da je standardni odklon enak .

, 0,1 .Velja: porazdelitev je normalna z je porazdeljena po X - a

X E X a X n Nσn

2 2. S 95% verjetnostjo lahko trdimo, da leži populacijsko povprečje na intervalu

σ σX ,X

n n

(tj. za okoli 95% vzorcev je populacijsko povprečje na izračunanem intervalu, za okoli 5% vzorcev pa je izven)

3 32 3 0 9972Podobno dobimo:

σ σP X a X ( ) .

n n

3 3. S 99.7% verjetnostjo je populacijsko povprečje na intervalu

σ σX ,X

n n

Verjetnost, s katero se iskani parameter nahaja na nekem intervalu je stopnja zaupanja.

Pripadajoči interval je interval zaupanja.

Večja stopnja zaupanja ali večja razpršenost potreben je širši interval zaupanja.⇒Večji vzorec zadošča ⇒ ožji interval zaupanja.

MATEMATIKA 2

VERJETNOST IN STATISTIKA OCENJEVANJE PARAMETROV

50

Splošni postopek za določanje intervalazaupanja za populacijski parameter u:

1) določimo vzorčni parameter ū, ki je primeren približek za u

(npr. za povprečje ali s 2 za razpršenost)

2) določimo porazdelitveni zakon vzorčnega parametra ū (npr. normalni, binomski,...; to je najzahtevnejši korak - praviloma se omejimo na standardne primere)

3) izberemo stopnjo zaupanja (običajno =95% ali =99%)

4) na podlagi porazdelitve in vrednosti vzorčnega parametra ū na danem vzorcu določimo interval zaupanja [U1,U2] za u, ki pripada izbrani stopnji zaupanja

( tj. tako, da velja P(U1 ≤ u ≤ U2) = ).

X

MATEMATIKA 2

VERJETNOST IN STATISTIKA OCENJEVANJE PARAMETROV

51

Pri manjših vzorcih ali neznanemu standardnemu odklonu ne moremo privzeti, da je povprečje normalno porazdeljeno. Običajno dobimo za približek porazdelitev, ki je odvisna od velikosti vzorca.

Naj bo količina X porazdeljena normalno z neznanim povprečjem a in standardnim odklonom .Iščemo interval zaupanja za populacijsko povprečje a pri stopnji zaupanja .

,

.

Imamo vzorec velikosti : parameter ocenimo z

parameter pa z in tvorimo novo spremenljivko X a

T

X

n

a

ss

n

Velja: T je porazdeljena po t.im. Studentovem porazdelitvenem zakonu S(n-1)

2

2

2

52 2

3

1

6 33 :

3

1

1

1 :

2 :

2

S p

S p xπ x

..

S p x

x

...

x

.

x

.

1

2 2

1Studentova porazdelitev ima gostoto

n-

n

xS n p(x) k

n

0,1N

MATEMATIKA 2

VERJETNOST IN STATISTIKA OCENJEVANJE PARAMETROV

52

Tabela mejnih vrednosti porazdelitve S(n):

parameter n(‘stopnje prostosti’)

mejna vrednost na stopnji zaupanja 1- ( P(|T| ≤ t)=1- )

95% 99%

tSenčena ploščina je enaka .

mejne vrednosti za normalno porazdelitev

MATEMATIKA 2

VERJETNOST IN STATISTIKA OCENJEVANJE PARAMETROV

53

Za izbrano stopnjo zaupanja iz tabel določimo t, da velja P(|T| ≤ t)=

Interval zaupanja za a na stopnji zaupanja je α α

s sX - t ,X t

n n

X s 3.59 1.800 [3.237,3.942] [3.125,4.054]

3.47 1.687 [3.139,3.800] [3.034,3.905]

3.94 1.605 [3.625,4.254] [3.495,4.354]

3.44 1.930 [3.061,3.818] [2.941,3.938]

3.68 1.567 [3.372,3.987] [3.275,4.084]

3.28 1.789 [2.929,3.630] [2.818,3.741]

3.53 1.602 [3.215,3.844] [3.116,3.943]

3.43 1.692 [3.098,3.761] [2.993,3.866]

3.42 1.668 [3.092,3.747] [2.989,3.850]

3.50 1.609 [3.184,3.815] [3.084,3.915]

interval zaupanja 95% 99%

pri 3. poskusu je dejansko povprečje izven 95%-intervala zaupanja in komajda znotraj 99%-intervala zaupanja.

MATEMATIKA 2

VERJETNOST IN STATISTIKA OCENJEVANJE PARAMETROV

54

Porazdelitvena gostota ni simetrična, zato za zahtevano stopnjo zaupanja poiščemo meji 2

a in 2b , da velja

P( 2 ≤ 2

a )=P( 2 ≥ 2

b )=1-/2 ⇒ P(2a ≤ 2 ≤ 2

b )=

Intervalska ocena za standardni odklon pri normalni porazdelitvi:2

22

1s

(n )σ

Primerjamo populacijsko razpršenost 2 z vzorčno razpršenostjo s2:

Velja: 2 je porazdeljena po zakonu ‘hi-kvadrat’ 2(n-1).

2 22

2 2

1 1Interval zaupanja za na stopnji zaupanja je

b a

n s n s,

χ χ

Porazdelitev hi-kvadrat 2(n) ima gostoto 1

2 2 ( 0)n x

-

n p(x) k x e x

2

2

2

2

2

2

2

2

1

14

4

1

1

2

1

2

2

3

2

x

x-

-

x-

x-

χ ( ) :

eχ ( ) :

χ ( ) : p(x)

p(x)

χ ( ) : p(x) e

x

.

p(x

....

e

e

)x

π

π

x

2a

2b

MATEMATIKA 2

VERJETNOST IN STATISTIKA OCENJEVANJE PARAMETROV

55

mejna vrednost 2

( P( 2 ≥ 2

)= )

Tabela mejnih vrednosti porazdelitve 2(n)

parameter n(‘stopnje prostosti’)

2

Senčena ploščina je enaka .

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

56

PRESKUŠANJE STATISTIČNIH DOMNEV

Statistična domneva je trditev o porazdelitvenem zakonu slučajne spremeljivke, ki jo želimo potrditi ali ovreči na podlagi vrednosti, ki jih zavzame na nekem vzorcu.

parametrične domneve (trditve o parametrih znanega porazdelitvenega zakona, npr. Poissonovo porazdeljena spremenljivka ima povrečje a)

neparametrične domneve(trditve o naravi porazdelitvenega zakona, npr. spremenljivka je normalno porazdeljena)

Domneva je enostavna, če v celoti določa porazdelitev (tip in parametre), sicer pa je sestavljena.

(npr. če H0 trdi, da je porazdelitev Poissonova z neznanim parametrom - H1 pa, da ni Poissonova, sta obe sestavljeni)

Omejili se bomo na osnovne primere parametričnih domnev, ko je vsaj ničelna domneva enostavna.

primerjamo dve domnevi:

H0: ničelna domneva in H1: alternativna domneva

(npr. H0 trdi, da porazdelitev ustreza zakonu P(2), H1 pa, da ustreza zakonu P(3.5))

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

57

Leta 2003 je bilo v Sloveniji 17321 živorojenih otrok, od tega 8930 dečkov in 8391 deklic. Zanima nas, ali je to v nasprotju z domnevo, da je rojstvo dečka enako verjetno kot rojstvo deklice.

Izberemo majhno število (npr. 0.05 ali 0.01) in poiščemo kritično vrednost c, da je pri pogoju p=0.5 verjetnost P(X > c)=.

Za slučajno spremenljivko X vzamemo število rojstev dečkov. X je porazdeljena binomsko b(n,p). H0 je enostavna domneva p=0.5, H1 je sestavljena domneva p > 0.5.

Če je število dečkov večje od c, potem H0 zavrnemo, v nasprotnem primeru pa je ne zavrnemo. Binomsko porazdelitev b(17321,0.5) aproksimiramo z N(8660.5, 65.80), in vzamemo =0.05.

0 050 05 0 05

0 050 05 0 05

1 8660 51 1 0 05

2 65 808660 5 8

8768660 5

0 45 1 6565 80 65 8

50

.

.

..

. .

c .P(X c ) P(X c ) Φ .

.c . c .

Φ . . . .

c .

Ker je dejanska vrednost (8930) večja od c0.05, ničelno domnevo zavrnemo.

Pri 1% značilnosti preskusa dobimo c0.01=8813.5, torej domnevo zavrnemo tudi pri ostrejšem preskusu.

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

58

Enostavna parametrična domneva u=u0 ima tri alternativne parametrične domneve:

u > u0

u < u0

u ≠ u0

Za prvo in drugo alternativo pravimo, da sta enostranski, za tretjo pa, da je dvostranska.

u0 c

sprejmemo zavrnemo

c u0

zavrnemo sprejmemo

c1 u0 c2

zavrnemo sprejmemo zavrnemo

Pri preskušanju trdnosti nekega materiala je smiselna enostranska alternativa, saj nas ne moti, če je le-ta trdnejši kot pričakujemo. Pri preskušanju odstopov velikosti vijaka glede na matico pa raje oblikujemo dvostransko alternativo.

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

59

Z porazdeljena po N(0,1) - kako določimo c?

11 1 2

2α α α α

αα P( Z c ) P( Z c ) Φ c Φ c

1 11 1

2 2α α α αα P(Z c ) P(Z c ) Φ c Φ c - α

1 1

2 2α α αα P(Z c ) Φ c Φ c α

Podobno ravnamo pri drugih preskusih. Pri t-testu tvorimo in upoštevamo, da je T porazdeljen po zakonu S(n-1).

Kritične vrednosti za dvostranski poskus pri značilnosti so v (n-1)-vivrstici in stolpcu, ki ustreza .

Kritične vrednosti za enostranski poskusa pa so v stolpcu, ki ustreza .

X - aT n

s

2

α

dvostranski preskus:

enostranski preskus:

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

60

Povprečje 10 meritev gostote neke snovi nam je dalo 1.35 g/cm3, čeprav bi teoretično pričakovali gostoto 1.2 g/cm3. Na podlagi izkušenj vemo, da je pri tovrstnem merjenju standardna napaka =0.25g/cm3. Ali na podlagi tega lahko zavrnemo H0( =1.2 g/cm3)? Značilnost preskusa naj bo 5%.

1.) H1( ≠1.2) (dvostranski preskus)

1 35 1 210 1 89

0 25

X - ρ . .Z n .

σ .

0 05 0 050 475 1 96. .Φ c . c . Ničelne domneve ne zavrnemo.(testna vrednost je manjša od kritične)

2.) H1( > 1.2) (enostranski preskus)

0 05 0 050 45 1 65. .Φ c . c . Ničelno domnevo zavrnemo.(testna vrednost je večja od kritične)

Pri sestavljeni alternativi lahko manj verjetni del alternative zmanjša možnost za izključitev ničelne domneve.

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

61

Splošni problem: kako ugotovimo, ali je vzorec X1,...,Xn v skladu z domnevo, da je opazovana populacija porazdeljena po nekem zakonu F(x) ?

Lotimo se ga takole (Pearsonov 2 – test, Goodness of Fit):

1. Realno os razdelimo na intervale I1,...,IK tako, da vsak vsebuje vsaj 5 elementov vzorca. Število vzorcev na intervalu Ik označimo z bk.

2. Ob privzetku, da je porazdelitev populacije F(x) izračunamo teoretično število vzorcev na intervalu Ik in ga označimo z ek.

220

1

( )Kk k

k k

b eχ

e

3. Izračunamo deviacijo

Dejstvo: 0

2 je porazdeljena po zakonu 2(K-1).

4. Za izbrano stopnjo značilnosti določimo 2 iz enačbe P( 2

≥ 2 )=.

Domnevo zavrnemo, če je 0

2 ≥ 2

.

Kovanec vržemo 50 krat in 29-krat dobimo cifro. Ali lahko sklepamo, da je popačen?

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

62

V našem primeru postavimo grb=0, cifra=1 in intervala I1=(-∞,0.5] in I1=(0.5,+∞).

Dobimo: b0=21, b1=29, e0=e1=25 in 0

2 = 16/25+16/25=1.28

Za 2(1) in pri stopnji značilnosti =5% je mejna vrednost 2 =3.841, zato

domneve, da je kovanec pošten ne zavrnemo.

Koliko cifer bi morali dobiti pri 50 metih, da bi lahko na 5% stopnji značilnosti zavrnili domnevo o poštenosti kocke?

Odstop označimo z a in rešimo a2/25+a2/25 > 3.841, kar nam da a ≥ 7. To pomeni, da bi pri 32 cifrah ali več zavrnili domnevo o poštenosti kocke.

Na stopnji značilnosti 1% pa bi jo zavrnili šele pri 35 cifrah ali več.

G. Mendel je pri enem svojih znamenitih poskusov dobil 355 rumenih in 123 zelenih grahov. Ali je to v skladu z domnevo, da je razmerje med rumenimi in zelenimi 3:1?

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

63

Odvisna vzorca Bolnik Število dodatnih ur spanja

X (zdravilo A) Y (zdravilo B) 1 1.9 0.7 2 0.8 -1.6 3 1.1 -0.2 4 0.1 -1.2 5 -0.1 -0.1 6 4.4 3.4 7 5.5 3.7 8 1.6 0.8 9 4.6 0.0

10 3.4 2.0

Na bolnikih so preskušali vpliv dveh zdravil (A in B) proti nespečnosti. Ali lahko na podlagi podatka o dodatnem številu ur spanja sklepamo o tem, da je eno zdravilo bolj učinkovito od drugega?

Privzemimo, da imamo rezultate vpliva obeh zdravil na istih bolnikih. Tedaj naredimo parni t-test.(Če bi imeli rezultate na različnih bolnikih, bi morali uporabiti šibkejši neparni t-test.)

Tvorimo razliko Z=X-Y.

Primerjamo H0(a=0) proti H1(a≠0).

Z Z2

1.2 1.44 2.4 5.76 1.3 1.69 1.3 1.69 0.0 0.00 1.0 1.00 1.8 3.24 0.8 0.64 4.6 21.16 1.4 1.96

15.8 38.58

2

1.58

1 51, 1.23

Z

s . s

1.58 010 4.06

1.23t

0.025 2.26 4.06t

Pri 95% stopnji zaupanja domneve, da sta zdravili enakovredni zavrnemo.

Dejstvo: porazdeljena je po Studentovem zakonu S(n-1).

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

64

X Y1,07 3,351,11 3,501,23 3,691,24 3,701,24 3,771,26 3,801,30 3,981,35 4,011,41 4,121,42 4,121,44 4,201,48 4,281,57 4,411,57 4,441,61 4,601,63 4,581,69 4,701,75 4,781,75 4,831,79 4,90

LINEARNA REGRESIJA

S pomočjo metode najmanjših kvadratov lahko določimo premico, ki se najbolje prilega dani množici točk v ravnini.

Statistično pa so vrednosti Y podvržene naključnim vplivom, zato je le do določene mere verjetno, da so izračunani koeficienti regresijske premice a+bX blizu dejanskih.

Velja: (1) Interval zaupanja za smerni koeficient premice je

kjer je t mejna vrednost na stopnji zaupanja pri porazdelitvi S(n-2).

(2) r(X,Y)2 je število, ki pove, kolikšen delež razpršenosti spremenljivke Y je pojasnjen z razpršenostjo X.

2 2( ) ( ),

( ) ( )2 2

c cD Y D Yb b b b

D X D Xn n

MATEMATIKA 2

VERJETNOST IN STATISTIKA PRESKUŠANJE STATISTIČNIH DOMNEV

65

X Y1,07 3,351,11 3,501,23 3,691,24 3,701,24 3,771,26 3,801,30 3,981,35 4,011,41 4,121,42 4,121,44 4,201,48 4,281,57 4,411,57 4,441,61 4,601,63 4,581,69 4,701,75 4,781,75 4,831,79 4,90

2

( , )

( )

( ) ( )

=

xy x y K X Yb

D Xx x x

a y b x E Y b E X

( ) 1.445 ( ) 0.0454( ) 4.188 ( ) 0.202

( ) 6.149 ( , ) 0.0955

E X D XE Y D Y

E XY K X Y

1.147 2.103 a b

Interval zaupanja za smerni koeficient je [2.103-0.0412 t ,2.103+0.0412 t ]

Za =5% dobimo pri S(18) mejno vrednost t=2.101 in pripadajoči interval [2.016,2.190]

Za r(X,Y)2 pa dobimo 0.99, torej je vsa varianca Y posledica variance X