29
Dr. sc. Hrvoje Cajner Osnove statistike Inženjerska statistika Osnove statistike Kombinatorika i vjerojatnost Obrada empirijskih podataka Mjere položaja i rasipanja

Osnove statistike.pdf

  • Upload
    jurica

  • View
    70

  • Download
    3

Embed Size (px)

DESCRIPTION

FSB Inženjerska statistika

Citation preview

Page 1: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Osnove statistike

• Kombinatorika i vjerojatnost

• Obrada empirijskih podataka

• Mjere položaja i rasipanja

Page 2: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Kombinatorika

• Slučajni događaj – događaj koji se pod nekim

okolnostima može ali i ne mora dogoditi. Služe pri

određivanju vjerojatnosti slučajnih događaja

• Modeli u kombinatorici:

– Permutacije (bez ponavljanja i s ponavljanjem)

– Varijacije (bez ponavljanja i s ponavljanjem)

– Kombinacije

– Složene kombinacije

Page 3: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• permutacije bez ponavljanja:

– niz n istovrsnih elemenata kojima se određuje broj mogućih

redoslijeda (poređaja)

1...k)(n...1)(nnn!P(n)

Primjer: Na koliko se načina može poredati niz od 4 kuglice različite boje?

4212344!P(4)

• permutacije s ponavljanjem:

– niz n istovrsnih elemenata među kojima postoje određene

podgrupe - određuje se broj mogućih redoslijeda (poređaja)

!A...!A!An!

K21K...A2A,1A

(n)

P

Primjer: Na koliko se načina može poredati niz od 6 kuglica (2 crvene, 2 plave

te zelena i žuta)?

180!2!2

!6P 1,1,2,2

(6)

Permutacije

Page 4: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Varijacije • varijacije bez ponavljanja:

– niz n istovrsnih elemenata iz kojeg se uzima uzorak r te se određuje

broj različitih (mogućih) ishoda

r)!(n

n!V(n)

r

Primjer: Koliko različitih uzoraka od po 3 kuglice možemo složiti iz skupa od 5 kuglica?

Primjer: Igranje sportske prognoze. Na koliko se načina može ispuniti listić sportske

prognoze ako se na listiću nalazi 12 parova, a mogući ishodi su 1,0 i 2?

603)!(5

5!V

(5)

3

• varijacije s ponavljanjem:

– niz n istovrsnih elemenata iz kojeg se uzima uzorak r te se određuje broj

različitih (mogućih) ishoda s mogućnošću ponavljanja elemenata iz

skupa n do maksimalno r-puta

441 5313V 12(3)

12

rn(n)

rV

Page 5: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Kombinacije • kombinacije bez ponavljanja – (s ponavljanjem nemaju smisla):

– niz n istovrsnih elemenata iz kojeg se uzima uzorak od r elemenata

te se određuje broj različitih (mogućih) sastava uzorka gdje nije bitan

redoslijed već sadržaj (sastav)

r! r)!(n

n!

r

n

r!

!VK

(n)

r(n)

r

Primjer: Koliko treba ispuniti nizova da bi se u LOTU 7/39 sigurno dobila ‘sedmica’?

NAPOMENA: budući da nije bitan redoslijed odabiranja (izvlačenja) kuglica

radi se o kombinacijama.

937 380 157!7)!(39

39!

7

39K

(39)

7

Page 6: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Složene kombinacije • složene kombinacije – skup od N elemenata sadrži podskup elemenata

sa svojstvom A i podskup elemenata sa svojstvom Ā (non A)

N

M (A) (N-M) (Ā)

n

x el A (n-x) el Ā

x-n

MN

x

MK M))-(N(M

x))-(n(x

UZORAK

SKUP

Page 7: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Vjerojatnost

• Slučajni događaj – događaj koji se pod nekim okolnostima može a i ne mora

dogoditi

• Elementarni događaj – mogući ishod slučajnog događaja

• Skup (polje) mogućih događaja – skup koji se sastoji od elementarnih

događaja

• Vjerojatnost – mogućnost pojave nekog elementarnog događaja koji se promatra

n

n(A)P(A)

1P(A)

0P(A)

- nemoguć događaj

- siguran događaj

P(A)1)AP(

• Protivna vjerojatnost

n – broj svih mogućih ishoda (događaja)

n(A) – broj događaja sa svojstvom A

1P(A)0

Page 8: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• Teoremi vjerojatnosti (slučaj složenih događaja):

• zbrajanje vjerojatnosti - P(A1) ili P(A2)

• zanima nas vjerojatnost da se dogodi A1 ili A2

• uz uvjet da su događaji A1 i A2 disjunktni (međusobno se

isključuju)

)P(A)P(A)iliAP(A2121

Primjer: Bacamo kocku. Kolika je vjerojatnost da će kocka pokazati broj 2 ili 4 ili 6?

2

1

;

6

1

6

1

6

16) ili 4 ili P(2

6

16) P(broj

6

14) P(broj ;

6

12) P(broj

• množenje vjerojatnosti (NEZAVISNI DOGAĐAJI)- P(A1) i P(A2)

• zanima nas vjerojatnost događaja da se dogodi A1 i A2 (istovremeno)

)P(A)P(A) Ai P(A2121

Primjer: Bacamo kocku i novčić. Kolika je vjerojatnost da će kocka pokazati broj 6 i

novčić pasti na ‘glavu’?

12

1

2

1

6

1)'6' i glava'P('

2

1)glava'P(' ;

6

16) P(broj

Page 9: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• množenje vjerojatnosti (UVJETNI DOGAĐAJI)- P(A1) i P(A2)

• zanima nas vjerojatnost događaja da se realizira A1 i A2

• jedan događaj utječe na vjerojatnost drugog događaja

Primjer: U kutiji je 10 kuglica, 6 bijelih i 4 crvene kuglice. Kolika je vjerojatnost da

prva i druga kuglica budu bijele ako izvučenu kuglicu ne vraćamo u kutiju?

A1 - prva kuglica bijela

A2 – druga kuglica bijela

)/AP(A)P(A) Ai P(A12121

3

1;

9

5

10

6) Ai P(A

9

5)/AP(A

10

6)P(A

21121

• ostale vjerojatnosti - uvjet da se elementarni događaji ne isključuju te da se

dogodi bar jedan događaj

• slučaj kada tražimo vjerojatnost pojave događaja A1 ili A2 ili A1 i

A2. Takova vjerojatnost se računa na način da se od sume

vjerojatnosti za događaje A1 , A2 oduzme vjerojatnost događaja

A1 i A2 istovremeno (izbjegavanje dvostruke vjerojatnosti).

P(A2))P(AP(A2))P(A) Aili P(A1121

Page 10: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• Bayes-ov teorem

P(K1) P(p/K1)P(K1/p)=

P(K1) P(p/K1)+P(K2) P(p/K2)

0,15P(K1/p)= 0,375

0,15 0,25

P(A/B) -

P(B/A) -

Vjerojatnost da se dogodi A ako se dogodio B

Vjerojatnost da se dogodi B ako se dogodio A

Primjer: U dvije kutije su raspoređene crvene i plave kuglice. U prvoj kutiji je 7 crvenih i 3

plave kuglice, dok su u drugoj kutiji 5 crvenih i 5 plavih. Potrebno je pronaći

vjerojatnost da ako je odabrana plava kuglica da je izvučena iz prve kutije.

K1 K2

P(A) P(B/A) P(A) P(B/A)P(A/B)=

P(B) P(A) P(B/A)+P(A) P(B/A)

10P(K1)=P(K2)= =0,5

20

3P(p/K1)= 0,3

10

5P(p/K2)= 0,5

10

Page 11: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• Upotreba teorije vjerojatnosti na primjerima iz prakse

• Slučaj serijskog spoja – problem vezan za pouzdanost sustava

Primjer: Pojednostavljen slučaj vjerojatnosti pogotka cilja projektilom. Projektil na

putu do cilja prolazi kroz faze koje imaju svoju vjerojatnost uspjeha.

Vjerojatnost uspješnog pogotka cilja se može prikazati kao serijski spoj

faza (vjerojatnosti uspjeha svake faze). Svaka faza ima vjerojatnost

uspjeha 0,99. Kolika je vjerojatnost uspješnog pogotka cilja?

0,9410,99pogodak) P(uspješan

P(kill)P(hit)P(trk)P(lock)P(lnch)P(det)pogodak) P(uspješan6

Za uspješan pogodak projektil mora uspješno proći sve faze.

Radi se o serijskom spoju (množenju vjerojatnosti).

Page 12: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• Slučaj paralelnog spoja – problem vezan za pouzdanost sustava

Primjer: U kritičnom dijelu nekoga procesa važno je da je barem jedna pumpa u

stanju ispravnog rada kako ne bi došlo do zastoja. Ako su vjerojatnosti

ispravnog rada (pouzdanost) svake pumpe R=0,99 kolika je vjerojatnost da

sustav funkcionira ispravno?

Budući da je P(ispravnog rada)+P(zastoja)=1

možemo pisati sljedeće:

0.9999990,010,010,01-1 rada) gP(ispravno

Q(pumpa3)Q(pumpa2)Q(pumpa1)P(zastoja)

;P(zastoja)-1rada) gP(ispravno

Page 13: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Obrada empirijskih podataka • deskriptivna statistika – opisivanje podataka iz uzorka ili populacije u formi

osnovnih parametara, identifikacija procesa

• osnovne vrste podataka – po nastanku varijable (upotreba različitih mjernih

ljestvica) se mogu klasificirati na:

1. Kvalitativne: nominalne (Da, Ne ; Dobar, Loš...), ordinalne (rangovi)

2. Kvantitativne: diskretne (cjelobrojne vrijednosti, pobrojane),

kontinuirane (neprekinute, mjerene)

a) Diskretne varijable – nastaju prebrojavanjem

P(n)P(2)..., P(1),P(0), )P(x ; n0,1,2...,x ii

b) Kontinuirane varijable – nastaju mjerenjem

0 1 2 3 4 5 xx x x x x

x

a b x

Page 14: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• Grafička obrada empirijskih podataka

• vrste grafičkih prikaza:

1. Histogram (‘bar chart’) – prikazivanje učestalosti podataka

stupićima te povezivanje vrhova u poligon frekvencija

- histogramski prikaz za diskretnu varijablu

- direktno očitavanje vjerojatnosti pojave pojedine

vrijednosti varijable

3028262422

7

6

5

4

3

2

1

0

x

Fre

qu

en

cy

Histogram - histogramski prikaz

za kontinuiranu

varijablu

- prikaz preko

razreda podataka po

kojima klasificiramo

podatke

- u tehnici se radi sa

razredima jednake

veličine (širine)

Primjer:

543210

12

10

8

6

4

2

0

C1

Fre

qu

en

cy

Histogram

Page 15: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

2. ‘Box- whisker’ prikaz (prikaz ‘kutija – brkovi’) – jedno od najčešćih prikaza podataka

Primjer:

- ‘box-whisker’ prikaz za kontinuiranu varijablu

- prikaz je moguće kreirati u različitim verzijama

(središnja točka medijan/aritmetička sredina,

podjela po percentilima/intervalima povjerenja...)

- jednostavna dijagnostika problematičnih podataka

(ekstrema, ‘outliera’)

- mogućnost prikazivanja dva ili više uzoraka

paralelno te brzo dijagnosticiranja njihovih relacija i

karakteristika x2x1

40

35

30

25

20

Da

ta

Boxplot of x1; x2

34323028262422

20

15

10

5

0

x1

Cu

mu

lati

ve F

req

uen

cy

Histogram of x1

- kumulanta – histogramski prikaz frekvencija koje se

kumuliraju od najnižega ka najvišem razredu

- mogućnost prikaza relativnih frekvencija (u %) na

ordinati

Page 16: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

3. ‘Stem-leaf’ prikaz (prikaz ‘stabljika - list’)

Primjer: fi Stem Leaf

2 21 0 2

4 22 3 3 4 9

5 23 1 2 5 8 9

4 24 5 6 7 8

2 25 4 8

1 26 4

- prikaz ‘stabljika-list’ se najčešće koristi na

podacima koji su u decimalnom obliku gdje

se znamenka cijelog broja prikazuju kao

stabljika a decimalni dio kao ‘list’

4. Ostali prikazi:

• ‘Individual plot’,

• ‘Scatter plot’,

• ‘Line plot’,

• ‘Dot plot’ ,

• ‘Marginal plot’ ,

• ‘Area plot’,

• ‘Pie chart’

• ‘Normal probability plot’,

• ...

Page 17: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Primjer grafičke analize podataka: Na jednom uzorku izmjerene su vrijednosti vlačne

čvrstoće šarže čeličnog lima (u N/mm2). Nakon mjerenja dobiveni su sljedeći

podaci: 430, 440, 450, 460, 440, 430, 410, 410

440, 440, 430, 440, 420, 450, 430, 450

420, 440, 420, 450, 410, 440, 460, 430

460450440430420410

7

6

5

4

3

2

1

0

Vlačne čvrstoće, N/mm2

Fre

kven

cij

a

Histogram

460450440430420410

25

20

15

10

5

0

Vlačne čvrstoće, N/mm2

Ku

mu

lati

vn

e f

rek

ven

cij

a

Histogram kumulativnih frekvencija

460

450

440

430

420

410V

lačn

e č

vrs

toće,

N/m

m2

Boxplot of Vlačne čvrstoće, N/mm2

Page 18: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• Numerička obrada empirijskih podataka

• aritmetička sredina – suma svih elemenata u populaciji podijeljena sa brojem

elemenata populacije (težište – paralela sa mehaničkim modelom)

N

x

μxE

N

i

i 1ocekivanje)(

n

xx

n

ii

1 uzorka sredina aritm.

• MJERE POLOŽAJA

• mod – podatak(ili razred) koji ima najveću frekvenciju

- mod dijeli distribuciju frekvencija na rastuću i padajuću stranu

- vrste distribucija s obzirom na mod

najvažnije svojstvo aritmetičke sredine: 0)(1

xxn

ii

Page 19: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• medijan – 50% podataka je manje, a 50% veće od te vrijednosti

• kvantili - vrijednosti numeričkog obilježja koje niz uređen po veličini dijele na

q jednakih dijelova Medijan

Kvartili

Decili

Percentili

Page 20: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• MJERE RASIPANJA

• standardna devijacija σ – prosječno odstupanje svakog podatka od arit. sredine

• varijanca σ2 – prosječno kvadratno odstupanje svakog podatka od arit. sredine

21

2

2

)(

n

xxn

ii

• koeficijent varijacije, V – međusobno uspoređivanje varijabilnosti pojava

ili svojstava

- pokazuje koliki odnos vrijednosti aritm. sredine iznosi

vrijednost standardne devijacije (u %)

100% x

V

koeficijent varijacije

(relativna mjera rasipanja)

• raspon, Rx – razlika najveće i najmanje vrijednosti u nekom nizu podataka

minmaxxxR

x

• nepristrana procjena varijance osnovnog skupa (σo2) :

2

2 1

( )

1

n

i

i

x x

sn

Page 21: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• MOMENTI STATISTIČKIH SKUPOVA

• mehanički model - greda, oslonac i opterećenje ( x1,x2, ... – jedinične sile)

x1 x2 x3 x4 x5 x6 x7

– centralni moment r-tog reda – moment oko centra (aritmetička sredina):

n

)x(xM

n

1i

r

i

r

r=0 M0=1

r=1 M1=0

r=2 M2=σ2

r=3 M3

r=4 M4

varijanca

– pomoćni moment r-tog reda – moment oko točke 0

n

xm

n

1i

r

i

r

r=0 m0=1

r=1 m1= x aritmetička sredina

koeficijent asimetrije

koeficijent spljoštenosti

Page 22: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• MJERE OBLIKA STATISTIČKOG SKUPA

• koeficijent asimetrije (Skewness) – mjera nagnutosti distribucije na lijevu

ili desnu stranu

3

1

3

3

n

1i

3)xi(x

3

nM 3

svaki |α3| : 0 - 0,25 zanemariva asimetrija

0,25 – 0,50 slaba asimetrija

0,50 – 0,75 srednja asimetrija

0,75 - + jaka asimetrija

nema asimetrije α3=0

pozitivna asimetrije α3>0

negativna asimetrija α3<0

Page 23: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• koeficijent spljoštenosti (Kurtosis)– mjera spljoštenosti (zaobljenosti) distribucije

121086420

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0,0

X

f(x

) normalna spljoštenost α4=3 (α’4=0)

spljoštenost α4<3 (α’4<0)

izduženost α4>3 (α’4>0)

4

1

4

4

n

1i

4)xi(x

4

nM 4

3'4

4 -M

-normiranje na nulu

(jednostavnije očitavanje)

Page 24: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Primjer dva skupa:

a) sa istim očekivanjem a različitom varijancom

b) sa istim očekivanjem i varijancom ali različitim elementima

Page 25: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• SLUČAJNA VARIJABLA - DEFINIRANJE

• diskretne varijable:

)...,P(n)), P(),P(P() ; P(x...,n,,xii

210210

očekivanje

1)( ,)()(1

i

n

i

ii xpxpxxE

varijanca 22 )()( xExEx

– funkcija distribucije F(x) diskretne varijable (kumulanta):

k

iik

xpxF1

)()( )()(kk

xxPxF

– vjerojatnost diskretne varijable:

0)( i

xf ;1)(1

n

i ixp

n

i i

i

i

xf

xfxp

1

)(

)()(

učestalost vjerojatnost

Page 26: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

zbrajanja frekvencija (kumuliranje)

543210

50

40

30

20

10

0

x

P*

10

0%

Vjerojatnosti

543210

100

80

60

40

20

0

x

Cu

mu

lati

ve P

erc

en

t C

ou

nt

Kumulativni prikaz

Page 27: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

• kontinuirane varijable:

x

– funkcija gustoće vjerojatnosti (kontinuirana varijabla):

očekivanje

dxxfxxE )()(

varijanca

2

22 )()()(

dxxfxdxxfxx

očekivanje

0)( xf

1)( dxxf

svojstva f.g.v. :

1.

2.

3.

2

1

21)()(

x

x

xxxPdxxf

Page 28: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

– funkcija distribucije vjerojatnosti (kontinuirana varijabla):

1

1)()(

x

dxxfxF

povezanost f.g.v. i funkcije distribucije

Page 29: Osnove statistike.pdf

Dr. sc. Hrvoje Cajner Osnove statistike

Inženjerska statistika

Primjer: Sljedeći podaci prezentiraju temperature ‘O-ring’ brtvi raketnog motora prilikom

testiranja sustava paljenja: 84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 73,

70, 57, 63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 75, 76, 58, 31. Potrebno je odrediti

sve osnovne statističke parametre i grafički prikazati podatke.

807060504030

14

12

10

8

6

4

2

0

°F

Fre

qu

en

cy

Histogram of °F

90

80

70

60

50

40

30

°F

Boxplot of °F