Upload
jurica
View
70
Download
3
Embed Size (px)
DESCRIPTION
FSB Inženjerska statistika
Citation preview
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Osnove statistike
• Kombinatorika i vjerojatnost
• Obrada empirijskih podataka
• Mjere položaja i rasipanja
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Kombinatorika
• Slučajni događaj – događaj koji se pod nekim
okolnostima može ali i ne mora dogoditi. Služe pri
određivanju vjerojatnosti slučajnih događaja
• Modeli u kombinatorici:
– Permutacije (bez ponavljanja i s ponavljanjem)
– Varijacije (bez ponavljanja i s ponavljanjem)
– Kombinacije
– Složene kombinacije
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• permutacije bez ponavljanja:
– niz n istovrsnih elemenata kojima se određuje broj mogućih
redoslijeda (poređaja)
1...k)(n...1)(nnn!P(n)
Primjer: Na koliko se načina može poredati niz od 4 kuglice različite boje?
4212344!P(4)
• permutacije s ponavljanjem:
– niz n istovrsnih elemenata među kojima postoje određene
podgrupe - određuje se broj mogućih redoslijeda (poređaja)
!A...!A!An!
K21K...A2A,1A
(n)
P
Primjer: Na koliko se načina može poredati niz od 6 kuglica (2 crvene, 2 plave
te zelena i žuta)?
180!2!2
!6P 1,1,2,2
(6)
Permutacije
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Varijacije • varijacije bez ponavljanja:
– niz n istovrsnih elemenata iz kojeg se uzima uzorak r te se određuje
broj različitih (mogućih) ishoda
r)!(n
n!V(n)
r
Primjer: Koliko različitih uzoraka od po 3 kuglice možemo složiti iz skupa od 5 kuglica?
Primjer: Igranje sportske prognoze. Na koliko se načina može ispuniti listić sportske
prognoze ako se na listiću nalazi 12 parova, a mogući ishodi su 1,0 i 2?
603)!(5
5!V
(5)
3
• varijacije s ponavljanjem:
– niz n istovrsnih elemenata iz kojeg se uzima uzorak r te se određuje broj
različitih (mogućih) ishoda s mogućnošću ponavljanja elemenata iz
skupa n do maksimalno r-puta
441 5313V 12(3)
12
rn(n)
rV
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Kombinacije • kombinacije bez ponavljanja – (s ponavljanjem nemaju smisla):
– niz n istovrsnih elemenata iz kojeg se uzima uzorak od r elemenata
te se određuje broj različitih (mogućih) sastava uzorka gdje nije bitan
redoslijed već sadržaj (sastav)
r! r)!(n
n!
r
n
r!
!VK
(n)
r(n)
r
Primjer: Koliko treba ispuniti nizova da bi se u LOTU 7/39 sigurno dobila ‘sedmica’?
NAPOMENA: budući da nije bitan redoslijed odabiranja (izvlačenja) kuglica
radi se o kombinacijama.
937 380 157!7)!(39
39!
7
39K
(39)
7
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Složene kombinacije • složene kombinacije – skup od N elemenata sadrži podskup elemenata
sa svojstvom A i podskup elemenata sa svojstvom Ā (non A)
N
M (A) (N-M) (Ā)
n
x el A (n-x) el Ā
x-n
MN
x
MK M))-(N(M
x))-(n(x
UZORAK
SKUP
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Vjerojatnost
• Slučajni događaj – događaj koji se pod nekim okolnostima može a i ne mora
dogoditi
• Elementarni događaj – mogući ishod slučajnog događaja
• Skup (polje) mogućih događaja – skup koji se sastoji od elementarnih
događaja
• Vjerojatnost – mogućnost pojave nekog elementarnog događaja koji se promatra
n
n(A)P(A)
1P(A)
0P(A)
- nemoguć događaj
- siguran događaj
P(A)1)AP(
• Protivna vjerojatnost
n – broj svih mogućih ishoda (događaja)
n(A) – broj događaja sa svojstvom A
1P(A)0
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• Teoremi vjerojatnosti (slučaj složenih događaja):
• zbrajanje vjerojatnosti - P(A1) ili P(A2)
• zanima nas vjerojatnost da se dogodi A1 ili A2
• uz uvjet da su događaji A1 i A2 disjunktni (međusobno se
isključuju)
)P(A)P(A)iliAP(A2121
Primjer: Bacamo kocku. Kolika je vjerojatnost da će kocka pokazati broj 2 ili 4 ili 6?
2
1
;
6
1
6
1
6
16) ili 4 ili P(2
6
16) P(broj
6
14) P(broj ;
6
12) P(broj
• množenje vjerojatnosti (NEZAVISNI DOGAĐAJI)- P(A1) i P(A2)
• zanima nas vjerojatnost događaja da se dogodi A1 i A2 (istovremeno)
)P(A)P(A) Ai P(A2121
Primjer: Bacamo kocku i novčić. Kolika je vjerojatnost da će kocka pokazati broj 6 i
novčić pasti na ‘glavu’?
12
1
2
1
6
1)'6' i glava'P('
2
1)glava'P(' ;
6
16) P(broj
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• množenje vjerojatnosti (UVJETNI DOGAĐAJI)- P(A1) i P(A2)
• zanima nas vjerojatnost događaja da se realizira A1 i A2
• jedan događaj utječe na vjerojatnost drugog događaja
Primjer: U kutiji je 10 kuglica, 6 bijelih i 4 crvene kuglice. Kolika je vjerojatnost da
prva i druga kuglica budu bijele ako izvučenu kuglicu ne vraćamo u kutiju?
A1 - prva kuglica bijela
A2 – druga kuglica bijela
)/AP(A)P(A) Ai P(A12121
3
1;
9
5
10
6) Ai P(A
9
5)/AP(A
10
6)P(A
21121
• ostale vjerojatnosti - uvjet da se elementarni događaji ne isključuju te da se
dogodi bar jedan događaj
• slučaj kada tražimo vjerojatnost pojave događaja A1 ili A2 ili A1 i
A2. Takova vjerojatnost se računa na način da se od sume
vjerojatnosti za događaje A1 , A2 oduzme vjerojatnost događaja
A1 i A2 istovremeno (izbjegavanje dvostruke vjerojatnosti).
P(A2))P(AP(A2))P(A) Aili P(A1121
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• Bayes-ov teorem
P(K1) P(p/K1)P(K1/p)=
P(K1) P(p/K1)+P(K2) P(p/K2)
0,15P(K1/p)= 0,375
0,15 0,25
P(A/B) -
P(B/A) -
Vjerojatnost da se dogodi A ako se dogodio B
Vjerojatnost da se dogodi B ako se dogodio A
Primjer: U dvije kutije su raspoređene crvene i plave kuglice. U prvoj kutiji je 7 crvenih i 3
plave kuglice, dok su u drugoj kutiji 5 crvenih i 5 plavih. Potrebno je pronaći
vjerojatnost da ako je odabrana plava kuglica da je izvučena iz prve kutije.
K1 K2
P(A) P(B/A) P(A) P(B/A)P(A/B)=
P(B) P(A) P(B/A)+P(A) P(B/A)
10P(K1)=P(K2)= =0,5
20
3P(p/K1)= 0,3
10
5P(p/K2)= 0,5
10
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• Upotreba teorije vjerojatnosti na primjerima iz prakse
• Slučaj serijskog spoja – problem vezan za pouzdanost sustava
Primjer: Pojednostavljen slučaj vjerojatnosti pogotka cilja projektilom. Projektil na
putu do cilja prolazi kroz faze koje imaju svoju vjerojatnost uspjeha.
Vjerojatnost uspješnog pogotka cilja se može prikazati kao serijski spoj
faza (vjerojatnosti uspjeha svake faze). Svaka faza ima vjerojatnost
uspjeha 0,99. Kolika je vjerojatnost uspješnog pogotka cilja?
0,9410,99pogodak) P(uspješan
P(kill)P(hit)P(trk)P(lock)P(lnch)P(det)pogodak) P(uspješan6
Za uspješan pogodak projektil mora uspješno proći sve faze.
Radi se o serijskom spoju (množenju vjerojatnosti).
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• Slučaj paralelnog spoja – problem vezan za pouzdanost sustava
Primjer: U kritičnom dijelu nekoga procesa važno je da je barem jedna pumpa u
stanju ispravnog rada kako ne bi došlo do zastoja. Ako su vjerojatnosti
ispravnog rada (pouzdanost) svake pumpe R=0,99 kolika je vjerojatnost da
sustav funkcionira ispravno?
Budući da je P(ispravnog rada)+P(zastoja)=1
možemo pisati sljedeće:
0.9999990,010,010,01-1 rada) gP(ispravno
Q(pumpa3)Q(pumpa2)Q(pumpa1)P(zastoja)
;P(zastoja)-1rada) gP(ispravno
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Obrada empirijskih podataka • deskriptivna statistika – opisivanje podataka iz uzorka ili populacije u formi
osnovnih parametara, identifikacija procesa
• osnovne vrste podataka – po nastanku varijable (upotreba različitih mjernih
ljestvica) se mogu klasificirati na:
1. Kvalitativne: nominalne (Da, Ne ; Dobar, Loš...), ordinalne (rangovi)
2. Kvantitativne: diskretne (cjelobrojne vrijednosti, pobrojane),
kontinuirane (neprekinute, mjerene)
a) Diskretne varijable – nastaju prebrojavanjem
P(n)P(2)..., P(1),P(0), )P(x ; n0,1,2...,x ii
b) Kontinuirane varijable – nastaju mjerenjem
0 1 2 3 4 5 xx x x x x
x
a b x
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• Grafička obrada empirijskih podataka
• vrste grafičkih prikaza:
1. Histogram (‘bar chart’) – prikazivanje učestalosti podataka
stupićima te povezivanje vrhova u poligon frekvencija
- histogramski prikaz za diskretnu varijablu
- direktno očitavanje vjerojatnosti pojave pojedine
vrijednosti varijable
3028262422
7
6
5
4
3
2
1
0
x
Fre
qu
en
cy
Histogram - histogramski prikaz
za kontinuiranu
varijablu
- prikaz preko
razreda podataka po
kojima klasificiramo
podatke
- u tehnici se radi sa
razredima jednake
veličine (širine)
Primjer:
543210
12
10
8
6
4
2
0
C1
Fre
qu
en
cy
Histogram
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
2. ‘Box- whisker’ prikaz (prikaz ‘kutija – brkovi’) – jedno od najčešćih prikaza podataka
Primjer:
- ‘box-whisker’ prikaz za kontinuiranu varijablu
- prikaz je moguće kreirati u različitim verzijama
(središnja točka medijan/aritmetička sredina,
podjela po percentilima/intervalima povjerenja...)
- jednostavna dijagnostika problematičnih podataka
(ekstrema, ‘outliera’)
- mogućnost prikazivanja dva ili više uzoraka
paralelno te brzo dijagnosticiranja njihovih relacija i
karakteristika x2x1
40
35
30
25
20
Da
ta
Boxplot of x1; x2
34323028262422
20
15
10
5
0
x1
Cu
mu
lati
ve F
req
uen
cy
Histogram of x1
- kumulanta – histogramski prikaz frekvencija koje se
kumuliraju od najnižega ka najvišem razredu
- mogućnost prikaza relativnih frekvencija (u %) na
ordinati
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
3. ‘Stem-leaf’ prikaz (prikaz ‘stabljika - list’)
Primjer: fi Stem Leaf
2 21 0 2
4 22 3 3 4 9
5 23 1 2 5 8 9
4 24 5 6 7 8
2 25 4 8
1 26 4
- prikaz ‘stabljika-list’ se najčešće koristi na
podacima koji su u decimalnom obliku gdje
se znamenka cijelog broja prikazuju kao
stabljika a decimalni dio kao ‘list’
4. Ostali prikazi:
• ‘Individual plot’,
• ‘Scatter plot’,
• ‘Line plot’,
• ‘Dot plot’ ,
• ‘Marginal plot’ ,
• ‘Area plot’,
• ‘Pie chart’
• ‘Normal probability plot’,
• ...
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Primjer grafičke analize podataka: Na jednom uzorku izmjerene su vrijednosti vlačne
čvrstoće šarže čeličnog lima (u N/mm2). Nakon mjerenja dobiveni su sljedeći
podaci: 430, 440, 450, 460, 440, 430, 410, 410
440, 440, 430, 440, 420, 450, 430, 450
420, 440, 420, 450, 410, 440, 460, 430
460450440430420410
7
6
5
4
3
2
1
0
Vlačne čvrstoće, N/mm2
Fre
kven
cij
a
Histogram
460450440430420410
25
20
15
10
5
0
Vlačne čvrstoće, N/mm2
Ku
mu
lati
vn
e f
rek
ven
cij
a
Histogram kumulativnih frekvencija
460
450
440
430
420
410V
lačn
e č
vrs
toće,
N/m
m2
Boxplot of Vlačne čvrstoće, N/mm2
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• Numerička obrada empirijskih podataka
• aritmetička sredina – suma svih elemenata u populaciji podijeljena sa brojem
elemenata populacije (težište – paralela sa mehaničkim modelom)
N
x
μxE
N
i
i 1ocekivanje)(
n
xx
n
ii
1 uzorka sredina aritm.
• MJERE POLOŽAJA
• mod – podatak(ili razred) koji ima najveću frekvenciju
- mod dijeli distribuciju frekvencija na rastuću i padajuću stranu
- vrste distribucija s obzirom na mod
najvažnije svojstvo aritmetičke sredine: 0)(1
xxn
ii
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• medijan – 50% podataka je manje, a 50% veće od te vrijednosti
• kvantili - vrijednosti numeričkog obilježja koje niz uređen po veličini dijele na
q jednakih dijelova Medijan
Kvartili
Decili
Percentili
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• MJERE RASIPANJA
• standardna devijacija σ – prosječno odstupanje svakog podatka od arit. sredine
• varijanca σ2 – prosječno kvadratno odstupanje svakog podatka od arit. sredine
21
2
2
)(
n
xxn
ii
• koeficijent varijacije, V – međusobno uspoređivanje varijabilnosti pojava
ili svojstava
- pokazuje koliki odnos vrijednosti aritm. sredine iznosi
vrijednost standardne devijacije (u %)
100% x
V
koeficijent varijacije
(relativna mjera rasipanja)
• raspon, Rx – razlika najveće i najmanje vrijednosti u nekom nizu podataka
minmaxxxR
x
• nepristrana procjena varijance osnovnog skupa (σo2) :
2
2 1
( )
1
n
i
i
x x
sn
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• MOMENTI STATISTIČKIH SKUPOVA
• mehanički model - greda, oslonac i opterećenje ( x1,x2, ... – jedinične sile)
x1 x2 x3 x4 x5 x6 x7
– centralni moment r-tog reda – moment oko centra (aritmetička sredina):
n
)x(xM
n
1i
r
i
r
r=0 M0=1
r=1 M1=0
r=2 M2=σ2
r=3 M3
r=4 M4
varijanca
– pomoćni moment r-tog reda – moment oko točke 0
n
xm
n
1i
r
i
r
r=0 m0=1
r=1 m1= x aritmetička sredina
koeficijent asimetrije
koeficijent spljoštenosti
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• MJERE OBLIKA STATISTIČKOG SKUPA
• koeficijent asimetrije (Skewness) – mjera nagnutosti distribucije na lijevu
ili desnu stranu
3
1
3
3
n
1i
3)xi(x
3
nM 3
svaki |α3| : 0 - 0,25 zanemariva asimetrija
0,25 – 0,50 slaba asimetrija
0,50 – 0,75 srednja asimetrija
0,75 - + jaka asimetrija
nema asimetrije α3=0
pozitivna asimetrije α3>0
negativna asimetrija α3<0
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• koeficijent spljoštenosti (Kurtosis)– mjera spljoštenosti (zaobljenosti) distribucije
121086420
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0,0
X
f(x
) normalna spljoštenost α4=3 (α’4=0)
spljoštenost α4<3 (α’4<0)
izduženost α4>3 (α’4>0)
4
1
4
4
n
1i
4)xi(x
4
nM 4
3'4
4 -M
-normiranje na nulu
(jednostavnije očitavanje)
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Primjer dva skupa:
a) sa istim očekivanjem a različitom varijancom
b) sa istim očekivanjem i varijancom ali različitim elementima
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• SLUČAJNA VARIJABLA - DEFINIRANJE
• diskretne varijable:
)...,P(n)), P(),P(P() ; P(x...,n,,xii
210210
očekivanje
1)( ,)()(1
i
n
i
ii xpxpxxE
varijanca 22 )()( xExEx
– funkcija distribucije F(x) diskretne varijable (kumulanta):
k
iik
xpxF1
)()( )()(kk
xxPxF
– vjerojatnost diskretne varijable:
0)( i
xf ;1)(1
n
i ixp
n
i i
i
i
xf
xfxp
1
)(
)()(
učestalost vjerojatnost
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
zbrajanja frekvencija (kumuliranje)
543210
50
40
30
20
10
0
x
P*
10
0%
Vjerojatnosti
543210
100
80
60
40
20
0
x
Cu
mu
lati
ve P
erc
en
t C
ou
nt
Kumulativni prikaz
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
• kontinuirane varijable:
x
– funkcija gustoće vjerojatnosti (kontinuirana varijabla):
očekivanje
dxxfxxE )()(
varijanca
2
22 )()()(
dxxfxdxxfxx
očekivanje
0)( xf
1)( dxxf
svojstva f.g.v. :
1.
2.
3.
2
1
21)()(
x
x
xxxPdxxf
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
– funkcija distribucije vjerojatnosti (kontinuirana varijabla):
1
1)()(
x
dxxfxF
povezanost f.g.v. i funkcije distribucije
Dr. sc. Hrvoje Cajner Osnove statistike
Inženjerska statistika
Primjer: Sljedeći podaci prezentiraju temperature ‘O-ring’ brtvi raketnog motora prilikom
testiranja sustava paljenja: 84, 49, 61, 40, 83, 67, 45, 66, 70, 69, 80, 58, 68, 60, 67, 72, 73,
70, 57, 63, 70, 78, 52, 67, 53, 67, 75, 61, 70, 81, 76, 79, 75, 76, 58, 31. Potrebno je odrediti
sve osnovne statističke parametre i grafički prikazati podatke.
807060504030
14
12
10
8
6
4
2
0
°F
Fre
qu
en
cy
Histogram of °F
90
80
70
60
50
40
30
°F
Boxplot of °F