Upload
jajaj-ajaaja
View
3
Download
0
Embed Size (px)
DESCRIPTION
-
Citation preview
Statistika i vjerovatnoća
Prof. Amela Muratović-RibićPMF SarajevoKancelarija: 414E-mail:[email protected]
Literatura:
• Probability and Statistic for Engineers and Scientists• WALPOLE,MYERS,MYERS,YE
• 38 časova po semestru: 7 po dva časa i 8 po tri časa• Svake druge sedmice po tri časa
Uvod
• U proizvodnji, istraživanju i sl. prikupljamo podatke.• Statistika sadrži čitav niz alata za donošenje naučnih zaključaka uprkos
neizvjesnosti i varijaciji.• Koristi se u poboljšanju kvaliteta proizvoda/proizvodnje, odobravanju
proizvoda ( lijekova ) i sl.• Naučnici koriste naučne zakone iz vjerovatnoće i statističke zavisnosti
da donesu zaključke o statističkom sistemu.• Informacije se dobijaju iz uzorka ili kolekcije opažanja.
Populacija - uzorak
• Populacija se sastoji od skupa individua ili individualnih objekata određenog tipa.• Npr. • ako skupljamo podatke o visini djece od 6 godina populacija su sva
djeca sa 6 godina.• Nemoguće je ispitati sve, pa se uzima uzorak tj. podskup populacije od
kojeg skupljamo podatke.• Podaci se skupljaju na sistematičan način:
Uticaj faktora.
• Inženjer koji ispituje gustoću materijala u zavisnosti od vlage može praviti eksperimente smanjujući ili povećavajući uticaj vlage.• On pravi eksperimentalni dizajn za skupljanje podataka.
• Šumar koji ispituje gustoću drveta to nije u stanju, već skuplja podatke na polju.• On vrši skupljanje podataka opažanjem.
Jednostavno slučajno prikupljanje uzoraka• Veličina uzorka je broj elemenata u uzorku.• Svaki uzorak ima jednaku šansu da bude izabran iz populacije.• Koristimo tabele ili generatore slučajnih brojeva.• Nije uvijek adekvatno.• Npr. Mišljenje o predmetu studenata sa prosječnom ocjenom 10 nije
isto kao onih sa prosječnom ocjenom 6. Želimo da svi budu zastupljeni.• Formiramo stratum = homogene grupe koje se ne presijecaju, i
biramo uzorke unutar svakog stratuma.
Eksperimentalni dizajn
• Unutar svake populacije biramo uzorke slučajno.• Npr. Na uzorku od po 100 pacijenata ispitujemo placebo i pravi lijek.• Pacijenti se razlikuju po težini, dobi, spolu i td. a to su sve faktori koji
utiču na rezultat ispitivanja.
Deskriptivna statistika• Moda: (Aritmetička sredina) Neka je dat niz opažanja u uzorku • Moda je definisana sa:
• Aritmetička sredina je jednostavno numerički prosjek.
• Primjer. Neka je zadan niz brojeva 3,5,6,1,3,2. Dužina niza je n=6. Tada je
Medijana• Neka je niz u rastućem redosljedu. Medijana je definisana sa
• Primjer: Da bi odredili medijanu niz brojeva 4,5,1,2,6,3 poredamo u rastućem redosljedu 1,2,3,4,5,6. Dužina niza je n=6 tj.parna pa je• (3+4)=3.5• Primjer: Za niz 3,5,7,2,2 koji je u rastućem redosljedu 2,2,3,5,7 dužina
je 5 pa je
Uticaj ekstremnih vrijednosti –moda ili medijana?• U jednom okrugu• Jedan bogataš sa 1000 siromašnih sa
godišnjim prihodom prihodom EURO 10^7 10 EURA
Aritmetička sredina je =10000
Medijana je 10 – bolje prikazuje podatkeIsključimo npr.5% ili 10% najvećih i najmanjih vrijednosti.
Varijansa• Podaci mogu varirati malo ili mnogo.• Rang uzorka: • Za izmjerene vrijednosti u uzorku varijansa je definisana sa
• ,• a standardna devijacija sa
• .• Mjeri kvadrat odstupanja od aritmetičke sredine. • n-1 je stepen slobode.
Moda i standardna devijacija se najčešće koriste
• Primjer 1: Niz 2,2,3,3, • , s=0,58• Primjer 2: Niz 1,2,3,4,• , s=1,3• Napomenimo da se ne mjeri n nezavisnih kvadrata odstupanja od
mode jer posljednja zavisi od n-1 prethodne, odakle je n-1 stepen slobode tj. broj nezavisnih vrijednosti.
Vrijednosti mogu biti diskretne i neprekidne• Često se pojavljuju binarni podaci : • Npr. Proizvod je ispravan ili neispravan• Lijek djeluje ili ne• Tako da u uzorku x elemenata uzima vrijednost 1, a n-x elemenata
uzima vrijednost 0. • Sada govorimo o proporciji uzorka gdje x/n proporcija ima vrijednost
1, a proporcija (n-x)/n ima vrijednost 0.
Gdje se ista vrijednost često pojavljuje koristi se frekvencija tj. broj ponavljanja iste vrijednosti
• Primjer: U nizu 1,1,1,2,2,3,3,3,3,4,5 frekvencije (tj. broj ponavljanja vrijednosti) su redom.• Vrijedi , gdje je k broj različitih vrijednosti u uzorku a n dužina niza tj.
broj elemenata u uzorku. Sada je• .
Grafičko predstavljanje podataka• Graf:
x y
1 42 33 2
0.5 1 1.5 2 2.5 3 3.50
0.5
1
1.5
2
2.5
3
3.5
4
4.5
Chart Title
Histogram-relativna frekfencija
x f Rel frkfencija
0-99 5 31%
100-199 10 63%
200-299 1 6%
• 100%
63%
31%
6% 50 150 250