20
Statistika i vjerovatnoća Prof. Amela Muratović-Ribić PMF Sarajevo Kancelarija: 414 E-mail:[email protected]

Predavanje_1

Embed Size (px)

DESCRIPTION

-

Citation preview

Statistika i vjerovatnoća

Prof. Amela Muratović-RibićPMF SarajevoKancelarija: 414E-mail:[email protected]

Literatura:

• Probability and Statistic for Engineers and Scientists• WALPOLE,MYERS,MYERS,YE

• 38 časova po semestru: 7 po dva časa i 8 po tri časa• Svake druge sedmice po tri časa

Uvod

• U proizvodnji, istraživanju i sl. prikupljamo podatke.• Statistika sadrži čitav niz alata za donošenje naučnih zaključaka uprkos

neizvjesnosti i varijaciji.• Koristi se u poboljšanju kvaliteta proizvoda/proizvodnje, odobravanju

proizvoda ( lijekova ) i sl.• Naučnici koriste naučne zakone iz vjerovatnoće i statističke zavisnosti

da donesu zaključke o statističkom sistemu.• Informacije se dobijaju iz uzorka ili kolekcije opažanja.

Populacija - uzorak

• Populacija se sastoji od skupa individua ili individualnih objekata određenog tipa.• Npr. • ako skupljamo podatke o visini djece od 6 godina populacija su sva

djeca sa 6 godina.• Nemoguće je ispitati sve, pa se uzima uzorak tj. podskup populacije od

kojeg skupljamo podatke.• Podaci se skupljaju na sistematičan način:

Uticaj faktora.

• Inženjer koji ispituje gustoću materijala u zavisnosti od vlage može praviti eksperimente smanjujući ili povećavajući uticaj vlage.• On pravi eksperimentalni dizajn za skupljanje podataka.

• Šumar koji ispituje gustoću drveta to nije u stanju, već skuplja podatke na polju.• On vrši skupljanje podataka opažanjem.

Jednostavno slučajno prikupljanje uzoraka• Veličina uzorka je broj elemenata u uzorku.• Svaki uzorak ima jednaku šansu da bude izabran iz populacije.• Koristimo tabele ili generatore slučajnih brojeva.• Nije uvijek adekvatno.• Npr. Mišljenje o predmetu studenata sa prosječnom ocjenom 10 nije

isto kao onih sa prosječnom ocjenom 6. Želimo da svi budu zastupljeni.• Formiramo stratum = homogene grupe koje se ne presijecaju, i

biramo uzorke unutar svakog stratuma.

Eksperimentalni dizajn

• Unutar svake populacije biramo uzorke slučajno.• Npr. Na uzorku od po 100 pacijenata ispitujemo placebo i pravi lijek.• Pacijenti se razlikuju po težini, dobi, spolu i td. a to su sve faktori koji

utiču na rezultat ispitivanja.

Deskriptivna statistika• Moda: (Aritmetička sredina) Neka je dat niz opažanja u uzorku • Moda je definisana sa:

• Aritmetička sredina je jednostavno numerički prosjek.

• Primjer. Neka je zadan niz brojeva 3,5,6,1,3,2. Dužina niza je n=6. Tada je

Medijana• Neka je niz u rastućem redosljedu. Medijana je definisana sa

• Primjer: Da bi odredili medijanu niz brojeva 4,5,1,2,6,3 poredamo u rastućem redosljedu 1,2,3,4,5,6. Dužina niza je n=6 tj.parna pa je• (3+4)=3.5• Primjer: Za niz 3,5,7,2,2 koji je u rastućem redosljedu 2,2,3,5,7 dužina

je 5 pa je

Uticaj ekstremnih vrijednosti –moda ili medijana?• U jednom okrugu• Jedan bogataš sa 1000 siromašnih sa

godišnjim prihodom prihodom EURO 10^7 10 EURA

Aritmetička sredina je =10000

Medijana je 10 – bolje prikazuje podatkeIsključimo npr.5% ili 10% najvećih i najmanjih vrijednosti.

Varijansa• Podaci mogu varirati malo ili mnogo.• Rang uzorka: • Za izmjerene vrijednosti u uzorku varijansa je definisana sa

• ,• a standardna devijacija sa

• .• Mjeri kvadrat odstupanja od aritmetičke sredine. • n-1 je stepen slobode.

Moda i standardna devijacija se najčešće koriste

• Primjer 1: Niz 2,2,3,3, • , s=0,58• Primjer 2: Niz 1,2,3,4,• , s=1,3• Napomenimo da se ne mjeri n nezavisnih kvadrata odstupanja od

mode jer posljednja zavisi od n-1 prethodne, odakle je n-1 stepen slobode tj. broj nezavisnih vrijednosti.

Vrijednosti mogu biti diskretne i neprekidne• Često se pojavljuju binarni podaci : • Npr. Proizvod je ispravan ili neispravan• Lijek djeluje ili ne• Tako da u uzorku x elemenata uzima vrijednost 1, a n-x elemenata

uzima vrijednost 0. • Sada govorimo o proporciji uzorka gdje x/n proporcija ima vrijednost

1, a proporcija (n-x)/n ima vrijednost 0.

Gdje se ista vrijednost često pojavljuje koristi se frekvencija tj. broj ponavljanja iste vrijednosti

• Primjer: U nizu 1,1,1,2,2,3,3,3,3,4,5 frekvencije (tj. broj ponavljanja vrijednosti) su redom.• Vrijedi , gdje je k broj različitih vrijednosti u uzorku a n dužina niza tj.

broj elemenata u uzorku. Sada je• .

Primjer

1 4 4 -2 16

3 10 30 0 0

5 4 20 2 16

18

Grafičko predstavljanje podataka• Graf:

x y

1 42 33 2

0.5 1 1.5 2 2.5 3 3.50

0.5

1

1.5

2

2.5

3

3.5

4

4.5

Chart Title

Grafički prikaz

Chart Title

1 2 3

1 2 30

0.5

1

1.5

2

2.5

3

3.5

4

4.5

Chart Title

Series1 Series2

Histogramx f

0-99 5

100-199 10

200-299 1

16

5

1

0-99 100-199 200-299

Histogram-relativna frekfencija

x f Rel frkfencija

0-99 5 31%

100-199 10 63%

200-299 1 6%

• 100%

63%

31%

6% 50 150 250

Čuvanje decimalnih pozicija

• Podaci o trajnosti baterije su npr.1.6, 2.5, 1.7, 1.8, 2.4, 1.9, 2.3 godina

Prva cifra Druga cifra frekvencija

1 6789 4

2 543 3