60
UVOD U STATISTIKU kroz razumijevanje pojmova i formula i uz pomo´ c Excela Boris ˇ Culina

UVOD U STATISTIKU kroz razumijevanje pojmova i formula

  • Upload
    others

  • View
    3

  • Download
    2

Embed Size (px)

Citation preview

Page 1: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

UVOD U STATISTIKUkroz razumijevanje pojmova i formula

i uz pomoc Excela

Boris Culina

Page 2: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

ii

Page 3: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

Sadržaj

Predgovor 1

1 Populacija, slucajni uzorak i slucajna pojava 5

1.1 Uvod . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

1.2 Populacija . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11

1.3 Slucajna pojava . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16

1.4 Slucajni uzorak . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

1.5 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

2 Vjerojatnosni model slucajne pojave 23

2.1 Prostor ishoda i prostor dogadaja . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2.2 Pojam vjerojatnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2.3 Racunanje vjerojatnosti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

2.3.1 Svodenje na vjerojatnosti pojedinih ishoda . . . . . . . . . . . . . . . . . . . . . . . . 30

2.3.2 Simetricni vjerojatnosni model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31

2.3.3 Vjerojatnost i logicki veznici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

2.4 Uvjetna vjerojatnost i nezavisnost dogadaja . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38

2.5 Beskonacni vjerojatnosni modeli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46

2.6 Zadaci za vježbu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

iii

Page 4: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

iv

Page 5: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

Predgovor

Jednostavno govoreci statistika je nauka prikupljanja podataka i izvlacenja iz njih pouzdanih infor-macija. Kao takva veoma je uspješna u analizi složenih situacija. A pošto je suvremeno društvopuno složenih situacija, statistika je danas zasigurno matematicka teorija s najširom i najucestalijomprimjenom. Ona je danas potrebna svakoj struci, pa tako postaje nužan opci predmet u visokoškolskomobrazovanju.

Studenti na engleskom govornom podrucju predmet Statistika znaju u kolokvijalnom govoru zvatiSadistics umjesto Statistics isticuci na taj nacin teškoce koje imaju u usvajanju tog predmeta. Tonije bez osnove. Statistika je ogromno multidisciplinarno podrucje s neobicnim pojmovima, teškom(i dosadnom) matematickom teorijom i kompliciranim racunanjima u primjeni. Izlažuci godinamastudente statistickim mukama i uceci od drugih nastavnika, vjerujemo da smo našli recept da ovajpredmet ucinimo normalnim, nekim studentima cak i zanimljivim.

Za studiranje statistike po ovoj knjizi student ne treba imati posebno matematicko predznanje.Gotovo da je dovoljno srednjoškolsko matematicko obrazovanje.

Smatramo da je najvažnije dobro razumjeti osnovne statisticke pojmove, i to prije svega naintuitivnom i upotrebnom nivou. To je pogotovo važno jer pogrešna upotreba statistike i pogrešnotumacenje njenih rezultata, a to je cesta pojava, upravo pocivaju na nerazumijevanju osnovnihpojmova. Zato smo razumijevanju osnovnih pojmova posvetili najveci dio knjige. Tome smo prilagodilii organizaciju knjige. Prvi dio knjige sadrži intuitivnije pojmove i jednostavnije procedure, dok smopouzdanije izvlacenje informacija (u kojem kvantificiramo sigurnost s kojom procjenjujemo parametrei donosimo odluke) ostavili za drugi dio knjige. Radi lakšeg usvajanja pojmova uveli smo i jednumetodološku novost. Godinama smo prvo izlagali teoriju vjerojatnosti pa tek onda statistiku, jer jeteorija vjerojatnosti teorijska osnova statistike, pa je to prirodan logicki slijed izlaganja. Medutim, zbogapstraknosti pojmova teorije vjerojatnosti, to se nije pokazalo dobro. Zatim smo godinama izlagali prvostatistiku, pa tek onda teoriju vjerojatnosti, jer pojmovima teorije vjerojatnosti upravo statistika daježivot. Medutim, ni to se nije pokazalo dobrim, jer je statistika naprosto slijepa bez pojmova teorijevjerojatnosti. Zato smo odlucili apstraktne pojmove teorije vjerojatnosti vezane za slucajne pojave ikonkretne statisticke pojmove vezane za populacije i uzorke izlagati paralelno. I to se pokazalo dobro.

Matematiku smo velikim dijelom sveli na gotove formule. Na ovom uvodnom nivou student se netreba brinuti odakle pojedina formula i zašto je ispravna. Bitno je da razumije šta formula "kaže", kojevelicine povezuje i uz koje pretpostavke o tim velicinama je ispravna. Razumijevanje formula i uvjetanjihove primjenjivosti omogucuje studentu da u zadanoj problemskoj situaciji prepozna koje formule cemu pomoci da je riješi.

Složena racunanja smo prepustili Excelu. Postoje razni software-i koji olakšavaju statistickaracunanja. Za ovaj uvodni nivo smatramo da je Excel prikladno rješenje, jer vecina studenata znakoristiti Excel i ne treba izdvojiti dodatno vrijeme za ucenje software-a. Mada Excel ima i dodatke za

1

Page 6: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2 SADRŽAJ

statistiku, njih nismo koristili jer složeniji alati znaju previše sakriti statistiku, a smatramo da to nauvodnom nivou ucenja statistike može biti kontraproduktivno. Svi veci skupovi podataka su studentudostupni u odgovarajucim Excel datotekama.

U ovoj smo knjizi izucavanje statistike sveli na jedno minimalno jezgro za koje vjerujemo s jednestrane da ga student u razumnom vremenu može temeljito usvojiti, a s druge strane da je dobra osnovana kojoj student može nastaviti izucavati statistiku u bilo kojem smjeru, ovisno o njegovoj struci i tipuposla koji ce u buducnosti raditi. Ovo minimalno jezgro omogucuje studentu da s jedne strane znaispravno i kriticki interpretirati rezultate statistickih istraživanja drugih, a s druge strane da i sammože napraviti statisticko istraživanje, ispravno interpretirati dobivene rezultate i donijeti pouzdanezakljucke.

Poglavlja su podijeljena na cjeline. Na kraju svakog poglavlja su zadaci za vježbu s odgovorima,klasificirani po cjelinama tog poglavlja. Tako, nakon svake cjeline student može naci na kraju poglavljazadatke vezane uz tu cjelinu.

Za usvajanje statistike veoma je važno imati dobre primjere. Neke primjere i zadatke smo samiizmislili, a neke smo preuzeli od drugih autora. Niže je dan popis knjiga kojima smo se služili:

Bluman, Elementary Statistics, A Step by Step Approach, McGraw Hill

Utts, Heckard, Mind on Statistics, Cengage Learning

Devore, Berk, Modern Mathematical Statisticswith Applications

Moore, The Basic Practice of Statistics

Agresti, Statistics

Kokoska, Introductory Statistics

Navidi, Statistics for Engineers and Scientists

Triola, Elementary Statistics

Page 7: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

SADRŽAJ 3

Page 8: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

4 SADRŽAJ

Page 9: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

1Populacija, slucajni uzorak i slucajna pojava

1.1 Uvod

Statistika daje odgovore ili barem omogucuje da razumijemo što se zbiva za zaista široki dijapazonproblema. Evo nekih primjera.

Na nivou osobnih odluka statistika ce nam pomoci da ih ispravnije donesemo:

a) Covjeku se dijagnosticira bolest od koje umire 80% oboljelih. Šta ta informacija za njega znaci?

b) Ako je statistika pokazala da jedna metoda lijecenja daje bolje rezultate od druge (kod prve preživinpr 30% pacijenata, a kod druge 40%), je li ispravno odluciti se za drugu metodu lijecenja?

Cini se da je odgovor na prvo pitanje da ce covjek gotovo sigurno umrijeti, a na drugo pitanje da jebolje odabrati drugu metodu. Vidjet cemo da nije tako. da te informacije ništa ne govore o tome hoce licovjek umrijeti ili ne, odnosno da li je druga metoda lijecenja za njega bolje ili ne. Medutim, statistickipodaci ga mogu uputiti šta mu je razumno uciniti.

Na nivou društvenih zbivanja statistika ce nam pomoci da bolje razumijemo što se zbiva.

a) U vrijeme kad smo zapoceli slagati ovu knjigu od prikupljenog nastavnog materijala DržavniZavod za Statistiku je objavio da je prosjecna isplacena neto placa po zaposlenom u pravnimosobama u Hrvatskoj za mjesec studeni 2017. godine iznosila 6190 kuna. Odražava li taj brojispravno primanja ljudi? Vidjet cemo da je sa stajališta onoga koji prima placu odgovor ne - taj jebroj prevelik i ljude zavarava da je osobni standard zaposlenih bolji nego što jeste.

b) Kako osiguravajuce kuce odreduju premije osiguranja? Bi li one mogle biti niže?

5

Page 10: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

6 1. Populacija, slucajni uzorak i slucajna pojava

c) Predizborne ankete nam kažu kako trenutno kotiraju politicke stranke. Kako se rade te ankete ikoliko su pouzdani ti podaci? Ako rezultati izbora ne odgovaraju predizbornim anketama, jesu liankete pogriješile ili se radi o izbornim nepravilnostma i prevarama?

d) Protiveci se sadržaju i nacinu donošenja novog Zakona o radu sindikati su 2010. godine krenuliu akciju prikupljanja potpisa gradana za pokretanje Referenduma o ovom pitanju. Da bi sepokrenuo Referendum, trebali su prikupiti 450.000 potpisa. Sindikati su prikupili više od 815.000.Osporavajuci ispravnost potpisa Vlada je, odnosno ministarstva uprave i unutarnjih poslova tedvije privatne tvrke, potrošila 40 dana za njihovu provjeru. Uz 40 dana, utrošeno je i 2.1 milijunproracunskih kuna. Jesu li zaista trebali potrošiti toliko vremena i novaca da ispitaju ima lidovoljno ispravnih listica? Usput da spomenemo, utvrdili su postojanje oko 90 tisuca sumnjivih(?)listica.

e) Svakom je društvu važna zdravstvena zaštita i nastoji eliminirati uzroke bolesti. Statistickaispitivanja su pokazala da pušaci cešce obole od raka pluca od nepušaca. Da li to znaci da pušenjeuzrokuje rak pluca i da država treba raznim mjerama destimulirati pušenje ili su pak potrebnadodatna istraživanja?

Statistika nam može pomoci u struci.

a) Uložio bih u prodaju jednog proizvoda kojeg nema na našem tržištu. Kako da saznam koliko jeljudi uopce zainteresirano za taj proizvod i po kojoj bih ga cijeni mogao prodavati?

b) Kad mjerim u laboratoriju neku fizikalnu velicinu, pri svakom mjerenju cu dobiti drugi broj. Kojibroj da uzmem za mjeru te velicine i kako da odredim preciznost svog mjernog postupka?

c) Na proizvodnoj liniji pratim kvalitetu proizvoda. Koliko mora biti pogrešnih proizvoda pa daprekinem proizvodnju i pokrenem remont linije?

Statistika nam može pomoci da opcenito zadovoljimo našu znatiželju i potrebu za znanjem iistraživanjem?

a) Postoje li ljudi koji imaju paranormalne sposobnosti?

b) Može li covjek odgoditi vlastitu smrt?

c) Pliva li se brže u obicnoj vodi ili u želatini?

Na sva ova pitanja, i mnoga druga, dobit cete odgovore u ovoj knjizi.

Osnovne ideje statistike ilustrirat cemo na jednom povijesnom primjeru. John Graunt (1620 – 1674)se smatra jednim od zacetnika statistike. Analizirajuci tablice smrtnosti (Bills of Mortality) u kojimasu bilježene smrti i rodenja po župama Londona došao je do mnogih informacija o životnom vijeku ljudi,broju muškaraca trenutno sposobnih za vojsku, itd. Kako je uspio iz tablica izvuci sve te informacijevitalne za upravljanje jednim velikim gradom kakav je vec tada bio London, pokazat cemo na primjeruosnovne takve informacije, njegove procjene ukupnog broja stanovnika Londona. Iz tablica smrtnosti za1662. godinu utvrdio je da je ukupno te godine u Londonu umrlo M = 13000 ljudi, od toga u centralnomLondonu (dio Londona unutar zidina) m = 3200 ljudi. Mogao je dosta dobro procijeniti broj ljudi koji živi

Page 11: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

1.1. Uvod 7

u centralnom Londonu znajuci površinu centralnog Londona, broj obitelji po jedinici površine i prosjecanbroj clanova obitelji u tom dobu. Tako je procijenio da u centralnom Londonu živi oko n = 95000 ljudi.Pretpostavio je da je omjer smrtnosti (broj umrlih na 100 stanovnika) u centralnom Londonu i cijelomLondonu isti i iz te jednakosti je odredio ukupan broj stanovnika Londona N:

MN

= mn→N = n ⋅M

m= 95000 ⋅13000

3200≃ 386000

Statisticka osnova Grauntove procjene ukupnog broja stanovnika Londona je sljedeca. Obicno naszanimaju velika mnoštva objekata cije parametre, npr ukupan broj objekata, broj objekata koji imajuneko svojstvo, itd., nije lako, zbog velicine tog mnoštva, utvrditi. Graunta je zanimala populacijaLondona, konkretno u našem primjeru jedan njen parametar - ukupan broj stanovnika. U statistici(veliki) skup objekata koji nas zanima nazivamo populacija a njene elemente jedinke. Medutim, tone mora biti neka populacija ljudi ili životinja. Populaciju mogu tvoriti npr. svi veci zemljotresi (iznadodredene jacine) u 20. stoljecu ili pak sve transakcije koje je poduzece obavilo u jednoj godini. Dakle,za populaciju je jedino važno da smo je precizno odredili, da znamo koji joj objekti pripadaju a koji ne.Parametar populacije je svaka njena brojcana karakteristika.

Da bi procijenio broj stanovnika Londona, Graunt je uzeo jedan uzorak stanovnika, stanovnikecentralnog Londona. Opcenito, uzorak populacije (engl. sample) je dio (podskup) populacije, pomogucnosti ne previše velik tako da na njemu možemo ispitati karakteristike populacije koje naszanimaju. Graunta je zanimao postotak umrlih u cijeloj populaciji. Da bi njega pronašao, utvrdio gaje na uzorku. Izjednacivši postotak umrlih na uzorku i postotak umrlih u cijeloj populaciji procijenio jeukupan broj stanovnika. Ali koja je osnova ovog izjednacavanja? Koliko je opravdano da prenesemona cijelu populaciju ono što smo utvrdili na uzorku? Rekli bismo da je opravdano ako je uzorakreprezentativan. Ali što je to reprezentativan uzorak? To je kljucno pitanje statistike. Mogli bismosmatrati da je uzorak reprezentativan za karakteristike populacije koje nas zanimaju ako ima gotovoiste te karakteristike kao i cijela populacija. Ali ovo odredenje nas ne vodi rješenju jer nam ne kažekako dobiti takav uzorak. Moramo imati operativno odredenje takvog uzorka. Odredenu intuiciju otome imamo. Npr. možemo se složiti da Grauntov uzorak baš nije bio reprezentativan, Naime, uvjetiživota u centralnom Londonu su bili bolji nego u ostalim dijelovima Londona, pa je po svoj prilici i

smrtnost bila manja. Tako je realnije da je umjesto jednakosti Graunt postavio nejednakostMN

> mn

i

tako dobio da je broj stanovnika manji od 386000. No bolje da je dobio išta nego ništa. Tako je i danasu realnoj upotrebi statistike. Kad operativno odredimo što je reprezentativan uzorak, vidjet cemo danjega baš nije lako dobiti, ali cemo bar znati što je idealan uzorak i pokušati ga u realnim uvjetima štobolje aproksimirati.

Grauntov uzorak nije idealan jer je geografski opterecen, uzet je iz samo jednog dijela Londona. Da jenasumice na karti odabrao više malih podrucja i na takvom uzorku utvrdio postotak smrtnosti dobio birealniji rezultat. Osnovna statisticka ideja je da cemo reprezentativan uzorak dobiti ako posve nasumiceodaberemo neku kolicinu jedinki iz populacije. Za tako nasumice odabran uzorak ne vidimo neki razlogda mu se karakteristike bitno razlikuju od karakteristika populacije. Svako odstupanje od nasumicnostivodi tzv pristranom (opterecenom) uzorku (engl. biased sample). Dakle, reprezentativnim uzorkomcemo smatrati slucajan uzorak (engl. random sample): uzorak dobiven postupkom niza izbora jedinkiiz populacije na nacin da pri svakom izboru svaka jedinka ima istu vjerojatnost da bude izabrana. Npr.ako želimo utvrditi koliko ljudi u Hrvatskoj ce na predstojecim izborima glasati za osobu X proceduralnoto možemo uraditi tako da (i) kodiramo brojevima (npr. njihovim OIB-ima) sve punoljetne hrvatskedržavljane, (ii) stavimo brojeve u veliki bubanj, zavrtimo ga, izvucemo odreden broj brojeva tako danakon svakog izvlacenja izvuceni broj zabilježimo i vratimo nazad u bubanj (danas to jednostavnije

Page 12: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

8 1. Populacija, slucajni uzorak i slucajna pojava

radimo pomocu software - a koji nam na slucajan nacin odabere odredenu kolicinu brojeva), (iii)pronademo ljude sa izvucenim brojevima i utvrdimo za koga ce glasati (ako smo istog covjeka nprdva puta izvukli iz bubnja, tad cemo njegov glas racunati kao dva glasa). Naravno, ovo zahtijevadosta vremena i sredstava. Umjesto toga, ljudi se obicno zovu telefonski i anketiraju. Medutim, ovoje optereceni uzorak, jer se anketiraju samo ljudi koji imaju telefon i žele preko telefona odgovoriti naovakvo pitanje. Iako to nije reprezentativan uzorak, opet cemo imati koliko toliko pouzdane podatke.

I Treba vidjeti kako agencije za ispitivanje mnijenja rade ankete

Tako smo odredili osnovnu statisticku proceduru. Da bismo saznali koliko jedinki populacijeima neko svojstvo moramo uzeti slucajan uzorak iz populacije i prebrojati koliko njih u uzorku ima tosvojstvo. Tad vrijedi sljedece.

Osnovna statisticka veza populacije i slucajnog uzorka

Neka u populaciji s N jedinki njih NA ima svojstvo A, a u slucajnom uzorku iz populacije koji iman elemenata njih nA ima svojstvo A. Tada je

NA

N≃ nA

n

Broj NA se naziva frekvencija svojstva A u populaciji, a omjerNA

Nrelativna frekvencija ili

postotak svojstva A u populaciji. Isto tako je nA frekvencija svojstva A u uzorku anA

nrelativna

frekvencija svojstva A u uzorku. Tako osnovnu statisticku vezu slucajnog uzorka i populacijemožemo i ovako izreci:

Relativna frekvencija svojstva u populaciji približno je jednaka relativnoj frekvenciji tog svojstvau slucajnom uzorku. Još kažemo i da relativnom frekvencijom svojstva u slucajnom uzorkuprocjenjujemo relativnu frekvenciju svojstva u populaciji.

Ova procjena je to bolja što imamo veci uzorak.

Iako smo dali proceduru kako dobiti slucajan uzorak sve cemo postaviti na cvrste osnove tekkad preciznije opišemo šta je to slucaj i šta znaci da svaka jedinka ima istu vjerojatnost da budeizabrana. Mada imamo neku intuiciju o tome, tek ce nam teorija vjerojatnosti (matematika slucajnih

Page 13: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

1.1. Uvod 9

pojava) dati precizan model koji ce nam reci koliko su slucajni uzorci reprezentatitvni, tj koliko dobroprocjenjuju parametre populacije. Ona ce potvrditi našu intuiciju da npr. možemo postotkom na uzorkudobro procijeniti postotak na populaciji i da je ta procjena bolja ako uzmemo veci uzorak. Omogucitce nam i mnogo više od toga, npr da kvantificiramo koliko je procjena dobra ili da donesemo na osnoviuzorka odluku o nekom parametru i da pri tom još kvantificiramo koliko je donesena odluka dobra.Npr. vidjet cemo da je dovoljan slucajan uzorak od nekoliko tisuca, cak i nekoliko stotina jedinki,da bismo sasvim zadovoljavajuce mogli procijeniti parametre populacije koja ima više miliona jedinki.Tako možemo odgovoriti i na jednu od uvodnih prica, ispravnost potpisa koje su sindikati prikupili zapokretanje Referenduma o Zakonu o radu. Umjesto da utroši 40 dana i 2.1 milijuna kuna u provjeru815 tisuca potpisa koje su sindikati prikupili, vlada je samo trebala na jedan dan angažirati jednogstatisticara i par pomocnika, da izabere slucajan uzorak od par stotina listica i da sa sigurnošcu utvrdiima li više od 450000 ispravnih potpisa, koliko je bilo potrebno za pokretanje Referenduma.

Teorija vjerojatnosti je medutim puno opcenitija teorija. Ona je teorija svih slucajnih pojava inije samo vezana za ispitivanje populacije pomocu slucajnog uzorka gdje smo slucajnu pojavu umjetnonapravili. Za primjer slucajne pojave možemo uzeti putovanje od kuce na posao. Za ovu pojavu kažemoda je slucajna pojava jer se nece stalno odvijati na isti nacin vec na razlicite nacine, pošto na putovanjeutjece puno faktora koji ne ovise samo o nama. Medutim, kao i kod populacije, da bismo analiziralislucajnu pojavu moramo je tocno definirati, odrediti uvjete pod kojim se ona dešava. Ovdje npr možemoprecizirati da je rijec o odlasku na posao koje zapocinje u 9 sati a covjek krece od kuce u 8.15 sati.Pri tome se covjek svaki put na isti nacin prevozi do posla, npr. autom po uputama Google maps-a.Kad smo tocno odredili o kojoj se slucajnoj pojavi radi trebamo odrediti i što nas zanima o toj slucajnojpojavi. Svako putovanje sadrži puno kvalitativnih i kvantitativnih karakteristika. Ovdje cemo se radijednostavnosti zadržati samo na jednoj karakteristici, vremenu putovanja. Pri tome cemo analiziratikašnjenje na posao. Taj dogadaj cemo oznaciti A. Covjek ce nekada zakasniti na posao, nekada ne. Akoželi kvantificirati koliko kasni, zabilježit ce koliko puta nA je kasnio u n putovanja za koje je pratiohoce li kasniti. Ta putovanja tvore uzorak slucajne pojave. Broj

nA

nna neki nacin eksperimentalno

mjeri koliko on kasni i nazivamo ga relativna frekvencija dogadaja kašnjenja A u danom uzorku.Da je covjek uzeo neki drugi uzorak svojih putovanja, dobio bi nešto drugaciju relativnu frekvenciju.Za vecinu slucajnih pojava se eksperimentalno možemo uvjeriti da što uzimamo vece uzorke razlikemedu relativnim frekvencijama dogadaja u uzorku su sve manje, odnosno grupiraju se oko nekog brojaizmedu 0 i 1. Za takve slucajne pojave kažemo da su statisticki stabilne i svakom dogadaju u toj pojavipridružujemo jedan broj izmedu 0 i 1 oko kojeg se grupiraju relativne frekvencije dogadaja u uzorcima.Taj broj je kao neka vrsta idealne relativne frekvencije dogadaja oko koje se grupiraju stvarne relativnefrekvencije. Valja istaknuti da mi postuliramo da za svaki dogadaj A postoji takav broj P(A) kojegnazivamo vjerojatnost dogadaja A (engl. probability - otuda oznaka P). To je naš teorijski modelkojeg preko relativnih frekvencija u uzorku povezujemo s realnošcu. Tako je osnovna veza teorijevjerojatnosti i slucajnih pojava sljedeca:

Osnovna veza teorije vjerojatnosti i slucajne pojave

Vjerojatnost dogadaja mora biti približno jednaka relativnoj frekvenciji dogadaja u uzorku.

Page 14: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

10 1. Populacija, slucajni uzorak i slucajna pojava

P(A) ≃ nA

n

Ova veza nam omogucuje s jedne strane da eksperimentalno (izracunavši relativnu frekvenciju dogadajau uzorku) procjenimo vjerojatnost tog dogadaja, a s druge strane da kad znamo vjerojatnost nekogdogadaja, procjenimo relativnu frekvenciju tog dogadaja u uzorku. Ova veza ujedno odreduje i znacenjevjerojatnosti kao idealne relativne frekvencije oko koje se grupiraju stvarne relativne frekvencije. Ovuinterpretaciju nazivamo statisticka interpretacija vjerojatnosti. Postoje i druge interpretacijevjerojatnosti, ali mi se njima necemo baviti jer je ova interpretacija znanstveno najutemeljenija i nanjoj je zasnovana statistika.

Istaknimo odmah da vjerojatnost dogadaja ništa ne govori o pojedinoj realizaciji slucajne pojave,hoce li se taj dogadaj desiti ili ne. Ona govori samo o mnoštvu realizacija i to samo o postotku pojave togdogadaja u mnoštvu. Npr. ako student eksperimentalno utvrdi da je vjerojatnost njegova kašnjenja 20%taj broj ništa ne govori o tome hoce li on ovaj utorak zakasniti, ali u 100 utoraka njegov broj kašnjenja cesigurno biti negdje oko 20. Možda baš nece biti tocno 20 (20%), vec 19 ili 21, ali nece puno odstupati od20. Ovo jeste mali paradoks, da vjerojatnost dogadaja ne govori ništa o pojedinom vec govori o mnoštvu,iako je mnoštvo sastavljeno od pojedinog. Iz istog razloga saznanje da je covjek obolio od bolesti zakoju vjerojatnost da ce umrijeti iznosi 80% ništa ne govori o tome hoce li on umrijeti ili ne, mada cena kraju od 100 oboljelih njih negdje oko 80 umrijeti. Zbog (životne) važnosti ove situacije objasnitcemo je podrobnije. Konkretan covjek koji je obolio od dane bolesti ima neke svoje karakteristike A,B, C, . . . , koje utjecu na ishod ove bolesti (za neke od njih možda i ne znamo da utjecu). Zato zanjega nije toliko relevantan podatak da je smrtnost 80% kod ljudi koji obole od te bolesti koliko mu jerelevantan postotak smrtnosti kod osoba koje obole od te bolesti a imaju karakteristiku A (postotaksmrtnosti u drugoj populaciji). Još mu je relevantniji postotak smrtnosti kod osoba koje obole od tebolesti a imaju karakteristike A i B (postotak smrtnosti u trecoj populaciji). Dodavanjem svake novekarakteristike on dobiva relevantniji postotak, postotak smrtnosti u za njega relevantnijoj populaciji,koji se može bitno razlikovati od prethodnog (npr. postati 10% umjesto 80%). Daljnjim preciziranjem, uidealnom slucaju, populaciju cemo svesti na samo jednu jedinku – samog tog covjeka. Za jednu jedinkustatisticki pojmovi gube smisao: tu ce postotak smrtnosti biti 0% ili 100%, i on to ne može unaprijedznati. Medutim, postotak smrtnosti od 80%, mada ne odreduje što ce s doticnim covjekom biti, ipakkaže što mu je razumno uraditi. Kaže mu da se radi o teškoj bolesti ciji ishod ne ovisi samo o njegovimkarakteristikama jedinke vec i o tome kakvo lijecenje i druge aktivnosti ce poduzeti, te da svoju situacijutreba ozbilno shvatiti i aktivno se suociti s njom. Isto tako, kad oboljeli savjetujuci se sa lijecnikomodlucuje koju metodu lijecenja odabrati, to što je jedna metoda lijecenja statisticki uspješnija znacinešto tek za mnoštvo oboljelih, dok za njega osobno opet ne znaci ništa. Zato treba uzeti u obzir sve

Page 15: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

1.2. Populacija 11

relevantne osobne karakteristike i druga znanja pored statistickih, da se donese što razumnija odluka.Ako nema drugih pokazatelja tad je razumno odluciti se za prvu metodu, ali je možda u nekom trenutkulijecenja razumno i odustati od nje, ako ne donosi ocekivani rezultat. Dakle, na nivou pojedinca (jedinke)statistika i teorija vjerojatnosti nam pomažu u donošenju razumnih ali ne nužno i ispravnih odluka.

Ilustrirajmo ovaj paradoks vjerojatnosti jedinka – mnoštvo na nešto laganijoj situaciji. Baca sesimetricna kocka i vaš protivnik vam nudi okladu u 100 kuna: ako padne šestica on dobiva 100 kn, ako

ne padne vi dobivate 100 kn. Poslije cemo vidjeti da je vjerojatnost da padne šestica16= 16.7%. Da li

prihvatiti opkladu? Ako sto puta (veci broj puta) bacate kocku sigurno prihvatite opkladu jer cete oko83 puta dobiti a oko 17 puta izgubiti, dakle zaradit cete 6600 kuna. Medutim, ako se samo jednom bacakocka ništa ne možemo reci o ishodu. Zbog navedene vjerojatnosti cini se razumnim prihvatiti opkladu,ali u konacnici ili cete dobiti ili izgubiti 100 kn.

Iz gornje analize bi se mogao steci dojam da pojam vjerojatnosti i nije baš neki dobar pojam jer gamožemo tek približno odrediti i tek približno na osnovi njega izracunati što ce se zbivati u mnoštvu.Medutim, teorija vjerojatnosti nam povezuje vjerojatnosti raznih slucajnih pojava i omogucuje dateorijski predvidamo što ce se zbiti i u situacijama s kojima nismo eksperimentirali, a predvidanjakoja ona daje o mnoštvu iako su približna, veoma su stabilna i korisna. Nadamo se da cete se i samina kraju studiranja po ovoj knjizi uvjeriti u to. Vratimo se na trenutak problemu kašnjena na posao.Što ako poslodavac ne dozvoljava da se kasni na više od 5% puta? Uz malo eksperimentiranja teorijavjerojatnosti ce covjeku dati odgovor koliko treba krenuti ranije na posao pa da ne kasni više od 5%puta. Taj cemo primjer poslije riješiti. Isto tako, teorija vjerojatnosti kod kladenja da ce pasti šesticace odrediti koliko je fer (i šta to znaci) da uloži novaca onaj koji se kladi na šesticu a koliko onaj koji sekladi da nece pasti šestica (intuitivno je jasno da bi onaj koji se kladi na šesticu trebao manje uložitijer mu je manja šansa dobitka). Ovakva pitanja fer ulaganja su od vitalnog znacaja osiguravajucimkucama, kladionicama i organizatorima igara na srecu, da bi mogli odrediti što nije fer ulaganje i takoostvariti profit. Pitanje fer ulaganja cemo takoder u jednom momentu riješiti.

U ovoj smo cjelini skicirali statisticki postupak ispitivanja populacije. Iz populacije slucajnimodabirom dobijemo slucajan uzorak. Na slucajnom uzorku ispitamo parametre koji nas zanimaju idobivenim brojevima procjenimo odgovarajuce parametre populacije. U sljedecim cjelinama cemo sedetaljnije zabaviti s tri kljucna elementa u ovoj shemi: populacijom, slucajnim uzorkom i slucajnompojavom.

1.2 Populacija

Apstraktno gledano, populacija je bilo koji skup objekata. Naravno, statistika se bavi velikimpopulacijama koje su iz nekog razloga zanimljive i cije parametre nije lako direktno odrediti. No mise možemo na primjeru male populacije (populacije - igracke) na jednostavan nacin upoznati sa svimelementima populacije kojima se bavi statistika (kod velikih i zanimljivih populacija). U tu svrhu smouzeli jednu grupu studenata jednog specijalistickog studija, Kao što je svaki student svijet za sebe sabeskonacno informacija, isto vrijedi i za svaku jedinku neke populacije. Obicno imamo neki razlog daistražujemo neku populaciju i taj razlog odreduje koje podatke o svakoj jedinki želimo prikupiti. Našapopulacija studenata služi za ilustraciju pojma populacije i to je donekle odredilo koje smo podatke onjima prikupili. Prikupili smo za svakog studenta podatke o starosti, spolu, visini, težini, visini, brojubrace i sestara, itd. Podaci su prikazani u sljedecoj tablici (možete ih naci u datoteci Populacije.xlsxu listu Grupa studenata)

Page 16: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

12 1. Populacija, slucajni uzorak i slucajna pojava

Ovo su takozvani izvorni podaci (engl. raw data), podaci koji su direktno dobiveni prikupljanjem,bez ikakve dodatne obrade (osim jednog malog detalja koji je niže opisan). Pri tome razlikujemopodatak i vrijednost podatka. Npr. u trecoj koloni (spol) imamo 22 podatka a samo dvije vrijednosti(m i ž).

Svaka je jedinka (student) predstavljena jednim slogom (nizom) podataka i to je jedna vrstaapstrakcije. Sve smo o toj jedinki apstrahirali osim onog što je u tom slogu. Kad želimo ispitati nekupopulaciju moramo dobro paziti koje podatke smatramo relevantnim za prikupiti da ne bismo nešto štobi moglo biti važno izostavili.

Prije nego analiziramo strukturu prikupljenih podataka upozorimo na probleme koji mogu nastatipri prikupljanju podataka. Prije svega je važno da su pitanja i ponudeni odgovori dobro definirani(dizajnirani). Npr. pitanje o spolu nije dobro definirano jer ne pretpostavlja da se u grupi možda nalaziosoba koja smatra da nema odredeni spol. Zato je možda trebalo ponuditi i izbor n (neopredijeljen).Isto tako je i pitanje jeste li za legalizaciju abortusa možda nedovoljno precizno, jer neki možda jesu uzneka ogranicenja. Isto tako je možda i tu trebalo ponuditi odgovor n za one koji nemaju odreden stavo tome. Nadalje, moramo paziti da postavljamo nepristana (engl. unbiased) pitanja: da se pitanja ne

Page 17: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

1.2. Populacija 13

dizajniraju tako da sugeriraju odgovor. Npr, pitanje treba li bolje zaštiti radnicka prava je možda takvonepristrano (optereceno) pitanje jer sugerira odgovor da. Bilo bi bolje ponuditi npr sljedecu formulaciju:na ljestvici od 1 do 5 ocjenite stanje radnickih prava u Hrvatskoj. Sljedeci problem prikupljanjapodataka je što uraditi sa osobama koje ne žele dati neke podatke o sebi, tzv problem nepostojanjaodgovora (engl. nonresponse bias). Taj problem se može ublažiti osiguranjem anonimnosti ankete ilida se kod svakog podatka ponudi i odgovor ne želim odgovoriti na to pitanje. Takoder, treba voditi brigui o tome da li smo podatak dobili mjerenjem ili nam je jedinka dala podatak. U ovom drugom sklucajupodatak ne mora biti vjerodostojan. Naravno, neke stvari ne možemo izmjeriti vec se moramo oslonitina izjavu jedinke, npr odgovor na pitanje je li za legalizaciju abortusa. Tako se u prikupljanju podatakajavlja i problem vjerodostojnosti podataka (engl. response bias). Kad se podaci prikupe dobro jepokušati uociti podatke koji se previše razlikuju od ostalih podataka, odudarajuce podatke (engl.outliers). Njihov izvor treba posebno ispitati da se utvrdi jesu li legitimni ili se desila nekakva greškau prikupljanju podataka. Npr. u originalnoj tablici je bio podatak za jednog studenta da ima 11 brace isestara. Naknadnom provjerom se utvrdilo da ima 1 sestru ali se 1 u pretipkavanju podataka pretvoriou 11. Tako, doslovno gledano gornja tablica ne predstavlja sirove podatke, jer je ipak uradena jednaobrada, no cinilo nam se nepotrebnim da zbog ovog detalja kojeg smo lako riješili u knjizi reproduciramodvije tablice.

Tablica podataka dane populacije studenata omogucuje izdvajanje raznih svojstava. Npr. možemo

se pitati koliko je studenata više od 180 cm. Takvih je 9 (apsolutna frekvencija svojstva), odnosno922

=0.409 = 40.9% (relativna frekvencija). Možemo izdvojiti i svojstva zadana složenijim opisima, npr. bitiosoba ženskog spola niža od 170 cm ili još složenije, biti osoba ženskog spola niža od 170 cm koja nemabrace i sestara, itd. Parametri koji su obicno zanimljivi u analizi populacije (i koje nastojimo procijenitiiz uzorka) su upravo (relativne) frekvencije svojstava populacije, odnosno (relativni) broj jedinki koji imazadano svojstvo. U periodu dok pišemo ovu knjigu (pocetak 2018. godine) upravo je veliki problem uHrvatskoj iseljavanje i zasigurno je važno vidjeti koliko mladih ljudi želi otici iz Hrvatske.

Svaki redak tablice predstavlja (apstraktno) jednog studenta (osim prvog retka). Što predstavljasvaki stupac tablice (izuzev prvog u kojem su studenti predstavljeni rednim brojevima)?. Npr. u stupcuvisina za svakog studenta je dana njegova visina. Matematickim rjecnikom govoreci imamo funkcijukoja svakom studentu pridružuje njegovu visinu. Kao što smo u standardnoj srednjoškolskoj matematiciimali npr. funkciju kvadrat koja svakom broju pridružuje njegov kvadrat, npr kvadrat(3) = 9, takoovdje imamo funkciju VISINA koja svakom studentu pridružuje njegovu visinu, npr. za studenta srednim brojem 3 je VISINA(3) = 185. Funkcija kvadriranja na ulazu ima realne brojeve i na izlazu imarealne brojeve. Zato za nju kažemo da je funkcija sa skupa realnih brojeva R u skup realnih brojeva Ri to sažeto zapisujemo kvadrat ∶ R→ R. Funkcija VISINA na ulazu ima studente a na izlazu ima realnebrojeve. Zato za nju kažemo da je funkcija sa skupa grupa studenata u skup realnih brojeva R i tosažeto zapisujemo VISINA ∶ Grupa studenata→ R. Isto vrijedi i za druge stupce. Svaki stupac tablicepredstavlja jednu funkciju. Npr stupac Pripadate li nekoj religijskoj skupini predstavlja jednu funkcijukoja svakom studentu pridružuje jednu od dvije vrijednosti d i n .Funkcije Starost, Spol, Visina, . . . ,se obicno nazivaju atributi ili karakteristike populacije. Medutim, njihova prava priroda je da suto funkcije sa populacije studenata, pa cemo ih mi tako i nazivati. Vrijednosti ovih funkcija obicnovariraju od jedinke do jedinke populacije pa se u statistici još uvriježilo da se funkcije sa populacije jošnazivaju i varijable populacije. Ovo ne treba brkati sa standardnim pojmom varijable u matematicii standardnim pojmom varijable u programiranju. Varijable u programiranju su obicno simbolickaimena celija u kojim se cuvaju podaci (vrijednosti varijabli), varijable u matematici su imena namjernonespecificiranih brojeva (neka je x bilo koji broj, a y broj veci od 0 . . . ), a varijable u statistici su naprostofunkcije. Takoder u statistici se uvriježilo da imena varijabli (funkcija!) pišemo velikim slovima. Takoih vizuelno možemo razlikovati od standardnih varijabli u matematici koje pišemo malim slovima. Jošje uobicajeno da vrijednosti varijable X oznacavamo x, varijable V sa v, itd.

Page 18: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

14 1. Populacija, slucajni uzorak i slucajna pojava

Kad proucavamo neku populaciju prvo odredimo koje nas varijable te populacije zanimaju. Skup tihvarijabli odreduje koju informaciju o svakoj jedinki želimo znati: to su upravo vrijednosti tih varijabli natoj jedinki. Tako su npr. podaci za studenta broj 4 redom vrijednosti varijabli STAROST, SPOL, VISINA,. . . Za svaku varijablu populacije parametri koji nas zanimaju su relativne frekvencije vrijednosti tevarijable, odnosno za svaku vrijednost varijable koliko posto jedinki ima tu vrijednost. Npr. varijabla B(broj brace i sestara) poprima vrijednosti 0, 1, 2 i 3. Iz tablice možemo vidjeti da 4 studenta imaju 0 brace

i sestara, pa je njihova relativna frekvencija422

= 211

= 18.2%. Isto tako 16 studenata ima jednog brata

ili sestru pa je njihova relativna frekvencija1622

= 811

= 59.1%, itd. Tako ovdje imamo novu funkciju kojasvakoj vrijednosti varijable B pridruži relativnu frekvenciju skupa jedinki koje imaju baš tu vrijednost.Ova funkcija se naziva distribucija (raspodjela) relativnih frekvencija varijable B i oznacavamo je fB.Tako sad imamo dvije povezane funkcije. Prva funkcija je varijabla B koja je zadana kolonom tablice ikoju cemo ovdje reproducirati u formi retka:

To je funkcija sa skupa studenata u skup vrijednosti 0,1,2,3. Npr. iz tablice možemo vidjeti da jeB(18) = 3, tj. da student pod rednim brojem 18 ima 3 brata i sestre.

Distribucija fB je funkcija sa ovog skupa vrijednosti u skup realnih brojeva. Nju isto možemoprikazati tablicom:

Npr. iz tablice možemo išcitati da je fB(3) = 1/22. To znaci da122

= 4.5% studenata ima trojebrace i sestara. Poslije cemo nauciti distribucije graficki predstavljati na nacin da cemo gotovo vizuelnoutvrdivati njihova svojstva.

Odnos varijable B i njene distribucije fB možemo slikovito prikazati na sljedeci nacin:

Statistiku ne zanimaju pojedine jedinke vec ”koliko cega ima”. Zato je za statistiku najvažnijeznati za svaku ispitivanu varijablu populacije X njenu distribuciju fX relativnih frekvencija. Toje funkcija koja svakoj vrijednosti varijable X pridružuje relativnu frekvenciju jedinki koje imaju tuvrijednost. Ovu funkciju možemo procijeniti iz slucajnog uzorka populacije, kao što cemo poslije vidjeti.Npr. dobavljacima obuce bi valjalo da znaju koliko posto žena (muškaraca) u Hrvatskoj ima odredenuvelicinu cipele, da znaju koje kolicine narucivati. Tu informaciju daje upravo distribucija varijable kojasvakoj ženi (muškarcu) u Hrvatskoj pridružuje broj cipela koje nosi. Primijetimo odmah da za velikepopulacije odredivanje distribucije neke varijable populacije direktno na njoj ili na slucajnom uzorku (injen graficki prikaz) su racunski veoma naporni i zato je gotovo nužno koristiti odgovarajuci software utu svrhu.

Page 19: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

1.2. Populacija 15

Varijabla populacije i njena distribucija relativnih frekvencija

Varijabla populacije je bilo koja funkcija sa populacije.

Distribucija relativnih frekvencija varijable populacije je funkcija koja svakoj vrijednostivarijable pridruži relativnu frekvenciju (postotak) skupa jedinki kojima varijabla pridružuje tuvrijednost (koliko posto jedinki u populaciji ima tu vrijednost).

Kad se radi matematicki opis i statisticka obrada varijabli populacije pokaže se da se ne mogusve varijable na isti nacin tretirati, vec se moraju podijeliti u odredene tipove. Osnovna podjela jena kategorijske (kvalitativne) varijable (kojima vrijednosti nisu brojevi) i numericke (kvantita-tivne) varijable kojima su vrijednosti brojevi koji izražavaju neku velicinu. Tako je npr. na našojmaloj populaciji studenata visina kvantitativna varijabla jer su joj vrijednosti brojevi a odgovor napitanje pripadate li nekoj religijskoj skupini kvalitativna varijabla jer su joj vrijednosti simboli d in. Napominjemo da se cesto objekti kodiraju brojevima. Tako smo umjesto n mogli uzeti broj 0 aumjesto d broj 1, pa bi odgovor na pitanje za vrijednosti davao brojeve 0 i 1. Medutim, ta varijablabi i dalje bila kategorijska varijabla jer njene vrijednosti nisu brojevi koji izražavaju neku velicinu vecbrojevi kao kodovi nenumerickih objekata. Nadalje, i kvantitativne varijable se po nacinu opisa dijelena diskretne kvantitativne varijable i neprekidne kvantitativne varijable, ovisno o tome jesu liim vrijednosti diskretan skup brojeva (najcešce cijeli brojevi) ili mogu poprimiti bilo koju vrijednost iznekog intervala brojeva. Npr. na našoj populaciji studenata broj brace i sestara je diskretna varijablajer može za vrijednosti poprimiti samo prirodne brojeve (ukljucujuci i 0). S druge strane, iako zbogzaokruživanja se cini da je visina diskretna varijabla, ona je ipak neprekidna varijabla jer visina možebiti bilo koji realni broj iz nekog intervala. Ova podjela varijabli se može još usitniti, ali ovo je osnovnai za naše uvodne potrebe dovoljna podjela.

Page 20: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

16 1. Populacija, slucajni uzorak i slucajna pojava

Pored relativne frekvenije pojedinih svojstava populacije i distribucije relativnih frekvencija va-rijabli populacije, statistiku pogotovo zanima povezanost varijabli. Npr. postoji li veza izmeduvisine i težine (povezanost dvije kvantitativne neprekidne varijable) veza izmedu stava o abortusu ipripadnosti nekoj religijskoj skupini (veza dvije kategorijske varijable) spola i visine (veza kvantitativnei kategorijske varijable). Promotrimo npr, detaljnije pitanje jesu li viši studenti teži. Ta veza sigurnonije deterministicka. Npr. u našoj populaciji studenata studenti broj 3 i broj 10 su jednako visoki(185 cm) a nisu jednako teški: broj 3 je težak 110 kg, a broj 10 89kg. No iz tablice je vidljivo da svecim visinama idu i vece težine, što naravno možemo objasniti fizikalnim svojstvima ljudskog tijela.Poslije cemo nauciti kako graficki predstaviti vezu ovih neprekidnih varijabli, kako mjeriti jacinu ovepovezanosti i kako predvidati vrijednosti jedne velicine kad znamo drugu. Isto tako vidimo da sukod osoba ženskog spola prisutnije niže visine a kod osoba muškog spola više visine, pa tako i ovdjeimamo povezanost (nedeterministicku) visine i spola. Poslije cemo nauciti graficki predstavljati takavtip veze, vezu kategorijske i kvantitativne varijable, i ispitivati kakva je njihova povezanost. Isto takocemo nauciti ispitati postoji li veza dviju kategorijskih varijabli, npr. veza izmedu pripadnosti nekojreligijskoj skupini i stavu o legalizaciji abortusa. Naravno, sve to cemo raditi uz pomoc Excela koji cepreuzeti racunski dio posla. Pri tome valj aistaknuti razliku izmedu utvrdivanja povezanosti varijablii uzrocosti. Jasno je da težina ne uzrokuje visinu niti visina težinu, vec su to karakteristike velicineorganizma. Medutim. to što visina ovisi o spolu, ne znaci i da spol uzorkuje visinu. Treba znati koji geniuzrokuju visinu i ispitati postoji li veza tih gena i spola. Uglavnom, statistika može utvrditi postojanjeveze medu varijablama ali opcenito govoreci ne i postojanje uzrocnosti medu varijablama.

1.3 Slucajna pojava

U analizi populacije slucajnu pojavu smo umjetno napravili da bismo dobili reprezentativan uzorak.Medutim, kao što smo rekli pojam slucaja je puno širi, pa cemo mu posvetiti još malo prostora.

Za neka zbivanja kažemo da su slucajna a za neka da se odvijaju na tocno odreden nacin, da sudeterminirana. Npr. koji ce se znak pojaviti na ekranu kad pišete tekst u programu Word posve jeodredeno time koju ste tipku na tastaturi pritisnuli. Nasuprot tome, bacimo li igracu kocku ne možemopredvidjeti na koju stranu ce pasti. Zbivanje je slucajno. Jednom ce pasti jedan broj, drugi put drugi.

Mada su slucajnost i determiniranost naizgled suprotni pojmovi oni se u realnim zbivanjimaispreplicu. Gotovo i ne postoje zbivanja u kojima nisu prisutni i determiniranost i slucaj, samo je pitanješto je od toga dominantno u tom zbivanju. Po klasicnoj fizici buduce gibanje je posve odredeno pocetnimuvjetima. Kad pritisnem tipku na racunalu rezultat ce biti ispis odredenog slova na ekranu nakontocno odredenog vremena t. To vrijeme je odredeno fizikalnim procesima u racunalu. Medutim uz istemakroskopske uvjete (temperaturu okoline, vlagu itd.) zbog mnoštva zbivanja u samom racunalu, kojane možemo kontrolirati, to vrijeme nece uvijek biti isto. Dakle prisutan je slucaj, ali njegov utjecaj jeovdje zanemariv. S druge strane, kad bacamo kocku, gibanje kocke je posve odredeno nacinom na kojije bacena iz ruke i svim utjecajima kojima ce biti izložena do zaustavljanja. Nacin izbacivanja kockene možemo posve kontrolirati kao ni ostale utjecaje prilikom padanja i to bitno utjece na rezultat. Zatonam ovdje determiniranost ne pomaže vec dominira slucaj.

U prethodnim primjerima slucaj je bio rezultat nemogucnosti kontrole zbivanja. Takvo razumijeva-nje slucaja proizlazi iz klasicne fizike kojom opisujemo makroskopske pojave. Po klasicnoj fizici je svedeterminirano a slucaj proizlazi iz nemogucnosti totalne kontrole uvjeta pod kojim se procesi odvijaju.Medutim, po kvantnoj fizici, koja je temeljnija fizikalna teorija, slucaj je bitan dio same prirode i nijetek rezultat nemogucnosti kontrole.

Page 21: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

1.3. Slucajna pojava 17

U svakodnevnom životu slucaj obicno ne možemo zanemariti u složenim situacijama na koje utjecemnoštvo faktora koje ne možemo kontrolirati. To može biti npr. putovanje od kuce do posla ili pakproizvodnja celicnih diskova odredene debljine. U prvom primjeru ce npr. vrijeme putovanja variratiiz dana u dan, a u drugom debljina diska. Mada vrijeme putovanja varira, ipak cemo uociti nekupravilnost u tom variranju. Vrijeme putovanja cešce ce biti u nekom vremenskom intervalu nego udrugom. Isto tako ce i debljina diska varirati oko neke "srednje" vrijednosti. Dakle i u slucaju otkrivamoneke pravilnosti. Ako nam se cini da debljina diska previše varira, pokušat cemo popraviti proizvodniproces da bismo dobili manju varijaciju. I tada ce biti neka varijacija i na nama je da procijenimo je liona zaista manja ili ne. Ako koristimo dva puta do posla, duž svakog puta postoje varijacije u vremenuputovanja. Možemo li usporediti vremena putovanja i zakljuciti da nam je bolje ici jednim putem a nedrugim? Sve ove situacije ukazuju na mogucnost i potrebu mjerenja slucaja.

Matematicki modeli kojima kvantitativno opisujemo situacije u kojima dominira determinizam aslucaj je zanemariv sastoje se od skupa odgovarajucih formula. Npr. padanje u zrakopraznom prostoru

je opisano Galilejevom formulom za jednoliko ubrzano gibanje s = 12

gt2, gdje je s prijedeni put u vremenu

t od pocetka padanja a g je konstanta slobodnog pada (približno jednaka 9.81 m/s2). Ta formula namtocno determinira koliki je put tijelo prešlo u zadanom vremenu padanja. U stvarnoj situaciji, kad nijeprostor zrakoprazan i kad se mogu pojaviti i neki drugi faktori, ova formula tek približno vrijedi. Tadatreba eksperimentalno utvrditi opisuje li ona dobro situaciju ili je potreban složeniji model (formula)koji ce uzeti u obzir i te druge faktore.

Matematicki modeli kojima kvantitativno opisujemo slucajne pojave sasvim su druge prirode. Naosnovi opažanja i mjerenja, ili pak iz neke teorije, slucajnoj pojavi se pridruži tzv. vjerojatnosnimodel koji je u stvari poopcenje slucajne pojave izbora iz populacije na bilo koju slucajnu pojavu. Kaoi kod slucajnog izbora iz populacije, taj se model sastoji od skupa mogucih ishoda (kod populacije suto bile jedinke) skupa dogadaja (kod populacije su to bila svojstva jedinki) i vjerojatnosti, funkcije kojasvakom dogadaju pridružuje broj koji mjeri ucestalost tog dogadaja. U okviru tog modela moci cemokvantitativno opisati slucajnu pojavu i u odredenom smislu predvidati zbivanja.

Vjerojatnosne modele cemo detaljno upoznati u sljedecem poglavlju. U ovom uvodnom dijelu cemosamo izložiti jedan ilustrativan primjer na kojem cemo upoznati osnovne elemente slucajne pojave ividjeti da ona ima slicnu strukturu kao i populacija.

Cesto nas zanimaju samo neka pitanja vezana uz slucajnu pojavu. Npr. u tradicionalnoj igri šijavicasudjeluju dva igraca. Oni istovremeno ispruže po jednu ruku i pokažu odreden broj prstiju (nula -zatvorena šaka, do 5 - svi su prsti ispruženi). Pri tome uzvikuju na iskrivljenom talijanskom jezikukoliki je ukupan broj prstiju (npr. do, od talijanski duo, znaci dva, šije, od talijanski sei, znaci šest,itd.). U pravoj igri je dogovor da se pokazanih nula prstiju racuna kao da je pokazan jedan prst. Noto bi nam sad nepotrebno kompliciralo analizu pa cemo ovdje gledati stvaran broj pokazanih prstiju.Onaj koji pogodi ukupan broj prstiju dobio je bod (punat). Tako je u slucajnom bacanju prstiju jedinozanimljiv ukupan broj pokazanih prstiju, prirodan broj izmedu 0 i 10. Pogledajmo što je u ovom slucajuvjerojatnosni model i kakva pitanja su zanimljiva za igru? Svaki ishod možemo predstaviti uredenimparom brojeva od 0 do 5. Prvi broj u paru kaže koliko je prstiju pokazao prvi igrac, a drugi, koliko jepokazao drugi igrac. Tako je prostor ishoda skup

Ω ∶

Page 22: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

18 1. Populacija, slucajni uzorak i slucajna pojava

(0,0) (0,1) (0,2) (0,3) (0,4) (0,5)(1,0) (1,1) (1,2) (1,3) (1,4) (1,5)⋮

(5,0) (5,1) (5,2) (5,3) (5,4) (5,5)

Što su jedinke za populaciju to su ishodi za slucajnu pojavu.

Sljedeci korak u odredenju vjerojatnosnog modela je pridruživanje svakom ishodu vjerojatnosti dase to desi. Ti brojevi ovise o strategiji koju su u igri odabrali igraci i mogli bismo ih procijeniti izrelativnih frekvencija u uzorku, nizu odigranih bacanja, uz uvjet da igraci ne promjene strategiju. Micemo sada, radi jednostavnosti, pretpostaviti da je u pitanju simetrican model – da su svi ishodijednako vjerojatni (ne postoji nikakva strategija u igri). To znaci da bi u nizu ponavljanja svi ishodiimali približno iste relativne frekvencije. Pošto je 36 ishoda te bi se frekvencije trebale vrtiti oko broja1

36. Tako cemo uzeti za naš vjerojatosni model da je vjerojatnost svakog pojedinog ishoda

136

. Možemo

razmatrati razne dogadaje, npr. dogadaj da su pali isti brojevi, i pitati se koja je vjerojatnost da seto desi. To ce se desiti kad padnu brojevi (0,0),(1,1),(2,2),(3,3),(4,4) i (5,5). Relativna frekvencijaovog dogadaja u uzorku je zbroj relativnih frekvencija pojedinih ishoda u uzorku pa je prihvatljivo unašem modelu za vjerojatnost tog dogadaja uzeti zbroj vjerojatnosti svih ishoda koji ga ostvaruju, dakle

broj6

36= 1

6. Istu analizu možemo uraditi za vjerojatnost bilo kojeg dogadaja. Zato cemo u modelu

postaviti opce pravilo da je vjerojatnost bilo kojeg dogadaja jednaka zbroju vjerojatnosti ishoda koji garealiziraju.

Što je podskup (svojstvo) u populaciji to je dogadaj u slucajnoj pojavi. Što je relativna frekvencija(postotak) podskupa u populaciji to je vjerojatnost dogadaja u slucajnoj pojavi

Za igru su jedino zanimljivi dogadaji vezani uz zbroj brojeva: kolika je vjerojatnost da zbroj bude 6,koji je zbroj najvjerojatniji, kolika je vjerojatnost da zbroj bude manji od 4, itd. Zbroj brojeva u paru jefunkcija Z koja svakom ishodu, paru (x, y), pridružuje jedan broj: Z(x, y) = x+ y. Funkciju sa skupaishoda nazivamo slucajna varijabla. Kažemo slucajna jer joj je ulaz slucajan ishod pa joj je i vrijednostslucajna. Jedan put ce biti jedna vrijednost a drugi put druga. Tako je funkcija Z (zbroj palih brojeva)slucajna varijabla. Možemo je prikazati sljedecom tablicom

y

x

0 1 2 3 4 50 0 1 2 3 4 51 1 2 3 4 5 62 2 3 4 5 6 73 3 4 5 6 7 84 4 5 6 7 8 95 5 6 7 8 9 10

Sva za igru zanimljiva pitanja su vezana uz vjerojatnosti da ce vrijednost slucajne varijable bitineki broj ili pak da ce biti u nekom skupu brojeva. Na sva takva pitanja možemo odgovoriti akoznamo vjerojatnosti da se dese pojedine vrijednosti, dakle, ako znamo njenu distribuciju vjerojatnosti.Njih možemo dobiti iz prethodne tablice. Npr vjerojatnost da ce zbroj biti jednak 3 (to pišemoP(Z = 3)) je vjerojatnost skupa svih ishoda za koje je vrijednost zbroja 3. U našem slucaju je to skup(3,0),(2,1),(1,2),(0,3) (to se može vidjeti iz prethodne tablice), pa je

Page 23: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

1.3. Slucajna pojava 19

P(Z = 3) = P((3,0),(2,1),(1,2),(0,3)) = 436

= 19

.

Izracunamo li na ovaj nacin vjerojatnost za svaku vrijednost z slucajne varijable Z dobit cemo sljedecutablicu koja nam odreduje novu funkciju – distribuciju vjerojatnosti varijable Z:

z 0 1 2 3 4 5 6 7 8 9 10f (z) = P(Z = z) 1

362

363

364

365

366

36536

436

336

236

136

Kad znamo distribuciju vjerojatnosti možemo zaboraviti na prostor ishoda jer nam ona sve govori ovjerojatnostima da ce vrijednost slucajne varijable biti u nekom skupu vrijednosti. Npr vjerojatnost dace zbroj biti manji od 4 je

P(Z < 4) = P(Z ∈ 0,1,2,3) = f (0)+ f (1)+ f (2)+ f (3) = 136

+ 236

+ 336

+ 436

= 1036

= 518

a vjerojatnost da ce zbroj biti izmedu 7 i 10 je

P(7 < Z < 10) = P(Z ∈ 8,9) = f (8)+ f (9) = 336

+ 236

= 536

Isto tako vidimo da je najvjerojatnije da zbroj bude 5 i ta vjerojatnost opada kako se udaljavamo od 5.Tako gledano, najbolje je, uz pretpostavku simetricnog modela, u igri stalno zvati 5 ili brojeve oko 5.

Na ovom primjeru smo ilustrirali dva važna pojma, slucajnu varijablu i njenu distribuciju vjerojat-nosti, pa ih valja još jednom istaknuti:

Slucajna varijabla i njena distribucija vjerojatnosti

Slucajna varijabla je bilo koja funkcija sa skupa slucajnih ishoda

Distribucija vjerojatnosti slucajne varijable je funkcija koja svakoj vrijednosti varijablepridruži vjerojatnost da ce varijabla poprimiti tu vrijednost.

Page 24: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

20 1. Populacija, slucajni uzorak i slucajna pojava

Što je varijabla sa svojom distribucijom postotaka u populaciji to je slucajna varijabla sa svojomdistribucijom vjerojatnosti u slucajnoj pojavi.

1.4 Slucajni uzorak

Na prethodnom primjeru male populacije ilustrirali smo strukturu populacije (svojstva i varijable)kojima se bavi statistika. No, kao što smo rekli, populacije koje su iz nekog razloga zanimljive suobicno ogromne i statisticki pristup utvrdivanju parametara populacije koji nas zanimaju je da dobijemoslucajan uzorak na kojem cemo ispitati te parametre. Struktura koja nas zanima na uzorku je ista onakao na populaciji, samo cemo sad svojstva i njihove relativne frekvencije ispitivati na uzorku, istotako i varijable i njihove distribucije, kao i povezanost varijabli. Relativnim frekvencijama svojstavana uzorku procjenjivat cemo relativne frekvencije istih tih svojstava na populaciji, a distribucijamavarijabli na uzorku procjenjivat cemo distribucije istih tih varijabli na populaciji. Isto tako, kadnaucimo ispitivati vezu medu varijablama, vidjet cemo da na isti nacin kako se opisuje veza varijablina populaciji, opisuje se i veza varijabli na uzorku, i onim što utvrdimo o vezi na uzorku procijenit cemovezu na populaciji. Nadalje, svi problemi na koje smo upozorili pri prikupljanju podataka za populacijuvrijede i za prikupljanje podataka za uzorak. S tim što je za uzorak, da bismo mogli koristiti statistickipristup, najvažniji problem koji treba riješiti – osigurati da je (približno) slucajan, da je svaka jedinkapopulacije pri svakom izboru jedinke u uzorak imala jednaku vjerojatnost da bude izabrana. Vec smonapomenuli da cesto nije lako dobiti slucajan uzorak. Postoje razne tehnike uzorkovanja koje dajuslucajan ili približno slucajan uzorak, ali time se u ovoj knjizi necemo baviti. Uvijek cemo imati predocima idealan postupak slucajnog uzorkovanja u kojem se objekti populacije kodiraju brojevima i ondase pomocu nekog software-a (obicno se koristi tzv. random naredba) izvuce dovoljna kolicina brojeva nanacin da je svaki broj imao istu vjerojatnost da bude izvucen, i izvuceni nam brojevi odrede slucajniuzorak.

Ne samo da populaciju ispitujemo na dobivenom slucajnom uzorku, nego isto radimo sa bilo kojomslucajnom pojavom - niz realizacija slucajne pojave daje nam slucajan uzorak te pojave. No i ovdjeuzimanje podataka iz uzorka nosi iste zamke kao i uzimanje podataka iz populacije. Po svojoj definicijitakav je uzorak slucajan, ali stvarni uzorak koji dobijemo ne mora biti takav. Ako smo iz nekih razlogaselektivno birali realizacije slucajne pojave, tad opet u konacnici necemo imati slucajan uzorak. Zailustrativan primjer uzet cemo stvarni dogadaj iz drugog svjetskog rata. U SAD-u je djelovala StatisticalResearch Group, grupa statisticara koju je oformila vlada za statisticku podršku u ratovanju. U namjerida poboljša otpornost svojih aviona u borbenim operacijama vojska je odlucila ojacati najosjetljivijedijelove aviona (nije mogla sve dijelove ojacati jer bi avioni postali preteški). Prikupili su podatke obroju rupa od metaka po kvadratnoj stopi avionske površine: 1.11 na motoru, 1.55 na sustavu goriva,1.73 na trupu i 1.80 rupa po kvadratnoj stopi na ostalim dijelovima aviona. Vojska je odlucila da najvišeojaca dijelove na kojima je bilo najviše rupa. Obratili su se matematicaru Abraham Waldu u StatisticalResearch Group da im pomogne rasporediti ukupnu dopuštenu kolicinu ojacanja na ove dijelove. Waldovodgovor ih je jako iznenadio: ”Najviše ojacajte one dijelove gdje nema rupa ili ih je malo”. Naime, Waldje ovako razmišljao. U zracnim bitkama za svaki kvadratnu stopu površine aviona ista je vjerojatnostda ce ga metak pogoditi. Dakle, u slucajnom uzorku aviona koji su bili u bitkama morao bi broj rupa pokvadratnoj stopi biti jednak na svim dijelovima. Vojska je donijela podatke prikupljene od aviona kojisu se vratili pa je njihov uzorak opterecen. Uzorku nedostaju avioni koji se nisu vratili. S obzirom dabi raspodjela metaka u ukupnom uzorku bila svugdje gotovo jednaka, na dijelu uzorka koji nedostaje jeobratna raspodjela rupa od metaka od ove koju je vojska prikupila. Dakle, najviše je aviona stradalo ubitkama od rupa na dijelovima gdje nema rupa kod aviona koji su se vratili. To su najosjetljiviji dijeloviaviona i njih treba najbolje zaštititi. Waldovo objašnjenje je prihvaceno i pokazalo je pozitivne efekte,

Page 25: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

1.4. Slucajni uzorak 21

pa se i dan danas koristi u poboljšanju otpornosti borbenih aviona.

Varijabla na uzorku i njena distribucija postotaka

Kad uzimamo uzorak iz slucajne pojave (specijalno populaciji) tad varijabla na slucajnoj pojavi dajei varijablu na uzorku.

Distribucija postotaka varijable na uzorku je funkcija koja svakoj vrijednosti varijable pridružipostotak objekata iz uzorka na kojima varijabla poprimi tu vrijednost.

Distribucija varijable na uzorku aproksimira distribuciju varijable na slucajnoj pojavi (specijalnona populaciji) i ta je aproksimacija bolja što je uzorak veci.

Matematicka teorija koja se bavi vjerojatnosnim modelima zove se teorija vjerojatnosti. Da bise našao odgovarajuci model, ako ne postoji neka teorijska osnova, mora se skupiti dovoljno podatakao slucajnoj pojavi na osnovi uzorka iz slucajne pojave. Obrada i graficko predstavljanje tih podatakaje podrucje deskriptivne statistike. Kao što postoje principi koji nam kažu koliko podataka trebaprikupiti i na koji nacin, te kako te podatke obraditi i graficki prikazati, tako postoje i principikoji nam kažu kako iz tih podataka konstruirati vjerojatnosni model slucajne pojave. Time se baviinferencijalna statistika. Osnovni princip smo vec istaknuli u uvodu: vjerojatnost dogadaja mora bitipribližno jednaka relativnoj frekvenciji dogadaja u uzorku. Kad smo jednom konstruirali vjerojatnosnimodel, on nam omogucuje analizu slucajne pojave i odredenu vrstu predvidanja. Ta predvidanja su,vidjeli smo, drugacijeg tipa od onih u deterministickim modelima i u njihovoj osnovi je vec spomenutiprincip da vjerojatnot dogadaja procjenjuje relativnu frekvenciju dogadaja u uzorku. Necemo moci

Page 26: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

22 1. Populacija, slucajni uzorak i slucajna pojava

predvidjeti da li ce se nešto desiti u jednoj realizaciji slucajne pojave koju model opisuje, ali cemo mocipredvidjeti koliko puta ce se to desiti u više realizacija te pojave. Ništa necemo moci predvidjeti opojedinom ali cemo moci predvidjeti o mnoštvu. Ta predvidanja su u praksi veoma upotrebljiva, odkontrole kvalitete proizvodnje i prognoze trajanja odredenih komponenti uredaja do izracuna premijaosiguranja i analize tržišta, od testiranja uspješnosti nove metode lijecenja do predvidanja pobjednikapredsjednickih izbora. Na pojmu vjerojatnosti se zasnivaju iznosi uplata za razna osiguranja, otkrivanjeuzroka raznih bolesti, otkrivanje raznih poremecaja u društvu (preporucamo pogledati film ZoranaTadica "Ritam zlocina" iz 1981.) itd.

Pored opisivanja vjerojatnosnih modela teorija vjerojatnosti odreduje i principe prikupljanja ianalize podataka o slucajnim pojavama, na osnovi kojih se ne samo odreduju vjerojatnosni modeli,nego se i testira je li došlo do promjena u samim pojavama. Jednostavnije receno, vjerojatnost je teorijaa statistika praksa slucajnih pojava.

Vec na osnovi ovog uvoda možemo opravdati osnovnu tezu da je slucajan uzorak iz populacije zaistadobar reprezentativni uzorak. Naime, kad radimo slucajni izbor iz populacije, tada nam je samapopulacija prostor ishoda koji su svi jednako vjerojatni da budu izabrani (simetricni model). Zato

je vjerojatnost da bude izabrana jedinka koja ima svojstvo A jednaka P(A) = NA

N, gdje je N broj

jedinki populacije a NA broj jedinki iz populacije koje imaju svojstvo A. Kad ponavljamo slucajan izbordobivamo slucajan uzorak. Po statistickoj interpretaciji vjerojatnosti, relativna frekvencija jedinki uuzorku koje imaju svojstvo A,

nA

N, gdje je n velicina uzorka a nA broj jedinki u uzorku koji imaju

svojstvo A, mora biti približno jednaka vjerojatnosti da se izvuce jedinka sa svojstvom A: P(A) ≃ nA

n.

Usporedimo li dva dobivena izraza za P(A) dobivamo da je

NA

N≃ nA

n, dakle da slucajan uzorak dobro aproksimira reprezentativan uzorak.

1.5 Zadaci za vježbu

Page 27: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2Vjerojatnosni model slucajne pojave

Vjerojatnosni model koji pridružujemo slucajnoj pojavi sastoji se od skupa mogucih ishoda slucajnepojave i funkcije koja svakom dogadaju pridružuje jedan broj, vjerojatnost tog dogadaja. Taj brojprocjenjuje relativnu frekvenciju dogadaja u nizu ponavljanja slucajne pojave. Ova veza vjerojatnostidogadaja i relativne frekvencije dogadaja je osnovna veza teorije i realnosti koja nam služi da odredimomodel i da ga testiramo, da po njemu predvidamo zbivanja u mnoštvu ponavljanja slucajne pojave, kaoi da registriramo da li se slucajna pojava promijenila. U ovom poglavlju cemo sve ovo utocniti.

2.1 Prostor ishoda i prostor dogadaja

Ma koja bila priroda slucaja, pod slucajnom pojavom cemo smatrati pojavu koja se uz isti tocnoodreden skup uvjeta odvija na razlicite nacine. Skup uvjeta pod kojima se odvija pojava definira tupojavu i cim se promijene ti uvjeti smatramo da se radi o drugoj slucajnoj pojavi. Primijetimo daje principijelno važna mogucnost ponavljanja pojave, da bismo mogli utvrditi da li ona uz isti skupuvjeta daje razlicite rezultate. U idealiziranom slucaju smatrat cemo da je slucajna pojava definiranaskupom uvjeta koje smo propisali za njeno izvršenje, da je uz te uvjete možemo proizvoljan broj putaponavljati te da postoji tocno odreden skup mogucih rezultata slucajne pojave. Na primjer kad bacamoigracu kocku, propisani uvjeti mogu biti da je bacamo na ravan pod s odredene visine i uz prethodnotreskanje kockice u ruci. Na taj nacin je možemo baciti koliko god želimo puta, a moguce rezultatemožemo predstaviti brojevima od 1 do 6 koji se javljaju na gornjoj strani kocke nakon što se kocka umirina podu. Za primjere slucajnih pojava cesto cemo koristiti kockice i igre na srecu, ne zbog sklonosti”kocki”, vec što su to jednostavne slucajne pojave na kojima možemo lako ilustrirati pojmove i metodeteorije vjerojatnosti. Nije slucajno teorija vjerojatnosti nastala polovicom 17. stoljeca u prepisci izmedupoznatih matematicara Blaise Pascala i Pierre de Fermata vezano za pitanja o igrama na srecu s kojimaim se obratio Chevalier de Méré, covjek koji se ponekad kockao.

Skup mogucih rezultata slucajne pojave zovemo prostorom slucajnih ishoda a njegove elementeslucajnim ishodima. Kod bacanja kocke to je skup brojeva od 1 do 6: Ω = 1,2,3,4,5,6. Taj

23

Page 28: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

24 2. Vjerojatnosni model slucajne pojave

prostor nije jednoznacno odreden slucajnom pojavom vec na njegov izbor utjece i to kakva nas analizaslucajnosti zanima. U igrama na srecu jedino je važno koji je broj na gornjoj strani kocke i to uvjetujeovaj izbor. Ako nas zanima konacan položaj kocke tad on nije odredeno samo brojem na gornjoj kocki veci orijentacijom bocnih strana u okolnom prostoru. Ako pak igramo igru u kojoj nam je samo važno je lipao paran ili neparan broj na kocki tad za prostor slucajnih ishoda možemo uzeti skupΩ = par,nepar.Dakle da bi neki skup bio prostor ishoda slucajne pojave važno je jedino da se u svakoj realizaciji slucajnepojave ostvari tocno jedan ishod iz tog skupa.

Prostor ishoda

Skup sa svojstvom da je svakoj realizaciji slucajne pojave pridružen tocno jedan njegov elementzovemo prostor ishoda slucajne pojave a njegove elemente zovemo ishodima.

Kod putovanja od kuce do posla vrijeme putovanja izraženo npr. u minutama, može biti bilo kojipozitivan broj. Istina, on nece biti prevelik, ali u matematickom modelu možemo, slobode radi, uzetibilo koji pozitivan broj: Ω =< 0,∞ >. Primijetimo da je sad prostor ishoda beskonacan. U putovanjunas je moglo zanimati pored vremena putovanja i trošak putovanja, pa bismo u tom slucaju za ishodslucajne pojave uzeli par pozitivnih brojeva. Može nas zanimati i koliko smo se puta nanervirali tokomputovanja, koliko smo prijatelja sreli, . . . . Svako putovanje je svijet s beskonacno informacija. Ma štouzeli za ishod slucajne pojave uvijek smo uradili jednu apstrakciju: slucajnu pojavu kroz pojam ishodasvodimo na par informacija koje su nam iz nekog razloga zanimljive.

Kad radimo slucajni odabir jedinke iz populacije, ishodi su jedinke pa je prostor ishoda cijelapopulacija.

Ako nas zanima kad ce pri bacanju kocke pasti prost broj vidimo da ce se to desiti kada padne 2, 3ili 5 (napominjemo da po definiciji 1 nije prost broj, jer je prost broj onaj koji ima tocno dva djelitelja, 1i sebe samog). Kažemo da ishodi 2, 3 i 5 realiziraju dogadaj A: ”pao je prost broj”, dok ga ishodi 1, 4 i 6ne realiziraju. Zato cemo dogadaj predstaviti skupom ishoda koji ga realiziraju:

A: ”pao je prost broj” ↦ A = 2,3,5

Isto tako dogadaj B opisan uvjetom ”pao je broj veci od 3” se dešava kad padnu brojevi 4, 5 i 6, pa što setice njegovog pojavljivanja možemo ga opisati tim skupom:

B: ”pao je broj veci od 3” ↦B = 4,5,6

U matematickoj analizi dogadaja zanima nas samo koji ishodi realiziraju dogadaj a koji ne, neovisnoo tome kako smo ga opisali i koje emocije vežemo uz njega. Zato dogadaj identificiramo sa skupom ishodakoji ga realiziraju.

Dogadaj

Dogadaji su podskupovi skupa prostora slucajnih ishoda.

Dogadaje opisujemo uvjetima a službeno identificiramo skupovima objekata koji ispunjavaju teuvjete. Skup svih dogadaja još zovemo i prostor slucajnih dogadaja. Za naše sadašnje potrebe to

Page 29: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.1. Prostor ishoda i prostor dogadaja 25

ce biti skup svih podskupova prostora ishoda, tzv partitivni skup P(Ω) skupa Ω (poslije cemo upoznatii neke drugacije situacije).

Kad nam je prostor ishoda neka populacije (iz koje radimo slucajan odabir) tad svojstva populacijeodreduju dogadaje. Npr za populaciju svih gradana Hrvatske svojstvo ”živjeti van Hrvatske” odredujedogadaj izbora covjeka koji živi van Hrvatske i taj dogadaj službeno predstavljamo skupom svih gradanaHrvatske koji žive van Hrvatske.

Pretpostavljamo da su citatelju poznati pojam skupa i osnovne operacije sa skupovima.

Od jednostavnijih uvjeta možemo pomocu logickih veznika praviti složenije uvjete koji takoderopisuju neke dogadaje. Npr.

”A i B”: ”pao je prost broj i pao je broj veci od 3”

Ishod koji realizira ovaj dogadaj je ishod koji realizira i dogadaj A i dogadaj B. On se tako nalazi i uskupu A i u skupu B. On je element presjeka ova dva skupa. Dakle uvjetu složenom iz drugih uvjetapomocu veznika i odgovara dogadaj koji je presjek dogadaja odredenih pojedinim uvjetima. Isto takovezniku ili odgovara unija skupova, a negaciji komplement skupa:

Algebra dogadaja

”A i B” ↦ A∩B

”A ili B” ↦ A∪B

”nije A” ↦ A

U našem slucaju je

A∩B = 5, A∪B = 2,3,4,5,6 i A = 1,4,6.

Page 30: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

26 2. Vjerojatnosni model slucajne pojave

Na isti nacin možemo racunati i složenije dogadaje, npr.

"nije prost broj i nije broj veci od 3" → A∩B = 1,4,6∩1,2,3 = 1

Primjer 2.1.1. Za dogadaje A: ”pao je najviše broj 2” i B: ”pao je broj djeljiv s 3” izracunajte dogadaje

a) ”pao je najviše broj 2”

b) ”pao je broj djeljiv s 3”

c) ”pao je najviše broj 2 i pao je broj djeljiv s 3”

d) ”pao je najviše broj 2 ili pao je broj djeljiv s 3”

e) ”nije pao broj djeljiv s 3”

f) ”nije pao broj koji je i najviše broj 2 i djeljiv je s 3”

g) ”nije pao broj koji je najviše broj 2 i nije pao broj koji je djeljiv s 3”

Rješenje:

a) A = 1,2

b) B = 3,6

c) A∩B = 1,2∩3,6 = =∅Ovo je nemoguc dogadaj jer ga nijedan ishod ne može realizirati. Nemoguc dogadaj predstavljamopraznim skupom.

d) A∪B = 1,2∪3,6 = 1,2,3,6

e) B = 3,6 = 1,2,4,5

f) A∩B = 1,2∩3,6 =∅ =Ω = 1,2,3,4,5,6

g) A∩B = 3,4,5,6∩1,2,4,5 = 4,5 Y

Primjer 2.1.2. Bacamo dva simetricna tetraedra, na cijim stranicama se nalaze brojevi od 1 do 4.Gledaju se brojevi na koje je pao svaki tetraedar. Što je prostor ishoda? Nadimo dogadaje A: ”obatetraedra su pala na isti broj”, B: ”zbroj brojeva na oba tetraedra je 4” te ”A i B”, ”A ili B” i ”B i nije A”.

Rješenje: Pošto na prvom tetraedru može biti bilo koji broj od 1 do 4, kao i na drugom, prostor ishodamožemo predstaviti skupom svih uredenih parova brojeva od 1 do 4:

Ω ∶

(1,1) (1,2) (1,3) (1,4)(2,1) (2,2) (3,3) (2,4)(3,1) (3,2) (3,3) (3,4)(4,1) (3,2) (4,3) (4,4)

Page 31: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.2. Pojam vjerojatnosti 27

Dogadaj A je skup parova na dijagonali A = (1,1),(2,2),(3,3),(4,4), a B = (3,1),(2,2),(1,3).

A B

(1,1) (1,2) (1,3) (1,4)

(2,1) (2,2) (3,3) (2,4)

(3,1) (3,2) (3,3) (3,4)(4,1) (3,2) (4,3) (4,4)

Iz slike ili pak racunanjem skupovnih operacija jednostavno možemo odrediti preostale dogadaje

A∩B = (2,2)

A∪B = (1,1),(2,2),(3,3),(4,4),(1,3),(3,1)

B∩A = (1,3),(3,1) Y

Kad uzimamo slucajan uzorak iz populacije tad isto imamo dogadaje opisane složenim uvjetima,npr, izbor covjeka koji je muška osoba veca od 200 cm i ne bavi se sportom, itd.

2.2 Pojam vjerojatnosti

Svakom dogadaju A iz prostora dogadaja cemo pridružiti jedan broj P(A), mjeru tog dogadaja. Kadje u pitanju prostor dogadaja odredene slucajne pojave osnovni smisao tog broja je, kao što smo vecanalizirali, da je on neka vrsta idealne relativne frekvencije tog dogadaja u nizu realizacija slucajnepojave. To je osnova primjene teorije vjerojatnosti:

Statisticka interpretacija vjerojatnosti

Neka je A dogadaj nad prostorom ishoda neke slucajne pojave i neka se u n ponavljanja slucajnepojave dogadaj desio nA puta. Tada je vjerojatnost P(A) tog dogadaja približno jednaka relativnojfrekvenciji

nA

npojavljivanja tog dogadaja.

P(A) ≃ nA

n

Matematika ne može ništa reci o stvarnosti. Ona može tek ponuditi efikasan jezik za opis stvarnosti.Tako je i u analizi slucaja. Matematika nudi tek razne vjerojatnosne modele za opis slucajne pojave a naosobi koja modelira problem je da odluci koji model odgovara proucavanoj slucajnoj pojavi. Vjerojatnosnimodel je matematicki model koji se sastoji od jednog skupaΩ cije elemente nazivamo ishodi i funkcije Pkoja svakom dogadaju (skupu ishoda) A pridružuje jedan broj P(A) koji zovemo vjerojatnost dogadaja

Page 32: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

28 2. Vjerojatnosni model slucajne pojave

A. Pošto su ti modeli namijenjeni za opis slucajnih pojava funkcija A↦ P(A) ne može biti bilo kakvafunkcija vec mora ispunjavati sljedece uvjete

1. P(A) ≥ 0, jer jenA

n≥ 0

2. P(Ω) = 1, jer je nΩ = n pa jenΩn

= nn= 1

3. Ako dogadaji A i B nemaju zajednickih elemenata (medusobno su iskljucivi, nijedan ishod nerealizira oba dogadaja), tj. A∩B = , tada je P(A∪B) = P(A)+P(B), jer je uz te uvjete

nA∪B

n=

nA +nB

n= nA

n+ nB

n

Konacni vjerojatnosni prostor

Konacni vjerojatnosni prostor se sastoji od

1. konacnog nepraznog skupaΩ cije elemente zovemo slucajni ishodi a cije podskupove zovemodogadaji

2. funkcije P ∶P(Ω)→R koja svakom dogadaju A ⊆Ω pridružuje realan broj P(A) i koju zovemovjerojatnost dogadaja A.

Pri tome mora vrijediti (aksiomi vjerojatnosti)

1. P(A) ≥ 0 (nenegativnost vjerojatnosti)

2. P(Ω) = 1 (normiranost vjerojatnosti)

3. P(A∪B) = P(A)+P(B), za A∩B = (vjerojatnost unije iskljucivih dogadaja)

Napominjemo da postoji šira definicija koja obuhvaca i beskonacne situacije kada ne mora svakipodskup skupa ishoda biti dogadaj. Mada su ideje iste, formulacija je nešto kompliciranija pa je necemoovdje provesti. Na kraju ovog poglavlja samo cemo navesti dva primjera tog tipa.

Možda smo mogli nametnuti još uvjeta na funkciju vjerojatnosti. Ostale uvjete koje cemo u buducekoristiti možemo izvesti iz ovih uvjeta pa ih zato nismo posebno naveli. Evo nekih od tih uvjeta:

Dodatna svojstva vjerojatnosti

1. P(∅) = 0 (vjerojatnost nemoguceg dogadaja)

2. A ⊆B→ P(A) ≤ P(B) (monotonost vjerojatnosti)

3. P(A) = 1−P(A) (vjerojatnost suprotnog dogadaja)

4. P(A∪B) = P(A)+P(B)−P(A∩B) (vjerojatnost unije dogadaja)

Page 33: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.2. Pojam vjerojatnosti 29

U ispravnost ovih svojstava se možemo uvjeriti na osnovi statisticke interpretacije vjerojatnosti na istinacin kako smo se uvjerili i u ispravnost aksioma vjerojatnosti. Medutim njih možemo dokazati izaksioma vjerojatnosti. Ovo je jedno od rijetkih mjesta u knjizi gdje cemo nešto, radi ilustracije citatelju,i dokazati.

1. Pošto ∅ i Ω nemaju zajednickih elemenata to je po 3. aksiomu vjerojatnosti

P(Ω) = P(Ω∪∅) = P(Ω)+P(∅)→ P(∅) = 0

2.

A ⊆B→B = A∪B∖A→ P(B) = P(A∪B∖A) = P(A)+P(B∖A) ≥ P(A)

3. A∪A =Ω→ P(A∪A) = P(Ω)→ P(A)+P(A) = 1→ P(A) = 1−P(A)

4.

A B

A ∩ B

Ω

A B

Ω

A ∪ B

Ω

A

A

A \ B B \ A

P(A∪B) = P((A∖B)∪(A∩B)∪(B∖A))= P(A∖B)+P(A∩B)+P(B∖A)= P(A∖B)+P(A∩B)+P(B∖A)+P(A∩B)−P(A∩B)= P((A∖B)∪(A∩B))+P((B∖A)∪(A∩B))−P(A∩B)= P(A)+P(B)−P(A∩B)

Slucajnoj pojavi pridružujemo vjerojatnosni model koristeci neke simetrije situacije, ili nekutemeljniju teoriju pod koju spada ta slucajna pojava ili pak ispitivanjem relativnih frekvencija dogadaja.Pomocu njega možemo racunati vjerojatnosti raznih dogadaja vezanih za tu slucajnu pojavu i nataj nacin predvidati njihove ucestalosti u velikom mnoštvu realizacija slucajne pojave. Na istinacin možemo i testirati model, ispitujuci jesu li relativne frekvencije dogadaja bliske izracunatimvjerojatnostima.

Page 34: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

30 2. Vjerojatnosni model slucajne pojave

2.3 Racunanje vjerojatnosti

2.3.1 Svodenje na vjerojatnosti pojedinih ishoda

Zakoni vjerojatosti povezuju vjerojatnosti jednih dogadaja s vjerojatnostima drugih dogadaja, Takonam omogucavaju da izracunamo vjerojatnost jednog dogadaja znajuci vjerojatnosti drugih dogadaja.Medutim, za konacne prostore ishoda dovoljno je znati vjerojatnosti pojedinih ishoda da bismo najednostavan nacin našli vjerojatnost bilo kojeg dogadaja, pa cemo prvo od te situacije krenuti upoznavatikako racunati vjerojatnosti.

Neka je npr dogadaj A = a,b, c. Tada je P(A) = P(a,b, c) = P(a∪b∪c) = P(a)+P(b)+P(c) = P(a)+P(b)+P(c), pri cemu umjesto P(x) radije pišemo P(x).

Svodenje vjerojatnosti na vjerojatnost elementarnih ishoda

Vjerojatnost dogadaja je zbroj vjerojatnosti ishoda koji ga realiziraju:

P(a1,a2, . . . ,an) = P(a1)+P(a2)+⋅ ⋅ ⋅+P(an)

Primjer 2.3.1. Jednom uredaju sastavljenom od 5 dijelova ispituje se broj kvalitetnih dijelova. Tomože biti bilo koji broj od 0 do 5. Ispitivanjem raznih uzoraka utvrdene su sljedece vjerojatnosti za brojkvalitetnih dijelova

n 0 1 2 3 4 5P(n) 0.1 0.15 0.25 0.3 0.15 0.05

Kolika je vjerojatnost dogadaja A: ”svi su dijelovi kvalitetni”, B: ”barem su 4 dijela kvalitetna”, C: ”višeje nekvalitetnih nego kvalitetnih dijelova”? Procijenite oliko ce uredaja u pošiljci od 1000 uredaja imativiše nekvalitetnih nego kvalitetni dijelova?

Rješenje: Ovdje imamo zadan prostor ishoda Ω = 0,1,2,3,4,5 zajedno sa njihovim vjerojatnostima.Za svaki dogadaj moramo prvo iz njegovog opisa utvrditi koji ga ishodi realiziraju. Drugim rijecima,moramo odgovoriti na pitanje kada ce se, gledajuci ishode, ti dogadaji desiti. Dogadaj A ce se desitijedino kad je 5 kvalitetnih dijelova, dogadaj B kada je 4 ili 5 kvalitetnih dijelova, a dogadaj C kad je 0,1 ili 2 kvalitetnih dijelova. To nam omogucuje da nademo vjerojatnosti ovih dogadaja.

P(A) = P(5) = P(5) = 0.05

P(B) = P(4,5) = P(4)+P(5) = 0.15+0.05 = 0.2

P(C) = P(0,1,2) = P(0)+P(1)+P(2) = 0.1++0.15+0.25 = 0.5

Page 35: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.3. Racunanje vjerojatnosti 31

Pošto je vjerojatnost da ce biti više nekvalitetnih dijelova nego kvalitetnih jednaka 0.5, to je i idealnaproporcija takvih uredaja u mnoštvu

nC

n= 50%. Znaci u idealnom slucaju ce u mnoštvu od n = 1000

takvih uredaja biti nC = 50% ⋅n = 500. Naravno, u pitanju je slucaj pa ce stvaran broj biti "tu negdje". Y

2.3.2 Simetricni vjerojatnosni model

Vjerojatnosni model u kojem svi elementarni ishodi imaju jednaku vjerojatnost P zovemo simetricnimvjerojatnosnim modelom. Takvi su obicno prostori slucajnih pojava koje imaju odredenu simetriju,kao npr. bacanje simetricne kocke. Takvi prostori su veoma znacajni i u statistici, jer, kao što smou uvodu rekli, kada statisticki proucavamo neku obicno veliku populaciju tada nasumice izabiremopojedine objekte populacije. Na taj nacin populaciji pridružujemo simetricni prostor vjerojatnosti ukojem su svi izbori objekata iz populacije jednako vjerojatni. Sad cemo izvesti jednostavnu formulu zaracunanje vjerojatnosti u simetricnom modelu.

Neka je u simetricnom modelu vjerojatnost svakog pojedinog ishoda jednaka p. Za Ω = a1, . . . ,aNje

1 = P(Ω) = P(a1)+⋅ ⋅ ⋅+P(aN) = p+⋅ ⋅ ⋅+ p = N ⋅ p→ p = 1N

= 1∣Ω∣

gdje ∣Ω∣ oznacava broj elemenata skupa Ω. Tada je vjerojatnost skupa A = ai1 , . . . ,aiM jednaka

P(A) = P(ai1)+⋅ ⋅ ⋅+P(aiM) = p+⋅ ⋅ ⋅+ p = m ⋅ p = MN

= ∣A∣∣Ω∣

Tako smo dobili jednostavnu formulu za racunanje vjerojatnosti u simetricnom modelu:

Vjerojatnost u simetricnom vjerojatnosnom modelu

P(A) = ∣A∣∣Ω∣

= broj elemenata skupa Aukupan broj elemenata

Primjer 2.3.2. Odredimo kolika je vjerojatnost da ce se pri bacanju kocke desiti A: ”pao je broj manjiod 3”, B: ”pao je broj djeljiv s 3”, C”: "pao je paran broj”, ”nije A”, ”A i B”, ”A ili B” i ”B ili C”.

Rješenje: Prostor slucajnih ishoda ima 6 elemenata a skup A = 1,2 ima dva elementa, pa je po

formuli za simetricnu vjerojatnost P(A) = 26= 1

3.

Skup B = 3,6 isto ima 2 elementa pa je njegova vjerojatnost isto P(B) = 26= 1

3.

Page 36: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

32 2. Vjerojatnosni model slucajne pojave

Skup C = 2,4,6 ima 3 elementa pa je njegova vjerojatnost P(C) = 36= 1

2.

Skup A = 3,4,5,6 ima 4 elementa pa je njegova vjerojatnost P(A) = 46= 2

3.

Kad smo vec izracunali P(A) mogli smo upotrijebiti formulu za suprotnu vjerojatnost da izracunamoP(A)

P(A) = 1−P(A) = 1− 13= 2

3

Skup A∩B =∅ nema elemenata pa je njegova vjerojatnost P(∅) = 0n= 0.

Skup A∪B = 1,2,3,6 ima 4 elementa pa je njegova vjerojatnost P(A∪B) = 46= 2

3.

Pošto skupovi A i B nemaju zajednickih elemenata mogli smo za racunanje vjerojatnosti primijeniti

formulu za vjerojatnost iskljucive unije: P(A∪B) = P(A)+P(B) = 13+ 1

3= 2

3.

Skup B∪C = 2,3,4,6 ima 4 elementa pa je njegova vjerojatnost P(B∪C) = 46= 2

3.

Ovdje ne možemo primijeniti formulu za vjerojatnost iskljucive unije jer dogadaji imaju zajednickielement. Ako bismo ovdje primijenili tu formulu jasno je da bismo dobili previše jer bismo zajednickielement dva put brojali. Medutim, možemo primijeniti opcenitiju i složeniju formulu za vjerojatnostunije bilo koja dva dogadaja:

P(A∪B) = P(A)+P(B)−P(A∩B) = 13− 1

2− 1

6= 2

3Y

Racunanje simetricnih vjerojatnosti u složenijim situacijama zahtjeva odredenu znanje kombinato-rike koja nam daje principe i formule koji nam olakšavaju prebrajanja u takvim situacijama. Npr. tebi nam formule mogle pomoci da izracunamo kolika je vjerojatnost da pogodimo šesticu u igri loto 6/45.Obzirom da je u pitanju simetrican model (jednaka je vjerojatnost da se bilo kojih 6 od 45 brojeva izvuce)možemo primijeniti formulu za vjerojatnost simetricnog modela. Ali ona traži od nas da prebrojimoneke skupove ishoda. Samo jedan nam ishod odgovara (naša šestica, ako smo ispunili samo jednukombinaciju), ali prostor svih mogucih ishoda (svih mogucih 6 izvucenih brojeva) je jako velik i bezkombinatornih formula ga je gotovo nemoguce izracunati). S obzirom da se u ovom uvodu u statistikubavimo pojmovima i principima, zadovoljit cemo se tim da znamo postaviti problem i u principu gariješiti, ali kako stvarno naci rezultat primjenom kombinatornih formula, time se necemo ovdje baviti.

Primjer 2.3.3. U primjeru na strani 26 pokazali smo da je pri bacanju dva simetricna tetraedra prostorishoda Ω:

(1,1) (1,2) (1,3) (1,4)(2,1) (2,2) (3,3) (2,4)(3,1) (3,2) (3,3) (3,4)(4,1) (3,2) (4,3) (4,4)

Page 37: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.3. Racunanje vjerojatnosti 33

Nadimo vjerojatnosti dogadaja A: ”oba tetraedra su pala na isti broj”, B: ”zbroj brojeva na oba tetraedraje 4” te ”A i B”, ”A ili B” i "B i nije A”. Procijenite hoce li u 100 bacanja dva tetraedra više puta na obatetraedra biti isti broj ili ce više puta zbroj biti jednak 4?

Rješenje: Pošto su tetraedri simetricni vjerojatnosti možemo racunati po formuli za simetricni model.

Dogadaj A je skup parova na dijagonali A = (1,1),(2,2),(3,3),(4,4), a B = (3,1),(2,2),(1,3). PoštoA ima 4 elementa, B 3 elementa a ukupan broj ishoda je 36, to je

P(A) = 416

= 14

P(B) = 316

Isto tako cemo izracunati i vjerojatnosti ostalih dogadaja (prvo moramo izracunati koji su to dogadaji):

”A i B”: A∩B = (2,2) → P(A∩B) = 116

”A ili B”: A∪B = (1,1),(2,2),(3,3),(4,4),(1,3),(3,1) → P(A∪B) = 616

= 38

”B i nije A”: B∩A = (1,3),(3,1) → P(B∩A) = 216

= 18

Pošto dogadaj A ima vecu vjerojatnost nego dogadaj B on ce se cešce dešavati. U idealnom slucaju od 100

bacanja dogadaj A ce se desiti14⋅100 = 25 puta a dogadaj B

316

⋅100 = 18.75 puta, dakle procjenjujemo da

ce se dogadaj A desiti više puta. Primijetimo da se idealni broj 18.75 dogadanja dogadaja B nece nikaddesiti jer brojevi dogadanja moraju biti cijeli brojevi. Izracunati idealni brojevi naprosto kažu da ce seisti broj pojaviti negdje oko 25 puta a zbroj 4 ce biti negdje oko 18.75 puta. Nadalje, pošto su ti brojevibliski ne možemo baš biti sigurni da ce se u stvarnom nizu od 100 bacanja isti broj više puta desiti negoda ce zbroj biti 4. Situaciju bismo mogli popraviti na sljedeci nacin. Ukupan niz od 100 bacanja takoderje jedna slucajna pojava koja ima svoj prostor ishoda (svi moguci nizovi od 100 bacanja) i svoju funkcijuvjerojatnosti. Kad bismo našli tu funkciju vjerojatnosti, tad bismo mogli preciznije odgovoriti na zadnjepitanje: mogli bismo reci kolika je vjerojatnost da ce više puta pasti isti broj nego da ce zbroj biti 4.Naravno, ovdje se necemo upustiti u takvo racunanje.

Y

Formula za vjerojatnost simetricnog modela opravdava naš osnovni statisticki postupak da relativ-nom frekvencijom

nA

nsvojstva A u slucajnom uzorku (svojstvo se nA puta pojavilo u uzorku velicine n)

procjenjujemo relativnu frekvencijuNA

Nsvojstva u populaciji (NA jedinki u populaciji velicine N ima to

svojstvo). Naime, kada radimo slucajan izbor iz populacije mi umjetno pravimo slucajnu pojavu u kojojje ista vjerojatnost za svakog clana populacije da bude izabran. Tako imamo simetrican vjerojatnosnimodel u kojem su ishodi jedinke, prostor ishoda je cijela populacija, dogadaji su svojstva, a vjerojatnost

da se desi dogadaj A (da izabrana jedinka ina to svojstvo) je po simetricnom modelu P(A) = NA

N. S druge

strane, po statistickoj interpretaciji vjerojatnosti, ta vjerojatnost mora odgovarati relativnoj frekvenciji

Page 38: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

34 2. Vjerojatnosni model slucajne pojave

tog dogadaja u dobivenom uzorku P(A) ≃ nA

n, Tako dobivamo osnovnu statisticu vezu populacije i

uzorka:

NA

N= P(A) ≃ nA

nÐ→ NA

N≃ nA

n

Hatzi slika 6

2.3.3 Vjerojatnost i logicki veznici

Opceniti nacin za racunanje vjerojatnosti je primjena formula koje povezuju vjerojatnosti jednihdogadaja s vjerojatnostima drugih dogadaja. Vec smo ih koristili u racunanju vjerojatnosti, ali sadcemo ih sistematski prostudirati.

Dogadaj opisujemo uvjetom a reprezentiramo skupom ishoda koji ispunjavaju taj uvjet. Npr,pri bacanju kocke smo dogadaj opisan uvjetom ”pao je broj djeljiv s 3” reprezentirali skupom 3,6.Sam uvjet je cesto složen od jednostavnijih uvjeta pomocu logickih veznika i, ili i nije. Lijepo bibilo za svaki veznik imati formulu koja vjerojatnost dogadaja opisanog složenim uvjetom izražavapomocu vjerojatnosti dogadaja opisanog uvjetima od kojih je složen. Time bismo reducirali racunanjevjerojatnosti složenijih na racunanje vjerojatnosti jednostavnijih dogadaja. Pošto ovim slaganjimauvjeta odgovaraju skupovne operacije to su ujedno i formule za skupovne operacije. Vec smo upoznalineke formule tog tipa.

Pošto negaciji uvjeta odgovara skupovna operacija komplement to nam formula za vjerojatnostsuprotnog dogadaja u ovoj terminologiji glasi

Vjerojatnost negacije

P(A) = 1−P(A) z→ P(′′nije A′′) = 1−P(′′A′′)

gdje je ”A” uvjet kojim je opisan dogadaj A.

Tako je npr P(”nije pao broj djeljiv s 3”) = 1−P(”pao je broj djeljiv s 3”)

Isto tako su nam formule za vjerojatnost unije ujedno i formule za veznik ili. Pri tome formula zauniju disjunktnih (iskljucivih) dogadaja (A∩B =∅) nam daje formulu za veznik "ili . . . ili" (tzv. iskljucivoili) a formula za bilo koju uniju za bilo kakvo ili:

Vjerojatnost disjunkcije

P(A∪B) = P(A)+P(B) za A∩B =∅ z→ P("ili A ili B") = P("A")+P("B")

P(A∪B) = P(A)+P(B)−P(A∩B) z→ P("A ili B") = P("A")+P("B")−P("A i B")

Page 39: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.3. Racunanje vjerojatnosti 35

Ponekad cemo radi jednostavnosti umjesto npr P("A ili B") jednostavnije pisati P(A ili B) jer je izkonteksta jasno da je rijec o vjerojatnosti dogadaja opisanog izrazom "A ili B".

Primjer 2.3.4. U jednom mondenom hotelu 20% gostiju je bogato (Bo), 10% poznato (Po) a 5% i bogatoi poznato, Kolike su vjerojatnosti dogadaja da ce gost kojeg cete posve slucajno sresti u predvorju hotelabiti bogat ili poznat, poznat ali ne i bogat, ni poznat ni bogat, ili poznat i bogat ili ništa od toga?

Rješenje: Pretpostavit cemo da je u pitanju simetrican model, odnosno da je za svakog gosta istavjerojatnost da cemo ga sresti. Tada su vjerojatnosti pojedinih dogadaja postoci gostiju koji ostvaruju

taj dogadaj. Tako je vjerojatnost da cete sresti bogatog gosta P(Bo) = 20% = 20100

= 0.2 (to su razni nacini

da se izrazi vjerojatnost), da cete sresti poznatog je P(Po) = 10%, a da cete sresti i bogatog i poznatogje P(′′Bo i Po′′) = 5%. Po formuli za vjerojatnost disjunkcije dobit cemo da je vjerojatnost da cete srestibogatog ili poznatog gosta

P(′′Bo ili Po′′) = P(Bo)+P(Po)−P(′′Bo i Po′′) = 20%+10%−5% = 25%.

Kombiniranjem formula mogli bismo odgovoriti i na preostala pitanja. No evo i jednog sistematskognacina. Najjednostavnije je izracunati vjerojatnost dogadaja ako ga svedemo na dogadaje koji nemajuzajednickih elemenata (iskljucivo ili) jer tada naprosto zbrajamo vjerojatnosti. Tako možemo i ovdjeuraditi. Pri tome je dobro poslužiti se tzv. Vennovim dijagramima:

Ω

A B

Ω

A ∪ B

Ω

A

A

Bo Po

ni Bo ni Po

Bo inije Po

Po inije Bo

BoiPo

U svakom dijelu je opis dogadaja koji odgovara tom dijelu. Nademo li vjerojatnosti svakog dijela,zbrajanjem možemo dobiti i vjerojatnosti unije tih medusobno iskljucivih dijelova. Svaki dogadaj kojije opisan pomocu dogadaja Bo i Po je unija tih dijelova, pa na ovaj nacin možemo naci i njegovuvjerojatnost. Znamo da je bogatih i poznatih 5%. To znaci da je bogatih i nepoznatih 20% - 5% =15% a poznatih i nebogatih 10% - 5% = 5%. Preostalih (ni bogatih ni poznatih) je 100% - 25% = 75%:

Ω

A B

Ω

A ∪ B

Ω

A

A

Bo Po

15% 5% 5%

75%

Page 40: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

36 2. Vjerojatnosni model slucajne pojave

Sad možemo odgovoriti obicnim zbrajanjem na sva pitanja

P(′′Bo ili Po′′) = 15%+5%+5% = 25%

P(′′Po i nije Bo′′) = 5%

P(”nije Bo i nije Po′′) = 75%

P(′′(Bo i Po) ili (nije Bo i nije Po)′′) = 75%+5% = 80% Y

Primjer 2.3.5. U tvornici se ispitivala kvaliteta poklopaca s obzirom na obradenost površine (klasifici-rani su u D - dobre, S - srednje i L - loše) i s obzirom na obradenost ruba ( tu je bila ista klasifikacija).Na osnovi ispitanog uzorka i na njemu utvrdenih relativnih frekvencija ustanovljene su vjerojatnostisljedecih dogadaja

Obradapovršina

D S L

D 30% 20% 10%

S 10% 8% 2%

L 10% 5% 5%

Obrada ruba

Kolika je vjerojatnost da ce proizvedeni poklopac a) imati dobar rub b) imati dobar rub i dobru površinu,c) imati dobar rub ili dobru površinu, d) nemati loš rub e) nemati loš rub i površina mu nece biti dobra,f) nemati dobar rub ili mu površina nece biti dobra? Ako se na dan proizvede 200 poklopaca procijenimokoliko ce ih imati barem nešto dobro?

Rješenje: Prvo moramo identificirati pojedine dogadaje. One koji imaju složeniji opis dobivamoodgovarajucim skupovnim operacijama iz onih koji imaju jednostavniji opis. Svaki od tih skupova bit ceunija elementarnih celija iz tablice. Celije predstavljaju medusobno iskljucive dogadaje pa cemo njihovevjerojatnosti naprosto zbrajati.

a) dobar rub:

Obradapovršina

D S L

D 30% 20% 10%

S 10% 8% 2%

L 10% 5% 5%

Obrada ruba

P(DR) = 30%+10%+10% = 50%

Page 41: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.3. Racunanje vjerojatnosti 37

b) dobar rub i dobra površina

Obradapovršina

D S L

D 30% 20% 10%

S 10% 8% 2%

L 10% 5% 5%

Obrada ruba

P(′′DR i DP′′) = 30%

c) dobar rub ili dobra površina

Obradapovršina

D S L

D 30% 20% 10%

S 10% 8% 2%

L 10% 5% 5%

Obrada ruba

P(′′DR ili DP′′) = 30%+20%+10%+10%+10% = 80%

d) nije loš rub:

Obradapovršina

D S L

D 30% 20% 10%

S 10% 8% 2%

L 10% 5% 5%

Obrada ruba

P(′′nije LR′′) = 30%+20%+10%+8%+10%+5% = 83%

e) nije loš rub i nije dobra površina

Obradapovršina

D S L

D 30% 20% 10%

S 10% 8% 2%

L 10% 5% 5%

Obrada ruba

Page 42: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

38 2. Vjerojatnosni model slucajne pojave

P(′′nije LR i nije DP′′) = 10%+8%+10%+5% = 33%

f) nije dobar rub ili nije dobra površina:

Obradapovršina

D S L

D 30% 20% 10%

S 10% 8% 2%

L 10% 5% 5%

Obrada ruba

P(′′nije DR ili nije DP′′) = 100%−30% = 70%

Odgovorimo i na zadnje pitanje. Vjerojatnost da ce proizvod imati barem nešto dobro izacunali smo podc) i dobili da ona iznosi 80%. Po statistickoj interpretaciji vjerojatnosti to je idealna relativna ucestalosttakvih proizvoda. Zato cemo približan broj takvih poklopaca x izracunati iz relacije

x200

≃ 80% → x ≃ 80% ⋅200 = 160.

Dakle, dnevno ce biti proizvedeno oko 160 takvih poklopaca. Y

Bilo bi dobro da imamo formulu vjerojatnosti i za veznik i odnosno presjek dogadaja. Postoji i takvaformula, ali ona je vezana s dva znacajna pojma, uvjetnom vjerojatnošcu kojoj odgovara veznik ako inezavisnošcu dogadaja, i tome je namijenjena sljedeca cjelina.

2.4 Uvjetna vjerojatnost i nezavisnost dogadaja

Vratimo se na prethodni primjer i tablicu u kojoj su dane vjerojatnosti kvalitete proizvoda u odnosu naobradu ruba i obradu površine:

Obradapovršina

D S L

D 30% 20% 10%

S 10% 8% 2%

L 10% 5% 5%

Obrada ruba

Možemo li iz tih podataka vidjeti je li povezana loša obrada ruba (dogadaj LR) sa lošom obradompovršine (dogadaj LP)? To možemo ispitati tako da ispitamo kolika je relativna frekvencija lošeobrade ruba medu proizvodima u uzorku koji imaju lošu obradu površine, tj. koliko je omjer broja

Page 43: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.4. Uvjetna vjerojatnost i nezavisnost dogadaja 39

proizvoda nLR∩LP s lošom obradom ruba i lošom obradom površine i broja proizvoda nLP s lošomobradom površine, i taj omjer usporedimo s omjerom broja proizoda s lošom obradom ruba u odnosuna ukupan broj proizvoda u uzorku. Ova relativna frekvencija odreduje novu mjeru dogadaja LR,koja mjeri ucestalost tog dogadaju u odnosu na dogadaj LP i njoj pridružujemo novu vjerojatnosnumjeru, tzv. uvjetnu vjerojatnost dogadaja LR koju oznacavamo PLP(LR), odnosno P(LR∣LP) (citamo”P(LR ako je LP”). Preko veze vjerojatnosti i relativnih frekvencija uvjetnu vjerojatnost možemoopisati pomocu originalne (apsolutne) vjerojatnosti:

P(LR∣LP) ≃ nLR∩LP

nLP=

nLR∩LP

nnLP

n

≃ P(LR∩LP)P(LP)

Ovu vezu uzimamo za definiciju uvjetne vjerojatnosti.

Uvjetna vjerojatnost

Za neprazan podskup B vjerojatnosnog prostora Ω s funkcijom vjerojatnosti P takav da P(B) ≠ 0definiramo novi vjerojatnosni prostor koji ima isti prostor ishoda, ali novu funkciju vjerojatnosti PBkoju još oznacavamo i P( ∣B):

PB(A) = P(A∣B) = P(′′A ako je B′′) = P(A∩B)P(B)

Ta funkcija zadovoljava sve aksiome vjerojatnosti na prostoru Ω i zovemo je uvjetna vjerojatnostdogadaja A s obzirom na dogadaj B.

Hatzi slika 7

Vratimo se sad našem uvodnom problemu, postoji li veza izmedu loše obrade ruba i loše obradepovršine. Usporedimo li uvjetnu vjerojatnost loše obrade ruba ako je površina loše obradena ibezuvjetnu vjerojatnost loše obrade ruba:

P(LR∣LP) = ∣LR∩LP ∣∣LP ∣

= 520

= 0.25

P(LR) = ∣LR∣∣Ω∣

= 17100

= 0.17

vidimo da je uvjetna vjeorjatnost veca, pa je to pokazatelj da je loša obrada ruba povezana s lošomobradom površine.

Primjer 2.4.1. U tablici su dane vjerojatnosti otpornosti proizvoda na ogrebotine ( D - dobra, L - loša) ina udarce ( D - dobra, L - loša)

Page 44: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

40 2. Vjerojatnosni model slucajne pojave

Otpornost na udarce D L

DOtpornostna ogrebotine

L

70% 9%

16% 5%

Nadite vjerojatnosti da je a) otporan na udarac ako je otporan na ogrebotinu, b) da je neotporan naogrebotinu ako je neotporan na udarac c) da je otporan na barem nešto ako je neotporan na barem nešto.U nekoj vecoj seriji procijenite koliko ce posto proizvoda koji su otporni na ogrebotinu biti otporni i naudarac?

Rješenje:

a) P(DU ∣DO) = P(DU ∩DO)P(DO)

= 7079

b) P(LU ∣LO) = P(LU ∩LO)P(LO)

= 514

c) P(DU ∪DO∣LU ∪LO) = P((DU ∪DO)∩(LU ∪LO)P(LU ∪LO)

= 56

Po statistickoj interpretaciji vjerojatnosti, postotak proizvoda koji su otporni na udarac medu onima kojisu otporni na ogrebotinu približno ce biti jednak uvjetnoj vjerojatnosti da je poklopac otporan na udaracako je otporan na ogrebotinu. Pod a) smo našli da ona iznosi 70/79 = 88,6%. Y

Uvjetna vjerojatnost je cesto sama za sebe znacajan pojam. Npr. premije osiguranja od automobilskenesrece drugacije se racunaju za one koji su skrivili neku nesrecu nego za one koji nisu jer je statistickiutvrdeno da je uvjetna vjerojatnost da ce netko skriviti nesrecu ako je vec skrivio nesrecu veca odvjerojatnosti da ce skriviti nesrecu ako nije skrivio nesrecu. No uvjetna vjerojatnost je i traženi korakprema formuli za vjerojatnost presjeka dogadaja. Naime, "okrenemo" li formulu za uvjetne vjerojatnostii iskoristimo simetricnost situacije dobit cemo

Vjerojatnost presjeka dogadaja

P(A∩B) = P(B) ⋅P(A∣B) = P(A) ⋅(B∣A)

Ova formula odgovara odredenom nacinu rastavljanja opisa dogadaja "A i B": da bi se dogodilo A i Bmora se dogoditi A i mora se dogoditi B kad se dogodi A:

"A i B"←→ "A i (B ako je A)".

Tako pravilo možemo formulirati i na sljedeci nacin:

Page 45: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.4. Uvjetna vjerojatnost i nezavisnost dogadaja 41

P("A i B") = P("A") ⋅P("B ako je A")

Ova formula je korisna u slucajevima kad je lakše naci uvjetnu vjerojatnost.

Primjer 2.4.2. Vjerojatnost da baterija u nekom uredaju bude izložena visokoj temperaturi u duljemperiodu je 0.05. Vjerojatnost da se baterija pokvari u takvim uvjetima je 0.7. Vjerojatnost da se baterijapokvari kada nije izložena visokoj temperaturi je 0.01. Kolika je vjerojatnost da ce baterija biti izloženavisokoj temperaturi i da ce se pokvariti? Kolika je vjerojatnost da ce se baterija pokvariti (neovisno otome je li bila izložena visokoj temperaturi ili ne)?

Rješenje: Neka je T: "izloženost visokoj temperaturi", a K: "kvar baterije". Znamo da je P(T) = 0.05,a P(K ∣T) = 0.7. Po formuli za konjukciju dogadaja je P("T i K") = P(T) ⋅P(K ∣T) = 0.05 ⋅0.7 = 0.035

Da bismo odgovorili na drugo pitanje analizirat cemo dogadaj kvara baterije "rastavljajuci" ga nadogadaje kojima znamo vjerojatnosti. Baterija ce se pokvariti ako bude izložena temperaturi i pokvarise ili ako ne bude izložena temperaturi i pokvari se:

K↔ T i K ∣T ili nije T i K ∣ nije T

Pošto je u pitanju iskljucivo ili ovo razlaganje dogadaja daje nam po prethodnim formulama redukcijuvjerojatnosti kvara:

P(K) = P("T i K ∣T")+P("nije T i K ∣ nije T") = P(T) ⋅P(K ∣T)+P("nije T") ⋅P("K ∣ nije T") = 0.05 ⋅0.7+0.95 ⋅0.01 = 0.0445

Y

Primjer 2.4.3. U kutiji se nalazi 6 zelenih, 3 crvene i 1 plava kuglica. Ako smo nasumice uzeli dvijekuglice kolika je vjerojatnost a) da ce obje biti zelene, b) da ce tocno jedna biti zelena, c) da nijedna necebiti zelena?

Rješenje: Zamislimo da nismo istovremeno izvukli obje kuglice vec jednu za drugom (to nema utjecajana konacan rezultat).

a) Da smo izvukli obje zelene kuglice (ZZ) znaci da je prva izvucena kuglica zelena (1Z) i da je drugaizvucena kuglica zelena (2Z):

ZZ ↔ 1Zi2Z → P(ZZ) = P(1Zi2Z) = P(1Z) ⋅P(2Z∣1Z) = 610

⋅ 59= 1

3

b) Da smo izvukli tocno jednu zelenu kuglicu (Z) znaci da je prva izvucena kuglica zelena (1Z) i dadruga izvucena kuglica nije zelena (2neZ) ili da prva izvucena kuglica nije zelena (1neZ) i dadruga izvucena kuglica je zelena (2Z):

Z ↔ 1Zi2neZili1neZi2Z → P(Z) = P(1Z)⋅P(2neZ∣1Z)+P(1neZ)⋅P(2Z∣1neZ) = 610⋅49+ 4

10⋅69=

815

Page 46: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

42 2. Vjerojatnosni model slucajne pojave

c) Da nije izvucena zelena kuglica (neZ) znaci da prvi put nije izvucena zelena (1neZ) i drugi putnije izvucena zelena (2neZ):

neZ ↔ 1neZi2neZ → P(neZ) = P(1neZi2neZ) = P(1neZ) ⋅P(2neZ∣1neZ) = 410

⋅ 39= 2

15

Y

Primjer 2.4.4. Vjerojatnost da se u danom podrucju u jednom danu pojavi avion je 0.05. Vjerojatnostda protuzracna obrana detektira avion ako se pojavio je 0.99 a da ga detektira ako se nije pojavio je0.1. Kolike su vjerojatnosti a) da se pojavi avion a protuzracna obrana ga ne detektira, b) da bude lažanalarm c) da se oglasi alarm d) da sustav pogriješi?

Rješenje: Na sva ova pitanja možemo odgovoriti tako da, kao i u prethodnom primjeru, opišemonavedene dogadaje pomocu dogadaja kojima znamo vjerojatnosti i upotrijebimo odgovarajuce formule zavjerojatnost. No možemo se poslužiti i jednim grafickim pomagalom tzv stablom izbora. Sve mogucesituacije su rezultat uzastopnih izbora da li se desio ili nije elementarni dogadaj: pojavio se (AV ) ili senije pojavio avion, te oglasio se (AL) ili se nije oglasio alarm. Elementarne dogadaje cemo predstaviticvorovima stabla a izbore granama koje vode do njih i na kojima cemo napisati vjerojatnosti tih izbora:

ALAV

0.99 22

0.01 ,,nije AL0.05

77

0.95 '' ALnije AV

0.1 22

0.9++

nije AL

AV : avion se pojavioAL: alarm se oglasio0.05 = P(AV)0.99 = P(AL∣AV)0.1 = P(AL∣"nije AV ")

Da bismo našli vjerojatnost nekog dogadaja prvo moramo odrediti kojim se nizovima izbora (putevimau stablu) on realizira. Njegovu vjerojatnost cemo dobiti tako da pomnožimo vjerojatnosti grana kojetvore jedan takav put (to odgovara vezniku i ) i tako dobivene vjerojatnosti zbrojimo po svim takvimputevima (to odgovara vezniku iskljucivo ili ).

a) Ovaj se dogadaj realizira putem0.05Ð→ AV

0.01Ð→ nije AL

Njegovu cemo vjerojatnost dobiti da pomnožimo vjerojatnosti na svakoj grani puta:

P("AV i nije AL") = P(AV) ⋅P("nije AL"∣AV) = 0.05 ⋅0.01 = 0.0005

b) Lažni alarm se realizira duž sljedeceg puta:0.95Ð→ nije AV

0.1Ð→ AL

P("nije AV i AL") = P("nije AV ") ⋅P(AL∣"nije AV ") = 0.95 ⋅0.1 = 0.095

c) Alarm se oglašava duž sljedecih putova0.05Ð→ AV

0.99Ð→ AL0.95Ð→ nije AV

0.1Ð→ AL

Zato cemo vjerojatnosti duž svakog puta zbrojiti:

Page 47: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.4. Uvjetna vjerojatnost i nezavisnost dogadaja 43

P(AL) = P("(AV i AL) ili ( nije AV i AL)")= P("AV i AL") ⋅P("nije AV i AL") = P(AV) ⋅P(AL∣AV)+P("nije AV ") ⋅P(AL∣"nije AV ") = 0.05 ⋅0.99+0.95 ⋅0.1 = 0.1445

d) Greška G se desi kad se avion pojavi i ne oglasi se alarm ili kad se avion pojavi a ne oglasi sealarm. Za promjenu, to cemo sada riješiti direktnim razlaganjem dogadaja (na stablu izbora semože graficki pratiti to razlaganje)

G←→ AV i nije AL ili nije AV i AL

Ð→ P(G) = P(AV) ⋅P("nije AL∣AV ")+P("nije AV ") ⋅P("AL∣ nije AV ") = 0.05 ⋅ 0.01+ 0.95 ⋅ 0.1 =0.0955. Y

Za teoriju vjerojatnosti i statistiku veoma je važan pojam nezavisnosti dogadaja. Intuitivnosmatramo da dogadaj B je neovisan o dogadaju A ako pojavljivanje dogadaja A ne utjece na vjerojatnostdogadaja B, tj ako je P(B∣A) = P(B). Tad vrijedi jednostavna formula za presjek dogadaja P(A∩B) =P(A) ⋅P(B), a iz toga slijedi i da je P(B∣A) = P(B).

Nezavisni dogadaji

Za dogadaje A i B kažemo da su nezavisni, ako je ispunjen jedan od medusobno ekvivalentnihuvjeta:

1. P(A∣B) = P(A)

2. P(B∣A) = P(B)

3. P(A∩B) = P(A) ⋅P(B) (formula za presjek nezavisnih dogadaja)

Primjer 2.4.5. U sljedecoj tablici su dane vjerojatnosti neispravnosti proizvoda i oštecenosti njegovepovršine.

Proizvodneispravan

Da Ne

Da 0,5% 4,5%

Ne 9,5% 85,5%

Oštećena površina

Jesu li neispravnost proizvoda i oštecenost njegove površine nezavisni dogadaji?

Rješenje: Neka je NP:"proizvod je neispravan" a OP:"površina je oštecena".

P(NP) = 0.5%+4.5% = 5%

Page 48: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

44 2. Vjerojatnosni model slucajne pojave

P(NP ∣OP) = P(NP ∩OP)P(OP)

= 0.5%10%

= 0.510

= 0.05 = 5%

Dakle, dogadaji su nezavisni. Y

Formulu za presjek nezavisnih dogadaja možemo upotrijebiti ne samo da ispitamo jesu li dogadajinezavisni, vec i da izracunamo vjerojatnost presjeka dogadaja kada znamo da su nezavisni. A to obicnoznamo iz nekih dodatnih informacija, npr, iz fizicke nezavisnosti dogadaja.

Primjer 2.4.6. Kolika je vjerojatnost da cemo u bacanju dvije kocke dobiti a) dvije šestice, b) jednušesticu, c) nijednu šesticu

Rješenje: Ovaj bismo zadatak mogli riješiti tako da napravimo tablicu mogucih ishoda (koji su svijednako vjerojatni) i pobrojimo koliko ishoda realizira navedene dogadaje. No možemo ga riješitigledajuci što je palo na kojoj kocki i koristeci nezavisnost dogadaja na drugoj kocki s dogadajima naprvoj kocki.

a) Da su pale dvije šestice ŠŠ znaci da je na prvoj kocki pala šestica (1Š) i da je na drugoj kocki palašestica (2Š):

P(ŠŠ) = P(1Š i 2Š) = P(1Š) ⋅P(2Š) = 16⋅ 16= 1

36

b) Da je pala jedna šestica (Š) znaci da je na prvoj kocki pala šestica (1Š) a na drugoj nije (2neŠ) ilina prvoj nije (1neŠ) a na drugoj jeste (2Š):

P(Š) = P(1Š i 2neŠ ili 1neŠ i 2Š) = P(1Š) ⋅P(2neŠ)+P(1neŠ) ⋅P(2Š) = 16⋅ 56+ 5

6⋅ 16= 10

36= 5

18

c) Da nije pala šestica znaci da nije pala na prvoj kocki (vjerojatnost je56

) i da nije pala na drugoj

kocki (vjerojatnost je56

) pa je vjerojatnost tog dogadaja56⋅ 56= 25

36.

Y

Vidimo da imamo dvije formule za konjunkciju dva dogadaja, kao i kod disjunkcije dogadaja, jednukompliciraniju koja uvijek vrijedi i drugu jednostavniju koja vrijedi samo za nezavisne dogadaje:

Vjerojatnost konjunkcije dogadaja

P("A i B") = P("A") ⋅P("B ako je A")

Ako su dogadaju A i B nezavisni tad imamo jednostavniju formulu:

Page 49: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.4. Uvjetna vjerojatnost i nezavisnost dogadaja 45

P("A i B") = P("A") ⋅P("B")

Primjer 2.4.7. Vjerojatnost kvara pojedinog uredaja u strujnom krugu u danom vremenskom perioduje 0.02. Kolika je vjerojatnost da ce doci do prekida strujnog kruga ako su uredaji spojeni a) paralelno,b) serijski? Pretpostavlja se da su kvarovi uredaja medusobno nezavisni dogadaji i da tad ne može tecistruja kroz uredaj.

Rješenje: a) Kod paralelnog spoja, do prekida ce doci kad se oba uredaja pokvare (KU1 i KU2)

U1

U2

P("KVARA") = P("KU1 i KU2") = P(KU1) ⋅P(KU2) = 0.02 ⋅0.02 = 0.0004

b) Kod serijskog spoja, do prekida ce doci kad se barem jedan od uredaja pokvari (KU1 ili KU2).

U1 U2

To možemo izracunati na jedan od sljedecih nacina:

1. po formuli za uniju (disjunkciju) dogadaja:

P("KU1 ili KU2") = P(KU1)+P(KU2)−P("KU1 i KU2")= P(KU1)+P(KU2)−P(KU1) ⋅P(KU2)= 0.02+0.02−0.02 ⋅0.02 = 0.0396

2. dogadaj cemo rastaviti na iskljucive dogadaje: do prekida ce doci ili kad se prvi uredaj pokvari adrugi ne pokvari ("KU1 i nije KU2") ili prvi uredaj se ne pokvari i drugi se pokvari ("nije KU1 i KU2")ili oba se pokvare ("KU1 i KU2"):

P("KVARA") = P("KU1 i nije KU2")+P("nije KU1 i KU2")+P("KU1 i KU2")= P(KU1) ⋅P("nije KU2")+P("nije KU1") ⋅P(KU2)+P(KU1) ⋅P(KU2)= P(KU1) ⋅P(1−P(KU2))+P(1−P(KU1)) ⋅P(KU2)+P(KU1) ⋅P(KU2)= 0.02 ⋅0.98+0.98 ⋅0.02+0.02 ⋅0.02 = 0.0396

3. po formuli za vjerojatnost suprotnog dogadaja (prekida nema kad oba uredaja ispravno rade):

P("KVARA") = 1−P("NIJE KVAR")= 1−("nije KU1 i nije KU2")= 1−P(nije KU1) ⋅P(nije KU2)= 1−(1−P(KU1))(1−P(KU2))= 1−0.98 ⋅0.98 = 0.0396

Y

Page 50: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

46 2. Vjerojatnosni model slucajne pojave

Nezavisnost dogadaja je veoma važna u održavanju sustava ciji kvarovi mogu ugroziti ljudske živote.Navest cemo ilustrativan primjer. Godine 1983. odmah nakon polijetanja,na Eastern Air Lines letu 855ugasio se jedan motor. Dok je posada okretala avion nazad na aerodrom ugasila su se i preostala dvamotora. Srecom, pri samom spuštanju, posada je uspjela upaliti jedan motor i avion sa 162 putnika i 10clanova posade je sigurno prizemljio. Analiza je pokazala da je isti mehanicar na sva tri motora napravioistu grešku pri zamjeni ulja, koja je mogla fatalno završiti. Recimo da je vjerojatnost da proizvoljnoizabrani mehanicar napravi takvu grešku 1%. Medutim, vjerojatnost da ce na drugom motoru kojineposredno servisira nakon prvoga napraviti takvu grešku je gotovo 100% (uvjetna vjerojatnost je skoro1), isto tako i na trecem. pa je po formuli za vjerojatnost konjunkcije (zavisnih dogadaja) vjerojatnostda ce na sva ti motora napraviti grešku jednaka 1% ⋅100% ⋅100% = 1%. Ako pak osiguramo da su tidogadaji nezavisni, odnosno da tri razna mehanicara servisiraju tri motora aviona, tada je po formuliza nezavisne dogadaja vjerojatnost da ce se greška napraviti na sva tri motora jednaka 1% ⋅1% ⋅1% =0.0001%, dakle, 10000 puta manja! Pouka iz ovog incidenta je bila upravo ova, Od tada svaki motoraviona mora servisirati druga ekipa mehanicara.

2.5 Beskonacni vjerojatnosni modeli

Na kraju cemo pokazati i dva primjera beskonacnog prostora ishoda.

Neka bacamo kocku dok ne padne šestica. Je li vjerojatnije da ce ona pasti u neparnom ili parnombacanju?

Pogledajmo prvo neke moguce ishode: 2316, 3324516, 1234235412323126, .... Vidimo da je prostor

ishoda beskonacan. Svakom pojedinom ishodu možemo izracunati vjerojatnost. Npr. P(2136) = 164 . Isto

tako možemo izracunati i vjerojatnost da ce šestica pasti baš deseti put. To ce se desiti kad prvih devet

puta ne padne a deseti padne i ta je vjerojatnost jednaka P(10) = (56)

9⋅ 16

. Isto tako možemo izracunati

da ce prva šestica pasti k-ti put:

P(k) = (56)

k−1⋅ 16

Medutim, kako cemo izracunati vjerojatnost da ce prva šestica pasti u neparnom bacanju, dakle uprvom, trecem, petom, ... bacanju? Ovaj se dogadaj sastoji od beskonacno ishoda. Njegovo razlaganjena pojedina neparna bacanja je beskonacno:

P(neparno) = P(1 ili 3 ili 5 ili . . .) = 16+(5

6)

2⋅ 16+(5

6)

4⋅ 16+ . . .

Do sada smo analizirali samo konacne vjerojatnosne modele. Ako je prostor ishoda beskonacan tada udefiniciji vjerojatnosnog modela zahtjevamo tzv. beskonacnu aditivnost vjerojatnosti:

Za beskonacno medusobno iskljucivih dogadaja A1, A2, . . .

Page 51: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.5. Beskonacni vjerojatnosni modeli 47

P(A1∪A2∪ . . .) = P(A1)+P(A2)+ . . .

Svaki konacan dio sume mogli bismo opravdati pomocu interpretacije vjerojatnosti relativnim frekven-cijama pa to daje opravdanje i za "granicni" beskonacan slucaj.

Ovo pravilo nam omogucuje da izracunamo prethodnu vjerojatnost. Pri tome cemo koristiti formuluza sumu beskonacnog geometrijskog reda:

1+ q+ q2+ . . . = 11− q

, za ∣q∣ < 1

Sad imamo sve potrebno:

P(neparno) = 16+(5

6)

2⋅ 16+(5

6)

4⋅ 16+ . . . = 1

6⋅(1+(5

6)

2+(5

6)

4+ . . . = 1

6⋅ 1

1−(56)

2 =6

11

Vidimo da je vjerojatnije da ce šestica pasti neparni put nego parni. To je i intuitivno prihvatljivo jerproces zapocinje neparnim (prvim) bacanjem.

Razmotrimo još jedan primjer beskonacnog prostora ishoda. Zamislimo da izabiremo na posveslucajan nacin (svi ishodi su jednako moguci) jednu tocku iz kvadrata na slici. Kolika je vjerojatnost dace tocka biti iz kruga na slici?

1

1

Što je veca površina jednog dijela kvadrata to ce vjerojatnost da tocka bude iz tog dijela biti veca. Zatose cini prihvatljivim za vjerojatnost da tocka padne na lik A uzeti omjer površine od A i površine cijelogkvadrata. Ovako definirana vjerojatnost zaista zadovoljava aksiome vjerojatnosti koje smo naveli ukonacnom slucaju, ali ima i neke neobicnosti. Pošto je ovdje ishod jedna tocka a površina tocke je nula toje vjerojatnost da izaberemo odredenu tocku jednaka nuli. Vec smo vidjeli da je vjerojatnost nemogucegdogadaja nula, a sada imamo primjer moguceg dogadaja kojem je vjerojatnost nula. To je naprostodogadaj koji se veoma rijetko javlja, toliko rijetko da mu je idealna relativna frekvenija jednaka nuli.Još jedna neobicnost ovog primjera je da nemaju svi likovi površine pa ne možemo svakom podskupukvadrata pridružiti vjerojatnost. Da bi se i za ovakve slucajeve mogli naci vjerojatnosni modeli,našu definiciju vjerojatnosnog modela bismo trebali proširiti na nacin da ne moraju svi podskupoviprostora ishoda biti dogadaji. Kakvi podskupovi mogu biti dogadaji zahtjeva analizu koja je doneklekomplicirana i time se ovdje necemo baviti. To nam nece biti neko ogranicenje, jer nas u praksi zanimajujednostavni skupovi. Tako cemo i u ovom slucaju, mada ne znamo sve elemente ovog beskonacnogprostora dogadaja, ipak moci po navedenoj formuli izracunati vjerojatnost da ce izabrana tocka bitiunutar kruga:

Page 52: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

48 2. Vjerojatnosni model slucajne pojave

P = POVRŠINA KRUGAPOVRŠINA KVADRATA

=(1

2)

1= π

4

Ovo nam ujedno daje nacin da pomocu slucajne pojave racunamo broj π. Uvedemo koordinatnisustav, pomocu racunala generiramo parove slucajnih brojeva koji predstavljaju tocke u kvadratu ievidentiramo kod koliko je parova brojeva (nk od njih n) tocka bila unutar kruga. Relativna frekvencijaza velike n mora biti bliska vjerojatnosti, dakle broju

π

4. Dakle, π ≃ 4 ⋅ nk

n

2.6 Zadaci za vježbu

Prostor ishoda

1. Odredite prostore slucajnih ishoda sljedecih slucajnih pojava

a) moguce greške pri transmisiji stringa od dva bita,

b) rezultati utrke na 100 metara (ucestvuje 8 trkaca i treba samo odrediti koliko elemenata imaprostor),

c) broj raspadnutih radioaktivnih cestica u nekom materijalu u nekoj jedinici vremena,

d) vrijeme rada do kvara stroja za pranje rublja.

2. Kontrola kvalitete ispitala je uzorke istog proizvoda od tri dobavljaca i svaki svrstala u kategorijudobar ili loš. Dobivena je sljedeca tablica:

Dobavljač

D L

1. 22 8

2. 25 5

3. 30 10

Kvaliteta

Koliko elemenata imaju dogadaji

A: proizvod je od prvog dobavljaca

B: proizvod je loš

C: proizvod je od prvog dobavljaca ili je proizvod loš

D: proizvod nije od prvog dobavljaca

E: proizvod nije od prvog dobavljaca i proizvod nije loš

3. Bacamo tri puta novcic. Pri svakom bacanju može pasti glava (G) ili pismo (P). Odredite prostormogucih ishoda te sljedece dogadaje i njihove vjerojatnosti (smatramo da je svaki ishod jednakovjerojatan):

a) A:”pale su tocno dvije glave”,

Page 53: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.6. Zadaci za vježbu 49

b) B:”zadnja je pala glava”,

c) C:”palo je više glava nego pisama”

d) D:”pala je barem jedna glava”,

e) E: ”barem je jednom nakon glave palo pismo”,

f) Ac,

g) B∪C,

h) Bc ∩C.

4. Taksi vozi tri putnika u tri hotela. Oznacimo s (x1, x2, x3) da ce x1 putnika odsjesti u prvi hotel, x2putnika odsjesti u drugi hotel, a x3 putnika odsjesti u treci hotel (x1+x2+x3 = 3). Odredite prostorslucajnih ishoda i sljedece dogadaje, te njihove vjerojatnosti ako pretpostavimo da svaki ishod imaistu vjerojatnost:

a) A:”u svaki hotel ce odsjesti po 1 putnik”,

b) B:”u prvi hotel ce odsjesti svi putnici”,

c) C:”svi putnici ce odsjesti u isti hotel”,

d) D:”barem dva putnika ce odsjesti u prvi hotel”,

e) E:”više putnika ce odsjesti u prvom nego u trecem hotelu”.

Racunanje vjerojatnosti

5. Moguci ishodi slucajne pojave su a, b, c i d s vjerojatnostima 0.1,0.3, 0.5, 0.1. Nadite vjerojatnostidogadaja A = a,b, B = b, c,d, AC, A∩B, A∪B, AC ∩(A∪BC).

6. Moguci ishodi slucajne pojave su a, b, c, d i e s vjerojatnostima 0.1, 0.1, 0.2, 0.4 i 0.2. Neka jeA = a,b, c i B = c,d, e. Izracunajte P(A), P(B), P(AC), P(A∪B), P(A∩B), P(AC ∪BC).

7. Slucajna pojava ima 5 mogucih ishoda a, b, c, d i e koji su jednako vjerojatni. Ako je A = a,b iB = c,d, e izracunajte sljedece vjerojatnosti: P(A), P(B), P(AC), P(A∪B), P(A∩BC).

8. U sljedecoj tablici proizvodi su sortirani prema otpornosti na ogrebotine (dobra, loša) i otpornostina udarac (dobra, loša)

Otpornostna ogrebotinu

D L

D 70 9

L 16 5

Otpornost na udarac

Neka A oznacava dogadaj da proizvod ima dobru otpornost na udarce, a B dogadaj da ima dobruotpornost na ogrebotine. Ako nasumce izabiremo jedan proizvod, kolika je vjerojatnost sljedeceihdogadaja: P(A), P(B), P(AC), P(A∩B), P(A∪B) P(AC ∪B).

9. Ako je P(A) = 0.3, P(B) = 0.2, i P(A∩B) = 0.1 odredite sljedece vjerojatnosti: P(AC), P(A∪B),P(AC ∩B), P(A∩BC), P((A∪B)C), P(AC ∪B).

10. U tablici su dane vjerojatnosti da glava kompresora koju proizvodi jedna tvornica ima dobru ililošu obradu površine odosno dobru ili lošu zaobljenost

Page 54: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

50 2. Vjerojatnosni model slucajne pojave

Obradapovršine

D L

D 70 9

L 16 5

Zaobljenost

Kolika je vjerojatnost da je:

a) dobro obradena površina

b) dobro obradena površina ili dobra zaobljenost

c) loše obradena površina i dobra zaobljenost

d) loše obradena površina ili loša zaobljenost

11. Proizvodac automobilskih farova klasificira svoje proizvode po intenzitetu (dobar, loš) i kvalitetisvjetla (dobra, loša), U tablici su dane vjerojatnosti da proizvod pripada pojedinoj grupi

Intezitet

D L

D 70% 12%

L 13% 5%

Kvaliteta

Kolika je vjerojatnost da uredaj

a) ima lošu kvalitetu svjetla

b) ima barem jednu karakteristiku dobru

c) ima tocno jednu karakteristiku dobru

Uvjetna vjerojatnost i nezavisnost dogadaja

12. U sljedecoj tablici su dane vjerojatnosti da proizvod pripada odredenoj grupi

Elastičnost

D L

D 70% 12%

L 13% 5%

Čvrstoća

Izracunajte vjerojatnosti sljedecih dogadaja

a) proizvod ima dobru cvrstocu ako ima dobru elasticnost

b) proizvod nema dobru cvrstocu ako nema dobru elasticnost

c) proizvod ima barem nešto dobro ako ima barem nešto loše

Page 55: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.6. Zadaci za vježbu 51

13. Kutija sadrži 15 bijelih i 25 crvenih kuglica i covjek zaredom bez vracanja izvadi dvije kuglice.Kolika je vjerojatnost da ce

a) druga izvucena kuglica biti crvena ako je prva izvucena bila bijela

b) da ce obje izvucene kuglice biti crvene

14. U sljedecoj tablici su dane vjerojatnosti da covjek pripada nekoj skupini s obzirom je li cijepljenod gripe i je li dobio gripu

Cijepljenod gripe

da ne

da 0,25 0,20

ne 0,28 0,27

Dobio gripu

Kolika je vjerojatnost

a) da ce covjek biti cijepljen i dobiti gripu

b) da ce dobiti gripu ako je cijepljen

c) da je cijepljen ako je dobio gripu

15. U tablici su dane proporcije u mnoštvu ljudi koje su odredenog godišta i imaju odredene prihode.

Godine

visok srednji nizak

<30 0,030 0,180 0,090

30-50 0,052 0,312 0,156

>50 0,018 0,108 0,054

Prihod

Ako proizvoljno odaberemo nekog covjeka, kolika je vjerojatnost

a) da ima visok prihod ako je mladi od 30 godina

b) da ima visok prihod ako je stariji od 30 godina

c) da je mladi od 30 ako ima nizak prihod

16. Od svih letova iz Splita za Bec 89.5% krece na vrijeme i stiže na vrijeme, 3.5% krece na vrijeme ine stiže na vrijeme, 1.5% ne krece na vrijeme i stiže na vrijeme, a 5.5% ne krece na vrijeme i nestiže na vrijeme. Kolika je vjerojatnost

a) da ce avion stici na vrijeme ako je krenuo na vrijeme

b) da je avion kasnio u polasku ako nije stigao na vrijeme

c) da ce avion stici na vrijeme

17. Ako je P(A∖B) = 0.4, P(B) = 0.8 i P(A) = 0.5 jesu li dogadaji A i B nezavisni?

18. CD diskovi jednog proizvodaca razvrstani su po otpornosti na udarce i otpornosti na ogrebotine.U tablici su dane vrijednosti da CD disk pripada odredenoj grupi

Page 56: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

52 2. Vjerojatnosni model slucajne pojave

Otpornostna ogrebotine

D L

D 70% 9%

L 16% 5%

Otpornost na udarac

Jesu li dobra otpornost na ogrebotinu i dobra otpornost na udarac nezavisni dogadaji?

19. Vjerojatnost kvara elektricnog uredaja u suhim uvjetima u danom periodu je 1%, a u vlažnimuvjetima 5%. Ako je vjerojatnost 90% da ce uredaj biti u suhim uvjetima, a 10% u vlažnim, kojaje vjerojatnost kvara uredaja?

20. 2% nova pamuka i 3% nova najlona neke tvornice ima grešku. Ako je kupac uzeo 70% pamucnihrola, a 30% najlonskih, kolika je vjerojatnost da ce proizvoljno uzeta roba biti s greškom?

21. Muha se krece po sljedecoj mapi

P

K

U svakom potezu dode iz jednog vrha u susjedni vrh. Kad je u jednom vrhu može krenuti premabilo kojem susjednom vrhu s istom vjerojatnošcu. Kolika je vjerojatnost da ce u 2 poteza doci izvrha P u vrh K?

22. U kutiji od 10 žarulja 4 su neispravne. Ako su iz kutije uzete dvije žarulje jedna za drugom bezvracanja, koja je vjerojatnost

a) da ce tocno jedna bit neispravna

b) da ce obje biti neispravne

23. Naftna kompanija se bori za prevlast nad naftnim poljima A i B s vjerojatnostima uspjeha 40% i30% redom. Vjerojatnost da ce im tada naftno polje A biti uspješno je 45% dok je za vjerojatnostza polje B 55%. Kolika je vjerojatnost

a) da ce kompanija imati uspjeha na polju A

b) da ce kompanija imati uspjeha na tocno jednom polju

c) da ce kompanija imati uspjeha na oba polja

d) da ce kompanija imati uspjeha na barem jednom polju

24. U kutiji je 9 loptica, 5 crvenih i 4 plave. Kolika je vjerojatnost da ce pri izvlacenju dvije lopticeobje biti crvene

a) ako se nakon svakog izvlacenja loptica vrati u kutiju

b) ako se nakon svakog izvlacenja loptica ne vrati u kutiju

25. Kad gospoda Štefa kupuje tucet (12) jaja uvijek izabere 3 nasumce da trešnjom ispita jesu limucak. Ako nijedno nije mucak Štefa kupi jaja. Kolika je vjerojatnost da ce kupiti tucet jaja akoje unutra bilo 5 mucaka.

Page 57: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.6. Zadaci za vježbu 53

26. Vjerojatnost da ce na jednoj lokaciji snijeg biti veci od 10 cm je 0.2 u prosincu, 0.4 u sijecnju, a 0.6u veljaci. Kolika je vjerojatnost

a) da ce snijeg biti manji od 10 cm u sva tri mjeseca

b) da ce snijeg biti veci od 10 cm u barem dva mjeseca

27. Tri loptice su izvucene na slucajan nacin iz kutije u kojoj je 6 crvenih, 4 bijele i 5 plavih loptica.Kolika je vjerojatnost da se redom izvucena crvena, bijela i plava loptica ako nakon svakogizvlacenja

a) loptica je vracena nazad

b) loptica nije vracena nazad

28. Prva kutija sadrži 3 crvene i 2 plave kuglice, a druga kutija 2 crvene i 8 plavih. Baca se novcic.Ako padne glava kuglica se nasumce bira iz prve kutije, a ako padne pismo bira se iz druge kutije.Kolika je vjerojatnost da cemo izvuci crvenu kuglicu?

29. U igri pikada Joža pogada sredinu s vjerojatnošcu 0.8, a Jura s 0.7. Ako su oba gadala jednom,kolika je vjerojatnost da je barem jednom pogodena sredina?

Rješenja

1. a) oznacimo li s d da je bit ispravno prenešen a s n da nije tad je Ω = (n,n),(n,d),(d,n),(d,d),

b) na prvom mjestu može (u principu) biti bilo koji od 8 trkaca, na drugom bilo koji od preostalih7, itd, pa je ukupan broj mogucnosti 8 ⋅7 ⋅6. . . = 8! = 40320,

c) buduci da ne možemo postaviti unaprijed gornju ogradu prostor mogucih ishoda je beskonacanΩ = 0,1,2, . . .,

d) Ω = [0,∞ >.

2. A↦ 22+8 = 30

B↦ 8+5+10 = 23

C = A∪B↦ 22+8+5+10 = 45

D = AC↦ 25+5+30+10 = 70

E = AC ∩BC = 25+30 = 55

3. Ω = (P,P,P),(P,P,G),(P,G,P),(P,G,G),(G,P,P),(G,P,G),(G,G,P),(G,G,G)

a) A = (G,G,P),(G,P,G),(P,G,G)→ P(A) = 38

b) B = (P,P,G),(P,G,G),(G,P,G),(G,G,G)→ P(B) = 48= 1

2

c) C = (P,G,G),(G,P,G),(G,G,P),(G,G,G)→ P(C) = 12

d) D = (P,P,G),(P,G,P),(P,G,G),(G,P,P),(G,P,G),

(G,G,P),(G,G,G)→ P(D) = 78

e) E = (P,G,P),(G,P,P),(G,P,G),(G,G,P)→ P(E) = 12

f) AC = (P,P,P),(P,P,G),(P,G,P),(G,P,P),(G,G,G)→ P(AC) = 38

Page 58: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

54 2. Vjerojatnosni model slucajne pojave

g) B∪C = (P,P,G),(P,G,G),(G,P,G),(G,G,G),(G,G,P)→ P(B∪C) = 58

h) BC ∩C = (P,P,P),(P,G,P),(G,P,P),(G,G,P)∩(P,G,G),(G,P,G),(G,G,P),(G,G,G) = (G,G,G)→ P(BC ∩C) = 1

8

4. Ω = (0,0,3),(0,1,2),(1,0,2),(0,2,1),(1,1,1),(2,0,1),(0,3,0),(1,2,0),(2,1,0),(3,0,0)

a) A = (1,1,1)→ P(A) = 110

b) B = (3,0,0)→ P(B) = 110

c) C = (3,0,0),(0,3,0),(0,0,3)→ P(C) = 310

d) D = (2,1,0),(2,0,1),(3,0,0)→ P(D) = 310

e) E = (2,0,1),(1,2,0),(2,1,0),(3,0,0)→ P(E) = 410

5. P(A) = 0.1+0.3 = 0.4

P(B) = 0.3+0.5+0.1 = 0.9

AC = c,d→ P(AC) = 0.5+0.1 = 0.6

A∩B) = b→ P(A∩B) = 0.3

A∪B) = a,b, c,d =→ P(A∪B) = 1

AC ∩(A∪BC) = c,d∪(a,b∪a) = c,d∪a,b =∅→ P(AC ∩(A∪BC)) = 0

6. P(A) = 0.4, P(B) = 0.8, P(AC) = 0.6, P(A∪B) = 1, P(A∩B) = 0.2,P(AC ∪BC) = 0.8

7. P(A) = 25

, P(B) = 35

, P(AC) = 35

, P(A∪B) = 1, P(A∩BC) = 25

.

8. P(A) = 0.86, P(B) = 0.79, P(AC) = 0.14, P(A∩B) = 0.70, P(A∪B) = 0.95, P(AC ∪B) = 0.84

9. P(AC) = 0.7, P(A∪B) = 0.4, P(AC ∩B) = 0.1, P(A∩BC) = 0.2,P((A∪B)C) = 0.6, P(AC ∪B) = 0.8

10. a) 79% , b) 95% , c) 18% , d) 30%

11. a) 17% , b) 95% , c) 25%

12. a)70%85%

= 1417

, b)5%15%

= 13

, c)25%30%

= 56

13. a)2539

, b)2540

⋅ 2439

14. a) 0.25, b)0.25

0.25+0.20= 5

9, c)

0.250.25+0.28

= 2553

15. a)0.030.3

= 110

, b)0.070.7

= 110

, c)0.090.3

= 310

16. a)89.5%

89.5%+3.5%= 89.5

93, b)

5.5%3.5%+5.5%

= 5.59

, c) 89.5%+1.5% = 91%

17. Ne

Page 59: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

2.6. Zadaci za vježbu 55

18. Ne

19. 90% ⋅1%+5% ⋅10% = 0.14

20. 70% ⋅2%+30% ⋅3% = 0.023

21.13⋅ 13+ 1

3⋅ 14= 1

9+ 1

12= 7

36

22. a)410

⋅ 69+ 6

10⋅ 49= 48

90

b)410

⋅ 39= 2

15

23. a) 0.18, b) 0.2856, c) 0.0297, d) 0.3153

24. a)59⋅ 59= 25

81

b)59⋅ 48= 5

18

25.7

12⋅ 611

⋅ 510

= 744

26. a) 0.192, b) 0.344

27. a)615

⋅ 415

⋅ 915

= 8225

b)615

⋅ 414

⋅ 513

= 491

28.25

29. 0.94

Page 60: UVOD U STATISTIKU kroz razumijevanje pojmova i formula

56 2. Vjerojatnosni model slucajne pojave