Upload
ante-ramic
View
68
Download
8
Embed Size (px)
DESCRIPTION
Vjerojatnost i statistika
Citation preview
Gradevinsko-arhitektonski fakultetSveuOiIita u Splitu
VJEROJATNOST I STATISTIKA
Prof. dr. sc. B.VrdoUak
Split, 2007.
Sadraj
Predgovor VII
I. dio ELEMENTI TEORTJE VJEROJATNOSTI 1
1. Pojam dogadaja I vjerojatnost dogadaja 31.1. Slueajni dogadaji 31.2. Operacije s dogadajina . . . 61.3. Vjerojatnost dogadaja 9
1.3.1. Vjerojatnost a posteriori 91.3.2. Vjerojatnost dogadaja pri jednako moguéirn ishodima 101.3.3. Geometrijske vjerojatnosti 121.3.4. Vjerojatnosni prostor 141.3.5. Diskretni vjerojatnosni prostor 171.3.6. Slueaj neprebrojivog skupa Q 19
1.4. Uvjetna vjerojatnost i nezavisnost dogadaja 201.5. Formula potpune vjerojatnosti i Bayesova formula 22
2. Sueajne varijable i distribucije 252.1. Pojam sluëajne varijable 252.2. Diskretne distribucije 272.3. Kontinuirane distribucije 312.4. Funkcija distribucije sluaajne varijable 35
3. Karakteristjene vrijednosti I funkcije slueajuih varijabli 433.1. Oeekivanje slueajne varijable 433.2. Medijan sluãajne varijable 473.3. Disperzija slueajne varijable 503.4. Momenti sluèajne varijable 533.5. Karakteristiena funkcija 55
4. Neke znaèajne distribucije 614.1. Binomna distribucija 614.2. Poissonova distribucija 664.3. Normana ill Gaussova distribucija 704.4. Gama-distribucija 81
III
4.5. Funlccije slueajnih varijabli.
5. Dvodimenzionalne sluëajne varijable i distribucije5.1. Pojam àluaajnog vektora5.2. Diskretrie dvodimenzionalne distribucije5.3. Kontinuiraae dvodimenzionalne distribucije5.4. Funkcija distribucije5.5. Marginalne distribucije5.6. Uvjetne distribucije5.7. Nezavisnost slueajnih varijabli5.8. Funkcije slueajnih varij abli5.9. Momenti dvodimenzionalne distribucije5.10. Koeficijent korelacije5.11. Regresija5.12. Linearna regresija5.13. Opéa linearna regresija5.14. Nelinearna regresija
[1
Ii6. Viedirnenzjona1ne sluëajne varijable
6.1. n—djmenzjoxialne sluoajne varijable I distribucije6.2. Zakoni velikift brojeva i centralni graniëni teorem6.3. Uvod u teoriju slueajnih procesa
6.3.1. Pojarn slueajnog procesa6.3.2. Sluëajni lanci, Markovlje’vi lanci6.3.3. Markovljevi procesi
IL dio OSNOVE MATEMATIOKE STATISTIKE 147
7. Osnove teorije uzoraka7.1. Populacija i slueajni uzorak7.2. Prilcazivanje statistiakih podataka7.3. Empirijska funkcija distribucije7.4. Neke znaëajne statistike7.5. Neke znaëajne distribucije
7.5.1. Pearsonova x2 —distribncij a7.5.2. Studentova t—distribucija7.5.3. Fisherova F—distribucija
7.6. Distribucije nekih statistika7.6.1. Sredina uzorka7.6.2. Disperzija uzorka7.6.3. Kvocijent sredine i disperzije uzorka7.6.4. Kvocijent disperzija dvaju uzoraka7.6.5. Koeficijent korelacije uzorka 170
SADR2AJ83
9191939698
101105107111116118121125127128
129129132138138140143
149149151154156159159163165166166167168168
rUi
UF’
SADRAJ V
8. Procjene parametara8.1. Toakasta procjena parametara
8.1.1. Metoda maksimalne vjerojatnosti8.1.2. Metoda momenata
8.2. Intervali povjerenja8.2.1. Jntrval povjerenja za nepoznatu vjerojatnost p8.2.2. Intervali povjerenja za parametre normalne distribucije
9. Testiranje parametarskih hipoteza0.1. Parametarski testovi
9.1.1. Testiranje hipoteze H0 (p = p) protiv H1 (p 0 i13) kada je disperzija a2poznataTestiranje hipoteze H0 (p = p) protiv H1 (p p3) kada a2 nije poznatoTestiranje hipoteze H0 (p = P2) protiv H1 (p1 P2)
Testiranje hipoteze o disperziji H0 (a2 = a) protiv H1 (a2 > a)9.1.5. Testiranje hipoteze o nepromjenljivosti disperzije9.1.6. Testiranje hipoteze o koeficijentu korelacije H0 (Px,y
tivne H1 (Px,Y 51Z 0)9.2. Neparametarski testovi
9.2.1. Hikvadrat - test9.2.2. Testiranje nezavisnosti9.2.3. Kolmogorov-Smirnovljev test9.2.4. Testiranje jednakosti distribucija
10.Regresija na osnovu uzorka10.1. Metoda najmanjih kvadrata10.2. Opei zadatak regresije na osnovu uzorka10.3. Linearna regresija
10.3.1. Proejene I intervali povjerenja u modelu linearne regresije10.3.2. Testiranje hipoteza o koeficijentu linearne regresije
10.4. Nelinearna regresija10.5. Viestruka linearna regresija
10.5.1. Gauss-Markovljev i fundamentalni teorem10.5.2. Procjene i intervali povjerenja za regresijske parametre
10.6. Viestruka nehnearna regresija
Dodatak A. Osnove komblnatorjkeA.1. PermutacijeA.2. VarijacijeA.3. Kombinacije . . 258
Dodatak B. Statistieke tablice
9.1.2.9.1.3.9.1.4.
=0)
171171175181185186188
195195
199200203204205
206207207213215219
221221223225227235237243246248250
protiv alterna
253254256
263
283Literatura
c-fl
C C-
C
CiD
i
1. Pojam dogadaja I vjerojatnostdogadaja
1.1. Slueajni dogadaji
U mnogiin struënim i znanstvenim istraivanjima izvode se odredeni pokusi ill eksperimenti.Cesto je cilj istraivanja formalizacija odnosa medu objektima istraivanja, a to znaëi i da je sveveéi znaëaj primjene rnatematike u raznim istraivanjima. U pitanju su deterministieki I sluãajnipokusi.
Kod deterministiëkih pokusa ishod pokusa je jednoznaeno odreden uvjetima pokusa.
Na primjer, pratimo slobodan pad predmeta koji je isputen s visine h metara iznad odredenepohe. Zanima nas dogadaj A “da predmet padne na tu plohu u vremenu od 3 do 4 sekunde”.
Kako je vrijeme slobodnog pada odredeno formulom t = gdje je g = 9, 81 rn/s2ubrzanje tee pri slobodnom padu, to ée dogadaj A nastupiti samo ako visina h ispunjava uvjet3 < < 411144,145 rn < h < 78,48 rn. Na primjer, u sluëaju visine h = 5Dm vrijemeslobodnog pada predmeta je t = 3, 193 s. Daide, vrijeme slobodnog pada ovisi iskljueivo o visinih.
Ako umjesto slobodnog pada promatramo pad nekog predmeta u nekoj sredini (no u vakuumu) onda ishod pokusa nije determiniran samo visinom h. U pitanju su i drugi uvjeti kojiutjeeu na ishod pokusa (na primjer, obik I teina predmeta, otpor sredine, utjecaj vjetra) pa jeishod pokusa slueajan.
Navedimo jo jedan primjer. Promatramo gibauje toeke p0 odredenom pravcu brzinomv (t) = at2 (funkcija vremena t), gdje je a > 0 parametar. Zanima nas dogadaj A da srednjabrzina v3,. gibanja toëke u prvih 30 sekundi bude izmedu 90 rn/s i 120 rn/s°.
T 30 30Imamo: v37 = + = 4J’v (0 dt = f at2dt =
-
. I = 300a rn/s , gdje je I predeni put u0 0 0
vremenu T. Na osnovi uvjeta pokusa, treba biti 90 < 300a < 120, tj. 0,3 < a < 0,4. Prematome, dogadaj A nastupit ée samo ako parametar a ispunjava uvjet 0, 3 < a < 0, 4. U ovompokusu ishod pokusa potpuno je determiniran izborom parametra a.
Ako umjesto toeke promatramo gibanje nekog predmeta, onda ishod pokusa nije determiniransamo veliëinom a, jer tada djeluju i drugi uvjeti koji ntjeëu na ishod pokusa koje nismo u stanjudeterminirano iskazati (na primjer, djelovanje otpora sredine i vjetra). U ovom sluëaju ishodpokusa je slueajan, a Sam pokus nazivamo sluãajnim pokusom. U takvom sluëajnom pokusunismo u stanju toëno predvidjeti kada êe nastupiti dogadaj A.
3
1.1. Sluajni dogadaji
Predmet naeg promatranja bit ée nedeterministieki odnosno sluèajni pokusi, koje Oemokraóe zvati pokusi. To su pokusi aiji ishodi, tj. rezultati nisu jednoznaeno odredeni i ne moguse unaprijed predvidjeti na temeiju uvjeta pokusa. Medutim, ako se takvi pokusi ponavijajudovoljno mnogo puta, dolazi se do odgovarajuáih zakonitosti. Proueavanje tih zakonitosti I jestpredmet teorije vjerojatnosti.
Pod pokusom podrazumijevat éeino tzv. statistieki pokus koji zadovoijava slijedeOe uvjete.(a) Moe se ponavijati proizvoljan broj puta.(b) Unaprijed se definira to se registrira u pokusu i poznati su svi moguéi ishodi.(c) Ishod pojedinaenog pokusa nije unaprijed poznat.
U opisivanju pokusa koristimo skupove. Skup svih moguéih ishoda odredenog pokusa oznaëavat éemo s Q. Elemente skupa Q zvat éemo I toekarna.
nPrimjer 1. Najjednostavniji primjer sluëajnog pokusa jest bacanje novëiéa. Misli se nanovëiá koji je simetrièan i hornogen (geometrijski simetriëan I naëinjen od homogenog materijala).Registrira se pojava pisma (F) iii pojava glave (G). Skup svih moguéih ishoda iii rezultata jeskup
Primjer 2. Kod pokusa bacanje kocke pretpostavimo da je kocka simetriena i homogena, astranice su joj oznaëene s tookama od jedan do est. Registrira se broj koji se pojavi na kocki(na gornjoj strand kocke). Skup moguih ishoda je
= {1,2,3,4,5,6}.
Primjer 3. Uzmimo da se novãió baca dva puta uzastopno (iii bacaju se dva oznaëenanovëiéa). Skup moguCih ishoda fr skup uredenih parova [
gdje prva koordinata u uredenom paru predstavlja ishod u prvom bacanju, a druga ishod udrugoni bacanju.
FTPrimjer 4. Novëié se baca 5 puta uzastopno (iii baca se pet noveiêa) I registnira se koliko . Iise ukupno puta pojavilo pismo. Skup moguéih rezultata je
c2={0,1,2,3,4,o}. [kPrimjer 5. Kocka se baca dva puta uzastopno (ill bacaju se dvije oznaëene kocke). Skup
mogueih ishoda je 9Q—{(i,j):i,j=1,2,...,6}. b
To jeskup uredenih parova (i,j) , i = 1,2,... ,6, j = 1,2,... ,6, gdje prvakoordinata predstavljabroj koji se pojavio u prvom bacanju, a druga broj koji se pojavio u drugom bacanju. Ovaj skup [jima 62 = 36 elernenata (broj varijacija s ponavljanjem drugog razreda od 6 elemenata).
Primjer 6. Proizvode se odredeni artikli sve dok 5€ ne proizvede 100 ispravnih. Registrira Use broj proizvedenih artikala. Za skup moguéih ishoda najjednostavnije je uzetic2={i00,ioi,...}. U
[1
1. Pojam dogadaja i vjerojatnost dogadaja 5
Ustvari, znamo da ée broj proizvedenih artika].a biti konaëan, au ako ga ograniëimo s nekimbrojem n ne moemo biti sigurni da ãe uvjet biti zadovoDen.
Primjer 7. Iz sk1adita se uzimajedan stroj I registrira se njegova duijina trajanja. Za skupsvih moguéih ishoda mote se uzeti vremenski interval [0, T], gdje je 2’ maksimalno vrijeme radanekog stroja, all je jednostavnije uzeti beskonaean interval
12 = [0,oo),
jet 3€ teko reêi koje vrijeme T koje sigurno neOe biti premaeno.
Primjer 8. Na odredenom mjestu i u odredeno vrijeme mjeri se temperatura 2’ i vlanostzraka V (a postocima). Skup moguéih ishoda je skup toeaka
12{(T,V)eR2:Tj�T�T2, OV<iO0}. I
Iz gornjih primjera zapaamo da se svakom sluëajnom pokusu moe pridruiti skup 12 kojireprezentira moguáe ishode tog pokusa.
Rezultate slueajnih pokusa zvat éemo dogadaji. Razlikujemo elementarne (nerazlo±ive)dogadaje 1 sloiene (raz1oive) dogadaje.
Svaki moguéi ishod pokusa zoverno elementarni dogadaj. U svakom pokusu realizira sejedan i samo jedan elementaa-ni dogadaj.
Skup 12 koji sadri sve moguée ishode (elementarne dogadaje) jednog pokusa naziva seprostor elementarnih dogadaja tog pokusa.
Prema danim primjerima, vidino da prostor elernentarnih dogathja 12 moe imati konaeno(Primjeri od 1 do 5) lb beskonaano mnogo elemenata i to prebrojivo (Primjer 6) iii neprebrojivomnogo (Prirnjeri 7 1 8). Za Primjere od 1 do 5 vrijedi da svakom ishodu pokusa odgovara toOnojedan element skupa 12 i obratno, da svâkom elementu skupa 12 odgovara toëno jedan moguéiishod pripadnog pokusa. Ti slueaju Primjera 6, 7 I 8 vrijedi da je svaki ishod pokusa reprezentiranjednim elementom iz 11, au obiatno ne wijedi, tj. svalcom elementu iz 12 ne mora odgovaratimoguéi ishod pokusa.
Za sada éemo promatrati samo slueajeve u kojima je skup moguéih ishoda 12 konaean iiiprebrojiv.
Promatrajmo sada jedan sloen dogadaj. Na primjer, ako je pokus bacanje dva novëiáa, tada“paloje harem jedno pismoU jedogadaj Ito s1oen dogadaj, oznaëimo gas A. U Prirajeru 3 definiran je pripadni prostor elementarnih dogadaja 12 = {(P, F) , (F, C) , (C, F) ,(G, G)}. Dogadaj A“palo je harem jedno pismo” dogodit e se ako i samo ako se dogodi jedan od prva tn elementarnadogadaja od 12, tj. ako se ostvari jedan od ishoda (F, F) iii (F, G) ih (C, F). Tako se ova] s1oendogadaj A razlae na tn elementarna dogadaja i moemo pisati A = {(P, F) , (F, C) , (C, P)}.Zapazirno, dogadaj A je napisan u obliku skupa i to kao podskup pnipadnod prostora elementarnih dogadaja 12. Svaki dogadaj vezan za odredeni pokus je podskup pnipadnog prostoraelementarnih dogadaja 12. Stoga, za dogadaj moemo kratko reel slijedeCe.
1.2. Operace s dogadajima
Dogadaj je podskup prostora elementarnih dogadaja Q.
Prema tome, svaki moguéi dogadaj vezan za odredeni pokus prikazuje se kao skup koji iisadri neke elementarne dogadaje. Nekom dogadaju A pripada odredeni skup moguáih ishoda(elementarnih dogadaja), koji se zovu povoljni ishodi za dogadaj A, jer realizacija bib kojegod tih ishoda povlaëi i realizaciju dogadaja A.
Primjer 9. Kod pokusa bacanja dviju kocki, neka je A dogadaj “zbroj brojeva koji su pailjednak je sedam”. Napisati dogadaj A.
Ad. Dogadaj A moemo prikazati kao skup
Utj. kao skup elemenata koji reprezentiraju sve ishode pokusa ëija realizacija pov1ai i realizacijudogadaja A. Dogadaj Aje podskup prostora elementarnih dogadaja fl koji je definiran u primjeru
Dakie, pod dogadajem podrazumijevamo sluëajni dogadaj koji se pod odredenim uvjetima Pm&e, au ne mora dogoditi. Dogadaje éemo oznaãavati velikim slovima A, B, C,. Neki do- Ugadaj A se realizira ako i samo ako se realizira neki ishodtQjkoji pripada skupu A c Q.
Uz svaki pokus moiemo definirati nemogué i siguran (iii izvjestan) dogadaj. Dogadaj koji sene moe dogoditi u odredenom pokusu naziva se nemogné dogadaj I oznaOava se lcao prazanskup 0. Cijeli prostor Q zovemo siguran dogadaj. To je dogadaj koji se realizira pri svakom _1cizvodenju pokusa.
1.2. Operacije s dogadajima
Definirajmo operacije s dogadajima pomoêu kojili se od danih dogadaja dobivaju novi dogadaji.Buduéi da su dogadaji p0 definiciji skupovi, to su operacije nad dogadajima upravo standardneoperacije nad skupovima.
Pretpostavimo da su svi dogadaji podskupovi istog prostora elementarnih dogadaja ft
Za dogadaj A kaemo da implicira iii povlaei dogadaj B ako je
AB
P(ovdje je ukljuaena i moguénosti A = B), to znaëi da realizacija dogadaja A povlaëi realizacijui dogadaja B, tj. kada god se realizira dogadaj A realizira se i dogadaj B. Iz formalnih raziogasmatrat c5emo da 0 c A, za bib koji dogadaj A. [It
LiPrimjer 10. Baca se kocka i neka je A dogadaj da je pao broj 4, B dogada] da je pao paranbroj i C dogadaj daje pao broj veOi od 3. Napisati dogadaje A, B i C i njihov medusobni odnos.
Ad. Imamo:A={4}, B={2,4,6}, C={4,5,6}.
[1[I
1. Pojam dogadaja I vjerojatnost dogadaja
Odavde vidimo da je A C B, tj. dogadaj A implicira dogadaj B, dok obratno ne vrijedi, tj.realizacija dogadaja B ne povlaëi uvijek realizaciju dogadaja A. Takoder, A C C, dok nije niBCCniCCB.I
Suprotan dogadaj dogadaju A, koji éemo oznaëavati s Ac, je dogadaj koji se relizira ondai samo onda ako se ne realizira dogadaj A i moemo pisati
Dakie, skup AC je komplement skupa A.
Primjer 11. Baca se novëie 2 puta (iii bacaju se dva oznaëena noveiéa) i neka je A dogadajdaje palo pismo Pu oba bacanja. Napisati dogadaje A i AD.
Ad. Skup svih moguéih elementarnih dogadaja je
Dogadaji A i Ac su:
A={(P,P)}, At={(P,G),(G,P)JG,G)}.•
RijeEiti zadatak ako se novëiê baca 3, odnosno 4 puta.
Presjek clogadaja A i B je dogadaj
AflB= {w e :w C A iwC B}
koji se realizira onda I samo onda ako se realiziraju oba dogadaja A i B. Zapis A n B ãita se “AI B”. Za presjek dogadaja A I B koristi se I kraêa oznaka AB.
Presjek konaeno rnnogo dogadaja A1, A2,--- , A, je dogadaj
AlflA2fl---flA={wCQ:wEAk, k=—1,---,n}
koji se realizira onda i samo onda ako se realiziraju svi dogadaji A1, A27--- , A,. Koristimo ikraêu oznaku
k=lkAnalogno se definira presjek prebrojivo mnogo dogadaja A1, A2,--- , A,,-
-AlflA-2fl.--flAfln...(=Ak) ={weQ:wEAk, k=1,2,---}.
Ako je AB = 0, tj. ako se dogadaji A i B ne mogu istovrerneno ostvariti, kaemo da sedogadaji A i B uzajamno iskljuëuju (skupovi A i B su disjunktni). Elementarni dogadajiuzajanmo se iskijuouju, tj. dva elementarna dogadaja ne mogu se dogoditi istovremeno. Za konaëno rnnogo dogadaja A1, A2,... , A, iii prebrojivo mnogo dogadaja A1, A2--- , A,, .. kaemoda se uzajamno iskljueuju ako je A fl A = 0 za i j.
Unija dogadaja A I B je dogadaj
A U B = {w e : w C A ih w C B}
1.2. Operacije s ciogadajima
koji se realizira onda i samo onda ako so realizira harem jedan od dogadaja A I B. Zapis A U Baita se “A iii B”.
Unija konaeno mnogo dogadaja A1, A2,• , A,. je dogadaj
A1UA2u.uA,. (= OAk) ={wEfl:wEAk, zanekik€{1,. nfl
koji so realizira onda i samo onda ako se realizira barem jedan od dogadaja A1, A2, , A,,.Analogno se definira unija prebrojivo mnogo dogadaja A1, A2,••• , A,.,
k_lk = {w C 12: w C Ak, za neki k e N}
Razlika dogadaja A I B je dogadaj nA\B={wecbweAiwØB} S
koji se dogodi ako I samo ako seA dogodi i B ne dogodi. Zapis A\B oita se “A i ne B”. Lako I!je zapaziti da vrijedi: U
A\B = AnBc II,A\B = A,akojeAflB=ø. [I
Dane operacije inogu se grafieki ilustrirati (slika 1.1.).
12
B
A
nLiPLi[1
Slika 1.1. Operacije s dogadajima
Primjer 12. U sluëaju Primjera 10 definirati skupove:
AnB, BuG, B\G, k’nB, (BuG)c, Au(B\C), AU(BUG)C, (BuG)n(NnG) . [I
IJU[1’
1. Pojam dogadaja i vjerojatnost dogadaja
Act. Irnamo:
AflB = {4}, BUG={2,4,5,6}, AcnB={2,6},(BuC)C = {1,3}, Au(BuC)’={1,3,4}, (Buc)n(ACnC)={5,6}.I
Zadatak. Dva lovca neovisno gadaju jedan cilj. Neka je A dogadaj da je prvi lovac pogodiocilj, a B dogadaj da je drugi lovac pogodio cilj. Rijeeima opisati dogadaje:
Ac, BC, AB, ACB, AUB, ACuB, AuBC, AnB, KnB, (AuB)\A, (AuB)nA’.
1.3. Vjerojatnost dogadaja
1.3J. Vjerojatnost a posterioriU jednom pokusu sa slueajnim ishodima ne moemo odredeno reéi 0 realizaciji iii nerealizacijinekog dogadaja A. Medutim, pri ponavijanju tog pokusa veljki broj puta u neizmijenjenimuvjetima primjeáuje se odredena pravilnost (zakonitost) pojave dogadaja A, koja 1ei u osnoviteorije vjerojatnosti i garantira njenu suglasnost sa zakonima objektivne realnosti.
Da bi objasnili u ãemu se sastoji ta pravilnost uvest éemo pojam relativne frekfrencije dogadaja.
Neka se u neizmjenjenim uvjetima ponavija neki pokus n puta sa slueajnim ishodirna i neka seu svakom pokusu dogadaj A moe ostvariti iii neostvariti. Neka se u n—terostrukom ponavijanjupokusa dogadaj A realizira A puta (0 � A <n). Broj A se zove frekvencija (iii uOestalost)dogadaja A. Broj
se zove relativna frekvencija dogathja A u It ponavijanja pokusa.Pri malom broju ponavijanja pokusa relativna frekvencija dogadaja nosi u sebi slueajni karak
ter I moe se znaöajno mije]tjati od jedne do druge serije pokusa. Teorija vjerojatnosti prouëavasamo pokuse koji imaju svojstvo tzv. statistieke stabilnosti relativnih frekvencija. Svojstvostabilnosti relativnih f’rekvencija ogleda se u tome da pri uveéavanju broja ponavijanjapokusa relativna frekvecija sve vie gubi sluèajni karakter i sve vie se grupira oko odredenogbroja.
Tako ns. primjer, kod bacanja novëiéa u velikim serijama relativne frekvencije pojave pismagrupiraju se oko broja
.Kod pokusa bacanja simetriene kocke n puta i praéenje, na primjer,
pojave broja 5 us kocki, relativne frekvencije se grupiraju oko broja.
Takojo nemamo definiran pojam vjerojatnosti, mnogi ée bez razmi1janja reôi da je vjerojat—nost dogadaja da ée novëiO pasti na pismo jednaka , te da je vjerojatnost dogadaja da ée kockapasti na broj 5 jednaka
.Ovdje se podsvjesno pod vjerojatnoéu odgovarajuóeg ishoda pokusa
smatra broj koji iskazuje mjeru (ocjenu) moguOnosti realizacije tog ishoda prilikom vrenja pripadnog pokusa. Vjerojatnost dogadaja A oznaãavat Oemo s P (A) (slovo P dolazi od rijeëiprobability-vjerojatnost).
Broj kojem tei relativna frekvencija dogadaja A kada se broj pokusa n neograniëenouveóava je vjerojatnost dogadaja A, tj.
P (A) = urnn—*Qo
1.3. Vjerojatnost dogadaja
Ovbnije matematiëkadefinicija vjerojatnosti. Toje tzv; kiasienadefinicija vjerojatnostia posteriori iii statistiëka definicija vjerojatnosti. Prema ovoj definiciji slijedi:
n
i aproksimacija je to boija to je broj ponavijanja n veôe.Kako je 0 � A � n, to je 0 � � 1, odnosno
0<F(A) <L (Li)
Daije, iz nrj = 0 i nç = n slijedi
P(ø)=0, P(Q)=1.
Nadalje, ako su A i B uzajamno iskljueivi dogadaji, tada je
ThAUB=flA+ThB,
P1?2AUBThA±flBflAflB U
to znaëi da jeP(AuB)=F(A)+P(B).
1.3.2. Vjerojatnost dogadaja pri jednalco moguéim ishodlina
Teorija vjerojatnosti daje pravila kako se polazeéi od jednih vjerojatnosti izraëunavaju drugevjerojatnosti. Dok polazne vjerojatnosti mogu biti rezultat naih uvjerenja u simetriju ishodapokusa kojeg promatramo. 11U
Primjer 13. Promatrajmo pokus bacanja novëiéa i odgovorimo na pitanje: Kolika je vjerojatnost da se pojavi pismo, a kolika da se pojavi glava?
Ad. Ovaj pokus ima dva jednako moguéa elementarna ishoda: palo je pismo (P) i pala jeglava (G). Ishodi su jednako moguéi jer se podrazumijeva da se radi o simetriënorn novãiéu panema razioga da jednom od tih ishoda dajemo prednost. Izgledi za pismo I glavu su isti, tj. 50%,pa moemo pisati
F(P)=F(G)=z
Primjer 14. U sluëaju pokusa bacanjajedne kocke, kolike su vjerojatnosti moguóih elementasnih dogadaja?
Ad. Skup svih moguêih ishodapokusa, tj. prostor elementarnih dogadajaje 12 = {1, 2,.. . , 6}.Radi Se o simetriOnoj kocki pa pojava bib kojeg od est moguoih ishoda nije u prednosti premaostalima. Prema tome, svaki elementarni dogadaj ima jednaku moguénost da se dogodi, pamoemo uzeti da je vjerojatnost svakog od est moguôih elementarnih dogadaja. Dakie, radise o elementarnim dogadajima koji su jednako moguéi, tj. jednako vjerojatni. •
SNeka pokus ma konaeno mnogo ishoda 12 = {wj,w2, . .. ,w,}. Pretpostavimo da en sd iiielementarni dogadaji w1, w2,. . . ,w,., jednako vjerojatni:
11UIii
1. Pojam dogadaja i vjerojatnost dogadaja 11
Kako su elementarni dogadaji uzajamno iskljueivi i kako je siguran dogadaj
to jeP(Q)=P(wj)+P(w2)+...+P(w)=nP(wk)=1 i
k=1,2,...,n.
Svaki dogadaj A, vezan za ovaj pokus, jednak je uniji elementarnih dogadaja kojima jeodreden:
A=WkUWk2U••UWkmgdje je Wk neki elementarni dogadaj. Obieno se kae da au , - . . W povoljni elementarnidogadaji za dogadaj A, jer realizacija bib kojeg od njih povlaei i realizaciju dogadaja A. Sadaje vjerojatnost dogadaja A
P(A)P(Wk3+P(Wk2)+.+P(Wk)_ .
Tako moemo dati slijedeéi zakljueak, poznat kao klasiëna definicija vjerojatnosti a priori.
Vjerojatnost dogadaja A, u sluáaju konaeno mnogo jednako moguéih ishoda, je
gdje m predstavlja broj povoljnih ishoda za dogadaj A, a n bro] svih moguéih ishodapripadnog pokusa.
Pri upotrebi ove definicije treba utvrditi da su elementarni dogadaji jednako moguói. Ovakvesluajeve uglavnom éenio i koristiti, a za odredivanje brojeva m I n osnovrni ulogu ima kombinatorika.
Primjer 15. Bacaju se dvije oznaëene kocke. Neka je A dogadaj da je pao zbroj 7. Odredivjerojatnost dogadaja A.
Ad. Broj svih mogudih ishoda pokusa je m = 36, a broj povoljnih ishoda za dogadaj A jem = 6 (vidi Priinjer 9). Elernentarni dogadaji su jednako vjerojatni, jet se podrazumijeva da sukocke idealno simetriëne, pa je
Primjer 16. U kutiji se nalazi 20 sijalica od kojih je 5 neispravnih. Iz kutije se izvlaei jednasijalica. Odrediti vjerojatnost dogadaja da je izvuëena sijalica: a) ispravna, b) neispravna.
Ad. Broj svih moguOih jednako vjerojatnih ishoda je ii = 20, jer se mote izvudi bib kojasijalica s istom vjerojatnoéu. Broj povoljnih ishoda je: a) m = 15, jer je u kutiji 15 ispravnih atjalica i dogadaj je realiziran ako se izvuëe bib koja od njih; b) m = 5,jerje 5 sijalica neispravnih.Neka je A dogadaj definiran pod a), a B dogadaj definiran pod b). Traene vjerojatnosti su
415 3 5 1P(n)—20—4, P(B)—20-—4.
1.3. Vjerojatnost dogadaja
Primjer 17. Bacaju se dva novëióa. Neka je A dogadaj da se pojavi pismo barem jedanput. Odrediti vjerojatnost dogadaja A.
Ad. Skup svih moguéib ishoda 0 i skup povoljnih ishoda za dogadaj A su:
=
A = {(P,P),(P,G),(G,P)}. [7Svi su elementarni dogadaji jednako vjerojatni pa je P (A) = .
Primjer 18. U kutiji se nalazi m bijelih i ii crnih kuglica. Iz kutije je izvuöeno p kuglicaod kojih je q bijelih. Zatim se izvlaei jo jedna kughca. Odredi vjerojatnost da je ta kuglica: a)bijela, b) crna.
Ad. Nekaje A dogadaj definiran pod a), a B dogadaj definiran pod b). Traene vjerojatnosti
m-q, P(B)=.
m+n—p m+n—p
1.3.3. Geometrijske vjerojatnosti
Ako je skup moguéih ishoda 0 beskonaean, vjerojatnosti dogadaja ne inogu se odrediti po formuliza vjerojatnost jednako moguéih ishoda. U slueajevima u kojima se skup moguéih ishoda 0mote prikazati kao ograniäen skup na pravcu, u ravnini iii u prostoru (vidi sliku 1.2.) mote seprimijeniti slijedeée pravilo geometrijske vjerojatnosti. U
[1!.Neka je A C 0 i neka su j.t (A) i z (0) mjere (duijine, povrine ih volumeni) skupa A, Uodnosno 0. Vjerojatnost dogadaja A da nasumice odabrana toeka iz 0 pripada A je
Ova definicija pretposta-vlja da znamo umjeritiI promatrane skupove i vrijedi da dva dogadajaA, B C 0 koji imaju iste mjere imaju iste i vjerojatnosti.
[1L1
[1U
Slika 1.2.
nU[I
1. Pojam dogadaja i vjerojatnost dogadaja 13
Primjer 19. Kolika je vjerojatnost da nasurnice odabran broj iz segnienta [0, 1] bude: a)broj , b) broj koji pripada segmentu [, ).
Ad. Ovdje je Q = [0,1]. Neka je A = {} c [0,1), tj. skup A je saãinjen od jedne toekeu segmentu [0,1], i neka je B = [, ] c [0, 1]. Kako je mjera (duijina) toeke jednaka nuli, tj.p(A) = 0, te 1t(B) = i 1L(O) = 1, toje:
a) P(A) =(Q) I,o 1
b) P(B) —___
4Q) 1 6
Zanimijivo jo primijetiti da, iako dogadaj A nije nemogué njegova vjerojatnost jednaka jenuli. Takoder, moe so pokazati da dogathj da nasumice odabran broj iz segmenta [0, 11 buderacionalan broj ma vjerojatnost jednaku null (vidi [3]). Ovaj dogadaj moe se realizirati S
beskonaeno mnogo elementarnih dogadaja, a njegova vjerojatnost ipak je jednaka nu]i.
Primjer 20. Neka se dva viaka duljine p0 150 m kreêu brzinom 15 rn/s po prugarna kojese medusobno ukrtaju. Neka je je njihov prolaz kroz raskrée slueajan, izmedu 10 sati i 10 satii 20 minuta. Kohka je vjerojatnost da ée se vlakovi sudariti?
Ad. Neka su x odnosno y trenuci ulaska prvog odnosno drugog vlaka u raskr6e. Kako je 20minuta jednako 1200 sek-undi, to za prostor elementarnih dogadaja uzimamo skup
sky
1200i-i
10olO 1200 X
Slika 1.3.
Q = {(x,y) €2 :0< x <1200, 0 � y � 1200}.
Prolaz kroz raskr6e svakog viaka traje p0 10 sekundi. Treba odrediti vjerojatnost dogadaja
A = {(x,y) C : — vI < l0}.
Imamo (vidi sliku 1.3.):
t (A) = 12002 — 11902 = 23900, t (12) = 12002 = 1440000
1.3. Vjerojatnost dogadaja
PA ,u(A) 23900 —0017p(Q)Th440000
Primjer 21. Nasumice biramo broj x iz segrnenta [1,2] i broj yiz segmenta [0, 2j. Kolikajevjerojatnost da je xy > ii x + y < 3 ?
Ad. Za skup elementarnih dogadaja imamo:
L
SadajeA={(x,y)efl:xy>1, x+y<3}.
Slijedi (vidi sliku 1.4.): 1c(Q) = 2 i
(A) =fdxfdy
=
Q_ = —1n2,
pa je traSena vjerojatnost pP(A) =(3—1n4) =0,403.
pLi
ny=3—x [2-
U1
U0 1 2 3 X
USlika 1.4.
1.3.4. Vjerojatnosni prostor
Kako smo vidjeli, u slueaju kada skup elementarnih dogadaja Q ima konaeno mnogo eleme- [Inata, tada nakon definiranja vjerojatnostj elementarnih dogadaja moguóe je odrediti vjerojatnostsvakog podskupa skupa ft U sluëaju prebrojivo beskonaenog skupa Q konstr.ukcija (definicija)vjerojatnosti je identièna samo to se umjesto konaenih suma mogu pojaviti redovi. Na nepre- pbrojivo beskonaenjin skapovima vjerojatnost se odreduje obieno tako da definiramo vjerojatnostna nekim “znaëajnim” skupovima, a zatim proirimo definiciju (koristeói svojstva vjerojatnosti)na dovoljno iroku (za primjene) familiju skupova (najaeee ne na sve podskupove 12). 1]•
[I
1. Pojam doga6aja I vjerojatnost dogadaja 15
Da bismo dali aksiomatsku definiciju vjerojatnosti us Q, trebamo definirati neku familijupodskupovaodI2koja óe predstavljati familiju dogadaja.
Sa PQ) oznaëimJ’àrtitiviü skup od ft To je skup svih podskupova skupa 12 u koji spadaprazan skup i sam skup ft
Definicija. Familija F podskupova skupa 12 naziva se a—algebra skupova na 12 ako je(Fl)(F2)(F3) AjcF,ieN=AcF.
Svojstva (P2) i (Pa) moemo iskazati I kac zatvorenost familije F u odnosu na komplementiranje i na prebrojive unije. Iz definicije slijedi da ako je F c—algebra na 12, tada vrijedi:
12 =‘C
A c F, ieNA=ftA EF,\t1 J
A,B C F==A\B=AnBCeF,
to znaëi da je F zatvorena i u odnosu na prebrojive presjeke i skupovne razlike.Najjednostavniji primjer c—algebre na 12 je skup {ø, Q} koji ima samo dva elementa. Par
titivni skup P (12) je takoder prinjer u—algebre na 12 i vrijedI F C 2(0), gdje je F bib kojau—algebra na 12. Takoder, familija F svih podskupova od 12 koji su prebrojivi iii imaju prebrojivekomplemente j e c—algebra.
Ureden par (12, F), gdje 1€ F c—algebra, zove se izmjeriv prostor. Elemeriti c—algebra Fzovu se dogadaji.
Sada moemo dati aksiomatsku definiciju vjerojatnosti na 12, odnosno na F.
Deflnicija. Neka je (12, F) izmjeriv prostor. Funkcija P F —, JR je vjerojatnost(na F, odnosno ria 12) ako je(P1) P(A)�O zasvakidogadajAeF, P(c2)=i;
(P2) AcF, ieN i AiflAi=ØzaiØiP(Ai) = ZP(A).i—i i=I
Uredena trojka (12, F, P) gdje je F u—algebra na 12 1 P vjerojatnost na F, zove sevjerojatnosnj prostor.
Na osnovu definicije vjerojatnosti, vrijede slijedeOa svojstva vjerojatnosti.
1.1 Vjerojatnost dogacSaja p
Osnovna svojstva vjerojatnosti. Neka je (0, F, F) vjerojatnosni prostor i neka suA,B,A12• ,A,••• CF. Tadavrijedi:(Si) P(ø)=0,(82) p( 4) = P(4), ako su A1,•• ,A medusobno disjunktni,
21 i=1(S3) P (AC) = 1 — P (A), (vjerojatnost suprotnog dogadaja AC)
(S4) AcBF(A)�P(B),(So) 0�F(A)�i,(86) P(A\B)=P(A)—P(AnB),(57) P(AUB)=P(A)+P(B)—P(AnB),(S8) AicA2cA3c• I A= A=P(A)= lirnP(A),
m=1 fl—OO
AiDA2DA3D..iA=A=P(A)=1imP(A).72=1 n—cc
Pojasnimo toënost ovib tvrdnji (vidi I siiku 1.5.).
(Si) Iz 0=QuøuØu••. i(S2) slijedi 1= 1-j-F(O)+P(Ø)+... , pajeP(ø) =0.
(S2) Slijedi iz (Si) i (P2) za 4 = 0, i > n.
i P(A9=1P(A). [:(S4)AcBB=Au(ACnB) i P(B)=F(A)+P(A”nB)>P(A).
(Sb) Slijedi iz A c 0, (84) 1 (P1). U
(S6) A = (A\.B) u (A n B) i (A\B) n (A n B) = 0 = P (A) = P (A\B) + P (A n B).
(S7) Iz B = (An B) U (B\A) slijedi P (B\A) = P (B) — P (An B).Sada, iz Au B = Au (B\A) slijediP(AUB)=P(A)+P(B\A)=F(A)+F(B)-F(AnB).
Moe se pokazati do. vrijedi i slijedeée poopéenje poznato kao Sylvesterova formula:U
P(AnA)+ Z P(AinAjnAk)_..._Hi)Th+1PQli=1 ij<k<n
gdje su 4 C F, i 1, 2, , n. Dokaz se moe provesti indukcijoni po n. Tako za tn dogadajaA,B,CcFvnijedi:
UP(AuBuQ)=PM)+P(B)+P(c).PMnB)_P(Anc)_P(Bnc)+p(AnBnc).
Takoder, moe se pokazati da vrijede i svojstva (S8) i (59) (vidi [5] str. 15). Svojstvo (S8) U’izraava neprekidnost vjerojatnosti u odnosu na rastuái niz dogadaja, a svojstvo (S9) izraavaneprekidnost vjerojatnosti u odnosu no. padajuéi niz dogadaja.
[-iiLiS
1. Pojam dogadaja I vjerojatnost dogadaja 17
B
B\AA
AnBA\B
Slika 1.5.
1.3.5. Diskretni vjerojatnQsni prostor
U s1uaju kada je skup 12 (prostor elernentarnih dogadaja) konaean ill prebrojiv, tj. 12 =
{w1,w2,-•• ,w} iii 12 = {wi,w2, - }, dovoljno je prornatrati vjerojatnosti koje su definiranena paTtitivnom skupu 73 (12), definiranjem nenegativnih vrijednosti
p=P(w) zasvakii,
takvih da je=1.
Vjerojatnost proizvoljnog dogadaja A C 12 (A C P (12)) definiramo na naëin
P(A) = . (1.2)w€A
Zapazimo da vrijedi svojstvo (P1)
P(rn= Zrt=Zn=1.wiEn
Takoder vrijedi 1 (P2) pa je stoga funkcija F 2(0) —. [0,11 vjerojatnost na 12.
Vjerojatnosni prostor (12,73(0), P) zo-verno diskretni vjerojatnosni prostor.Ako skup £2 ima ii elemenata, taj vjerojatnosni prostor je n—dimenzionalni, a U slueajukada je slcup 12 prebrojiv, zovemo ga prebrojiv diskretni vjerojatnosni prostor.
Ako skup 12 ima n eleinenata, onda partitivni skup 7) (0) ima 2 elemenata. Tako, naprimjer, u slueaju pokusa bacanja para kocki skup moguOih ishoda 12 ima 36 elemenata, apripadni partitivni skup 2(12) ima 236 = 68719476740 elemenata, to predstavlja broj svihmoguéih dogadaja vezanih za pokus bacanja para kocki.
Prirnjer 22. Pokus se sastoji u uzastopnom bacanju jednog noveiéa. Neka je ishod polcusabroj bacanja tog novëiOa do prvog nastupa “pisma”. Odrediti pripadni vjerojatnosni prostor.
1.3. Vjerojatnost dogaclaja
Ad. Skup 12 elementarnih dogadaja je
Za a—algebni dogadaja moemo uzeti F = V (N), a vjerojatnost P F —+ [0, 1) definirajrnotako da elementarnim dogadajima {k} C F, Ic = 1, 2, .. pridruimo vjerojatnosti
Pk = F({k}) =, (1.3)
jeT je {k} dogadaj da se u prvih Ic — 1 bacanja novëiba pojavi glava a zatim u k—om bacanjupojavi pismo. Dogadaji {k} C F, Ic = 1,2,--- medusobno se iskijuouju 12 i vrijedi
ZPk=Z=1.
Za svaki dogadaj A = {w1,w2,- ..} CF (Ac U), gdjeje w EN, w1 <w2 < , vrijedi
1 1 (1.4)U
Prema tome, promatranom pokusu odgovara vjerojatnosni prostor (N, P (N) , F), gdje je vjerojatnost P definirana s (1.3) odnosno (1.4).
Promatrajmo sada dva zanimijiva niza dogadaja. LPrvo, promatrajino niz dogadaja A, n = 0, 1, 2,--- , gdje A oziiaiava dogadaj da je pismo
nastupilo nakon n—tog bacanja novëiéa. Imamo:
= {n+1}u{n+2}U---A0 =
to znaãi da je A, n = 0, 1,2,--- , padajuei niz dogadaja i urn A = 0 (nernoguO dogadaj).71—+00
Nadaije, prerna (1.3), vrijedi:
1 1 1.P(ATh) =++-= ‘
1irnP(A) = 1irn-=0,n—’oo n—*oo2fl
to je u skiadu sa (S9): P ( A) = urn P(A). nn=1 n—.oo
Sada, promatrajmo niz dogadaja B, n = 1,2,-. , gdje B,-, oznaëava dogadaj da je pismonastupilo prije n—tog bacanja novOiéa. Ovdje imamo:
p= {l}U{2)U..-U{n—1} i
B1 = øcB2cB3c---to znaei sa je B, n = 1,2,--- rastuéi niz dogadaja i limB, = N = 12 (siguran dogadaj). [1Sada, prema (1.3), vrijedi:
P(B) = j
urn P(B) = urn (‘i——s—-- , nn—’oo n—’ ç 2m_1
1. Pojam dogadaja i vjerojatriost dogadaja 19
to je upravo p = p (12) kao u (S8).
1.3.6. Slueaj neprebrojivog skupa 12
Najzanimljiviji je slueaj kada je 12 = JR. Ovdje Se vjerojatnost definira na otvorenim intervalirna (a, 6) a zatim, primjenom svojstava vjerojatnosti, defmuicija se proiruje na sve skupoveiz najmanje a—algebre koja sadri sve otvorene intervale. Najmanja u—algebra postoji, ona jejedinstvena i jednaka je presjeku svih u—algebri podskupova od 12, koje sadr2e sve otvoreneintervale.
Definicija. Najmanju u—algebru B koja sadri sve otvorene intervale (a, b) C JRzovemo Borelcwa u—algebra, a elemente u—algebre 13 zovemo Borelovi skupovi.
Ustvari, svaki skup A koji se moe dobiti pomoOu prebrojivo mnogo skupovnih operacija jeBorelov skup. Tako iz
(abJ=(a.b+i) [ab)=(a_b) a<b,a,bER
sJijedi da su i intervali oblika (a, bJ i [a, b) Borelovi skupovi. Takoder, i neograniëeni intervali suBorelovi skupovi, jer se mogu prikazati kao prebrojive unije ogranieenih intervala.
Stoga, umjesto intervala (a, 6) u definiciji Borebve u—algebre moemo uzeti I intervae jednogod slijedeéih oblika:
(a, 6], [a, 6), [a,b] , (—cc, b) , (—cc, 6], [a, +oo), (a, +oc)
Buduei jecc / 1 iN
{a}=z fl a——,a+—),n1\ Ii Il,!
to je i svaki jednoalani skup {a}, a e IR, Borelov skup. Prema tome, Borelovi skupovi su iprebrojivi podskupovi od JR. Tako je skup svih racionalnih brojeva Borelov skup, a takoder Iskup iracionalnih brojeva, kao njegov komplement, je Borelov skup. Ipak, moe se pokazati dana JR postoje skupovi koji nisu Borelovi, to znaãi da je B 0 2 (JR)
Prirnjer 23. Neka je na intervalima oblika (—cc, x], x e R, definirana vjerojatnost
= { 1Hex,
Ovim je definirana jedna vjerojatnost na Borelovoj u—algebri B. Na osnocu svojstava vjerojatnosti, mogu se dobiti vjerojatnosti na pojedinim Borelovim skupovima. Na primjer, odreditéemoP((a,b))zaa,5>Q.
Prvo zapazimo da je
P({a}) = Urn (p ((-cca+]) - p ((-cc,a -
1.4. Uvjetna vjerojatnost i nezavisriost dogadaja
Sada za a > 0 vrijedi
P ({a}) = urn (e() - e()) =n—*cc
P ((a, 6)) = P ((- 61)- P ({6)) - P ((-, al) = P ((— 61) -
‘((- ai)
= (ifr6) - (ie-a)=
(e-j.
1.4. Uvjetna vjerojatnost i nezavisnost dogadaja
U pokusu bacanja kocke vjerojatnost pojave broja pet je . Medutim, ako je poznato da je kockapala na neparan broj, tada vjerojatnost pojave broja pet je , jet uvjet da se veé pojavia neparanbroj ukazuje na tn moguéa ishoda, a to su tn broja 1, 3 iii 5.
Neka su A i B odredeni dogadaji. Vjerojatnost dogadaja B pod uvjetorn da se prethodnodogodio dogadaj A nazivamo vjerojatnost od B uz uvjet da se A dogodio iii krae, vjerojatnost od B uz uvjet A I piemo P (BIA). U navedenom primjeru B je dogadaj “pao jebroj pet”, a A je dogadaj ‘pao je neparan broj”. Ukoliko znamo da se dogadaj A dogodio, tadaje skup Q sveden na A, a elementarni dogadaji povoljni za B su sada elementarni dogadaji Upresjeku AflB.
Neka su A, AB brojevi koji oznaëavaju koliko su se puta u n—terostrukom ponavijanju pokusa realizirali, nespektivno, dogadaji A, B i An B. Tada je (mA > 0) relativnafrekvencija dogadaja B u pokusima u kojima se realizirao dogadaj A. Kako je
mADmA
—-t
to je prirodno dati slijedeéu definiciju.
Lj.Definicija. Neka su dogadaji A, B e F i P (A) > 0. Uvjetna vjerojatnostdogadaja B pod uvjetom da se (prethodno) dogodio dogadaj A defluira se Icao U
P(BIA) P(AflB)
fli
Primjetjmo da vnijedi:p
P(BIB) = LidAnB = ø=P(B(A)=0.
Iz definicije i ma osnovu komutativnosti presjeka dogadaja, tj. A n B = B n A, vjerojatnost Upresjeka dva dogadaja je:
UP(AnB)=P(A).F(BIA) ih P(AnB)=PçB)-P(AB). [I
U
1. Pojam doga6aja I vjerojatnost dogadaja 21
Opéenito vrijedi:
P(Ain...nA)=P(Ai)P(A2JA1)P(AaAinA2)...P(AIAinA2n...nA0_i)
Jedan od osnovnih pojmova teorije vjerojatnosti i matematieke statistike je nezavisnost.Prirodno se nameóe sljedeéa definicija. Dogadaj B nezavisan je od dogadaja A (u smislu teorijevjerojatnosti) ako je
P (BA) = P (B)
Ako je dogadaj B nezavisan od dogadaja A, tada je:
P(AnB)P(A).P(BA)P(A).P(B) A(AJB)= P(B)—
P(B)-
F(B)-
a to znaëi da je i dogadaj A nezavisan od dogadaja B.
Definicija. Neka je (ft F, F) vjerojatnosni prostor i neka su A, B C F.Dogadaji A i B su nezavisni ako je
P (An B) = P (A) P (B)
Iz ove definicije slijedi da je svaki dogadaj A C F za koji je P (A) = 0 nezavisan od svakogdogadaja B e F, jer jeAn B C A, pa je i P (An B) = 0.
Iz nezavisnosti dogadaja A i B slijedi nezavisnost i dogadaja A i BC, kac i AC i B, te A’ i BC.Pojam nezavisnosti moe se proiriti i na familiju dogadaja.
Definicija. Neka je A c F, i c I C N, proizvoljna familija dogadaja. Kaemo da je tofamilija nezavisnih dogadaja ako za proizvoljnu k—torku dogadaja A1 , A2, - .. ,Avrijedi
P(A,nAj2n...nA1j= P(AjP(A12)...P(A)
Praktiëno se nezavisnost dogadaja najeée ne utvrduje po definiciji nego iz uvjeta danogpokusa.
Primjer 24. U kutiji se nalazi 21 bijela i 10 crnih kuglica. Iz kutije se izvlaöe dvije kuglicejedna za drugorn, bez vraéanja prve kuglice u kutiju. Kolika je vjerojatnost dogadaja daje drugaizvuëena kuglica bijela ako se zna da je prva izvuëena kuglica bijela.
Ad. Neka je A dogadaj da je prva izvuëena kuglica bijela, a B dogadaj da je druga izvuëenakuglica bijela. Treba odrediti uvjetnu vjerojatnost dogadaja B pod uvjetom da je prethodnorealiziran dogadaj A. Imarno:
P(BIA)==[Prinjer 25. Izvodimo pokus bacanja para kocki i neka su dogadaji:
A = {na prvoj kocki je 2, 3 iii 4}, B = {na drugoj kocki je 4, 5 iii 6),
22 1.5. Formula potpune vjerojatnosti Bayesova formula
C = {zbroj brojeva na obje kocke je 1O}. Definiraj vjerojatnosni prostor I ispitaj nezavisnostdogadaja A, B i C.
Ad. Vjerojatnosni prostor je (12, P (12) , P), gdje je
i P({w}) =, i,j = 1,2,. ,6.
Skup 12 ima 36 elemenata (elementarnih dogadaja), pa skup P (12) ima 236 elemenata (dogadaj a),A, B, C C 12, odnosno A, B, C c 2(12). Dogadaji A i B imaju po 18 povoljnih ishoda, dok jeC = {(4, 6), (5,5), (6, 4)}. Nadaije, irnamo:
P(AflB) =
P(A.flC) =
P(BnC)=
P(AnBnC)
Slijedi, dogadaji A i B su nezavisni, dok dogadaji A i C, kao i B I C, nisu nezavisni.
Primjer 26. Od pet kljuaeva samo jedan otvara vrata. Odrediti vjerojatnost dogadaja dasu potrebna tn pokuaja da se vfata otvore.
Ad. Neka je A dogadaj da êe se vrata otvoriti u i—tom pokuaju (i = 1,2, , 5), a Asuprotan dogadaj i neka je B dogadaj da su potrebna tn pokuaja da se vrata otvore. Imamo:
B = AnAnA3 I
P(B) =
1.5. Formula potpune vjerojatnosti I Bayesova formula pLi
Definicija. Neka Jo (12, F, F) vjerojatnosni prostor. Za konaonu iii prebrojivu familiju ridogadaja H€ c F, i E I C N, kaemo da elni potpun sistem dogadaja ako IiiHy&Øzasvakj i, HflH=Øzaij[IiU
Neka je A e F proizvoljan dogadaj. Dakie, A c H1 U H2 U.. pa je (vidi sliku 1.6.)
A—(H1nA)U(H2nA)u...=u(HnA) , (1.5) hto znai da dogadaj A moe nastupiti zajedno s jednim iii vie dogadaja H .
[Cakoje iiP(HnA)=P(Hj)P(AIH),
I kako su H, uzajanmo iskljueivi, to iz (1.5) slijedi slijedeea tvrdnja.
pU
1. Pojam dogaeaja I vjerojatnost doga&aja 23
H2flA
Hi n A
Hi ‘12
Slika 1.6.
Neka je H c F, i C I c N, potpun sistem dogadaja.Tada za prizvoljni dogadaj A € F vrijedi formula potpune vjerojatnosti:
F(A)=LP(Hj)P(AIHj).
U primjenarna dogadaje H potpunog sistema dogadaja zovemo hipoteze. Hipoteze se uzajamno iskljuãuju, a toäno jedna od njih mora se dogoditi.
Sada nas zanima uvjetna vjerojatnost hipoteze H znajuôi (iii pretpostavljajuêi) da se dogadajA dogodio, tj. zanima nas P (HIA). Prema gornjem, lako je zapaziti da vrijedi slijedeóa tvrdnja.
Neka dogadaji H e F, i C I C N, ëine potpun sistem hipoteza u vjerojatnosnomprostoru (S2, F, F) i neka je dogadaj A c F i P (A) > 0. Tada, za svaki i, vrijedislijedeéa Bayesova formula:
P”H A P(HflA)\ I — P(A) — ZP(Hk)P(AIHk)
k
Bayesova formula naziva 5€ jo i formula vjerojatnosti hipoteza (iii uzroka), jer na H1, H2,moemo gledati kao na razlieite uzroke koji mogu dovesti do realizacije dogadaja A. Ako se pakdogadaj A realizirao, interesira nas kolika je vjerojatnost da je u pitanju neki odredeni uzrok H,tj. koliko je F (HIA). (T. Bayes, 1702-1763, engleski matematitar.)
Primjer 27. Sijalica moe pripadati trima raznim serij ama 81, 82, 53, pri ëemu je p = 0, 25,P2 = 0,50, pa = 0,25 vjerojatnost da sijalica pripada 81, 82 odnosno S seriji. Vjerojatnost ciaée sijalica iz prve serije sijati 1000 sati je 0,1, za drugu seriju 0,2, a za treéu 0,4.
a) Odrediti vjerojatnost dogadaja da ée slueajno izabrana sijalica sijati 1000 sati.b) Ako je poznato da je sijalica sijala 1000 sati odrediti vjerojatriost dogadaja da je ona iz
treóe serije.
24 1.5. Formula potpune vjerojatnosti I Bayesova formula [7?
Ad. Neka je H1 hipoteza (pretpostavka) da sijalica pripada prvoj seriji, 112 drugoj seriji iFf treéoj. Neka je A dogadaj da je slueajno uzeta sijahca sijala 1000 sail. Dogadaj A noemonapisati kao:
A=(HinAju(H2nA)u(H3nA)Sada treba odrediti P (A) I P (Hs IA) . Imamo:
P(A) = P(RInAH-F(H2nM+P(H3nA)== P(Hi)P(AIH1) +P(H2)P(AjH2) + P(Hs)F(AIH3) =
= 0,25.0i+0,50.0,2+0,25.0,4=0,025--0,100+0,10Q=0,225, p.P A P(Hs)P(AIH3) 0,1
—1 4(H3I )_
P(A) 0,2252259
n.Primjer 28. Na ispit je izi1o 70% studenata koji poIau prvi put i 30% ostalih studenata. U
Neka je vjerojatnost da ée student koji prvi put po1ae po1oiti ispit iznosi 0.5, a za studentekoji su ispit i ranije polagali vjerojatnost je 0.4. a) Odrediti vjerojatnost da ée slueajno izabranistudent po1oiti ispit. b) Ako je sluOajno izabrani student poloio ispit, odrediti vjerojatnost da Uje student iz skupine studenata koji su veé polagali ispit.
Ad. Nekaje A dogadaj daje student po1oio i AC suprotan dogathj. Potpun sistem hipotezau odnosu na dogadaj A áini hipoteza Hj: student polaie prvi put i H2 : student ne po1ae prviput. Iz uvjeta zadatka slijedi
lr?P(Hi)=0,7, P(H2)=0,3, P(AIH1)=0,5, P(A]H2)=0,4. U
Primjenom formule potpune vjerojatnosti i Bayesove formule nalazirno UP(A) = P(H1nA)+P(H2nA)=P(H1)F(AJH1)+P(H2)P(AIH2) P
= O,7•0,5+0,3•0,4=0,47 , I
p..U
P(A) 0,47 0,47
U[j?[I1[J!
U1!
2. Sluëajne varijable i distribucije
2.1. Pojam sluèajne varijable
Pri praéenju odredenog pokusa zanimamo se za neko obi1jeje iii brojevnu karakteristikuX. Na primjer, testiramo ispravnost tn uredaja i zanima nas broj X ispravnih uredaja. Svakislueajni ishod nekog pokusa moguée je izraziti nekim realnim brojem. Tada se sluëajni ishodi togpokusa mogu opisati pomoéu varijable X, koju zovemo slueajna vanijabla iii sluäajna velieina.Neka je iE skup svih moguéih ishoda (skup svih elenxentarnih dogadaj a) ‘vezanih za odredenpokus. Svakom ishodu to C Q, s obzirom na obi1jeje X, moemo pridruiti odreden broj X (to) =
x I kae se daje x = X (to) vrijednost slueajne vanijable X za ishod to (slika 21.).
Definicija. Neka je (Q, P (0), F) diskretan vjerojatnosni prostor. Funkcija X : 0 JRkoja svakorn ishodu to C 0 pnidruuje realan broj X (to) naziva se sluëajna varijabla.
to
R0 X(w) *
Slika 2.1.Dakie, slueajna varijabla se definira kao realna funkcija definirana na 0.Ako je 0 neprebrojiv skup, ova se definicija mon dopuniti na slijedeôi naëin: Ako je (0, B, P)
vjerojatnosni prostor, funkcija X je sluëajna varijabla na 0 ako je X’ (B) e B za proizvoljniBorelov skup B € B.
Sluaajne vanijable oznaãavat éemo velikim slovima: X, Y, Z, •, a pripadne vnijednosti kojeone uzimaju (to su realni brojevi) s malim slovima iii konkretnim brojevinia.
Zapis {X = x} predstavlja dogadaj da sIuajna vanijabla X uzme vrijednost z i to je skraêenizapis za dogadaj
{wcQ:X(w)=x}
25
26 2.1. Pojam sluëajne varijable
Primjcr 1. a) Bacamo novëiê tn puta i neka X predstavlja broj pojave pisma. Dakie, X jeslueajna vanijabla koja moe uzeti jedan od brojeva 0, 1, 2, 3.
b) Bacamo kocku i neka X predstavlja broj koji se pojavi na kocki. Slueajna varijabla Xnote uzeti jedan od broje’va 1,2,3,4,5,6.
c) Bacamo kocku i neka je X = 1 ako se pojavi neparan broj i X = 0 ako se pojavi paran Ibroj. Ovdje je X slueajna varijabla koja moe uzeti vrijednost 0 iii 1.
Primjer 2. Neka se pokus sastoji u testiranju ispravuosti tn ure4aja i neka X predstavjabroj ispravnih uredaja.
Lako je zapaziti da je X slueajna vanijabla koja mote uzeti vnijeduost 0, 1, 2 ill 3, jet odtn uredaja ispravnih moe biti 0, 1, 2 iii 3. Za tn odredena uredaja sluëajna varijabla X áeuzeti jedan odreden broj x. Praéenje ove sluëajne varijable X moe se primijeniti i na slueajnuvanijablu X koja predstavlja broj pojave pisma kod bacanja tn novëiéa (Prinijer 1 a)).
Ozna&mo s 0 neispravan, a s 1 ispravan uredaj. Skup svih moguéih ishoda je:
= (0,0,0), w2 = (0,0,1), £03 = (0,1,0), w4 = (0,1,1),—
l w5=(1,1,1), wo=(1,1,0), w=(1,0,i), w=(1,0,0)
Sada je oeevidno:
X(wi) = 0,X(w2)=X(ws)=X(w8)=l,X(w4) = X(we) =X(w7) =2, X(ws)=3 , ra pnipadne vjerojatnosti su:
F(X=0)=,P(X=1)=[F(X=2)=[P(X=3)=r[ PKako vidimo, sluëajna vanijabla X kao funkcija vri preslikavanje skupa Q u skup brojeva __
{0,1,2,3} (slika2.2.).
£07£08
‘U6
n£04 U
£01 £03
nLiU
V LI0 1 2 3
B.
Slika 2.2. 1
[1U
Ii
2. SIuajne varijable I distribucije 27
Zapazimo da, u vezi s ovim pokusorn, moemo promatrati razne dogadaje. Evo nekih primjera.
a) Dogadaj A da broj ispravnih uredaja nije manji od 2, tj. A je dogadaj da slueajna varijablaX uzme vrijednost ne manju od 2 i moemo pisati
A={X�2} iii A=tX=2}u(X=3}
tj. dogadaj A je unija disjunktnih dogadaja {X = 2} i {X = 3}. Shjedi,
P(A)=P(X=2)+P(X=3=+=0.5.
b) Dogadaj B = {—2 < X <3). Ovdje irnamo:
{X = 0) U {X = i}u {X = 2}
1337
c) Dogadaj C: broj ispravnih uredaja je neparan broj. Imamo:
{X = 1} u {X = 3}
P(C)= = 0.5
Ogranieit éemo se na dva tipa slueajnih varijabli: slueajne varijable diskretnog tipa i sluáajne varijable kontinuiranog (neprekidnog) tipa. Postoje i one sluajne varijable koje nisu nidiskretnog ni kontinuiranog tipa.
2.2. Diskretne distribucijeSlueajna varijabla X je diskretnog tipa ako moe uzeti samo diskretne vrijednosti.
Oznaeimo s R. (X) situp svih moguôih vrijednosti slueajne varijable X. Dakie, dogadaj{X C fl(X)} je siguran dogadaj paje i P(X C R(X)) = 1
Diskretna slueajna varijabla X moe uzeti konaeno iii prebrojivo mnogo vrijednosti pa jeskup svih moguôih vrijednosti oblika
ill R.(X) =
U Primjeru 2 je R. (X) = {0, 1, 2, 3}.
Vjerojatnost dogadaja da slueajna varijabla X uzme vrijednosti x je broj
p =p(c3)= P(X =), z e71(X)
gdjejepi�0, i=1,2,... i
jerje
2.2. Diskretne distribucije p
tj. unija nezavisnih dogadja na lijevoj strani jednak je sigurnorn dogadaju na desnoj strani.
Skup svih parova ft(xi, p(xj)), i=1,2,...
ëini distribuciju iii razdiobu diskretne s1uajne varijable X.Funkciju p (x) P0 kojoj svakoj vrijednosti x pripada vjerojatnost p (xi) = P (X = x) Inzvat éerno zakonom distribucije iii funkcijom vjerojatnosti sluëajne varijable X.
Distribuciju te slueajne varijable X moerno pisati u obliku tablice
1 2pfri) pi P2
iii u obliku tablicex1 Z2 ...
P1 P2 -
Obratno, za svaki prebrojiv (iii konaean) skup (xi, p), takav da je Piixjxjzaij, j�O i >p=1, (2.1)
Ppostoji slueajna varijabla X takva da je s {z, p} odredena distribucija od X. Drugirn rijeëirna, Liiako je zadana tablica
1’ X1 Z ... Zn •..‘\ PP1 P2 Li
takva da vrijedi (2.1), tada postoji slueajna varijabla X ëija je distribucija odredena torn tablicorn.
U Frimjeru 2 slueajna varijabla X irna distribuciju:1Lxi 0 1 2 3
1/8 3/8 3/8 1/8
U vezi s promatranirn pokusorn vidimo da su dogadaji {X = 0} i {X = 3} nastupili p0 jedanput, dok su dogadaji {X = 1} i {X = 2} nastupili p0 tn puta. Tako su brojevi 0, 1 , 2 i3 dobili odredena “optereéenja” karaktenizirana pripadnirn frekvencijama, odnosno pripadnirnvjerojatnostirna. Dogadaju {X = 1}, odnosno broju 1 pripada optereéenje 3/8, a dogadaju{ K = 3}, odnosno broju 3 pripada optereóenje 1/8. Prerna tome, prornatranorn pokusu testiranja ispravnosti tn uredaja pridruena je odredena distribucija ‘optereéenja” na skupu realnihbrojeva, pri ëernu rnoerno smatrati da ostalirn realnirn brojevirna pripada “optereóenje” nula.
Primjer 3. Bernoullijeva distribucija. U pokusu pratirno realizaciju jednog dogadaja.Moguoa su dva ishoda: jedan da se dogadaj ostvari I drugi da se dogadaj no ostvari. Neka je ElX = 1 ako se dogadaj ostvani i X = 0 ako se dogadaj ne ostvani. Ako je
P(X=1)=p i P(X=O)=1—p, O<p<1,Ii
F’U
11
2. SIuajne varijable distribucije 29
tada slueajna varijabla X ima distribuciju:
I’ 0 iNX= thuobliku1P VI
oLp i—p p
koja je pozuata kao Bernoullijeva distribucija koja ovisi o parametru p1 oznaëava se s Bern (p).Napomena. Ova distribucijaje osnovna u teoriji vjerojatnosti. Njen znaëaj posebno dolazi
do izraiaja u slucaju n—terostrukog ponavijanja istaknutog pokusa, to dovodi do znaëajnebinornne distribucije, a iz nje proizilaze znaëajne Poissonova I normalna distribucija. Te znaëajnedistribucije upoznat éemo kada se upoznamo s tzv. karakteristionim vrijednostima I funkcijamaslueajnih varijabli, kako bismo te distribucije mogli kompletnije sagledati.
Primjer 4. Indikator dogadaja A C Q je slueajna varijabla 1A, takva da je
Ii, akowcA,IA(W)1 o, akowØA.
NekajeP(IA=1)=zp i P(IA=0)=zl_p, O<p<l.
Dakie, slueajna varijabla ‘A ima Bernoiilhijevu distribuciju, pa se kate da je ‘A Bernoullijevaslueajna varijabla i pie se ‘A Bern (p).
Primjer 5. U kutiji se nalazi 5 ispravnih i 4 neispravne aru1je. Iz kutije se izvlaei p0 jednaaru1ja bez vraéanja sve dok se ne izvuëe ispravna aruIja. Odrediti distribuciju vjerojatnostislueajne varijable X koja predstavlja broj izvuëenih arulja I odrediti vjerojatnost dogadaj a{—1 < X < 3}.
Ad. Ovdje je skup moguêth vrijednosti slueajne varijable X:
7Z(X) = {i,2,3,4,5},
a pripadne vjeroj atnosti su:
P1 =
4 3 2 5 5 4 3 2 15 1J94 = P(X=4)=-.--.-.-=-— p5=P(X=5)—9 8 7 6 126’ 9 8 7 65 126
Prema tome, distribucija sluëajne varijable X je:
lxi 1 2 3 4 5p 5/9 5/18 ) 5/42 5/126 1/126
5Zapazimo da su p > 0 1 da je = 1.
1=1Vjerojatnost dogadaja da slueajna varijabla X uzme vrijednost izmedu —ii 3 je
2.1 Diskretne distribucije
jer sluëajna varijabla X na intervalu (—1,3) moe poprimiti samo vrijednost liii 2.
Primjer 6. Ceometrijska distribucija. Pokus se ponavija sve dok se odredeni dogadaj A,koji ima vjerojatnost P (A) = p, ne pojavi prvi put. Neka je X broj izvedenih pokusa. VeheinaX je slueajna varijabla koja ima skup moguéih vrijednosti:
C,
s vjerojatnostima U
Pk—P(k)=F(X—k)—P(iP),k—1,2
To znaëi da realizacija dogadaja {X = k} nastupa kada se u prvih k—i pokusa reaJizira dogadajAc, a zatim u k—om pokusu Se po prvi put realizira dogadaj A. Distribucija sluéajne varijableX poznata je pod nazivom geometrijska distribucija s parametarom p. Ii
Primjer 7. Hipergeometrijska distribucija. U jednom skupu od N elemenata nalazise M elemenata s nekim svojstvom A (0 < M < N). Iz skupa se uzima slueajni uzorak od ii
eiemerxata (0 < a < N). Neka je X broj elernenata sa svojstvom A u torn uzorku. Odreditidistribuciju slueajne varijable X.
Ad. U skupu od N elemenata nalazi se M elemenata sa svojstvom A, a N — M elemenatakoji nemaju svojstvo A. Skup svih moguOih vrijednosti slueajne varijable X je
gdjejer=xnin{n,M}. SIOdredimo vjerojatnost dogadaja {X = k}, Ic = 0, i, 2, . .. r. Iz skupa od N elemenata moe U
se uzeti uzorak od n elemenata na = (N) razlieitih naëina. Nwlaije, iz podskupa od
(M) IM’\ . . . . UM eleinenata sa svojstvom A moemo uzeti Ic elemenata na = Ic)raz]aëjtth naëina.
Preostalih ii — Ic elemenata u uzorku nernaju svojstvo A i njih treba uzeti iz podskupa koji ma 51N—M IN—MN . . . . .N — M elemenata, a to je moguce ostvariti na G = razlaeitih naëina. Svaki- \n—kJizbor od Ic elemenata sa svojstvom A dolazi zajedno sa svakim izbororn od n — Ic elemenata koji p
nemaju svojstvo A, pa je broj rnoguéih formiranja uzoraka u kojima je od n elemenata njih Ic iisa svojstvorn A I it — Ic koji nemaju svojstvo A (vidi I Primjer 15 iz poglavija Kombinatorika,Dodatak A), tj. broj povoljnih ishoda za dogadaj {X = k} jednak je:
C(M) G(NM) —(MN (N - MN
n-k çk}cn-k}Stoga je vjerojatnost dogadaja {X = k} jednaka
pk=p(k)=P(X=k)= k)n—k ), k=0,i,2...,r. (2.2)() Si
[1.U
[Ii
2. SIuajne varijable I distribucije 31
Distribucija sluãajne varijable X poznataje pod nazivom hipergeometrijska distribucija, kojaovisi o N, M i n i oznaëava se s H (N, M, n).
Kako je Zn = 1, to iz (2.2) slijedi
(MN/N-MNk}n-k)
-1 [MN/N-MN1Z IN\ — IN\Zk)n_k}
k=O ( ( )k=O\nJ \nJ
a odavde slijedi zanimijiva jednakost:
(N-MN-
[Nn-k) H
Hipergeometrijska distribucija rno2e se koristiti u kontroli uzoraka.
Prirnjer 8. Skup se sastoji od 30 proizvoda, 24 dobra i 6 defektna. Uzimamo na sreOu 5proizvoda. Neka X predstav]ja broj defektnih proizvoda. Odrediti distribuciju sluOajne varijablex.
Ad. Slueajna varijabla X ima hipergeometrijsku distribuciju H (30, 6, 5), a to je distribucija:
IkI 0 1 2 3 5Pk 0.29826 j 0.44739 0.21304 [0.03874 0.00253 000004
Zadatak. Napisati distribuciju vjerojatnosti sluãajne varijable X H (30, 6, 10).
Primjer 9. Diskretna uniformna iii jednolika distribucija. To je distribucija sineajuevarijable X kod koje je skup mogueih vrijednosti
s pripadnim vjerojatnostima:
i=1,2
Kako vidimo, radi se o jednako vjerojatnim ishodima slueajne varijable X. •23. Kontinuirauc distribucijeS1uajna varijabla Xje kontinuiranog (neprekidnog) tipa ako moe poprimiti bib koju vrijednostnekog konaenog ih beskonaenog intervala. Na primjer, neka je X trajanje slueajno izabranearu1je iz nekog sk1adita. X je kontinuirana slueajna varijabla. Elementarni ishod X =
nastupa kada trajanje X ima toëno vrijednost x.
2.3. Kontinuirane distribucije
Za slueajnu varijablu X kae se da ima kontinuiranu distribuciju ako postojinenegativna funkcija f takva da je
&P(a<X<b)=ff(x)dx zasvea,bcR, a<b.
Funkcija f zove se f’unkcija gustoêe vjerojatnosti iii kraee funkcija gustoéesluëajne varijable X
Funkcija gustoée f ima svojstva:f(x)�O, —c’o<x<oo,
(f2) 7f(x)dx=1,-Co El
(f3) funkcijaf je neprekidna osim moMa u najvie konaeno mnogo toãaka.
Svojstvo (f2) slijedi iz ãinjenice da sluëajna varijabla X uzima vrijednosti sa skupa IR, tj.skup svih moguéih vrijednosti slueajne varijable X je 7?. (X) = JR I da je P (X C 7?. (X)) = 1
bSvojstvo (f3) za posijedicu ima egzistenciju integrala ff (x) dx
Na funkciju f mogu se postaviti i slabiji uvjeti au to nadilazi potrebe ovog kolegija (vidiliteraturu).
Alto podrueje vrijednosti kontinuirane varijable X nije cijeli skup IR, nego samo jedan njegovdio, na primjer, interval a, bl, onda je
Elf(x)=O, xg[a,b . U
U ovom slueaju uvjet b) je ekvivalentan s
/f(x)dx=1. uVjerojatnost dogadaja da sluaajna varijabla X kontinuiranog tipa uzme vrijednost cjednaka
je nuli, za svaki c C 1, jer je
F (X = c) = ff (x) dx = o.
Stoga vrijedi:
&
F (a � X < b) = P (a < X � b) = P (a <X < b) = P (a < X <b) = ff (x) dx. (2.3) Lia
rEfteba naglasiti da svaka funkcija f koja ispunjava uvjete a), b) i c) moe biti funkcija gustoée Lineke sluaajne varij able X.
Graf funkcije gustoáe naziva se krivulja distribucije. U’F’Li
it
2. SIuajne varijable I distribucije 33
Zapazimo i to cia f(s) ne predstavlja nilcakvu vjerojatnost. Naziv funkcija gusto6e potjeëeotuda to je vjerojatnost dogadaja da slueajna varijabla X uzme vrijednost u malom intervalu[xo, so + Axcj proporcionalna duijini intervala Ax0 i koeficijent proporcionalnosti je f (so). Zaista, prema slici 2.3., ako je f neprekidna funkeija na [so, o + Asol, vrijedi
xo+xo
P(xo�X<xo+Axa)= f f(x)dxf(xo)Axo.
To znaëi da slueajna varijabla uzima vrijednosti u najveêeni broju suöajeva (vjerojatnosno“optereéenje” je najveee) u okolini one vrijednosti so u kojoj funkcija f uzima ekstremnu vrijednost, to i opravdava naziv funkeija gustoée.
0 x
Slika 2.3.
Primjer 10. IContinuirana unIformna ili jednolika distribucija. Za sluëajnu varijabluX koja uzima vrijednosti iz 1? (X) = [a, 61 s funkcijom gustoée
f(x)=i’ ba’ ax<b,1 0, x<a, x>b,
kaemo da ima uniformnu iii jednoliku distribuciju na segmentu [a, bj. Ova distribucija ovisi odva parametra a i 61 obi1jeava so s Un (a, 6) (slika 2.4.).
f(s)
a 0 x
Slika 2.4.
Za razliku od diskretne uniformne distribucije, koja uzima n diskretnih vrijednosti s jednakimvjerojatnostima, kontinujrana uniformna distribucija ima neprebrojivo mnogo ishoda: to su Swvrijednosti segrnenta [a, 6].
Odredimo vjerojatnost dogadaja daslueajnavarijabla X uzine vrijednost iz intervala (xi, z2) C[a, 6]. Irnamo:
34 2.3. Kontinuirane distribucije
P(xl<X<x2)=ff(r)dx=X1.
Odavde slijedi da intervalima jednake duijine unutar intervala (a, 6) pripadaju jednake vjerojatnosti. Upravo zbog toga svojstva ova distribucija je i dobila naziv uniformna lb jedno]ikadistribucija. Ova distribucija se koristi za opisivanje pokusa izbora slueajne toeke u intervalu.
Prinijer 11. Eksponencijalna distribucija. Za slueajnu varijablu K sa skupom nxoguêihvrijednosti
fl(X)= ={O,oo)
i s funkcijom gustoée
f 0, x<0,f (x) — ac , r> ogdje je a> 0 parametar1 kaemo da ima eksponeucijalnu distribuciju (slika 2.5.).
Ova distribucija ovisi a parametru a i obi1jeava se s Er (a).
Af()
a
SU0
Slika 2.5.
U mnogim djelatnostinia mogu se definirati slueajne varij able koje se ponaaju p0 eksponencijalnoj distribuciji. Na primjer, vijek upotrijebljivosti odredenih vrsta uredaja, vremenskiintervali dogadaja koji nastupaju sluëajnim slijedom (na primjer, kvarovi stroja, telefonski poziviu centrali) i drugo. Tako, ako sluãajna varijabla K izraava duijinu rada uredaja, onda parametara iskazuje reciproënu vrijednost prosjeënog vremena ivota jednog uredaja.
Priniarni raziog velike vanosti ove distribucije je u tome to slueajne varijable s eksponencijalnim vjerojatnostnim optereOenjem imaju svojstvo “zaboravljivosti”. To znati da seslueajna varijabla nakon odredenog vremena s nadaije ponaa kao i ad samog poeetka, tj. vrijedi:
F(X>s+t(X>s)=P(X>t), zasves,t>O. (2.4) 0Zaista,kakoje P
P(X > x)= 1_P(X�z)=1_afeUdu= e
[I
2. SIuajne varijable I distribucije
to je, prema definiciji uvjetne vjerojatnosti,
F(X>s+t,X>s) P(X>s+t)P(X>s+X>s) =
P(X>s)=
P(X>s)e_(8+t)
=et=F(X>t)
U”
af(x-s)
p
0 S
Slika 2.6.
Kako vidimo, jednakost (2.4) izraava slijedeée. Ako, na primjer, slueajna varijabla Xiskazuje duijinu ispravuog rada jednog uredaja (na primjer, u satima), onda X > $ znaëi daje uredaj ispravan poslije s sati rada. Jednakost (2.4) iskazuje da je poslije .s sati ispravnog radavjerojatnost da uredaj bude ispravan jo barem t sati jednaka vjerojatnosti da je uredaj ispravanposlije t sati od ukljueenja. DaMe, kao da je uredaj ‘zaboravio’ daje veô radios sati (slika 2.6.).
Prirnjer 12. Cauchyeva distribucija je distribucija definirana furikcijom gustoée:
f(x)= 2 —OO<X <00. (2.5)r(1+x
Primjer 13. Laplaceova distribucija ill dvostrana eksponericijalna distribucija, sparainetrom a (a > 0), je distribucija definirana funkcijom gustoée
AOS7 c’LI\
f(x)=aeI , —00<z<00. (2.6)
Posebno znaëajne kontinuirane distribucije: normalnu i garna distribuciju, upoznat éemonakon upoznavanja s tzv. karakteristienim vrijednostima i funkcijama slueajnih varijabli.
Zadatak. Pokazati da funkcije defInirane a (2.5) i (2.6) ispunjavaju uvjete funkcije gustoôeodgovarajuee slueajne varij able X.
2.4. Funkcija distribucije sluèajne varijable
Proueavanje distribucije vjerojatnosti slueajne varijable X zgodno je provoditi pomoéu funkcijedistribucije vjerojatnosti F (x), —oo K x K cc’.
36 2.4. Funkcija distribucije sIuajne varijable
Definicija: Neka je X slueajna varijabla na fl. Funkcija F JR —* O, 1} definirana s
Ffr) = P (X � x) = P {w C (2: X (w) � x}, x € R,
naziva se funkcija distribucije ill funkcija razdiobe slueajne varijable X.
U literaturi se spominje I naziv kumulatWna funkeija dstribucije.
Funkcija distribucije F ima slijedeêa svojstva.
F je neopadajuéa funkcija na JR.
(F2) Funkcija F u svakoj toeki x € JR ima limes slijeva F (x_) ilimes zdesna F(x÷) i vrijedi F(x_) � F(.x) � F(x+).Skup svih toeaka prekida funkcije F najvie je prebrojiv.
(F3) F(—) = llrnF (z) = P (0) = 0, F(+oo) = 1imF (x) = F ((2) = 1.
(F4) F je neprekidna funkeija zdesna a s-vakoj toeki rc C JR.
Zasvaki x C IRvrijedi P(X=x)== F(x)—F(x_). I(P6) F je neprekidna funkcija u toeki x CR ako I samo ako je P(X = x) = 0.
1ji
Zaista, za svaki x1,x2 c IR, x1 < x2, slijedi {X � xi} c {X � x2} pa je P(X � xi) �P (X � x2) odnosno F(xi) <F(x2), to znaëi da je F neopadajuéa funkcija i da postoje vrijednosti F(x_) i F(x).
Dokaimo svojstvo (F4). Neka je x e JR i neka je (x, a e N) proizvoljan niz u JR koji padai urn x, = x. Tada vrijedin-.Qo
{X�x}o{X<x+i},neN i {X�x}={X�x},71=1
a odavde (prema svojstvu neprekidnosti vjerojatnosti) slijedi limF (z71) = F (x), to znaëi da je6-40 fl
F neprekidna funkcija zdesna u x C JR.Primjetimo da opêenito ne vrijedi: F (x_) = F (x). Naime, ako je x toaka prekida funkcije
F, taclajeP(X<x)=F(x_)<F(z).
Svojstvo (F5) slijedi iz:
F(X=x) =(
-
<X�x}) =uim (F(x) _F(x_!)) =F(z) -F(x).
Svojstvo (P6) je posljedica svojstava (F4) i (F5).Moe se pokazati da je svakom funkcijom F JR -. [0, 1, koja ima gornja svojstva definirana
odredena distribucija vjerojatnosti na JR.
p
ii
2. Slubjne varijable i distribucije 37
Napomenimo da je za svaku slueajnu varijablu X funkeija distribucije F(x) definirana zasve realne vrijednosti x. Funkcija distribucije potpuno opisuje sluäajnu varijablu s vjerojatnosnetoeke gIedita, tj. javija se kao jedan oblik zakona distribucije.
Funkeiju distribucije zgodno je koristiti za izraãunavanje vjerojatnosti odredenih dogadaja.Talco vrijede slijedeáe tvrdnje.
—Neka je F funkcija distribucije sluëajne varij able X i neka su a, 6 C 11{, a < b (dolazi u cbziri a = —cc, b = cc). Tada vrijedi:
P@ <Xb) = F(b) —F(a),P(a<X<b) =
F(a < X<b) = F(b)—F(a),P(Q�X <b) = F(b_)—F@),
F(X=b) =
P(X<b) =
P(X>a) = 1—F(a),P(X�a) =
ICed slueajnih varijabli diskretnog tipa funkeija distribucije je stepenasta funkcija. Veliãinaskoka u toëki Xk .ie Pie = p(xk) = P (X = Xk), k = 1,2
Funkcija distribucije slueajne varijable X diskretnog tipa definirana je a:
F(x)= YZp(xie),—oo<x<co.xk
Ako diskretna slueajna varijabla X ima konaean skup moguOih vrijednosti7?. (X) = {xi, x2,... , s pripadnim vjerojatnostima p(xk), k = 1,2 n, tada funkcijudistribucije F moemo napisati kao:
0,F(x)= ZP(2k), x1<z<x,,., (2.7)
xk<x1, x�xn.
Primjer 14. Neka je slueajna varijabla X odredena distribucijom:
0 10.5 ( 0.3 0.2
Odrediti funkciju distribucije F i nacrtati graf te funkcije.Ad. Prema (2.7) imaino (vidi sliku 2.7.):
0, z<—1,0.5, —1<z<0,F(x)=P(X�z)= 0.8,1, x�1.
c’ 4pcc j-rV meq
38 2.4. Funkcija distñbucije sluëajne varijable
“F(x)I -r
0.8
1° ‘C
SIlica 2.7.
Primjer 15. Za Bernoullijevu distribuciju funkeija distribucije je (graf funkcije prikazan jena slid 2.84:
1 0 z<O,F(x)=P(X�x)= l—p, O�x<1,
j 1, x�1.
F(x)I
‘-p
0 1 a;
iiIiSlika 2.8.
Primjer 16. Za hipergeometrijsku distribuciju H (N, M,n) funkcija distribucije je:
0, x<0,M N-M
F(x)=P(X<z)= Z k—k , 0�x<n,
k<x71
1,
Zadatak. Napisati funkciju distribucije za sluëajnu varijablu X kojaje definirana u Primjeru8 i nacrtati njen graf.
Promatrajmo sada funkeiju distribucije za kontinuiranu sluëajnu varijablu. r‘IAko je sluëajna varijabla X kontinuiranog tipa s funkcijom gustoóe f, onda jefunkcija distribucije: IiiF(x)=F(X<z)= ff(t)dt.
U0![1;
2. SIuajne varijable I distribucije 39
Odavde, deriviranjem p0 x, dobivamo I slijedeêu vezu izmedu funkcije gustoôe f I funkcijedistribucije F:
F’ (x) = f (x),
to znaOi da je F primitivna funkcija funkcije f. Stoga, ako je poznata jedna od tih funkcija lakose odreduje ona druga.
Dakie, u slueaju kontinuirane slueajne varijable funkcija distribucije F je neprekidna funkcijai vrijedi (vidi i (2.3)):
P(a<X<b) = P(a<X<b)_—P(a<X<b)=P(a<X<b)
= ff(x)dx=F(b)F(a).
Primjer 17. Funkcija distribucije za uniformnu distribuciju (koja je definirana u Primjeru10) je (graf funkeije dan je na slici 2.9.):
1 0. x<a,F(x)=ff(x)dx= a<xb,
—
11, x>b.
a U b x
Slika 2.9.
Primjer 18. Funkcija distribucije za eksponencijalnu distribuciju (koja je definirana uPrimjeru 11) je (graf funkeije dan je na slici 2.10.):
F(x)=P{X�x}=ff(x)dx={°iZeax,
Prirujer 19. Odrediti konstantu c tako da funkcija f (x) = cx predstavlja funkciju gustoOeslueajne varijable X koja uzima vrijednosti iz segmenta [1, 5]. Zatim, odrediti funkciju distribucije F i odrediti vjerojatnost dogadaja da sluëajna varijabla X uzme vrijednost iz segmenta[2, 3]. Nacrtati grafove funkcija f i F.
Ad. Konstantu c nalazimo iz uvjeta
ff(x)dx=fdx==1.
Sada imamo:
( 0,f(x)= x,
10,
F()=P(X<x)= ff(x)dx=00
( 0,(x_1)1,
x<1,1<x<5,x>5,
a) Odrediti paranietar a tako da funkcija f bude funkcija gustoée neke slueajne varijable X.b) Odrediti funkciju distribucije F i nacrtati grafove funkeija f i F.c) Odrediti vjerojatnost da slueajna varijabla X uzme vrijednost iz segmenta [1, 2j.
(•• N
Ii
40 2.4. Eunkcija distribucije sIuajne varijable
“Ffr)
Slika 2.10.
Odavde je c = 4 pa je funkcija gustoOe f (x) = za 1 <x � 5, odnosno
x<1,1�x�5,x>5.
512
Pc12
1
Slika 2.11.
Primjer 20. Neka je
(0, z<0,
f(x)=j a(3xx2) , O�z�3,0, x>3.
ii
2. Sluèajne varijable I distribucije 41
3Ad. a) Paranietar a nalazimo koriste& uvjet fa (3x — x2) 1. Imamo:
0
fa(3x_x2)dx=a(_9) =1,
x (0, x<O,b) F(x)== f f(t)dt= x2(i-.x) , O<x<3,
—
(1, x>3.
rFl’f
0 1 3 Z
Slika 2.12.
c) P (1 � X <2) = F (2)- F (1) = (i_-
(i =
42 2.4. Eunkcija distribucije sluèajne varijable
rsJN/ 1’fl6 r40?
‘‘Ne f
3. Karakteristiëne vrijednosti Ifunkcije sluëajnih varijabli
Ovdje promatramo neke numeriëke karakteristike I kankteristiöne furikcije slueajnih varijabli.Na primjer, oaekivana vrijcdnost sluëajne varijable i rasipanje moguéih vrijednosti slueajne varijable u okoUni oeekivane vrijednosti. Karakteristiena funkeija sluëajne varijable je u stvariFourierova transformacija pripadne funkcije gustoée. Karakteristiene funkcije su veoma korisneu rjeavanju nekih problema teorije vjerojatnosti.
3.1. Oeekivanje sluëajne varijable
Matematieko oekivanje slueajne varijable X na neki naëin predstavlja srednju vrijednost sluèajne varijable X.
Nekaje X slueajna varijabla diskretnog tipa s konaënim skupom rnoguéih vrijednosti 1?. (X) =
{x1, x2,• x,}. U N ponovljenth neovisnih pokusa registriramo vrijednosti za X. Neka sevrijednost x1 ostvari u N1 pokusa, vrijednost x2 u N2 pokusa, vrijednost x U Nn pokusa, gdjeje
Prornatrajmo izraz
N1 P12 NXN= N
Velioina Xjv je slueajna varijabla koja predstavlja srednju vrijednost (usmislu aritmetieke sredine) svih registriranih vrijednosti. Zaista, u jednoj odredenoj seriji XN uzima odredenu vrijednost XN, dok ii nekoj drugoj seriji od N ponovljenih pokusa neêe se opêenito, vrijednost xkregistrirati ba. Nh puta, veé nelci drugi broj P4 puta, pa óe i sluaajna varijabla Xyq uzeti druguvrijednost
. Medutim, ako N —‘ cc onda se relativna frekvencija dogadaja {X = Zk}grupira oko broja
tako da graniena vrijednost od XN kad N —* cc nije slueajna varijabla veó broj
Ovaj broj, koji je na takav naëin srednja vrijednost sluëajne varijable X, naziva se matematiëkooëekivanje iii kraee oaekivanje sluãajne varijable X i oznaëava se s E (X) I ita “oeekivanje odx,,.
43
44 31. Oëekivanje slubjne varijable
Definicija. Neka je X diskretna sluaajna varijabla s distribucijom koja je odredenaprebrojivim (iii konaenim) skupom parova (xk,pk). Broj
E (X) = Zxkpk
nazivamo matematieko oëekivanje (kraee, oeekivanje) slueajne varijable X, ako Isame ake red Zxkpk apsolutno konvergira.
ItMatematieko oeekivanje kontinuirane sluëajne varijable X s funkcijom gustoêef (x), —cc < x <+cc definira se kao brcj
+00
E(X)=
ako I samo ako nepravi integral fxf (x) dx apsolutno konvergira.
TJmjesto oznake E (X) koristi se I oznaka EX.Iz dane definicije slijedi da E (X) postoji ako i same ako postoji E (IXI).
+00
Ako red YZxkpk, odnosno integral f xf (x) dx, divergira ili ne konvergira apsolutno, tadak
—sluaajna varijabla X nema matematieko oeekivanje.Naime, poznato je da ako beskonaean red ne konvergira apsolutno, tada promjenom redosl
ijeda zbrajanja moe se za sumu reda dobiti bile koji realan broj. Nadaije, kako u skupu moguéihvrijednosti {xi, x2,• } poredak vrijednosti nije utvrden, to matematieko oeekivanje ne bi biledobro definirano ako bi red same konvergirao (uvjetno konvergirao).
Primjetimo da matematiëko oeekivanje slueajne varijable X diskretnog tipa s konaënimskupom moguéih vrijednosti {xi, x2,••• x} je
E (X) =
i uvijek postoji. Takoder, uvijek postoji i matematieko oeekivanje kontinuirane slueajne varijableX koja za skup moguéih vrijednosti ima konaean interval [a, bj.
Pojasnimo matematieko oeekivanje za sluaajnu varijablu X kontinuiranog tipa.Neka je f funkcija gustoée za sluëajnu varijablu X neprekidna funkcija na konaënom seg
mentu [a, bj i nula izvan tog segmenta. Podijelimo [a, bJ na n segmenata duljine = Axtoëkamaa=xo<xi<...<xb
Slueajnu varijablu X aproksimirajmo slueajnom varijablom diskretnog tipa X, koja poprimavrijednost xk s vjerojatnoéu
PIt = P(xkl<X<xk)= Jf(x)dx LIf(xk)(xk—xk_l) =f(xk)AxJ,, k=1,2,-• ,ri
3. KarakteristiErie vrijednosti 1 funkcije sIuajnih varijabli 45
Ako n—
co prirodno je smatrati da X,., sve boije aproksimira X, pa kao definiciju za F (X)uzeti: urn F (X). Tako jen—f00
£ (X) = limE (X) = limZxk f f (x) dx = iirnZxkf (xk) Axk = fxf (x) dxk=1 k=1 a
Ako sada stavimo da a —* —co, b —* +oo, dobivamo danu definiciju za £ (X) u sluëaju kada jeX kontinuiranog tipa.
Dakie, u usporedbi s diskretnim sluëajem, u kontinuiranorn sluaaju urnjesto zbroja imamointegral, a umjesto vjerojatnosti pk imamo element vjerojatnosti f (x) dx.
Definicija. Za sluèajne varijable X1, X2,.• , X,- kaemo cia su nezavisne slueajnovarijable ako su za proizvoljne skupove A C R, i = 1, 2, , n dogadaji{X1 e A1}, {X2 c A2}, ..., {X, c A,} nezavisni.
Svojstva matematiekog oeekivanja.Neka je c e JR i neka su X i Y slueajne varijable. Tada vrijedi:(ol) E(c)=c,(o2) E(cX) =cE(X)(o3) E(X+Y)=E(X)-j-E(Y),(o4) F (XY) = F (X) F (Y), ako su X I Y nezavisne sluëajne varijable.
Svojstva (ci) i (o2) slijede neposredno iz definicije matematiëkog oëekivanja.Svojstva (o3) i (o4) bit ée dokazana u Poglaviju 5.Iz (o2) i (o3) slijedi svojstvo:
E(aX+b)=aE(X)+b, a,6EJR.
Svojstva (o3) i (o4) prirodno so proiruju i na vine sluëajnib -varijabli X1, X2, , X,-. Takoje:
Nadalje, ako su X1, X2,.. , X,1, nezavisne sluaajne varijable tada je:
F (X1X2 •. . X,) = F (X1) F (X2) .. .8 (X)
Primjetimo da, ne vrijedi obrnuto tvrdnje, tj. ako je
E (XY) = F (X) F (1’)
ne slijedi da su slueajne varijable X i Y nezavisne.
Primjer 1. Neka je X sluëajna varijabla koja predstavlja rezultat bacanja kocke. Odreditidistribuciju slueajne varijable X i njeno oëekivanje.
3.1. Oéekivanje sluEajne varijable
Ad. Skup moguéih vrijednosti slueajne varijable X I pripadne vjerojatnosti su:
= {1,2,3,4,5,6}
P(X=k) =
Stoga je oeekivanje
Zanimljivo je primjetiti da slueajna varijabla X ne moe poprimiti vrijednost 3, 5.
Primjer 2. Promatrajmo diskretnu slueajnu varijablu X koja ima distribuciju UXk 2 22 2I... 2kp(xk)I z thl
Prvo zapazimo da je slueajna varijabla X dobro definirana jer je
1 1 1 1 1 1
U pitanju je geometrijski red s prvim elanom a1 = I kvocijentom q =.
Sada izraãunajmooeekivanje E (X). Imamo:
E(X) =
=
U pitanju je divergentan red, pa oëekivanje E (X) slueajne varijable X ne postoji.
Primjer 3. Neka je X slueajna varijabla koja predstavlja broj bacanja novëiéa do prvepojave pisma. Odrediti distribuciju sluäajne varijable X i njeno oëekivanje.
Ad. Distribucija slueajne varijable X je:
[xk 1 2 3 ... ItI ( 1 I 1 1LPki
Sadaje p
UDakie, moemo reéi da je 2 oeekivani iii srednji broj bacanja novëiéa potrebnih da se pojavi Upismo.
Primjer 4. Neka kontinuirana slueajna varijabla X ima uniformnu distribuciju Un (a, b).Funkcija gustoée je
I Em a<x<b,f) o” xa,r>b, [I
3. Karakteristi&e vrijednosti I funkcije sIuajnih varijabli 47
pa je oeekivanje &uëajne varijable X:
E(X)=fzf(z)dz _fzb dz =
Primjer 5. Promatrajmo sluëajnu varijablu X s eksponencijalnom distribucijom.
Kako smo veó vidjeli, funkeija gustoée f i funkcija distribucije F su:
10, z<0f (z) -
{ cxe°, 0<z<oo,
F(z)=P(X�z)=ff(x)dx= { Ze
Oaekivanje sluaajne varijable X je
E (X) i (x: = ( dv=ardx,
= —ze + [eZdz = 0— —e = —
o J0
Prirnjer 6. Neka je X slueajna varijabla s Cauchyjevom distribucijom koja je odredenafunkcijom gustoée
1 1—oo<zx<+oo.
?T 1-f-rn2Kakoje
+00 +00 +00
1 11 i ___I IzIf(x)dz=— i dx=2.— ir dx=oo,
J 7rJ 1+x2 irJ 1+x2—00 0
to oeekivanje E (X) slueajne varijable X ne postoji.
Zadatak. Odrediti oeelcivanje s1uajne varijable X koja ima:a) Bernoullijevu distribuciju,b) diskretnu uniformnu distribuciju sa skuporn moguéih vrijednosti {1, 2,.. . ,
c) Laplaceovu distribuciju.
3.2. Medijan sluëajne varijable
Definicija. Neka je Fx funkcija distribucije sluëajne varijable X. Medijan od Xje realan broj m za koji je(M)
48 3.2. Medijan sluëajne varijable
Oeevidno je uvjet (M) ekvivalentan sa
P(X>mx)> i P(X<mx)>.
Jasno je da medijan sluaajne varijable uvijek postoji, au on ne mora biti jedinstven.
Primjer 7. a) Neka je sluëajna varijabla X e’’ Bern (0,5). Tada je
1 0 akojex<0akojeO�x<1
1 akojex>1,
pa je svaki broj iz [0, 1] medijan od X.b) Neka slueajna varijabla X ima distribuciju
x 012 3113 3 1Pt Si S S S
Svaki broj iz segmenta [1, 2j je medijan od X.
Primjer S. Slueajna varijabla X a distribucijom
z 0 1J23
nima medijan mx = 1, jer je
2 1 5 flFx(1_)<<Fx(1)r.
Ako je X neprekidna (kontinuirana) slueajna varijabla s funkcijom distribucije Fx (z), tada r1 U
Fx(mx).Dakie, medijan mx dijeli skup svih moguéih vrijednosti sluëajne varijable X na dva jednako U
vjerojatna dijela, jer je
F (mx) = P (X < mx) = P (X > mx) =.
Prema tome, medijan se javija kao rjeenje jednadbe
Fxfr). (3.1) [LAko neprekidna sluëajna varijabla X ima pozitivnu i neprekidnu funkciju gustoáe f (x),
E 7?. (X) C JR (promatrat áemo samo ovakve neprekidne slueajne varijable), jed.nackba (3.1)ima jedinstveno rjeenje jer funkeija distribucije F,.- (x) na 1? (X) strogo raste od 0 do 1.
Pravac x = mx dijeli na pola povrinu ograniãenu krivuljom gustoée I osi x.Ako je pravac x = a Os simetrije krivulje gustoée sluaajne varijable X, tada je
mx=E(X)=a.
n
I Karakteristine vrijedrtosti i funkcije sIuajnih varijabli 49
Vrijedi osnovno svojstvo medijana:
minE OX — = EOX —
ceR
tj. oeekivana udaijenost sluëajne varijabe X od fiksiranog broja c e 1I je najmanja kada jeC = mx.
Primjer 9. Neka je slueajna varijabla X s eksponencijalnom distribucijom Ex(a). Odreditimedijan siueajne varijable X.
Ad. Prirnjer 5 odnosi se na distribuciju Ex(a). Tn su navedene funkcija gustoóe f i funkcijadistribucije F i odredeno je oeekivanje: E(X) =
. Medijan mx je rjeenje pripadne jednadbe(3.1) p0 Z, tj. jednadThe
I — e0X =
Odavde je—ax 1 In1 1 1n2e = — =e 2 —ax =in—, x = —
2 2 ain 2
mx = —aIKako vidimo, oeekivanje i medijari slueajne varijabie X su razlieiti. Ilustracija tih vrijednosti
danaje na slici 3.1.
41f
OI
Slika 3.1.
Medijan se koristi kao mjexa srednje vrijednosti. Za razliku od matematiekog oëekivanja,medijan uvijek postoji. U primjenama se matematieko oeekivanje i medijan ocjenjuju iz nizastatistiekih podataka, kao aritmetieka stedina i srednja vrijednost p0 veliéini. Neka imamo iipodataka poredanih po vehëini
(3.2)
Tada se medijan niza podataka (3.2) definira kao
rn—f (xn+xn÷i) zaparnon,xj za neparno 72.
Primijetimo dana medijan m utjeëu samo sredinji podaci iz uredenog niza podataka (3.2),za razliku od prosjeka na kojeg svaki od podataka ima odredeni utjecaj. Tako, na primjer,
1
3.3. Disperzija sluëajne varijable
medijan se neOe promijeniti ako se u uredenom nizu (3.2) (n � 3) podatak z1 proizvoljno smanjiiii x, proizvoljno poveéa.
Prinjer 10. Neka irnamo slijedeée vrijednosti:
1,3, 3,4,5,6,6,7,8
Aritmetieka sredina (koja se uzima kao ocjena za matematieko oeekivanje) i medijan su redorn:
- 1+2•3+4+5+26+7+8 —467
m=5. p
3.3. Disperzija sluèajne varijable
Matematieko oeekivanje E (X) kao broj koji je in neki naëin srednja vrijednost slueajne varijableX, je prva i osnovna informacija o sluëajnoj varijabli, all je daleko od toga da mote zamijenitipotpunu informaciju koju daje njena distribucija. Srednja vrijednost nije dovoljna za opisivanjenekih pojava. Na primjer, ako je prosjeëna godinja temperatura u nekom mjestu 1400, moese pomisliti da to mjesto ima ugodnu klimu. Medutim, ova prosjeöna temperatura je moguéai ako je maksimalna temperatura 40°C a minimalna —12°C. Dakle, pored srednje vrijednostipoieljno je znati i kakva su odstupanja od srednje vrijednosti.
Sluëajna varijabla X — E (X) je odstupanje slueajne varijable X od oeekivane vrijednostiF (X), dok je X — E (X)I apsolutna vrijednost toga odstupanja. Buduéi je nepodesno je raëunati s apsulutnim vrijednostima, koristi se suëajna varijabla (X — E (X))2.
Definicija. Disperzija iii varijanca slueajne varijable X, u ozuaci D(X) iii kraóe DX Udefinira se kao oaekivanje slueajne varijable [X — E (X)j2, tj.
D(X)=E[X-E(X)J2, 11dok se parametar Li
ax = fD(x),naziva se standardna devijacija slueajne varijable X. 111
IiKako (X — B (X))2 iskazuje kvadrat udaijenosti X od oaekivanja B (X), to disperzija i stan- ndardna devijacija slueajne varijable X su mjere odstupanja (otklona) X od njenog oeekivanja. Ii
Disperzija iskazuje kvadrat odstupanja, a standardna devijacija iskazuje srednje kvadratno odstupanje X od oãekivanja B (X). 9
IzraOunavanje disperzije aesto je 1ake p0 formuli: LiD (X) = B (x2) — (B (X2. (3.3)
Zaistaje
D(X) = E(X_E(X))2=B(X2_2E(X)X+(E(X))2) =
= E(Xi—2B(X)E(X)+(E(x2=E(x2)_(E(X))2. IiU[Ii
3. Karakteristine vrijednosti I funkcije sIuajnih varijabli 51
Disperzija slueajne varijable X ëesto se oznaëava s cr3, V (X) iii Var(X).
Osnovna svojstva disperzije:(dl) D (X) � 0, a jednakost vrijedi ako i samo ako je X = c, za neki c C IR,(d2) D(X+c)=D(X), cClR,(d3) D(cX)= c2D(X), ceR,(d4) Ako su X1 i X2 nezavisne slueajne varijable I imaju disperzije, tada je
D(X1 —I-X2)=D(X1)+D(X2),(do) E(X — a)2, promatrano kao funkcija od a, ima minimum D(X) za a = E(X), tj.
D (X) <E (X — a)2 za svaki broj a, a jednakost vrijedi samo za a = E (X).
Pokaimo da vrijede svojstva (d3), (d4) I (d5). Zaista,
D (cx) = E (cx — E (cX))2 = E (c (X — EX))2 = c2E (X — EX)2 = c2D (X),
D(Xi-i-X2) =
= E(Xf+2X1X2+X?)—(E(X1)+E(X2fl2== E (x?) + 2E (X1X2) + E (x) — (E (X1))2 — (E (x2))2 =
= E(X?)-(E(X1))2+E(X) -(E(X2))2=D(X1)+D(X2).
Iz nezavisnosti Xi i X2 slijedi: E (X1X2) = E (Xi) P3(X2) Vrijedi opéenito: ako suX1, C2,•-. X,-, nezavisne slueajne varijable i imaju disperzije, tada je
D(ZXk) =EDxk.
Svojstvo (do) slijedi iz:
= E(X-EX+EX-a)2== EQX_EX)2+2(x_Ex)(Ex_a)+(EX_a)2)== D(X)+2(EX-a)E(X-EX)+(EX-a)2== D(X)+(EX—a)2>D(X),
jer (EX — a)2 inn minimum 0 za a = EX.Dakie, rasprenje, odnosno rasipanje, vrijednosti sluëajne varijable je najnianje U oko]ini
oëekivane vrijednosti.Za izraãunavanje disperzije koristimo definiciju i svojstva oeekivanja.Ako je X diskretna sluëajna varijabla s distribucijom koja je odredena prebrojivim iii kon
aãnim skupom parova (xk, Pk) ,tada jen
k=i
52 3.3. Disperzija sluëajne varijable
(fix = LX) iii prema (3.3)
D (X) =xpk
—
Disperzija kontinuirane sluëajne varijable X s funkcijom gustoée f (x),—
< x < go je
D(X) =f(x_fix)2f(x)dx
iii prerna (3.3)
D(X)=fx2f(x)dx_fl=fx2f(x)dx_ Zxf)2Primjer 11. Neka slueajna varijabla X ima Bernoullijevu distribuciju Bern(p)
XkI 0 1pkI1PP
.
IiTadaje:
E(X) = Q.(1p)+l.p=p, ElD(X) = E(X—p)2=(0—p)2(1—p)+(1--p)2.p=p(1—p) p
Primjer 12. Odrediti disperziju slueajne varijable X ëija je distribucija: U
JXk 0 1 2 3 iiPk 0.2 0.3 0.4 0.1 Ii
Ad. Imamo:
E(X) = Zxk.pk =0•0.2+1•0.3+20.4+3•0.1= 1.4,
E(X2) = Zxpk=0.0.2+1.0.3+4.o.4+9.0.l=2.8,
D(X) = E(X2) — (E(X)2 = 2.8— 1.42 = 0.84
iii izravno:
D(X) = E(X—E(X))2=E(x—1.4)2= (_1.4)2 0.2 + 0.42.0.3 + 0.62.0.4 + 1.62.0.1 = 0.84.
Primjer 13. Neka je a toëna vrijednost velielne koju mjerimo. Zbog slueajnih pogreakamjerenje ponavijamo n puta. Rezultati mjerenja su nezavisne sluëajne varijable
FtU[I
3. Karakteristine vrijednosti funkcije sIuajnih varijabli 53
Xi, X2,..., X, svaka s matematiëkim oeekivanjem a i disperzijom u2. Disperzija iskazuje mjeruneprecizriosti mjerenja, odnosno nepreciznosti instrumenta kojim mjerimo.
Zapazimo da je:
xi+x2+...+xn) = !(E(xi)+E(x2)+...+E(xnfl=!na=a,
D( 3(n) =
Odavde vidimo cia je dispeizija aritmetiekih sredina ponovljenih mjerenja manja od clisperzijesvakog pojedinaenog mjerenja. Buduéi da —+ 0 kad n
—
, to s dovoljnim brojem mjerenjamoiemo postiéi proizvoljnu preeiznost.
Primjer 14. Odrediti oeekivanje I disperziju sluãajne varijable X s funkcijom gustoée
_I x za0<x�2,o zax<Oix> 2.
Ad. Imamo:
E(X) =
28 6 2D(X) = E(X_E(X))2=f (_‘) .xdxf(x3x2+Lx)dx_
Primjer 15. Odrediti disperziju slueajne varijable X s ekspoRencijalnom distribucijomEx (a)
Ad. U Primjeru 5 odredili smo oOekivauje: E(X) = fx . ac°’dx = .Odredimo E(X2):
E (X2) =fx2
. f) dx=fx2
. aex = ( d=aedx, e)
= x2ext +2fxedx=_fx.ae—dx=_.E(x)_—.__—.o a a a a a0 0
Sadaje
3.4. Momenti s1uajne varijableU prouãavanju karakteristienih vrijednosti slueajnih varijabli od znaëaja su I tzv. momentislueajne varijable. Razlikujemo dvije vrste momenata: centralni i ishodini momenti.
3.4. Momenti sIuajne varijable
Centralni moment r—tog reda sluáajne varijable X, u oznaci hr (X), je oeekivanjesluëajne varijable (X — B (X))r, ako taj broj postoji, tj.
,. (X) = E(X — , r = 0,1,2, .
&
Zapazimo da za svaku slueajnu varijablu vrijedip
ji=1, p,•=O,
dok je moment drugog reda disperzija, tj.
p2(X)=D(X)
Preko treéeg i ëetvrtog momenta definiraju se koeficijent asimetrije:
Q — —E(X—E(Xfl3
i koeficijent sp1jotenosti iii eksces: I
gdjejec= .0(X).
U slueaju simetriene distribucije vjerojatnosti u odnosu in oeekivanje E (X) moment treéegreda ji E (K — F (X))3 jednak je null, pa je I koeficijent asimetrije Sk 0. Prema tome,parametar 8k iskazuje odstupanje od simetriëne distribucije. Ako je pararnetar S = 0, onda segovori o tzv. normalnoj sp1jotenosti grafikona distribucije vjerojatnosti (koji je odreden nizomtoëaka (xk, pk) ill krivuljom distribucije, zavisno od tipa slueajne varijable). Stoga, parametarS iskazuje odstupanje (ekces) od normalne sp1jotenosti. Parametri Sk i S mogu biti pozitivni inegativni i spadaju u tzv. parametre oblika.
rIshodini moment v-tog reda sluoajne varijable X definira se kao: I]p(X)=E(X9, v=0,1,2
ii,Buduéi da je ove momente 1ake raeunati to je korisno uspostaviti vezu izmedu centralnih i
ishodinjh momenata.Uz oznaku E (X) = p, primjenorn binomnog teorema, nalazimo da je [i
B (X = B (z (j)Vk (Q x7k) =
= t0’ (r)TkE (Xk), r = 0,1,••• ill
Pr = (_1)()pjkplk, r0,1,” [1UF)
3. KarakteristiEne vrijednosti I funkcije sIuajnih varijabli 55
Kako je i4 = F (X) = ova nam formula daje mognénost pronalaenja centralnib momenatana osnovi poznavanja ishodinih momenata.
Sw reëeno vrijedi za diskretne i za kontinuirane sluöajnc varijable.Tako u diskretnom sluoaju, s distribucijom (xi, p), imamo:
z’ (X) = E (Xv) =
r(X) = E(X- E(X))r = — r =
Ako je sluëajna varijabla X kontinuirana s funkeijom gustoóe f (x), x C R, tada je
(X) = r =
Naravno, odgovarajuéi moment postoji ako pripadni red, odnosno integral, apsolutno konvergira.
3.5. Karakteristiéna funkeija
Neka su X i Y realne slueajne varijable. Tada je Z = X + iY, i = /ni, je kompleksna slueajnavarijabla koja uzima vrijednost na skupu C kompleksnih brojeva, a njeno oeekivanje je definiranoS
(Z) = F (X) + iF (Y)
Moe se dokazati da za proizvoljnu kompleksnu sluäajnu varijablu Z vrijedi
IE(Z)I EGZI),
gdje je Z = Jx2 + Y2 realna sluëajna varijabla.Kompleksne slueajne varijable Z1 = X1 + iY1 i Z2 = X2 + iY2 su nezavisne ako su Xi X2
X1, Y2 X2, l’i; 1’1, Y’2 parovi nezavisnih slueajnib varijabli. Ako su Zi 1 Z2 nezavisne sluoajnevarijable, tadaje
(3.4)
U svthu 1akeg raëunanja momenata slueajne varijable, kao i za rjeavanje raznih problemau vezi s funkcijama sluaajnih varijabli uvodi se tzv. karakteristiena funkcija.
3.5. Karakteristina funkcija
Definicija. Ako je X zadana realna slueajna varijabla it realan broj, tada se funkcijaJR —, C definirana kao:
kx(t)=E(e’°’) , tEJRnaziva karaicteristiena funkcija sluëajne varijable X.Ako je X diskretna slueajna varijabla sa zakonom distribucije p (zk), tada je
kx(t)=Eeitk pk , teRk
a ako je X kontinuirana slueajna varijabla s funkcijom gustoée f, tada je+00
kx(t)=JeitX.f(x)dx, tea.
Kako je funkcija x —* eZtX = costx + isintz za svaki x € JR i za svaki t C JR neprekidna i= 1, to je kx dobro definirana funkcija, tj. imamo kx JR —i C. Za svaku slueajnu varijablu
X postoji njeno oaekivanje EettC, jer pripadni red, odnosno integral, konvergira (apsolutno) zasvaku slueajnu varijablu.
Iz definicije se vidi da je karakteristiena funkcija s1uajne varijable X jedinstveno odredenanjenom distribucijom. To znaëi da sluëajnim varijablama s razliëitim distribucijama odgovarajurazlieite karakteristiëne funkcije I obratno.
Neka svojstva karakteristiene funkcije: Li(ki) kx(O)1, kx(t)I<1, teR.(1<2) Ako sluëajria varijabla X ima simetriënu distribuciju vjerojatnosti u odnosu na p
ishodite, tada je karakteristiena funkeija k realna funkcija. Ii(k3) Ako je X realna sluëajna varijala i a, b e JR, tada je
kaX+b(t) = . kjç(at) , t e JR. [14(k4) Ako su X1 i J2 nezavisne slueajne varijale, tada je U’
kxi+x2(t)=icx,jt).kx2(t) , t€JR.(1<5) Ako slueajna varijabla X ima prvih ii ishodinih momenata E (Xj, r = 1,’• , n, p
tada karakteristiana funkcija kx ima r—tu derivaciju i vrijedi UrE(X)vkx (0), r—1,...,n
kx(t)= EE()() , tea.r=zO
Kakoje UF (eitX)j < F (jeit)) = 1 , to je p
Ikx(t)I�1, teR, U
pri ëemu zuak jednakosti vrijedi samo za t = 0.Za twdenje (k2) prvo zapazimo da je U
k (—t) = F (e_utX) = E(eitX) = kx (t) U
[1!
3. Karakteristi&e vrijednosti I funkcije sIuajnih varijabli 57
( oznaãava konjugiranje u C). Ako X ma simetriënu distribuciju vjerojatnosti, tada i slueajnavarijabla —x ima istu distribuciju vjerojatnosti i vrijedi
kx (t) = k_x (t) = kx (—t) = kx (t)
to znaëi da je kx realna funkcija. Takoder, vrijedi i obratno.Prema tome, sluaajna varijabla X je sinietrièna ako i samo ako je k realna funkcija.Svojstvo (k3) sl.ijedi iz
kax+o (t) = 8 (etemtx) = eitb. kx (at)
Dokaz tvrdnje (k4) slijedi iz (3.4). Iz nezavisnosti sluëajnih varijabli Xi i X2 slijedi nezavisnost slueajnih varijabli E (eit) E (ettX2) , pa je
E = E (eutXl . etX2) = E (eitXl) E (ettx2) = k1 (t)’ kx2 (t)
Svojstvo (k4) vrijedi i za vie nezavisnih slueajnih varijabli X1, X2, ... ,
kx,+x2+...÷x (t) = kx1 (t) kx2 (t) . . . kx,, (t)
Ako su jo sluöajne varijale X1, X2, .. , X,. distribuirane p0 istoj distribuciji kojoj pripadakarakteristiena funkcija t —i k (t), onda je
kx1+x2+...÷x (t) = (k (tflm
Pojasnimo I svojstvo (kS). Ako je f funkeija gustoôe od X I ako postoji moment reda r, tadaje
k (t) = (x) dx = i’f exrf (x) dx. (3.5)
Derivacija pod znakom integrala je dozvoljena jer je derivirani integral uniformno konvergentan(Xveierstrassov kriterij):
Z tx (x)I dx = EUxIfl
Sada iz (3.5), za t = 0, k5) (0) = iThE (X’)
Tz svojstva (k5) slijedi:
E(X) = —ik(0)
D (X) = E (x2) — (E (X))2 = —14 (0) + [14 (0)]
kx(t) = 1+iE(X)t- [D(X)÷(E(X))2] 1+o(t2)
Simbol o (ta) upotrebijen u svojstvu (k5) oznaëava da je 1im = 0.t—*o
58 3.5. Karakteristina funkcija
Kako smo vidjeli, karakteristiena funkcija slueajne varijable odredena je preko njene distribucije vjerojatnosti. Sada istaknimo kako odrediti distribuciju vjerojatnosti sluaajne varijable akoje pozuata njena karakteristiena funkeija.
Teorem (Teorem inverzije) *
(a) Ako je kx karakteristiena funkcija od Fx i ako su a i b (a < b) proizvoljnetoëke neprekidnosti od Fx , tada je
Fx(b) — Fx (a) = fi1 kx (t) dt.
(b) Ako je f Ikx (t)I dt < oo, tada pripadna distribucija vjerojatnosti je kontinuirana
distribucija s neprekidnom i ograniëenom funkcijom gustoée vjerojatnosti
f(x)= 7 etxkx(t)dt, x ER.
(c) Ako je X diskretna slueajna varijabla sa skupom moguoih vxijednosti1Z(X) = {O, ±1, ±2 -.. } i sa karakteristienom funkeijom kx , tada vrijedi
prP(X=r)116_ittkx(t)dt, r=O, ±1, ±2
Dokaz ovog teorema moe se naéi, na primjer, u N. Sarapa 5]. [Ii
Prinjer 16. Odrediti karakteristienu funkciju za Bernoullijevu distribuciju Bern(p).
Ad. U pitanju je distribucijaXk 0 1Pk 1—pp
pa je karakteristiena funkcija Uk(t) = e’°(1—p) +eit1 p lp+p& = q+p&t, q = i—p.
Primjer 17. Neka slueajna varijabla X ima diskretnu uniformnu distribuciju:P (X = r) = r = 1,2,--. , ii . Odrediti karakteristienu funkciju za X.
tER.
Prirnjer 18. Odrediti karakteristienu funkciju kontinuirane uniformne distribucije Urt(a, b)
a1 1 zbt_iat
k(t) /ettx. dx= ._..ettxl= , teR.j b—a b—a it a zt(b—a)
Za sirnetrjëan interval [—1, 1] imamo
tER.
UU[1!
3. Karakteristine vrijednosti I funkcije sluëajnih varijabli 59
Primjer 19. Odrediti karakteristienu funkciju za eksponencijalnu distribuciju Ex(a).
Ad.
k(t)fettx
. aeXdx = afe(it_a)xdx
=a
.e(it_T a .&tx._T=a
, taR.it—a it—a o a—it
Primjer 20. Odrediti distribuciju vjerojatnosti ako je poznata karakteristiena funkeija
k(t) =3 +:ost
Ad. Kakoje
k(t) = + et1 +
to je k karakteristiena funkcija slueajne varijable X s distribucijom vjerojatnosti
—1 0 11 3 18 4 8
Primjer 21. Odrediti distribuciju vjerojatnosti za sluëajnu varijablu X ako je
1kx(t) , tER.
Ad. Karakteristiena funkcija kx je realna pa sluëajna varijabla X ima simetriënu distribucijuvjerojatnosti u odnosu na ishodite. Zapazimo da je
1 1/_1 11+t2_21_it+1+it
Funkcija t—
je karakteristiena funkcija za X Ex(1) s funkcijom gustoôe fx @1 =z 0. Prema svojstvu (k3), funkcija t —f rh je karakteristiena funkcija za slueajnu varijablu—X, gdje je X Ex(1). Funkcija distribucije za —x shjedi iz
P(_X�x)=P(X�-.x)=ex, x�0.
Odavde je funkcija gustoée fx (x) = eX, x 0. Prema tome, funkeija gustoôe koja odgovaradanoj karakteristienoj funkciji je
f(x)&x(x)+fx(x))eH, xER.
Distribucija vjerojatnosti s ovom funkcijom gustoée pozuata je kao Laplaceova iii dvostranaeksponericijalna distribucija s parainetrom a = 1.
60 35. Karakteristiëna furikcija
4. Neke znaèajne distribucije
4.1. Binomna distribucija
Distribucija Bernoullijeve s1uajne ‘varijaNe je najjednostavniji model i izvor je mnogih rezultatau teoriji -vjerojatnosti i matematiëkoj statistici. Distribuciju Bern (p) koristimo I ovdje.
Promatrajmo jedan pokus sa sluëajnim ishodima i dogadaj A s vjerojatnoéu P (A) =
vezan za taj pokus. Pretpostavimo da pokus ponavijamo n puta nezavisno I u neizmjenjenimuvjetima. To znaëi da su ishodi u razlieitim pokusima nezavisni dogadaji I da je P (A) = p u svimpokusima. Za te ishode moemo uzeti dogadaje A I Ac, jet nas u svakom pokusu interesirajusamo dogadaji A i A’, pri ãemu je F (AC) = 1 — p = q.
Ovdje je u pitanju matematieki model za n nezavisnih pokusa od kojih svaki ima samo dvarnoguéa ishoda i to “uspjeh” (1) 1 “neuspjeh” (0), tj. realizacija dogadaja A i nerealizacijadogadaja A (realizacija dogadaja AC), pri ëemu je vjerojatnost uspjeha u svakom pokusu ista.Ovakav model poznat je kao Bernoullijeva shema.
Sada definirajmo sluöajnu varijablu X kao broj koji iskazuje koliko se puta realizirao dogadajA, tj. koliko se puta ostvario “uspjeh”, u n—terostrukom ponavijanju ii neizmjenjenim uvjetima.Slueajna varijabla X 1€ diskretnog tipa sa skupom moguéih vrijednosti
R(X)={0,1,2,... ,n},
buduéi da se u n ponavijanja dogadaj A moe realizirati nijednom, jednom, itd. do n puta.Odredimo vjerojatnost dogadaja da slueajna varijabla X uzme vrijednost k, tj. vjerojatnost
dogadaja{X=k}zak=0,1,... ,n.Neka je A dogadaj da se realizira dogadaj A u i—tom ponavijanju, a A’ dogadaj da se ne
realizira dogadaj A u i-tom ponavijanju. Imamo
P(A)=P(A)=p, P(A)=P(K)—1—p=q, i==1,2,. ,n.
Dogadaj {X = k} je skup svih nizova nezavisnih dogadaja duine n u kojima se dogadaj A javljaIc puta, a dogadaj AC se javlja u preostalih n — Ic puta i moemo ga prikazati kao:
(4.1)1 2 n—k n—k+1 n—k-4-2 fl
Odredimo sada vjerojatnost dogadaja (4.1). Svaki dogadaj u zbroju nezavisnih dogadaja(4.1) je umnoak n nezavisnih dogadaja i iskazuje realizaciju dogadaja A Ic puta i nerealizacijudogadajaAn—k puta, pajevjerojatnost svakog odtih dogadajajednaka9q k, kao vjerojatnostumnoka on n nezavisnih dogadaja. Ako u (4.1) svaki A zamijenimo s A, a svaki A zarnijenimo
61
4.1. Binomna cHstribucija
s onda je lako zapaziti da desna strana od (4.1) predstavlja zbroj svih permutacija od nelemenata s k jednakih in — Iv jednakih, paje taj broj jednak
p(n) —72!
k,n—k k!Qn—k)!—
Tako imamo:
Pk =p(k) = P(X = k) = ()pkqn_k. (4.2)
Distribucija slueajne varijable X sa skupom moguéih vrijednostiTZ(X)={0,1,2,.. ,n}
i s pripadnim vjerojatnostima
Pk =p(k)=P(X = Iv) = ()pkqn_k, k=0,1, ,n
naziva se binomna distribucija, ovisi o dva parametra ii i p i oznaëava se s B (n, p).
Primijetimo dajepk >0, Iv = 0,1,... ,n i daje
()pkqTh_k = (p + q)’ = 1 . (4.3)
Relacija (4.3) pokazuje daje zbroj svih vjerojatnosti >Zpk iskazan binomnom formulom, ëime
se i opravdava naziv binomna distribucija. Za s]ilcajnu varijablu X s binomnom distribucijomkate se da je binoruna slueajna varijabla I pie se x r’s B (n,p).
Pri izraëunavanju uzastopnih vjerojatnosti p (Iv) za veée vrijednosti n i Iv zgodno je koristitirekurzivnu formulu. KoristeOi (4.2), kvocijent
p(k) n—k+1 pp(k—1) Iv q
Udaje rekurzivnu formulu:
p(k) = n_k+l..P(k_l) , k=1,2,••• ,n, (4.4)
p(O) = qfl•
Radi efikasnijeg izraëunavanja vjerojatnosti u binomnoj distribuciji (kao I u drugim znaëajnimk
distribucijama) niogu se koristiti I tablice vrijednosti za Pk i za razne vrijednosti n, p i Ivi=1
(vidi Tablice B.1. i B.2., Dodatak B).Binomna slueajna varijabla X moe se prikazati i kao zbroj indikatora:
X=I1+I2+.+Ifl=ZIk, (4.5)
Un
4. Neke znabjne distribucije 63
gdje je ‘j, slueajna varijabla koja mote uzeti vrijednost 0 iii 1 s obzirom na to da ii se uom pokusu dogadaj A nije iii jeste realizirao (tj. da ii se u k-om pokusu ostvario neuspjeh”iii “uspjeh”). Sluaajne varijable ‘1,’2,•• It-, su nezavisne, svaka se ravna p0 Bernoullijevojdistribuciji s oeekivanjem i disperzijom:
E(Ik)=p, D(Ik)=p(l—p)=pq. (4.6)
Odredimo sada oëekivanje I disperziju binomne sluëajne varijable. Koristcái (4.5) 1 (4.6)jednostavno dobivamo:
E(X) =E(ZIk)
=E(I=np,
D(X) = D(Zim) =D(Ik)=pq=npq.
Oeekivanje I disperziju slueajne varijable X B(n,p) mogu se odrediti i po definiciji koristeéi(4.2). Ovaj postupak je tei. Tako je:
E(X) = Zkpk = k)pkq =(k — 1)!(n —
pq = (k — 1 = j)
=0j!(n—j— /q3=npq3_1 p.
Ovdje smo iskoristili da je
=
jer je to zbroj vjerojatnosti u B (n — l,p) distribuciji. Slieno (samo rnalo tee) nalazi se da je
E (x2) = Pk = np + n (n — 1) p2,
pajeD(X) = E (X2) — (E (X))2 np + n (n —1) p2 — (np)2 = npq.
Koeficijenti asimetrije I sp1jotenosti su, redom:
q—p 1—6pq8= - 4.7
npq
Primjetimo da koeficijenti asimetrije i sp1jotenosti tee nuli kada n tei beskonaenosti. Kakoéemo vidjeti, to je u vezi s konvergencijom binomnog zakona distribucije normalnom zakonudistribucije kod kojeg su ovi koeficijenti jednaki nuli.
Primjer 1. Zna se da je 0, 02 vjerojatnost da je jedan proizvod neispravan I neka se iz jednogvelikog skladi&ta uzima 100 proizvoda. Odrediti vjerojatnost da medu tih 100 proizvoda brojneispravnih nije veái od 5.
4.1. Binomna distribucija
Ad. Neka je A dogadaj da je proizvod neispravan. Imamo:
P(A)=0,02=p, P(K)=1p=q=0,98
U pitanju je binomna distribucija B (100, 0,02).Nekaje B dogadaj da broj neispravnih proizvoda nije veéi od 5. Dogadaj B je unija nezavisnih
dogadaja:5 n
B=(X=0)u(X=1)u(X=2)u...u(X=r5)=u(X=k),
gdje je sluëajna varijabla X r.’ B (100, 0,02), pa je
P(B) = P = k)) = = (1O0)o 02k 098100—k
Primjer 2. U proizvodnji odredenili artikala na 100 artikala pojavijuje se 75 artikala prvekiase. Na slueajan naëin uzimamo 5 artikala. Neka je X broj artikala prve kiase od S izabranih.Odrediti: distribuciju vjerojatnosti, funkciju distribucije, oëekivanje i disperziju, koefIcijenteasimetrije I sp1jotenosti sIueajne varijable X.
Ad. Vjerojatnost izbora artikia prve k].ase je p = =, pa je:
P0 = p(O) = P(X = 0) = ()5 = = 0,00098.
Sadaje, prema (4.4) ( = 3):
= p(1) =P(X=1)=530,00098=0,01465 ,
P2 = p(2)=P(X=2)=230,01465=0,08789, U
= p(3)=P(X=3)=1.3.0,08789=0,26367,
P4 = p(4)=P(X=4)=3.0,263G7=0,39551, 11:
Ps = p(5)=P(X5)3.0,39551=0,23730. P5 UGrafiaki prikaz distribucije vjerojatnosti dan je na slici 4.1. pomoéu poligona i histograma distribucije vjerojatnosti. Poligon distribucije vjerojatnosti je iziomijena krivu]ja koja je odredenatoekama (k,pk), k = 0,1, , 5. Histogram distribucije vjerojatnosti prikazan je nizom pravokutnika ëije su osnovice na apscisnoj osi sa sreditem u toëki k i visine Pk, Ic = 0, 1,... , 5.
iiFunkcija distribucije: U
0,00000, a: <0,0,00098, 0�x<1,0,01563, 1�x<2,
F(x)=P(X �x)= 0,10352, 2<z <3,0,36719, 3�x<4,0,76270, 4�x<5,1.00000, a: � 5
U[1
4. Neke znaëajne distribucije 65
apk
0 1 2 3 4 5 k
Slika 4.1.
Prema (4.7), koeflcijenti asimetrije I spljotenosti su:
—q—p
——2
— —
1—6”” —9= =_zI_O,1333.
npq 15
Distribucija vjerojatnosti je asimetriãna s negativnom asimetrijom jima negativnu sp1jotenost.
Primjer 3. Za sluëajnu varijablu X rs B (n, p) odrediti karakteristienu firnkciju, a zatimoeekivanje i disperziju.
Ad. Karakteristiena funkcija za Bernoullijevu sluëajnu varijablu je:
k(t) =q+peit . (4.8)
Uzmimo daje sluoajna varijabla X zbroj nezavisnih indikatora (4.5), s jstom karakteristiOnomfunkcijom (4.8). Slijedi:
kx (t) = k71 (t) k12 (t) . . . k1, (t) = (q +peit)Th
Iz k) (0) = r , slijedi:
E(X9 = 4-k5(0) ,
E(X) = k(0)= n(q+pej’ pe .iJ =np,
E (X2) = (0) — (n(n —1) (q+pe’)2 . . + n (q+pej’ .pett . i2)
= n(n—1)p2+np.
Sada je D (X) = n (n — 1) p2 + np — (np)2 = npq.Kako vidimo, koristeOi karakteristiauu funkeiju lako smo odredili oeekivanje i disperziju.
4.2. Poissonova distribucija r.
4.2. Poissonova distribucija
U Primjeru 1, koji je dan uz binomnu distribuciju, moemo zapaziti da je efektivno raëunanjevjerojatnosti Pk u s1uajevima kadaje ii velik vezano s raeunskim tekoóama. Stoga su zanimijiviaproksimirani izrazi za vjerojatnosti 73k kada je ii velik. Uglavnom radi se s dvije vrste aproksimacija: Poissonovoj i normalnoj. Ako je up < 10 primjenjuje so Poissonova aproksirnacija, a uslueaju up> 10 primjenjuje so normalna aproksimacija. U oba slueaja podrazumijeva se da jeTi velik, recimo n > 50. Ukoliko je n veée utoliko je pogreka aproksimacije manja.
Promatrajmo Poissonovu aproksimaciju i definirajmo Poissonovu distribuciju.Ako stavimo da je up = A > 0, tada je
73k =p(k)= P(X = k) = k= 0,1,2,---, kadan— .
Zaista:
73k = P(X= k)= ()pkqn_k =n(m 1)--.(n—k+ 1)
(A (i_ jn_k
= Ak( A)( A)k( i (12)Qk-1)
(1_.:)nz:toe_A.
n n n—cok!
U Primjeru 1 je A = up = 100- 0, 02 = 2 < 10, to moemo primjeniti Poissonovu aproksimaciju, pa je
=0,78041. [1
Da bi naffli vrijednosti izraza i za razliëite vrijednosti A, k i ni mogu se
konstiti odgovarajuée tablice za te izraze.Prema gornjoj aproksimaciji, na brojeve k = 0,1,2,--- moemo gledati kao na vjero
jatnosti dogadaja da slueajna varijabla X poprimi vrijednosti k = 0,1,2,---, tj. da je
73k =p(k) = P(X k) = e_A, k =0,1,2,--- - (4.9)
Zapazimo dajepk � 0, k = 0,1,2,--- i daje
>7,73k = >7e-j- = eA>7j. = eeA = 1 -
Distribucija slueajne varijable X koja poprima vrijednosti iz skupafl(X) = {0,1,2,---}
S vjerojatnostima
PkP(k)P(X=k)=&r, k0,1,2,--- Linaziva se Poissonova distribucija, ovisi o jednom parametru A i oznaëava se s Po (A).pU
F,U
4. Neke znaajne distribucije 67
Ako treba izraeunati vjerojatnost p (k) za vie uzastopriih vrijednosti It, tada formula (4.9)nije najpodesnija. Ako p (It) podjelimo s p (It — 1) imamo:
p(k) Ap(k—1)
— It
a odavde dobivamo rekurzivnu formulu:
p(k) = p(k—1), k=1,2, (4.10)
p(O) =
gdje smo p (0) uzeli iz (4.9).k
Za vrijednosti pk i moemo koristiti i Tablice B.3. i B.4., koje su dane u Dodatku B.i=1
Znaaj Poissonove distribucije nije santo u tome to je ona aproksimacija binomne distribucije. U teoriji vjerojatnosti I teoriji slueajnih procesa ima ëeste primjeue.
Sluaajna varijabla s Poissonovom distribucijom naziva se Poissonova slueajna varijabla Ikoristi se oznaka X Po (A). Ona se koristi kao model za broj telefonskih poziva u jedinicivremena, broj prolaza automobila u jedinici vremena, broj prolaza kosmiekih zraka, brzinaradioaktivnog raspada nekog materijala, ltd. Parametar A predstavlja srednju vrijednost ovihdogadaja. Tako imamojedan “potok dogadaja”. Rijee “dogadaj” ovdje nije upotrebljena u smisluslueajni dogadaj, veé oznaëava jednu slueajnu toëku na vremenskoj poluosi [0, +c) (slika 2).Oznaeimo s X [a, 6] sluëajnu varijablu koja predstavlja broj “dogadaja” u vremenskom intervalu[a, 6]. To je sluaajna varijabla diskretnog tipa sa skupom moguéih vrijednosti (0, 1,2, . }.Veliki broj situacija koje sreéemo u primjenama zadovoljavaju slijedeée pretpostavke o sluëajnojvarijabli X [a, 6]
a) distribucija vjerojatnosti za X [a, 6] ne ovisi o poloaju intervala [a, 61, nego samo o njegovojduljini 6— a:
pk(b—a)=P(X[a,b]=k),
b) ako su intervali [a1, bi], [a2, 62] disjunktni, tada su dogadaji {X [ai, b] = ki} i{X [a2, 62] = k2} nezavisni za svaki It1, It2 = 0,1,2,..
c) nemoguónost da se u bib kojem trenutku t “dogodi” vie od jednog “dogadaj&’.Pokazuje se da pod ovim pretpostavkama slueajna varijabla X (t) = X [0, t] ima distribuciju
Po (At), gdje je A > 0 fiksiran parametar koji karakterizira intezitet “potoka dogadaja”.
r x xlo La 6 t
Slika 4.2.
Odredimo oeekivanje i disperziju slueajne varijable X r.-’ Fo (A). Imamo:
E(X) = = e Z(k 1)1= = AeZ = Ae_ACA = A
4.2. Poissonova distribucija
B (X2) = = e_AZk(kAk
= (k — 1 = j)00 A’ 00
= eZ (i ± = +j=o j=o j=o
= A>je_A4+Ae_AZ4 =AE(X)+Ae_AeA=A2+A,
D(X) = E(Xi—(E(xfl2=A2+A—A2 =A.
Koeficijenti asimetrije I spIjotenosti su:
1 18k,
Primjer 4. Odrediti vjerojatnosti p (k) Poissonove distribucije Po (1,2) zak = 0, 1,2,3,4,5,6,te osnovne karakteristiene vrijednosti ove distribucije.
k 0 ‘1 2 3 4 5 6p (k) 0,3012 0,3614 0,2169 0,0867 0,0260 0,0062 0 0012
Matematiako oekivanje I disperzija su:
E(X)=A=1,2=D(x).
Koeflcijenti asimetrije I sp1jotenosti su:
Sk==4=0,913, E==Q,833.
Primjer 5. Neka se slueajna varijabla X ravna 0 Poissonovoj distribuciji Po (1). Odrediti:a) distribuciju sluëajne varijable X,b) funkciju distribucije,c) vjerojatnosti dogadaja: (X � 2}, {2 <X < 6}, {X > 5}.
Ad. a) KoristeOi formulu (4.10) (A = 1) jednostavno nalazimo uzastopne vjerojatnosti (motese koristiti i odgovarajuea tablica vrijednosti p (k)) i dobivamo distribuciju vjerojatnosti slueajnevarij able X:
(0 1 2 3 4 5 6 7 8L,0,3679 0,3679 0,1839 0,0613 0,0153 0,0031 0,0005 0,0001 0,0000
Vjerojatnosti p (8), p (9) ltd. nisu jednake null, one su zanema.rivo maie i u zapisu na eetiridecimale one jesu jednake null.
Ap
4. Neke znaéajne distribucije 69
b) Iz gornje sheme slijedi:
0, x<0,0,3679, O�x<1,0,7358, 1�x<2,0,9197, 2<z<3,
Ffr) =P{X � x} = 0,9810, 3 <x<4,0,9963, 4�x<5,0,9994, 5�x<6,0,9999, 6�x<7,1,0000 x�7.
c)
P (X � 2) = 1 —P (X < 2) = 1 — F (1) = 1 — 0,7358 = 0,2642
P (2 < X < 6) = F(S) — F (2) = 0,9994—0, 9197 = 0,0797
P (x > 5) = 1—P (z � 5) = 1 — F(S) = 1—0,9994 = 0,0006
Primjer 6. Odrediti distribuciju vjerojatnosti sluëajne varijable X koja se ravna p0 Poissonovoj distribuciji Po (5) i nacrtati poligon i histogram te distribucije vjerojatnosti.
Ad. Koristeêi formulu (4.10) Q = 5) (iii tablicu vrijednosti p (k) = dobivamotraenu distribuciju
ki 0 112 3{4p (k) j 0,0067 0,0337 0,0842 0,1404 0,1746 0,1755
6 7 8 9 10 110,1462 0,1044 0,0653 0,0363 0,0181 0,0082
p(k)
0 1 2 3 4 5 6 7 8 9 10 k
Slika 4.3.
Vrijednosti p (0), p (11), p (12), su male pa se u grafiëkom prikazu i ne zapaaju.
Primjer 7. Nekaje X(t) broj ëestica koje emitira radioaktivni izvor za t sati. Neka X(t) imaPoissonovu distribuciju Po(20t). Kolika je vjerojatnost da radioaktivni izvor emitira 7 ëestica unekom 15—minutnom intervalu?
Ad. Kako jet = 0,25 sati, slueajna varijabla X(t) ma distribuciju Po(5). Traena vjerojatnost je
P(X= 7) =e5 = 0,104.
70 4.3. Normalna iii Gaijssova distribucija ¶1
Primjer 8. Odrediti karakteristienu funkciju za Poissonovu slueajnu varijablu X.
Ad.
kx (t) = E (eitX) = Zett, = = e_Ae1t eIt_1) . P
Zadatak. Koristeêi k5) (0) = i’E (X9 = pokazati da su koeficijenti asimetrijei sp1jotenosti:
1 1
4.3. Normalna iii Gaussova distribucija
Normalna iii Gaussova distribucija ima posebno vanu ulogu u teoriji vjerojatnosti i maternati-koj statistici. Normalna distribucija je posebno znaãajna zato to se ona javija graniënomdistribucijom kojoj konvergiraju mnoge distribucije.
Veê smo napomenuli da je pri velikim vrijednostima ii kod binomne distribucije poe1jnoiéi na aproksimaciju i to Poissonovu iii normalnu. Za Poissonovu aproksimaciju veé smo dobilirezultat, a sada éemo istaknuti rezultat normalne aproksimaeije slijedeôim teorernom.
Moivre-Laplaceov teorem. Nekaje X,-. r..B(n,p), 0 <p <1, ii eN.a) Nekaje k= k=0,1,•• ,n (nEN). Tadavrijedi
(ML1) P(XTh = k) = (fljpkqfl_k ‘eNkada n
—uniformno na svakom konaenom segmentu [a, 61, a xk <6, za sve k ib) Za proizvoljne a, 6 C R, a < 6, vrijedi
(ML2) F (a < Z2’ <6) —* kada n —, oo.
Tvrdenje pod a) poznato je kao Lokalni Moivre-Laplaceov teorem, a pod b) kao Inte- Ugralni Moivre-Laplaceov teorem.
Relacije (ML1) i (ML2) moemo napisati I u oblicima, redom:
1im1.P(X=k) = 1,eXk
m (a Xnp <a) =fe2dx.
(4.11) 0Dokaz. a) Prvo imamo da je
1’k = iij = n_k=n_nv_z=nq_znq(1_x) kadn,
U
4. Neke znaëajne distribucije
jer x ostaje u konaenom intervalu.Sada primijenimo Stiriingovu forrnuiu: m! . m”e”. Imamo:
flflTh
P(X =1 1npk (nq
k) \j)Kako je In (1 + t) = t — -i- 0 (t3) imamo:
Odavde je
in (flP)k (q)
— (nq —x in (i
j
IT— x4 I—
V nq
= —(np+xJfln
x2 (1=
(i + .vnpJ
Oime je prvi dio teorema dokazan.b) Stavimo
1npk (nq’k) kj)
2
Xn,k+1 — Xnk =
Posijednji izraz je integralna suma za Riemannov integral
1 _1xe 2 nk
ëime je dokazan I drugi dio teorema. S
.Jz_ I -frd (4.12)
Dani dokaz je zanimljiv I vrijedan. Medutim, moemo zapaziti da tvrdnje teorema izravno
= Idj!’
Medutixn,
pa imamo
p1 jp k(nq\ipk&lv()
Eq—\(—=n(p+x q x npq,
Iv — np Ic = 0,1,
Tada je
pa irnamo:
Xnk =
P (a <—
,12; n=1,2,.-
1
zk:a<xflk �b
P(Xn = Iv) _!:_ zka<xflk�b
slijede iz tzv. centrainog graniënog teorema koji éemo kasnije upoznati.
72 4.3. Normalna ill Gaussova distribucija
Integral (4.12) ne moe se izraëunati elementarnim postupkom. U odgovarajuéoj tablicinalaze se prib1ine vrijednosti tzv. Laplaceove funkcije
CF(x) = e_t2dt x ER. (4.13)
Funkcija CF ima svojstva:
CF(0)=O, CF(+)=, CF(—)=—,
CF(—x)=---CF(x), xER.Zaista, CF (0) = 0 je oeevidno, a koristeOi poznati Poissonov integral
=
dobivamo:00 00
1 1 1 1 _1 1CF(+o3)=hmCF(x)==Je2 dt=,je2 dt=.
Kako je y (x) = *efr pozitivna I parna funkcija, lako je zapaziti da je funkcija CFmonotono rastuéa i neparna funkcija i vrijedi CF (—x) = —CF (x), x e it Odavde se za negativne vrijednosti argumenta x nalaze vrijednosti funkcije CF (x). Zbog neparnosti je CF (—co) =
(x) = —i. Graf funkcije CF dan je na slid 4.4..
/0.5
N
Vo Ni
/-0.5
Slika4.4. PGeometrijski gledano CF (x) predstavlja povrinu “krivolinijskog trapeza” oznaãenog na slid
4.5.a). Lako se uvjeriti da je (slika 4.5.b)) Ft& II
= CF(b) — CF(a) , a, ER, a < b. (414)a
LI
U
4. Neke znaëajne distribucije 73
Zaista, za a <b vrijedi
(b) ==zf
efrdx = (a) + J&±2dx,
a odavde slijedi (4.14). Tako je, za a> 0
*[e_2dx = (4.15)
Sada (4.11) moemo napisati kao
limP(a<X—np
�b) =(b)—(a) a<b, (4.16)TI—, 00
a kako je
a<b,
to iz (4.16) dobivamo slijedeéu interpretaciju rezultata (ML2) Moivre-Laplaceova teorema kojaje znaëajna za primjene.
Nekaje X, B(n,p), 0 <p < 1. Tada za proizvoljne a,b €111, a <hi za dovoljno velike nvrijedi
P(a �X � b) (b_n) -
Moe se pokazati da je za odredeno n pogreMca u gornjoj prib1inoj formuli to manja to je pbIii
.
a) b)
a’ a’
Slika 4.5.
Kako vidimo, Moivre-Laplaceov teorem, za dovoljno velik m, iskazuje aproksimaciju diskretnebinomne distribucije s kontinuiranom distribucijom koja je definirana funkcijom gustoOe
ço(z)=e , xelR.
Ta aproksimacija je dobra i praktieno se primjenjuje kada je npq> 9. U pitanju je najznaOajnijadistribucija i nazi’va se standardna normalna distribucija.
74 4.3. Normalna WI Gaussova distribucija
Kontinuirana slueajna varijabla X ima standardnu normalnu distribuciju iiistandardnu Gaussovu distribuciju, u oznaci N (0,1), ako je njena funkcija gustoOe
xEI.
Funkcija ‘p poznata je i kao Gaussova iii normalna funkeija.Francuski znanstvenik Abraham de Moivre (1667-1754) prvi je prouiavao normalnu distribu
ciju. Ipak normalna distribucija nosi naziv p0 velikom njemaakom znanstveniku Karlu FriedrichuGaussu (1777-1855) koji je otkrio da se slueajne pogreke raznih mjerenja mogu opisati normaLnom distribucijom. U vezi s funkcijom 4 je tzv. funkcija pogreke Erf (od engleskog nazivaError function) koja se definira kao
Erf (z) = e_t2dt = 2 — 1 .
Odredimo oèekivanje i disperziju slueajne varij able X N (0, 1) . Imamo:
E(X)=fx.(x)=fxefrdx=O,
jet je to integral neparne integrabilne funkeije na simetriënom intervalu,
E(X2) = ( dxex2dx. z)= _7xe2z!+Je2xdx=0±.\/=1, H
D(X) = E(Xi—(E(x))2=1—0=1. HDakie, kod distribucije N (0, 1) brojevi 0 i 1 predstavljaju oeekivanje i disperziju pripadne 6
slueajne -varij able.H
Funkcija distribucije za standardnu normalnu distribuciju je
j (x) = P(X <x) = f(x)dx =
fet2dt.
Veza izmedu funkcije i Laplaceove funkcije je oeevidna I vrijedi 11j(x)=0,5+(x), xER.
Pribline vrijednosti funkcija i mogu se odrediti numeriekom integracijom, a za odredene Iivrijednosti nezavisne varijable vrijednosti ovih funkeija su tabelirane (vidi Tablice B.5 i B.6. iiDodatku B). P
nUP
4. Neke znaèajne distribucije 75
U zadacima koji se svode na integrale oblika (4.14) uglavnom se koristi funkcija ‘1, a moese koristiti i funkcija cP. Tako je
fe_4x2dx = i(b)—i(a) a,beR, a�b,
= (a) — (—a) = (a) —1,
gdje je iskoritena oëevidna veza (—a) = 1—i (a) . Lako je zapaziti da je umjesto 2 (a) —1zgodnije koristiti 2F (a).
Krivulje funkcije gustoée ‘p i funkeije distribucije standardne normalne distribucije N (0, 1)prikazane su na slici 4.6. a) i b). Funkcija gustoée ‘p je parna funkcija, u x = 0 postie maksimalnuvrijeduost ‘p (0) = jima toeke infieksije x12 = ±1.
a) Ltf b)a; 1
0.5
a I
—1 0 :1 0 x
Slika 4.6.
Kontinuirana sluaajna varijabla X ima normalnu iii Gaussovu distribuciju s parametrima m I a-2 (a-> 0) 1 oznaãava se s N (rn, a-2), ako je njena funkcija gustoOe vjerojatnosti
(x—m2
f(x)=—=e, zElR.
Pokaimo cia funkcija f predstavlja funkciju gusto6e vjerojatnosti. Zaista, funkcija f jedefinirana, neprekidna i pozitivna funkcija za svaki x C J1 i
+00 -f00 +00
1 1 1 _!(&2 fit—rn 1 1, f(x)dx= I e 2 a I dx ( =t, dx=crdt =— / e 2 dtl.J a- j—00 -cc
Graf funkcije f je simetriëan u odnosu na it = m, tj:
f(m+x)=f(rn—x), xC]R,
u toeki it = m poprima maksimalnu vrijednost f (m) = —r toeke infleksije Si! = rn±u
75 4.3. Normalna Ii Gaussova distribucija
Funkcij a rtormalne distribucije je
F(x) = P(X � x) = Jf(x)dx = Je()2dt.
Grafovi funkeija gustoóe f i distribucije F ilustrirani su na slici 4.7. a) i b).
b)a)
cv’s ,
0.5I I I
/ I I
I I I II I I
—-
-%I
0 rn—u m m+a 0 n
Slika 4.7.
Kako se vidi, promjena parametra rn ne povlaëi promjenu oblika krivulje distribucije, veO sesamo ona pomjera ii suijeru x-osi. Oblik krivulje opisuje parametar a, jer je
—=
maksimalnavrijednost funkcije i onaje obrnuto proporcionalna saa. Pri poveéanju parametra a maksimalnavrijednost se smanjuje i obrnuto. MedutIm, povrina ispod krivulje uvijek je jednaka jedinici,pa pri poveéanju a- krivulja distribucije postaje pijosnatija, rastee se du x-osi, a pri smanjenjua krivulja se stee i postaje i1jastija du osi simetrije r = m.
Ako siuöajna varijabla X ima normalnu distribuciju s parametrima m I a2, tada slueajnavarij abla
z Xm (4.17)
ma standardnu normalnu distribuciju N (0,1). Lako je zapaziti da supstitucija (4.17) povezujefunkcije gustoéa vjerojatnosti slueajnih varijabli Z r—.’ N (0, 1) 1 X ‘- N (m, cr2) . Standardizirananormaina slueajna varijabla obièno se oznaëava s Z. Za distribuciju N (0, 1) jo se kae da jenormirana normalna distribucija ill jediniëna normalna distribucija.
Oeekivanje I disperziju slueajne varijable X N (rn a2) moemo jednostavno odrediti koristeôi vezu (4.17) i svojstva oeekivanja i disperzije. Tako iz [1!
Li.X=aZ+rn
flcdobivamo: IiE(X) = E(aZ+m)=E(JZ)+E(rn)=aE(Z)+rn=a.0+rn=mD(X) = D(aZ+rn)=D(aZ)+D(rn)u2D(Z)+0—cr2.1n2.
Dakle, parametri rn i a2 kod normalne distribucije N (m, a2) su rnateniatieko oeekivanje 1disperzija pripadne s1uajne varijable. DI
Li
LIfl
4. Neke znaèajne distribucije 77
Rod normalne distribucije N (rn, a2) medijan i oeekivanje su jednaki i vrijedi:
mxz=E(X)=rn.
Odredimo sada vjerojatnost dogadaja da slueajna varijabla X koja ima normalnu distribucijuN (in, a2) poprimi vrijednost na segmentu [a, b], a, 6 € JR. Imamo:
dx=adu)a a
(4.18)—
1 1’ _U2J —4.(.z.raN ,(m\u—d
gdje je Laplaceova funkcija definirana s (4.13).Izraeun (4.18) moemo jednostavno provesti postupkom standardizacije sluëajne varijable
P(a�X�b)__P(am�x_m<m)=m)_(am) (4J9)
Ako u (4.19) uzmemo da je
a—rn---öa i b=rn+ôa, ñ>O,
tada imamo
FGX—mJ<öa) = P(rn_Sa�X�rn+6a)=P(_o�Xin�6)
=
Posebno, za S = 1,2,3 dobivama, redorn:
P (in — a X � in + a) = 2 (1) = 2 . 0,34134 = 0,68268,
P (m — 2cr � X ç m + 2cr) = 2 (2) = 2 •0,47725 = 0,95450,
P (in — 3cr <X <m + 3a) = 2 (3) = 20, 49865 = 0,99730,
Vidimo da se pri normalnoj distribuciji N (rn, a2) praktiëno Oitavo vjerojatnosno optereêenjenalazi na intervalu [in — 3a, in + 3aj sa 99, 7%. To znaëi da so u 99,7% slueajeva oeekuje das1uajna varijabla X poprimi vrijednost iz 3cr okoline oeekivane vrijednosti in. Daije, vjerojatnostpoprimanja broja iz [in — 2cr, in + 2cr] je neto veêa ad 95%, a iz intervala [in — a, rn + a] veâaad 68% (slika 4.8.).
Prema tome imamo maguénost ocjenjivanja raspona maguOih vrijednasti normalne slueajne varijable poznate ii matematiekoj statistici pod nazivom “pravilo tn (dva, adnosno jedan)sigma”.
Centralni momenti za sluèajnu varijablu X N (m, a2)
r (X) = E (X — E (X) = (x — rn)t e2dx
78 4.3. Norrnalna III Gaussova distribucija
Af1
I II I I II I I II I I I
I I I II II I I
rn—Sc rn—2a rn—a- rn+2c rn+3cr
flSlika 48. .2.
u = (x — rn)T, du = (r — 1) (x — rn)T_2 dx Ndv = (x — rn) C_m)dX, v = a2e_(X?fl)2 U
=1 (_ — ,)r—1 e_fr_m)2 T + (r — 1) 2 .7 (x — mr2 e_öm)2dx U-00
‘Co
= (r — 1)c2 — rn)T_2e_mdx IIOdavde dobivamo rekurzivnu formulu: LI
= (r— 1)u2 Pr—2 , r = 2,3,[Ti
Kakoje Ii= 1, =0 toje
PS = P5 —P2k-j-1° k=1,2,••-
Stoga, koeficijent asimetrije kod normalne distribucije je
to se i oeekivalo jer je ona simetriãna distribucija. Daije je
P2a-2, /143J4, p6=5•3c6, ... 2k(21)(2k3)31J2 , k=1,2,.•• .
fl!Dakie, kod normalne distribucije i koeficijent spIjotenosti iii eksces je jednak null, tj. Li
8— —3—O4 -.
UFTLI
U
4. Neke znabjne distribucije 79
Stoga, moe se reói da koeficijenti asimetrije I sp1jotenosti neke distribucije pokazuju u kojojse mjeri ta distribucija vjerojatnosti razilkuje od normalne distribucije.
Odredimo sada karakterjstjene funkcije nekih norrnalnih distribucija. Neka je Z r’. N (0, 1),tada je
+00
k (t) — —f-- itx dx —z ,_1e e —
dokje
kz2 (t) = fe_fr(1_2it)dx
—
2it
Ako je slueajna varijabla X distribuirana p0 normalnoj distribuciji N (m, a2), tada je Z =
22 distribuirana 0 N (0,1) . Kako je X = uZ+im, to normalnoj distribuciji N (m, a2) pripadakarakteristiana funkcija
kx (t) =
Neka su K1, X2,. . . ,X, nezavisne slueajne varijable ave distribuirane p0 riormalnoj distribucijiAko je X = ZXk , tada je
1 22kx (t) =
to znaëi da je i sluëajna varijabla X normalno distribuirana s oeekivanjem i disperzijom:E (X) = mm i D (X) = mu2, tj. X N (mm, flu2).
Zadatak. KorjsteOi karakteristjenu funkciju normalne distribucije N (m, a2) , pokazati:a) ako su X1 N (mi, a?) I X2 ‘.-‘ N (rn2 u) nezavisne sluëajne varijable, onda je sluëajna
varijabla X1 + X2 distribuirana p0 normalnoj distribuciji N (in1 + m2, a + u)b) da je linearna kombinacija nezavisnih normalnih varijabli a1X1 + a2X2 + . + aX
distribuirana p0 normalnoj distribuciji N (aimi + . + a?u? + ... + au)
Primjer 9. Po definiciji odrediti oeekivanje i disperziju sluaajne varijable X N (rn, cr2).
Ad. Imamo
+00
1 (z_m)2— inE(X) = fx C 22 dx= =t, dx=adt
—
a/ a
+00 +00
= =aftc4 dt + mJ=f Ccdt = 0 +rn+z/
= in.
Sliano se dobiva:
F (x2) = z2e_4()2dx = a2 + in2,
4.3. Normalna lb Gaussova distribucija
pa je disperzija jednaka13(X) = + in2 — in2 = a2.
Prixnjer 10. Nekaje X r%’ B(100, 0,5). Koristeéi Moivre-Laplaceov teorem, odrediti prib1inevrijednosti vjerojatnosti:
a) F(X>70) , b) P(X<40) , e) F(30<X<60), d) P(X=50).
Ad. U svim sluãajevima koristimo aproksimaciju:
X—mp X—1000,5 X—50=
100•0,5•,5 5ZN(0,1)
F (X> 70) = F (X; 50
> 70; 50) F(Z > 4) = 0,5 — (4) = 9,5—0, 49997 = 0,00003,
P(X <40) = (X50 40
50) pcz < —2) = 0, 5—(2) = 0,5—0,47725 = 0,02275, ii’:
<60)=P(3055°X—50
60—50)
F (—4 <X < 2) = I (2) — ‘F (—4) = ‘F (2) + ‘F (4) = 0,47725 + 0,49997 = 0,97722
d) U ovom slueaju ne moemo direktno primijeniti dani teorem, all moemo uzeti da je
P(X=50)=F(49.5<X<50,5)
F(X=50)=P(49.5<X �50,5)= (_qsx—so
= P(—0, 1 � Z � 0,1) 2’F(0, 1) = 2 0,03983 = 0,07966 . r.Primjer 11. Nekaje X N(4,25). Odrediti: a) P(—2 � X < 8), b) P (X � —2), c) L
P(X<7).
Ad. Sluèajna varijabla X ima norinalnu distribuciju s E (X) = m = 4, 13(X) = a2 = 25 i LI:s(X)= /13(x) =5, paje
X—4 r=Zn-N(0,1).
Koristeéi tablicu vrijednosti funkcije Laplacea ‘F dobivamo: a)
P(—2<X<8) = F(254�x54�8;4)=P(_L2�z�o,8)= Th(0,8)—’F(—1.2) =‘F(0,8)+’F(1.2) =0,28814+0,38493=0,67307, 0
pU
4. Neke znaajne distribucije 81.
b)
< —2—4) = P(Z K —1.2)=0,5—(1.2)=0,5—0,38493 =0, 11507,
c)
P(X � 7) = F (X; < 4) = P(Z K 0,6) = 0,5+ (0,6) = 0,5 +0,22575 = 0,72575
Primjer 12. Neka je X r.. N (4,25). Odrediti x tako da je: a) P (X <x) = 0,81 , b)P(X <x) = 0,09.
Ad. a) Buduéi da je 0,81 > 0,5 moemo postupiti na slijedeei naëin:
F(Xx)=P(X54<x54)=P(Z<z)=O,8l=O,5+(z) , paje
(z)=0,31
Sada u tablici vrijednosti funkcije Laplacea nalazimo broj koji je najbIii broju 0,31 a to je broj0, 31057 koji odgovara vrijednosti argumenta z = 0, 88. Slijedi
x4_088 pajex=8.40.
b) Ovdje je 0,09 <0,5 pa moemo postupiti na slijedeéi naëin:
P(X�x)=P(X54�x54)=P(z<z)=o,o9=o,5_(_z), paje
‘
(—z) = 0,41Ovdje je —z > 0, U tablici nalazimo najb1ii broj 0,40988 koji odgovara argumentu —z = 1.34,paje z = —1.34 1
x = 5z + 4 = —2.70.
4.4. Gama-distribucija
Gama-distribucija, kao i jo neke znaëajne distribucije koje éemo kasnije upoznati, definirajuse pomofrn gama-funkcije. Stoga, podsjetimo na gama-funkoiju u opsegu koji éemo koristiti.Gania-funkcija je funkcija
1(x) = fe_tt_ldt, x > 0
sa svojstvima:
F(1) = 1 (4.20)
r3) =
I’(x+l) = xF(x), x>0, (4.21)I’(n+l) = ii!, nEN. (4.22)
44. Gama-distribucija 11Zaista,
00
P(l) = f&4dt=_e_tt=1
= fetr4dt = ( =i: ) = /fezdu
=
P (z +1) = fetFdt = ( dv=Ctdt, du=xt::’dt)
= . etdt = zP(x) .
0 Lid
f.mSvojstvo (4.22) slijedi iz (4.20) i (4.21). [I
Graf funkcije P za x > 0 prikazan je na slici 4.9..
Li
-m
U
Uo p
IiSlika 4.9.
fl
URontinuirana sluëajna varijabla X irna gama-distribuciju s paranietrimaa >0 i $>O i oznaëava sos C(a,5), akoje njena funkcija gustoée vjerojatnosti
f (x) = { p—yflx e, z>00, x�0.
UP:,U
n
4 Neke znabjne distribucije 83
Karakteristiena funkcija gama distribucije je:00
k(t) = E (etX) =Jexedx
(/3 - it)°
Odavde je
k’ (t) = icq3° (5— it)t1,
k” (t) = —a (a + 1)50 (5 — it)2.
Sada k (0) = irE (X9, r = 1, 2,••. s1ijedi
E(X) = k’(0) =,
(4.23)
E(X2) = -k(0) a(a+1)paje
D (X) E (x2) — (F (X))2 = . (4.24)
Za a = 1 gama-distribucija postaje eksponencijalua distribucija Ex (5), a za /3 = i an C N, dobiva se tzv.x2—distribucija (hi kvadrat-distribucija), koja je vrlo znaëajna u
matematiëkoj statistici I koju éemo kasuije posebno promatrati.U slueaju x2—distribucije zapazimo da je funkeija gustoée vjerojatnosti
1‘
x> 0. 2F()
0, x<0,
gdje se prirodan broj n zove stupanj slobode distribucije. Oeekivanje I disperzija slueajne vanjable X = G (, 4, prema (4.23) i (4.24), su:
E(X) =
D(X) = 2n.
Oral funkcije gustoée x2—distribuciie ilustriran je na slici 4.10. za vine stupnjeva slobode.Moemo zapaziti da se x2—distnibucija za dcsvoljno velik ii mote aproksinfirati normalnom distribucijom N (ii, 2n).
4.5. Funkcije slueajnih varijabilNekaje poznata distribucija sluajne varijable Xi g : JR
—
JR neprekidna funkcija. Treba odreditidistnibuciju sluëajne vanijable Y = g(X).
Naprimjer, Y=X2+i, Y=12X—1j, Y=eX.Funkciju Y = g (X) treba ovako shvatiti: svakom ishodu w C 12 odredenog pokusa odgovara
broj X (w) odnosno broj Y (w) = g (X (w)) (slika 4.11.). DaMe, Y je funkcija definirana na 12,tj. Y je slueajna varijabla.
84 4.5. Funkcije sluèajnih varijabli
Lkf
21=1
n=2
21=3n=6
2,
pLi
Slika 4.10.
U,
Qx
g
Li) X(w) Y(w) = g(X(w)) flU
YnLi
Slika 4.11.
Prvo promatrajmo slueaj kada je X diskretna slueajna varijabla sa zakonom distribucije
nx=(x1 ;: z). (4.25)
Ako je g strogo monotona funkcija tada ée razlieitim vrijednostima varijable X odgovarati prazlieite vrijednosti varijable Y = g (X), pri ëernu ée vjerojatnosti odgovaraju6ih vrijednosti Livarijabli X I Y biti jednake. Tada sluaajna varijabla Y = g (X) ima distribuciju vjerojatnosti:
Yiq=fi) Y2qj2) Hgdje je P
qj=q(y)=F(Y=y)=p3,j=1,2,...,n. UflIPrimjer 13. Neka slueajna varijabla X ima distribuciju U
x=(011 0,4 p
pU
11
4. Neke znaajne distribucije 85
Odrediti distribuciju vjerojatnosti slueajne varijable Y = 3X — 2.Ad. Distribucija varijable Y je
1 7 160,1 0,4 0,5
Ako funkcija g nije monotona, tada razliëitim vrijednostima slueajne varijable X moe dgovarati jedna vrijednost slueajne varijable Y = g(X). U ovom sluaaju vjerojatnosti moguéihvrijednosti slueajne varijable Y jednake su zbroju vjerojatnosti onih vrijednosti sluáajne vanjable X za koje Y poprima zadanu vnijednost. Vnijedi slijedeôi zakljueak.
Neka diskretna slueajna varijabla X ima distribuciju (4.25) i neka je sluëajna vanijabla Y =
g (X), gdje je g neprekidna funkcija. Tada je Y diskretna slueajna varijabla jima distnibuciju
y(Y1 Y2
\ qi q2 ...
gdjejey =g(xjjzanekekcNi
q=q(y)=P(Y =yj)=P(g(X)=yj)=P(xe {g’(yj)}nlZ(X)) = Zgdje je 7Z (X) = {x1, X2,• } skup moguéih vnijednosti sludajue vanijable X.(sumiranje se vri0 svim k za koje je g(xk) =
Oëekivanj e diskretnie sluëajne varij able Y j eE(Y) = iii
E(g(X)) =
Dakie, oöekivanje E (Y) moemo izraãunati I bez odredivanja distribucije vjerojatnosti sluëajnevarij able Y
Primjer 14. Neka slueajna vanijabla X ima distnibuciju:
—2 —1 1 2 3\ 0,1 0,2 0,2 0,2 0,3
Odrediti distribucjju vjerojatnosti i oeekivanje sluëajne vanijable Y = 3X2 — 2.Ad. Sluaajna varijabla Y lEna distribuciju:
1 10 250,4 0,3 0,3
Oëekivanje E(Y)je
E(Y) = = 10,4+10.0,3+25.0,3=10,9 iii
E(Y) = g(x)pj=10.0,1+1.o,2+1.o,2+1o.o2+25.o31og
4.5. Funkeije sh.iajnih varijabli
Primjer 15. Neka je X r.’ Pa (A). Odi-editi distribucije slueajnih varijabli
a) Yr=X2, 1,) Z=sinQX).
Ad. Prvo zapazimodaje fl(X) ={O, 1, 2,- .-} i daje P(X = k) = k = 0,1,2,a)Slueajna varijabla Y = X2 ima skup moguéih vrijeduosti RL(Y) = {0,1,22,32, . .} pri
ëemu je
P (Y = k2) = P(X = k) = ,k = 0,1,2,---
b) Slueajria varijabla 2 = sin (2X) ima skup moguéih vrijednosti fl(Z) = {—1,0,1} Ivrijedi U
{Z= —1} = {sin(x) =—1}={xc{4k+3 :k=0,1,2,”-}},
{Z=0} = {sin(.x) =o}={xe{2k:k=o,1,2,...}},
{Z=1} = {sin(x)==1}={Xe{4k+1:k=o,1,2,...}} [1
Sada su vjerijatnosti gornjih dogadaja
- hA— AP(Z —1) = ZF(X =z4k+3) &Z(4k3)i e2
P(Z=0) = ZP(X=2k)=Cy,=e_AcoshA00
°° A41 hA+P(Z=—1) = ZP(X=4k÷fl=&Z( —e 2 U
Ovdje smo koristili razvoje funkcija x —, sin x, x —* sinh x i x —* cosh x u pripadne Maclaurinove Iiredove.
Sada, neka je X kontinuirana slueajna varijabla s funkcijom gustoe fx i funkcijomdistribucije Fx i neka je Y = g (X), gdje je g strogo monotona derivabilna funkcija.
Ako je g rastuéa funkcija, tada funkcija distribucije za slueajnu varijablu Y je
Fy (y) = P(Y � y) = P(g(X) � y) = P(X � 1()) = Fx (g’ (y)),
pa je funkcija gustoée od Y
f0dFY(Y) dg’(y) (4.26)U
Ako je g padajuOa funkcija, tada imamo
Fy (y) = P (V y) = P(g (X) y) = P (X � g’ (y)) = 1 — Fx (g1 (y)), ppaje U
fy (y) = -fx (g’ (v)) -dg’ (y) (4.27)
Vii
[I
4. Neke znabjne distribucije 87
Kako je d o;’(v) pozotivno u slueaju kada funkcija g raste, a negativno kada funkeija g pada,relacije (4.26) 1 (4.27) moemo napisati kao
fy (y) = fx (g’) .dg’(y) (4.28)
Za oeekivanje kontinuirane sluëajne varijable Y = g (X) imamo
E (Y) fvf (y) dy. iii
E(g(X))
Primjer 16. Neka slueajna varijabla X ima distribuciju U (0,1). Odrediti distribucijuslueajne varijable Y =
Ad. Funkeija gustoée sluëajne varijable X je
1 1, O<x1,fx(x)1 o, x0,x>1.
Iz y = eX slijedi x = my = g’ (y) i dg(y)=, paje, prema (4.26) iii (4.28),
fy(y)fxny) {‘
y<y>e.
Za oeekivanje od Y imamo
E(Y) = /—=e_i iii
E(Y) = E(eX)=fex.ldx=e_1.
Primjer 17. Neka je slueajna varijabla X s distribucijom N (m, a2) i neka je Z =
Odrediti distribuciju slueajne varijable Z.
Ad. Funkcija gustoée sluëajne varijable X je
I lfx—m\2fx (x) = . (4.29)
cv 27r
Nadaije, iz z = slijedi x = az + in = g (z) dç(z) = a, pa je funkcija gustoêe od Z
I i2
fz(z)=we2
4.5. Furikcije sIuajnih varijabli
Dakie, i na ova] naäin je pokazano da ako je X N (m, a2), tada je ‘- N (0,1).
Primjer 18. Pokazati da ako je X r’s N(m,a2), tada Se slueajna varijabla Y = aX + 6,a, 6 C K, a
�
0 takoder irna normalnu distribuciju i to N (am + 6, at2 2)
Ad. Iz y = ax + 6 slijedi x = (y —6) i = a kako je funkcija gustoée od X definiranas (4.29), to je funkcija gustoée od Y:
1 i(2z=2 1f () = e2 aa I
a 2ir a1
= e °- I
Odavde zakljuëujenio da se sluëajna varijabla Y = aX + 6 distribuira po norrnahioj distribucijiN (am + 6, al2 2)
Primjer 19. Neka sluOajna varijabla X irna funkeiju gustoáe fx (x) = x, x C [0,2].Odrediti funkciju gustoée shxëajne v&ijable Y = 3X + L
Ad. Kako varijabla X uzima vrijednosti od 0 do 2 toje podrueje vrijednosti sluëajne varijableY interval [1, 7J. Nadaije, iz y = 3x + 1 slijedi x = (y — 1) i =
, pa je funkcija gustoóe od
fy(y)(y-1)=(y-1), ye[l,7].
7Lako je provjeriti da funkcija gustoée fy (y) ispunjava uvjet fcp (y) dy = 1.
Primjer 20. Lognormalna distribucija. AZa sluãajnu varijablu X kaerno da ima lognormalnu distribuciju s pararnetrirna ‘(1m i cr2 i oznaëava se s EN (m, a2) ako je podrueje njenih vrijednosti fl (X) = = (0, +oo) UI pri torn se slueajna varijabla Y = lnX distribuira 0 normalnoj distribuciji N (m, cr2)Funkcija gustoée slueajne varijable X je Ii1 AfInr—m\2e 2t 1, x>0fx (x) =
0, x�0. p[INeka slueajna varijabla Y = In X irna normalnu distribuciju N (m, a2) i funkciju gustoêe111 if2 4f()= ,—e 2k a I.
cry 2ir
Odredirno funkeiju gustoáe fx (x) sluaajne varijabk X = e’. Irnarno:
fx (x) = fy (mx)! =1 Qm)2. (4.30) PLi
U
4. Neke znaëajne distribucije 89
Moe se pokazati da su oëekivanje i disperzija sluëajne varijable X:
E(X) =
D (X) = 2m+a2 (eU2 —
Stavimo ii u (4.30) u =lnz—m dobivamo:
1 1 _12 . 1fx(x)———-,1=e 2 jlj fx(x)=—(u),
gdje je cc funkcija gustoáe jediniene normalne distribucije (distribucije N (0, 1)). Ova vezaoxnoguêuje upotrebu tablice vrijednosti normalne distribucije za lognormalnu distribuciju.
Na slici 4.12. prikazana je krivuDa ognorma1ne distribucije LN (0, 1).
f
0.6
0 21
Slika 4.12.
Lognormalna distribucija inn vanu ulogu u teoriji pouzdanosti, jer se vrijeme ispravnograda nekog uredaja distribuira p0 Iognormalnoj distribuciji.
Primjer 21. Neka je X kontinuirana sluaajna varijabla s funkeijom gustoóe fx (x). Odreditifunkciju gustoée fy (y) slueajne varijable Y = X2.
Ad. Buduái da y = z2 nije monotona finkeija, tj. nije bijekcija, to ne moemo koristiti for—mulu (4.28). Ovdje éemo dati postupak odredivanja funkcije gustoée fy (y) kada y nije monotonafunkeija od x.
Funkcija distribucije Fy od Y, za y > 0, je
Fy(y) = P(Y<y)=P(X2<y)zF(—.J<X<fy)=
a nakon deriviranja po y dobivamo funkciju gustoée od Y
fy(y) = fx(V+fx(—v’)
= (fx()+fx(-)), y>O.
r
90 4.5. Funkcije sIuajnih varijabli
Zapazimo da, u gornjem primjeru, jednadtha y = z2 inn dva rjeenja p0 Z Z1 = = i (y)
I z2 = = 92(y). Sada êemo dati opêi rezultat koji obuhvaoa I slueajeve kada funkcijay = g (x) nije bijekcija (nije monotona funkeija) i jednadba y = g (x) ima vie rjeenja 0 X.
Teorem. Neka je X kontinuirana slueajna varijabla s funkeijom gustoée fx (x) i neka jeY = g (X), gdje je g derivabilna funkcija. Neka jednadtha y = g(x) ima r rjeenja p0 Z
= g (y), x2 = g (y), , a,. = g.. (y), koja su derivabilne funkeije varijable y.Tada je funkcija gustoée sluëajne varijable Y
fy . ____
nU
U
U
iiiU
nUpU
p
ii
ULI
5. Dvodimenzionalne sluèajnevarijable I distribucije
Cesto smo u situaciji da za slueajni ishod w odredenog pokusa veemo ne samo jednu sluaajnu varijablu, veé za svaki w veemo istovremeno dvije iii vie slueajnih varijabli (dva iii vieobi1jeja). Na primjer, suëajuo biramo jednog diplomiranog studenta iz skupa diplomiranibstudenata na Sveuei1itu u Splitu u jednoj akademskoj godini i registriramo postignutu prosjeènu oejenu u tijeku studiranja X i duijinu studiranja Y. Ovdje skup Q predstavlja uoëeni skupdiplomiranih studenata, w je jedan sluëajno izabrani diplomirani student, broj X (w) je prosjeëna ocjena tog studenta (na primjer, X (w) = 3.54), a broj Y (w) je njegova duijina studiranjaizraena u godinama (na primjer, Y (w) = 5.6). Dakle, ovdje nas zanimaju dva podatka (dvaobi1jeja) za svakog studenta iz skupa 12 i to prosjeëna ocjena X i duijina studiranja Y. Kakovidimo, X i Y su sluäajne varijable koje zajedno promatramo pa lb je zgodno i pisati kao uredenipar (X,Y).
Deste su situacije u kojima treba istovremeno promatrati vie slueajnih varijabli i gdje soslueajne varijable ne mogu zasebno promatrati Zapazimo jo jedan primjer. Neka je X brzinaautomobila, a Y potronja gori-va na predenib 100 km. Tada izmedu X i Y postoji odredenazavisnost koja se ne moe ispitati ako se posebno promatraju X i Y.
51. Pojam sliiëajnog vektora
U Poglaviju 1 definirali smo opéi vjerojatnosni prostor (12, F, P) , gdje je F c—algebra skupovano. 12, koji sIui kao matematieki model za prouëavanje slueajnih pokusa.
Svakom ishodu slueajnog pokusa pridruujemo neki realan broj, a no. skupu svih moguéihishoda 12 jednog pokusa moemo definirati funkeije koje zovemo sluëajne varijable. U sluaajukadaje skup 12 konaãan ill prebrojiv uveli smo diskretni vjerojatnosni prostor (12, P (12), P),a svaka ream. funkcija na 12 je diskretna sluäajna varijabla koja mote primiti najvie prebrojivomnogo razliëitih vrijednosti. U slueaju neprebrojivog skupa 12 uveli smo vjerojatnosni prostor(12,8, F), gdje je 13 Borelova c—algebra I vrijedi
B_—zc{(a,b):a,bcJR,a<b},
a no. 12 definirali smo kontinuirane slueajne varijable.Analogno se definiraju I sluaajni vektori.
91
92 5.1. Pojam sluëajnog vektora
Definicija. Neka je (Q, 7’ (Q) P) diskretni vjerojatnosni prostor. Funkcija X S —* WI kojasvakom ishodu w C Q pridruuje uredenu n—torku X (w) = (X1 , X, (w)) C W1 jeslueajni vektor. Za X = (X1,.•• , X,) kaemo da je n—dimenzionalan slueajni vektor n.iii m—dimen%ionalna sluëajna varijabla na Q.
Obratno, ako su Xj,• , X slueajne varijable nafl, tadaje X = (X1,•. X,) n—dimenzionalansluèajni vektor na 2. Prema tome, n—dimenzionalan sluóajni vektor na Q je uredena n—torkasluãajnih varijabh X1,.. X, na ii.
Promatrajmo sada kontinuiran sluãaj. Neka je (0, F, P) vjerojatnosni prostor koji odgovarajednorn sluãajnom pokusu i neka u vezi s tim pokusom mjerimo dvije velieine X1 I X2. Svakojtoëki w e Q pridruiujemo toëku X (w) = (X1 (w) , X2 (w)) c JR2 Promatrajmo vjerojatnost d.aX padne u pravokutnik (a, b) x (c, ci) CR2, tj. da je a <X1 (w) <b, c < X2 (w) <ci. Imamo
P{w €0: X(w) c (a,6) x(c,d)}=P(X’Ua,b) x(c,d))) = P(a < X1 <b, c< X2 < d).
Ovo ée biti moguée samo ako je X’ (B) C F za svaki pra-vokutnik B = (a, b) x (c, ci). Kako je Psvaki otvoren skup u K2 prebrojiva unija otvorernh pravokutnika, to je U
B2 =c{(a,b)x(c,d):a,b,c,delR, a<b, c<d}, PUtj. B2 je u—algebra na JR2 i vrijedi X1 (B) C F za svaki B C B2.
Sa B’2 oznaëimo u—algebru na WI generiranu familijom svih otvorenih intervala od WI. B”zovemo c—algebra Borelovih skupova na WI, a elemente od 13” zovemo Borelovi skupovi na JR’2.Vie o ovome vidjeti, na primjer, u [5j.
U
Definicija. Neka je (Q,F, P) vjerojatnosni prostor. Funkc.ija X: 0 —* K” je Pn—dimenzionalan sluëajni vektor (kraée, slu&jni vektor) na 0 ako je X1 (B) C F Uza svaki B C 23”, tj. X’ (B”) CF.
nU
Intervali u WI defmniraju se analogno kao u JR. Tako za a, b c F’, a = (aj,.. ,a), b =
,b,jimamo [1(a,bl = {xz(xt,...,xfl)e11”:ak<±k<bk,k=l,2,...,n},
(—c,b] = {xcR”: xk<bk, k=l,2,. ,n},(a,oo) = {acR”: rk>ak, k=1,2, ,ri}.
U ovom poglaviju promatrat éemo sluaj n = 2, tj. dvodimenzionalan sluëajni vektor iiidvodimenzionaffiu sluOajnu varijablu Z = (X, Y). U ovom slueaju, svakoxn ishodu w € 0slueajnog pokusa pridruuje se ureden par vrijednosti (X(w) ,Y(w)) eM2 (slika 51.).
ULI
5. Dvodimenzjc,nalrie suëajne varijable distribucije 93
(YY)
(X(w),Y(w))
Slika 5.1.
5.2. Diskretne dvodimenziorialne distribucijeDvodimenzjonalna sluaajna varijabla Z = (X,Y) je diskretnog tipa ako je njen skup moguêihvrijednosti diskretan (konaean iii prebrojiv):
7Z(X,Y)={(xi,y)eR2:i,j=1,2,...}
pri emu jePX,Y) e R(X,Y)) = 1. (5.1)
Definicija. Kaemo da je zadaia distribucija (lii zakon distribucije) suëajnogvektora Z iii zajednieka clistribucija slueajnih varijabli X i Y ako su za sw i, j zadaniparovi (xi,yj) c JR2 i brojevi
zasvei,j,pri ëemu je
p�O, zasvei,j i pjj=1.Funkcija p (x, y) definirana na uredenim parovima (xi, yj) naziva se funkcijavjerojatnosti dvodimenzionalne sluëajne varijable (X, Y) diskretnog tipa.
Funkciju p (x, y) neki nazivaju funkeijom gustoée vjerojatnosti i oznaëavaju s f (x, y).Primjetimo da izraz EPij iskazuje vjerojatnost dogadaja da slueajna varijabla (X, Y) uzme
3,3
bib koju moguóu vrijednost (z, y), a kako je to siguran dogadaj vrijedi >pij = 13,3
Distribuciju vjerojatnosti diskretne slueajne varijable (X, Y) zgodno je prikazati tablicom:
X\Y Yi Y2z1 p(zi,y1) p(xi,y2) I ... p(xl,yj)
z2 p(z2,yl) p(x2,y2) . . . p(x,y.j)
x p(zj,yl) P@i,Y2) .. .
5.2. Diskretne dvodimenzionalne distribucije
Primjer 1. Distribucija diskretne sluoajne varijable (X, Y) dana je slijedeOorn tablicomvrijednosti F(X = 1, Y =j), = 1,2,3, j = 1,2:
i\j 1 21 0.12 0.112 0.25 ?3 0.16 0.15
nOdrediti: a) vrijednost koja u tablici nedostaje, b) P (Y = 2), c) P (X > Y).
tsj
Ad. a) Zbroj svih vjerojatnosti u tablici treba biti 1, pa je izostavijena vrijednostn
p22=P(X=2,Y=2)=0,21.
b) Dogadaj da sluëajna varijabla Y poprimi vrijednost 2, bez obzira koju Oe vrijednost pritome poprimiti varijabla X, moemo iskazati kao uniju dogadaja:
{Y2}{X1,Y2}U{Xrz2,Y2}U{X3,Y2}
pa je traena vjerojatnost U
P(Y=2) = P(X=1,Y=2)+P(X=2,Y=2)+P(X=3,Y=2) U= 0.11 + 0.21 + 0.15 = 0.47.
c) Kako je X > Y samo ako varijabla (X, Y) poprima nijednosti (2, 1) (3, 1) i (3,2), to je
P(X>Y) =0.25+0.16+0.15=0.56. [1Prirajer 2. Istovremeno bacamo novOié i kocku. Neka X predstavlja pojavu odredene strane
na novëiéu, a Y pojavu broja na kocki. Odrediti distribuciju slueajne varijable (X, Y).Ad. Skup moguéih vrijednosti varijable Yje RJY) = {1,2,3,4,5,6}, a varijabla X moe
uzeti dv-ije vrijednosti 1 neka je taj skup vrijednosti R.(X) = {0, 1), gdje 0 oznaãava pojavuglave a 1 pojavu pisma. Dvodimenzionalna slueajna varijabla (X, Y), mote uzeti 12 vrijednosti(1, j), = 01 j = 1,2,•• , 6, a vjerojatnost dogadaja da varijabla (X, Y) uzme bib koju od tihvrijednosti je tj. vrijedi
pj=p(i,j)=P(Xj, Y=j)=4 1=0,1, j=1,2,•• ,6.
Distribucija slueajne varijable (X, Y) prikazana je tablicom:
[x\Y 1 2[3 4 5 60 .i. I _i ± I i51 12 12 12 i t 112
II
n
5. Dvodimenzionalne sluëajne varijable I distribucije 95
Primjer 3. Dvije trake proizvode odredeni artikal. Neka je, u jedinici vremena, kapacitetproizvodnje prve trake 4 artikia, a druge 3. Pretpostavimo da su brojevi proizvedenih artikalana svakoj traci slueajni. Neka (X, Y) predstavja proizvodnju prve i druge trake. Skup svihmoguéih vrijednosti za (X, Y) je skup
‘R(X,Y) = {(i,j) ER2 i = 0,1,2,3,4, j = O,1,2,3}
Neka je distribucija vjerojatnosti s1uajne varijable (X, Y) dana tablicorn:
X\Y 0 1 2 30 0,01 0,02 0,02 0,021 0,02 0,04 0,04 0,042 0,04 0,06 0,07 0,053 0,06 0,06 0,07 0,084 0,08 0,07 0,07 0,08
Odrediti vjerojatnosti dogadaja:a) da pna traka proizvede dva artikia,b) da prva traka proizvede vie od druge,c) da druga traka proizvede manje od dva artikia.
Ad. a) Ovorn dogadaju odgovaraju ishodi:
(2,0), (2,1), (2,2), (2,3), paje
P(X =2)= P(X=2,Y=0)+P(X=2,Y=fl+P(x=2,Y=2)-l-P(X=2,Y=3)= 0.04 + 0.06 + 0.07 + 0.05 = 0.22
b) Toèke (i,j) za koje je i > j su:
(1,0), (2,0), (2,1), (3,0), (3,1), (3,2), (4,0), (4,1), (4,2), (4,3) . (5.2)
Vjerojatnost P (X > Y) jednaka je zbroju vjerojatnosti da varijabla (X, Y) uzme vrijednosti(5.2), tj.
P(X>Y)=Zp(i,j)i>j
= 0.02 + 0.04 + 0.06 + 0.06 + 0.06 + 0.07 + 0.08 + 0.07 + 0.07 + 0.08 = 0.61
c) Ovdje su u pitanju ishodi (i,j), j < 2, tj.
(0,0) ,(1,0) ,(2,0), (3,0) ,(4,0), (0,1) ,(1,1), (2,1), (3,1) (4,1)pa je traena vjerojatnost
P(Y <2)= Zvi,ij<2
= 0,01 + 0,02 + 0,04 + 0,06 + 0.08 + 0.02 + 0.04 + 0.06 + 0.06 + 0.07 = 0.46
5.3. Kontinuirane dvodimenzionalne distribucije
Primjer 4. Bacamo dva simetriëna tetraedra sa stranicama oznaëenim brojevima od 1 do 4 iregistriramo brojeve na donjim stranicama tetraedara. Neka X oznaäava broj na donjoj straniciprvog tetraedra, a Y veOi od brojeva na donjim stranicama. Odrediti distribucije sluëajnihvarijabli X i Y i njihovu zajednieku distribuciju, tj. distribuciju sluaajnog vektora (X, Y).
Ad. Nije teko pokazati da su traene distribucije:
/123 4N (1 2 3 4NX=11111),Y=j13573,‘4 4 4 4/ \16 16 16 16/
X\Y 1 2 3 4I
‘I ..L I
C) P 1f16 N5
Th 1
16
5.3. Kontinuirane dvodimenzionalne distribucije pSlueajna varijabla (X, Y) je kontinuiranog (neprekidnog) tipa ako za njen neprebrojiv skup Li
mogueih vrijednosti 1?. (X, Y) C 1R2 vrijedi uvjet (5.1). pii
Definicija. Za dvodimerizionalnu slueajnu varijablu (X, Y) kae se da irna kontinuiranudistribuciju ako postoji realna integrabilna funkcija (x, y) F— f (x, y) � 0 takva da za svakipravokutnik S c R2 (S € 132) vrijedi:
PX,Y) €8) = j’f(x,y)dxdy i dajeS
+00 +00
f f f(x,y)dxdy=1.
Funkci.jaf(x,y) naziva se funkcija gustoêe vjerojatnosti (kraée, funkcija gustoEe)slueajne varijable (X, Y)
Zapa.zimo da je f f (x, y) o!zdy dvostruki integral funkcije f na domeni S I da geometrijskiS
predstavlja volumen tijela iznad skupa S u ravnini Oxy, a ispod grafa funkcije f. Prema tome,+00+00
uvjet f (x, y) dxdy = 1 iskazuje da graf funkcije f s ravninom Oxy zatvara volumen Lijediniene zapremine.
Naziv funkcija gustoée vjerojatnosti opravdanje time to (slieno jednodimenzionalnom slueaju) LJ.vjerojatnost da (X, Y) “padne” u mali pravokutnik D = I x + Ax] x Iu, y + Ay] (slika 5.2.) jednakaje
Ii:F((X,Y)cD) = P(x�X<x+A; y�Y�y+Ay) p
p U= Jf(x)dxdy= f f f(x,y)dydxf(x,y)xAy,
13 my
LI
unø4
5. Dvodimenzionaine siutajne varijable distribucije 97
Af(x,y)
S]ika 5.2.
ako je funkeija f neprekidna u toeki (x, y) a Ax i Ay mali. Dakie, vjerojatnosno optereéenjepravokutnika D sa stranicama lAx i lAy i vrhom u toäki (x, y) priblino je jednako .j’ (xy) AxlAy
Ako slueajna varijabla (X, Y) poprima vrijednosti iskljueivo na skupu S C R2 tada uzimamodaje f(x,y) = 0 za svaki par (xy) g S.
Primjer 5. Neka varijable X i Y uzimaju samo nenegativne vrijednosti. Pokazati da je
I e’, x>0, y>Of(x,y)=< —.
—
0, x<Oiy<0
funkcija gustoée vjerojatnosti slueajne varijable (X, Y) I odrediti P (0 � X � 1, 0 � Y � 1) -
Ad. Zaista, funkcija f je nenegativna, tj. f (x, y) � 0 za svaki (x, y) € K2 i vrijedi
+00+00 +00+00 +00 +00
_L _L f (x, y) dxdy = / / e’dxdy = / edx/ edy = 1
Traena vjerojatnost je
P(0�X�1,0�Y�1)fff(x,y)dxdY=/e_xdxfe_dy=(1_)
Primjer 6. Dvodimenzionalna slueajna varijabla (X, Y) ima normalnu iii Gaussovudistribuciju ako je njen skup moguéih vrijednosti 1? (X, Y) = JR2 i funkcija gustoóe vjerojatnosti
1 —[2 zncrnz+(za\2]
f(z,y)= e 2O_p2)“
0 1j, (x,y)cK2,27ru1c2 1—p2
15.4. Rrnkcija distribucije
gdje su parametri distribucije
m1,m2,u1,a2,pER, di >0, cr2 >0, —1 <p <+1.
Ova distribucija oznaëava se s N (mi, m2, c, oj, p). Paraxnetri ove distribucije su odgovarajuóekarakteristiane vrijednosti, to éerno uskoro I vidjeti.
Primjer 7. Neka je skup S c s povrinom ji (S) > 0. Dvodimenzionalna slueajnavarijabla (X, Y) ima uniformnu distribuciju u skupu S ako je funkcija gustoOe oblika
5 K, (x$J)eS,, (x,y)S,
gdje je K konstanta koju odredujemo iz uvjeta
y) dxdy =/ Kdxdy = 1.
Odatle jeK 1 1
— fdzdy r5.4. Funkcija distribucije
UFunkcija distribucije F (z, y) dvodimenzionalne sluëajne varijable (X, Y) definira se kao
F(x,y)=P(Xx,Yy). pU
Funkcija distribucije F (x, y) ispunjava uvjete:(Fl) F(xj,y) S F(x,y) za x1 <Z2 i sasvaki yc R,
F F (a, za yl< iza svaki xc(F2) Jim F(x,y) = urn F(x,y)= 0 zasvaki x ER ye 11?,
y—.—cc
(F3) urn F(x,y) = 1,x—*OGy—*oQ
(P4) F(x2,y2)—F(zl,y2)--F(zz,yl)+F(xl,yl)>Ozaxl<x2jy1<y2[1U
Lijeva stram. nejednakosti (F4) predstavlja vjerojatnosno optereenje pravokutnika ABOD flbez stranica AB i AD koje I ne utjeëu na pripadni integral (slika 5.3.), tj. Li
A
n
5. Dvodimenzionaine sIuajne varijable I distribucije 99
0
Slika 5.3.
Ako sluëajna varijabla (X, Y) diskretnog tipa ima distribuciju odredenu s p (xi, yj), i =
1, 2,-• , j = 1, 2,.. , tada je (analogno jednodimenzionalnom sluaaju) njena funkcija distribucije stepenasta funkcija
FQc,y)= Z Z p(x,y). (5.3): x�x j: v,�v
Funkcija distribucije dvodimenzionalne sluOajne varijable (X, Y) kontinuiranog tipa s funkcijoin gustoée f (x, y) je
F(x,) fff(uv)dvdu (5.4)
Ako je funkcija gustoée f neprekidna, tada vrijedi veza
82f(x,y)= 8F(x).
Primjer 8. Nekaje
f( )— .f asin2xsiny, (z,y)CD,X 0, (z,y)gD,
gdje je a konstanta, a D pravokutnik
D = {(x,y) eR2 :0 x , o �,
a) Odrediti konstantu a tako da funkcija f predstavlja funkciju gustoée vjerojatnosti odredenedvodimenzionalne s1uajne varijable (X, Y).
b) Odrediti funkciju distribucije.
100 5.4. Funkcija distribucUe
+00+00
Ad. a) Konstantu odredujemo iz uvjeta f f (x, y) dxdy = 1, to je ekvivalentno S
ff(x,y)dxdv=1. Iii
Imamo:
f(x,y)dxdy =afsin2xdxfsinvdv
2a = 1,1
b) Oznaeimo s D1, D2,• D9 (D5 = D) dijelove ravnine prikazane na slici 5.4..
Li!
D2
:7;
Slika 5.4.n
Koristeei (5.4), odnosno
F(x,y)=P(—<X<x, —<Y<v)_—fff(uv)dvdu
traenu funkciju distribucije nalazimo po dijelovima.
1. Za(x,y) ED1UD2UD3uD4uD7: F(x,y)=0. [IiU2. Za(x,y)cD5=D:
UF(x,y) = sin2uduf sinvdv = (cos2x — 1)(cosy— 1).
0 0U
U
5. Dvodimenzionaine siuajne varijable 1 distribucije
3. Za (x,y) ED5, tj. za 0 � a: , y > Tr:
101
Z
F(z,y) = fsin2uduJsinydy = (cos01
U
= (1—cos2x)
2u1) .()4. Za (x,y) ED3, tj. za a:> , 0 y 71
= (i—cosy)
5. Za (x,y) ED9, tj. za a:> , y >
it
F (a:, y) = sin 2zdxf sin ydy =
(cos 2x — 1) (cos y — 1),F(x,y)= ;(l_cos2x)
(1 — cosy)
5.5. Marginalne distribucije
U D2 U D3 U V4 U D7,0 �
‘y > ir,V �
Neka s1uajna varijabla (X, Y) ima distribuciju odredenu s p (xi, 113) (i = 1-, , j 1,2,)lii f (a:, y), ovisno o tipu slueajne varijable. To je zajednieka distribucija slueajnih varijabli Xi Y. Mogu nas zanimati distribucije sluoajnih varijabli X I Y. Tako u navedenom Primjeru3 moemo se zanimati samo za distribuciju proizvodnje prve trake, tj. distribuciju slueajnevarij able X.
U sluëaju da je (X, Y) diskretnog tipa dogadaj {X = x} definira se kao
{X = xj} {X = x, Y = yi} U {X = x, Y =
pa je vjerojatnost tog dogadaja
pj=p(rc)= P(X=z)=p(a:,yi)+p(x,ya)+... =p(xj,yj), i= 1,2,••
Vrijednosti x i vjerojatnosti p = p (xi), I = l,2,•-• predstavljaju distribuciju slueajne varijableX koja se naziva margInalna (rubna) distribucija sluëajne varijable X.
V
Ffr,y) = fsin2zdxfsinvdv = j (_cosa:!) (cosvi)
Konaeno imamo:
(1it
cos2zJ).
(_cosYi) = 1.
0,
1,
(a:, y) C V10 � a:0 � a: �
05;a:> , y > .
102 5.5. Marginalne distribucije
Na sliãan naëin, marginalna distribucija za varijablu Y odredena je vrijednostima yj ipripadnim vjerojatnostima qj
qj=q(y)=P(Y=yj)=p(xi,yj)+p(x2,yj)+...=r,p(x,yj), j=1,2,.
Marginalne distribucije za varijable X i Y zgodno je prikazati na tablici zajedniake dvodimenzionalne distribucije slueajne varijable (X,Y) dodajuôi na inarginama tablice novi stupac i flredak s vrijednostima p = p (xi) i q = q (yj) Iii
X’NY Y2 Vixi p(xi,yi) p(xj,y2) •.. p(xl,yj) -.. Ux2 p(x2,y1) p(x2,y2) p(x,y) P2
L x p(xj,yl) I p(rc,y)
qj q ... 1 Li
Zapazimo da vrijed:
pQx1) � 0, i=1,2,•• ,
iiq(yj) � 0, j=1,2, , q(y)=i. U
Primjer 9. Distribucija slueajne varijable (X, Y) dana je tablicom:
X\Y 2 340 0.02 9.04 0.021 0.02 0.10 0.052 0.10 0.30 0.203 0.04 0.06 0.05 II:
Naôi marginalne clistribucije vjeroj atnosti.
Ad. Marginalne distribucije za varijable X i V predstavljamo na tablici s dodatnim vrijed- Unostima p j na marginama tablice:
X\V 2 3 4 p0 0.02 0.04 0.02 0.081 0.02 0.10 0.05 0.17 p2 0.10 0.30 0.20 0.60 U3 0.04 0.06 0.05 0.15qj 0.18 0.50 0.32 1
iii posebno: Ujx 0 1 2
0.08 0.17 0.60 0.15
El:U
[I
5. Dvodimenzionalne sluëajne varijable i distribucije 103
2 3 4[q 0.18 0.50 0.32
Primjer 10. Odrediti marginalne distribucije za varijable X i Y ako je distribucija varijable(X,Y) definirana: a) u Prinjeru 3, b) u Primjeru 4.
Ad. a) Marginalne distribucije za X i Y (distribucije proizvodnje na prvoj i drugoj traci)su, redom:
x 0 1 2p 0.07 0.14 0.22 0.27 0.30
0 ) 1 2 3 1qj 0.21 0.25 0.27 0.27J
b) Distribucije slueajnih varijabli X i Y yea su dane u Primjeru 4, na osnovi definiranogpokusa. Ove distribucije lako nalazinio i iz zajednièke distribucije, prema postupku za marginalnedistribucije. Imamo
(i 2 3 4\ 1 2 3 4Xr4z1 1 1 1 1 I’ 1 3 5 7
\4 4 4 41 16 16 16 16
Ako je sluaajna varijabla (X, Y) kontinuiranog tipa s funkcijom gustoée f (z, y), onda sui sluaajne varijable X I Y kontinuiranog tipa i marginalne funkcije gustoée su, redom za XiY:
fx(x)
=
Zanimijivo je uoëiti arialogiju s diskretnim slueajem: umjesto f (x, y) tamo je p (xi, yj), a umjestointegracije tamo je zbrajanje.
Primjer 11. Neka (X, Y) ima uniformnu distribuciju na trokutu D s tjemenima (0,0),(1,0), (1,1). Odrediti marginalne distribucije.
Ad. Za funkciju gustoôe imamo:
fx f 2, (x,y)ED,‘j 0, (z,y)ØD.
Kada traimo marginalnu gustoáu za X treba zapaziti da x u ff (x, y) dy figurira kao
parametar. Tako, u ovoni primjeru, za svaki x e [0, lj, f (x, y) kao funkcija od y je razlieita odnule za 0 � y � x (slika 5.5.).
104 5.5. Marginalne distribucije
1y=x
1’
a;
Slika 5.5.
Za na1aenje marginalnih gustoéa za slueajne varijable X i Y treba imati u vidu da je f 0izvan podrueja D.
Imamo:
fx(x) zaQx<1,
fx(x) zax<0, x>1,
pa moemo pisatiI 2x, 0�x�l,
fx(x)1 0, x<0, 1>1.Analogno je:
fY(Y)=ff(xY)dx=f2dx=2(1_Y) Oy�l,
I 2(1-v), Oy�1,fy(y)—0 <0,>1. U
Primjer 12. Neka (X, Y) ima uniformnu distribuciju na trokutu D s tjemenima (0, 0),(2, 0), (2, 1). Odrediti marginalne distribucije.
Ad. Ovdje imamo:
LIfx(x)=Jf(xv)dv=J1d=x za0<x<2,
ii.Li
[I
5. Dvodimenzionalne sIuajne varijable I distribucije 105
I x, 0<x<2,fx(x)=1 0, x<0,x>2,
f(v)=ff(zv)d=f1dx=2_2v=2(1_v) za0y1,
(J2(1—y), O�ySl,fYty)— 3,
5.6. Uvjetne distribucije
U praksi nas ëesto zanima distribucija jedne sluëajne varijable uz uvjet da druga slueajna varijabla poprima neku odredenu vrijednost. Takva distribucija naziva se uvjetna distribucija. Naprimjer, uvjetna distribucija slueajne varijable X pod uvjetom da s1uajna varijabla Y poprimaodredenu vrijednost Y = y.
U slueaju kada je dvodirnenzionalna sluaajna varijabla (X, Y) diskretnog tipa imamo,koriste6i se uvjetnim vjeroj atnostima:
S p (xy), i = 1,2,•-, oznaöena je uvjetna distribucija za s1uajnu varijablu X priuvjetu Y = y. Ona ovisi o y, j = l,2,.• , kao parametru, pri ëemu je qj > 0.
Slieno imamo u’vjetnu distribuciju za Y pb uvjetu X = x, gdje je p > 0:
j1,2,”.P(X=x,) p(x,)
Primjer 13. Neka je distribucija varijable (X, Y) definirana u Primjen 3. Odrediti distribuciju za proizvodnju prve trake pod uvjetom da je proizvodbnja druge trake Y = 1.
Ad. Treba odrediti vjerojatnosti:
0,1,2, 3, 4.
Iz tablice Primjera 3 ëitamo vrijednosti:
p (0,1) = 0.02, p (1,1) = 0.04, p (2,1) = p (3,1) = 0.06, p (4,1) = 0.07,q(1) = P(Y = 1) =0.02+0.04+0.06+0.06+0.07= 0.25.
Vrijednost q (1) moemo proeitati i iz marginalne distribucije varijable Y u Primjeru 10. Sadaje distribucija varijable X pri uvjetu Y = 1
x=iJ 0 1 2 3 Jp(itl) L0.08 0.16 0.24 j 0.24 0.28
106 5.6. livjetne distribucije
4Primjetimo da je p(iIl) > 0, i = 0,1,2,3,4 i p(iIl) = 1, pa p(i1), i = 0,1,2,3,4,
i=opredstavlja jednu distribuciju.
Zadatak. Odrediti uvjetne distribucije: a) p (i12), i = 0, 1,2, 3,4, b) q (jj3) , j 0, 1, 2, 3.
Analogno diskretnim uvjetnim distribucijarna, u slueaju kontinuirane vaxijable (X, Y) s -
funkcijom gustoóe f (x, y) imamo kontinuirane uvjetne distribucije. Tako je uvjetna funkcijagustoEe vjerojatnosti za slueajnu varijablu X pri uvjetu Y =
rfy(y)
gdje je fy (y) > 0. Funkoija fxiy (xy) je funkcija varijable x, dok je y parametar i vrijedi L
Jfxy (xly) dx = 1.
Sliano, uvjetna funkcija gustoée vjerojatnosti za sluëajnu varijablu Y pri uvjetuX=xje
fyjx(y)=fl’, —<y<+,fx (x)
gdjeje fx(x) >0.
Primjer 14. Neka slueajna varijabla (X, Y) ima uniformnu distribuciju na krugu radijusa [1!a > 0 x2 + y2 � a2. Odrediti marginalue I uvjetae funkcije gustoêe vjerojatnosti.
Ad. Prvo zapazimo da je funkeija gustoée slueajne varijable (X, Y):
f(x f] 0, za ostale toeke iz R2.
—nMarginalne funkcije gustoée su:
‘ía2 —x2
fx(x)tff(xY)dv= f _dy=2’x, za—ax�a, LI00 —‘1a2-—x2
r1+00
r‘ 1 2/a2_ 2 U
fy(y) = I f(x,y)dx= I —-—dx= , za —a<y<a.J ja ‘it a2’ir —
Sada su uvjetne funkcije vjerojatnosti:
fxjy(ay)f 2/C2za — a2—y2�x< a2—y2,
, 0, zax<— a2—y2 i x>
fy1x(yx)1 2’í2_x2 , za _ja2_x2�y�/a2_x2, [I0, zay<— a2—x2 i y> a2—x2.
11Ii
iiLi
r
5. Dvodimerizionalne slubjne varijable i distribucije 107
5.7. Nezavisnost sluëajnih varijabli
Za dvije sluëajne varijable X i Y moemo vezati slueajne dogadaje {X c S} i {Y e S2}, gdjesu S i 82 intervali iz lit Nezavisnost slueajnih varijabli X i Y definiramo pomoéu nezavisnostislueajnih dogadaja fX e S} I {Y c S2}.
Slueajne varijable X i Y su nezavisne ako su dogadaji {X C 8} I {Y C 82} nezavisni zasvaki izbor skupova 81,82 C R, odnosno ako je
P(XeSj,Yc82)=P(XCSjj•P(YCS2)
Nezavisnost sluaajnih varijabli obiëno slijedi iz fizikalnib uvjeta prornatranog pokusa nadkojim s-u one definirane I rijetko se provjerava koristeôi gornju definiciju.
Neka je dvodimenzionalna sluaajna varijabla (X, Y) diskretnog tipa. Sueajne varij able X 1Y su nezavisne ako I samo ako je
zasvei=z1,2,...,j=1,2,, (5.5)
gdje sup (xi), i = 1,2,•-. I q (y), j = 1,2,•• marginalne distribucije redom za X i Y.Ako je varijabla (X, Y) kontinuiranog tipa s funkcijom gustoôe vjerojatnosti f (at, y) , varijable
X i Y su nezavjsne ako I samo ako je
f(x,y) = fx(x) . fy(y), —00< Z,y <00,
gdje su fx (at) i fy (y) marginalne gustoée redom za X i Y.Ako su sluëajne varijable X i Y nezavisne, tada je
E(XY)=E(X).E(Y),
ako ta oèekivanja postoje. Zaista, u slueaju da je varijabla (X, Y) diskretnog tipa, vrijedi
E(XY) = ZZxiyjp(zi,yj) = xjyjp(x)q(yj)
= (zXP yjq(yj)) =E(X)E(Y),
zbog apsolutne konvergencije tib redova. Analogno se pokazuje I u slueaju kontinuirane sluëajnevarij able (X, Y).
Primjer 15. Da ii su nezavisne slueajne varijable X I Y definiraiie: a) u Primjeru 3, b) uPrimjeru 11?
Ad. a) U Primjeru 3, slueajne varijable X i Y nisu nezavisne jer je, na primjer,
p (0,0) = 0.01 p (0) q (0) = 0, 070, 021 0,0147.
b) U Primjeru 11, slueajne varijable X i Y nisu nezavisne jer je, na primjer,
f (1,1) 20 fx (1) . fy (1) = 20 = 0.
5.7. Nezavisnost sIuajnih varijabli
Primjer 16. Baca se uovãié dva puta i neka su elementarni ishodi 0 ako se pojavi pismo i1 ako se pojavi glava, za svako bacanje. Neka X iskazuje vrijednost prvog bacanja, a Y zbrojvrijednosti oba bacanja. Da ii su slueajne varijable X I Y nezavisne?
Ad. Zajedniëka distribucija slueajnih varijabli X i Y, kao i pripadne marginalne distribucijeprikazane su na tablici:
X\Y 0 1 2 p(1 11 n 144’,1 i 1 1
44 212 14 4 4
Odavde Se vidi da slueajne varijable X I Y nisu nezavisne. Zapazimo da je skup svih moguOihvrijednosti dvodimenzionalne slueajne varijable (X, Y)
1?. (X, Y) = {(0, 0), (0, 1), (1, 1), (1, 2)}.
Primjer 17. Neka sluaajna varijabla (X, Y) ima funkciju gustoéefl f ‘,
f(x )—) 2’
‘
—
0, (x,y)ØD,gdje je D kvadrat s vrhovizna (—1,0), (0, —1), (1,0), 0,1. Odrediti:
a) rnarginalne distribucije varij abli X I Yb) uvjetne distribucije,c) da ii su varijable X I Y nezavisne? rAd. Na slici 5.6. prikazan je kvadrat D.
y
x
Slika 5.6. [1a) Marginalna funkcija gustoée vjerojatnosti varijable X je
fxfr)=ff(x,u)dy=fHdy=l_JzI={1+x, —1�x�0, Li
2 1—; 0< x <1.
Analogno, marginalna funkcija gustoée vjerojatnosti varijable Y je00 i-lId
fY(v)=ff(xY)dx=f dy=I-yj= { �0,
iiLi
[1
5. Dvodimenzionalne sIuajne varijable I distribucije 109
b) Uvjetne funkoije vjerojatnosti su:
= fy(y) 2(1-M)’
fy(yx) = fx(z) 2(1—IzD’ 1x�1.
c) Kako je, na prinijer,
f (0,0) = fx (0) fy (0) =1.1=1,
slueajne varijable X I Y nisu nezavisne.
Primjer 18. Distribucija vjerojatnosti dvodimenzionalne slueajne varijable (X, Y) dana jetablicom:
X\Y 2 3 40 0.02 0.04 0.021 0.04 0.10 0.062 0.10 0.30 0.203 0.04 0.06 0.02
a) Odrediti marginahie distribucije vjerojatnosti.b) Odrediti uvjetne distribucije vjerojatnosti.c) Da ii su slueajne varijable X I Y neza’visne?
Ad. a) Marginalne distribucije vjerojatnosti za varijable X I Y predstavljene su na tablici,dopunom dane tablice s stupeeni vrijechiosti p i retkom vrijednosti qj
X\Y 2 3 4 p0 0.02 0.04 0.02 0.081 0.04 0.10 0.06 0.202 0,10 0.30 0.20 0.603 0.04 0.06 0.02 0.12qj 0.20 0.50 030 1
b) Nie su dane dvije tablice. Na prvoj tablici prikazane su uvjetne distribucije sluëajnevarijable X pod uvjetima Y = 2, Y = 3 i Y = 4 (u pripadnim stupeima), raèunajuéi uvjetnevjerojatnosti:
i=0,1,2,3; j=2,3,4.
Na drugoj tablici prikazane su uvjetne distribucije sluèajne varijable Y pod uvjetima X = 0, X1, X = 2, 1 X = 3 (u pripadnim recima), ra6unajuêi uvjeti-ie vjerojatnosti:
q(jji) = j = 2,3,4; i = 0,1,2,3.
5.7. Nezavisnost sIuajnih varijabh
XjY 01 008 rx\Y 2 3 4 Z1 0.2 6.2
0 0.25 0.5 0.25 1
• . — 1 1• 3 — 05 — 11 1 1
. 6
c) Slueajne varijable X i Y nisu nezavisne jer uvjet (5.5) nije ispunjen.
Primjcr 19. Promatrajmo dvodimenzionalnu sluëajnu varijablu (X, Y) s normalnorn distribucijom A1(rnx,m2,a,a,p)
Njena funkcija gustoée je
f (x, y)1
ex 1 (z—mi22 (z_ml)(v_m2)÷(v_m22 j2irc1u2 1—p2 2(1—p2) k cr ) u1C2 2 ) J U)
Moe se pokazati da su marginalne distribucije za X i Y takoder normalne s funkcijamagustoêe:
1 (x—mi)fx(x) ,,_exp 2cr?
1 (y—m2)2fy (y) exp — 2 tj.2cr2
X .M(m,afl, E(X)=mi, D(X)=c?,Y N(m2,cr), E(Y)=m2,D(Y)=c.
Sada se lako zapaa da u opóem s1uaju varijable X I Y nisu nezavisne i da óe biti nezavisnesamo kada je p = 0.
Takoder, moe da se pokae da su i uvjetne distribucije za koinponente X i Y normalnedistribucije s funkcijama gustoáe:
fx (z(y), 2(1 — 2)
exp{ 2 (1 2) {z — (m + p (y
fy1x (viz)c22(1 — 2) exP{_22(l 2) [v — (m2 + p2 (z — mi))] tj.
XiY’N mi+p-(y—m2),c?(1—p2) , [PYJXN m2+p(x—ml),c(1—p2) .
6
U
5. Dvodimenzionalne suajne varijable I distribucije
5.8. Funkcije sluéajnih varijabli
Kao i u jednodimenzionalnom slueaju i ovdje moemo prornatrati funkcije slueajnih varijabli.Problem je slijedeéi.
Dana je dvodimenzionalna slueajna varijabla (X, Y) distribucijom odredenom s p (xi, y) iiif (x, y) I odredena funkcija dviju varijabli (,.) Treba odrediti distribuciju suëajne varijableZ = y (X, Y). Na primjer,
z=x+Y, z=xY, z=.Sluoajnu varijablu Z treba ovako shvatiti: za svaki ishod w C �2 sluëajne varij able X i Y uzi
maju vrijednosti X (w) i Y (w) a slueajna varijabla Z uzima vrijednost Z (w) = (X (w) , Y (w))(slika 5.7.).
Z(w)0
(X(w),Y(w))
xz
SilIca 5.7.
Neka je (X, Y) diskretna slueajna varijabla sa skupom mogueih vrijednosti i pripadnimvjerojatnostima:
7Z(X,Y) = {(xi,vj)cR2:i=1,2,” , j=1,2,
= P(X=x,Y=y)>O, ZZpjj=i.
Tada je potpuno odreden skup svih moguóih vrijednosti I pripadiiih vjerojatnosti sluëajne vanjable Z =
7Z(Z) = {zl,z2,...},
Tk = P(Zzk)>0, k=rl,2,” ,
gdje su vjerojatnosti dobivene kao zbroj vjerojatnosnih optereOenja svih onih (xi, y) c7?.(X,Y) zakojeje Ip(rcj,yj) = zk.
Oeekivanje E (Z) slueajne varijable Z = (X, Y) je
E (Z) = zjrj ili
E(Z) =
5.8. Funkcije sIuajnih varijabli
Priinjer 20. Neka sluãajna varijabla (X, Y) predstavlja proizvodnju na dvije trake kao uPrimjeru 3. Odrediti distribuciju slueajne varijable Z = X + Y.
Ad. Skup moguãih vrijedncsti sluëajne varijable (X, Y) je
fl(X,Y)={(i,j)EIR2:i=0,1,2,3,4,j=0,1,2,3},
pa je skup moguéih vrijednosti sluëajne varijable Z
a pripadne vjerojatnosti su:
= P(Z=0)=p(0,0)=0.01,= P(Z= 1) =p(O,1)+p(1,0) =0.04,= P(Z=2)=p(0,2)+p(1,1)+p(2,0)=0.10,= P(Z=3)=p(0,3)-i-p(1,2)-i-p(21)+p(3,0)=0.18,= P(Z—4)=p(1,3)+p(2,2)-}-p(3,1)+p(4,0)=0.25,= P(Z = 5) =p(2,3) +p(3,2) +p(4,1) = 0.19,= P(Z=6)=p(3,3)+p(4,2)=0.15,= P(Z =7) =p(4,3)=0.0S.
Sada distribuciju slueajne varijable Z noemo predstaviti na tablici: ElZkI 0 1 2 6 7Vk I 0.01 0.04 0.10 0.18 0.25 019 0.15 0.08 P
U7
Zapazimo daje > = Zp(,j) = 1.k=Q
Neka je (X, Y) kontinuirana sluëajna varijabla s funkcijom gustoêe f (x, y) I Zy (X, Y) zadana derivabilna funkeija. Za svaki z C M odreden je skup (11
U
Vjerojatnosno optereéenje skupa A prenosi se furikeijom p na interval (—cc, zl tako damoemo pisati : LA
F(AZ) = P(y(X,Y) � z) = ff(x,y)dxdy, pA, I
pa je funkeija distribucije slueajne varijable Z:
G(z)=P(Z<z)=Jf(x,y)dxdy. 11Fr
Funkcija gustoêe vjerojatnosti slueajne varijable Z je ULIdz U
UIn
5. Dvodimenzionalne sIuajne varijable i distribucije
Ooekivanje E (Z) je+00 +00
E(Z)=L
PHnijer 21. Odrediti distribuciju sluëajne varijable Z = X + 1’.Ad. Pripadni skup A prikazan je na slici 5.8..
x
Slika 5.8.
Funkeija distribucije sluaajne varijable Z je
G(z) = F(X +Y � z) =
pa je funkeija gustoée
g (z) =dG(z)
= (x, z — x) dx. S
Ako su X i Y nezavisne slueajne varijable, tada je
C (z) = IA, fx (x) fy (y) dxdy,
gdje su fx (x) i fy (y) funkeije gustoée nezavisnih sluäajnih varijabli X 1 Y.U sluãaju Prixnjera 21 imamo:
g(z) =ffx(x)fY(z_x)dz,
a to je konvolucija funkeija fx i fyPrimjer 22. Neka su X i Y nezavisne sluëajne varijable distribuirane pa normalnoj dis
tribuciji N (0,1). Odrediti distribuciju slueajne varijable Z =
5.8. Funkcije sIuajnih varijabli
Slika 5.9.
Ad. Ovdje imamo (vidi sliku 5.9. koja odgovara sluajuz= ):
—
G(z) ffx(x).fYGu)dxdY=J7=e 2 2dxdy
= _fdyfe(2+2)dx+_fdyfe(2+2)dx,
g(z) =dG(z)
=__Jy(4)dy+_7yeH)dy
_
= ±fye_c(z2+1)dy= (z2+1)
U1Ovdje koristimo pravilo derivacije integrala:
b(A) b(A)
I(A)= ff(x,xdx,dI(A)
=
a(A) a(A)
Dakie, kontinuirana sluáajna varijabla Z = ima funkciju gustoée
1g (z) =it (z2 + 1)
kojom je definirana Cauchyjeva distribucija. •
UF’,
5. Dvodimenzionalne s!uajne varUable I distribucije 115
Promatrajmo sada slijedeéi zadatak.
Neka kontinuirana slueajna varijabla (X, Y) ima distribuciju koja je odredena funkcijomgustoée f(x,y) I neka an siueajne varijable U=p1 (X,Y), V = Y2 (X,Y). Odrediti distribucijudvodimenzionalne slueajne varijable (U, V).
Funkcija gustoée g (u, v) slueajne varijable (U, V) je
g (u, v) = f( (nv) ‘2 (nv)) IJJgdje su x = th1 (u, v), v = ‘2 (n, v) rjeenja sustava jednadbi u = co (z, y), V = 2 (x, y) p0 x I1’,
D(th ib 2t t4)j’ 00 na7?CU,V).D(nv’ __2
‘ ‘
(Ovdje je J Jacobijan funkcija ‘i I po u i v, J 0 0 garantira da pripadni sustav predstavUabijektivno preslikavanje.)
Sada distribucije sluaajnih varijabli U I V (marginalne distribucije) moemo odrediti naosnovi distribucije slueajne varijable (U, V). Marginalne gustoóe varijabli U I V su redom:
gu(u) =fg(u,v)dv, gv(v)
Ovo se moe iskoristiti I za zadatak odredivanja distribucije slueajne varijable U=cp (X, Y) naosnovu distribucije sluOajne varijable (X, Y). U ovom slueaju moemo uzeti U=so (X, Y) =
V = 1’ = ‘P2, pa odrediti funkciju gustoée g (is, v) slueajne varijable (U, V) a zatirn odreditifunkciju gustoée sluëajne varijable U kao marginalnu gustoéu.
Primjcr 23. Slueajna ‘varijabla (X, Y) ima funkciju gustoée oblika
1Axe, y<.x<O,-0, mace
Odrediti konstantu A i funkciju gustoée sluëajne varijable (U, V), ako je U=X — Y, V =
Da Ii su U i V nezavisne I koliko je oeekivanje sluOajne varij able Z = U — V?Ad. Prvo odredimo konstantu A. Imamo:
AfdxfzeYdy : = A (x — 1) efl = A C—i) =
Sada iz sustava jednadthix
U = 2:— y, V = —
Vnalazimo:
isv uv—i v—i
tr cv— u ii
(v—i)2’ (v—i)2
5.9. Momenti dvodimenzionalne distribucije
Kakojey<x<0,tojeu>O, te0<v= <1. DaMe,vrijediu>0, 0<v<1. Skupovimoguéih vrijednosti S 1 5’ za sbaeajne varijable (X, Y) I (U, V) ilustrirani su na slici 5.10. a) I
a) b) 1y
y=x
2:
Slika 5.10.
Sada, funkcije gustoée smu I’
I fje”- 2= uvpeTEV u>0, 0<v<1,g(u,v) = (1v) (1-.)
. ii0, mace
1
gu(u) = fg(u,v)dv=e_u u(u)={’
gv(v) = fg(u,v)du= 2v, gv(v)= {‘
°e.”
Kako je gu (u) . gv (v) 0 g (u, v), sluëajne varijable U I V su ovisne. Oeekivanje P7(Z) je
E(Z)=EW)_E(V)=Juedu_fv.2vdv= ii =
5.9. Momenti dvodimenzionalne distribucije
U -vezi s dvodimnzinalnom slueajnom varijablom (X, Y) promatrajmo funkcije oblika 11(x,Y) —* XmY” I(X,Y) (X—E(X))m.(Y—E(Y)), m=0,1,.., n=0,1
Li
Oeekivanje sluëajne varijable xm . Y” naziva se ishodini moment reda (m, n) Pslnôajne varijable (X, Y) i pie se Li
m=0,1,2,..., n=0,1,2
UU
5 Dvodimenzionalrie sIuajne varijable I distribucije 117
Zapazimo da je:t00=1, 140=E(X), 141=E(Y).
Kako vidimo, momenti pQ i j4 SU onekivanja sluëajnih varijabli X i Y.
Broj/4mn=ERX_E(X))m•(Y_E(Yfl’i, m=0,1,...,n=0,1,...
naziva se centralni moment iii kraée moment reda (rn n) slueajne varij able (X, Y).
Ovdjeje
=1= 1101=0,
= E(X-E(X))2=D(X),1102 = E(Y-E(Y2=D(Y)
Momenti 1120 i 1102 su disperzije slueajnih varijabli K i Y.Nadaije, moemo primjetiti da su ishodini momenti
=
= E(YTh)
ujedno ishodini inomenti slueajnih varijabli X i Y. Takoder, centralni momenti
14mG =
= E(Y—E(Yflm
poklapaju se s centralnim momentima pripadnog reda slueajnih varijabli X i Y.U dvodimenzinalnoj distribuciji posebno je zanimljiv moment reda (1, 1):
Pu = E[(XE(X))(YE(Y))jE[XY-XE(Y)—YE(X)+E(X)E(Y)j=
= E(XY)-E(X)E(Y)--E(X)E(Y)+E(X)E(Y)= E(XY)—E(X)E(Y)=p41—p40./61.
Moment Jtu naziva se korelacijski moment ili kovarijancasluëajnih varijabli X I Y, u oznaci S (X,Y), I vrijedi
Ako su sluaajne varijable Xi Y nezavisne, tadaje E (XY) = E (X) E (Y) paje S (K, Y) = 0.Medutim, ako je S (X, Y) = 0 to X i Y ne moraju nuno biti nezavisne varijable.
118 5.10. Koeficijent koreiacije
Moe se pokazati (vidi [5, str. 138) da vrijedi
IE(XYH � (EX2 EY2). (5.6)
Iz (5.6) slijedi
IS(X,Y)I <(DX DY)4. (5.7)
5.10. Koeficijent korelacije
Dva obi1jeja X i Y mogu biti medu sobom nezavisna iii zavisna. Ako su zavisna, ta zavisnostmote bitt funkcionalua ±1 stohastieka. U sluëaju funkcionalne zavisnosti izmedu dogadaja postoji, kako i sam naziv kae, odredena funkcionalna veza, koja onioguéava potpuno prouëavanje Li’
promjene jedne velieine u zavisnosti o promjeni druge velieine. Ako zavisnost nije fnnkcionalna,ona je stohastielca (statistWka, korelacijska). Prouëavat emo stupanj i formu stohastieke zavisnosti.
B —E(XY)-E(X)E(Y) S(X,Y) Uroj
‘I — — S(X)S(Y)
gdjesu S(X)=,Ai= JD(X)>O, S(Y)=i7i= D(Y)> 0, nazivasekoeficijerit korelacije (koeficijent linearne korelacije) izmedu slueajnih varijabli X I Y.
Koeficijent korelacije je broj kojim se na neki naëin mjeri stupanj linearne povezanosti slueajnih varijabli X I Y.
Uloga i znaëaj koeficijenta korelacije dvodimenzionalne slueajne varijable (X, Y) za koju je LID (X) > 0 i D (Y) > 0 proizilazi iz njegovih svojstava.
nii’
Svojstva koeficijenta korelacije:a) Ir(X,Y)i�1, F!:b) r(X,Y)=±1 akoisamoakoje
Y=aX+b, a,beR,a0,signa=signr(X,Y).c) r(aX+b,cY+d)=z±r(X,Y), a,b,c,deR, a,c#0, Itgdje se uzirna znak + ako je ac> 0 i znak — ako je ac < 0.
Svojstvo a) slijedi iz (5.7).Svojstvo r(X, Y) = +1 vrijedi ako i samo ako je P(Y = aX + 6) = 1, tj. r(X,Y) = ±1
ako i samo ako je varijabla Y linearna funkcija varijable X koja taste za r = 1, a pada zar = —1. Dakle, za r (X, Y) = ±1 izmedu varijabli X i Y postoji Jinearna funkcionalna zavisnostY = aX + b, gdje je a> 0 za r = 1, a < 0 za r = —1.
ULi
F!
5. Dvodimenzionalne sIuajne varijable i distribucije 119
Zapazimo da je r (X, Y) = 0 ako i samo ako je S (X, Y) = 0.Stoga, ako su varijable X i Y nezavisne tada je r (X, Y) = 0. Obrnuto nuno ne vrijedi.Ako jer (X,Y) = 0, tada se kae da su X I Y nekorelirane sluëajne varijable.Nadaije, kae se da su X i Y poziti’vno korelirane ako je r (X, Y) > 0,a negativno korelirane alto je r (X, Y) <0.
Prema tome, nezavisne slueajne varijable X I Y su ujedeno nekorelirane, dok nekoreliranostsluëajnih varijabli ne obezbjeduje nuno i ujihovu nezavisnost.
Takoder, zapazimo da ukoliko je V (X, )I veée, tj. b1ie 1, utoliko je veéi stupanj linearnezavisnosti X I Y.
Istaknimo jo jednom, koeficijent korelacije mjeri samo linearnu zavisnost.
Pojasnimo stupanj zavisnosti s1uajnih varijabli X i Y I kroz slijedeéu ilustraciju.Pretpostavimo da odredeni pokus ponavijamo mnogo puta (na primjer, n puta) i svaki put
registriramo dobivene vrijednosti (xi, y) koje uzima slueajna varijabla (X, Y) Ako se uredeniparovi (z,) (1 = 1,2,. .
- , ii) predstave grafieki na Oxy—ravnini dobiva se skup toeaka koji senaziva dijagram rasprenja. Na slici 5.11. ilustrirana su ëetiri moguéa sluaaja. Sa slike 5.11.zapaamo da je, u slueaju:
Sky Sky
a; a;
d)rOA d)r—O.8 c)rO d)r=1
Slika 5.11.
a) r (X, Y) > 0 (X raste, Y raste);b) r (X,Y) <0 (X raste, Y pada), zavisnost je bolja nego u sluoaju a), a radi se priblino o
linearnoj zavisnosti Y = aX + b, a < 0;c) zavisnost je najmanja izmedu X I Y i moemo reéi da su varijable X i Y nezavisne;d) r (X, Y) = +1, u pitanju je linearna funkcionalna tavisnost Y = aX + b, gdje su a> 0 1 6
odredeni brojevi;Kako vidimo, povezanost varijabli Xi Y je najjaëa u slueaju d), gdjeje u pitanju funkcionalna
(a ne stohastielca) za-visnost.
Prin-ijer 24. Promatrajmo slueajnu varijablu (X, Y) koja ima dvoclimenzionalnu normalnudistribuciju .iV(mi,m2,a,o,p).
5.10. Koeficijent korelacije
Moe se pokazati da je
+00 +00
E(XY)= L = pu1c2 +mlm2,
a kakoje E(X) = m1 i E(Y) = m2, te 8(X) = i i 8(Y) = a2 (vidi Primjer 19), imamo:
= & (X, Y) = E (XY) — E (X) E (Y) =
(XY)— S(X,Y)—
8(X)S(Y)
Dakie, parametar p koji figurira ii normalnoj distribuciji je upravo koeficijent korelacije(koeficijent linearne korelacije) varijabli X i Y.
U Primjeru 16 vidjeli smo da su varijable X i Y nezavisne samo ako je p = 0. Prema tome, kodnormalne distribucije pojam nekoreliranosti pokiapa s pojmom nezavisnosti slueajnih varijabli.
nPrirnjer 25. Neka slueajna varijabla (X, Y) ima uniformnu distribuciju na trokutu V s
tjemenima (0,0), (1,0), (1, 1). Odrediti koeficijent korelacije r (X, Y).
Ad. Prvo zapazimo da su funkcije gustoóe (vidi Primjer 11):
( )f2 (x,y)eD,fx,y(x,y)D,
I 2z, 0�x<1, I 2(1—y), 0<y<1,fx(z)1 0, x<0,x>1 0, yO,>1.
Sada je:
= fxfx(x)dz=fx.2zdx=, E(Y)=fyfY(y)dY=fv.2(1_Y)dy= [1= fx2.2xdx=, E(Yi=Jy2.2(1_Y)dy=,
= E(X2)-[E(X)]2=, D(Y)=E(Y2)_[E(Y)j2=,
E (XY) =Z7: (z, y) dzdy =fdxf2xydy =
Jx3dx=. II
Slijedi, traeni koeficijent korelacije jeUI
r(X Y)= E(XY)-E(X)E(Y)= i-fl 1
fD(x)D(Y) 2
U
5. Dvodirnenzionalne sIuajne varijable I thstribudje 121
Prinijer 26. Neka sluáajna varijabla (X, Y) ima uniformnu distribuciju na kvadratu D $
tjemeriima (0,0), (1,0), (1, 1), (0,1). Odrediti koeficijent korelacije r (X, Y).
Ad. Za funkcije gustoôe imamo:
11, (x,y)ED,(x,y)ØD,
1 1, 0�x�1, 1 1, ocyl,fx(x)=1 0, x<0,x>1, o, y<o,y>i.
Sada je:
E(X) = fxfx(x)dx=fxdx= E(Y)=Jyfy(y)dy=fvdy=
E (XY) = (x, y) dzdy =fdxfxydy = fxdx =
pajeS(X,Y)=E(XY)-E(X)E(Y)=0,
to znaOi da je koeficijent korelacije r (X, Y) = 0, tj.da su varijable X i Y nekorelirane.
Ovaj prirnjer odgovara slueaju c) na slici 5.11..
5.11. Regresija
Regresija u statistici iskazuje zavisnost jedne sluëajne varijable o drugoj sluöajnoj varijabli (iiio vie varijabli).
Ovdje se koristi uvjetno matematieko oöekivanje jedne sluëajne varijable u odnosu na drugu.Na primjer, uvjetno oeekivanje slueajne varijable Y u odnosu na X, u oznaci E (YIX).
Oeekivanje E (YjX) je funkcija slueajne varijable X. Talco pri dogadaju {X = r} dobiva sebroj E (YIX = x) iii kraée E (Yx) koji predstavlja srednju vrijednost slueajne varijable Y poduvjetom X = x.
Model zavisnosti slueajne varijable Y o slueajnoj varijabli X mote se napisati kao
(5.8)
gdje je R (X) funkcija kojom se iskazuje zavisnost sluëajne varijable Y o drugoj sluãajnoj varijabli X, a velieina e je slueajna varijabla nezavisna o X s normalnom distribucijom N (0, a2)(oeekivanje je nula, a disperzija a2 je nepoznata) i predstavlja pogreku koja se ëIni kada seslueajna varijabla Y aproksimira s R (X). Varijabla X moe biti skalarna iii vektorska varijabla.
Iz (5.8) slijediE(YIX)=R(X), paje
E(YX = x) iii krabe 11(x) = E(Ylx). (5.9)
122 5.11. Regresija
Funkcija 1? (x) defmnirana s (5.9) naziva se funkcija regresije sluëajne varijable Yu odnosu na varijablu X iii kraóe regresija od Y 0 X i pie se
Yr =
a definirana je na skupu moguéih vrijednosti varij able X.Analogno se definira funkeija
= R(y)= E(Xly),koja se naziva funkcija regresije slueajne varijable X u odnosu na varijablu Y illkraêe regresija od X po Y, a definirana je na skupu moguêih vrijednosti varijable Y.
P.Dakie, regresija je funkcija, koju smo oznaeili s R, koja se definira kao uvjetno maternatieko
oëekivanje. Krivulja funkcije 1? naziva se krivulja regresije. 1!;U diskretnom sluãaju imamo:
E(Ylx) = yjq(yj)x) = YjP:yx(tI) = ZYj’,
pod uvjetom da je p > 0, za svaki i, a u kontinuiranom s]naaju, za svaki moguái x, n
E (Y)x) = (y)x) dy dy,
pod uvjetom da je fx (x) > 0.Analogno, u sluäaju regresije od X po Y imamo: U
E(Xjy) _—xp(xjy) = Zxi =>j, qj >0, za svaki j,
E (XIy) = 7 xfxiy (xfy) dx =
‘
dx, fy (y) > 0, za svaki moguéi
- -
fY(y)
Ako slueajnu varijablu Y aproksimiramo slueajnom varijablom R (X), onda se moe pokazatida je ta aproksimacija najbolja u slijedeéem smislu. Ako Y aproksimiramo funkcijom (X) iusvojimo da pogreku aproksimacije mjerimo brojem
E (Y - (X))2, (5.10)
tada pogreka aproksimacije je najmanja ako za funkciju uzmemo regresiju R, tj. uvjetnomatematieko oëekivanje E (YIX) ima najmanje srednje kvadratno odstupanje od Y od svihfunkcijay(X).
F?U
Primjer 27. Neka (X, Y) irna imiformnu distribuciju na trokutu D s tjemenima (0,0), (1,0),(1, 1). Odrediti regresiju od Y po X i pogreku aproksimacije Y s 1? (X).
PU[ir
5. Dvodimenzionajne sIuajne varijable i cjistribucije 123
Ad. U primjeru 25 dane su funkcije gustoée f (x, y) i fx (x). Sada je+00 +00
If(x,y)
Yr = R(x)=E(Y)= fYfYix(YIx)dv= Yf@)dY.-00 —00
I2= y—dy=—x.
2x 20
Dakie, traena regresijaje y x (slika 5.12.). Ako sluoajnu varijablu Y aproksimiramo funkcijom X ëinimo najmauju moguéu pogreku u smislu ocjene (5.10). Ta pogreka je
+00+00 1 X
I
E(Y_)= ff (Y_)2f@Y)dxdv=fdxf(Y_) 2dy—.0 0
i1,
Y=x
1II =
2;
Slika 5.12.
Primjer 28. Neka je funkeija gustoãe slueajne varijable (X, Y)
1f(x,y) (x,y)eD,=
2.ft’gdje je 13 trokut s tjemenima (0,0), (1,1), (0,1). Odrediti koeficijent korelacije, regresiju od YP0 X i pogreku aproksimacije.
Ad. Imamo:
{ 1f(x,y)= (x,y)eD,
0, (x,y)ØD,
1
0<x<t =fx(x) { 1z/ 0�x�1,fx(z) =‘
— — 0,V
____ 1, O�y�l,= [ 1
dx=1, 0�y1, fY(Y)={ 0, <o,>iJ2
124 5.11. Regresija
E(X) fzfx(x)dx=fx. 1dx= ,
E(Y)=fyfv(y)d__fudY,
=fx2.
1dx=± E(Y2)=fy2dy=,
D(X) = E (x2) — [E(X)}2 = 1512’D(Y) = E (2) — IEV)12 =
+00+00
E(XY) = = =
Slijedi, traeni koeficijent korelacije je
D (X) D (Y) 21
Za regresiju Y p0 X imamo (vidi sliku 5.13.): Ii
Yr = R(x) =E(YIx) =LYfYu1L= J2lr3lra(1+x+
y=x
Ii
I]:Li
- pLI
Slika 5.13.
Pogreka aproksirnacije sluaajne varijable Y s R(X) = (i + X + prema (5.10) je:
E(Y-(1+X+) jj(-4i++)2
— 9•30<15 hnU[1:
5. Dvodimenzionalne sIuajne varijable I dstribucije 125
5.12. Linearna regresija
Na osnovi prirode problema I prethodnih istra2ivanja za odredivanje regresije moe se koristiti ipretpostavka o zavisnosti cc.
Najjednostavniji primjer takve pretpostavke je linearna zavisnost: y (x) = ax + 5, tj. akosluáajnu varijablu Y aproksimiramo linearnom funkcijom
Y = aX + 5, (5.11)
gdje su a i S parametri koje odredujemo iz uvjeta da pogreka aproksimaeije
(5.12)
bude minimalna.Stoga, pogreku aproksimaeije napiimo kao funkciju koja ovisi o a i 5:
H(a,b) =E(Y—(aX+b))2.
Funkeija H ima minimum za one vrijednosti a i S za koje je
=o, =o (5.13)ôa 85
Stacionarna toèka funkcije H je upravo zoeka minimuma te funkeije.Prije deriviranja funkciju H napiimo u obliku
H (a, 5) = E (Y2) + a2E (x2) + — 2aE (XY) — 2bE (Y) + 2abE (X).
Sada sustav (5.13), nakon sredivanja, postaje
aE(X2)+bE(X)=E(XY), (514)aE(X)+b=E(Y)
Sustav (5.14) je linearan po nepoznanicama a i S jima jedinstveno rjeenje jer je determinantasustava
E(x2) E(X) =E(x2)(E(x))2=D(x)>o.
Rjeenja sustava (5.14) su
—E(XY)-E(X)E(Y)S(X,Y)a -
E(X2) - (E(X))2- D(X)
S = E(Y)_aE(X)=E(Y)_’jE(X).
Prema tome, najbolja linearna aproksimacija varijable Y pomoóu varijable X u smislupogreke (5.12), ëesto so kae u smislu srednje kvadratnog odstupanja, je
Y=8(X-E(X))+E(Y),
126 5.12. Linearria regresija
a funkcija
Yr =S(X,Y) (x - F (X)) + E (Y), (5.15)
naziva Sc prvi pravac regresije.Ako moment korelacije S (X, Y) izrazimo preko koeficijenta korelacije r (X, Y), kao
S(X,Y)=r(X,Y) D(X) D(Y),
tada (515) moemo napisati u obliku
Yr = r(X,Y) (x-E(X)) +E(Y). (5.16)
Analogno, kada je Li (Y) > 0, mote se naéi i regresija slueajne varijable X u odnosu na Y,odnosno drugi pravac regresije, ãija je jednadtha
Zr r(x,Y)D (y -E(Y)) +E(X). (5.17)
Kako se vidi, pravci regresije se sijeku u toeki oëekivanih vrijednosti (F (X) , F (Y)).Ako su sluëajrie varijable X I Y nekorelirane, tj. r(X,Y) =0, iz (5.16) i (5.11) slijedi da su
prvi i drugi pravac regresije, redorn:
Yr =
Zr = E(X). F!UTo su pravci okomiti medu sobom i paralelni s koordinatnim osima.
U slueaju r (X, Y) = ±1 pravci regresije pokiapaju se i tada vrijedi iiF (aX + b — F (Y)X))2 = D (Y) (i — r2 (X, Y)) = 0.
PPrimjer 29. U Primjeru 19 istakli smo da ako sluëajna varijabla (X,Y) ima normalniadistribuciju K (in,, m2, a, c4, p), tada je uvjetna distribucija za varijablu Y pri uvjetu X =takoder normalna distribucija
N(m2+P2(x_ml),a(1_p2)).
Otudaje
Yr = R(x) = E(YIx) = m2 + p2- (x — in,),a1
gdjejem, =E(X), m2=E(Y), a,= D(X), 2= 13(Y), p=r(X,Y).Kako vidimo, kod normalne distribucije regresija se pokiapa s linearnom regresijom. Ovo Pvrijedi samo za dvodimenzionalnu normalnu distribuciju i predstavlja vrlo znaëajno svojstvo
normalne distribucije.
U
[I:U
11?
5. Dvodimenzionalne sIuajne varijabie i distribucije 127
5.13. Opêa linearna regresija
Slueajnu varijablu Y aprolcsimiramo funkcijom oblika
Y = a0fc (X) + ajfi (X) + + (X), (5.18)
gdje su X i Y slueajne varij able, f, fi, , fm su zadane funkcije, a koeficijenti a0, a1, , amsu nepoznati pararnetri. Funkeija (5.18) je Imearna p0 nepozuatim parametrima a0, a1,• ,
Primjer 30. Primjeri linearne regresije su, na primjer:a)
Y=ao+alX+a2X2f...+amXm (5.19)
b)Y = aX2 +beS ice_X.
Cesto se za linearnu regresiju definiranu s (5.19) kae da je poiinomnska regresija, a zamodel
Y=aX2+bX+c
da je kvadratna regresija. U ovom slueaju se samo zavisnost oblika (5.11) naziva linearnomregresijom.
Polazeéi od modela regresije oblika (5.18) nepoznate parametre a0, a1,- ,am odredujemotako da funkeija
H (a3, a1,••• ,am) = E (Y — (a0f3 (X) + aifi (X) + . . . ± amfm (x)))2poprima minimum, tj. iz sustava jednadthi
1=0,1, ,m. (5.20)
Sustav (5.20) je linearan po nepoznatim parametrima a0, a1, .am, koji nakon sredivanjamoemo napisati kao
arjC03 + a1001 + G2002 + ... + amCom = c0= C1
a0C00 + ajC01 + a2CQ2 + .. + amGom
= c0
gdje je Cj = Ef(X)f (X), c = Ef3 (X)Y, i,j = 0,1,•• , in. Lako je zapaziti cia funkcija IImoeimati samo minimmm Maksimum bi odgovarao vrijednostima parametara a0, ,amza koje pripadna funkeija (5.18) “najgore” opisuje zavisnost izmedu X i Y, a jasno je da takvafunkeija ne postoji.
128 5.14. Nelinearna regresija
5.14. Nelinearna regresija
Nelinearna regresija je regresija ii kojoj je funkcija zavisnosti izmedu slueajnih varijabli X iY nelinearna 0 nepoznatim parametrima. Neke od tih regresija mogu se transformirati nalinearne.
Pritnjer 31. Primjeri nelinearne regresije su, na primjer:a)
Y = eaxcos@X+c) (5.21)
b)Y = (5.22)
Nelinearni model (5.21) ne moe se svesti na linearan, dok nelinearan model (5.22) logaritmiranjem svodimo na linearan sluaaj. Tako iz (5.22) dobivamo
U=A+bX2+cX, (5.23)
gdje je U = ln Y nova sluëajna varijabla, A = In a. Model (5.23) je ilnearan p0 nepoznatimpararnetrima A, 6 i c. Kada odredimo paraanetar A, tada za parametar a imamo: a = e.
Kako vidimo, za odredivanje regresije koristili sino distribuciju slueajne varijable (X, Y).Medutim, ako distribucija nije pozuata, onda se problem regresije rjeava na osnovi uzorkasluãajne varijable (X, Y). 0 regresiji na osnovi uzorka bit ée govora kasnije.
11Li
[1Li
HH’9UpU
ILi
p
6. Viedimenzionalne sluãajnevarijable
Ako za svaki ishod w C 12 promatramo ii obi1jeja (numeriekih karakteristika) X1, X2,tada imamo n—dimenzionalmi sluëajnu -vaxijablu ih n—dimenzionalan slueajni vektorX = (X1, X2,••• , X,,). Poopéenje n—dimenzionalne slueajne varijable vodi na slueajni nizX1, X2,••, a daljnje poop&nje vodi na pojam sluëajne funkcije t —* X, koja ovisit. U ovom poglaviju ukratko áemo predstaviti n—dimenzionalne sbaeajne varijable i distribucije,neke zakone velikih brojeva i osnove teorije slueajnih procesa.
6.1. n—dimenzionalne sluëajne varijable I distribucije
Pojam i definicije n—dimenzionalnog slueajnog vektora diskretnog I kontinuiranog tipa dali smou Poglavlju 5.
Ono to je reãeno o dvodimenzionalnim sluèajnim varijablama analogno se mote prenijeti Ina n—dimenzionalmi slueajnu varijablu (ii = 3, 4,).
Neka je (12, F, P) vjerojatnosni prostor I X 12 —* ill” n—dimenzionalan sluãajni vektor.Vrijedi X’ (B) e .1 za svaki B e 8”, gdje Jo B” Borelova a—algebra u 1EVt. Dakie je X =
(X1, X2,• , X,,), pri ãemu su 12—
R, k = 1,2,••• , ii, slueajne varijable. Sa
Px(B)__P(XEB)_rP(X1(B)), Be13”, (6.1)
definiranaje vjerojatnosna funkeija .Px na J31, tj. Fx 13” —f [0,1] Vrijedi Px (K”) = P (12) = 1,a za proizvoan niz (B, i € N) medusobno disjunktnih skupova iz 13” niz (X’ (Th), i € N) Joniz medusobno disjunktnih dogadaja i vrijedi
Px (B) = (B) = ZPX (X’ (B)).
Funkcija Px Jo zakon distribucije slueajnog vektora X. Prema tome, svakom n—dimenzionalnom sluëajnom vektoru X preko funkcije Px pridru2uje se vektorski prostor (K”, B”, Px) i zadacivezani za sluëajni vektor X rjeavaju se unutar tog vjerojatnosnog prostora. Za skup moguOihvrijednosti 7?. (X) = 7?. (X1, X2,... , X,,) C K” s1uajnog vektora X = (X1, X2,••• , X,,) vrijedi
P((X1,X2,... ,X) c 7?(Xi,X2,•• ,X)) = 1. (6.2)
129
6.1. n—dimenzionalne slubjne varijable I distribucije
Distribucij a suëaj flog vektora X = (X1, X2,.• X,) diskretnog tipa odredena je diskretnimskupom moguéih vrijednosti
1?. (X) = 7Z(X1, X2, . .. , X,) = { (x, x?2, . . ,x) C JR’1 za sve ii, i2, . . .
i pripadnim vjerojatnostiina
zasvei1,i2,,i,
priãemuje p(zç,x,...,x’)>ozasvei1,i2,...,in i
Z p(x,x,,x)=P(Xcfl(X))=F(Q)=1il,i2,--. ,in n
Slueajne varijable X1, X2, , X,, su nezavisne ako i samo ako je
,x’) =pl(x)p2(z)...pfl(xi), zasvei1,i2, ,‘ pgdje je Pk (xt), = 1,2,• , stribucija slueajne varijable Xk.
Distribucija slueajnog vektora X = (Xi,X2, .. ,X,) kontinuiranog tipa je odredena akopostoji integrabilna funkcija f(xi,x2,.•• ,x) � 0, (xi,x2,-. ,x) e IR’1, takva da za svaki‘pravokutnik” S C IR’1 (S C 13’1) vrijedi P
UP((X1,X2,. ,X) eS) =Jf(xix2... ,x)dxidz2 ••dx i daje (6.3)
S U)Li
J f(xi,x2,” ,x)dz1dx2...dx,1=1.
iiFunkcija f je funkcija gustoée sluëajnog vektora X.
Slueajne varijable X1, , X, su nezavisne ako i samo ako je rU
gdje je fk (xk), —00 < x < oo, funkcija gustoôe za varijablu Xk, odnosno marginalna funkcijagustoée komponente Xk slueajnog vektora X = (Xi, X,).
Funkcija distribucije slueajnog vektora X 12 R’1 je funkcija F IR’1 —, [0, 1] defini- [)rana kao U
F(x) = F(xi,x2,... ,x)=P(X �x)=P(Xi �xi,X2 �x2, ,X�x), (6.4)x = (xi,x2,... ,x)C1R’1.
Funkcija distribucije F monotono raste neprekidna je s desna, 1)Li
—* 0 akoxk—i--oozabarjedank=1,2,...,n,— 1 akoxk—.+oozasvakik=1,2,...,n.
Ft
6. ViedimenzionaIne sluëajne varijable
U slueaju kontinuiranog sluëajnog vektora X vrijedi
‘i XQ rn
F (x1, x2, --- , x) = ff... ff (t1, t2,--- , t) dt1dt2 - - - dt, (x1, x2, --- x) C
Ako je funkcija gustoêe f neprekidna funkcija na W, tada vrijedi
f (xi,z,.-- ,x) =8F(zi,z2,--- (xl,x2,--- ,x) EF. (6.5)
ox1...8xTh
Ako funkcija gustoée f ima konaeno mnogo prekida na R’t, tada (6.5) ne vrijedi u toekamaprekida funkcije f.
Prema (6.4) lako se zapaa da je s
Fk(xk)=F(oo,--- ,00,xk,00,--- ,), k = 1,2,--- ,n
definirana jednodimenzionalna distribucija vjerojatnosti (marginalna distribucija) komponenteXk slueajnog vektora X = (X1, X2, -.. ,
Ako postoje oekivanja E (Xk), it = 1, 2,... , n, tada se ured.ena n-torka(E (X1) , E (3(2),--- , E (X)) e Ktm naziva vektor oëekivanja sluëajnog vektoraX = (X1,X2,--- ,X). Za toeku T = (E(X1),E(X2),--- ,E(X)) C K’2 moemo reéi dajeteite vjerojatnosnog optereêenja u K.
Za svaki i, j C {1, 2,-- , n} mogu se, ako postoje, definirati veliëine
s =E[(X—E(X)) (X —E(X))] =E(xX) —E(X)E(X), z,g 1,2,--- ,n.
Odavdeje s = = D(X) disperzija iii varijanca sluëajne varijable X. Za i j 5q nazivase kovarijanca slueajnih varijabli X i X i oznaëavarno s S (X1, Xi), a ãesto se oznaãava S
Cov(X,X).Zapazimo da je $jj = - Simetriana matrica
811 512 - - -
821 22 82m
Sni - - - 3nn
naziva se kovarijaciona inatrica slueajnog vektora X = (X1, X2, - - - , X,) - Neki je nazivajudisperzijska matrica slueajnog vektora X.
Prema (5-6), odnosno (51’) vrijedi
sq( � i,j = 1,2,- - - ,n, (6.6)
gdjejes= D(Xk)�O,k=1,2,-.. ,n.Akojes>Ois >O,tadasebroj
i,j=1,2,--- ,n,SjSJ
132 6.2. Zakoni veiikih brojeva i centralni graniëni teorem
za i 0 j, naziva koefleijent korelacije slueajnih varijabli X i X Zapazimo da je = 1 ida, prema (6.6), vrijedi K 1, i, j = 1, 2,•• , m. Simetriena matrica
1 r12‘21 1
r1 r2 1
naziva Se korelacijska matrica slueajnog vektora X = (X1, X2,.. , X).Ako su slueajne varijable X1, X2,... , X,, nezavisne, tadaje 5ij = 0, i j, i, j = 1,2, , n. U
ovom sluaaju kae so da su sluëajne varijable X1, X2,. , X,,. nekorelirane, matrica S je dijago- flnalna, a matrica 1? je jediniena matrica. I
Neka je p JR.” —‘ JR odredena funkcija. Moemo promatrati slueajnu varijablu iiY=(Xi,X2,... ,X)
kao funkciju sluoajnog vektora X = (Xi, X2,--- , X,). Ceste funkcije sluãajnog vektora su Pfunkcije oblika U
YClXl+C2X2++C,,X,,, CkER, k=1,2,•,n.Prema poznatom svojstvu oëekivanja, oeekivanje slueajne varijable Y je
IiZa disperziju vrijedi
a nakon kvadriranja dobiva sen
D(Y) = D ZEcjE[(Xj - E(X))(Xj E(Xjflj = cjsjj. Iii==I i=13=1 i=lj=1
Ako su slueajne varijable X1, X2,.- , X nezasne, tada je s = 0 za i j, pa je [1
D(Y)=D(ZciX)=ZcJ3(X). U6.2. Zakoni velikih brojeva I centralni graniãni teorem [JU pitanju su glavni rezultati teorije vjerojatnosti znaëajni za matemati&u statistiku, a odnosese na dvije vrste pitanja. To su takozvani zakoni velikih brojeva i centralni graniëni teorem. Obapitanja mogu se vezati za binomnu distribuciju.
Neka su X1, X2,... slueajne varijable koje imaju isto oeekivanje m. Zakoni velikih brojevat-vrde da, pod odredenim uvjetima, aritmetieka sredina
n
6. ViedimenzionaIne sIuajne varijable 133
konvergira ka m, tj. tei broju m kad n raste. Na primjer, ako su X1, X2,... nezavisne slueajnevarijable koje imaju istu distribuciju I s nepoznatim oeekivanjem m, tada zakon velikih brojevaopravdava aproksimaciju
x1+x2+...+xnn
koja je to boija to je n veée.
Istaknimo prvo jednu nejednakost koja irna znaëajnu ulogu u dokazima mnogih teorema uteoriji vjerojatnosti.
Teorem 1. (Oebiev1jeva nejednakost) Ako sluëajna varijabla X ima konaeno oeekivanjekvadrata E (x2), tada za svako e > 0 vrijedi Cebievljeva nejednakost
PUXI �e) �E(X2) (6.7)
Dokaz. Dokaimo teorem za sluoaj kontinuirane sluaajne varijable X s funkcijom gustoéef (x). Imamo:
E(X2) = JX2f(X)dx = f x2f(x)dx+ J xf(z)dx � J x2f(x)dx
IxI�s IzI<c IxI�e
� fef(x)dx=e2ff(x)dx=e2PaXI�e),Ixt�€
to i potvrduje relaciju (6.7).
Ako u (6.7) umjesto X stavimo X — E (X) dobivamo Oebiev1jevu nejednakost u specijalnomobliku:
PGX_EXl�e)�Dc. (6.8)
Kako se vidi, nejednakost (6.8) iskazuje da vjerojatnost dogadaja da slueajna varijabla Xpoprimi vrijednost izvan intervala (EX — e, EX + e) nije veéa od broja za svako e> 0.
Kako je P (Ac) = 1 — P (A), nejednakost (6.8) ekvivalentna je nejednakosti
PGX-EXI<e)>1- D(X)
Promatrajmo sada sluëajnu varijablu X koja se ravna p0 binomnoj distribuciji B (n,p).Sluëajnu varijablu X moemo napisati u obliku
x=i1+i2+..+i, (6.9)
gdje su I, j = 1,2,. . . , ii nezavisjij indikatori s istom Bernoullijevom distribucijom vjerojatnosti.Sjetimo Se: slueajna varijabla X s binomnom distribucijon predstavlja broj pojave odredenog
dogadaja A u seriji od n pokusa u neizrnjenjenim uvjetima, pri ëeniu je u svakom ponavljanjuP (A) = p i P (AC) = 1 — p. Indikator I je shieajna varijabla koja moe uzeti vrijednost 0 iii 1u ovisnosti od toga da ii se nije iii jeste ostvario dogadaj A u j—om ponavijanju.
134 6.2. Zakoni velikih brojeva i centrairil granini teorem
Promatrajmo aritmetieku sredinu indikatora
- I1+I2++Inx?-L —
71
Bernoullijev zakon velikih brojeva tvrdi da za svako e > 0
F(Xn_EXn�e) —*0 kadn—*oo.
Vrijedi i opéenitiji
Teorem 2. (Bernoullijev zakon velikih brojeva) Neka su X1, X2,... nezavisne sluëajnevarijable s istom distribucijom, s konaenom disperzijom D (Xi) = a2 i oäekivanjem E (Xi) =
m, i = 1, 2 Tada niz aritmetiëkih sredina
- x1+x2+...+xnX,-, = , 71 = 1,2,...71
tei ka m, kad m —, cc, ii smislu da za svako e> 0 vrijedi:
P(Ixn_m]�e) —O kadn—*co. (6.10)
Dokaz. Prvo zapazimo da je
E(Xn)ZE(Xi)=m, D()=4ZD(X)=—.
Sada, prema Oebiev1jevoj nejednakosti, imamo: UD(X”) 2
2 ‘=-—*O kadn—oo.• 116 716 LiOvaj teorem j asno iskazuje da aritmetieka stedina slueajnih varij abli oeekivanj a m “gubi
sluoajnost” kada je n dovoljno veliko, tj. aritmetieka sredina je sve “bliEe” konstanti in ukolikoje 71 veée. Ovdje “b1ie” znaëi da vjerojatnost ma kako malog odstupanja aritrnetieke sredine odoeekivanja tei null kad n neograniëeno taste.
Ovim teoremom iskazan je samo jedan od takozvanih zakona velikih brojeva.
Primjer 1. Pretpostavimo da vrimo niz mjerenja velieine in bez sistematskih all sa slueajnim pogrekama. Mjerenja su nezavisna i pod istim uvjetima. Na ishod j-og mjerenja moemogledati kao na slueajnu varijablu X. Slueajne varijable X1, X2,. . . , X, su nezavisne i svakas istom distribucijom vjerojatnosti. Neka smo ii n mjerenja registrirali numerieke vrijednosti:x1, x2,. . . , x,. Prema iskustvu, smatramo da éemo manje pogrijeiti ako za prib1inu vrijednostza in uzmemo aritmetieku sredinu
X1+X2+”+Xn
UAko bi ponovili cijeli postupak dobili bi, opéenito, neke druge numerieke vrijednosti:x, x,. . . , z i a4. Stoga i kaemo da su X1, X2, .. . , X, i S,3 slueajne varijable. Zakon velikih
U
El[1!
5. ViedjmenzionaIne sluajne varijable 135
brojeva iskazuje da éemo manje pogrijeiti ako radimo sa srednjom vrijednoéu svih mjerenja,jet vjerojatnosti odstupanja i?,. od m su to manje to je n veôe.
Druga vrsta pitanja odnose se na aproksimaciju binomne distribucije norma]nom distribucijom: Ako se slueajna varijabla X ravna p0 binomnoj distribuciji B (it, p) , tada slueajna varijabla
z ——
(standardizirani oblik za varijablu X) tei normalnoj distribuciji N (0, 1) kad n —, . Ovajrezultat smo ranije iskaz&i kroz Moivre-Laplaceov teorem.
Centralni granièni teorem tvrdi da to nije sluOaj samo kada je varijabla X zbroj indikatoranego vrijedi opéenitiji
Teorem 3. (Centralni graniëni teorern) Neka su slueajne varijable X1 , X2,... nezavisne1 s istom distribucijom, s E (Xi) = rn D (Xi) = a2, i = 1, 2, -. ., I neka je
XX1+X2++Xn.
Tada distribucija za standardiziran oblik sluaajne varijable X tei normalnoj norniiranoj distribuciji kad it —+ cc, tj. distribucija slueajne varijable
—X—E(X)X--nrn
D(X)X1—rn X2—rn X—m
tei riormalnoj distribuciji N (0,1) kad it —* cc.
Dakie, distribucija za Z je pribIino N (0, 1), odnosno distribucija za X je prib1inoN (urn, flu2), a toänost je to veáa to je it veée.
Napominjemo da ovaj teorem nije najopéenitiji i da postoji vie verzija ovog teorema. Centralni graniëni teorem vrijedi i u slueaju kada slueajne varijable X1, X2,... nemaju nuno istudistribuciju. U opéem slueaju, zbroj velikog broja slueajnili varijabh, pod odredenim uvjetima,moe imati prib1ino normalnu distribuciju i ako nisu ni nezavisne ni s istom distribucijom. Centralni graniãni teorem pokazuje zato je normalna distribucija tako vana. Naravno, normalnaaproksimacija ne mora uvijek vrijediti.
U mnogim stvarnim situacijama sluëajne varijable koje promatramo mogu se zamisliti kaozbroj velikog broja nezavisnih varijabli, koje su u odnosu na zbroj na odrederii naëin sve male(me moraju imati istu distribuciju). Na primjer, rezultujuôa pogreka nekog mjerenja je zbrojvelikog broja nezavisnih pogreaka, pri ëemu je udjel svake od njih u cijelom zbroju mali. Tadaovakva rezultujuéa pogreka kao slueajna varijabla ima, prema centralnom graniënom teoremu,prib1ino normalnu distribuciju. Prema ovome, slueajne pogreke imaju gotovo redovito priblinonormalnu distribuciju.
Objasnimo u kom sniislu su sumandi X1, X2,. . . , X,-. mali u odnosu na zbroj X = Xj. + X2 +• . + X,. Ako zbroj promatramo u standardiziranom obliku Z, onda disperzija svakog je
(X—mN 1 1 2 12=1,2
\ / flQ_2 no.2 fl
136 6.2. Zakoni velikih brojeva I centralni grani&i teorem
Kako vidimo, disperzija svakog sabirka je i tei mu kad ii —* cc, dok disperzija zbroja uvijekostaje 1.
Primjer 2. Odrediti distribuciju aritmetieke sredine
za konaeno au veliko n.
Ad. Prema centralnom graninom teoreniu vrijedi aproksimacija
(6.11)
gdje se slueajna varijabla Z ravna 0 distribuciji N (0, 1). Iz (6.11) slijedi
x1+x2+...-I-xn 0
n
X ima prib1ino normalnu distribuciju N (,)
Primjer 3. Promatramo pristup automobila na autoput na odredenom ulazu. U prosjekusvaki treéi automobil je odredene klase A (na primjer, sa snagom motora iznad 120 KS). NekajeX ukupan broj pristupnih automobila dok ne pristupi prvih 100 kiase A. Odrediti distribucijuslueajne varijable X.
Ad. Neka je X, i = 1, 2, .., broj automobila koji pristupi na autoput nakon to je pristupilo Sii — I automobila kiase A pa dok tie pristupi i-ti autoniobil klase A. Vjerojatnost da pristupniautomobil bude kiase A je . Velieine X, i = 1,2,... su slueajne varijable koje su nezavisne i sistom distribucijoin: fl
Li2 1
P(J)=F(Xii)(a) •,j=1,2
Ukupan broj pristupnih automobila je
x=x1+x2+...+x100. U
iiIzraëunom nalazimo da je
E(X) =3, D(X) =6, i=1,2 (6.12) r‘UiSlijedi, prema centralnom graniënom teoremu, slueajria varijabla X ima pribIino normalnu
distribuciju N (300, 600).Uii!U:
6. ViedimenzionaIne sIuajne varUable 137
Vrijednosti (6.12) moemo naOi na siijedeêi naëin. Neka je f (x) = Koristeôi razvojfunkeije f u Taylorov red u okolini nule imamo:
= 0<x<1,1—x k=O
= =Zkxk_l, 0<x<1,(1 — k=O
= xf’(x)= 2 =
( ) k=O
1+x(1 — x)3 kO
() = 15,
D (Xi) = £ (x?) — (B (X))2 = 6. •
Prinjer 4. Odrediti aproksimacije slijedeéih distribucija norma]nom distribucijom:a) binomne distribucije B (n,p) ib) Poissonove distribucije P (A).
Ad. Slueajna varijabla X s binomnom distribucijom B (n,p) definirana je s (6.9), kao zbrojnezavisnih varijabli s istom distribucijom. Buduói da je
E(X)=np, D(X)=np(1—p),
to se, prema centralnom graniënom teoremu, binomna distribucija B (n,p) moe aproksimiratinormalnom distribucijom N (np, np (1 — p)).
b) Buduái da se, za veliko n Isonovom distribucijom P (A) (Arati normalnom distribucijom.P (A) vrijedi
to se distribucija P (A) moe aproksimirati normalnom distribucijom N (A, A). Smatra se da jeova aproksiniacija zadovoljavajuOa za A 10.
Primjer 5. Neka se slueajna varijabla X ravna p0 distribuciji B (100; 0, 5). Odrediti:
1f (x)
f’(x)
(x)
1
0< a; < 1,
Sadaje(zax=)
0< a; <1.
E(X€) = OO(2)i-1:1133
E(X) =
malo p, binomna distribucija B (i-i, p) moe aproksimirati Pois= tip), to se I Poissonova distribucija P (A) mote aproksimiKako za slueajnu varijablu X s Poissonovom distribucijom
P(X>60), P(30�X�50), P(X=40).
6.3. Uvod u teoriju sluEajnih procesa
Ad. Prvo standardizirajmo sluëajnu varijablu X i iskoristimo aproksimaciju:
1000.5= —50 r.N(0,1).
V100 0.50.5 5
Sada imanjo:-
60) = P (X50
60—50) = P(Z> 2) = 0,5 — (2) = 0,02275,
P (30 X � 50) = P (—4 S Z 5 0) = (4) = 0,4999683,
P (X = 40) = P (39,5 5 X <40,5) = P (—0,1 5 Z <0,1) = 2 (0,1) = 0,07966 .•
6.3. TJvod u teoriju sluèajnih procesa pPrirodna goneralizacija pojma slueajnog vektora X = (X1, X2,. , X,) vodi na pojam slueajnogprocesa.
Opis mnogih dogadaja u prirodi, tehnici, ekonomiji 1 drugdje mote se postiêi pomoôu slueajnih varijabli koje ovise o vremenu.
Na primjer, potronja elektriCne energije u jednom naseiju podvrgrnita je sluaajnim oscilacijama, u ovisnosti o potrebi i navici potroaea. Potronja elektriëne energije moe se shvatitikao kontinuirana sluoajna varijabla X, a ako mijenjamo vrijeme praéenja t, potrnja elektrieneenergije je kontinuirana sluãajna varijabla koja ovisi o vremenu t.
6.3.1. Pojam slueajnog procesa
Skup slueajnih varijabli, koje ovise o nekom parametru, ëini slueajni proces.
Definicija. Neka je (Q, F, P) odredeni vjerojatnosni prostor, T C JR neprazan ship i neka je 11sval<om t C T pridruena odredena sluèajna varijabla X : 12 —* JR. Tada se familija slueajnih Uvarijabli
{Xt:tET}naziva slueajni ill stohastieki proces.
Velieina t naziva se pararnetar, skup T parametarski skup iii parametarski prostor, a Uskup vrijednosti slueajnih varijabli naziva se prostor stanja.
Zapazimo da je slueajnim procesom {X : t e T} iskazana funkcija s 7’ x 12 u skup realnihbrojeva ik, tj. (t, w)
—
X (w) C JR. Za svaki fiksirani t e 7’, w —* X, (Lii) odredena je slueajnavarijabla X, koja opisuje promatranu slueajnu pojavu u odredenom momentu t C T. Tako je Xvrij ednost procesa u trenutku t. 11:
Takoder, zapazimo da se u pojam slueajnog procesa za 7’ = {1} ukiapa pojam slueajne iivarijable, a za 7’ = {1, 2,.. , n} ukiapa se pojarn n—dimenzionalnog slueajnog vektora, zaT = N pojam slueajnog niza, te za T = JR iii neki interval od JR pojam slueajne funkcije t —* X,tET. Li
U zavisnosti od prirode parametarskog skupa razlikuju se procesi s diskretnim parametrom, kod kojih je 7’ prebrojiv skup, I procesi s kontinuiranim parametrom, kod kojih
U
U
6. Vi�edimenzionalne sIuajne varijable 139
je T neprebrojiv skup. Parametar t obieno ima znaëenje vremena i pripadni slueajni procesopisuje odredeni fizikaJni proces koji tokom vremena mijenja svoje stanje na sluëajan naëin.Odatle i dolazi naziv slueajni iii stohastieki proces.
Nadaije, slueajni procesi se dijele na procese s diskretnim vrijednostima i na procese s kontinuiranim vrijednostima. Ako je X diskretna slueajna varijabla a svaki t e T, kae se da je{X t C T} sluëajni proces s diskretnim vrijednostima, a ako je X kontinuirana sluaajna varijabla za svaki t C T, tada je za svaki {X : t T} s1uajni proces s kontinuiranimvrijednostima.
Nadaije, sluëajni procesi se dijele na stacionarne i nestacionarne.
Definicija. Slueajni proces {X t C T} je stacionaran ako za svaki n C N, svaki moguéiizbor t1, t2,... t, C T i svaki broj u e JR za koji je , t,. e T sluèajni vektori
,Tt,) i (Tt1+, Tt2÷,... ,
irnaju iste distribucije vjerojatnosti.
Dakle, sluãajni proces je stacionaran ako su njegove konaèno dimeuzionalne distribucije invarijantne u odnosu na translaciju u vremenu.
Funkcija t —* m (t), t C T, defmnirana kao:
m(t)= E(X)
(oeekivanje od Xt) naziva se matematieko oeekivanje iii kraôe, oeekivanje slueajnog procesa{X t c T}.
Funkcija (t1, t2) —, .R (ti, t2) , (ti, t2) e T x T definirana S
R(ti, t2) E [(X1 — m (t1)) . (X2 — m (t2))}
naziva se autokorelacijska funkcija (iii samo korelacijska funkcija) sluëajnog procesa{X : t C T}. Odatle je
R(t,t) = E (X — m(t))2 =
gdje je funkcija t —* 32 (t), t T, disperzija iii varijanca slueajnog procesa {X t C T}.
Primjer 6. Jedan primjer slueajnog procesa u elektrotehnici je vremenski signal s aditivnimumom iskazan sluëajnom funkcijom oblika
Xt=A(t)sin(wt)+Yt, tETclR,
gdje je Y intenzitet uma u trenutku t.Za svaki t C T dobija sejedna slueajna varijabla X, a za svaku fiksiranu n—torku (t1, t2, t,)
dobija sejedan sluëajan vektor
Prinjer 7. U jednom proizvodnom pogonu koji radi kontinuirano 24 sata na dan radim strojeva. Svaki stroj radi dok se tie pokvari, a zatim se stroj popravi i ponovo ukljuei iipogon. Neka je 1% vrijeme rada i—tog (i = 1, 2,-S. , m) stroja izmedu dvije uzastopne popravkei neka je [4 vrijeme popravka i—tog stroja. Velieina V je kontinuirana sluëajna varijabla s
6.3. Uvod u teoriju sIuajnih procesa H
odredenim zakonom distribucije (obieno eksponencijalni zakon). Takoder, U je kontinuiranaslueajna varijabla sa svojim zakonom distribucije.
Za odvijanje proizvodnog procesa od znaëaja je slueajna varijabla X , t e [0, a] (na primjer,vrijeme ocl 0 do 24 sata) koja pokazuje broj ispravnih strojeva koji su ukljueeni u rad. SluaajnavarijabJa X, moe poprimiti vrijednosti 0, 1, 2,.. m.
Ako promatramo jedan radni dan, moguée je zamisliti da se proces odvija toga dana takoda je startano s m’ ispravnih strojeva. U momentu t1 > 0 pokvari se jedan stroj, zatim so umomentu t2 > t1 pokvari jo jedan stroj, dok je u momentu t3 > t2 zavren popravak jednogstroja I ukijuouje se u rad, ito isto dogodi so 1 u momentu t4 I tako daje. Pripadna trajektorijat —* x, prikazana je na slici, a predstavlja jednu od moguih realizacija sluëajne funkcije t —,
t e [0,sJ.
fl
LiKako vidimo, u danom primjeru pojavijuje se skup svih moguêih realizacija (trajektorija)
koje prikazuju odvijanje procesa u toku jednog dana i odredena distribucija vjerojatnosti natorn skupu. Opisani slueajni proces t e T = [0, s} je proces s diskretnirn vrijednostirna S
kontinuiranim parametrom.
Primjer 8. Neka su Y i Z nezavisne sluëajne varijable s normalnim distribucijama N (mi, ?)i N (m2, u) i neka je T = [0, oo). Tada je
{X = e’tcos(27rZt) t E T}
slueajni proces s kontinuiranim vrijednostima s kontinuiranirn pararnetroin. Za Y ? 0 pro- nces opisuje pojavu priguenih oscilacija sa slueajnim koeficijentorn priguenja Y i slueajnom [1frekvencijom Z. Svaka realizacija t
—
z (t) Xt danog slueajnog procesa je jedna funkcija oblikat—* x(t) =e_Vtcos(2lrzt).
.3.2. Slucajrn lanci, Markovijevi lanci
Ako su za neki siueajni proces i prostor stanja i parametarski prostor diskretni, slueajne varijableX i pararnetar t rnogu. poprimiti sanxo konaeno lb prebrojivo mnogo vrijednosti, onda govorimoo slueajnim lancima. Za neki slueajni lanac mogu se pripadna stanja i vrijednosti parametranumerjratj na slijedeei naëin:
Z = {1,2,•.. ,i,i+i,...},T {to,ti, ,tm,tm+i,•••},
U[I
6. Viedimenzionalne sluèajne varijable 141.
gdje je 0 � t0 <t1 < <t,, <t,fli < . Vremena t0, t1,••. ne moraju biti ekvidistantna.
Ako u nekom slueajnom lancu vjerojatnost dogadaja Xtm+i ovisi samo o stanju od trenutkatm onda govorimo o Markovijevom lancu, tj. vrijedi
P (Xty1 = im+xtXto = i0, X1 = i1,••• , Xt,_ = = = im+iXtm = im)
zasveme{O,1,2,...}izasveio,ii,’•,im÷jcZ.
Neka je dan Markovljev lanac I dva vremenska trenutka tm tm+1 . Uvjetne vjerojatnosti
(X1 = jlXtm = = Pq (tm, tm±i)
se zovu prijelazne vjerojatnosti. Prijelazne vjerojatnosti iskazuju vjerojatrxost da stanjeXtm i za tm prijede u stanje Xtm+i = j za tm+1.
Ako je prostor sta.nja nekog Markovijevog lanca konaean, tj. Z = {1, 2,••• , N}, onda seprijelazue vjerojatnosti Pij (t1, t2) izmedu stanja s vremenima t1 it2 mogu prikazati kvadratnornmatricom P (t1, t2), takozvanom matricom prijelaza:
Pu (ti, t2) P12 (tu, t2) . . PiN (ti, t2)p21(ti,t2) p22(tj,t2) ... p2n(tj,t2)
P(t1,t2)=PN1 (tu,t2) PN2 (t1,t2) PiVN (t1,t2)
Vremena t1 it2 ne moraju slijediti jedan za drugim.
Ako prijelazne vjerojatnosti Markovljevog lanca s konaOnim prostorom stanja Z = f 1, 2,- , N}ne ovise o vremenu, tj. ako vrijedi
pia(tm,tm+u) Pij,
onda govorimo o hornogenom Markovijevom lancu. Dakie, prijelazne vjerojatnosti ne ovise 0
vremenu i iste su tokom ëitavog procesa. Homogenom Markovlj evom lancu s konaenim prostoromstanja pripada, dakie, rnatrica prijelaza
P11 P12 PiN
=P21 P22 P2N
, (6.13)
Pm PN2 PNN
pri öemu vrijedi
Pij � 0 zasve i,j i = 1 zasve i. (6.14)
Buduéi da su Pij nezavisni o vremenu, Pij predstavlja vjerojatnost da stanje i prijede u stanje ju bib kojem vremenu.
Primjer 9. Broj pripadajuéih izlaznili vodova neke telefonske centrale moe se modeliratipomoéu Markovijevog lanca. Radi jednostavnosti, pretpostavimo da postoje samo dva voda.
142 6.3. Uvod u teoriju sluèajnih procesa
Dakie, postoje stanja i = 0,1,2 (0, 1 iii 2 voda mogu biti zauzeta). Nekaje jedinica vremena 1mm. Za prijelaznu matricu dobivene su slijedeée vrijednosti:
0,7 0,3 0,0(Pu) = 0,2 0,5 0,3 , i,j = 0,1,2.
0,1 0,4 0,5
Odavde je, na primjer, P12 = 0,3 vjerojatnost da su u trenutku tm dva voda zauzeta, ako je utrenutku tm_i bio zauzet jedan vod.
Svalca kvadratna matrica P = (pjj) tipa N x N sa svojstvima (6.14) zove se s1uajnamatrica, a njezini vektori retci zovu se slueajni vektori.
U nekom homogenom Markovijevom lancu distribucija sluëajnih varijabli X, u danoni trenutkudana je vjerojatnostima
P(X=i) =p(t), i=1,2,•• ,N, (6.15)
a buduei da se proces u trenutku t sigurno nalazi u nekom stanju, vrijedi
N(6.16)
Vjerojatnosti (6.15) mogu se prikazati pomoéu vektora [1U
p(t) = (Pa (t),p2(t),... ,PN(t)).[1,
koji se zove vjerojatnosni vektor. Ovaj vektor opisuje distribuciju vjerojatnosti po stanjima [jhomogenog Markovijevog lanca za trenutak t.
Ako znamo prijelaznu matricu P homogenog Markov]jevog lanca, koja je definirana s (6.13) ri koja ispunjava uvjete (6.15) i (6.16), tada iz distribucije vjerojatnosti u trenutku t moemo Uodrediti distribuciju u trenutku t + 1, tj. iz P i p (t) moemo odrediti p (t + 1) . Vrijedi:
p (t + 1) = p (t) . P.
Qdavde je
p(t+2) = p(t+1).P=p(t).P2 i opáenitop(t+k) = p(t).PC k= 1,2,...
nSada,zat=Oimamo
p(k)=p(0).Pk k=1,2,.. , (6.17)a to je jedan homogen Markovljev lanac koji so opisuje pomoêu poëetne distribucije p (0) i Fi:prijelazne matrice p. U
Kako je matrica P slueajna matrica, to je i p’ takoder slueajna matrica.Homogeni Markovljev lanac s matricom prijelaznih vjerojatnosti P 1 s vektorom poëetnih
vjerojatnosti p (0) je stacionaran ako i samo ako je
p(k)=p(0), k=1,2,... . UPrimjer 10. Neka ëestica mijenja svoje stanje X (1 S x 5 5) u trenucima t = 1,2,prema slijedeéim pravilima:
pU
F I
6. ViedimenzionaIne sluëajne varijable 143
1. Iz mjesta x = 2,3,4 se u slijedeóem trenutku nalazi s vjerojatno6u p = 0,6 desno i svjerojatno6u 1 — p = 0, 4 lijevo.
2. Na mjestima x = 1 i z = 5 ëestica se apsorbira, tj. ona ostaje tamo, s vjerojatnoéu 1, U
slijedeéim vremenima.3. U trenutku t = 0 ãestica se nalazi na mjestu x = 2.Treba odrediti distribuciju vjerojatnosti p (3) u trenutku t = 3.
Ad. Prema (6.17) imamo:p (3) = p (0) P3,
gdjejep(O) = (0, 1,0,0,0),
1 0 0 0 00,4 0 0,6 0 0
P= 0 0,4 0 0,6 00 0 0,4 0 0,60 0 0 0 1
Sadaje1 0 0 0 0
0,496 0 0,288 0 0,216P3= 0,160 0,192 0 0,288 0,360
0,064 0 0,192 0 0,7440 0 0 0 1
p (3) = (0,496; 0; 0,288; 0; 0,216).
6.3.3. Markovijevi procesi
Neka je {X± : t e T} dani sluèajni proces I neka je tt > 0 realan broj takav da je t + u C T.Slueajna varijabla Xfu — za svaki t C T naziva se prirast procesa.
Ako su slueajne varijable X1÷,—X1 i X2—X2 distribuirane p0 istom zakonu distribucijeza svaki t1, t2, t1÷,, t2 C T, tada se za slueajni proces {X : t C T} kae da je sluëajni processa stacionarnim prirastima.
DaMe, slueajni proces {Xt : t C T} ima stacionarne priraste ako distribucija prirasta —
X ne ovisi 0 t, nego samo 0 U.
Za sluoajni prostor {Xt : t c T} kae se da je sluëajni prostor a nezavisnim prirastimaako za svaki prirodan broj n � 3 i svaki izbor parametara t1 < t2 < . . . t, iz T, skup prirasta
— X1, Xt3 — XE2, ... , X — X,,_, ëini skup nezavisnih slueajnih varijabli.
Prirujer 11. Slueajni procesi {X : t C T} ëije Sn ave konaënodimenzjonalne distribucijenormalne nazivaju se Gaussovi sluëajni procesi.
Prirnjer 12. Gaussov sluaajni proces {Xt : t C T} kod kojeg je T = [0, ), s nezavisnim stacionarnim prirastima, X je normalno distribuirana slueajna varijabla s oaekivanjem idisperzijom:
m(t) = 0, 52(t) = 52(1) t za svaki t > 0,
144 6.3. Uvod u teoriju sluëajnih procesa
te X0 = 0 (s vjerojatnoéu 1) je takozvani proces Brownovog gibanja ill Wienerov proces.Ako je jo 2 (1) = 1, takav sluëajni proces zove se standardni Wienerov proces.
Za svaki t2 > t1 � 0 prirastu X2 — X, = X2_1 pripada normalan zakon distribucije:N (0, 52 (1) Ct2 — ti)) . Odavde se vidi da maloj promjeni t2 — t1 parametara pripada mala disperzija. To znaëi da malim promjenama parametara odgovaraju male promjene vrijednostiprocesa.
Skotski botaniear Robert Brownje poëetkom 19-g stoljeéa prouëavao kaotieno gibanje ëesticapolena u vodi. Albert Einstein je pokazao da se isti fenomen zapaa i na nivou molekula. NorbertWiener je, u prvoj polovini 20-og stoljeóa, dao matematieki model ovog procesa.
Trajektorije Wienerovog procesa su neprekidne funkcije, all nisu derivabilne ni u jednoj toeki.Ova ëinjenica je doprinjela da se shvati vanost takvih funkeija i da se razvije vie novih teorija.
Primjer 13. Poissonov proces. Ovo je jedan tip diskretno vrijednog slueajnog procesa s pnezavisnim stacionarnim prirastima. P
S1uajni proces {X : t e [0, )} s zakonoin distribucije slueajne varijable X , za svaki t > 0,
P(X=k)= k=0,1,2,••, U
gdje je A = E (X1) > 0, naziva se Poissomov proces. Oeekivanje i disperzija za Poissonov proces:
rn(t)=s2(t)=At, t�0.
Prirast X2 — X1 (t2 > t1 � 0) distribuira se kao i slueajna varijabla Xj2_ po distribucijiPoissona Fo (A (t2 — ti)) i vrijedi
F (X2 — X1 = k) =(A (t2— t1ke_A(t2_tI), k =
Slueajna varijabla X predstavlja broj signala u vremenskom intervalu [0, t). Brojevi signalau disjunktnim intervalima su nezavisne slueajne varijable.
Definicija. Slueajni proces {X : t c T} zove se Markovljev proces ako je za svaki prirodanbroj n � 3, svaki izbor t1 <t2 < . . . t,,. iz T I svaki moguéi izbor realnih brojeva x1, x2,• ,
(M) P(X � x,j (X_1 = zn_i,... ,X1 = zi)) = F(X zIXt_1 = x_i).
nLiRelacijom (M) izraeno je takozvano Markovijevo svojstvo, koje iskazuje da distribucija
vjerojatnosti slueajne varijable X u trenutku t = t, ovisi sanio o vrijednosti x,_i procesa Un-iomentu t_1 < t, dok ne ovisi o vrijednostima Zn_2,•• , x1 procesa U ranijim momentima LItn—2>tn_3>...>ti.
Ako je {Xt : t e [0, oo)} proces s nezavisnim prirastima i X0 = 0 (s vjerojatnoéu 1), tada jeon Markovljev proces.
Wienerov proces je i Markovljev proces. PU
U
6. VedimenzjopaIne sluëajne varijable 145
Ako je {X t C [01 oo)} diskretno vrijedan Markovljev proces i ako prijelazne vjerojatnostiP (X = Xk X_1 = ne ovise individualno o t, i t,.1, nego samo o razlici t, — =
tako da se moe pisati:
P(X+ =x(Xt=xj) =pjj(r), i,j=1,2,••
tada se taj proces naziva homogeni Markovljev proces.
Poissonov proces je hornogeni Markovljev proces.
Primjer 14. Proces radanja i umiranja. Neka je X veliëina neke populacije (ijudi,bakterija, elektrona, radioaktivnih ëestica i slieno) u vremenu t. Iz razliëitih uzroka, neke jedinkeisëezavaju a stvaraju se nove. Prirodno je pretpostaviti da buduea velieina populacije zavisi odveliëine u pro1osti samo preko sadanje velieine. U torn sluëaju {X : t e [0, )} je jedan tiphomogenog Markovijeva procesa koji je nazvan proces radanja i urniranja.
146 6.3. Uvod u teoriju sluëajnih procesa
P
‘0
•rH-
CzrnC
7. Osnove teorije uzoraka
7.1. Populacija i sluëajni uzorak
Promatrajmo situp nekih elemenata. U maternatiekoj statistici takav skup naziva se populacijaiii generalni skup. Za svalci element populacije zanima nas odreceno odredena numeriekakarakteristika lb statistiëko obi1jeje, kraée obi1jeje, populacije.
Primjer 1. U kutiji se nalazi N kuglica od kojih je Np bijelih i N (1 — p) crnih. Skup ovihkuglica ëini jednu populaciju. Za obilj&je svakog elementa (kuglice) uzmimo boju kuglice. OvoobiIjeje nije numerieka karakteristika, all to moemo urediti. Na primjer, uzmimo daje obiIjejeo ako je kuglica crna ii ako je kuglica bijela.
Primjer 2. Godinja proizvodnja jedne tvornice elektrienih sijalica je jedna populacija. Zaobi1jeje svake sijalice moemo uzeti “duljinu 2ivota” sijalice U satima.
Primjer3. Treba vriti mjerenje neke fizikalne velieine. Zbog razlioitih smetnji jednomjerenje nije dovoljuo toãno pa vrimo niz mjerenja. Situp svih mogueih mjerenja áini jednupopulaciju. Obiljeje svakog mjerenja je vrijednost koja se mjerenjem dobije.
Ovi primjeri pokazuju da populacija mo2e imati konano iii beskonaeno (prebrojivo lb neprebrojivo) mnogo elemenata. Kod svakog elementa populacije moemo se zanimati ne samo zajedno obiIjeje, nego za dva ill vise obi1jeja istovremeno.
Osnovni problem matematitilce statistike je u tome da se za danupopulaciju odredi distribucija odredenog obi1jeja na ujenirn elementima.
Primjer 1’. U primjeru 1 nepoznat je broj bijelih i crnih kuglica. Distribuciju obiIjejamoemo odredjti tek kada odredimo broj p. Tada su odredeni i brojevi Np bijelih i N (1 — p)crnih kuglica.
Primjer 2’. U Primjeru 2 distribuciju “duijina ivota?’ moemo utvrditi ako znamo postotakproizvedenih sijalica ëija je “duljina ivota” u odredenim granicama [a, b za razne vrijednosti ai b, 0 a < 6.
Primjer 3’. U primjeru 3 distribuciju traenog obi1jeja moemo dati kada utvrdimo kolikopostotaka tih mjerenja daju rezultate u zadanom intervalu [a, 6] za razne vrijednosti a I 6, 0 �a <6.
149
150 7.1. Populacija I sIuajni uzorak
U pralcsi, u najveóem broju sluáajeva, nije moguóe dobiti kompletnu informaciju o distribucijiobi1jeja u cijeloj populaciji. Raziozi mogu biti razliëiti. Na primjer, preveliki je broj elemenatapopulacije (primjer 1), preveliki su trokovi za utvrdivanje obi1jeja za svaki elemenat populacije(primjer 2), iii nemoguánost utvrdivanja obi1jeja za svaki elemenat populacije (primjer 3).
Stoga, ostaje moguênost da uzmemo dio popuacije i da na njemu utvrdimo obiJjeje kodsvakog elementa i da zatim dobijenu distribuciju proirimo na cijelu populaciju. U ovom slueajunameée se pitanje reprezentativnosti uzetog dijela. Na primjer, ako u primjeru 2 uzmemo samosijalice proizvedene u jednom danu ne moe se reel da je uzeti dio reprezentativan. Dakie,treba voditi raCuna o naëinu izbora dijela populacije. To svakako treba biti na naCin kojim seobezbjeduje da izbor elemenata bude slueajan.
Ako jedan elemenat skupa biramo sluaajno iz cijele populacije, onda populaciju moemoslivatiti kao skup svih moguéih ishoda �, a elemente populacije promatramo kao moguCi ishodiw. Kako se svakom elementu populacije pridru2uje jedan broj, njegovo obi1jeje, to obi1jeje jejedna slueajna varijabla X = X (w), w e Q. Tako se problem svodi na odredivanje distribucijesluOajne varijable X.
Ako slueajno biramo n elemenata populacije w1, w2, . . . , w,, tada imamojednu n-dimenzionalnusluëajnu varijablu (X1 (wi) ,X2 (w2) , . . . , X,1, (wa)) iii kraCe (X1,X2,... ,X). Zaista, u jednomslueajnom izboru ii elemenata populacije w1, w, .. . 1w,1 slueajna varijabla (X1, X2,. . . , X,) uzetée jednu odredenu vrijednost (x1, x2 x), u drugom sluaajnom izboru n elemenata populacije of1, % slueajna varijabla (X1, X2,. . . , X,) uzet Ce drugu odredenu vrijedriost(xi, x,. .. , x), itd. Prema tome, (X1, X2,.. . , Xi.) predstavlja n-dimenzionalnu sluaajnu varijablu, gdje se varijabla X1 odnosi na i—to izvlaaenje. Ova n-dimenzionalna slueajna varijablazove se sIuajni uzorak obima n.
Promatrat éemo samo uzorke kod kojih su slueajne varij able X1, X2,.. . ,X, nezavisne i svakaima istu distribuciju kao i obiIjeje X koje promatramo. To je takozvani jednostavan slueajniuzorak koji Cemo zvati kratko uzorak.
- Ako populacija inià kohaCan b±oj elemenata N, tada jednostavan sluCajni uzorak thoemodobiti na naCin da svakom elementu populacije pridruimo numeriranu karticu, kartice izmjeamoI slueajno izvuëemo jednu karticu w1 I odredimo vrijednost obi1jeja X1 (wi) = x1, sada izvuèenukarticu vratimo medu ostale kartice, izmjeamo ih i ponovo slueajno izvuCemo jednu karticu0)2 i odredimo vrijednost X2 (w2) = x2 itd. Ova izv1aenja su medusobno nezavisna pa takav Upostupak dobivanja uzorka garantira nezavisnost slueajnih varijabli X1, X2,. . . , X, i ispunjenjeuvjeta da sve imaju istu distribuciju kao i obiljeje X. Ovakav postupak samo pojanjava toznaëi jednostavan sluCajni uzorak, dok se u praksi ne postupa tako. 0 postupcima dobivanja jJuzorka bit Ce govora kasnije.
Primjer 4. U primjeru 1 obi1jeje X uzima dvije vrijednosti: 0 ako je kuglica crna ii akoje kuglica bijela I ima Bernoullijevu distribuciju vjerojatnosti:
p
°Ii IiI 1—pJp
Jednostavan slueajni uzorak ostvarujemo ako kuglice izvlaeimo jednu po jednu, kod svake Likughce registriramo njenu boju I vraCamo u kutiju prije izvlaeenja slijedeCe. Ako bismo kugliceizvlaaili bez vraCanja onda sluCajne varijable X1, X2,. . . , X,, ne bi bile nezavisne, jer, na primjer,
U
7. Osnove teorije uzoraka 151
vrijedi
P(X2=lIXi=Q) N—i’P(X2=iX1=i) =
Dobivene vjerojatnosti su razlièite, to je dovoljno za zakljueak da slueajne varijable Xi i X2nisu nezavisne. •
7.2. Prikazivanje statistièkih podatakaFromatrajmo obiljelje X na nekoj populaciji. Uzmirno slueajni uzorak dimenzije m i registrirajmo vrijednosti promatranog obiljelja X ma elementima izabranog uzorka. Ove vrijednostiporedamo u rastuãi niz, takozvani varijacijski niz, a zatim iz tog niza izdvojimo sve razlieitevrijednosti. Neka su to vrijednosti
X1,x2,..,Xk (k�n), (7.1)
gdjejexl<X2<”CXk.
Skup vrijednosti (7.1) je skup raz1iitih vrijednosti koje obiljelje X uzima na elementirnaizabranog uzorka. Neka je vrijednost x1 oblljja X registrirana n1 pita, x2 registrirana n2 puta,
vrijednost Xk registrirana k puta, gdje je
722 + + = 72-
Broj n je frekvencija vrijednosti z, a broj p = je relativna frekvencija vrijednostix (i=1,2,... ,k).
Distribuciju obiljelja X ëini skup moguãih vrijednosti (7.1) $ pripadnim frekvencijama n2,• ,
odnosno relativnim frekvencijama ma, !&2,... , Distribucija obiljelja X obieno se prikazujetablicom moguéih vrijednosti s frekvencijama iii relativnim frekvencijama kao tablica (7.2) iii(7.3):
X x1 I (7.2)iii nijn2 “lnikI 72
[ :ri lxi x2l--jxkI (73ma ma ... ma)i.rt lb fl 71 71
Talcoder, mole se grafieki prikazati poligon distribucije frekvencija 111 kraóe poligonfrekvencija (slika 7.1.), gdje su toeke A = (x1, ni), i = 1,2,- , k. Na isti nain prikazuje se Ipoligon relativnih frekvencija s toekama B = (xi, ), i = 1,2,-- , /c.
Ako je dimenzija uzorica ii velika I ako obiljelje ima mnogo razlieitih vrijednosti, tada opisaninaëin prikazivanja statisti&ih podataka nije pogodan. To je sluëaj kod obiljelja neprekidnogtipa, na prirnjer, rezultati mjerenja neke fizikalne veliëine(na primjer, duijina livota, teina,ëvrstoéa). U ovoni slueaju se podaci meg-u grupirati p0 skupinama vrijednosti obiljelja, naprimjer, p0 intervalima jednake duijine. Neka su to intervali
(aD, aa) [a1, a2), . . . , [aj_, au
152 7.2. Prikazivanje statistiëkih podataka
n(z)
A2
iiSlika 7.1.
Broj
a_1 + a p=
2= 1,2, ,1 ,
zove se sredina razreda [a1, ad). Tako Se razred (interval) [a.i, a) zamijenjuje sredinom razreda nx (i = 1,2, ,l). Nelca je n broj vrijednosti obiljeja X koji pripadaju razredu [a_i, a) LI(i = 1,2,... , 1). Broj n zove se frekvencijarazreda (i = 1,2,.•• ,I) i vrijedi rti+n2+ = n.Na tablici (7.4) predstavljena je distribucija frekvencija p0 razredima, a na slici 7.2. dan jegrafieki prikaz podataka pomoéu poligona frekvencija i histogranrn distribucije frekvencijaih kraOe histograma frekvencija, gdje su toëke A = (x€, iii), i = 1,2, , I, A = (a, 0),B =(b,0), a brojevi a i b su takvi daje P
Ua+xj b+xj
2 ai= 2U
n(x)
PU
A B0 a b
Slika 7.2.
Na isti naëin prikazuje se i poligon relativnih frekvencija s toëkama B = (xi, ¶), i1,2,.. ,1.
UH
7. Osnove teorije uzoraka 153
Razredi Stedine razreda Frekvencije razredaacdoa1a1 do a2 (74)
aj_1do aj xl
Dok se u prvom sluëaju (s1uaj statistiekih podataka (7.1)) frekvencije pridruuju brojevima,u drugom sluãaju (slueaj grupiranja vrijednosti p0 intervahnia) frekvencije se pridriñuju intervalima. Stoga, u drugom sluáaju, danini nizorn statistiëkih podataka o nekom obiIjeju nijejednoznaeno odredena pripadna distribucija frekvencija. U ovom sluëaju distribucija frekvencijaOvisi 0 naèinu grupiranja podataka u razrede.
Primjer 5. Neka obi1jeje X oznaëava ocjenu iz matematike studenata jednog fakultetakoja se iskazuje brojevima 1, 2, 3, 4 i 5. Neka je izabran slueajni uzoralc od m = 20 studenata ineka su registrirane slijedeée vrijednosti obi1jeja X
2, 3, 1, 3, 2, 1, 4, 2, 5, 2, 3, 3, 2, 4, 3, 1, 2, 3, 2, 4.
Odrediti distribuciju frekvencija i relativnih frekvencija, te poligon frekvencija I relativnih frekvencija.
Ad. Statistieke podatke uzorka poredajmo u rastuéi niz, tj, u varijacijski niz:
1, 1, 1,2,2,2, 2,2,2, 2,3,3, 3, 3,3,3, 4,4,4,5.
Distribucija obiIjeja X prikazana je na tablicama s frekvencijama I relativnim frekvencijama:
fxe 112I’ L7 6L3[1 20
1 2 3 I 5 ZI [0.15 0.35 0.30 0.15 L°°
Grafovi poligona frekvencija i relativriih frekvencij a dani an ma slid 7.3. a) i b).Ak LI
7-I
0.35-p I J I
3-
I
0.15-
1 2 34 5 1 2 3 45a) b)
Slika 7.3.
154 7.3. Empirijska funkcija distribucije
Oãevidno je da izmedu grafova na slid 7.3. a) i b) nema bitnih razlika. Rijee je samo 0promjeni injerila na ordinatnoj osi.
Primjer 6. Neka obi1jeje X predstavlja teinu osoba jedne populacije (na primjer, studentijednog fakulteta). Neka je obavijeno mjerenje teine 100 osoba i neka su dobivene vrijednosti:
Teina u kg Broj osoba60do62 6 P62do64 1064do66 1766do68 32 P68 do 70 18 U70do72 1272do74 5
Odrediti distribuciju frekvencija p0 razredima, te poligon i histogram frekvencija.Ad. Distribucija frekvencija p0 razredima prikazana je na tablici:
Razredi Sredine razreda Frekvencije razreda60do62 61 6 r62do64 63 1064do66 65 1766do68 67 32 n68do70 69 1870do72 71 12
£
72do74 73 5
Poligon i histogram frekvencija dani su na slici 7.4.. U
32
1710
6
0
Slika 7.4.
[17.3. Empirijska funkeija distribucije
UNcka su registrirane vrijednosti obi1jeja X na elementima izabranog uzorka dimenzije ii, poredaneii rastuéi niz, tj. varijacijski niz:
, UU
7. Osnove teorije uzoraka 155
pri emu je
Xl< K K Zn
Definicija. Empirijska iii uzoraeka funkcija distribucije obi1jeja Xdefluira se za svaki c e 11 kao
f 0, zax<x1,F(x)= , zaxk<x<xk+l,1�k<n—1,
I 1 zax�x.
Zapazimo da je empirijska funkcija distribucije zapravo funkeija distribucije vjerojatnostiodredene diskretne diskretne distribucije vjerojatnosti koja u svakoj toeki xk ima skok
.Ako
je u toeki Zk palo vie podataka uzorka, recimo j podataka, tada u toeki x,, empirijska funkcijadistribucije ima skok
Empirijska funkcija distribucije F (x), dobivena na osnovi uzorka, aproksimira funkeiju distribucije F (x) = P (X < x) sluëajne -varijable X, a aproksimacija je to boija to je dimenzijauzorka ii veOa. Slijedeei teorem poznat pod nazivom centralni teorem statistike tvrdi da jeta aproksimacija uniformna 0 x.
Teoreim Neka-je Fernprijska-funkci}a-distribucijedebivena-i jednostavnegslucajr oguzorka obima n iz distribucije s funkcijom distribucije F Tada je, (s vjerojatnoéu 1),
urn sup IF (x) — F(x) = 0.fl_s dE
Primjer 7. Neka su vrijednosti obi1jeja X na ri = 10 elernenata izabranog uzorka;
5, 7, 3, 9, 10, 9, 6, 3, 9, 6
Odrediti distribuciju frekvencija i relativnih frekvencija obiljeja X, te empirijsku funkciju dis—tribucije i nacrtati njen graf.
Ad. Varijacijski niz vrijednosti uzorka je
3, 3, 5, 6, 6, 7, 9, 9, 9, 10
Distribucija frekvencija i relativnih frekvencija obiljeja X su:
5 9110 ZLmJ2 I 2j1 3j 1 10
3 5 6 j‘
[ 100.2 ro.i 10.2 0.1 0.3 0.11 1
7.4. Neke znaajne statistike
Empirijska funkcija distribucije je:
0, x<3,
=0.2, 3�x<5,
5 � x <6,
F(x)= =05, 6�x<7,
=0.6, 7�x<9,
9�x<lO, r1, x>10.
SSFn(x)
1
0.5
0.2 t3
SIlica 7.5.
7.4. Neke znaëajrie statistike [11LI
Vratimo se na osnoyni problem odredivanja distribucije odredenog obiljja X na cijeloj populaciji. To znaëi da treba odrediti p (xi), i = 1, 2,... ako je K diskretnog tipa lb funkeiju gustoéef (x),
—
< x <oo ako je X kontinuiranog tipa. Centralni teorem statistike tvrdi da jednostavan slueajni uzorak moe dati kompletnu inforinaciju o distribuciji obi1jeja X pod uvjetomda obim uzorka n neogranieno raste. Medutim, buduôi da se u praksi radi samo s konaonimobimom uzorka, to se distribucija za obi1jeje X moe odrediti samo priblino i utoliko toenije toje n veée. Za rjeavanje problema koriste se odredene funkcije slueajnog uzorka (X1, K2,.. , Xn)koje se zovu statistike.
Svaka slueajna varijabla koja je definirana kao funkcija slueajnog uzorka y (Xi, X2,. . . , X,,j,koja ne ovisi eksplicitno o nepoznatim parametrima, naziva se statistika.
Primjer 8. U Prinijeru 4 distribucija obiIjeja X potpuno je odredena parametrom p. jOvdje uzorak (X1, X2, . . . , X,,) moemo pisati pomoéu indikatora kao (11,12,.. . , 1,1j, gdje je Ijindikator dogadaja da u j-om izvlaeenju kuglica bude bijele boje. Tada je slueajna varijabla r
sn=I1+12+...+In
jedna statistika, koja predstavlja broj izvueenih bijelih kuglica. U
nI
7. Osnove teorije uzoraka
Poznato nam je da se sluoajna varijabla S, ravna pa binomnoj distribuciji B (np) I da je
E(S)=np, D(S.1j=np(1—p).
Promatrajmo statistiku
72 72-
Imamo:
E(5?n)rJE(sn)=p, D(t)=4D(S)=’,
Kako je E (ta) = p to prema zakonu velikih brojeva vrijedi:
kadn,
a to znaëi da je sluëajna varijabla XTL sw b1ia nepoznatorn parametru p kada obim uzorka nraste.
}Coristeôi centralni graniëni teorem a ovoj aproksimaciji moemo reéi i vie i moemo jeocijeniti. Slueajna varijabla 8,-, ima prib1ino normalnu distribuciju N (tip, tip (1 — p)) a slueajnavarijabla X,, ima priblifto normalnu distribuciju N (p, PQ. Zapazirno da je
zao<p<L
Tako, na primjer, slueajna varijabla X1o0 ima priblino distribuciju N (p j)) i disperzijukoja nije veéa ad
. Funkcija gustoée vjerojatnosti ilustrirana je na slici 7.6.. Vidjino da suvjerojatnosti veéeg odstupanja two ad nepozuatog parametra p vrlo made. Na primjer,
p (x —p <o.i) = p —p <o.i) = PGSIDO — lOOpI <10)
= ( S1—iOQp 10 S—l00p 1
\ 100p(l—p) ‘°Op(’—p)) k\ lOOp(i—p) p(i—.p)
(izi < � PQZj <2) = 2(2) = 2•0.47725 = 0.9555,
gdje slueajna varijabla Z ima distribuciju N (0, 1).Dakie, vjerojatnost dogadaja da sluëajna varijabla X100 uzme vrijednost koja ée odstupiti ad
p manje ad 0.1 veôa je ad 0.95. Tako, aka, na primjer, putem uzorka dobIjemo da je io = 0.8,to onda znaëi da smo skara sigurni da se nepaznati parametar p nalazi u intervalu [0.7,0.9]. •Zadnji prhnjer pakazuje znaëaj paznavanja distribucije vjerajatnasti odredene statistike.Navedimo neke znaëajnije statistike dobivene pamoéu uzorka (X1, XE2,. .. , X,) obilje2ja X.
158 7.4. Neke znaEajrie statistike
0 -i--i---P P 10
Slika 7.6.
4-sSredina uzorka:
Xfl=!Zxk
Disperzija uzorka:
= (X -X)2
Pokaimo da vrijedi:
(7.5)
Zaista,
= (x—2xkfl+Z) U
= - 2Xfl!YZXk + !nX2 = -
Izraz (7.5) o1akava izraëunavanje disperzije uzorka.
Popravijena disperzija uzorka:
=hjZ(xkTn)2k=1 P
U1Raspon uzorka:
R=maxXk—minX. p1<k<n 1�j�n
U[•1
7. Osnove teorije uzoraka 159
Koeficijent korelacije na osnovi uzorka
Ako je obi1jeje dvodimenzionalna slueajna varijabla (X, Y) (kod svakog elementa populacijezanimarno Se za dvije numeriëke karakteristike) tada je uzorak oblika
(X1,Y1), (X2,Y2) (X,Y).Jedna znaëajna statistika je koeficijent korelacije na osnovi uzorka:
*ZXkYk -XY,R(X,Y)= k=i
gdje su
Statistike su, kako se vidi, slueajrie varijable. Medutim, ako pristupimo registriranju vrijednosti obi1jeja X kod jednog odredenog uzorka, obima n dobivamo niz od n odredenib brojeva(x1, x2, . . . , x,) i statistike postaju odredeni brojevi, na primjer,
, 4, , r, r(X,Y)
koje oznaëavarno odgovarajueim malint slovima. To su vrijednosti koje su ‘uzele” odgovarajuôeslueajne varijable
X—2 —‘2 /
n, ,j, n, I
Moemo zapaziti da ée brojevi , 3, , r (X Y) suiti kao ocjene za E (X), D (X),p (X, Y), tj. kao ocjene othedenih parametara koji daju informaciju o distribuciji obiljeja X,odnosno (X, Y). Broj r kao vrijednost kojuje uzela statistika R daje iformaciju o duini intervalau kojem uzima vrijednost obiIjeje X u cijeloj populaciji.
7.5. Neke znaëajne distribucije
7.5.1. Pearsonova x2—distribuciiaSjetimo se da smo kod upoznavanja garna distribucije C (a, j3) definirali x2—distribucitu kaospecijalan sluëaj gama distribucije i to kao C (9, )
Definicija. Distribucija definirana funkcijom gustoée vjerojatnosti0, x<0,
f(x) = { 2F()x 82, nO,naziva se x2—distribucija (hikvadrat distribucija) s n stupnjeva slobodei oznaëava se s x2 (n), gdje je n e N parametar distribucije.
Craf funkeije gustoée, zarazlieite stupnjeve slobode, prikazan je na slici 7.7.. Lako se pokazujeda funkcija gustoée f postie maksimum za z = n — 2 (n � 3).
7.5. Neke znaajne distribucUe
Ovdje je F poznata gama funkcija. Podsjetixno:
F (p) =
F(p+1) = pF(p),p>O; P(p+1)p,peN;
n=1 r13
0.5U
n=2n=3
n=6 n=10 n[10 4 8 12 16 X
Slika 7.7.
Primjetimo daje za m = 2 hikvadrat distribucija ustvari eksponencijalna distribucija ExHikvadrat distribncija ima izuzetno veliku vanost u statistici, a od posebne je vanosti
slijedeéa tvrdnja.
bTeorem 1. Neka su slueajne varijable Z1, Z2,. , Z,. nezavisne i svaka se distribuirap0 standardnoj normalnoj distribuciji K (0, 1) 1 neka je
x=z?+Z+..+z, nEN.Slueajna varijabla x. ima hikvadrat distribuciju x2 (n) I pie se “-‘ x2 (ii).
LIDokaz. Kako je karakterjstjana funkcija gama distribucije (dano ranije)
/3a
to je karakteristiena funkcija hikvadrat distribucije (za = 9, fi = LI1
,, (7.6) P(1_22t)2
UnU.
7. Osnove teorije uzoraka 161
S druge strane, kako je karakteristiena funkcija svake sluëajne varijable 4 (k = 1,2,--- ,n)
kz2 (t) E = . e2dz
= I e2’dx =1
J1—21t0
to je karakteristiana finkcija zbroja nezavisnih slueajnih varijabli x = 4 + 4 +- + 4/ 1 NTh 1
kx2 (t) =— 2it)
a to je upravo (7.6). Ovim je teorem I dokazan. I
Broj stupnjeva slobode oznaëava broj linearno nezavisnih sluaajnih varijabli ineduZ1, Z2,.-- , ZT u izrazu za. Kako su sw one nezavisne broj stupnjeva slobode je n. Medutim,ako izmedu slueajnih varijabli Z1, Z2,--- , Z, postoji jedna linearna veza, na primjer, Z1 + Z2 +
+ Z,-, = 0, onda vrijedi
tj. broj stupnjeva slobode umanjen je za 1, a pripadna distribucija je x2 (n — 1).Zapazimo slijedeée svojstvo x2 distribucije koje éemo koristiti kasnije. Ako su sluöajae van
jable x i x nezavisne, tada vrijedi
2 2_ 2Xn + Xm — Xn+,
nVrijedi i poopéenje ovog svojstva: Zbroj nezavisnih slueajnih varijabli s x2 (ni) distribucijom,1, 2,..- , It, ima x2 (n1 + n2 + + n,) distribuciju. Ovo svojstvo slijedi izravno iz oblika
karakteristiane funkcije.
Veô smo napornenuli da x2—distribuciia ima veliku vanost u statistici. Vjerojatnosti vezaneza 2 distribuciju dane su u odgovarajuáim tablicama. Na osnovi najëeée pnimjene te tablicesu tako sastavijene da za dani broj stupnjeva slobode n (najaeee rt = 1, 2,--- , 30) i za dani broja, 0 <a < 1 (najeeêe a = 0.01, 0.05,--- , 0.80), u tablicama ëitamo broj x,a takav da je
P (x � Xz,a) =
Na slid 7.8. prikazan je broj X&a i broj a koji kao vjerojatnost predstavlja povrthnu izmedux-osi I krivulje funkcije gustoée za x �
Primjer 9.
a) Za ii = 10, a = 0.02 X?o,o.02 = 21.161,b) Za m = 11, a = 0.05 : x?ioo5 = 19.675,c) Za n = 16, a = 0.20 X6,o.2o 20.465.
7.5. Neke znabjne distribucije
0
Slika 7.8.
Obiono se u tablicama ne daje broj stupnjeva s]nbode n preko 30.
Kako je slueajna varijabla x predstavljena kao zbroj nezavisnih slueajnib varijabli 4, k =
n, koje se ravnaju p0 normalnoj distribuciji N (0,1) i kako je
E (z) = 1, (4) = E (z) — (E (4))2 = 2, k = 1,2,•• (77)
to, prema centralnom graniënom teoremu, sluaajna varijabla x inn prib1irno normalnu distribuciju K (n, 2n) i kada n — co vrijedi:
xJ/@,2n) i
Stoga, za slueajnu varijablu x za n> 30 koristi se prib1ina normalna distribucija I’.! (n, 2n),to je za primjenu zadovoljavajuée toëno. [1
UDokaz rezultata (7.7) Kako je *feZtdx = 1, vrijedi: [I
1 2 fu=x, du=dx N 1= fx erdx =
dv = xeTdx, v = —e4 ) = ezdx = 1,
1 1 4x2 /ux3, du=3x2dxN 3 1 2—= —jx e 2 dx =
t\ dv = xec dx, v = —e4 ,) = e 2 dx = UZa primjenu hikvadrat distribucije od znaaja je i slijedeea tvrdnja.
[làTeorem 2. Neka su X1, X2,.. , X nezavisne sluëajne varij able s istomdistribucijom N (p, a2) I neka je X, = . Tada vrijedi: U’a)
iib) ____ Lii
Hi
Li
7. Osnove teorije uzoraka 163
Dokaz. a) Kako je
Zk=N(O,1), k=1,2,”,n
I Z1, Z2,• ,Z,, su neza-visne sluëajne varijable, to je tvrdnja a) izravna posijedica Teorema Lb) Prerna centralnom graniënom teoremu vrijedi prib1ino
/c = 1,2, In.0
Nadaije, dovoljno je zapaziti da izmedu slueajnih varijabli zç, , Z7 postoji linearna veza:
4XkXn =(txk_txn) =±Xn
Ovu distribuciju 1900. godine uveo je engleski matematiear (I statistiear) 1. Karl Pearson(1857-1936), pa se i distribucija ëesto zove Pearsonova x2—distribuciia.
7.5.2. Studentova t—distribucija
Neka su slueajne varijable Z r..’ fl (0, 1) i x x2 (n) nezavisne i neka jet—n’p7.
Distribucija slueajne varijable t naziva se Studentova distribucija iii t—distribucijas n stupanjeva slobode, oznaëava se s t (ii) i pie se t, t (n), gdje je n e N parametardistribucije. Slueajna varijabla t,2 je kontinuiranog tipa s funkcijom gustoóe
2
-
f(x)=v(fl (i÷) , —oo<x<oo.
Graf funkcije gustoée prikazan je na slid 7.9. za razlieite stupnjeve slobode u usporedbi sfurikcijom gustoée distribucije N (0,1).
Za n = 1 Studentova distribucija postaje Cauchyjeva distribucija koja je poznata po tometo nema konaëno oáekivanje, pa ni momente vieg reda.
Vjerojatnosti vezana za t—distribuciju dane su u pripadnoj tablici. Za odreden broj stupnjevaslobode n I odreden broj a, 0 <a < 1, u tablici aita se pozitivan broj takav da je
P (tI > t) = a
Na slici 7.10. vjerojatnost je prikazana kao zbroj osjeneenih povrina koje odgovaraju vjerojatnosti dogadaja
tltn � tna} = {t tna} U {tn tma}, tj.
FGtI � tn,) = F(t —trip) + PQ � trip) = + = a.
7.5. Neke znaèajne distribucije
‘f(x)n = 15
\ n=2
—
1
Slika 7.9. pLi
Primer 10. flLI
a) Za n = 6, a = 0.02 t6o.02 = 3.143,b) Za n=9,a=0.05: tg,305=2.262, Pc) Za n = 12, a = 0.05 = 2.179. ii
1!Prema tome, vjerojatnost da apsulutna vrijednost slueajne varijable t6 ne bude manja od U
broja 3.143 jerkaka je 0.02.
LaAf()
U
[3El
USlika 7.10.
7. Osnove teorije uzoraka 165
Za distribuciju t (i-i) oeekivanje, disperzija, koeficijent asimetrije i spljotenosti su:
E (ta) = 0,D(tfl)=?7---, n>2,
= 0,E <0.
Krivulja Studentove distribucije sliena je krivulji normalne distribucije N (0, a2) Iz Sk = 0slijedi da je distribucija sirnetriãna u odnosu na oaekivanje, a iz S cc 0 slijedi da je Studentovadistribucija uvijek neto sp1jotenija od distribucije N (0, 1). Nadaije, iz D (tn) r > 1 vidise da distribucija t (n) tei normalnoj distribuciji K(0, 1) kad n —. cc (slika 9). Za n > 120aproksimacija ma sasvim zadovoljavajuOu toënost. Medutim, veé za n> 30 koristi se distribucijaK (0, 1) i funkcija Laplacea.
Ovu distribuciju je deflnirao i prouëavao William Gosset (Jrska) i objavio 1908. godine podpseudonimom Student. Odatle i potjeëe naziv Studentova distribucija.
7.5.3. Fisherova F—distribucija
Neka su sluãajne varijable x?,, x2 (in) i x ‘- x2 (n) nezavisne.Fisherova distribucija iii F—distribucija je distribucija slueajne varijable
2/m,n— x/n
s m stupnjeva slobode u brojniku I ii stupnjeva slobode u nazivniku, ovisio dva parametra m, n e N, oznaëava se s F (m, n) i pie se Fm,,. F (in, ii).Funkcija gustoOe vjerojatnosti je
( 0, x�0,= 1 (r’(1+xf, >0.
Funkcija gustoée postie maksimum za x = a oblik krivulje gustoóe prikazan je naslid 7.11..
Za F-distribuciju oäekivanje i disperzija Sn:
E(Fm,n) zan>2,DF • —
2n2(m-J-n—23 >4t mn) — m(n—2)2(n---4) za
Distribucija F (in, ii) zavisi o dva parametra pa je njeno tabeliranje s]xenije. U pripadnimtablicama za c = 0.05 i = 0.01 daju se vrijednosti Fm,n,a takvi daje (vidi sliku 7.11.)
P (Fm,,. � Fm,n,a) = cr
7.6. Distribucije nekih statstika
lkf()
0
Slika 7.11. nL
Primjer 11.
a) Za m=5,n=10,=0.O1 F5,1o,OM1=5.64,b) Za m=12,n=7,a=0.05: F127,005=3.57,
Ako je jedan od. brojeva stupnjeva s]obode i-n i ii veliki, tada se distribucija F (rn,n) moeaproksimirati hikvadrat distribucijom. Ustvari, vrijedi slijedeéa tvrdnja.
nFunkcija distribucije za F (m, n) distribuciju, kada i-i —* oo, konvergira funkciji iidistribucije slueajne varijable gdje je x ‘S-’ x2 (in).
R. A. Fisher, poznati statistiãar, 1924. je dao jedan oblik ove distribucije, a oblik distribucijekoji ovdje dajemo dao je 0. W. Snedecor 1940. godine. [17.6. Distribucije uekih statistika
U matematiekoj statistici razlikujemo mali i veliki uzorak, prema tome da ii je obim uzorkamali iii veliki. Kod velikog uzorka obieno koristimo asimptotski toëne distribucije statistika kojepromatramo. Ne moe se povuéi stroga granica izmedu malog i velikog uzorka (da ii je ona zabroj uzorka , recimo, n = 30,50 ill 100). PrimjenjujuOi asimptotski toene distribucije ëinimoveée iii manje pogreke, veé prema tome da ii je broj uzorka manji iii veéi.
Od asimptotskih distribucija koje primjenjujemo kod velikog uzorka obieno je u pitanjunormalna distribucija zbog vaeéeg centralnog graniënog teorema.
r7.6.1. Srcdina uzorka UNeka obiIjeje X ima oeekivanje I disperziju: B (X) = I D (X) = c2. Ako je obim uzoraka n(X1, X2,..• , X,1j veliki (recimo n > 30), onda, prema centralnom graniënom teoremu, sredina [Iuzoraka
— _xI+x2+...+xnxv.— pn UpUn
7. Osnove teorije uzoraka 167
ima priblino normalnu distribuciju. Kako je
E = E (txk) = (Xk) = =
D(XO=D(iZXk) =tD=2%
slijedi da je to normalna distribucija K (p ) (to smo i ranije pokazali).Primjetimo da smo u gornjem izraëunu E () i D () koristili ëinjenicu da je
(X1, X2, , X,) jednostavan uzorak, tj da su K1, X2,... , X,- nezavisne sluaajne varij able i dasvaka ima istu distribuciju kao I obi1jeje X.
Medutim, kod malog uzorka slutimo se toenim distribucijama statistika koje promatramo. Uslueaju malog uzorka redovito éemo pretpostaviti da obi1jeje X koje promatramo ima normalnudistribuciju K (,t, cr2). Ova pretpostavka oeevidno je jedno ograniëenje, all obzirom na ono tosmo rekli o znaëenju centralnog graniënog teorema i normalne distribucije, takvo ograniöenjeima vie teorijski karakter.
Koristit éemo se slijedeéim svojst-vom normalne distribucije, to smo ga I ranije istakli.Ako su X I Y nezavisne slueajne varijable s distribucijama N (IL1, ?) i N (p o) respek
tivno, tada sluOajna varijabla aX + bY, a, b e K, ima distribuciju K (ati + bp2, a2c + b2o),tj.
aX + bY K (api+ bp2, a2u? + b2u)
Vrijedi i slijedeée poopéenje. Ako su X1, X2,... X,- nezavisme slueajne varijable s distribucijama K (pl ?) K (P2, c) , . . - ,N (p,, u) respektivno, tada sluëajna varijabla
Prema tome, ako obi1jeje X ima distribuciju K (p a2), tada sredina uzorka X, ima distribuciju K (it), tj.
X’--’K(p,u2) XnrsKQt,.).
7.6.2. Disperzija uzorka
Promatrajmo disperziju uzorka iz normalne populacije, tj. populacije ãije je obiljeje XK (p, 2)
Mnoenjem ave relacije s dobivamo slueajnu varijablu
t(xm;)z (=i;),
168 7.6. Distribucije nekib statistika
koja ima x2 (it — 1) distribuciju, tj. hikvadrat distribuciju s n — 1 stupanj sobode (Teorem 2b)).
Dakie, ako obiIjeje X ima normalriu distribuciju K (p, a2), tada je statistika =
tj.
x N (p a2) (it —1).
7.6.3. Kvocijent sredine I disperzije uzorka
Slijedeaa tvrdnja je vrlo znaëajna u matematiekoj statistici.
Ako obiIjeje X irna normalnu distnbuciju K (p, a2), tada su statistike X Inezavisne slueajne varij able.
Standardizirani obljk za sredinu uzorka X N ¶) je
N(O,1).a/v
Prema tome, sineajue varijable! = Xi su nezavisne i na osnovi definicije Studentove distribucije vrijedi:
Xn1L —
tj. LI}Sn U
n
XFPn_1t(n_1),
odnosno statistika ima Studentovu t (it — 1) distribuciju.
7.6.4. Kvocljent disperzija dvaju uzoraka HNeka su (X1, X2, Xm)i(Yi, , Y,j dva nezavisna jednostavna uzorka obi1jeja XK (p, a2). Sredine i disperzije oba uzorka Sn;
XmniZXk, YnZYk,mki
Z(Xkm)2, c=JZ(Yk_Yfl)2.m
ii
7. Osnove teorije uzoraka
to:
Buduéi da
t_T7nN(o/1 1\rn n
r.M(O,1).
rnS+
—2mS*m 2
0-2— Xm—i
2
su nezavisne i na osnovi svojstva x2—distribuciie vrijedi:
—2mS*m — 2
2 ± Xm+n—2
XmYn—2 —2vi Sm±n S
Takoder, prema (7.8), slijedi:
--
m + n — 2) rJ t (m + n — 2).rn-En
mS/( 1)n
—2—
n—i rn S*rrirn-i n
= Frn_i,n_i tj.
F(rn—1,n—1).
169
XrnYn
Ova slueajna varijabla nezavisna je od sluëajne varijable
Nadaije, sluëajne varijable
(7.8)
Sada vrijedi:
trn+n_2
0
Z=
(XrnYn)/u 9+X+fl_2/(m+n—2) i (m+n)/(m-l-n—2)
X,y — mn(rn+n—2), tj.
mS+nSm+n
76, Distribucije nekiFi statisti ka
7.6.5. Koeficijent korelacije uzorka
Sada éemo dati distribuciju statistike koja se odnosi na koeficijent korelacije uzoraka R (X, Y).Neka imamo dvodimenzionalno obi1jeje (X, Y) koje se ravna p0 normalnoj distribuciji
N (Mi, P2 ci?, o, p). Zapazimo odredeni jednostavan uzorak obima
(Xi,Y1), (X2,Y2), ,
pMoc se pokazati da, ako je p = 0, onda vrijedi
R(X,Y)—/n—2—t_2, tj.,/1_R2(X,Y)
./iR(XY)
cmDakie, u pitanju je Studentova distribucija s ii — 2 stupnja slobode. Sjetimo se da uvjet
p = 0 kod dvodimenzionathe normalne distribucije za (X, Y) znaëi da su obiljeija (tj. slueajnevarijable) X i Y nezavisna.
Zadatak . Neka je obi1jeje koje promatramo indikator ‘A dogadaja A i neka je P (A) = p.Uoeimo dva nezavisna jednostavana uzorka:
(11,12,” ,Jm), ‘) Eli odgovarajuee sredine uzorakap
Xm=_ZIk, tniE1k.mkl Ttkl
Naôi prib1inu distribuciju za statistiku U
kada su obimi uzoraka m i ii veliki.
iiUpUPU
ii
iiU
n
8. Proejene parametara
Osnovni problem matematieke statistike je da se na osnovu uzorka (Xi, X2, ,X) zakljueikakva je distribucija vjerojatnosti obi1jeja X za cijelu populaciju. Cesto na osnovu razmatranja i poznatih iskustava o primjeni odredenih distribucija, na primjer, onih koja se odnosena primjene Poissonove I normalne distribucije, koje smo ranije napomenuli, znamo da obi1jejeX ima odredeni tip distribucije all ne znamo parametre te distribucije. Na primjer, ako is 11
pitanju P (‘X) ill N (ii, a2) distribucija obi1jeja X, onda poznavanje parametra A, odnosno t ic2, potpuno odreduje distribuciju obiIjej a.
Stoga I jeste jedan od osnovnih problema matematieke statistike odredivanje numeriokilikarakteristika populacije na osnovu uzorka, odnosno procjene nepoznatih parametara distribucijena osnovu uzorka.
Primjer 1. Neka populaciju eini odredeni skup uredaja istog tipa koji funkcioniraju odnultog trenutka, a obi1jeje Xje trenutak otkaza nekog uredaja. Ako nemamo nikakvih informacija ill pretpostavki o funkcioniranju uredaja najprirodnije je pretpostaviti da obi1jeje X imauniformnu distribuciju na intervalu [0, b], b> 0, gdje je b nepoznati parametar.
Razilkujemo dvije vrste procjena parauxetara: takozvana toekasta procjena parametara, prikojoj se odreduje broj kao aproksimacija nepoznatog parametra, I takozvana intervalna procjena parametara, pri kojoj nepozuati parametar moe poprimiti bib koju vrijednost dobivenogintervala uz odreden stupanj pouzdanosti.
8.1. Toëkasta procjena paranetara
Nepoznati parametar distribucije obi1jeja X oznaëimo s 8. Na osnovu uzorka (X1, X2, , X,)biramo jednu statistiku
,X),
koja se zove procjenitelj mj estimator nepoznatog parametra 8, kojom procjenjujemo parametar 0 u slijedeêem smislu. Registriramo odredene numeriëke vrijednosti odredenog uzorka(x1, x2,.. , x,), to je niz od n brojeva koje je u eksperimentu uzela n-dimenzionalna slueajnavarijabla (X1, X2,.. , X1j. Tako statistika O, kao funkcija od (X1, X2, , X,) uzima jednuodredenu numerieku vrijednost z91 = p (x1,x2,... ,x). Tim brojem 6, procjenjujemo nepoznati parametar 0. Jasno je da ta ocjena ima odredenu pogreku. Radi Se o tome da ako bismocijelu operaciju uzimanja uzoraka ponovili, ne bismo uopôe dobili iste brojeve kao prvi put veéneke drugs (4,a4,... ,x), a to znaëi I drugu ocjenu = p(xI,4.. ,%) nepoznatog parametra 0. Kako su vrijednosti koje dobivamo u uzorku nepredvidive u obienom deterministiekom
111
172 8.1. Toëkasta procjena parametara
smislu, to je nepredvidiva i vrijednost za ocjenu parametra 9. Dakie, O, kao procjenitelj je sluëajna varijabla. Medutim, kada je jednom realiziran uzorak, dobiven je odreden broj 6, kao ocjenaparametra U u koji moemo imati manje iii vie povjerenja. Ilustrirajmo to primjerom.
Primjer 2. Obi1jeje X ima normalrxu distribuciju s poznatorn disperzijom 2 =•
Matematièko oâekivanje p nije poznato i e1imo ga procijeniti na osnovi uzorka. Uzmimo uzorak obima4 i neka Lu registrir ane vrijednosti:
= 3.0, x2=2.7, x3=4.1, x4=3.4.
Parametar p procijenit éemo sredinom uzorka X4, tj. brojem 1]:
— Xl+X2+X3+X4C
=3.3.4 r.Uznilmo sada drugi uzorak iz iste populacije, obima 16 i neka su registrirane vrijednosti: U
= 3.3, x2=2.5, x3=4.0, x4=3.7, x5=2.8, x=3.7, x7=3.3, x8 =4.0, pxg = 3.5, x = 2.4, = 3.4, Zfl = 3.9, Z13 = 2.9, Z14 3.6, x15 = 4.0, x16 3.4, U
tako daje
16 = = 3.4.
Za koju od dobivenih sredina x4 iii x15 vjerujemo da je boija ocjena parametra p.? Na osnovizakona velikih brojeva moemo smatrati da je 16 boija ocjena od x4. BoUa je u slijedeéem
XIZ ima distribuciju N (p.,), tako da je PU
X4K(fl,1) i xi€Q). p- — - U
Za slueajne varijable X4 — p. 1 — p. koje predstavljaju odstupanja X4, odnosno X16, oiloëekivanja p vrijedi (slika 1) p
/ 1 UX4_pr..N(0,1) i Xis_pn-tK(0_)
Nathmo vjerojatnost dogadaja da X4, odnosno X15, otupa od :za vie od odredenog broja US > 0. Imarno (viii sliku 8.1.): n
Pflw_P6)=F(x1 >t)=1_2(2. UDaMe, vjerojatnost u drugom s1uaju je nianja. Na primjer, za S = 0.2 imamo r
P(4—p>O.2) = 1—2(0.2)=0.841,P — > 0.2) = 1 — 24 (0.4) = 0.684.
PU
8. Procjene parametara 173
‘f(x)
x16 —
0
SilIca 8.1.
Prema tome, imamo vie povjerenja u 16 = 3.4 nego u = 3.3 kao ocjene za nepoznatooeekivanje p. Ovdje Se procjene daju u vjerojatnosti. Tako vjerojatnosti 0.684 1 0.841 u ovornprimjeru odnose se na slueajne dogadaje, tj. na situaciju prije uzimanja uzoraka Buduéi dasmo uzeli odgovarajuee uzorke i dobili brojeve 3.3 i 3.4 vie se ne moe govoritio vjerojatnostinjegovog odstupanja od p jer 3.3 1 3.4 su brojevi a ne siuOajne varijabie X4 I X16. Moda jestvarno 3.4 dalje od p nego 3.3. Favoriziranje broja 3.4 je na osnovi utvrdene vjerojatnosti prijerealizacije uzorka.
Procjena nepoznatog parametra 0 pomoôu procjenitelja O, brojemzove se toekasta procjena. Ako procjenitelj O, ispunjava uvjet
—onda se kae da je 9,. centrirani lb nepristrani procjenitelj. Velieina
zove Se pristranost proejeniteija.
Oäevidno je da je centriranost vrlo poe1jno svojstvo procjenitelja.
Primjer 3. Sredina uzorka X, je centrirana ocjena oeekivanja p obi1jeja X.
Primjer 4. Disperzija uzorka nije centrirana ocjena disperzije a2 obi1jeja X.Zaista,
(Xk - = E -
X] = ZE (x) - E (x).Daije je
E(X)=E[!ZXk]=4E Ex+2zxxk1 k=1
174 8.1. Toëkasta procjena parametara
Kako u izrazu zxx ima (it) sumanda, a X, X su nezavisne varijable za i j, pa je2
E (XX) = E (Xi) E (Xi) i kako, prema zakonu velikih brojeva, >X konvergira ka E (X2),
E() = E (x2) - 1E (x2) () [E (X)j2
= fhE(xi_Th[E(X)J2=fhc2.
Sada vidimo i kako treba popraviti ocjenu za disperziju da bi se postigla centriranost. Takoimamo takozvanu popravijenu disperziju uzorka:
= (X -
Kakoje flfl —2
E=fiEr)=fi.fhu2=c2.
Dakie, S je centrirana ocjena za a2. Primjetimo da, ako je it veliko, tada je -y 1, tako 11da kod velikog uzorka nema znaeja da Ii uzimamo iii kao ocjenu za disperziju. U
Pnmjer 4 sugenra kako da se od]ncimo koji je od dva centnrana procjenitelja 0,-. i °n parametra 8 boji iii efikasniji.
pZa nepristrani procjenitelj On, funkeija U
R(8=Er_Er))=Dr) rnaziva se funkcija rizika (risk function), a moie se slivatiti kao oeekivana iii srednja iikvadratna pogreka pri aproksimaciji nepoznatog parametra 8 vrijednoéu i9,procjenitelja On. fl
IiZapazimo da se opéenito moe napisati rU
pa se funkcija rizika moe napisati kaoU
R(O) =Dcfl) +d2(O).n
Primjer 5. Procjenitelj X, je nepristran procjenitelj parametra /s. Medutim, procjenitelj LictX (0 < a < 1) nije nepristran jer je .E (axn) = a’t, pa je njegova pristranost ci (j)
U
P
8. Procjene parametara 175
lako je nepristranost poe1jno svojstvo procjenitelja, moe se dogoditi da pristrani procjeniteljima manju vrijednost funkcije rizika nego nepristrani procjenitelj.
Neka su 0m centrirani procjenitelji parametra 9.Procjenitelj m efikasniji od procjenitelja @ ako je
D(rn) <ijr’n).
Primjetimo da razlika u efikasnosti dvaju procjenitelja ne mora biti nuno vezana za razlieiteobime uzoraka: veéi oMm uzoraka - veéa efikasnost.
Primjer 6. Medijan uzorka (Xi, X2,-•. X) je statistika X1 definirana na slijedeOi naëin:Neka su (Xi, X,... X) s1uajne varijable Xk, k = n poredane u varijacijski niz kaoXç<X<...<X,tadaje
X, ako je it neparan,
akojenparan.
Moese dokazati daje ii, centrirana ocjena matematiekog oeekivanja ti da je njena disperzijaD (x) = . I{ako je D () =
, slijedi da je sredina uzorka X efikasnija ocjena
matematiekog oeekivanja ji od medijana uzorka X.
8.1.1. Metoda maksimalne vjerojatnosti
U Matematiakoj statistici postoje razradene metode za dokazivannje egzistencije i odredivanjenajefikasnijeg procjenitelja parametara U, tj. procjenitelja U, za koji disperzija D (en) nijeveôa od disperzije bib kojeg drugog proejeniteija parametra U na osnovi uzoraka istog obima n.Procjenitelji se definiraju pomoéu takozvanih dovoljnih statistika, ëime se ovdje neéemo baviti.
Do statistika koje nam sIue za ocjenu nepoznatih parametara do sada smo dolazili irstuitivno.Sada éemo dati dvije opée metode za na1aenje procjenitelja nepoznatih parametara: metodumaksimalne vjerojatnosti i metodu monienata.
Metoda maksimalne vjerojatnosti (engleski: Maximum Likelihood Method) iii kraée MLmetoda je najopOija metoda za dobivanje toekastih ocjena parametara. Procjenitelji dobiveniovom metodom ne moraju biti centrirani (nepristrani), au se obieno mogu popraviti. Kadaje obim uzoraka velik toakaste procjene metodom maksimalne vjerojatnosti su najefikasnije.Medutim, primjena ove metode ëesto je vezana uz sIoena izraëunavanja. Za 1ake razumijevanjeave metode razmotrimo slijedeéi primjer.
Primjer 7. Da bi se ocijenio broj N nba u jezeru postupa se tako to se ulovi it nba,obi1jee se i vrate u jezero. Poslije nekog vremena, dovoljnog da se obi1jeene ribe izmijeaju sostalim ribama, ulovi se m nba. Broj obi1jeenih nba medu tih m nba je sluëajna vanijabla X
176 8.1. Toëkasta procjena pararnetara
s distribucijom vjerojatnosti:
(nN(N-n\r)rn—rPp,(Xzr) N ‘
r—O,1,,- ,rn, 2
k\rn)
to se na osnovi kombinatorike I jednakovjerojatnih ishoda moe provjeriti. Kada izvrimoopisani pokus, sluaajna varijabla X uzme neku odredenu vrijednost l0 (u uobiëajenim oznakamaro je ostvarena vrijednost x1 uzorka X1 obima n = 1). Za nepoznati parametar N kojim jeodredena distribucija vjerojatnosti obi1jeja X uziina se ona vrijednost N za koju je vjerojatnostPpy (X = r3) maksimalna. Sniisao ovog pravila je u tome to smatramo da se ostvari ono to imanajveáu vjerojatnost.
Za koje N = N funkeija PN (X = ro) postie maksimum mote se odrediti iz uvjeta da za toN bude
Ppi(Xrzro)<Pn(Xrro) i Pp÷1(X=ro)< P&(X=ro),odnosno
(N_n_iN (N—nN (N—n+i’\ (N—nrn—i’0 ) \rn—ro) . rn—i’0 ) \rn—r0
rn) rn) m) rnOdavde se dobiva da je N cijeli broj najb1ii broju iii, prib1ino =
, to se moglo i Poëekivati. I Li
Neka je distribucija obi1jeja X (p (xi; 0), i = 1,2,•• iii y (x; 0), — oo <x < oo) odredenapararnetrom 0 ëija je vrijednost nepoznata. Stavimo, kratkoêe radi,
f x = f p (z; 6), ako je X diskretnog tipa, 8 fl(x; 9), ako je X kontinuiranog tipa, / [gdje U moe biti i vektorski parametar, tj. 0 = (6, 92,--- , 0) , to znaëi da distribucija obiIjejaX zavisi o I parametara 61, 9,-- ,61. p
Neka je (X1,X2,... ,X) jednostavan uzorak obi1jeja X i neka je (zi,x2,•-• ,x) jedan U’ostvaren uzorak. Definira se funkcija vjerodostojnosti kao:
L(6;x1,z2,.. ,z) =f(x10)f(x20)”’f(0). [IAko bi, na primjer, 0 mogao biti samo jedan od brojeva iz dvoëlanog skupa {0, 92} onda jenormalno da se odlueimo za onu vrijednost, recimo 6, za koju funkcija vjerodostojnosti imaveéu vrijednost. Ova odluka temeiji se na uvjerenju da se registrira onaj uzorak (xi, x2,.•• , x,)koji ima najv&u vjerojatnost. Obzirom da se radi a nezavisnim slueajnim varijablama u jednostavnom uzorku (X1, X2, -- , Xj, to f (xi; 9) f (x2 6)... f (x, 6) predstavlja tu vjerojatnost.
U opêern slueaju, procjenitelj parametra 6 dobiven je metodom maksimalne vjerojatnostiako za 6 = ô funkcija vjerodostojnosti L (6; x1, x2,-.. , x,) postie maksimum.
Za praktiean rad ëesto je jednostavnije traiti ocjenu ‘0 kao vrijednost za koju
lnL(6;x1,x2,... ,x)
U[}i
ii
8. Procjene parametara 177
postie malcsimum. Pretpostavljajuei diferencijabilnost te funkcije po 0 problem se svodi narjeavanje jednadbe
0 0 = 79. Neka je to rjeenjei9=g(xi,x2,--- ,x),
pa je procjenitelj za nepoznati parametar U
0= g(X1,X21.••
U sluaaju daje 0 = (0, 02,-- , 0) , ocjene th, i = 1,2,--- 1, odreduju se iz sustavajednadbi:
8lnL äInL 81nL0 (82)80
=802 80
—. S.
Tako rjeavanjem sustava jednadthi (8.2) p0 01, 02, , 0, dobivamo ocjene za te parametre:
(8.3)
Ako u (8.3) (xi, £2,-- , x,) zamijenimo slueajnim vektorom (X1, X2,-•• , X,) dobivamo statistike
za koje se kae da su ML—procjenitelji nepoznatih parametara 01,02, , Ut.
Prirnjer 8. Metodom maksimalne vjerojatnosti odrediti procjenitelj za nepoznati parametar6 u primjeru 1.
Ad. Kako je ovdje
L—
i 0, u ostalim slueajevima,to za funkeiju vjerodostojnosti imamo
L(b;x1,x2,... ,x) = f(xib)f(x2b)-..(xn6)
— f (1)’ b>xkzasvakik=l,2,- ,n—
‘1% 0, u ostalim sluëajevima.
Fromatrana kao funkoija od 6 ona je najveéa za 6 najmanje, pa je oejena nepoznatog parametra6 na osnovi ostvarenog uzorka (x1, x2,-.- , x,)
6= maacxk.1<k<m
Dakie, statistika kojom ocjenjujemo parametar 6 na osnovi slueajnog uzorka (X1, X2, - , X,1jje
Y = max Xki<k<n
Odredimo funkciju gustoóe vjerojatnosti za slueajnu varijablu?.
178 8.1. To&asta procjena parametara
Prvo odredimo funkciju distribucije za sluëajnu varijablu Y pomoéu funkcije distribucijeF (x) za X:
Fp(x) = P(Y<x)=P(i(Xk<
= flP(Xk<x)=(F(x)).
Sada je funkcija gustoóe vjerojatnosti za slueajnu varijablu Y:
(x) = ((F (x))) = n [F (x)]’ f (x; 6),
gdje je0, x<0,
F(x)=J f(t;b)dt=r4 , 0<x<b,[ 1, x�b.
Slijedi:
thJ’ x”1, 0�xb,1 0 u ostalim slueajevima.
Sadaje
E (?) =fxx1dx =
to znaëi daY nije centrirani procjenitelj za 6. Medutim, lako se moe popraviti zapaanjem daje statistika
= n+lp tj.
- n+1U = maxTi 1�k�ri
Ucentrirani procjenitelj za nepoznati parametar 6. ]DisperzIja za U je
D(U) = (n±l)2D(P)(n+1)2[E(?j(nb)2]
(n+12 Iz2zm_1dz_(_ b. Lin j j b1 \n+1) n(n+2)
Primjer 9. Neka obi1jeje X ima Poissonovu distribuciju P (A), gdje je A nepoznat Liparametar. Odrediti ML-procjenitelj za parametar A.
Ad. Imamo:
f(x;A)=p(z;A)=PA(X=z)=rA,x0,1,2,...,
F]
& Procjene parametara 179
L(A; x1, x2,•.• x) = !1f (xi, =x1!, x2!
pa je
ölnLA
Odavde slijedi da je ocjena A za parametar A na osnovi ostvarenog uzorka (x1, x2,.
A =
tj. sredina uzorka (x1, a,- , a), pa je ML-proejenitelj parametra A
xz=xn.Primjer 10. Neka obi1jeje X ima distribuciju N a2), gdje je poznat, a g2 nepozuat
parametar. Odrediti procjenitelj za nepoznati parametar 2.
Ad. Ovdjeimamo
f (x;u2) = eL,—
<x <,V2irc2
fl(=,)22 1 2c
L(c ;1,22, .. ,x,) = e(2iru2) 2
In L (a2 X2, = (2n2) —
0.
Prema tome, ocjena za nepoznati parametar a2 na osnovi uzetog uzorka (xi, x2,• , x,) je:
= (x —
odakie je procjenitelj za parametar a2
Primjer 11. ML-metodozn odrediti procjenitelje za nepoznate parametre ji i a2 normalnedistribucije N (,, a2).
Ad. Ovdje imamo
2 1 —______
f (zp,cr)=,,__.e2a2 , _oo<x<oo,
180 8.1. To&asta procjena parametara
n jc_X I,
2 1-’ 2,2;xl,x2,••• ,x) = 2(2iru )2
lnL(p,u2zj,x2,... ,x,) = —1n(2a2) —
22 F!näInL 1
=
bInL it 1 20a2
= =0 iii
1Th
odakie irnamo ocjene za nepoznate parametre p i c2: rjçjy 2 L
tj. sredina I disperzija uzorka. 1-cPrimjer 12. ML-metodom odrediti procjenitelje za nepoznate parametre dvodimenzion
alne normalne distribucije (p’, #2, ?, °1, ‘) p,Ad. Nepoznati vektorski parametar je U = (pj,p2,u,u,p), [Li, #2 C J, a1 > 0, a2 > U
0, jp) < 1.Slueajni uzorak obima it je niz nezavisnih dvodimenzionalnih slueajnih varijabli
(x1,Yi),(X2,Y2),•.. ,(Xn,Yn),
pri ëernu
Na temeiju poznate funkcije gustoée f formira se funkcija vjerodostojnosti L, a iz sustavajednadbi
8p1ãp68cr Opnalaze se ocjene nepoznatih parametara: U
/11 = X,, P2Yn,
= iZ(xi_)2=s,Zr’
= !z(w...v)2s,
= 22Z(Ti )(y —) = r.
Na osnovi ovih ocjena lako je napisati i pripadne ML-procjenitelje.U
8. Procjene parametara 181
8.1.2. Metoda momenataMetoda maksimalne vjerojatnosti u nekim sluaajevinia ne funkcionira dobro. Na primjer, priprocjeni parametara gama distribucije G (a, 5).
Metoda momenata nudi jednostavno rjeenje, all procjene dobivene ovom metodom (u opéemslueaju) imaju manju efikasnost. Ova metoda se temeiji na pretpostavci da su vrijednosti uzoraakih momenata bliske vrijednostima teorijskih momenata.
Teorijski izraz za ishodini k-ti moment (k = 1, 2, -..) sluëajne varijable X definira se kaoE (Xj, ako postoji. S druge strane, k-ti moment uzorka (Xi, X2, , X,) definira se kao
Kod ostvarenog uzorka (x1, x2,. x,) k-ti moment je broj
Prvo promatrajmo slueaj kada distribucija obi1jeja X zavisi o jednom nepoznatom parametru 0 ëija je vrijednost nepoznata. Neka je distribucija obilj&ja X odredena s (8.1). Procjenitelj O, za nepoznati parametar 0 metodom momenata odredujemo na slijedeéi naëin.
Prvo napiemo teorijski izraz za ishodini moment prvog reda obilje2ja X (to je oeekivanjeod X i znamo ga za sve distribucije koje smo upoznah):
E(X)=f1(6). (8.4)
Sada iskaemo relaciju (8.4) na osnovu ostvarenog uzorka (xj, x2,. , x,) (tako da momentprvog reda E (X) zamijenirrio uzoraekim momentom prvog reda a parametar B zamijenimo S
njegovom ocjenom na osnovi uzorka 29):
in = f ().Odavde (kao rjeenje 3) dobivamo ocjenu i9 nepoznatog parametra B:
= gi
paje traeni procjenitelj za nepoznati parametar 0 na osnovi slueajnog uzorka (Xi, X2, , X,)
=
Primjer 13. Odrediti procjenitelj za nepoznati parametar a eksponencijalne distribucijeEx (a).
Ad. Teorijski izraz za prvi ishodini moment je
a na osnovi ostvarenog uzorka (x1, x2, , x,) to je
1xl, =
a
8.1. Toékasta procjena parametara
Odavde je ocjena & nepoznatog parametra a:
1a =
Zn
pa je statistika
xnproejenitelj za nepoznati parametar a eksponencijalne distribucije Er (a) u smislu metode momenata. •
Promatrajmo sada sluëaj kada distribucija obi1jeja X zavisi o dva parametra 01 1 S. Nekaje ta distribucija odredena s (8.1), gdje je 0 = (0, 02) vektorski paranietar.
Prvo napiemo teorijske izraze za ishodine inomente prvog I drugog reda obiIjeja X
E(X) = fl(61,92),
E(X2) = f2(01,02).
Sada ove relacije iskaemo na osnovi ostvarenog uzorka (ri, x2,.• x,)
= fl(t91,62),
= f2Q1,2).
nOvaj sustav jednadbi rijeimo p0 6 i 6 U
= ga
62 = g2frn,xj.
Odavde slijedi da sri procjenitelji nepoznatih pararnetara 1 1 02
/— —2= i
92 = g2()n,x). [1Primjer 14. Odrediti procjenitelje za nepoznate parametre p i a2 normalne distribucije/2
UAd. Kakoje E(X)= p D(X) = E(X2) — (E(XD2, imamo:
E(X)=p, E(X2)=c2+p2, [1paje
2a2+2 UOdavde su ocjene i i a2 za nepoznate parametre p i a2
p = z,n U
a2 = — (2 = — (2 = ,
U
8. Procjene parametara 183
pa za nepoznate parametre i i a2 imamo procjeniteije:
icc==3(,
Dakie, i prema metodi mornenata, procjenitelji za nepoznate parametre p i u2 su sredinauzorka X,. i disperzija uzorka S respektivno.
Ako je parametar p poznat, a parametar a2 nepoznat, tada iz E (x2) = a2 + p2 slijedi, naosnovu uzorka:
= +pa je oejena &2 nepoznate disperzije a2, u slueaju pozuatog oëekivanja p
a2 = —
a pripadni proejenitelj je
2=Z4_p2.
Primjer 15. Metodom momenta odrediti procjenitelj za parametar b u Primjeru 1.
Ad. Kakoje
imamob
xn
Odavde imamo oejenub =
to znaëi da je statistika B kojom proejenjujemo nepoznati parametar b:
B=2X.
Ovaj procjenitelj je centriran:
E(B) = 2E(X) =2E(X)z2 =b,
s disperzijom
UsporedujuOi disperzije procjenitelja za b dobivene ML-metodom u Primjeru 8. i metodommomenta vidimo da je za n � 2 prva metoda efikasnija.
Primjer 16. Neka obi1jeje X ima Poissonovu distribuciju P (), gdje je A nepoznatparametar. Ako su u uzorku obima n = 100 registrirane vrijednosti
x(0 1 2 js tn36 38 1816 2j
184 8.1. Tokasta procjena parametara
metodom momenata odrediti ocjenu nepoznatog parametra A.
Ad. IzE(X) = A
slijeditj. A=,
pa je procjenitelj za parametar A i po metodi momenata:
Sada na osnovi ostvarenog uzorka prikazanog u gornjoj tablici slijedi da je ocjena nepoznatogparametra A:
= = 1.00.
Primjer 17. Odrediti procjenitelje za parametre a i /3 gama distribucije G (a, /3).Ad. Ovdje je
E(X)
E (x2) a(a + 1)/32
paje ii
—
1L
UOdavde dobivamo ocjene za parametre a 1/3:
2—
()—
..2 2’ fl= 2 iii
— (z1) — ()—2 - P
____a— —2Sn Sn
pa za nepoznate pararnetre a i /3 imamo procjenitelje: pU
- ,
Ako je poznat jedan parametar /3 iii a, tada je dovoljno koristiti vezu E(X) =, pa za
proejeniteije imamo:
A = fiX,1 , paranietar /3 je poznat,—
aB =
—
, parametar a je poznat. •
[J:i
n
8. Procjene parametara 185
Neka distribucija obi1jeja X zavisi 01 nepoznatih parametara 01,02, .. ,0, odredena s (8.1),gdje je 0 = (Ui, 02, •.- , Oj) vektorski parametar.
U opéem sluaaju k-ti moment obi1jeja X E (Xk), k = 1,2,••• , 1 je odredena funkcijaparametara61,02,•- ,0z
E(Xj =fk(O1,&2, ,0), k=1,2,•• ,l.
Metoda momenta sastoji se u tome da se u gorujim jednakostima lijeve strane zamijeneodgovarajuéim momentima if uzoraka (xi, X2, ‘,xn), ana desnoj strani umjesto nepoznatihparametara 01,02,• , Oj stave njihove ocjene 191, 192, , 6. Tako imamo 1 jednadbi
iz kojih nalazimo ocjene 19m, m = 1,2,-. , 1 nepoznatih parametara 01, 02, , 6, u funkcijimomenta, r = 1,2,•• , 1
19m=Ym(n,” ,), m=1,2,--• 1.
Sada su odgovarajuée statistike, kao procjenitelji nepoznatih parametara 6i,62, naosnovi slueajnog uzorka (X1, X2,... , X,-j
= gin , , m= 1, 2, •., 1.
8.2. Intervali povjerenja
Osim toekastih ocjena, bavit éemo se I takozvanim intervalnim ocjenama nepoznatog parametra0. Problem se svodi na odredivanje dviju statistika
91=f1(X1,X2,.• ,X) I O2=f2(X1,X2, ,X)
takvih dajePri<02)=1 I P(1<0<O2)=fl,
gdje je j3 zadana vjerojatnost. Interval [L,2] je àluëajni interval, jer su mu krajnje toekevarijable. Interval [01,02] naziva se interval povjerenja za parametar 0, a vjerojatnost /3naziva se nivo povjerenja. Prirodno je traiti to ue intervale povjerenja[&i, 02] , na primjer,u tom smislu da matematieko oeekivanje duijine intervala povjerenja E (2 — bude to manje.S druge strane eIimo da nivo povjerenja /3 bude to veói. Najeeée se uzima /3 = 0.95 iii 0.99.Jasno je da su ova dva zahtjeva uglavnom opreëna. Izlaz lei, kao to éemo na primjerima vidjeti,u poveôenju obima uzoraka.
Kada smo uzeli uzorak i dobili brojeve (x1, x2,... , x,), tada statistike 01 = fi (Xi, X2,” , X,)i °2 = f2 (X1, X2,. , X,) postaju odredeni brojevi
19if(xl,x2,”mxn) i 2f(x1,x2,...,z),
8.2. Intervali povjerenja
respektivno, a slueajni interval 02] postaje odredeni interval 62]. Pogreno bi bib
snatrati da sa vjerojatnoéu 5 taj interval [or. 192] sadri nepoznati parametar 9. Brojevi
t91,’i92 i U nisu slueajni brojevi, prema tome dogadaj (t9 SB S 192) je izvjestan iii nemoguOdogadaj i njegova vjerojatnost je I, odnosno 0, a nikako nije /3. Vjerojatnost /3 je samo vjerojatnost da sluëajni interval [o12] prekrije nepoznati broj 0. Vjerojatnost 5 moemo interpretirati i ovako: zamislimo da smo uzeli mnogo serija uzoraka obima n i dobili nizove brojeva(x1,x2,•-• ,x), (4,4,.-. 4), (4,4,-.. 4),... i izraeunali intervale povjerenja
[3c ], [Z], -. . Tada na te intervale moemo gledati kao na realizacije sluöajnog
[12]. Kakoje
I tumaëeéi vjerojatnost kao graniënu vrijednost relativnih uëestalosti moemo reOi da prib1ino1005% numeriekih intervala [z91, 292], [, 6], {, 6],..- “pokriva” nepoznati broj 0, a ostalih100(1 — /3) % ne “pokriva” (slika 8.2.).
119 [2
Slika 8.2. iiNavediino sada neke primjere za intervale povjerenja. Najprije jedan u sluëaju velikog uzorka, r
kada se s1uimo asimptotski tonom distribucijom. 118.2.1. Intrval povjerenja za nepoznatu vjerojatnost p
Kod svakog elementa populacije ispitujemo realizaciju dogadaja A. Njegova vjerojatnost P (A) =p je nepoznata. Dakie, kao obiljeje moemo promatrati indikator dogadaja A ‘A = I. Jednostavan uzorak obirna n je (11,12,... ,In). Statistika 8,, = I + 12 + ... + I,, predstavlja brojkoliko se puta u uzorku obima n realizira dogadaj A.
Na osnovu centralnog graniãnog teorena ima prib1ino N (0, 1) distribuciju. Za svakizadani nivo povjerenja /3 moemo odrediti broj z takav da je
P(IZISzp)=2’P(zp)/3, (8.5)r
gdje ZrN(0,i), aodavdeje hi(Zfl)
8. Procjene parametara 187
pa iz odgovarajuée tablice ëitamo broj
= -1()Neka je, na primjer, a) 3 = 0.95, b) j3 = 0.99. Koriatcél odgovarajuéu tabhcu, imamo:
a) (zrj.95) = 0.475, z095 = 1.96,b)
‘
(zag9) = 0.495, Z399 = 2.58
Prema (8.5), imamo priblino:
s—\ np(i—p) — )
Gornji dogadaj moe Se napisati kao:
I <Z13l=I<Z =np(1-p) J np(l-p)-
= {(n2+mz)p2—(2nSn+n4)p+S<0}= {i(Sn)�p<2(Sn)},
gdje su j5 (Sn) (S,) respektivno manji I veéi korijen kvadratne jednadbe
(n2+n4)p2— (2nS+nz)p+S =0.
Prema tome, interval[i (Sn), P2 (Sn)] (8.6)
je interval povjerenja za nepoznati parametar p s nivoom povjerenja fi, jer je
Eksplicitni oblik za interval (8.6) je
+-—2 sn@siJ+4‘
2 ++z5‘TtfrL_’n)+4
n+z5 n 2n n 4Th-I-Z
ii 2n n 4
Za ostvaren uzorak (i1i2,.. ,i) dobiva Se odredeni broj s = ij + i2 + + in, pa jeinterval povjerenja odredeni numerieki interval [j5 (sn), P2 (sn)] kojega treba tumaëiti onakokako je uëinjeno ii diskusiji opéeg sluëaja. Pñrnjetimo da, iako je nepoznata vjerojatnost psigurno u intervalu [0,1], dobiveni numerieki interval povjerenja [j31 (sn), P2 (sn)] za parametarp ne mora biti sadr±an u 10,11.
Primjer 18. U odredenom porizvodnom procesu tijekom jednog tjedna proizvedeno je 79artikala, media kojima su naderia 3 s pogrekom. NaCi 95% (j3 = 0.95) interval povjerenja zanepoznatu vjerojatnost p = P (‘da je proizvod s pogrekom”).
8.2. Intervali povjerenja
Ad. Ovdje je n = 79, 579 = 3 i rjeenje jednadbe
(792+79 x 1.961p2 —(2 x 79 x 3+79 x 1.961p+9 = 0
daje interval povjerenja za nepoznati parametar p s nivoom povjerenja fi = 0.95:
[0.013, 0.106] .
Primjer 19. Od 120 proizvedenih artikala 4 je s pogrekom. Naêi 99% ( = 0.99) intervalpovjerenja za nepoznatu vjerojatnost p = P (“da je proizvod s pogrekom”).
Ad. Ovdje je ii = 120, 12o = 4. Interval povjerenja za nepoznati parametar p daju rjeenjajednadbe U
(1202 + 120 x 2.582)p2 —(2 x 120 x 4+ 120 x 2.582)p+16 = 0 ili [1
15198.768 p2 — 1758.768 16 = 0.
Interval povjerenja za nepoznati parametar p s nivoom povjerenja j3 = 0.99 je pU
[0.010, 0.106] .
8.2.2. Intervali povjerenja za parametre normalne distribucije
Interval povjernja za oëekivanje t u slueaju poznate disperzije a2
Vidjeli smo da kod velikog uzorka za sredinu uzorka vrijedi: [1$— ( c2’\ nX,. Kiit,—j,
\ “1 Ui
N(0,1).
Prema tome, imamo:N’
a�25J13 LiI
{it �zfl}={m�z}=U
,U <c = {z — cit
paje UiU — aN’
Z5i�t<Xn+ZI3T,)1i
Dakie, interval povjerenja za p je: [IZ5, X+Z3] . p
iJ
8. Procjene parametara
Primjetimo da u ovom sluOaju duijina intervala povjerenja nije slueajna veé je jednaka broju
2z0. Vidi se kako se interval suava s porastom obima uzorka n.
Primjer 20. Pretpostavimo da imamo dovoljno razioga da smatramo da je standardnadevijacija visine u jednoj velikoj ljudskoj populaciji a = 16 cm. Srednja vrijednost visine kod100 slueajno odabranih osoba je = 175. Odredi 99% interval povjerenja za steduju visinu ucijeloj populaciji. Iz odgovarajuée tablice nalazimo j3 = 2.58, te za 99% interval povjerenjaimamo
[175— 2.58)_ 175 + = (171,1791 .1
Kod malog uzorka redovito éemo pretpostavljati da obiIjeje X ima N (p, a2) distribuciju.Zapazimo da smo za interval povjernja za oeekivanje p kada je disperzija a2 poznata koristili
dogadaj istog oblika {IZI <z0} i vjerojatnost P (IzI <zp) = /3 kao i za sluëaj odredivanjaintervala povjerenja za riepoznato oëekivanje p indikatora ‘A kada se uzimao veliki uzorak.
Primjer 21. Sueajna varijabla X ima normalnu distribuciju N (p, 8) s nepoznatim oeekivanjem p. Odrediti interval povjerenja za ocjenu oeeki-vanja p s nivoom povjerenja /3 = 0.9762ako se zna da je sredina uzorka = 12.25.
Ad. Imamo:
( Xn p= 2 (z0) = 0.9762,
\ ‘/ I= 0.4881,
r’ (0.4881) = 2.26.
Sadaje interval povjerenja zap:
[12.25— 2.26, 12.25 + 2.26] = [11.61, 12.89]
Interval povjerenja za oëekivanje p kada disperzija a2 nije poznata
Sjetimo se da je
=Xn:
i da iz odgovarajuee tablice moemo proëitati broj tako da
PUtn_iI � t,_1,) = a iii
P (jt — lj t_110) = 1 — a.
Dakie, promatrajmo statistiku
=Xn: —1.
8.2. Intervali povjerenja
Za dani nivo povjerenja moemo iz tablice proãitati broj tj,j_p takav da je
PGtn_iI � tn4,1_fl) =
P � = .
Odavde slijedi
—
tfl_J,lP: 1 + =
DaMe, u slueaju kada disperzija a2 nije poznata zamijenjuje se disperzijom uzorka I 1008%interval povjerenja za oëekivanje p je:
—
1’+ t11_
U ovom slueaju duijina intervala je 2ti,1_p a to je slueajna varijabla, tj. varira odjednog do drugog realiziranog uzorka.
Primjer 22. Pretpostavimo da je godinji vodeni talog na odredanoj lokaciji slueajna vanjabla X s normalnom distribucijom. Tijekom 8 godina zabiljeene su vrijednosti taloga
34.1, 33.7, 27.4, 31.1, 30.9, 35.2, 28.4, 32.1.
AOdrediti 90% interval povjerenja za E (X) = p.Ad. Ovdje je n = 8 i = 0.90, te iz tablice eitamo broj
I= 1.89.
Odredimo s :
s= (34.1+33.7++32.1) rr 31.6
4 = — = (34.12 + 3372+ + 32.12) — 31.62.= 7.5.
DaIcle, 90% interval povjerenja za p je
[31.6_ 31.6 + 1.895] = [29.64, 33.56J .•
d
8. Procjene parametara 191
Interval povjerenja za nepoznatu disperziju cr2
Disperzija obi1jeja X mjeri na neki naein homogenost tog obilje2ja u populaciji I xi nizu situacijau primjenama vana je sarno gornja granica disperzije. Zato je ovdje interesantniji takozvanijednostrani interval povjerenja obhlca [0, d}.
Sjetimo se da je—2
2 flSflxfl.—1 —
i da iz odgovarajuêe tablice ëitamo broj takav da je
(x_i � x1) =
Stoga, za dani nivo povjerenja 5 u tablici ëitamo broj X_i,p takav da
P (x—i � x_i,p) = 5 ili
� = 5.Odavde je
?xTh_1j3 JDakie, 1005% jednostrani interval povjerenja za disperziju cr2 je
—2n
2
Dvostrani interval povjerenja za a2 je oblika {d, d], a moemo ga dobiti na slijedeOlnaëin. Za dani nivo povjerenja 5 ëitamo iz tablice brojeve
2‘
(slika 3). Na taj naèin je
F � � xfl_L1) = 5,
P � = /3.
Slijedi, dvostrani interval povjerenj a za a2 j e
—2 —2nsfl nsfl2
‘2X_jjj X 1+5
2 fl,2Zapazimo daje (vidi sliku 8.3.):
2 2—
1—5 1+5Xfl—lXfl_J, 2 =
2
8.2. Intervali povjerenja
Slika8.3.
Primjer 23. Odredena dimenzija nekog proizvoda ima normalnu distribuciju. U uzorku odn = 20 proizvoda nadeno je L
= 32.29 mm i 20. = 2.53 mm2
Naôi 96% jednostrani i dvostrani interval povjerenja za nepoznatu disperziju a2 te dimenzije ucjelokupnoj proizvodnji.
Ad. Linearnom ekstrapolacijom vrijednosti iz tablice dobivamo da je x?g,o.96 10 take da96% jednostrani interval povjerenja za 2
[o j] iii [0, 0.25 mm2]
Za dvostrani 96% interval povjerenja iz tablice nalazimo brojeve:
:336871— Xigo.gs -
2tako da je dvostrani 96% interval povjerenja za a : La[3:7 8.567] iii [0.07 mm2, 0.30 mm2]
Od konkretne situacije zavisi koji éemo od ova dva intervala upotrebiti. In
Primjer 24. Na slueajnom uzorku od 20 elemenata iz normalne distribucije odredeno je U= 6. Odrediti 90% jednostrani i dvostrani interval povjerenja za nepoznatu distribuciju a2
u cijeloj populaciji. I aAd. Imamo:
n=20, =6, 5=0.90, 1/3oos 1±5 6x?goso = 11.651, Xgoijs = 30.144, )dg;o.95 = 10.117,
[I
8. Procjene parametara 193
pa su traeni intervali:F 20x61(0, 11.651] = [0, 10.30]
r2ox6 20x61 [3.98, 11.86) . I[30.144’ 10.117] =
Primjer 25. Odrediti 99% jednostrani i dvostrani interval povjerenja disperzije populacijeiz koje je izvuëen slijedeói uzorak
xjjO 1 2 3 4
H 11 8 5 2
Ad. Ovdje je n = 30, $ = 0.99 i koristeOi:
11O 2 H 2
‘2[ Xn_i;pJ X_1 X1
‘2 72
= = 1X -X2,k=1 k=1
dobivamo50
—5
—
*(4.0411.1 + 8•2 +5•3 + 2.4) = —
120= (4.o2 ± 11 .12 + 8.22 + 5.32 + 2.42) = (11 + 32 + 45 + 32) = = 4,
30 25 11= —4 =4— = = 1.22,
k1
= X9Q99 = 14.256,
= Xg,ooo5 53.945,
= X9,oa95 = 13.597
Sada, traeni intervali Sn:
[ 0,30 x 1.221
= [0, 2.57],14.256 j130 x 1.22 30 x 1.221[ 53.945 ‘ 13.597 j [0.68, 2.69] . I
194 82. Intervali povjerenja
F!
b
Pii
P
4)
nUP
PU
UF,
U
9. Testiranje parametarskihhipoteza
9.1. Parametarski testovi
Osnovni problem u matematiekoj statistici, kako smo veé naglasili, je na osnovu uzoraka ocijenitikoju distribuciju u cijeloj populaciji ima promatrano obi1jeje. Svaka pretpostavka koja se odnosius. tu distribuciju obi1jeja naziva se statistiëka hipoteza, a postupak njene verifikacije pomoOuuzorka naziva se statistieki test. Statistika kojom se koristimo u torn postupku naziva se teststatistika.
Primjer 1. ProizvodaO odredenib elektrienih uredaja utvrduje daje uvodenjem nove tehnologije duljina trajanja uredaja umjesto dosadanjih 100 sati poveéana na 103 sata. Pri tome duijinutraj anj a uredaj a treba slivatiti kao srednju vrijednost duijine traj anj a svih ureaj a proizvedenihistom tehnologijom. Duijina trajanja uredaja je sluëajna varijabla s normalnom distribucijom.Pretpostavit ôemo da je disperzija poznata i da iznosi u2 = 16 sati2. Dakie, proizvodae tvrdi danova tehnologija daje distribuciju K (103,16) obi1jeju X - duijina trajanja uredaja, nasuprotranijoj koja je bila N (100,16). Problem éemo pojednostaviti tako to Oemo pretpostaviti da udistribuciji obi1jeja X koja jeW (/L, 16), parametar p moe biti samo jedan od brojeva iz skupa{100, 103}. Hipotezu da je p = 100 oznaOit éemo s H0 (p 100) i zvat éemo nul-hipoteza, ahipotezu da je p = 103 zvat éemo alternativna hipoteza i oznaëit emo je s H1 (p = 103).
Sada treba testirati hipotezu H0 (p = 100), tj. da na osnovi sluaajnog uzorka prihvatimo iiiodbacimo hipotezu Ho, to povlaai odbacivanje, odnosno prihvaéanje hipoteze H1.
Neka je obim uzorka n = 16 i uoëimo sredinu uzorka 46. X6 je slueajna varijabla i kaduzmerno jedan odredeni uzorak (xi, x16) ona poprima odredenu numeriaku vrujednost x16.Za testiranje hipoteze H0 (p = 100) koristit éemo test statistiku X16 i dati pravilo za odluku oprihvaéanju iii odbacivanju hipoteze prema vrijednosti 16 koju u ostvarenorn uzorku poprimiX16. U tam cilju odredit éemo skup toeaka C na realnom pravcu i odbacit éemo hipotezu H0 akox16 C C, odnosno prihvatiti H0 ako C. Skup C se zove kritiean skup za test. Oeevidnoda ako dobijemo < 100 neéemo odbaciti H0 iii ako je > 103 onda neéemo prihvatitiH0, tj. prihvatit óemo H1. Ova odluka temeiji se na ëinjenici da je X16 centrirana ocjena zanepoznati parametar p koji je iz dvoelanog skupa {100, 103}.
Kakvu odluku donijeti ako je na primjer x16 = 102? Pretpostavirno da je H0 (p = 100)toëna. Tada X16 ima distribuciju N (100, 1) (silka 9.1.). Ako kritienu oblast C uzmemo kao[k, +), k > 100, tada éemo H0 (p = 100) odbaciti ako je � k. Pri tome moemo uëinitioclredenu pogreku koju nazivamo pogreeka prve vrste i koja se sastoji u tome da nul-hipotezu
195
9.1. Parametarski testoviFt
H0 (p = 100) odhacimo iako je u stvari H3 toëna. Vjerojatnost pogreke prve vrste je
a = P110 16 � k) = PH0 (xis—100 k
_100) = 0.5— (k — 100)
H0 H1
100 103C
1
UI.
Slika9.1.
Na primjer, za k = 102 ona iznosip
a=0.5—(2) =0.02275
i zaista je mala. Pisanjem indeksa H3 uz vjerojatnost P e1imo istaôi da tu vjerojatnost izraëu- iinavamo pod pretpostavkom daje H3 toäna. Oeevidnoje da s poveéanjem k vjerojatnost pogrekeprve vrste moemo iiëiniti P0 voiji malom.
Medutim, ako je hipoteza H1 (p = 103) toëna, onda prihvaeajuéi hipotezu H0 (p = 100) emimo pogreku druge vrste. Kolika je vjerojatnost te pogreke? Ako je H1 toCna, onda
N (103, 1). Prihvaãamo H3 ako je I6 < k. Dakie, radi se 0 vjerojatnosti (slika 1)
/3 = P1 <k)=PH1(16103
<k_lOS)= t’(k—103)—(—oo)=0.5—(103—k). nLiNa primjer, za k = 102:
/3 = 0.5— (1) = 0.15866.
Prema slici 1 vidimo da su zahtjevi za smanjenje vjerojatnosti pogreki prve i druge vrste I]pomoéu mijenjanja kritienog skupa opreCni: ako a opada, /3 raste i obrnuto. Rjeëenje 1ei upoveéanju obima uzorka. Ako, na primjer, uzmemo ii = 64 irnarno da ako je H0 (p = 100) toena,onda X64 .1V(103, ), a ako je H1 (p = 103) toCna, onda X64 n-i N(103, ). Sada imamo zakritiean skup C = [102, +oo) vjerojatnosti pogreaka prve i druge vrste:
a = P110 64 � 102) = PH0100
� 4) = 0.5— (4) = 0.004, L/3 = P1 64 < 102) = PH1 (T64
— 102<—2) = 0.5 — (2) = 0.02275.•
U
[I
9. Testiranje parametarskih hipoteza 197
Navedimo sada definicije nekih pojrnova koje smo koristili u Primjeru 1.U testiranju statistieke hipoteze koja se odnosi na parametar 6, vano je toëno odrediti koji
je skup moguéih vrijednosti parametara 0. Taj skup (3, koji 5€ jo naziva skup prihvatljivihvrijednosti paranietra 9, zavisi od konkretnog zadatka. U Prirnjeru 1. on je {1.00, 103}. Akoje poznato iii se pretpostavua da se u torn primjeru duijina trajanja uredaja uvodenjem novetehuologije ne moe smanjiti, tada skup prihvatljivih vrijednosti pararnetra p je [100, +). Akonema nikakvih informacija iii pretpostavki taj skup je (0, oo).
Hipoteza je jednostavna ako se odnosi na jednu vrijednost parametra kojom je distribucija potpuno odredena. U Primjeru 1. obe hipoteze H0 (p = 100) i H1 (p = 103) su jednostavne.Ukoliko nije jednostavna hipoteza se zove s1oena. Obieno testiramo jednu jednostavnu hipotezuH0 (0 = 0) koju nazivarno nul-hipoteza. U ovisnosti ad skupa vrijednosti za 0 suprotna ill alternativna hipoteza moe biti jednostavna iii s1oena. U Primjeru 1. gdje je skup rnoguôih vrijednosti parametra p flail, 103}, alternativna hipoteza nul-hipotezi H0 (p = 100) je jednostavna:H1 (p = 103). Ovdje bi alternativna hipoteza mogla biti s1oena, na primjer, H1 (p 0 100),H1 (p> 100) ltd., to zavisi od konkretnog zadatka.
Pogreka prve vrste je odbaciti hipotezu H0 kada je ona stvarno toëna, apogreka druge vrste je prihvatiti hipotezu H9 kada je stvarno toëna H1.Vjerojatnosti tih pogreaka oznaëavat éemo s a i , respektivno.
Primjer 2. Vratimo se na Primjer 1. Smatrat éemo da nova tehnologija ne daje proizvodekraeeg trajanja od ranijih, tj. da je skup moguéih vrijednosti parametra p: [100, +). Neka jenul-hipoteza H0 (p = 100), tj. da nova tehnologija nije boija od prethodne. Ovdje je alternativnahipoteza s1oena: H1 (p > 100). Kritian skup za nul-hipotezu odredit êemo tako da vjerojatnostpogreke prve vrste bude unaprijed zadani broj a. Obiëno se za a uzima 0.05 iii 0.01, medutim tonije pravilo. U prirnjenama biranje vrijednosti za a vezano je za rizik (iii, na primjer, trokove)u koji ulazirno odbacujuéi Ho kada je ona toëna. Pri tome treba imati u vidu da smanjenjem auveóavarno vjerojatnost da prihvatimo H0 kada ona nije toëna. Uzmimo obirn uzorka ii = 16 ia = 0.05, tada se kritiaan skup C = [k, +) odreduje na slijedeOi naëin:
a = PH0 {Xw � k} = 0.5 — F (k — 100).
Prerna tome (vidi sliku 9.2.),
t (k —100) = 0.3— 0.05 = 0.45
i iz odgovarajuOe tablice ëitamo:
k—laO = 1.65, pajek = 101.65 iC = [101.65, +oo).
Dakie, postupak testiranja H0 (p = 100) protiv H1 (p > 100) je shjedeéi: u uzetom uzorkuod n = 16 proizvoda nove tehnologije odredujemo sredinu uzorka i16. Alto je � k101.65 hipotezu H0 (p = 100) odbacujemo, alto je z16 < lv = 101.65 hipotezu H0 ( = 100) neodbacujemo, tj. ne smatramo da nova tehnologija produuje duijinu trajanja proizvoda.
9.1. Parametarski testovi
100Cr
nSlilca 9.2.Li
Smisao a = 0.05 je slijedeãi. Ako bi mnogo puta ponavijali ova testiranje onda bi priblifrou 5% slueajeva pogreno odbacili nul-hipotezu kada je ona uistinu toëna. Priinjetimo da ovdjene moemo odrediti vjerojatnost pogreke druge vrste, tj. vjerojatnost pogreMce da prihvatimoH0 (,u = 100) kada ona ustvani nije toëna. •
Nekaje skup moguêih vrijednosti nepoznatog parametra 0 fiksiran. Zelimo testirati H0 (0= So)protiv, na pnimjer, H1 (0 0 Oo). U tom cilju za dane n i a uzimano odredenu statistiku 0,-. =
f (X1, X2,. , X,) I odredujemo knitiëan skup C. Time je test potpuno odreden: ako u uzetorn uzorku (x1, x2,... , z,), 6, = f (x1, x2,-- , x,) padne u kritãöan skup C, tj. ako 3, C Conda Ho (0 = Oo) odbacujemo, ako 3, C onda H0 (0 = Oc) ne odbacujemo, tj. uzeti uzorak neproturjeëi hipotezi Ho (0 = 0w).
Test opisan u Primjeru 2. pripada takozvanim testovima znaeajnosti, a vjerojatnost anaziva se razina znaëajnosti. Raziog upotrebe rijeëi °znaëajnost’ biti Oe jasniji nakon slijedeéeg moguOeg opisa takvog testa. Testiramo hipotezu H3 (0 = Go), protiv, na primjer, sloeneH1 (0 4 8). Na osnovi uzorka (X1,X2, , X,) biramo test statistiku 0,, koja je neka ocjenanepoznatog pararnetra. U uzetom uzorku (xj, X2,” , x,,) statistika U,, postaje odreden broj ii,,i utvrdimo odredeno odstupanje — Uo ocjene i3,, od hipotetieke vrijednosti 6 za parametar0. Sada smo pred dilemom da Ii da to odstupanje smatramo beznaeajnim, tj. da ga pnipiemoslueajnirn odstupanjima koja su rnoguéa kada je stvarno hipoteza H0 (9 = Oo) toëna iii znaáajnirn, tj. da je to odstupanje toliko veliko da ga ne moemo objasniti slueajnim odstupanjem,u ovom sluiaju hipotezu H0 (0 = 8) odhacujemo. Kriterij pa kojem éemo odstupanje I¼ OoIsmatrati znaäajnim moomo definirati ovako: odredit êerno broj V,,a tako da je vjerojatnost,izraãunata pod pretpostavkom da je H0 (0 = Uo) toëna, odstupanja ne manjeg od broja Vn,cc
jednaka a, gdje je a mall broj (recimo 0.05 iii 0.01). Dakie, formalno zapisano:
PH0 — oo � tin,0) = a,
gdje FH0 oznaëava vjerojatnost raäunatu pod pretpostavkom da je Ho (0 = 0) toëna. Ako Podstupanje ,, — 0 dobiveno prema uzetom uzorku nije manje ad v,,,0 to moemo protumaaiti:pod pretpostavkom da je H3 (0 = 0) tona realiziran je dogadaj koji je imao vjerojatnost manjuod a. Prirodnije je sada smatrati da je pogrena pretpostavka toënost hipoteze Ho, umjesto [I!
LI
9. Testiranje parametarskih hipoteza 199
smatrati da se realizirao dogadaj mare vjerojatnosti a. Ukoliko je — Oci < vn,a nemamorazloga odhaciti H0. Broj vn,a naziva se kritiena vrijednost testa s razinom znaëajnosti a.
Oeevidno smanjenjem razine znaëajnosti a umanjujemo rizilt da pogreno odbacimo Ho kad jeona uistinu toOna, au time istovremeno poveéavamo rizik da pogreimo tako to neóemo odbacitiH0 kada ona stvarno nije toëna. Testovi znaëajnosti ne kontroliraju pogreku druge vrste. Zatopri izboru razine znaëajnosti a treba se rukovoditi konkretnom situacijom u kojoj primjenjujemotest i procijenimo kakovim nez rizicima gubitka iii trokova izlau pogreke prve i druge vrste.Oeevidno je da uveóavanje obima uzorka n utjeëe na smanjenje vjerojatnosti pogreaka prve idruge vrste.
U vezi s tim, reôi éemo neto o izboru nul—hipoteze. Iz skupa prihvatljivih vrijednosti parametra S = {6} biramo onu vrijednost oo (i postavijamo nul-hipotezu H3 (6 = Go)) koja obienoodgovara situaciji kakva je bila do statistiakog eksperimenta kojeg poduzimamo iii koja odgovara (vrijednost Go) predvidenim standardima. Na osnovi statistiëkog eksperimenta, tj. uzorka(X1, X2,... , X,), odnosno realiziranog uzorka (xi, z2,- , x,) trebamo zakljuãiti je ii doMo doprornjene (treba Ii H3 odbaciti). Izbor razine znaëajnosti a odreduje strogost naeg kriterija.
Ono to je reöeno o testu znaëajnosti za H0 (9 = G) protiv H1 (6 0 Go) moe se prilagoditidrugim slueajevima nulte i alternativne hipoteze. Na primjer, H3 (0 = O) protiv H1 (9 < oo) iiiH0 (6 � Oo) protiv H1 (9 > 6o).
Sada éemo iznijeti nekoliko primjera testova znaëajnosti. Primjetimo jo jednom da se kodvelikog uzorka koristimo asimptotski toënim distribucijama koje su uglavnom normalne.
9.1.1. Testiranje hipoteze H0 (t = 1u3) protiv H1 ([4 p) kada je disperzija a2poznata -
Ako je H0 ([L = jz) toëna onda sredina Y, velikog uzorka ma prib1ino distribuciju N (ito -),odnosno Z = X-iz0 ima distribuciju N (0, 1). Za danu razinu znaëajnosti a ëitamo iz odgovara
vijuée tablice broj z1_ takav da je
(iXm—iioI �zi_a) =a.
Dakie, ako u uzetom uzorku (xi, x2,• , x,) zaicljueimo da je � onda hipotezu
H0 (p p) odbacujemo, u sluëaju daje ‘0 <zl_a kaemo da uzeti uzorak nije u suprotnostis hipotezom H0 (p =
Ovaj test primjenljiv je i kod malog uzorka ukoliko obiljeje X ima normalnu distribuciju.
Primjer 3. U proizvodnji odredenog proizvoda vjerojatnost da je jedan proizvod defektanje p = 0.1. Uvodenjern nove tehnologije u proizvodnju oeekuje se smanjenje te vjerojatnosti. Uuzorku od 100 artikala utvrdeno je 8 defektnih. Da ii se s razinom znaöajnosti a = 0.05 moesrnatrati da nova tehnologija znaëajno smanjuje vjerojatnost defektnih proizvoda?
Ad. Ovdje je nul-hipoteza H3 (p = 0.1) protiv afternativne H1 (p < 0.1). Ako promatramostatistiku S100 — broj defektnih proizvoda na 100 slueajno izabranih, onda ona ima prib1inodistribuciju N (lOOp, lOOpq).
9.1. Parametarski testovi
Dakie, ako pretpostavimo da ,je H0 (p = 0.1) toëna, onda 8100 ima distribuciju N (10, 9),odnosno 100_ ima distribuciju N (0,1). U uzetom uzorku bi1jeimo soo = 8. Kritianu vrijednost 1oo,o.o5 odredit éemo iz uvjeta da je (slika 9.3. a))
PH0 (Sioo 8100,0.05) = 0.05
Imamo (slika 9.3. b)):
PH0 (Sioo � 8100,0.05) = PH0 (8100;10
<8j9Q,g —
10)
= 0.5— (8100.0.05— 10) = o.os, Podnosno
sioo,o.os — iON .
= 0.45, paje
10 8100,0.05= 1.65 i 100,0.05 = 5.05. tIc
Kakoje P{Sioo S 5.05} C {Sioo 5 8}, to je
P9 (S 58) > P110 (So 55.05) = 0.05. UiPrema tome, ne moemo smatrati daje odstupanje broja defektnih 8 od matematiekog oeekiva.njakoje je
EH0 (Sioo) = 100 x 0.1 = 10
znaëajno, buduói da ima vjerojatnost veéu od 0.05. ILia) b)
8100 — 10I 3
0.050.05
P8100,0.05 10 ioo,o.o5 — 10 0
S P
Slika 9.3. PKod malog uzorka redovito éemo pretpostavljati da obi1jeje X ima normalnu distribuciju
9.1.2. Testiranje hipoteze H0 (p = Po) protiv H1 ( 0 p) kada a2 nije pozuato
Alto X ima normalnu distribuciju tada jeU
xn — Pc n—i.
Fit
9. Testiranje parametarskih hipoteza 201
Statistika t,._1 predstavlja na odgovarujuái naöin normirano odstupanje )t, od hipotetiëkogmaternatiekog oekivanja (primjetimo da, ako je H0 toëna, E (Y) = i0). Za danu razinuznaajnosti a u odgovarajuéoj tabhci ëitamo kritiënu vrijednost tn_,a za koju je
P0 (ltn_il � tn_ip) = a.
Na osnovu uzetog uzorka (zj, x21 xn) izraöunavamo realiziranu vrijednost statistike t,_i
tn_i = XnMoSn
Ako je > onda hipotezu H0 (j.t = ji0) odbacujemo, a ako je Fnii <nemamo razloga odbaciti H0 (p = ito).
Prinijer 4. Na grupi od 10 pacijenata ispituje se djelovanje dvaju sredstava za spavanjeA I B. Dodatni broj sati spavanja pri uporabi sredstva A neka je X, a pri uporabi sredstva Bneka je Y. Promatrajmo obi1jeje U = X — Y i pretpostavimo da ono ima normainu distribucijuN (p a2). Testirajmo hipotezu H0 (p = 0) protiv H1 (p #0) 5 razinom znaëajnosti a = 0.01,tj. testirajmo hipotezu 0 podjednakoj efikasnosti sredstava A i B. Nekaje uzeti uzorak slijedeôi:
Pacijent Xk yk uk = xk — Ilk1 1.9 0.7 L22 0.8 —1.6 2.43 1.1 j —0.2 1.34 0.1 —1.2 1.35 —0.1 —0.1 0.06 4.4 3.4 1.07 5.5 3.7 1.88 1.6 0.8 0.89 4.6 0.0 4.610 3.4 2.0 1.4
Ad. Na pivi pogled ovi rezultati daju prednost sredstvu A. Medutim, potrebna je statistiekaanaliza podataka da bismo se odlueili je Ii odstupanje matematiëkog oëekivanja za U od p = 0znaëajno; iii je E (U) = 0, a dobivena odstupanja u uzetom uzorku nisu znaãajna, tj. to suona odstupanja koja se slueajno javijaju i variraju od jednog do drugog uzorka iako je stvarnoE (U) = 0. Iz uzetog uzorka dobivamo:
=ZUk
= 1.580
io =
pa je
=1.167
= 4.06.
Iz odgovarajuOe tablice ëitamo kritienu vrijednost tg,oo = 3.25.
202 91.. Parametarski testovi
Kako je, > tg,o.ai, odbacujemo H0 (p = 0), tj. aba sredstva nemaju jednako djelovanje,A je efikasnije ad B. •
Primjer 5. Pretpostavimo da u prethodnom primjeru testiramo H0 (p = 0) protiv H1 (ii> 0),tj. nul-hipotezu a podjednakoj efikasnosti protiv alternativne hipoteze da je A boije od B. Ovohi odgovaralo, na primjer, situaciji icada je A novo sredstvo pa e1imo na osnovu statistiekogeksperimenta zakijualti je ii ono znaèajno boije od sredstva B koje je do sada bib u uporabi.
Ad. Ovdje bi prevelika vrijednost koju bi uzela statistika =Xi0v1T mogla biti
kritiena, tj. kritiena vrijednost ka se odreduje iz uvjeta
(Xnpo NPHOj 7;
“on /
Obzirom kako su tablice za Studentovu distribuciju napravijene, imamo
= tn_l,2a = t910.02 = 2.821.
S druge strane, koristeoi padatke iz prethodnog primjera imamo [1:.
S10
Kako je = 4.06> ka = 2.821, to nul-hipotezu Ho (p = 0) treba odhaciti u korist alternativneHi (p 0) .
Primjer 6. Na osnovu uzorka obima n = 50 dobiveno je srednje vrijeme rada izvjesnog tipastroja i jednako je 2900 sati sa standardnirn odstupanjem 200 sati. Na 5% nivou znaëajnostitestirati hopotezu H0 (p = 3000) pri ëemu je suprotna hipoteza H1 (p 3000).
Ad. Ako je Ho toëna hipoteza, onda statistika Iitn_l=X_P0n_lt(n_n. r
Buduói da je ii — 1 = 49, n> 30, statistika t_1 ima asimptotsku clistribuciju N (0, 1).Kako je (slika 9.4.) p
PflZJ � tn_i,a) = 1 PGZI < tn_i,) = 12(tn_i,a) =a= 0.05, toje U(tn_i,) = 0.475 i
= 1.96. 1lz uvjeta
— BPH0 � 1.96) = 0.05
Sn fldobivamo kritieni skup C = (—oo, —1.96] U [1.96, oo). Li
Na osnovu podataka iz uzorka dobivamo vrijednost
— 2900 — 3000=
200 =3.5cc.
Dakie, jt_1 > tn_i,o pa se ne maze prihvatiti hipoteza Ho, odnosno prihvaéa se hipoteza H1. ULi
9. Testiranje parametarskih hipoteza 203
a a2 2
—1.96 0 1.96
Slika 9.4.
9.1.3. Testiranje hipoteze H0 (p1 = P2) protiv H1 (p1 $ P2)
Promatrajmo dva nezavisna uzorka (X1, x2,... , X,1) I (Yi, Y2,... ,Y2) obiIjeja s nornialnorndistribucijom N (p, a2). Vidjeli smo da vrijedi
— Yn2 fin2= - (n1 + 2 — 2).
2 2 fl + 712nS ,4--n2S
Ovu statistiku moemo upotrebiti za testiranje liipoteze o jednakosti matematiakih oecki—vanja obilje2ja Xi Y u dvjema populacijama, pod predpostavkom data obi1jeja imaju normalnudistribuciju s istom disperzijom. Neka
XrN(p1,c2), YN(,2,a2).
fiebamo testirati hipotezu H0 (p = P2) protix’Hj (P1 0 P2)- Gornja statistika t+,2_2, sobzirom da predstavlja normiranu razliku X — Y2 mote nam kazati da Ii je zadanoni razinomznaëajnosti a razlika ‘2 dobivena iz uzetih uzoraka (x1, x21-- , x,1) i (Yi, V2,” ,
znaëajna iii nije.Na osnovi uzetih uzoraka izraOunavamo broj
- flj
= . (n1 + f2 —2)i + 2
i usporedujemo tni+nz4 S kritienom vrijednoéu t,2_2, proëitaiiom u odgovarajuéoj tablicikoja zadovoijava
PHQ (Itni+nr_2( � tm1-f2_2,) = a.
Ako je %j+n2—2 � tn12_2p, onda H0 (p = P2) odbacujemo, a ako je tnl+n2_21 <tnl+n2_2a, onda uzeti uzorci ne proturjeëe hipotezi H0 (p = P2).
Primjer 7. Pretpostavimo da su podaci xj,, I 71k, k = 1,2,-- ,10, dani u Prirnjeru 4. horezultat ispitivanja lijeka A na jednoj grupi od 10 pacijenata i lijeka B na drugoj grupi od 10pacijenata, respektivno. Ako je obi1jeje X broj dodatnik sati spavanja pri uporabi sretstvaA i Y pri uporabi B, onda je prirodno pretpostaviti da x r. .‘V(pi,a2) i Y .Af(p2,o-2).
204 9.1. Parametarski testovi
Testirajmo razinom znaëajnosti a = 0.01 hipotezu H0 (i’ = it2) protiv H1 (iti 0 it2)- Ovdjeimamo n1 = = 10 i
1O = = 2.33, Pm = = 0.75
= = 36.1, 10 = Z (yk — p10)2 = 28.9.
Registrirana vrijednost statistike tioio_2 je
lox 10(10+102)1.8610+10 fl
Usporedujuéi je s kritienorn vrijednoou t18001 = 2.878 vidimo da na osnovi uzetog uzorkanemamo razioga da s razinom znaëajnosti a = 0.01 odbacimo hipotezu o jednakoj efikasnostilijekova A i B. I
Prividnu proturjeënost rezultata dobivenih u Primjerima 4. i 7. lake je objasniti ako sepodsjetimo to ustvari znaëi test znaëajnosti. U testu znaëajnosti, pretpostavljajuôi da je nulhipoteza toëna, izraëunavamo vjerojatnosti odstupanja, pa ako su te vjerojatnosti isuvie malesmatrarno da su odstupanja znaëajna, tj. ne mogu se objasniti slueajnim fluktuacijama, podpretpostavkom da je nul-hipoteza toëna. Dakie, u torn sluëaju nul-hipotezu odbacujemo.
Ooevidno je da su, pod pretpostavkorn o jednakoj efikasnosti lijekova A i B sluOajna odstupanja (tj. rnoguée vrijednosti X—Y) veéa u slueaju kada A ispitujemo najednoj grupi pacijenataa B na drugoj, nego kad registriramo U = X — Y na svakom pacijentu jedne grupe. Take sernoglo dogoditi da pri danom nivou znaãajnosti nul-hipotezu ne odbacimo u drugom sluëaju.
9.1.4. Testiranje hipoteze o disperziji H0 (a2 = a) protiv H1 (a2 > c)
Testiranje hipoteze o disperziji je vano ii prirnjenama, jer je disperzija kao mjera rasturanja [1dobar pokazatelj stabilnosti raznih procesa, toOnosti instrumenata i tehnolokih procesa itd.Pri tome najee6e se susreóerno s problemom da na osnovi slueajnog uzorka (X1, X2,” X)odredimo dali je “proces’ preao propisane granice disperzije ao, tj. nul-hipotezaje H0 (2 = a)protiv s1oene hipoteze H1 (a2 > us).
Rekli smo da s1uajna varijabla ima x2 (n — 1) distribuciju. Pretpostavljajuéi da je iiH0 (a2 = ag) toöna, iz odgovarajuée tablice ëitamo kritienu vrijednost za danu razinuznaëajnosti a iz uvjeta
n.
UJAko je registrirana vrijednost i na osnovu uzetog uzorka (x1, x2,”. , x,) takva da [I
2
go
iiU11
9. Testiranje parametarskih hipoteza 205
onda odbacujemo hipotezu H0 (u2 = o), jer je odstupanje znaãajno. Ako je pak
—2flS, 2
2Co
uzeti uzorak ne proturjeãi hipotezi H0 (a2 =
9.1.5. Testiranje hipoteze o nepromjenljivosti disperzije
Neka su (Xi, X2,.. , X1) j (Y1, V23. .. , Y2) nezavisni uzorci obilje2ja X ni N (,1, i Y.V (i’23 u), respektiv-no. Testirajmo hipotezu H0 (o = oj) protiv alternative H1 (a1 <Ovo odgovara shiOaju kada je, na primjer, (X1, X2,... , X,) uzorak proizvoda uzetih ranije, a(Y1,Y2,... ,Y2) je uzorak proizvoda uzetih kasnije s proizvodne trake, pa e1imo zakljuOiti je iiu meduvremenu do1o do “ratimovanosti” proizvodnog procesa, tj. da ii je disperzija porasla.
Iz uzetih uzoraka (x1, X2,” x,21) i (Yi, V2,” , Vn2) nalazimo njihove dispeizijerespektivno. Ako smo dobili da je > ?, onda nernamo razioga da odmah osporavarno
H0 (c = o-) u korist alternativne hipoteze H1 (u < oj). Ako je <23 tj. z2_ > 1,
onda primjenjujemo test znaëajnosti da odluoimo je ii ovo odstupanje rezultat uvijek mogueihslueajnih odstupanja kada je Ho (? = c) toëna iii je ono znaèajno, tj. ne moe se objasnitisluaajnim odstupanjem pod pretpostavkom da je H0 (? = toëna i treba usvojiti hipotezuH1 (? <o) kao toãnu.
Kod ovog testa koristimo se Fisherovom F—distribucijom. Ako je H0 (o = a) toèna, ondaje
—2
— —2/ (n 1) (n1 — 1) fl23**= —w2 —2
ttiSfl1
/ (n1 — 1) (n2 — 1) n1S1
jerje
7i2Sfl2 2 i8ni—
22 ni—1
0-i
i smatramo da je ? = oj. Kritienu vrijednost F2_1,11, za razinu znaëajnosti a = 0.05 iiia = 0.01 ëitamo iz odgovarajuee tablice, prema uvjetu:
Pg0 (F21,1 � Fn2_inii,a) = a.
Akoje(ni — 1) n2i2
—2 Fn2_inii,a(n2 — 1)fljS*1
hipotezu H0 (a = c) treba odbaciti, a ako je
(ni — 1)—2 < Fm2_i,niip
(n2 — 1) nis1
dobiveno otstupanje tie sinatramo znaëajnim, tj. nema razioga da na osnovu uzetih uzoraka(x1, x2,.. , x,1) I (y, Y2,•’• , y,2) odbacimo hipotezu H0 (? = oj).
9.1. Parametarski testovi
Primjer 8. Uzet je uzorak od n1 = 10 proizvoda i izmjerena odredena dimenzija proizvodakao obi1jeje X. Nadena je disperzija uzorka = 5.7 mm2. Poslije izvjesnog vremena uzetje novi uzorak obima 2 = 15 proizvoda istog stroja I utvrdeno je ?2 = 9.6 mm2. Moeii se s razinom znaeajnosti a = 0.05 smatrati da je doMo do znaOajnog porasta disperzije kodpromatrane dimenzije proizvoda?
Ad. Kakoje(ni—1)n22 (10—1)x15x9.6
—162(n2—1)ni
— (14—1) x 10x5.7—
I is odgova,rajuée tablice ëitamo kritienu vrijednost F14,g,0.05 = 2.65. Zakljueujemo da ovaj registrirani porast disperzije uzorka ne moemo smatxati znaOajnim.
9.1.6. Testiranje hipoteze o koeficijentu korelacije H0 (pX = o) protiv alternativne H1 (pX, # o)
Podsjetinio se da kod dvodimenzionalnog obi1jeja (X, Y) ako je koeficijent korelacije Px,y 0i obi1jeje (X, Y) ima dvodimenzionalnu normalnu distribuciju vrijedi da je
R(X,Y)1—R2(X,Y)
gdje je R (X, Y) koeficijent korelacije na osnovi uzorka [(Xi, Y1) ,(X2, Y2),.. , (X,, Y)j. I kadaje stvarno pyy = 0 ne moemo oëekivati da kod uzetog uzorka [(xi, y), (x2, y2), , (x,, yn)j
bude r (X, Y) = 0, jer je r (X, Y) vrijednost koju je uzela sluOajna varijabla R (X, Y). Medutim,ako se r (X, Y) znatnije razlikuje od 0 onda je to osnov sumnje da nije Px,y = 0. Statistika tn_2
mjeri to odstupanje pod pretpostavkoxn da je Ho (pxy = 0) toãna. Dakie, ako e1imo testiratihipotezu H0 (pxy = 0) protiv H1 (pxy 0 0) s razinom znaëajnosti a, onda iz odgovarajuéetablice odredujemo kritiãnu vrijednost tn_2,a j usporedujemo s
- r(X,Y)tn—2 = 1_i2 (X,Y)
Akoje t,_2 � tn_2,c ondaH0 (Px,Y = 0) odbacujemo, aakoje n—21 <tn_2,a nernarazioga Lida odbacimo H3 (Px,Y = 0).
Primjer 9. Iz uzorka obima ri = 25 izraëunat je oraeki koeficijent korelacije r (X, Y) =
0, 50. Testirati hipotezu H3 = o) protiv alternativne hipoteze H1 s o) s razinomznaëajnosti a: a) a = 0.01; b) a = 0.05. U!Ad. Na osnovi uzorka je
—2 23 =¼_0 02
2.76887 [1Kritiena vrijednost t23, odreduje se p0 relaciji P {ItI � tn,a} = a. 9
a) t23001 = 2.807 > t, nema razioga da se hipoteza H0 = o) odhaci.
b) t23,0.05 = 2.069 <23, hipotezu Ho = o) treba odbaciti.
91U
9. Testiranje paranietarskih hipoteza 207
Primjer 10. Promatraju se trnice u gradovima I dvodimenzionalno obi1jeje (X, Y), gdjeX prdstavlja cijenu kilograma krumpira I Y cijenu jaja pa komadu. U uzorku ad 14 gradovazabi1jeene su vrijednosti:
Grad Xk Yk1 1.14 1.282 1.23 1.503 1.50 1.254 1.15 1355 0.50 1.106 0.70 1.257 1.10 1.408 1.00 1.209 1.05 1.35
10 1.05 1.4311 1.23 1.3512 1.18 1.3513 1.70 1.3314 1.20 1.20
Potrebno je s razinom znaëajnosti c = 0.10 testirati hipotezu a nepostojanju linearne korelacije izmedu cijene krumpira I cijene jaja, tj. H0 (Px,Y = 0) protiv alternativne Hi (px,y # o).
Ad. Prema uzetom uzorku nalazimo:
14
?ZxkYk—14Yl4r(X,Y)= k=1
**=0.4,
814814
pa je
=/1--0A2’
1.52.
Kako je kritiena vrijednost t12,010 = 1.78 > T12 = 1.52 nema razioga da smatrarno da izmeducijene krumpira i jaja postoji (linearna) Icorelacija.
9.2. Neparametarski testovi
Neparametarski testovi su testovi u kojima se koristi test-statistika ëija distribucija ne zavisiad distribucije obilje2ja u smislu nul-hipoteze. To je osnovna razlika izmedu neparametarskih iparametarskih testova.
9.2.1. Hikvadrat - test
Nul-hipoteza H0 je hipoteza da obi1jeje X ima distribuciju odredenu s
p(x),i=1,2,... iii f(x),xelR,
208 9.2. Neparametarski testovi
ii zavisnosti od toga da ii je slueajna varijabla diskretnog iii kontinuiranog tipa, i testirat Oemo jeprotiv alternativne hipoteze H1 do. X nema tu distribuciju. Kod ovog testa s1uimo se asimptotskitoënim distribucijama. U pitanju je veliki uzorak, obiajo n � 50.
Nekaje 1? (X) skup moguéih vrijednosti obi1jeja X, tj. skup statistiëkih podataka za obiljejeX dobivenih iz uzorka. Skup moguéih vrijednosti R (X) podijelimo na r (r � 2) disjunktnihpodskupova (razreda) R1, R2, . .. , 1?,-. Oznaaimo s Nk, k = 1,2,.. . , r, slueajnu varijablu kojapredstavlja broj sluëajnih varijabli iz uzorka (X1, X2, . . . , X,) koje “padaju” u skup Rk. Podskupove R1, R2,. . . , I?,. odredujemo prema uzetom uzorku (x1, x2,. . . , x) vodeéi raëuna da rbude to veée, all da u svakom razredu Rk, k = 1,2,. . . , r, bude barem 5 vrijednosti iz uzetoguzorka, tj. da je svaki rik � 5, k = 1,2,.. - ,r, gdje je k vrijednost slueajne varijable Nk U
ostvarenom sluëaju.Nekaje
pk=PH0(XERk), k=1,2,...,r,
tj. 0k je vjerojatnost dogadaja {X C Rk} a izraëunava se pod pretpostavkom da je nul-hipotezaHo toëna.
Slueajna varijabla Nk,pod pretpostavkom da Jo H3 toëna, ima binomnu distribuciju B (n, pk),
Nkr..B@,pk), k1,2,...,.Prema tome, ako je H9 toëna, onda je
E(Nk)=npk, D(Njj=npkq, Qk—1—Pk, k=1,2,...,r
i statistika U(9.1)
k=I nfl
dobro predstavija odstupanje statistika Nk od njihovih matematiekih oëekivanja. U ostvarenomuzorku (xi, x2, . . . , x,) slueajne varijable N1, N2, . . , Nr poprimaju odredene vrijednostin1, it2,.. it,. (it1 + 2 + .. + it,. = it) i statistika (9.1) postaje odreden broj
Li2
k=i itPk
Ako je hipoteza H3 toena, ne oeekujerno da taj broj odstupa znaëajnije od 0 i obinuto: akoje odstupanje znaèajnije, nul-hipoteza H9 dovodi se u pitanje. Treba dakie, znati distribuciju A:statistike (9.1) da hi se odredila kritiena vrijednost za unaprijed zadanu razinu znaëajnosti a. ii
Za ovaj test od posebne vanosti je slijedeéa tvrdnja.
UPearsonov teorern. Pod uvjetom da vrijedi hipoteza H9, za veliki ii test-statistika(9.1) prib1ino ima hikvadrat distribuciju s r — 1 stupnjeva slobode, tj. priblifto vrijedi fl,
(N—np)2— 2
d — Xr—I
[IU
Dokaz ovog teorema mote se naéi u literaturi (na primjer u [5j), a temeiji se na slijedeéemzapaanJu. Test-statistika (9.1) je zbroj kvadrata sluaajnih varijabli Npi k = 1,2,•• , r.
1L
9. Testiranje parametarskih hipoteza 209
Za veliko ii, slueajna varijablaNPk
moe se aproksimirati sluOajnom varijablomq = 1 — pk, koja se prerna centralnoin graniënom teoremu za veliko n ravna p0 distribucijiN (0, 1). Fisher je u svom radu od 1950. pokazao da se umjesto npkqk za dovoljno veliki xi moeuzeti TLPk. Zaista, za veliki xi moe se uzeti da je q 1, jer su vjerojatnosti Pk male za veliki xi.
Prema tome, kritienu vrijednost X1,G , koja zadovoijava uvjet
H0 (x_i � x_i,a) =
itamo u odgovarajuáoj tablici. S druge strane, na osnovi ostvarenog uzorka (xx, X2 xn)odredujemo uzoranku vrijednost statistike (9.1):
r 2—2 _\-‘(nk—nvk)Xr-i —
fln
Sada usporedujemo uzoraeko odstupanje s kritienom vrijednoéu X—z,aAko je � X—i, oiida hipotezu H0 odbacujemo, a ako nemamo razioga
dana osnovi ostvarenog uzorka (x1, x2 Zn) odbacimo hipotezu H0.
U primjenama smo esto u situaciji da trebamo testirati hipotezu H0 da obi1jeje K irnaodredenu distribuciju au parametri te distribucije nisu poznati. Na prinjer, H0 je hipoteza daX ima normalnu distribuciju, au parametri p i a2 kojima je ta distribucija potpuno odredenanisu poznati. U ovom sineaju nepoznate parametre zamjenjujemo njihovim ocjenama na osnoviuzetog uzorka. Tako éemo u sluaaju normalne distribucije N (p, a2) za parametre p i a2 uzeti:
n1[I =
= ill 2_/1ZkXn)
(kako je xi veliko razlika je neznatna). Rod Poissonove distribucije P (A) i binomne distribucijeB (n,p) za nepoznate parametre A i p uzet éemo:
A =Zn
73=—.1’S tim ocjenama primjenjuje se hikvadrat test i jedina je razlika u tome to test-statistici
(9.1), koja se prib1ino ravna 0 hikvadrat distribuciji, stuparij slobode smanjuje I umjesto v — 1uzirna se da je r — 1 — 1, gdje je 1 broj nepoznatih parametara koje smo zamijenili njihovimocjenama na osnovi uzorka. Tako za kritienu vrijednost, za danu razinu znaëajnosti , nalazirnoiz odgovarajuee tablice pod brojem stupnjevaslobodejednakim r—l—1, tj. za kritienu vrijednostuzima Se broj x_1._1
Napomena. Neki autori za ovaj test umjesto test-statistike napisane u obliku (9.1) koristezapis (/t&)2, pa je _1 = f Tn se smatra da svakom razredu Rk pripadajudvije frekvencije: empirijska fk i teorijska ftk.
9.2. Neparametarski testovi
Primjer 11. Igraéa kocka baeena je n = 100 puta. Dobivene su frekvencije registrirane utablici:
Ixkl 1 2 5 61flkI22 16 22120 8 12
Na nivou znaeajnosti a = 0.05 testirati hipotezu H0 da je igraéa kocka pravilna.
Ad. Ovdjejem=100,r=6,Rj={1},R2={2},R3={3},R4={4},&={5}, n= {6}, frekvencije k dane su u gornjoj tablici. Treba testirati hipotezu
1C
6
prema alternativnoj hipotezi
H1 : s ishodi nemaju istu vjerojatnost .
Slijedom hikvadrat-testa odredujemo:
6 2 6 12 6 2—2
—VTh@k—npk) _(nk—1O0x)
—50
Xs — L flpk f 100x —giThk1
= 0.06 [(22 — 16.67)2 + (16— 16.67)2 + (22— 16.67)2 + (20 — 16.67)2
± (8— 16.67)2 + (12— 16.67)2]= 9.92,
a iz odgovarajuée tablice nalazimo kritienu vrijednost Xo.os = 11.070.Kako je y < Xoos, uzeti uzorak ne proturjeëi hipotezi H0, tj. dani podaci ne upuéuju na
znaëajne nepravilnosti igraée kocke.
Primjer 12. U uzorku od m = 200 sijalica pokazalo se da je 106 sijalica sijalo do 100 sati,55 u intervalu [100,200), 23 ii [200,300), 9 u [300,400), i 7 sijalica je sijalo 400 i vie sati. Narazini znaajnosti a = 0.01 testirati hipotezu H0 da obilje±je X koje predstavlja duinu trajanjasij alica ma eksponencijalnu distribuciju Ex (0.01).
Ad. Ovdje imamo: n = 200, r = 5, R1 = LU, 100), .1?2 = [100,200), .R3 = [200, 300),H4 =[300,400), R5 =[400,+oo), n = 106, n2 = 55, n3 =23, n4 = 9, ti5 =7.
Nadaije, eksponencijalna distribucija Ex (0.01) odredena je £unkcijom gustoée
10, x<0,f (x) =o.O1c001, x � 0,
100 100
p1 = P0 (0 <X < 100) = ff (x)dx = f0.01e_001dx = _e_001z’j = 1—c1 = 0.6321,0 0
0
A
9. Testiranje parametarskih hipoteza
200p 200P2 = PH, (100 � X < 200) = J 0.01&OXdx = _&0d1x = — = 0.2325,
100100
300= PH0 (200 < X <300) = = — = 0.0855,
200400
p4 = (300 X < 400) = = — = 0.0315,300
= 1— (Pi +732+733+734) = 0.0184.
Podatke testa moemo prikazati I tablicom:
k 1 2 3 4 5Rk [0,100) [100,200) [200, 300) [300,400) [400, +oo)
106 55 23 9 7
I 73k 0.6321 0.2325 0.0855 0.0315 0.0184[20073k 126.42 46.5 17.1 6.3 3.66
Sadaje
5 2—2
—flk200pk)
Xs—i —
k—i
(106— 126.42)2 (5546.5)2 (23 — 17.1)2 (9— 6.3)2 (7— 3.68)2126.42 + 46.5 + 17.1 + 6.3 ± 3.68
= 11.040.
Iz odgovarajuée tablice ãitamo kritienu vrijednost:
X,o.oi = 13.277.
Kako je to na OSflOVU uzorka nemamo razloga odhaciti hipotezu Ho
Primjer 13. Neka obiIjeje X predstavlja broj telefonskih poziva u telefonskoj centrali uintervalu od 10 sekundi. Koristeéi hikvadrat-test, in nivou znaëajriosti 1% testirati hipotezu H0da sluaajna varijabla X ima Poissonovu distribuciju. Izvreno je ii = 100 brojanja telefonskihpoziva koji u intervalu duine 10 sekundi pristi2u u telefonsku centralu i dobiveni su podaci:
Broj telefonskih poziva 0 1 2Broj mjerenja 53 31 11 3j 2
Ad. Poissonova distribucija P (A) odredena je parametrom A koji je nepoznat, pa ôemo gazamijeniti ocjenom na osnovi uzorka:
1 100A Zi00 = = (53 x 0+31 x 1-i- U x 2+3 x 3+2 x 4) =0.7.
Za skupove Rk, k = 1,2,3,4 uzmimo:
212 9.2. Neparametarski testovi
s frekvencij amafli = 53, = 31, fl = 11, n4 = 5
Kako je hipoteza H0 da je X ‘-.‘ 7(0.7), to je:
Pi = = 0.497,
P2 = 0.348,
= =
= 1 —(p’ +P2 +p3) = 0.034.
Sadaje p.
= = (Thk— 10Q)2
= 1.480,
dok je kritiena vrijednostX,o.ai = 9.21.
Kako je < Xoo,, ostvareni uzorak ne proturjeãi hipotezi Ha te je prihvaéamo.
Primjer 14. Pomoéu hikvadrat testa ispitati suglasnost podataka:
Xk 0 1j2 34 U11 18j15 5 1
s binoim zakonom distribucije na 5% nivou znaãajnosti.
Ad. Ovdjeimamo: it = 50, r = 4, R1 = {0}, It2 = {1}, IL3 = {2}, IL4 = {3,4}. Zanepozuati parametar p uzet éemo
= x (11 x 0+18 x 1+15x 2+5 X 3+1 x 4)= X 1.340.335, rpa je H0 hipoteza da obiljeje X irna distribuciju B (4, 0.335). Stoga je
Pk = 0.335’ x 06654—k+1 k = 1,2,3,4 i
= 0.665 = 0.196, P2 = 4 x 0.335 x 0.665 = 0.394, UPS = 6 x 0.3352 X 0.6652 = 0.298, ps = 1 (Pi +732+733) = 0.112.
Sadaje
= = jjn ;o2 = 0.325,
dok je kritiena vrijednost2 .....X2,o.o5 — U. 1.
pIi
9. Testiranje parametarskih hipoteza 213
Kako je <Xooi, ostvareni uzorak ne proturjeëi hipotezi H0.
Prin,jer 15. Neka X predstavlja broj automobila koji u intervalu od 5 sekundi produ krozodredeni presjek autoceste. Izvreno je n = 333 brojanja automobila koji u intervalu duine 5sekundi produ kroz odredeni presjek autoceste I dobiveni su podaci
Broj automobila 0 1 2Broj mjerenja 128 93 72 35 4 1
Testirati hipotezu H0 da obiljeje X ima Poissonovu distribuciju P (A), na razini znaëajnostia = 0.01.
Ad. Za nepoznati parametar A uzet óemo333
A=333=__Zxk=(128x0+93x 1+72x2+35x3±4x4+1 x5)= 1.09.
Dakie, treba testirati hipotezu H0 daje X 2 (1.09). Za skupove Rk, k = 1,2,3,4,5 uzmimo:= {0}, R2 = {1}, 1?3 = {2}, .F?4 = {3}, li5 = {4,5,...}, pajeni = 128, = 93, n3 = 72,
it4 = 35, it5 = 5. Dalje, imamo:
Pk = (k — fl!ek = 1,2, 3,4, 1— (P1 +P2 +ps +p4),
P1 = 0.336, P2 = 0.366, p = 0.200, 734 = 0.073, p = 0.025.
Sadaje—2 __2_-’@k33373k)X5—1—1 — X3 — L1 333Pkk=1
—(128— 111.888)2 (93— 121.878)2 (72 — 66.6)2 (35— 24.309)2 (5 — 8.325)2
— 111.888 + 121.878 + 66.6 + 24.309 + 8.325= 2.320 + 6.842 + 0.438 + 4.702 + 1.328 = 15.63
Kritiëna vrijednost je = 11.345.Kako je > Xo.oi’ to na osnod uzorka ne moemo prihvatiti hipotezu Ho.
Iz danih primjera vidimo da u primjeni hikvadrat testa koristimo test-statistiku (9.1) usvakom primjeru nezavisno o distribuciji obi1jeja X koju testiramo. Stoga, kako smo i napomenuli,hikvadrat-test je neparametarski test.
9.2.2. Testiranje nezavisnosti
Za prouëavanje nekih pojava nije dovoljno promatrati samo jednu veliãinu (jedno obi1jeje), negoje potrebno simultano promatrati vie veliina.
Razmotrimo problem vezan za dva statistiëka obi1jeja X i Y. Pokazat éemo ukratko kakose hikvadrat-test moe primjeniti na testiranje hipoteze H0 da sit dva promatrana obi1jeja Xi Y nezavisna, protiv alternativne H1 da nisu nezavisna. Neka su u n—terostrokom ponavijanju mjerenja, odnosno opaanja odredene pojave, obiljeje X poprimi r razlieitih vrijednosti
214 9.2. Neparametarski testovi
{x1, x2,..., a obi1jeje Y poprimi s razlieitih vrijednosti {yl,y2 ,v}. Neka uredenom- -
paru (xi, y) pripada frekveneija n. Prema tome, za niz statistiekih podataka
(x1,y1), (z1,y2) , . . . (xr,ys)
moe se formirati pripadna tablica frekvencija koja se obieno zove kontigencijska tablica:
X\Y Yi 712 Ys Zx1 flu n12 fl18 mj:12 n21 n22 n25 m
Zr ri r2 Thrs m5
I2 I...Brojevi xi, :12,” ,Xr, odnosno yi, 712,- , Ys obieno su poredani po velieini kao:
Xi<Z2<”<Zr, Y1<Y2<”<Ys.
Frekvencije n13, m i n su cijeli brojevi i vrijedi:n
= njj , i=1,2,•• ,r,
= njj , j=1,2,”,s, Li= = = YZni [1:
i=ij=1 i=1 j=l
Ako stavimo da je: UPij = P(X=z,Y=y), r
= P(X=x), i=1,2,-- ,r, Iiqj = P(Y=y), j=1,2,-•- ,s,
tada je nul-hipoteza
Ho:p=pq,
a alternativna hipoteza je
H1 :pjj bar zajedno i, j. [iPokazuje se da kada je rz veliko, uz pretpostavku da je Ho toèna, vrijedi prib1ino,
r S 2 UXr-l).(sl) =
. n)
F’
9. Testiranje parametarskih hipoteza 215
gdje nj, m, n shvaOamo kao slueajne varijable, jer ti brojevi na slueajan naëin variraju odjednog do drugog uzorka. U uzetom uzorku to su brojevi I statistika r-1)-(s—1) uzima vrijednost
X(r_fl.(s_1) koji usporedujemo s kritiënom vrijednoãu Xr_l).(s_l),a
Ako je Xr—1)(s—1) � Xr—x)-(s_ij,a onda, na nivou znaëajnosti , hipotezu H0 o nezavisnostiX i Y odhacujemo, a ako je 1)(si) < Xr_l).(s_l),e , onda na osnovu uzetog uzorka nemarazioga odbaciti H0
Primjer 16. U jednom razredu od 30 ueenika promatra se ocjena iz matematike (obiIjejeX) i ocjena iz fizike (obi1jeje Y). Rezultati uzorka dani su u kontingencijskoj tablici:
X\Y 1 2 3 41 2 1——— 32 162—— 93
—
4 7 1 — 124 — 1 3 — 45 — — — — 2 2Z 3 11 10 4 2 30
Testirati hipotezu o nezavisnosti ocjena iz matematike i fizike s razinon znaëajnosti = 0.01.
Ad. Ovdje imamo:
55 2—2
——2
—1 —çm(30.nj —mnj)
3(4.4 —X16— fl.2
1 (60 9)2 (30— 33)2 (30— 27)2 (180— 99)2 (60— 90)2 (120— 132)29 + 33 + 27 + 99 ÷ 90 + 132
+(210_120)2
+(30_48)2
+(3040)2
+(90_16)2
+(604)2
120 48 40 16 4= 50.15
X?6,o.ol = 32.00
Kako Je ?6 > X6,o.o1 hipotezu H0 o nezavisnosti X I Y odbacujemo, tj. ocjene iz matematikei fizike nisu nezavisne.
9.2.3. Kolmogorov-Smirnovljev test
Kolmogorov-Smirnovljev test (KS-test) je neparametarski test znaajnosti a primjenijiv je samou slueaju kada obi1jeje X ima kontinuiranu funkciju distribucije vjerojatnosti F (x). Ovaj testzasniva se na usporedivanju funiccije distribucije vjerojatnosti F (x) s empirijskom iii uzoraekomfunkcijom distribucije Fn (z), koju smo ranije definirali.
Podsj etimo ukratko.Neka su vrijednosti ostvarenog uzorka obima n obi1jeja X poredane u rastuéi niz, tj. var
ijacijski niz: x1 < x2 � S . Tada se pripadna empirijska funkcija distribucije definira
216 9.2. Neparametarski testovi
kao1 0, zax<x1,
F71(x)= , zaxk�x<xk+l,1�k�m—l,I 1 zax�x71.
Dakie, to je stepenasta funkcija koja u svakoj toeki xk, k = 1,2,... ,n, ima skok velieine .
Ako se broj xl, javija mj, puta, tada funkcija F71 u toeki Xk ima skok flk x
*= f. Empirijska
funkcija distribucije F71 (x) aproksimira funkciju distribucije F (x) = F (X � x) slueajne varijableX i aproksimacija je to boija to je dimenzija uzorka it veéa.
Funkcija F71 (x) ovisi o slueajnom uzorku (X1, X2 X71) i moe se shvatiti kao vrijednostpripadne statistike:
P “i’ brqj X-ova koji su <x ]R71
, . pi .
Empirijska funkcija distribucije F71 (x) kao statistika moe se smatrati procjeniteljem zanepoznatu funkciju distribucije F (x). Funkcija F71 (x), kad it —* , konvergira funkciji F (x),tj. vrijedi
urn F(x) = F(x)fl—boo
i to uniformno p0 x. Ovu tvrdnju daje slijedeéi teorem, poznat kao fundamentalni teoremstatistike (dokaz u [5J). S
IiTeorem. (Guivenko-Cantelli) Neka je (X71, it e N) niz nezavisnih, jednako distribuiranibsluèajnih varijabli sa zajedniekorn fimkcijom distribucije F i neka je F71 empirijska funkcijadistribucije bazirana na uzorku X1, X2,... , X71 (it C N). Tada vrijedi
P[lim (suPin@)_F(x)t=o =1. nL— XCa I LUpravo ovaj teorem daje pozitivan odgovor na pitanje: moe ii uzorak dati potpunu infor
maciju o distribuciji obi1jeja? U
Ovdje se promatra statistika
D71 =supP(x) -F(x) (9.2)
poznata kao Kolmogorov-Smirnovljeva statistika, a njena distribucija poznataje kao KolmogorovSmirnovljeva distribucija. Za zadani a iz odgovarajuoe tablice moe se odrediti broj D71,0 premauvjetu:
Fo (D71 � D71,0) = a. (9.3)
Testirajmo nul-hipotezu H0 da obi1jeje X irna odredenu funkciju distribucije F (x), kojaje kontinuirana. Za zadanu razinu znaëajnosti a kritieno podrueje KS-testa odreduje se natemeiju test-statistike (9.2) kojoj, pod uvjetom da je hipoteza H0 toãna, pripada odgovarajuoadistribucija vjerojatnosti koja ne ovisi o funkciji distribucije F nego samo o velieini uzorka it. pU.
rU11
9. Testiranje parametarskih hipoteza 217
Iz odgovarajuée tablice eitamo kritienu vrijednost Dma prema uvjetu (9.3) 1 usporedujemoje s uzoraekom vrijednoéu D koju je uzela statistika D za ostvareni uzorak (Ii, 12,. . ,
tj.D= sup IFfr)—F(x)I. (9.4)
zEit
Ako je D � Dna hipoteza H0 se odbacuje, a ako je D < nema razioga da se natemeiju ostvarenog uzorka odbaci hipoteza H0.
Ako se hipoteza H0 odnosi na distribuciju s neodredenim parametrima, tada te parametremoemo zamijeniti pripadnim ocjenama na osnovu ostvarenog uzorka.
Primjer 17. Neka su za obilje2je X u n = 10 mjerenja dobiveni slijedeéi podaci poredanip0 velieini:
10.0, 12.2, 13.5, 14.8, 15.1, 15.3, 15.6, 16.1, 17.0, 18.0.Na razini znaäajnosti a = 0.05 testirati nul-hipotezu da je X r..’ N (15, 4)
Ad. Funkeija distribucije je
x—15 05— 1&) <isF(x)=PHO(X<x)=F(Z< 2 ){ o.s+(), x>15.
Rezultate raëuna u danom nizu vrijednosti za x = x prikazujemo u tablici:
x J 10.0_ 12.2_ 13.6. 14.8 15.1_ 15.3 156... 16.L. j 17.0_ 18.0_F10 (x) 1 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9F (x) 0.006 0.081 0.227 0.460 0.520 0.560 0.618 0.709 0.841 0.933
LI?io (x) — F (x)I 0.006 0.019 0.027 0.160 0.120 0.060 0.018 0.009 0.041 0.033
Na slici 9.5. ilustrirani su grafovi funkcija F I F10. Lako je zapaziti da se supremurn odstupanja na osnovu uzorka definirano s (9.4) ostvaruje u nekoj toëki x iii u xj... (F (x_)limP10 (x)). Iz tablice vidimo da je uzoraako odstupanje najveée u 148... i iznosi:
Dio = sup IFio (x) — F (x)I = IF10 (14.8_) — F (14.8_)I = 0.3— 0.4601 = 0.160.xCL
Sa slike se vidi da je neto manje odstupanje u toãki 12.2 koje iznosi (F10 (12.2) — F (12.2)1 =
(0.081 — 0.2( = 0.119Iz odgovarajuee tablice nalazimo kritiënu vrijednost: D103.35 = 0.409.Kako je D10 < D10005, zakljueujemo da s nivoom zna&jnosti a = 0.05 hipotezu H0 treba
prihvatiti.Primjer 18. Testirati hipotezu H0 da obilj&.je X ima normalnu distribuciju N (11, 3.61)
ako su a n = 8 mjereuja dobiveni slijedeéi podaci poredani po velieini:
10.0, 10.6, 11.8, 12.9, 13, 13.2, 14.3, 15.
Ispitivanje izvesti na 5% nivou znaëajnosti.Ad. Funkcija distribucije je
F(x)=PHO(X<x)=P(Z< x—lflx�1i
1.9 ,, o.s+(), x> 11.
218 9.2. Neparametarski testovi
Fio(x)
F (x)
/0
0 10 12.2 13.5 14.8 16.1 17 18 X
n
Slika 9.5. Ii
Rezultate raëuua dajemo u tablici:
10.0_ 10.6— 11.8— 12.9_ 13 13.2_ 14.3 15_ 15F8 (x) 0.000 0.125 0.250 0.375 0500 0.625 0.750 0875 1.000F (x) 0.302 0.417 0.663 0.841 0.853 0.877 0.959 0.983 0.983
IF8 (x) — F(x)I 0.302 0.292 0.413 0.466 0.353 0.252 0.209 0.108 0.017
Tz tablice se vidi (zapaa se i sa slike 9.6.) da se supremurn odstupanja na osnovi uzorkaostvaruje u 12.9_ i da iznosi 0.466, pa je
= sup jF8 (x) — F (x)I = IF8 (12.9_) — F (12.9_)I = 10375 — 0.8411 = 0.466.xCR. [S
Iz odgovarajuee tablice za KS-test, putem interpolacije, rialazimo kritiënu vrijednost: D50.05 =
0.471.Slijedi zakljuaak: kako je D8 < D8005, to na osnovi uzorka nema razioga da hipotezu H0 U
odbacimo.n
Primjer 19. Vijek trajanja jedne vrste stroja mjeren je na uzorku od ii = 60 i dobiveni su Uslijedeéi rezultati:
Vijek trajanja (god.) 0.5 1 1.5 2 2.5 UBrojstrojeva 11 2411312 6 INa nivou znaëajnosti 1% testirati hipotezu da je vijek trajanja slueajna varijabla s eksponenci- fljalnom distribucijom. U
Ad. Prvo zapazimo da parametar a eksponencijalne distribucije Ex (a) nije poznat, pa éemoga zamijeniti ocjenom na osnovi uzorka:
xo 1.33
iiLI9
9. Testiranje parametarskih hipoteza 219
F8(x)
F(z)
0
____
1J id. 11.8 14.3 1
Slika 9.6.
Dakie, testiramo hipotezu H0 x Ex (0.75), odnosno testiramo hipotezu Ho da se obi1jejeX ravna p0 distribuciji s funkeijom distribucije
F(x)=FHO(X�x)={ Ze_75x O�z<+.
Za odredivanje uzoraakog odstupanja dajemo izraëun u tablici:
x 0.5._ II 1.5— 2_ 2.5_ 3 3F6 (x) 0.000 0.183 0.583 0.800 0.833 0.933 1.000F (x) 0.313 0.528 0.675 0.777 0.847 0.895 0.895
Fe (x) — F (x)l 0.313 0.345 0.092 0.023 0.014 0.038 0.105
Slijedi, D60 = 0.345, a iz odgovarajuée tablice za KS-test nalazimo kritienu vrijednostD60,o.01 = 0.207.
Kako je > D60001, to na osnovi uzorka hipotezu Ho odbacujemo.
9.2.4. Testiranje jednakosti distribucija
KS-test mo2e se primjeniti I u slueaju kada e1imo testirati hipotezu
H0 : obi1jeja X i Y imaju istu (kontinuiranu) funkciju distribucije
protiv alternative H1 da nemaju istu distribuciju.Nekaje F,1 (x) empirijska funkcija distribucije obi1jeja X na osnovi uzorka (Xi, X2,. . . ,
i F (x) empirijska funkcija distribucije obi1jeja Y na osnovi uzorka (1”, Y2,.. . ,
220 9.2. Neparametarski testovi
Pokazuje se da je tada= sup (x) - P,: (x)
nitn2 xER
pa se moe priitjeniti test znaëajnosti.
Primjer 20. Proniatra se potronja vode u u dvjema grupama domaOinstava u jednomperiodu od 10 dana. Iz prve grupe registriran je uzorak obima n1 = 65 i iz druge obim uzorka
= 57. Podaci o potronji vode zajedno s F,:1 (x_), F,: (x_) I F,:1 (x_) — F,: (x_) prikazanisu u tablici:
i1Broj Prva grupa Druga grupa F,:1 (x_) F,: (x.) (x_) — F, (x_)(
1 0 4 0.000 0.000 0.0002 0 2 0.000 0.070 0.070 RI3 3 1 0.000 0.105 0.105 U4 2 1 0.046 0.123 0.0775 3 2 0.077 0.140 0.063 RI6 5 4 0.123 01.75 0.052 U7 7 5 0.200 0.246 0.0468 5 6 0.308 0.333 0.0259 9 7 0.384 0.439 0.055
10 8 2 0.523 0.561 0.03811 5 3 0.645 0.596 0.049 012 5 3 0.723 0.649 0.074 U13 0 1 0.800 0.702 0.09814 1 4 0.800 0.719 0.08115 2 0 0.815 0.789 0.02616 1 4 0.846 0.789 0.05717 6 2 0.861 0.860 0.00118 1 0 0.954 0.895 0.05920 2 1 0.969 0.895 0.07422 0 1 1.000 0.912 0.088 023 0 3 1.000 0.930 0.070 U24 0 1 1.000 0.982 0.018
> 24 0 0 1.000 1.000 0.000 0UNa razini znaëajnosti a = 0.01 testirati nul-hipotezu H0 da dva obi1jeja X i Y imaju istu
funkciju distribucije.
Ad. Iz gornje tablice nalazimo uzoraeko odstupanje: L
= sup F,:, (x_) — F,: (x_)I = 0.105.n1+n2 xea
Za a = 0.01 iz odgovarajue tablice ëitamo kritiënu vrijednost D “1 n a = = 0.2898.n14-n2’ I
Prema tome ovi uzorci ne proturjeëe hipotezi da je distribucija potronje vode ista u obegrupe domaéinstava.
nUULi
10. Regresija na osnovu uzorka
Regresijorn se iskavije ovisnost jedne slueajne varijable o drugoj iii vie slueajnih varijabli. UPoglavlju S regresiju smo definirali kao uvjetno matematieko oeekivauje E (YIX x) koristeãirazdiobu dvodimenzionalne sluãajne varijable (X, Y). Medutim, akoje razdioba nepoznata, ondatie moemo odrediti uvjetno oaekivanje. U torn suëaju ovisnost slueajne varijable Y o x odredujemo na osnovu uzorka. Fri tome koristi se metoda najmanjih kvadrata.
10.1. Metoda najmanjih kvadrata
PrincIp metode najmanjih kvadrata postavio je njemaki matematiëar Gauss 1795. godine prilikom izuëavanja kretanja nebeskib tijela, to je objavio 1809. godine. Francuski matematiãarLegendre 1805. godine prvi je publicirao postupak metode najinanjih kvadrata.
Ovdje dajemo jedan moguéi opis metode najmanjih kvadrata, koja ima iroku prirnijenu.Metoda najmanjih kvadrata (MNK), u pravilu, primijenjuje se na prib1ino rjeavanje pre
odredenih (predimenzioniranih) sustava jednadbi, tj. sustava koji irna vie jednadthi negonepoznanica.
Neka je u pitanju preodreden sustav linearno nezavisnih jednadthi, oduosno uvjeta,
f(tl,t2, ,tm)0, i=1,2,-•. ti, n>m, (10.1)
gdje su f C C2 (JR”t) odredene funkcije, a t1, 22,--- ,tm nepoznanice sustava.Buduéi da gustav (10.1) ima vie jednadThi nego nepoznanica, on nema toèno rjeenje, tj. ne
postoji uredena ti—torka (ti, t2,.-. ,tm) koja zadovoijava sustav jednadbi (10.1) (sve jednadbesustava). Stoga treba odrediti onu uredenu n—torku (t, 2,... , t,) koja ée, u odredenom smislu,biti najbolje prib1ino (aproksimativno) rjeenje sustava (10.1).
Za odreden izbor (t, ta,- .., t) sustav (10.1) postaje:
,t) E, i= 1,2,.-. ,n , (10.2)
gdje su e, i = 1,2,-. ti, odstupanja lijevih strana jednadbi ovog sustava od nule, odnosnoe, i = 1,2,--. , n, su pogreke koje se ëine ako se za rjeenje sustava (10.1) uzme (t, t,--- , t)
Ideja metode najmanjih kvadrata je da se nepoznanice 21, t2,-.- , sustava (10.1) nalaze izuvjeta da zbroj kvadrata lijevih strana tog sustava (odnosno zbroj kvadrata pogreaka)
H(t1,t2,... ,tm) Zft1,t2, ,tm) (10.3)
221
222 10.1. Metoda najmanjih kvadrata
bude minimalan, tj. iz in uvjeta
1 ÔHti,t2,”,tm)=0, k=1,2,•••,m, (10.4)hutk
to ãini m jednadbi s in nepoznanica t1,t2,..
,tm) ,t = 0, k— 1,2, ,m (10.5)
Uvjeti (10.4) su nu2ni uvjeti za ekstrem funkeije H, a u slueaju kada so radi o jedinstvenomrjeenju, obzirom na oblik funkcije H, to su ujedno i dovoljni uvjeti za minimum funkeije II.
Ako su sve funkeije f, i = 1,2,.• , n, linearne p0 svim nepoznanicama ±1, t2, , t7fl tadaje i sustav jednadThi (10.4), odnosno (10-5) , linearan jima jedinstveno rjeenje za koje funkcijaH postie minimum.
Rjeenje ,t) sustava jednadthi (10.4), odnosno (10.5), (slueaj kada so radi ojedinstvenom rjeenju) je najbolje aproksimativno rjeenje u smislu metode najmanjih kvadrata,odnosno to je rjeenje za koje je suma kvadrata pogreaka sustava (10.2) minimajna. Za rjeenje(t, , t) kae se da je MNK-rjeenje sustava jednadbi (10.1) i vrijedi
(t1, t2,... , t) = (t, , t). (10.6)
Primjer 1. Naéi aproksimati-vno rjeenje sustava od ëetiri jednadbe s fri nepoznanice
= 2, 11= 1, (10.7) U
t1+t2+t3 = 2,1+2+3. LI
Ad. Sustav jednadbi (10.7) moemo napisati u obliku p
t1—t2+t3—2 = 0, Ut3—i = 0, (10.8)
= 0, U4t142t2+t3—3 = 0.
Funkcija zbroja kvadrata pogreaka H je
H(t1,t2,t3) = (t1 — t2 + t3 — 2)2 + (t3 — 1)2 + (ti +t2 +t3 — 2)2 + (4t1 + 2t2 + t3 — 3)2 11ii..Za odgovarajuéi sustav (10.4) dobivamo
p9t1+4t2+3t3 = 8, 114t1+3t2-f-t3 = 3,3t1+t2+2t3 = ‘, El
Ii,U
10. Regresija na osnovu uzorka 223
ëije je rjeenje= 0.5, t2 = —0.1, t3 = 1.3,
to je, u smislu metode najmanjih kvadrata, najbolje aproksimativno rjeenje sustava jednadbi(10.7), odnosno (108), a odstupanja (pogreke)
= —0.1, c 0.3, s = —0.3, e4 = 0.1
I zbxoj kvadrata pogreaka je
Zapazimo da iz prve tn jednadbe sustava (10.8) dobivamo rjeenje
tl=1, t2=0, t3=1,
dok se za ëetvrtu jednadthu ëini pogreka e’ = 2, paje, u ovom slueaju, zbroj kvadrata pogreaka
= 0+ 0*0 +4 = 4,
to je 20 puta veée od 0.2,
10.2. Opel zadatak regresije in osnovu uzorka
Neka imamo it parova mjerenja (odnosno ostvaren uzorak)
(x1,y1), (x2,y2) . .., (z,,yn), (10.9)
gdje su x1, x2,... , ulazne vnijednosti nezavisne varijable x (neslueajne), a yi, Y2, , y, Suizmjerene (pripadne izlazne) vrijeduosti slueajne varijable Y.
Na primjer, ispituje se ovisnost potronje elektriene struje o dobu dana. Potronja strujemoe da se mjeri u jednakim vremenskim razmaoinia (recimo svakib 10 minuta) x1, X2,• , X, itake se dobiju vrijednosti (izmjerene vrijednosti) yi, y2,’ , y,. Dakie, x je nezavisna varijablaza koju se jó I kae da je koñtrolir&na (a ne sluéajna) varijablä. U ôom pnimjeru x ozriaëavavrijeme mjerenja, a Y potronju struje U ovisnosti 0 vremenu z.
Nizu uredenih parova (10.9) u xy—ravnini odgovara dijagram rasprenja. Na osnovu oblikadijagrama rasprenja moe se zapaziti oblik aproksimativne krivulje oko koje se grupiraju toãke(10.9). Neka je odabran matematiëki model regresije
Y=p(x,al,a2,’..,am)+a, m<n, (10.10)
gdje je ji odredena funkoija koja se zove regresijska funkcija koja ovisi o nezavisnoj varijabli xi o nepoznatim parametrima a1,a2,• ,am, a eje slueajna varijabla (sluajna pogreka) koja seravna po normalnoj razdiobi N (o, c2) s nepoznatim parametrom a2, tj. E (e) = 0, D (e) = a2.Model (10.10) naziva se regresijski model, a ëesto i empirijski model. U praksi u praviluje m << it, tj. broj parametara m je znaãajno manji od broja dimenzije uzorka it, na primjerm = 2, it = 100.
224 10.2. Opel zadatak regresije na osnovu uzorka
Zapazimo da zä SluCajhu varijablu Y, kojaje definirana (10.10), vrijedi
E(Y) = p(x,al,a2, ,am),
D(Y) = a2.
Na temelju niza mjerenja (10.9) treba odrediti vrijednosti nepoznatih parametara a1, , amza koje pripadna krivulja, od svih krivulja uzetog oblika, u odredenom smislu, najbolje aproksimiraniz toeaka (10.9). Za niz mjerenja (10.9), prema modelu (10.10), uzimamo
yi=/L(xi,al,a2,.,am)+ei, i=1,2,•,n,
gdje su e, i = 1,2,•• ,n, nezavisne sluOajne varijable (sluaajne pogreke) koje se ravnaju p0istoj normalnoj razdiobi N (0, a2).
Za odredivanje proejena nepoznatih parametara a1, a” ,a i a2 i za definiranje odgovarajuéih procjenitelja koristi se metoda najmanjih kvadrata. To znaëi da proejene a1, , a,nepoznatih parametara a1, - ,am, treba odrediti tako da vrijedi [j
— (x,a1,a2,”- ))2 = — ,am))2, IItj. iz uvjeta o minimumu funkcije
odnosno iz iivjetabH-—---(ai,- ,am)=0, k=1,2,•-- ,m. (10.11)c/ak rRjeenja ovog sustava jednadbi Sn traene procjene nepoznatih parametara U
ak=ak, k=1,2,... ,m. (10.12)C
Za veheine ak, k = 1, 2,-- , in, kae se da su dobivene kao MNK-procjene nepoznatth regresijskthkoeficijenata ak, k = l,2,•. , m, odnosno da su ak, k = 1,2,... , in, MNK-procjene parametara LÀa, k=1,2,-.- in.
Na osnovu rjeenja (10.12) za sluãajni uzorak
(xi,Yi), (x2,Y2), ..., (10.13)—
ridefiniraju se pripadni procjenitelji Ak, Ic = 1, 2,-• , in. Slueajne varijable UYj=(xj,ai,a2,..,am)+sj, i=1,2,•.,n
su rnedusobno nezavisne, au ne nuno i sa zajedniëkom razdiobom vjerojatnosti. Medutim, ako 11so pretpostavi da su sluàajne varijable e, g2, ... s, nezavisne i sa istom razdiobom N (0, u2),tada se mogu dobiti prikiadni procjenitelji za nepoznate parametre aj, k = 1, , in i cr2. rU nastavku ôemo dati postupke odredivanja nepoznatih parametara u odredenim regresi- LIjskim funkcijarna u smislu metode najmanjih kvadrata. Posebno su zanimijivi slueajevi kadaje regresijska funkcija linearna po nepozuatim parametriina iii se odredenom transformacijommoe linearizirati. U ovim slucajevima odgovarajuCi sustav jednadthi (10.11) je linearan sustav Uod in jednadbi s in nepoznanica a1, a2,••- ,am koji ima jedinstveno rjeenje koje se jednostavnonalazi.
ii
10. Regresija na osnovu uzorka 225
10.3. Linearna regresija
Pretpostavimo da irnamo niz mjerenja (10.9) i neka dijagram rasprenja pripadnog niza toëakaupuéuje na model linearne regresije
s linearnom regresijskom funkcijom p (x, a, b) = ax + 6. Dakie, u ovom slueaju koristimo regresijsku funkciju
y = ax + 6, (10.14)
gdje su a i b nepoznati pararnetri koje treba odrediti tako da dobijemo pravac koji od svihmoguôih pravaca, u smislu metode najmanjih kvadrata, najbolje aproksimira niz toaka (10.9).
Za niz rnjerenja (10.9), prema (10.14), imamo
y—ax+b+e, i=1,2,...,n.
Zapazirno da razhkei= 1,2,...,n (10.15)
predstavljaju vertikalna odstupanja toëalca uzorka (xj,yj), I = 12,.. ,n, od pravea (10.14)(slika 1).
y,=ax+b
5€(xj,y1)
I
0 x1 x
Slika 10.1.
Sada odredimo parametre a i 6 tako da zbroj kvadrata vertikalnih odstupanja (10.15) budeminimalan, tj. odredimo vrijednosti parametara a 1 5 za koje funkoija
11
postie minimalnu vrijednost. (Ovo je postupak metode najmanjih kvadrata).Funkoija H ima minimum za one vrijednosti a I 6 za koje je
-0 -028a ‘ 285
IUn
226 10.3. Linearna regresija
to daje sustav jednadbi
= 0,
= 0.
Prema tome, parametre a i b odredujemo iz sustava dviju Iinearnih jednadbi (to su gornjejednadibe uredene po a i b)
(2) a+ = Xij,
=
Jedinstveno rjeenje ovog sustava jeclnadthi je
—
(if).a — a—
/ \2iç’ 2 1 V’ .
i=1 \ i=1 /
6 = b=!Zyj_a.*Zxj.
Zapazimo da u izrazima za a I b imamo srednje vrijednosti72 72_.1
Xz—Xj, YZYi
pa se moe pisati
(10.16)
1=1
[J)a = (10.17)
= —.=[1 —±)]m7 (10J8)
gdje je
= E(xi_)2=>4_±2, U=
[I
10. Regresija na osnovu uzorka 227
Zaista, za zadnju formulu vrijedi
=
nh1nn=
1 -=
Dakie, regresijski pravac y = ax + b, in osnovu uzorka (10.9) procjenjuje se pravcem
y = ax+b odnosnoszy =
koji se takoder zove regresijski pravac.
Zapazinio da se dobivena formu’a za regresijski pravac podudara s odgovarajuéom formulom(u Poglavlju 5) regresijske funkcije sluëajne varijable Y s obzirom na X kao uvjetno oeekivanjeE (YX = x) u slueaju kada sluëajna varijabla (X, Y) ima zajednieku normalnu razdiobu. Ovoje znaëajno svojstvo normalne razdiobe. Vrijedi slijedeéi stai’.
Regresijska funkcija je regresijski pravac oblika
E(Y)X=x)=
ako i samo ako s1uajna varijabla (X, Y) ima zajednieku dvodimenzionalnu normalnu razdiobu.Regresijski pravac irna sn-usia formirati i ii slueaju kada se zna da zajedniaka razdioba nije
non-n-ama. U ovom sluëaju dobiva se pravac koji od svih moguêih pravaca, u smislu metodenajmanjih kvadrata, najbolje opisuje zavisnost izrnedu Y i x na osnovu danog uzorka.
10.3.1. Proejene I intervali povjerenja u modelu linearne regresijePolazeêi od slnëajnog uzorka (10.13), prema (10.17) (10.18), za nepoznate parametre a i bimamo procjenitelje
A = (10.19)
= a[1_3(X_] (10.20)
dok za parameter a2 procjenitelj je
2= (10.21)
228 10.3. Linearna regresija Li
Ovi procjenitelji su funkcije slueajnog uzorka (10.13) i kae Se da su to procjeniteljismislu metode najmanjih kvadrata iii MNK-procjenitelji.
Kako jeYj=ax1+b+e1, e1riN(0,u2), i1,2, ,n,
E(Y)=ax+b, D()=D(s)=a2, i=1,2,••,n,
xrrijedi PYjr.N(ax+b,u2), i=1,2,••• ,n
i kako su Yj (i = 1,2, , rt) nezavisne sluëajne varijable to je
E(A) = -E =--E [_ab:ei]
= {E[az(xi_±)xi] +E[bz@_±] +E{Z(x_)E]}
= —aris = a,nsx
D (A) = (2)2D (n2)2CZ@=(2)2x
=
Sliëno se pokazuje da je
E(fi) = b, D(zr_(1+), n72 8, UF(S2) =
-Prema tome, A, B i 52 su nepristrani procjenitelji za nepoznate parametre a, b i Stoga, Limoe se smatrati da su A I B asimptotski normalni procjenitelji, tj. za veliko ii vrijedi
7 2\ PhA N(a,---J, (10.22) U\ n5xJ
B NQ(1+)). (10.23) [1Prema tome, mogu se odrediti intervali povjerenja odredene pouzdanosti a za nepoznate
parametre a i b uzimajuéi 52 umjesto nepoznatog parametra g2, pH ëemu je 52 vrijednost nepris- Utranog procjenitelja 2, tj.
s2=l2(y_ax2)2=722 (—*) (1024) L
gdje je ii
i=1
iiLi
[I?
10. Regresija na osnovu uzorka 229
Sada zapazimo da je Ax + . procjenitelj za ax + b i to nepristran procjenitelj jer vrijedi
E(Ax+) xE(A) +E(B) =ax+b.
Slueajne varijabe A i B opóenito nisu nekorelirane I mote se pokazati da im je kovarijanca(korelacijski moment)
S(A,Bj=E(ABj-E(A)E(D)=_,I da je varijanca
D(Ax+B1=— 1+1/ n \Prema tome, vrijedi
Ax+flN(az+b [i+(x_)2]).
Sada, pH velikom uzorku, moe se odrediti interval povjerenja pouzdanosti za nepoznatuvrijednost ax
--
6. Iz
Ax+B—(ax+b)�Zfl =fl (10.25)
D(Ax+dobiva se interval povjerenja pouzdanosti za nepoznatu vrijednost ax + 6
[Ax+BzqD(Ax+n), Ax+B+z D(Ax+B)]
ill
—
-% uAx+B—z
1+ , Ax+B+zp 1±
odnosno, za ostvaren uzorak,
u F (x)2 aax+b_-z13y1+ , ax+b-J-zp7 1+
irina intervala povjerenja za odredeno x C IR je
25(x)=2zp+_2
(10.26)
Vrijednost z nalazimo iz uvjeta (10.25), odnosno iz
Ax + B — (ax + b)P �zp 2(z5)=8,D(Ax H-B)
10.3. Linearna regresija
odakie je
(zp) z =r1 (f). (10.27)
U praksi Oesto se raspolae s malim uzorkom (a malim brojem mjerenja). Utvrdene razdiobevjerojatnosti (10.22) i (10.23) za procjenitelje A i B za nepoznate parametre a i b vrijede i usluãaju malog uzorka uz dodatnu pretpostavku o sluëajnim varijablama €j iz regresijskog modela
—ax+b+e, i=1,2,...,n.
To se postie uz pretpostavku da su sluëajne varijable El, 62,” , 6, nezavisne ida imaju istunormalnu razdiobu vjerojatnosti N (0, a2) (E (e) = 0, D (e) = a2, i = 1,2,. . . , n). Slueajne tiJvarijable Y1, Y2,. , Y, su nezavisne i vrijedi
11:1’rN(aze+b, a2), it=1,2,...,n.
Sada moemo zapaziti da za sluoajnu varijablu 2 definiranu s (10.21), tj.
vrijedi
x2(n —2) (10.28)
1 da su A i S2, kao i B i g2 nezavisne slueajne varijable.Prema (10.19), (10.20) i (10.28) vrijedi
t(m—2), (10.29)
s F t(n—2).S
Odatle, mogu se odrediti intervali povjerenja odredene pouzdanosti $ za nepoznate parametre ai b, kao i za vrijednost regresijske funkcije ax + b za svaki x C K.
Iz uvjeta
A_ar=
nalazi se interval povjerenja za parametar a (za konkretan uzorak)
[a_t, a+t5]. (10.30) 1]S1ino se nalazi interval povjerenja za nepoznati parametar b
U
{_tfl*/÷. +tP* i+f]. (10.31) 1]iiU
10. Regresija na osnovu uzorka 231
Moe se pokazati da za regresijsku funkciju ax + b vrijedi interval povjerenja
ax+b—tfl71+@_22,
ax++t51+@_22 xeR. (10.32)
Prema tome, regresijska funkeija ax i- b moe se nepristrano proejeniti pomobu vrijednostiax * b procjenitelja Ax + B i da se s vjerojatnoóu /3 moe jarnOiti da pogreka nije veéa od
26(x) = 2t 1 +(x —x)
, x ER (10.33)
Vrijednost tp (Olta se iz odgovarajuêe tablice) odredena je uvjetom
P (jt_2) < t0) = 2G_2 (t0) — 1 = /3,odakie je
t5=Gi2(2/3),
gdje je G_2 funkeija razdiobe vjerojatnosti Studentove razdiobe t (n — 2) sa m — 2 stupnjaslobode, a °2 njoj inverzna funkcija.
Zapazimo da su formule (10.26) 1(10.33) vrlo shone. Umjesto zç u (10.26), koji se odnosi narazdiobu N (0, 1), u (10.33) stoji t, koji se odnosi na razdiobu t (ii — 2), a umjesto parametraa ii (10.26), koji se u praksi zaffijenjuje procjenom s, u (10.33) stoji upravo s. Ivledutim, bitnoje napomenuti da formula (10.26) vrijedi za veliko ii dok formula (10.33) vrijedi za svako n > 2.
Zapazimo da problem proejene nepoznatih parametara a, b cr2 mo2e se rjeavati i metodommaksimalne vjerojatnosti, koja je dana u Poglaviju 8. Ovdje smo metodom najmanjih kvadratadobili da su A, B i 32 nepristrani procjenitelji za nepoznate parametre a, b i 2, a metodommaksimalne vjerojatnosti za parametre a i b dobiju se iste nepristrane procjene dok se za parametar a2 dobije proejena koja nije nepristrana, razlika je samo u faktoru umjesto (kod32). lz ovog slijedi da je metoda najmanjih kvadrata povoljnija I opéenitija jer zahtjeva slabijepretpostavke, ne trai se normalna razdioba za pogreke e. Pored toga MNK-procjenitelji, kaoI Mlrprocjenitelji (procjenitelji metodom maksimalne vjerojatnosti), imaju mnoga dobra svojstva. Iz (10.19) i (10.20) se vidi da su procjenitelji A I B linearni proejeniteiji, jer sn iskazanikao linearne kombinacije sluoajnih varijabli Y1,
Poznat je Gauss-Markovljev teorem koji iskazuje da od svih linearnih nepristranih procjeniteija za parametre a i 5 MNK-procjenitelji imaju najmanje varijance. Prema tome, GaussMarkovljev teorem tvrdi da su (u linearnoj kiasi procjenitelja) MNK-procjenitelji A i B najefikasniji procjenitelji za parametre a i b i da je Ax + B najefikasniji procjenitelj za ax + b.
Primjer 2. Neka je poznat niz mjerenja (xi, y), i = 1,2,. ,15,
(1,3), (3,2), (3,5), (5,4), (5,7), (6,3), (8,6), (9,4),(10,5), (11,6), (11,9), (14,7), (14,9), (16,9), (17,11).
Odrediti pravac regresije od Y u odnosu na x.
232 10.3. Unearna regresija
Ad. Za izraëun potrebnih vrijednosti zgodno je naCiniti tablicu
i Xj y Xjj 41 1 3 3 1 92 3 2 6 9 43 3 5 15 9 254 5 4 20 25 165 5 7 35 25 496 6 3 18 36 97 8 6 48 64 36 [T8 9 4 36 81 169 10 5 50 100 2510 11 6 66 121 36 P111 11 9 99 121 81 U12 14 7 98 196 4913 14 9 126 196 8114 16 9 144 256 8115 17111 187 289 121Z 133 90 951 1529 638] [I
Slijedi
= =8.8667,90
= 2.6=1O20O0
= (133)2
= 6383 =fi5333
Za parametre a i b dobivamo
a = a= = 0.437, [110.2000 133
— 2b = ==6_233156•__ .121, LIpa je jednadba regresijskog pravca
[Iy = 0.437x + 2.121 . (10.34) U
Ako se promjenu uloge x i y pa se odredi regresijski pravac za x u odnosu na y, dobiva se
x = l.56ly — 0.501 , tj.
=.61x + = 0.641x + 0.321
nLi
10. Regresija na osnovu uzorka 233
UI,
(, i)
1
12 5 10 13 17 X
Slika 10.2.
Ovaj pravac se znatno razlikuje od pravca (10.34) s obzirom na nesimetriOne uloge x i y U modelui u izrazu za ocjenu koeficijenata regresijskog pravca.
Pravci regresije ilustrirani su in slid 2.Zapazimo da se srednja kvadratna pogreMca aproksimacije regresije 2, koja je odredena s
(10.24), moe napisati kao
=n — 2
( — =n 23
— 4) =n 2 (1— r2)
gdje jo r = fl- uzoraeki koefIcijent linearne korelacije, to iskazuje mjeru linearne zavisnostiizmedu x i y. l2ako se zapaa da ukoliko je koeficijent korelacije r p0 apsolutnoj vrijednostib1ii jedinici utoliko je boija linearna povezanost. Prema tome, to je pogreka regresije manjato se regresijski pravci manje razlikuju, a pokiapaju se samo ako izmedu x i y postoji linearnafunkcionahia veza (to je sluaaj kada je r2 = 1).
U Primjeru 1 srednja kvadratna pogreka aproksimacije 2 standardna pogreka s te uzora-eki koeficijent linearne korelacije r su
10 22=
233156 6.5333 = 0.683, r = 0.8264,
82 = .6.5333(1 — 0.683) = 23896, s = 1.5458.
Zapazimo da u sluaaju odredivanja pravca regresije od X u odnosu in y u obliku
x=cy+ct, (10.35)
234
1
0
Slika 10.3.
ci
2
(x1, y)
= 1,2,
10.3. Linearna regresija
a,
horizontalna odstupanja toeaka uzorka (xi, y) (i = 1,2, . . . , n) od pravca (10.35) (slika 3). RIiiPrimjer 3. Neka su mjerenjem dobiveni rezultati prikazarxi u tablici
42,0 2,6
yjj2,5 3,0 4,2 5,0 5,2 5,4 5,6 6,8 7,0 7,8fl
Na osriovu pripadnog niza toëaka mote se usvojiti model linearne regresije. Prema danimformulama dobiva se
= *Z4 — ±2 = 1,924,i=1
= — = 2,191,i=1
52 =
*— 4) = 0,119,
= 1, 387
Prema tome, pravac regresije je
Za /3 = 0,95 imamo
y = 1, 139x + 1,537.
1+32
[J:
pa su intervali povjerenja za paranietre a i b, pouzdanosti /3 = 0,95, prema (10.30) i (10.31),redom
[0,958; 1,320], [0,894; 2,180]
r
= Cu + d
,n koje predstavljajuumjesto razlika (10.15) imamo razlike x — cyj — d =
1 2 3jx 1,2 1,5
516.7 8 9 103,0 3,5 3,9 4,4 5,0 5,5
= = 3,260, g= = 5,250,
iiL
U
pa je
= _2 = 2,590, s, = 1,609
= 1,139, b=—a±= 1,537,
U
U= 4,800
s=0,345 LI
= G’ ( ) = G (0,975) = 2,306,ElU
UnU
n
10. Regresija na osnovu uzorka 235
To znaãi da se s vjerojatnoéu od 0, 95 moe jamèiti da se nepoznati parametar a nalazi uintervalu [0,958; 1, 320] I da se nepoznati parametar 6 nalazi u intervalu [0, 894; 2, 180].
Interval povjerenja pouzdanosti fi = 0,95 za vrijednost regresijske funkeije ax + 6, prema(10.32), za svaki x eR je
1, 139x + 1,537—0,252 1 + 1, 139x + 1,537 + 0,252 1 +(x
Take se za x = = 3, 260 s vjerojatnoéu od 0, 95 vrijednost regresijske funkcije ax + 6 nalazi uintervalu [4, 998; 5, 502], a irina tog intervala povjerenja je 26 () = 0, 504 i to je naju2i intervalpovjerenja, dok je za sve ostale vrijednosti x irina pripadnog intervala povjerenja veOa.
10.3.2. Testiranje hipoteza o koeficijentu Linearne regresije
Ako se za nepoznati koeficijent linearne regresije a dobije po niodulu mala vrijednost procjenea, moe se posumnjati da je stvarna vrijednost paraaetra jednaka nuli i da je regresijski modeloblika
Yr=6+
Tada, moe se pisatiyib+ti, i=1,2,••• ,n,
to znaãi da vrijednost y ne ovisi o vrijednosti x. Ti ovom sluèaju se problem regresijske analizesvodi na problem procjene nepoznatog oeekivanja i nepoznate varijance sluëajne varijable YN (6, 2). Stoga, zanimljivo je testirati hipotezu H0 a = 0, prema nekoj od alternativnihhipoteza.
Testirajmo opéenitiju hipotezu H0 a = a0, gdje je a0 C P. odreden broj, prema alternativnojhipotezi IIj : a a0, pri razini znaëajnosti a.
Prema (1029), uz uvaavanje hipoteze H0, vrijedi
A-a.
sx/r-it(n_2).
Ovu s1uajnu varijablu t2 moemo uzeti kao test-statistiku jer na osnov-u uzorka (xi, y),i=1,2,... ,n,m>2,vrijednost
- a—a9tn_2 = Sxv1S
iskazuje odstupanje procjene a, dobivene na osnov-u uzorka, od pretpostavljene vrijednosti a9 zakoefleijent a linearne regresije.
Za zadanu raziriu znaëajnost a, iz tablice vrijednosti koja se odnosi na Studentovu razdiobu,odredujemo kritienu vrijednost tn_2,a za koju je
P(Itn_21 � tm2,a) = a.
KakojeF (Jt_2j � tn2,a) = a = 1 — G_2 (t_,) +
236 10.3. Linearna regresija
GJ2 (i —
Sada slijedi zakljueak. Akoje Jn...2j tn_2,a, hipotezu H0 treba odbaciti, a akoje <n—2,a, hipotezu H0 ne treba odbaciti. I
Zapazimo da smo u Primjeru 2 imali a = 0, 437 pa se riameáe zadatak da testiramo hipotezuHo a = 0, prema alternativnoj hipotezi H1 a 0, uz razinu znaëajnosti, na primjer, a = 0,05
Ovdjejen= 15, s =4,829, s = 1,546, paje r
t13 =Q,437Q •4,829• /j =5,29.
Nadaije, iz tablice B.10 nalazimo daje
tiSO,05 = G’ (0,975) = 2,16.
Kako je 1t131 > t13.005. hipotezu H0 treba odbaciti. To znaëi da dani podaci ne opravdavajuhipotezu da sluãajna varijabla Y ne ovisi 0 x.
U Primjeru 3 za koeficijent linearne regresije a dobili smo procjenu a = 1, 139, pa éemo ovdjetestirati hipotezu H0 a = 1, preina alternativnoj hipotezi H1 a 1, us razinu znaëajnostia = 0,05.
Sada imamofl= 10, s = 1,387 is=0,345, paje
1,139 -.1•1387/iö=i767
Nadaije, iz odgovarajuée tablice nalazimo da je kritiena vrijednost
= G (0,975) = 2,306.
Kako je VsI < tS;O,O5 to hipotezu H0 ne treba odbaciti. rU sluaaju promatranja hipoteze H0 a = ao, prema alternativnoj hipotezi H1 a > a0, pri U
razini znaëajnosti a, kritienu vrijednost t,...20 odredujemo iz uvjeta[Ii
P(t.2 � t,_2,0) =a. LiKakoje
Utoje
tn_2,a=G.j2(1_a). ULbAko za alternativnu hipotezu uzmemo H1 a < a0, tada kritienu vrijednost tfl_2,0 odredu
jerno izP (tn_2 � tn_2,a) = a = Gn_2 (tfl_2,0).
Odavdeje
=2 (a).
F!U
10. Regresija na osnovu uzorka 237
Tako, na primjer, ako u sluëaju Primjera 2 testirarno hipotezu H0 : a = 0, prema alternativnoj hipotezi H1 : a > 0, pri razini znaëajnosti a = 0, 05, za kritiënu vrijednost imamo
t13 oos = Gj’ (0,95) = 1,771.
Kako je 1 = 5,29 > 1,771, hipotezu Ho treba odbaciti I prihvatiti hipotezu Hi a > 0. Toznaëi da je u pitanju linearna regresija s pozitivnim koeficijentom regresije.
10.4. Nelinearna regresijaAko na osnovu dijagrama rasprenja nizu toaaka (xi, y) (1 = 1, , ii) ne odgovara hnearnaregresijska funkeija y = ax+b, tada treba uzeti neku nelinearnu funkciju regresije (po nezavisnojvarijabli x) da hi se dobila dobra prIlagodha danim podacima.
Cesto éemo pomisliti i na tzv. polinomsku regresiju s regresijskom funkcijom u oblikupolinoma (m — 1) —og stupnja p0 varijabli z
y = aixm_l + a2xm_2 + . + + am. (10.36)
U ovom sluëaju nizu mjerenja (xi, y) (i , n) odgovara niz uvjeta
— (air—’ + a2z2 + + a_1x + am) =
a nepoznate parametre ak, prema metodi najmanjih kvadrata, odredujemo iz uvjeta o minimumufunkcij e
‘3rn—I m—2 2H(ai,a2,... ,arn) =Z(aix +a2x +. +am_lxi+am yi)
tj. iz uvjeta
—(ai,a2,” ,arn)=O, (10.37)2 8aJkoji daju linearan sistav od m jednaclthi s m nepoznanica a1, a2,- ,am
Z (aixr’ + a2xr2 + . ‘. + a_x + am — yi) = 0, tj.
(trn_1) a1 + (Exm_2_k). . .
+ (ZXr1_k) am_i + (zzi). am
= xr-4y, lc= 1,2,-•• ,m.
Opel oblik nelinearne regresijske funkeije kojaje linearna po nepoznatim parametrirna a1, ,amje
y = aifi (z) + a2f2 (x) + ...+ amfm (z), (10.38)
gdje su f, f2,-•• , 1- zadane funkcije. Za n mjerenja (xi, y) (i = 1,... , it) imamo
— [aif1 (z1) + a2f2 (xi) + . . .+ af (x)1 = e, i = 1, 2,•. ,
238 10.4. Nelinearna regresija
pa za funkciju zbroja kvadrata pogreaka imamo
II(ai, a2,•-- ,am) = Z[aaf (xi) + a2f2 (xi) + - -- + amfm (xi) —
Nepoznate parametre a1, a2,--’ ,am nalazimo iz pripadnog sustava uvjeta (10.37), odnosno izsustava od rn linearnih jednadbi
Zlalfl@i)+a2f2(xi)+---+amfm(xi)_yilfk(xi)=O, k=l,2,--- rn, tj.
(x)fk(xi)] -a [tf2()] -a+---+ [fm@ fk(xi)] -am
k1,2,--- ,rn.
Primjer 4. Pod pretpostavkom da vrijedi model zavisnosti y = ax2 + bx + c, odreditiregresijsku parabolu na osnovu podataka
x —2{--1 0 1 2[yt 0.4 1.3 2.2 2.5 3.0 Ii
Ad. Regresijska funkcija y = ax2 + bx + c je linearna po nepoznatim parametrima a, b I c.Ovdje imamo L
y—ax?—bx—c=e, i=1,2,---,5,5
H(a,b,c) =Z(a4+bxj+c_yj)2, U
= Z@+i+c_y=0, Li
= Z@x+bxi+c—yi)xi=0,
= Z(ax+bxi+c—yi)=0. L:Nepoznati parametri a, Si c odreduju se iz sustava linearnili jednadbi
() -a+ -5+ -c =
(4) -a+ (zx) -5+ . =
-a+ (1) -5+5-c =‘1=1 i==1
UI.’
10. Regresija na osnovu uzorka 239
ëiji se koeficijenti i slobodni elanovi odreduju na osnovu danih podataka, koristeOi slijedeéitablieni izraëun.
i X Ui I Xyi I4T4Ui X Z1 —2 0,4 —0,8 4 1,6 —8 162 —1 1,3 —1,3 1 1,3 —1 13 0 2,2 0 0 0 0 04 1 2,5 2,5 1 2,5 1 15 2 3,0 6,0 4 12,0 8 16
I Z 0 9,4 6,4 10 17,4 0 34Tako za nepoznate pararnetre a, b i c imamo sustav jednadbi
34a+lOc = 17,4lOb = 6,4
lOa+5c = 9,4,
ëija su rjeenja art —0,1 , S = 0,64 , c = 2,08 , pa je traena regresijska funkcija
y = —0,1x2+0,64x+2,08.
Suma kvadrata pogreaka je
H(a,b,c) = Z(—04x?+0,64xi+ 2,08—y)2
= (—0,4— 1,28+2,08_o,4)2÷(_0,1 _0,64+2,081,3)2+ (2,08— 2,2)2 + (—0,1 + 0,64 + 2,082,5)2 + (—0,4 + 1,28 + 2,08 — 3,0)2
= 0+0,0016+o,0144+o,0144+o,0016 =0,03Z
Primjer 5. Da hi se utvrdila ovisnost tlaãne ëvrstoée betona Y u megapaskalima (MPa) okoncentraciji x (prornila) odredenog aditiva izveden je eksperixnent. Dobiveni podaci prikazanisu u tablici
k 1 2 3 4 5 6 7 8 9 10 11 12 13 14 1510 15 20 25 30
Zik 25 27 29 28 30 31 30 31 33 30 31 32 30 31 33
Uz svaku na-vedenu koncentraciju xk aditiva izradene su p0 tn betonske kocke na kojima jemjerena tlaëna ëvrstoéa Ilk.
Pretpostavirno da je regresijska funkcija oblika
y = a1 + a2x + a/j (10.39)
Procjenia regresijske ftrnkcije obhka (10.39) za dana mjerenja je
y = —0,642 — 1, 276x + 12, 792/i
Zapazimo da smo umjesto regresijske funkcije (10.39) mogli uzeti i neki drugi oblik regresijskefurikcije. Pni izboru tipa regresijske funkeije istraivaë se oslanja na neke spoznaje o promatranim
240 10.4. Nelinearna regresija
veileinama iii ga grafleki prikaz podataka navodi na ideju. Najoeiglednija je situacija kada sepokae da toëke (xi, y) (i = l,2,.• , n) prib1ino 1ee na jednom pravcu. Ako to nije siuëaj,onda se nastoji polazne podatke (zj,y) transforrnirati u nove podatke (x, y) koji pribli2no leena jednom pravcu.
Tako na primjer, eksponencijalnoj regresijskoj fiinkciji y = aexp(bx) niza podataka (xi,yi)
odgovara linearna zavisnost y’ = A+ bx niza podataka (x = = ]nyj) (i = 1,2,•• m), gdjeje y’ = in y, A = in a- Ovo dolazi otuda to iz y = a exp(bx) shjedi in y = in a + bx.
Primjer 6. Neka imamo niz mjerenja
1xi10.5 1.5 2 12.514 4.5)5 P0.70 0.40 033 0.29 0.20 0.18 j 0.16
Koristeói dijagram rasprenja odrediti mode’ zavisnosti i odrediti regresiju od Y u odnosu na x.
Ad. Dijagram rasprenja dan je na slici 4.
Liz’
PU
TiU
0.5 1.5 2 2.5 4 4.5 5U
Shka 10.4. 1UNa osnovu dijagrama rasprenja za regresijsku funkciju uzet éemo
1 (10.40) iiax + ba to je nelinearna funkeija po nepoznatiin parametrima a i b.
Treba odrediti nepoznate parametre a i b tako da pripadna krivuija, u smisiu metode najmanjib kvadrata, najbolje od svih mogubih krivulja tog obhka aproksimira zadani niz toeaka.
Regresijsku funkciju (10.40) moemo hnearizirati po parametrima a i b. Naixne, (10.40)moiemo napisati kao
1- =ax+b.y
Sada na osnovu danih podataka imamo
ax+b—1=ej, i=1,2,. 7.yi LI
q
10. Regresija na osnovu uzorka 241
Parametre a i b odredujemo iz uvjeta o minimumu funkcije
H(ab)=ZZ(axi+b_ 1)2
tj. iz sustava jednadbi
=
=
odnosno
=
=
U tablici prikazujemo potreban izraãun
I 41 0.5 0.70 1.4286 0.25 0.71432 1.5 0.40 2.5 2.25 3.75003 2 0.33 3.0303 4 6.06064 2.5 0.29 3.4483 6.25 8.62075 4 0.20j 5 16 206 4.5 0.18 5.5556 20.25 25
5 0.16 6.25 25 31.25LZ 20 2.26 27.2128 74 95.3956
Sada sustav jednadbi gla.si
74a+20b = 95.3956,20a+7b = 27.2128,
a rjeenja sua = 1.047 b = 0.897
pa je regresijska funkcijaI
— 1.047x + 0.897
Navedimo jo neke nelinearne rnodele regresije i zapazimo kako se jednostavnom transformacijom svode na linearne po nepoznatirn parametrima.
242 10.4. Nelinearna regresija
1) Promatrajmo modely = aaP.
Odatle je
my = lna+blnx iiimy = A+bnx, A=lna.
Model by = A+blnz je1inear po parametrima A lb. Nizu mjerenja (10.9) (x >0, y > 0)odgovara niz uvjeta
A+b1nx—1ny=c, i=1,2,••,n,
a nepoznate parametre A i b odredujemo iz uvjeta o minimumu firnkcije
H (A, b) = (A + b1nz — inyj)2.
Kada odredimo parametar A, onda je poiazni parametar a =
2) Slieno, neiinearan regresijski model y = ae svodimo na linearan in y = A + bx, A = in a.
Zapazimo da za odredeni niz mjerenja moemo uzimati I razileite regresijske modele I izabrationaj koji daje najbolju aproksimaciju, tj. onaj za koji je suma kvadrata vertikainih odstupanjazadanog niza toeaka od aproksimativne krivulje najmanji (za koji pripadna furikcija H uzimanajmanju vrijednost).
Buduéi da na iste podatke (niz mjerenja) moemo primijeniti raziieite regresijske modeie,nameôe se pitanje prikiadnosti (adekvatnosti) izabranog modela y = i (x, a1, ,am) Zapazirnoda u sluaaju adekvatnosti ovog modeia i vehkog broja podataka (10.9) niz podataka 11
Zi=Yt:t, I=1,2,•• n, (10.41)a ‘ 11gdje je l = u ,), ,..- , su procjene za nepoznate parametre a1,••• ,am dobivene primjenom inetode najmanjih kvadrata, a2 je odgovarajuea procjena za a2 (a2 2),treba se ponaati kao niz nezavisnih mjerenja siuëajne varijabie Z N (0, 1). Prema tome te- Ustiranje hipoteze o adekvatnosti regresijskog modela y = z (x, ,am) svodi se na zadatak otestiranju hipoteze H0 da podaci (10.41) potjeëu iz standardne normalne razdiobe. Ovaj zadatak F!:moe se rijeiti hikvadrat-testom ili K-S-testom. U
F!U
U
ElU
ii
10. Regresija na osnovu uzorka 243
10.5. Viestruka linearna regresijaModel u kojem slueajna varijabla Y ovisi o vie nezavisnih (slueajnih iii kontroliranih) varijablije takozvana viestruka iii viedimenziona1na regresija.
Opéi model viestruke linearne regresije je (In — 1) —dimeuzionalni linearni regresijskimodel s regresijskom funkeijom oblika
y = a1x1 + a2x2 + + am_lxm_1 + am , (10.42)
gdje su al, a2,-- am nepoznati parametri ih kraêe a = (a1, a2,--- ,am) e am je vektorskiparametar dimeuzije m, a x1, x2,--- , su nezavisne varijable (ulazne varijable) iii kraOe x =
(x1, X2, , Xm_i) e R”—1 je (In — 1) —dimenzionalna ulazna (neslueajna) vektolska varijabla.Geometrijski gledano u pitanju je regresijska ravnina u
Zapazimo da se (m — 1) —dimenzionalni (m � 2) regresijski model s regresijskom funkcijom oblika (10.42) moe tretirati kao m—dirnenzionalni ]inearni regresijski model s regresijskomfunkcij om oblika
y = a1x1 + a2x2 + + am_jxml + amxm , (10.43)
gdje je Xm 1. Sada je x = (xi,x2,-.- ,xm) e am je m—dimenzionalna ulazna vektorskavarijabla, pa Oe x@)
= (x1, x2,--. x), gdje € = 1, oznaëavati i—tu (i = 1,2,--- , n)n > m, vrijednost ulazue vektorske varijable za koju je y pripadna vrijednost iziazue slueajnevarijable Yj
Na osnovu niza mjerenja (xW,y), i = 1,2,--- , n, imamo niz uvjeta
= a1x1 + a2x2 + + amxmj + , i = 1,2,--- (10.44)
Nepoznate parametre a1, a2,--- ,am odredujemo iz uvjeta o minimumu fiankcije -
H (ai, a2,--- am) = Z (aixj + a2x2 + + ax
tj. iz sustava jednadbi
1811—(ai,a2,-.. ,am) =E(alxii+a2x2j + --- Vi) Xkz =0, k = 1,2,--- ,m,
to dovodi do linearnog sustava od m jednad2bi
(x1xke)- a1 + (x2ixki)
. a + - -- + (xmixi)- am = YiZki, k = 1,2,-- , m.
(10.45)Uzmimo vektorske i matriöne oznake
x = (xi, x2, - - - ,x) = (xl,x2, - - - , x) , a = (aj, a, - - -
Y(Y1,Y2,-.,Y), V(Y1,V2,”,Yn), e=(el,e2,---,e),
Xfl X21 Xml
x= £12 £22 Xm2
X X2n Xmn
244 10.5. Viestruka linearna regresija
Matrica X reda n x m je tzv. matrica ulaznih podataka. ii:Sada sustav uvjeta (10.44) moemo napisati u matriënom obliku
y__aXT+e,
XT je transponirana matrica matrice X, a sustav Iinearnih jednadbi (10.45) moemo napisatiu obliku
a (XTX) = yX. (10.46)
SKako izmedu ulaznih varijabh x1, x2,... , Xm ne postoji linearna zavisnost, to je sirnetncnakvadratna matrica XTX regularna matrica, to znaëi da ima inverznu matricu (XTX) , pa je Ijedinstveno rjeenje sustava (10.45), odnosno (10.46),
a = a = yX (XTX)’. (10.47)
Formulom (10.47) prikazana je MNK-procjena a vektorskog parametra a m—dimenzionalnogliriearnog regresijskog modela s regresijskom funkcijom oblika (10.43).
Primjer 7. Neka je na osnovu istraivanja utvrdeno da slueajna varijabla V ovisi o dvijenezavisne varijable x1 i x2 i da je regresijski model linearan s regresijskom funkcijom oblika
= ax1 + 6x2 + c, gdje su a, 5 i c nepoznati parametri. Neka je poznato 13 mjerenja
/c 1 2 3 4 5 6 7 8 9 10 11 12 13Xjk 152 183 171 165 158 161 149 158 170 153 164 190 185 11X2k 50 20 20 30 30 50 60 50 40 55 40 40 20 U71k 120 141 124 126 117 129 123 125 132 123 132 155 147
11Koristeéi metodu najmanjih kvadrata, odrediti regresijsku ravninu. Li
Ad. Nepoznate parametre a 6 i c odredujemo iz uvjeta o minimumu funkcije
13
H(a,b,c)=Z(axlk+bx2k+c_yk)2. [1Ako odredimo parcijalne derivacije p0 a , 6 i c i izjednaaimo s nulom dobivamo linearan sustav
jednadthi p0 nepoznanicama a , 61 cLi
Z@xlk+6x2k+c_vkzlk = 0, 11k=1 Ii
= 0, [3k=1 Li
Z(axlk+bx2k+c_yk) = 0,k=1 ii
UI
10. Regresija na osnovu uzorka 245
13 13a + (Zxk)J + (Zz2k)
. c
(Zx2k). b + 13 . c
gdje koeficUente i slobodne elanove treba odrediti na osnovu danih statistiekih podataka. Rjeenjetog sustava jednadbi je
a=1,077, b—0,425, cr=—65,1,pa je procjena regresijske fuukcije za dane statistieke podatke, odnosno traena regresijska ravnma
= 1,077x1 +0,425X2 —65,1.Prirnjer 8. Za gradevinski beton koriste se cement, pijesak i voda o ëemu uglavnom ovisi
1 tlaexia evrstoea Y betona, to se mjeri na odredenim uzoraOkim kockama. Neka je x1 kolieiriacementa u kg., x2 kolieina pijeska I z3 vodocementni faktor koji iskazuje omjer cementa 1 vode.Testirano je 7 betonskih kocki naëinjenih od razliaitih omjera sirovina i za svaku kocku utvrdenaje vrijednost Vi (i = 1,2,•. , 7) tlaene ãvrstoée u megapaskalirna (MPa), a rezultati su dani u
zli x2200 2123220 2090250 2060280 2014300 1993320 1967350 1926
Poznato je da je tlaena vrstoéa Y (ii sluëaju primijene late recepture) sluaajna varijabla za kojuse obieno pretpostavlja normalna razdioba. Stoga izlazne vrijednosti y OVise o ko1iinama x1,x2 I X3 sirovina, kao i o sluéajnoj pogreki c u koju su ukljueeni I drugi faktori koji utjeëu natlaänu ëvrstoéu, za koju se smatra da se ponaa p0 odredenoj statistiekoj zakonitosti.
Regresijski model se moe napisati u matrienom obliku
Y=aXT+e
s linearnom regresijskom funkcijom oblika
y = a1x1 + a2x2 + a3z3 + a4,
gdje je a = (a1, a2, a, a4) nepozuati ‘vektorski pararnetar. Ovdje je
m = 4, n=7,
odnosno
• a + (fxlkx2k) •b+ (x1k).
XlkX2k)
(fxlk) a +
=
= Z32kvk
=
tablici.x3i
0,6000,5600,5100,470
Vi29,030,533,837, 5
0,450 39,80,430] 41,30,405 1 42,3
y = (29,0; 30,5; 33,8; 37,5; 39,8; 41,3; 42,3),
246 10.5. Viestruka linearna regresija
200 2123 0,600 1220 2090 0,560 1250 2060 0,510 1
X= 280 2014 0,470 1300 1993 0,450 1320 1967 0,430 1350 1926 0,405 1
Sadaje544200 3865000 917 1920
XTX —3865000 28731000 6964 14170
— 917 6964 1,7 3,41920 14170 3,4 7
0,030 0,021 1,634 —51,993
(XTX’ —0,021 0,017 —0, 186 —39,467
— 1,643 —0,186 1446 —779,222—51,993 —39,467 —779,222 94550
pajea = a = yX (XTX)’ = (0, 111; 0,058; —47,28; —89,022)
i MNK-procjena regresijske funkeije jePbL(x,a) = 0, 111x1 -I- 0,058x2 — 47,28x3 —89,022. (10.48) Ii
1O.5J. Gauss-Markovljev I fundamentalni teorem
Kod promatranja jednodimenzionalnog regresijskog modela istakli smo da metoda najmanjihkvadrata ima dobra svojstva za proejenu nepoznatih parametara, to naravno vrijedi i za viedimenzionalnu linearnu regresiju. Fosebno je vano svojstvo o efikasnosti MNK-procjenitelja kojese obieno iskazuje kao Gauss-Markovljev teorem.
Ovdje éemo koristiti ozriake i rezultate dane u promatranju viestruke ]inearne regresije.Promatrali srno m—dimenzionalni linearni regresijski model s regresijskom funkcijom oblika
(10.42), oduosno (10.43), tj.n
p(x, a) = a1x1 + a2x2 + + amxm (10.49) UTaj regresijski model mo2e se napisati u matriOnom obliku
Y=aXT+e, (10.50)
gdje je XT transponirana matrica matrice X ulaznih podataka, a za slueajni vektor vrijedi
E(e)=0, E=c2I, (10.51)
gdje je >D kovarijancna iii disperzijska matrica sluoajnog vektora e, I je jediniöna matrica redaii. (Lako je zapaziti da regresijski model u matrienom obliku (10.50) odgovara sustavu uvjeta(10.44) za ostvaren uzorak.) HU,
[•1
10. Regresija na osnovu uzorka 247
Iz (10.47) zapaamo da se vektor a moe shvatiti kao vrijednost vektorskog procjenitelja A =
(A1, A2, ,Am) za nepoznati vektorski parametar a = (ai, a, --. ,am), gdje je procjenitelj A(prerna (10.47)) definiran s
A = Yx (xTx)’. (10.52)
Odatle se vidi da je A linearan procjenitelj jer je iskazan kao linearna funkeija izlaznog slueajnogvektora Y, a kako je
E[A]=a,
to je A linearni nepristrani procjenitelj (LN-procjenitelj).Prema (10.50) 1(10.51) vrijedi
Ey = = a2I,. (10.53)
Nadaije, vrijedi= u2 (XTX) 1, (10.54)
a odatle je varijanca (iii disperzija) procjenitelja Ak nepozuatog parametra ak
D [Ak] = 2kk, k = 1,2,- , m, (10.55)
gdje je akk dijagonalni element matrice (XTX)Postavija Se pitanje da ii je procjenitelj Ak najbolji u smislu da ima najmanju varijancu
u kiasi svih LN-proejenitelja za nepoznati parametar ak. Fozitivan odgovor na to pitanje dajeslijedeéi teorem.
Gauss-Markovljev teorem. Neka je Y = aXT + e m—dimenzionalni linearni regresijski model za koji je XTX regularna matrica, gdje je X matrica ulaznih podataka, a(a1, a,--- ,am) C ir je nepoznati vektorski parametar dimenzije rn Nadaije, neka je A(A1, A2,--- , Am) MNK-procjenitelj za nepoznati vektorski parametar a, 4 = (4 42, ,
am je proizvoljni m—dimenzionalrii vektor I
je vrijednost regresijske funkcije u toeki 4 e Ktm.Tada je slueajna varijabla (statistika)
(, A) = A A141 + A24 + ... + Am4m (10.56)
najbolji LN-procjenitelj za velieinu p (4, a) u smislu da je
D [ (4,A)] = D [A4T] � D [AT] (10.57)
za svako 4 C 1W” 1 svaki LN-procjenitelj = (Ba, B2, --. , za vektorski parametar a.
Iz (10.56) vidi se da je p (4 A) linearan procjenitelj, a kako je
(10.58)
248 10.5. Vioestruka linearna regresija
s (, .Z jet nepriotrao peocjenitelj. Dokan nejednakoott (18.57) mole se coOl u literoturi.
Soda dajemo znatajao teorem na kojem se temeije moogi teortjeki rezoltati viteetruke lioeaeneregreoije.
Fundamentalni teorem. Neka u m—dimenzionolnom regresijokom modelu (10.50) vrijedido matrica utaonih podataka X ima rang m (m < o) (ularne varijable so lineorno nezovisne),a on sloOajni vektor r koji se podvrgnva n—dimeozinnolnoj nnrmolnnj razdiobi vrijedi (10.51)Tado on slutajnu vorijablo
(10.59)
pripads hikvodrat-rozdioba e a — m stupojevo elobode.
Jo nvog teorema elijedi
s2=___L__Z[Yj_,A(xt,A)]2, (10.60)
E [52] = g2 D [82j = .-_L.04, (10.61)
Ito pokozoje do je 2 neprietean i knozietentan procjenitelj on nepoonati parametor 2. Premotome, no veltko a (a>> en) mole so neeti do je
02 = (p — s (xi, 5)(2. (10.62)
10.5.2. Procjene i intervali povjerenjn za regresijske parausetre
KoeioteOi Gnoee-Morkovljev t fondomeornloi teorem mole se pokooott do vrijede eijedeki eeooltatioo m—dimeoeieooloi lineorni regresijeki model (10.50).
Slogojoom vektoeo Y pripodo n—dimenotoooloa oormnlno roodiobo 5 vektoeom otekivoojokovoeijooeoom moteieom, eedom,
M(X,o)=OXT, Eya21,,.
Vektoroki prorjeoitelj A20 nepoonoti vektoeeki poenmetor a, koji je defleiron formulom (10.52),tj.
A= ‘x (xTXf’
lineneno evict o elotojoom vektoro Y, Ito onoti do elotojoom vektoro Apripodo m—dimenoioooloonormolon roodiobo e vektorom otekivaojn t kovnrijooroom mntrirom, redom,
E[Aj=n, E5=02(XTX)5.
Odotle, komponeoti At (0 = 1,2,- , m) pripndn oormolnn rozdinbo i vrijedi
N(nn,rr), gdjeje rr=a2onn.
(1
10. Regresija na osnovu uzorka 249
Slijedi, vrijednost ak, kao vrijednost MNK-procjenitejja Ak za nepoznati regresijski parametarUk, moemo shvatiti kao vrijednost slueajne varijable koja se rasipa p0 normalnoj razdiobi okoUk UZ varijancu cr. Kako a ovisi o nepoznatom parametru a2, to za veliko n (broj podataka),parametar a2 moemo zamijeniti s vrijednoeu .s2 pripadnog nepristranog procjenitelja g2 kojije defmniran s (10.60) i moemo pisati
4=s2akk, krrl,2,-.- rn,
pa prib1ino vrijediAknN(ak,d), k=1,2--- ,in.
Prema tome, interval povjerenja pouzdanost 5, za nepoznati parametar a, moemo izrazitiformulom
[ak—Zfldkak+Zflak], k=1,2,--- ,rn, (10.63)
gdje je velieina koja se odnosi na normalnu razdiobu N (0,1) (odredena s (10.27)).
Neka n nije veliko. Primjetimo da slueajnoj varijabli
Ak — Uk
odgovara normalna razdioba N (0, 1) i moemo pisati
A—a n—mk—aiJ&Vnas2
pa prema Fundamentalnom teoremu vrijedi
Ak —
= rt(m_rn), k= 1,2,--- rn, (10.64)Qakk
gdje je t, (Iv = 1,2,--- , m) slueajna varijabla sa Studentovom razdiobom t (n — rn).Odatle slijedi da interval povjerenja pouzdanosti 5 za regresijski parametar Uk moe se izraziti
formulom[ak t/3Uk, as,, + tflukj, k = 1,2,--- , rn, (10.65)
gdje je tp vellaina koja se odnosi na Studentovu razdiobu t (n — in).
Primjer 9. Promotrirno daniPrinjer 8.Iz dobivene matrice (XTX)1 imamo
an = 0,030; a22 = 0,017; a = 1446; a = 94550.
Odredimo vrijednosti (i = 1 2,--- , n) p0 formuli
yi=2=1L(ri,a), i=1,2,--- ,r,
pa za 2 imamo
s2z(yi_)2o,72; s=0,85.
10.6. Viestruka nelinearna regresija
Sada moemo odrediti MNK-procjenu ak (Ic = 1, 2, 3, 4) regresijskog parametra aj I pripadnuprocjenu dk standardue devijacije c&. Izraeun je u tablici
Ic 1 2 3aj 0,111 0,058 —47,28 —89,02
I &Jg 0,146 0,109 32,2 260,7J
Iz tablice vidimo da su ave standardne devijacije vezane za pripadne procjene parametarajako velike, to upozorava na slabost dobivenog regresijskog modela.
Intervali povjerenja pouzdanosti /9 = 0,95 (t5 = 3,18) za parametre ak (Ic = 1,2,3,4),raëunate 0 formuli (10.65), su redom
[—0,352; 0, 575j , [—0,289; 0,589], [—150; 55,11, [—918; 740]fl
Dobili smo vrlo iroke intervale povjerenja, to jo boije ukazuje na pogreke procjena. Ovo smomogli i oeekivati jet je broj nijerenja mali (n. = 7).
Ako za sirovine uzmemo vrijednosti
= 230 kg cementa, x2 = 2050 kg pijeska, x3 = 0,55 vodocernentni faktor (10.66)
tada, prema (10.48), dobivamo vrijednost regresijske funkeije Ui
= 0,111-230+ 0,058- 2050— 47,28 -0,55—89,022 = 29,4,
a to je MNK prognoza za vrijednost izlazne slueajne varijable. To znai da moemo oOekivatitlaenu ëvrstoáu od 29, 4 MPa na betonskim kockama izradenim p0 recepturi (10-66).
U slueaju kadaje broj mjerenja n dovoljno velik, za slueajnu varijablu p (z, A) mo2e se uzeti
p(x,A) N(p(x,a),&).
Ovo omoguéuje odredivanje intervala povjerenja pouzdanost /9 za nepoznatu vrijednost regresijske funkcije p (x, a). Koristeâi relaciju (10.64) moguée je provoditi test za testiranje hipotezeH0 = a0, prema suprotnoj hipotezi H1 ak a0 (iii ak < a0, iii ak > a0), gdje je a0 C JRzadaril broj. Studerstova sluëajna -varijabla tk 12 (10.64) uzima se kao test-statistika.
10.6. Viestruka nelinearna regresija rModel 1—dimenziorialne nelinearue regresije, koja je linearna pa nepoznatim parametrimaa1, a,--- ,am, moe se iskazati pomoOu regresijske funkcije oblika
y a1f1 (xj, x2,--- , xj) + a2f2 (x1, x2,--- ,zj) + -- + amfm (xi,x2,.-- , xj), (10.67)
gdje su fi, f2,--- , f,, odredene funkcije koje ovise a 1 nezavisnih varijabli x1, x2,-- ,x.-
Neka je x = (x1, x2, , x1) c JR’ je l—dimenzionalna ulazna vektorska varijabla. Nekax0) = (x1, X2i,•• , xj) oznaëava i—tn (i = 1,2,--- , n) , n > m, vrijednost ulazne vektorskevarijable za koju je y pripadna vrijednost izlazne sluaajne varijable Y.
h[I
10. Regresija na osnovu uzorka 251
Prema (10.67), za niz mjerenja (x(), Vt) = 1,2, ... , ii, n > rn irnamo niz uvjeta
= a1f1 + a2f2 + ... + af + , = .n. (10.68)
Sada je funkcija surne kvadrata pogreaka
H (a1, a21•• . [aifi (x()) + a2f2 (x(0) + ... + af (x@)) —
Nepoznate parametre al, a27 ,am odredujemo iz uvjeta
1 OH—(ai,a21” ,am)
= () + a22 + + () — fk = 0, k = 1,2, ,rn,
tj. iz linearnog sustava od m jednadbi
[Ji () fk ai + [ff2 (x(0) fk {fm (xU)) fk am
k=1,2,. ,m.
Prinijedba- Zapazimo da za viestruku nelinearnu regresiju koja je linearna po nepoznatimparanietrima, koja je definirana regresijskom funkcijom (10.67), vrijede analogni rezultati daniza viestniku linearnu regresiju koja je definirana regresijskom funkeijom (10.43). Razllka jesamo u tome to umjesto m—dimenzjonalnjh ulaznih vektorskih vrijednosti
= ,xmj) cam, i= 1,2,•• ,n,
treba uzeti rn—dimenzionalne vektorske vrijednosti
f(i) = (L (x()) ,f2 (x(j... ,fm (x())) eRtm, i = 1,2,•• ,n.
252 10.6. Viestruka nelinearna regresa
Dodatak A.
Osnove kombinatorike
Kombinatorika je dio matematike u kojoj Se izuãavaju odredena svojstva konaenih skupova. Zaizuëa-vanje vjerojatnosti i statistike nuno je poznavati osnovne pojmove iz kombinatorike. Naprirnjer, za odredivanje vjerojatnosti dogadaja u sluaaju pokusa s jednakomoguéim ishodimapotrebno je prebrojati odgovarajuée dogadaje I pri tome se ëesto koristi kombinatorika.
Prvo óemo razmotriti osnovni problem o uzastopnom prebrojavanju.Neka imamo dva prazna mjesta 1. i 2., te m elemenata s kojima moemo popunjavati prvo
mjesto I n elemenata s kojima moemo popunjavati drugo mjesto. Neka su to elementi:
Ai,A2,...,Am, B1,B2,...,B.Treba odredi na koliko se razlieitih naina mogu popuniti dva prazna mjesta.
Skup 5-4db moguéih popunjavanja je:
A1B1 A2B1 AmB1A1B2 A2B2 AmB2
A1B A2B AmBnOdavde vidimo da se dva prazna mjesta mogu popuniti na m - n moguéih naëina, odnosnouredenih parova (A, B) ima in - ii.
Ako imamo tn prazna mjesta 1., 2. 1 3. 1 pu tome m elemenata za popunjavanje prvog, nelemenata za popunjavanje drugog i p elemenata za popunjavanje treOeg mjesta:
Ai,A2,...,Am , B1,B2,...,B ,
Broj moguéih popunjavanja svih triju mjesta, odnosno broj uredenih trojki (Ad, B, Ck) biti 6€jednak in. n - p. To dolazi otuda to se prvo I drugo mjesto mogu popuniti na m ii naëina, te dasvako popunjavanje prvih dvaju mjesta moe doéi sa svakim popunjavanjem treOeg mjesta.
Kao poopéenje gornjeg, vrijedi slijedeei osnovni princip kombinatorike.
Pravilo o uzastopnom prebrojavanju. Ako imamo r razliaitih mjesta i pri tome se prvomjesto moe popuniti s n1 razlieitih elemenata, drugo mjesto s it2 razlieitih elemenata, itd.n-to mjesto s ii,. razlieitih elemenata, onda se svih r mjesta mogu popuniti na n1 i-i,.razileitib naëina.
253
254 AL Pern,utacije
Iz elemenata jednog skupa moemo na odredene naeine formirati nove skupove. To nas vodina pojam permutacija (premjetanje), kombinacija (izbor) I varijacija (izbor I poredak).
A.1. Permutacije
Permutacije bez ponavijanja
Permutacija bez ponavijanja je bib koji poredak od n razliaitih elemenata u odredenom nizu.
tDvije perinutacije razlikuju se samo p0 redoslijedu elernenata.Odredimo broj moguéih permutacija. Zamislimo da je n mjesta u nizu prazno i da ih treba
popuniti danim elementima. Svako moguée popunjavanje tih n mjesta predstavlja jednu permutaciju. Prvo mjesto u nizu moguãe je popuniti na n razlieitih naëina, jer na to mjesto moemostaviti svaki od n elemenata. Kada je prvo mjesto popunjeno ostaje n — 1 element pa se drugomjesto moe popuniti nan — 1 naãin. Isto tako, nakon popune (r — 1) —og mjesta, r—to mjestomoe se popuniti na n — (r — 1) razlieit naãin. Slijedi, prema osnovnom principu kombinatorike,broj moguéih permutacija svih n mjesta jediiak je
n•(n—1)•••3-2•1=nL
Prema tome, broj permutacija n razlieitih elemenata je
LiP(n)t= n!.
9Pnznjer 1. a) Permutacije dva elementa 1 i 2 su
12 21.
b) Sve nioguêe permutacije tn elementa 1, 2 i 3 su
123 213 312132 231 321
Zaista, broj moguéih permutacija tn razliäita elementa je P (3) = 3! 6.Zapazimo da treba voditi raëuna o toèno odredenom postupku formiranja niza permutacija.
Na prvo nijesto prvo stavimo 1 i permutiramo ostala dva elementa (prvi stupac), zatim na prvomjesto stavimo 2 i permutiramo ostala dva elementa (drugi stupac) i na kraju na prvo mjestostavimo 3 i permutiramo ostala dva elementa (treéi stupac).
Primjer 2. Na koliko se naëina mogu poredati slova a, b, c, d. Napisati sve moguée permutacije.
LII]Li
[Ir
A Osnove konibinatorike 255
Ad. Broj moguéih permutacija bez ponavijanja je P (4) = 4! = 24 i to su
abed bacd cabd dabeabde bade cadb daebaebd bead cbad dbacacdb beda ebda dbcaadbc bdac dab dcabadcb bdca cdba deba
Istakaimo i ovdje postupak kojim Sn formirane permutacije bez ponavijanja. Prvo, na prvomjesto stavimo a i permutiramo ostala tn elementa (takvih permutacija je 6), zatirn slijedi 6permutacija s b na poëetku, a zatim s e i na kraju 6 permutacija s d na poaetku. Analogno sepostupa i S vie elemenata.
Primjer 3. Neka imamo pet razlieitih elemenata: a, 6, e, d, e. Koliko se moe naëinitipermutacija bez ponavijanja? Napisati stotu permutaciju.
Ad. I3roj moguéih permutacija bez ponavijanja je F(S) = 5! 24. 5 = 120. Kako je24•4 = 96, to znaëi daje 97—a permutacija osnovna permutacija S petim elementom na poeetku,tj.
eabcda slijedeóe permutacije su
eabde, eacbd, eacdbDakie, stota permutacija je eacdb .
Permutacije s ponavijanjem
Neka imamo n elemenata od kojih je r1 jednakih, r2 jednakih itd. jednakih, pri ëemuje r1 + r2 + - + r4 = ii. Svaki mogu& poredak tih m elemenata u nizu ëini jednupermutaciju S ponavijanjem.
Odredimo broj moguéih permutacija s ponavijanjem.Prvo, ako su svi elenienti razliëiti, tada je broj pernnutacija jednak n!.Neka je r elemenata jednakib. Skup svih permutacija raspada se na grupe od po n1 medu
sohno jednakih penmutacija. U jednu grupu ulaze one permutacije koje na istim mjestima sadreiste elemente, pa se njihovim penmutiranjem ne dobivaju nove permutacije. Otuda je broj permutacija s r1 medusobno jednakih elemenata p$ jednak broju tih grupa, tj.:
Sada neka je od preostalih ii — r elemenata njih r2 medusobno jednakih. Opet se ovaj skuppenmutacija raspada in grupe ad po r2! medusobno jednakih permutacija. U ovom sluöajn brojpermutacija P,$ jednak je:
nlp(n) —_____
—
256 A.2. Varijacije
Nastavljajuéi ovaj postupak, zakljuëujemo da je broj permutacija n elemenata s r1 jednakihelemenata, r2 jeduakih, itd. rj jednakib elemenata:
(n)—Pr],,-2 ,...,rk — ri!r21.rk.!
Primjer 4. Permutirati znamenke broja 2334.
Ad. Broj moguéih permutacija je 12. U pitanju su permutacije:
2334 3234 4233 1):2343 3243 43232433 3324 4332 ii
334234233432 P
Primjer 5. Koliko se mote dobiti brojeva permutirajuói znamenke broja 113336. Napisati I
nekoliko brojeva koji se dobiju na taj naãin.
Ad. Broj nioguéih permutaxija je U(5)
—6! 120 -6
—2,3 —
2’3’ 2-6 —
113336 131336113363 .
113633116333
A.2. Varijacije
Varijacije bez ponavijanja
Jzbor r elemenata od n razlieitih elemenata, uzimajuêi redoslijed u obzir, naziva se 31,varijacija bez ponavijanja r—tog razreda od n elemenata (r � n). Li
Odredimo broj svih moguéih varijacija bez ponavijanja. UZamislimo r pranih mjesta u nizu. Prvo rnjesto moguôe je popuniti na n razliëitih naãina,
jer imamo n razlieitih elemenata. Drugo mjesto, kada je prvo veó popunjeno, moguée je popunitina n — 1 naëin. Prema tome, prva dva mjesta u nizu mogii se popuniti na n’ (it — 1) naëina fJNastavljajuéi ovaj postupak, nalaiimo da ser mjesta moe popuniti na ii. (n — 1) ..
- [it — (r — 1)1razliëjtjh naOina. U
Prema tome, broj svih moéih varijacija bez ponavijanja r—tog razreda od it elemenata je Uv@) =n(m-1)...[n-(r-1)1,
ii
A. Osnove kombinatorike 257
odnosno
r�n.
U sluëaju r = ii oëevidno vrijedi da je
vr(n) = P (n)
tj. varijacije bez ponavijanja prelaze u permutacije bez ponavijanja od n elemenata. Dakie,permutacija n razlieitih elernenata ujedno je I varijacija n—tog razreda od ii razlieitih elemenata.
Primjer 6. Koliko se razliëitih troznamenkastih brojeva mote napisati od snamenki 2, 3, 4, 5,bez ponavijanja snamenki u jednom broju? Napisati te brojeve.
Ad. Broj razliëitih troznamenkastih brojeva jednak je
Evo tih brojeva:234 324 423 523243 342 432 532235 325 425 524253 352 452 542245 345 435 534254 354 453 543
Varijacije s ponavijarijem
Izbor r elemenata od n ra2liëitih elemenata, doputajuéi ponavijanje bib kojeg elementai us uvaavarije redoslijeda, naziva se varijacija s ponavijanjem r—tog razreda od nelemenata.
Zbog ponavijanja elemenata u jednom poretku ovdje moe biti I r > n.Do broja varijacija s ponavijanjem moemo doéi na isti naëin kao i kod broja varijacija bez
ponavijanja. Ovdje, svako ad r mjesta u nizu moemo popuniti na n razlieitih naëina, jer jedozvolj eno ponavlj anje elemenata.
Prema tome, broj svih varijacija s ponavijanjem r—tog razreda od n elemenata jednak je:
=
Primjer 7. Neka su zadane znamenke 1,2,3,4.a) Koliko se dvoznarnenkastih brojeva moe napisati ad danih znamenki? Napisi te brojeve.
258 A.3. Kombinacije
b) Koliko se troznamenkastih brojeva moe napisati od danih znameuki?
Ad. a) Broj dvoznamenkastih brojeva jednak je
V=42=16.
Evo tih brojeva:11 21 31 4112 22 32 4213 23 33 4314 24 34 44 n
b) Broj troznamenkastih brojeva jednak je
= 4 = 64.
Primjer 8. Koliko se moe napisati sedmeroznamenkastih brojeva koristeéi neparne znamenke, a koliko tako da:
a) svi zapoëinju s znamenkom 5,b) svi u sredini imaju zuamenku 1,c) svi zavravaju s 1,d) svi ixnaju zadnje dvije znarnenke 11.
Ad. U pitanju su znamenke: 1, 3, 5, 7, 9. Od ovih znamenki sedmeroznamenkastih brojevaxnoemO napisati: p
= = 78125. IiNadaije, traeni brojevi su
a) 5615625 5) 56, c) 56 d)55=3125 UPrimjer 9. U sportskoj prognozi imamo tn rezultata I dvanaest meëeva. Na kdliko naëina A
moemo prognozirati rezultate? UAd. Broj moguéih naãina jednak je broju varijacija s ponavijanjem 12—tog razreda od tn n
elexnenta: 0, 1, 2, tj. LiV =312=531441
A.3. Kombinacije jJ
Kombinacije bez ponavljanjaU
Svaki podskup od r eleinenata nekog skupa od ii (razlieitih) elemenata naziva sekombinacija bez pona-vljanja r—tog razreda od ii elemenata (r n).
Poredak elemenata u jedno] kombinaciji nije bitan. Dvije kombinacije an jednake samo ako 11sadre iste elemente bez obzira na njihov raspored.
Broj svih mogueih kombinacija bez ponavijanja odredit óemo pomoOu broja vanijacija bezponavijanja. IU
Li-7.
A. Osnove kombjnatorjke 259
Promatrajmo prvo skup svih varijacija bar ponavijanja r—tog razreda od n elemenata. Swte varijacije moemo rasporediti u skupine od kojih svaka sadri sarno one varijacije koje se norazilkuju p0 elementima veê samo p0 njihovorn poretku unutar sloga, jer uzmemo Ii bib kojuvarijaciju, tada 12 flJO moemo permutirajuéi elementc dobiti nove varijacije koje ée irnati istisadraj. Stoga svaka skupina sadri r! varijacija. S g1edita kombinacija, varijacije jedne skupinemedusobno su identiane kombinacije.
Stoga je broj kombinacija bez ponavijanja r—tog razreda od n elemenata jednak brojuskupina varijacija, tj.
TIO’)
ii
odnosno
(n)— lN —
it!— rI —
Dakie, ako se u svakoj kombinaciji bez ponavanja elementi medusobno permutiraju, dobivaju se varijacije bar ponavijanja. Stoga, broj moguéih varijacija bar ponavijanja moemoiskazati kao:
T/(n)_ (n r!=(n—r)!
Primjer 10. Od dvanaest zadataka student treba odabrati 4 zadatka. Na koliko naöina tomoe uiniti?
Ad. Broj moguéih naëina jednak je broju kombinacija bar ponavijanja 4—tog razreda od 12elemenata:
—(12\
—12• 11 . 10 . 9
——
4} 1•234 —
Primjer 11. Od 10 igraãa treba formirati momëad od 5 igraëa tako da u momëadi budu dvaunaprijed odabrana igraëa. Na koliko se naëina to mote uëiniti?
Ad. Traeni broj naëina Jo:(SN
—8 •7 6
— 563) 6
Primjer 12. Na koliko Jo naëina moguáe na sastanku od 30 sudionika izabrati 4, od kojihje jedan presjedavajuei, jedan diskutant, i p0 jedan prvi i drugi pomoénik?
Ad. U pitanju je broj moguOih varijacija bez ponavijanja
= (0) •4! = 657720
jer od 30 sudionika 4 noemo izabrati na broj mogu6ih naOina = (40), all svaku izabranueetvorku treba perniutirati obzirom na razliëite 4 funkcije. •
260 A.3. Kombinacije
Kombinacije s ponavijanjem
Svaki izbor od r elemenata nekog skupa od n razliëitih elemenata, bez obzira naredoslijed i uz moguánost ponavijanja bib kojeg elementa, naziva sokombinacija s ponavijanjem v—tog razreda od ii elemenata.
rT.Zbog ponavijanja elemenata ovdje moe biti i v > n. Dvije kombinacije s ponavijanjem su I
jednake samo ako sadre iste elemente bez obzira na njihov raspored.Broj svih rnoguOih kombinacija bez ponavijanja v—tog razreda od n elemenata jednak je
Li
(n)— (n+r—1
V
Primjer 13. Neka imamo ëetiri elementa 1, 2, 3, 4. Naniniti sve moguée kombinacije treéeg nrazreda i to: t -.
a) bez ponavijanja,b) s ponavijanjem.
Ad. Prvo zapazimo brojeve moguéih kombinacija: Li
c= () =4,=
() =20. [1Traene kombinacije su: a)
123 234 H124134
b) U111 222 333 444112 223 334 flH113 224 344 U114 233122 234123 244 U124133134144
Primjer 14. a) Bacaju so dvije kocke. Koliki je broj razlieitih ishoda (rezultata) bacanja I Ukoje su to moguánosti? Ub) Ako se baca k kocki, koliki je broj razlieitih ishoda bacanja?Ad. a) Broj razlieitih ishoda bacanja je [I
= C) = 21,
A. Osnove kornbinatorike 261
a to su11 22 33 44 55 6612 23 34 45 5613 24 35 4614 25 3615 2616
b) Broj razlieitih ishoda bacanja je
(6+/c— 1) . —
Primjena kombinatorike nekad se odnosi I na utvrdivanje broja moguéih uzoraka odredenogsadraja. Stoga, razmotrimo I taj sluãaj kroz slijedeéi prirujer.
Primjer 15. Pretpostavimo da medu N proizvoda ima M dobrih i N — M defektnihproizvoda. Na koliko se naëina moe formirati uzorak ad n proizvoda, au tako da se u ajemunalazi x dobrih i n — x defektnih proizvoda.
Ad. Primjetimo da ad ukupno M dobrih proizvoda treba uzeti njih x to se moe uOiniti na
GM) = ()razlieitih naëina, dok se ad ukupno N — M defektnih proizvoda treba uzeti 2i — x, a to se moeuëiniti na
0(NM) (N - M
n—xrazlieitih naäina. Uzorak ad x dobrih I n — z defektnih proizvoda nastaje spajanjem skupinedobrih i skupine defektnih. Otuda je broj moguéih formiranja uzoraka navedenog sadrajajednak:
0(M) .CM) —(MN .(N_MN
— .(N-M)!
x m—x — x) n—z) — (n—x)!(N—M—n+x)!
pri ëemu je: x ii — x N — M.
Kako vidimo ovdje se ëesto pojavijuje -vrijednost n! (n e N). Za izraëunavanje ii! za velikevrijednosti n moe se koristiti Stirlingova prib1ina formula:
iJ• .
Opéenito vrijedi ocjena (n e N):
12n+l) <n!<
262 A.3. Kombinacije
odakie se vidi da je
urn =1.Tt
Primjer 16. U dvorani je 25 studenata i 10 studentica. Na koliko se naëina moe formiratigrupa od 2 studenta i 3 studentice.?
Ad. Od 25 studenata 2 studenta rnoguôe je izabrati na broj naãina:
125N 25.242) =
2 =300.
Arialogno, broj izbora 3 od 10 studentica je:
(10)108
120
Bib kojoj grupi studenata mote se pridodati bib koja grupa studentica, pa je traeni broj: U’
() . () = 300. 120 = 36000 .1
iiU
[1;U
11:U
UnU
UA
Tablica B.i: Binomna razdioba B (n, p)
Vjerojatnosti P (X = k) = (jpk (1 )nk zapS 0,5.
Zap> 0,5 treba koristiti: (1 — = (m k) (1 — )flk .
Svakoj vrijednosti u ovoj tablici prethodi decimalni zarez.
pk 0,05 0,06 0,07 0,08 0,09 0,10 0,20 0,30 0,40 0,50
5 0 77378 73390 69569 65908 62403 5905 3277 1681 0778 03131 19363 23423 26182 28656 30859 3280 4096 3601 2592 15622 02143 02990 03941 04983 06104 0729 2048 3087 3456 31253 00113 00191 00297 00434 00604 0081 0512 1323 2314 31254 00003 00006 00012 00019 00029 0005 0064 0284 0768 15625 00000 00000 00000 00000 00001 0000 0003 0024 0102 0313
10 0 59874 53862 48398 43439 38942 3487 1074 0282 0060 00101 31512 34379 36429 37773 38513 3874 2684 1211 0404 0097 fl2 07464 09875 12334 14780 17141 1937 3020 2335 1209 04403 01047 01681 02476 03428 04521 0574 2013 2668 2150 11724 00097 00188 00327 00521 00782 0112 0881 2001 2508 20515 00006 00014 00029 00055 00093 0015 0264 1030 2007 24606 00000 00001 00002 00004 00008 0001 0055 0367 1114 20517 00000 00000 00000 00000 0000 0008 0090 0425 11728 0001 0015 0106 04-409 0000 0001 0016 0097
10 0000 0001 0010
15 0 46329 39529 33670 28630 24301 2059 0352 0047 0005 00001 36576 37847 38015 37343 36050 3431 1319 0306 0047 00052 13475 16911 20029 22730 24959 2669 2309 0915 0219 00323 03073 04677 06533 08566 10696 1285 2502 1701 0634 01394 00486 00896 014Th 02234 03174 0429 1876 2186 1268 04165 00056 00225 00244 00427 00690 0105 1031 2061 1859 09176 00005 00014 00031 00062 00114 0019 0430 1473 2066 15277 00000 00001 00003 00007 00014 0003 0139 0811 1771 19648 00000 00000 00001 00002 0000 0034 0348 1181 19649 00000 00000 0001 0115 0612 152710 0000 0030 0245 091711 0006 0074 041612 0001 0016 013913 0000 0003 003214 0000 000515 0000
iiNastavak na sljedeéoj stranici
Ii
n
B. Statisti&e tablice 265
pk 0,03 0,06 0,07 0,08 0,09 0,10 0,20 0,30 0,40 0,50
20 0 35849 29011 23424 18869 15164 1216 0115 0008 0000 00001 37735 37034 35262 32817 29996 2701 0577 0068 0005 00002 18868 22458 25214 27109 28183 2852 1369 0279 0031 00023 05958 08600 11387 14143 16724 1901 2053 0716 0124 00114 01333 02334 03642 05228 07029 0898 2182 1307 0350 00465 00224 00476 00878 01454 02225 0319 1746 1789 0746 01486 00030 00076 00165 00316 00550 0089 1091 1916 1244 03707 00003 00010 00025 00055 00109 0020 0546 1643 1659 07398 00000 00001 00003 00008 00017 0003 0221 1144 1797 12019 00000 00000 00001 00003 0001 0074 0653 1597 160210 00000 00000 0000 0020 0309 1172 176211 0005 0120 0710 160212 0001 0038 0355 120113 0003 0049 073914 0013 037015 0003 014816 0000 004617 001118 000219 0000
30 0 21464 15626 11337 08197 05905 0424 0012 0000 0000 00001 33890 29921 25599 21382 17522 1413 0093 0003 0000 00002 25864 27693 27939 26961 25126 2277 0337 0018 0000 00003 12705 16498 19627 21881 23194 2360 0785 0072 0003 00004 04513 07108 09972 12843 15484 1771 1325 0209 0012 00005 01236 02359 03903 05807 07963 1023 1723 0464 0042 000’6 00271 00628 01224 02104 03281 0474 1795 0829 0115 00057 00049 00137 00316 00628 01113 0180 1538 1219 0263 00198 00007 00025 00068 00156 00316 0058 1105 1501 0505 00559 00001 00004 00013 00034 00077 0015 0676 1573 0823 013310 00000 00001 00002 00006 00016 0004 0355 1416 1152 028011 00000 00000 00001 00002 0001 0161 1103 1396 050812 00000 00001 0000 0064 0748 1474 080613 00000 0022 04-44 1360 111514 0007 0232 1101 135515 0002 0105 0783 144416 0000 0043 0490 135517 0015 0279 111518 0004 0119 080619 0002 0054 050820 0000 0020 028021 0007 013322 0002 005523 0000 001924 000525 000226 0000
Tablica B.2: Binomna razdioba B (it, p)
kVjerojatnosti P(X�k)= (k=0,1,..• ,r)
i=1
pk 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,80 0,90
5 0 0,5905 0,3277 0,2373 0,1681 0,0778 0,0312 0,0102 0,0024 0,0003 0,00001 0,9185 0,7373 0,6328 0,5282 0,3370 0,1875 0,0870 0,0308 00067 0,00052 0,9914 0,9421 0,8965 0,8369 0,6826 0,5000 0,3174 0,1631 0,0579 0,00863 1,0000 0,9933 0,9844 0.9692 0,9130 0,8125 0,6630 0,4718 0,2627 0,08154 1,0000 0,9997 0,9990 0,9976 0,9898 0,9688 0,9222 0,8319 0,6723 0,40955 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
10 0 0,3487 0,1074 0,0563 0,0282 0,0060 0,0010 0,0001 0,0000 0,0000 0,00001 0,7361 0,3758 0,2440 0,1493 0,0464 0,0107 0,0017 0,0001 0,0000 0,00002 0,9298 0,6778 0,5256 0,3828 0,1673 0,0547 0,0123 0,0016 0,0001 0,00003 0,9872 0,8791 0,7759 0,6496 0,3823 0,1719 0,0548 0,0106 0,0009 0,00004 0,9984 0,9672 0,9219 0,8497 0,6331 0,3770 0,1662 0,0474 0,0064 0,00025 0,9999 0,9936 0,9803 0,9527 0,8338 0,6230 0,3669 0,1503 0,0328 0,00166 1,0000 0,9999 0,9965 0,9894 0,9452 0,8281 0,6177 0,3504 0,1209 0,01287 1,0000 1,0000 0,9996 0,9984 0,9877 0,9453 0,8327 0,6172 0,3200 0,07028 1,0000 1,0000 1,0000 0,9990 0,9983 0,9893 0,9536 0,8507 0,2642 0,26399 1,0000 1,0000 1,0000 1,0000 0,9999 0,9990 0,9940 0,9718 0,8926 0,651310 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
15 0 0,2059 0,0352 0,0134 0,0047 0,0005 0,0000 0,0000 0,0000 0,0000 0,00001 0,5490 0,1671 0,0802 0,0353 0,0052 0,0005 0,0000 0,0000 0,0000 0,0000 [12 0,8159 0,3980 0,2361 0,1268 0,0271 0,0037 0,0003 0,0000 0,0000 0,0000 U’3 0,9444 0,6482 0,4613 0,2969 0,0905 0,0176 0,0019 0,0001 0,0000 0,00004 0,9873 0,8358 0,6865 0,5155 0,2173 0,0592 0,0094 0,0007 0,0000 0,00005 0,9978 0,9389 0,8516 0,7216 0,4032 0,1509 0,0338 0,0037 0,0001 0,0000 Li6 0,9997 0,9819 0,9434 0,8689 0,6098 0,3036 0,0951 0,0152 0,0008 0,00007 1,0000 0,9958 0,9827 0,9500 0,7869 0,5000 0,2131 0,0500 0,0042 0,00008 1,0000 0,9999 0,9958 0,9848 0,9050 0,6964 0,3902 0,1311 0,0181 0,00039 1,0000 1,0000 0,9992 0,9963 0,9662 0,8491 0,5968 0,2784 0,0611 0,002310 1,0000 1,0000 0,9999 0,9993 0,9907 0,9408 0,7827 0,4845 0,1642 0,012711 1,0000 1,0000 1,0000 0,9999 0,9981 0,9824 0,9095 0,7031 0,3518 0,055612 1,0000 1,0000 1,0000 1,0000 0,9997 0,9963 0,9729 0,8732 0,6020 0,1841 U13 1,0000 1,0000 1,0000 1,0000 1,0000 0,9995 0,9948 0,9647 0,8329 0,451014 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9995 0,9953 0,9648 0,794115 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Nastavalc na sljedeéoj stranici
Li
iiLi
UUA
B. Statisti&e tablice 267
pk 0,10 0,20 0,25 0,30 0,40 0,50 0,60 0,70 0,80 0,90
20 0 0,1216 0,0115 0,0032 0,0008 0,0000 0,0000 0,0000 0,0000 0,0000 0,00001 0,3917 0,0692 0,0243 0,0076 0,0005 0,0000 0,0000 0,0000 0,0000 0,00002 0,6769 0,2061 0,0913 0,0355 0,0036 0,0002 0,0000 0,0000 0,0000 0,00003 0,8670 0,4114 0,2252 0,1071 0,0160 0,0013 0,0001 0,0000 0,0000 0,00004 0,9568 0,6296 0,4148 0,2375 0,0510 0,0059 0,0003 0,0000 0,0000 0,00005 0,9887 0,8042 0,6172 0,4164 0,1256 0,0207 0,0016 0,0000 0,0000 0,00006 0,9976 0,9133 0,7858 0,6080 0,2500 0,0577 0,0065 0,0003 0,0000 0,00007 0,9996 0,9679 0,8982 0,7723 0,4159 0,1316 0,0210 0,0013 0,0000 0,00008 0,9999 0,9900 0,9591 0,8867 0,5956 0,2517 0,0565 0,0051 0,0001 0,00009 1,0000 0,9974 0,9861 0,9520 0,7553 0,4119 0,1275 0,0171 0,0006 0,000010 1,0000 0,9994 0,9961 0,9829 0,8725 0,5881 0,2447 0,0480 0,0026 0,000011 1,0000 0,9999 0,9991 0,9949 0,9435 0,7483 0,4044 0,1133 0,0100 0,000112 1,0000 1,0000 0,9998 0,9987 0,9790 0,8684 0,5841 0,2277 0,0321 0,000413 1,0000 1,0000 1,0000 0,9997 0,9935 0,9423 0,7500 0,3920 0,0867 0,002414 1,0000 1,0000 1,0000 1,0000 0,9884 0,9793 0,8744 0,5836 0,1958 0,011315 1,0000 1,0000 1,0000 1,0000 0,9997 0,9941 0,9094 0,7625 0,3704 0,043216 1,0000 1,0000 1,0000 1,0000 1,0000 0,9987 0,9840 0,8929 0,5886 0,133017 1,0000 1,0000 1,0000 1,0000 1,0000 0,9998 0,9964 0,9645 0,7939 0,323118 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9995 0,9924 0,9308 0,608319 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 0,9992 0,9885 0,878420 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
Tablica W3: Poissonova razdioba Po(A). Vjerojatnosti F (X = k) =
Svakoj vrijednosti u ovoj tablici prethodi decimalni zarez.
Ak 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,00 90484 81873 74082 67032 60653 54881 49659 44933 40657 367881 09048 16374 22225 26813 30327 32929 34761 35946 36591 367882 00452 01638 03334 05363 07582 09879 12166 14379 16466 183943 00015 00109 00333 00715 01264 01976 02839 03834 04940 061314 00000 00006 00025 00072 00168 00296 00497 00767 01112 01533
n5 00000 00002 00006 00016 00036 00070 00123 00200 003076 00000 00000 00001 00004 00008 00015 00030 00051 -
7 00000 00000 00001 00002 00004 000078 00000 00000 00000 000009 00000 U
k 2 3 4 5 6 7 8 9 10 110 13534 04979 01832 00674 00248 00091 00034 00012 00005 000021 27067 14936 07326 03369 01487 00638 00268 00111 00045 000182 27067 22404 14653 08422 04462 02234 01074 00500 00227 00101 [1
3 18045 22404 19537 14037 08924 05213 02863 01499 00757 003174 09022 16803 19537 17457 13385 09123 05725 03374 01892 01019
5 03609 10082 15629 17547 16062 12772 09160 06073 03783 02242 L6 01203 05041 10420 14622 16062 14900 12214 09109 06306 041107 00344 02160 05954 10445 13768 14900 13959 11712 09008 06458 1!,8 00086 00810 02977 06528 10326 13038 13959 13176 11260 08879 U9 00019 00270 01323 03627 06884 10141 12408 13176 12511 10853
S10 00004 00081 00529 01813 04130 07098 09926 11858 12511 11938 Ii11 00001 00022 00193 00824 02253 04517 07219 09702 11374 1193812 00000 00006 00064 00343 01126 02635 04813 07277 09478 1094313 00001 00020 00132 00520 01419 02962 05038 07291 0925014 00000 00006 00047 00223 00709 01692 03238 05208 07275 b
15 00002 00016 00089 00331 00903 01943 03472 05335 516 00000 00005 00033 00145 00451 01093 02170 03668 517 00001 00012 00060 00212 00579 01276 0237318 00000 00004 00023 00094 00289 00709 0145019 00001 00009 00040 00137 00373 00840 [120 00000 00003 00016 00062 00187 0046221 00001 00006 00026 00089 0024322 00000 00002 00011 00040 00121 L23 00001 00004 00017 0005824 00000 00002 00007 00027 525 00001 00003 00012 U26 00000 00001 0000527 00000 0000228 0000129 00000
[1
B. Statisti&e tablice 269
kTabhca B.4: Poissonova razdioba Po (A). Vjerojatnosti P (X <k) = (k = 0, r)
Ak 0,1 0,2 0,3 0,4 0,5 j 0,6 j 0,7 0,8 0,90 0,9048 0,8187 0,7408 0,6730 0,6065 0,5488 0,4966 0,4493 0,40661 0,9953 0,9825 0,9631 0,9384 0,9098 0,8781 0,8442 0,8088 0,77252 0,9998 0,9989 0,9964 0,9921 0,9856 0,9769 0,9659 0,9526 0,93713 1,0000 0,9999 0-9997 0,9992 0,9982 0,9966 0,9942 0,9909 0,98654 1,0000 1,0000 0,9999 0,9998 0,9996 0,9992 0,9986 0,99775 1,0000 1,0000 1,0000 0,9999 0,9998 0,99976 1,0000 1,0000 1,0000
Ak 1,o(1,512,0j2,513,o0 0,3679 0,2231 0,1353 0,0821 0,49791 0,7358 0,5578 0,4060 0,2873 0,19912 0,9197 0,8088 0,6767 0,5438 0,42323 0,9810 0,9344 0,8571 0,7576 0,64724 0,9963 0,9814 0,9473 0,8912 0,81535 0,9994 0,9955 0,9834 0,9580 0,91616 0,9999 0,9991 0,9955 0,9858 0,96657 1,0000 0,9998 0,9989 0,9958 0,98818 1,0000 0,9998 0,9989 0,99629 1,0000 0,9997 0,998910 0,9999 0,999711 1,0000 0,999912 1,000013 1,0000 0,9999 0,9997 0,999314 1,0000 0,9999 0,999815 1,0000 0,999916 1,0000
8,5 9,0 9,50,0002 0,0001 0,00010,0019 0,0012 0,00080,0093 0,0062 0,00420,0301 0,0212 0,01490,0744 0,0550 0,04030,1496 0,1157 0,08850,2562 0,2068 0,16490,3856 0,3239 0,26870,5231 0,4557 0,39180,6530 0,5874 0,52180,7634 0,7060 0,64530,8487 0,8030 0,75200,9091 0,8758 0,83640,9486 0,9267 0,89810,9726 0,9585 0,94000,9862 0,9780 0,9665
3,50,03020,13590,32080,53660,72540,85760,93470, 97330,99010,99670,99900,99970,9999
4,0 4,5 5,00,0183 0,0111 0,00670,0916 0,0611 0,04040,2381 0,1736 0,12470,4335 0,3423 0,26500,6288 0,5321 0,44050,7851 0,7029 0,61600,8893 0,8311 0,76220,9489 0,9134 0,86660,9786 0,9597 0,93190,9919 0,9829 0,96820,9972 0,9933 0,98630,9991 0,9976 0,99450,9997 0,9992 0,9980
Ak 6,0 ( 6,5 J 7,0 7,5 8,00 0,0041 0,0025 0,0015 0,0009 0,0006 0,00031 0,0266 0,0174 0,0113 0,0073 0,0047 0,00302 0,0884 0,0620 0,0430 0,0296 0,0203 0,01383 0,2017 0,1512 0,1118 0,0818 0,0591 0,04244 0,3575 0,2851 0,2337 0,1730 0,1321 0,09965 0,5289 0,4457 0,3690 0,3007 0,2414 0,19126 0,6860 0,6063 0,5265 0,4497 0,3782 0,31347 0,8095 0,7440 0,6728 0,5987 0,5246 0,45308 0,8944 0,8472 0,7916 0,7291 0,6620 0,59259 0,9462 0,9161 0,8774 0,8305 0,7764 0,716610 0,9747 0,9574 0,9332 0,9015 0,8622 0,815911 0,9890 0,9799 0,9661 0,9466 0,9208 0,888112 0,9955 0,9912 0,9840 0,9730 0,9573 0,936213 0,9983 0,9964 0,9929 0,9872 0,9784 0,965814 0,9994 0,9986 0,9970 0,9943 0,9897 0,982715 0,9998 0,9995 0,9988 0,9976 0,9954 0,9918
Nastavak na sljedeêoj stranici
I AkJ 6,0 6,5 7,0 8,0 8,5 9,016 1,0000 0,9996 0,9996 0,9990 0,9980 0,9963 0,9934 0,9889 0,982317 1,0000 0,9999 0,9998 0,9996 0,9992 0,9984 0,9970 0,9947 0,991118 1,0000 0,9999 0,9999 0,9997 0,9994 0,9987 0,9976 0,995719 1,0000 1,0000 0,9999 0,9997 0,9995 0,9989 0,998020 1,0000 0,9999 0,9998 0,9996 0,999121 1,0000 0,9999 0,9998 0,999622 1,0000 0,9999 0,999923 1,0000 0,999924 1,0000
Ak 10,0 11,0 j 12,0 13,0 14,0 15,0 16,0 17,0 18,00 0,0000 0,0000 0,00001 0,0005 0,0002 0,0001 0,00002 0,0028 0,0012 0,0005 0,0002 0,00003 0,0103 0,0049 0,0023 0,0010 0,0001 0,0000 0,00004 0,0293 0,0151 0,0076 0,0037 0,0005 0,0002 0,00001 0,0000 0,00005 0,0671 0,0375 0,0203 0,0107 0,0018 0,0009 0,0004 0,0002 0,00016 0,1301 0,0786 0,0458 0,0259 0,0055 0,0028 0,0014 0,0007 0,00037 0,2202 0,1432 0,0895 0,0540 0,0142 0,0076 0,0040 0,0021 0,00108 0,3328 0,2320 0,1550 0,0998 0,0316 0,0180 0,0100 0,0054 0,00299 0,4579 0,3405 0,2424 0,1658 0,0621 0,0374 0,0220 0,0126 0,007110 0,5830 0,4599 0,3472 0,2517 0,1094 0,0699 0,0433 0,0261 0,015411 0,6968 0,5793 0,4616 0,3532 0,1757 0,1185 0,0774 0,0491 0,030412 0,7916 0,6887 0,5760 0,4631 0,2600 0,1848 0,1270 0,0847 0,054913 0,8645 0,7813 0,6815 0,5730 0,3585 0,2676 0,1931 0,1350 0,091714 0,9165 0,8540 0,7720 0,6751 0,4664 0,3632 0,2745 0,2009 0,142615 0,9513 0,9074 0,8444 0,7636 0,5704 0,4657 0,3675 0,2808 0,208116 0,9730 0,9441 0,8987 0,8355 0,6694 0,5681 0,4667 0,3715 0,286717 0,9857 0,9678 0,9370 0,8905 0,7559 0,6641 0,5660 0,4677 0,375018 0,9928 0,9823 0,9626 0,9302 0,8272 0,7489 0,6593 0,5640 0,468619 0,9965 0,9907 0,9787 0,9573 0,8826 0,8195 0,7423 0,6550 0,562220 0,9984 0,9953 0,9884 0,9750 0,9235 0,8752 0,8122 0,7363 0,650921 0,9993 0,9977 0,9939 0,9859 0,9521 0,9170 0,8682 0,8055 0,730722 0,9997 0,9990 0,9970 0,9924 0,9712 0,9469 0,9108 0,8615 0,799123 0,9999 0,9995 0,9985 0,9960 0,9833 0,9673 0,9418 0,9047 0,858124 1,0000 0,9998 0,9993 0,9980 0,9907 0,9805 0,9633 0,9367 0,898925 0,9999 0,9997 0,9990 0,9950 0,9888 0,9777 0,9594 0,931726 1,0000 0,9999 0,9995 0,9974 0,9938 0,9869 0,9748 0,955427 0,9999 0,9998 0,9987 0,9967 0,9925 0,9848 0,971828 1,0000 0,9999 0,9994 0,9983 0,9959 0,9912 0,982729 1,0000 0,9997 0,9991 0,9978 0,9950 0,989730 0,9999 0,9996 0,9989 0,9973 0,994131 0,9999 0,9998 0,9994 0,9986 0,996732 1,0000 0,9999 0,9997 0,9993 0,998233 1,0000 0,9999 0,9996 0,999034 0,9999 0,9998 0,999535 1,0000 0,9999 0,999836 1,0000 0,999937 1,0000
11U
B. Statistj&e tablice 271
Tablica B.5: Vrijednosti funkcije Laplacea (x) =
Svakoj vrijednosti u ovoj tablici prethodi decimalni zarez.
[x r0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 00000 00399 00798 01197 01595 01994 02392 02790 03188 035860,1 03983 04380 04776 05172 05567 05962 06356 06749 07142 075350,2 07926 08317 08706 09095 09483 09871 10257 10642 11026 114090,3 1171 12E72 12552 12930 13307 13683 14058 144•1 14803 151730,4 15542 15910 16276 16640 17003 17364 17724 18082 18439 18793
0,5 19146 19497 19847 20194 20540 20884 21226 21566 21904 222400,6 22575 22907 23237 23565 23891 24215 24537 24857 25175 254900,7 25804 26115 26424 26730 27035 27337 27637 27935 28230 285240,8 28814 2913’ 29389 29673 29955 30234 30511 30j85 31057 313270,9 31594 31859 32121 32381 32639 32894 33147 33398 33646 33891
1,0 34134 34375 34614 34850 35083 35314 35543 35769 35993 362141,1 36433 36650 36864 37076 37286 37493 37698 37900 38100 382981,2 38493 38686 38877 39065 39251 39435 39617 39796 39973 401471,3 40320 40490 40658 40824 40988 41149 41309 41466 41621 4177414 41924 42073 42220 42364 42507 42647 42786 42922 43056 43189
1,5 43319 43488 43574 43699 43822 43943 44062 44179 44295 444081,6 44520 44630 44738 44845 44950 45053 45154 45254 45352 454491,7 45543 45637 45728 45818 45907 45994 46080 46164 46246 463271,8 46407 46485 46562 46638 46712 46784 46856 46926 46995 470621,9 47128 47193 47257 47320 47381 47441 47500 47558 47615 47670
2,0 47725 47778 47831 47882 47932 47982 48030 48077 48124 481692,1 48214 48257 48300 48341 48382 48422 48461 48500 48537 485742,2 48610 48645 48679 48713 48745 48778 48809 48840 48870 488992,3 48928 48956 48983 49010 49036 49061 49086 49111 49134 491582,4 49180 49202 49224 49245 49266 49286 49305 49324 49343 49361
2,5 49379- 49396 49413 49430 49446 49461 49477 49492 49506 495202,6 49534 49547 49560 49573 49585 49598 49609 49621 49632 496432,7 49653 49664 49674 49683 49693 49702 49711 49720 49728 497362,8 49744 49752 49760 49767 49774 49781 49788 49795 49801 498072,9 49813 49819 49825 49831 49836 49841 49846 49851 49856 49861
3,0 49865 49869 49874 49878 49882 49886 49889 49893 49897 499003,1 49903 49906 49910 49913 49916 49918 49921 49924 49926 499293,2 49931 49934 49936 49938 49940 49942 49944 49946 49948 499503,3 49952 49953 49955 49957 49958 49960 49961 49962 49964 499653,4 49966 49968 49969 49970 49971 49972 49973 49974 49975 499763,5 49976744,0 49996834,5 49999665,0 4999997
Tablica B.6: Standardna normairia razdioba N (0, 1)
Vjerojatnosti P (Z <z) = (z)
z 9,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09-5,0 0,0000003-4,5 0,0000034-4,0 0,0000317-3,5 0,0002326
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-2,9 0,0019 0,0018 0,0017 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,00362,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233-1,8 0,0359 0,0352 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0722 0,0708 0,0694 0,0681-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,09851,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379 U!-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867 ii-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148 [1-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247 Li-0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
Nastavalc na sljedeãoj straniciU(1
11ii
L666666’0o’c9966666’Oc’T’g896666’o0’T’VL9L66602’
8666’OL666’0L666’0L666’0L666’0L666’0L666’0L666’0L666’02666’0T”C2666’0966609666’09666’09666’09666’09666’02666’09666’09666’0‘$9666’09666’09666’0666’0T’666’0T’666’0f’666’017666’08666086660t$£666’08666’01666’0%666’01666’01666’O1666’0166601666’00666’0[‘80666’00666’0686606866’06866’08866’08866’0L866’0L866’0L866’00’C
9866’09866’09866’098660T’866’0866’0$86603866’O1866’01866’0631866L00866’06L66’O6L66’O8L66’0LL66’0LL66L09L66’09L66OVL66’083VL66’0$L66’01L66’01L66’00L66’06966’089660L966’09966’o9966’ot3T’966’0$966’O1966’0!966’0096606266’0L966’09266’09966’o£966’o9’g196601966’06V66’08f66’091’66’0cT’66’081’66<0U’660Ot’66’08866’09’1
98660t’866’0l$66’0186606166’01Z66’09366’0ZZ66’00366081660V391660$166’01t66’06066’09066’0t066’01066’O8686’09686’0£686’0$‘g0686’0L886’0fl86’01886’08L86’02L86’01L86’08986’0V986’0t98Wo1’3L986’0J’986’0086’09V86’01t86’08$86’0T’886’00$96’09186’01186’01’gL186’03186’08086’0$086’086L6’0$6L6’088L6L0£2L6’08LL6’01LL6’00’3
L9L6’019L6’099L6’009L6’0VtL6’088L6’0l$L6’091L6’061L6’0$1L6’O6’!90L6’066960$69609896’08L96’0LL96’0V996’09996’o6V96’0U’96’08’1£89609196’0919608096’0669601696’01896’0£L96’0T’996’0V226’0Ci21’26’09$26’09196’09t26’09096’096t6’0t8i’6’0tL6’0£96’0181’6’0911VP6’063t6’0816’090T’6’01’6$6’038$6’00L86’0Lc$6’09fl6’0388609’!
61$6’Q90$6’03616’08226’0993601$36’0983603366’0L036’016T6’0f’12.L16’039160L1’16’01$16’09116’06606’03806’0990W06V06’O380608’!91060266800868’019680M’68’09368’02068’0888806988’061’88’03’!0888’00188’0O6LWO02L8’06W2’06328’08028’09898’09998’0C198’01’-[119806698’02L08’0N98’01898’08098’0281’8’019P8’08$V8’0£IT’8’0ol
6888’0998800fl8’09188068180938’088380313809818’o62!8’06’0tg’o901808L08’01908’0$10809662’0L96L’0686L’0016201882’08’0198L’0£18L06LL’019LL’0t8LL’0tOLL’0$L9L’0lP92’0119L’0082L’0L’06f’9L0LI2L’098L’0VQJ’L’Ollfl’0688L0LQ8L0fl$L’016120L932’09’0flZL’0061L’0L9IL’0£ZIL’08802,0T’QOL’O610L’09869’00969’0916902’0
6L89’0fl89’08089’012L9’09$L9’000290999’08399’01699’0T’999’0VoL199’008V9’08fl9’0901’9’089$9’0t8$9’0$639’09939’02139062t9’0COW19’O80190909’09109’02869081’69’00169’01L82’03889’0£62901’0$9220tILQ’0929909899’09629’02999’0L199’08LtQ’0881’2’0868201’0698906189’0622906$39’066t2’00919’00312’00809’0oT’Oc’Ooooc’o00
60080’0L0’090’090’0P0’080010010’000’0
£23aDiqeIa)i2sie45•2
Tablica B.9: Hikvadrat razdioba sa ii stupnjeva slobode x2 (n)
Vrijednosti X,a za koje je P (x. x,0) = a
a0,99 [ 0,975 0,95 0,05 j 0,025 0,01
1 0,00016 0,00098 0,0039 3,8 5,0 6,62 0,020 0,051 0,103 6,0 7,4 9,23 0,115 0,216 0,352 7,8 9,4 11,34 0,297 0,484 0,711 9,5 11,1 13,35 0,554 0,831 1,15 11,1 12,8 15,1
6 0,872 1,24 1,64 12,6 14,4 16,87 1,24 1,69 2,17 14,1 16,0 18,58 1,65 2,18 2,73 15,5 17,5 20,19 2,09 2,70 3,33 16,9 19,0 21,710 2,56 3,25 3,94 18,3 20,5 23,2
11 3,05 3,82 4,57 19,7 21,9 24,712 3,57 4,40 5,23 21,0 23,3 26,213 4,11 5,01 5,89 22,4 24,7 27,714 4,66 5,63 6,57 23,7 26,1 29,115 5,23 6,26 7,26 25,0 27,5 30,6
16 5,81 6,91 7,96 26,3 28,8 32,017 6,41 7,56 8,67 27,6 30,2 33,418 7,01 8,23 9,39 28,9 31,5 34,819 7,63 8,91 10,1 30,1 32,9 36,220 8,26 9,59 10,9 31,4 34,2 37,6
21 8,90 10,3 11,6 32,7 35,5 38,922 9,54 11,0 12,3 33,9 36,8 40,323 10,2 11,7 13,1 35,2 38,1 41,624 10,9 12,4 13,8 36,4 39,4 43,0 Ii25 11,5 13,1 14,6 37,7 40,6 44,3 Li26 12,2 13,8 15,4 38,9 41,9 45,6 fl!27 12,9 14,6 16,2 40,1 43,2 47,0 U28 13,6 15,3 16,9 41,3 44,5 48,329 14,3 16,0 17,7 42,6 45,7 49,6
n30 15,0 16,8 18,5 43,8 47,0 50,9U
40 22,2 24,4 26,5 55,8 59,3 63,750 29,7 32,4 34,8 67,5 71,4 76,2 S60 37,5 40,5 43,2 79,1 83,3 88,4 Li70 45,4 48,8 51,7 90,5 95,0 100,480 53,5 57,2 60,4 101,9 106,6 112,390 61,8 65,6 69,1 113,1 118,1 124,1 U100 70,1 74,2 77,9 124,3 129,6 135,8
Un
Li
I1
B. Statistiëke tablice 277
Tablica B.10: Studentova razdioba san stupujeva slobode t (n)
Vrijednosti x = (p),gdje je 0,, funkcija razdiobe vjerojatnosti: G,1(x) = P (t,, S x) = p.
Ii p0,90 0,95 j 0,975 0,99 0,995
1 3,078 6,314 12,706 31,821 63,6572 1,886 2,920 4,303 6,965 9,9253 1,638 2,353 3,182 4,541 5,8414 1,533 2,132 2,776 3,747 4,6045 1,476 2,015 2,571 3,365 4,032
6 1,440 1,943 2,447 3,143 3,7077 1,415 1,895 2,365 2,998 3,4998 1,397 1,860 2,306 2,896 3,3559 1,383 1,833 2,262 2,821 3,25010 1,372 1,812 2,228 2,764 3,169
11 1,363 1,796 2,201 2,718 3,10612 1,356 1,782 2,179 2,681 3,05513 1,350 1,771 2,160 2,650 3,01214 1,345 1,761 2,145 2,624 2,97715 1,341 1,753 2,131 2,602 2,947
16 1,337 1,746 2,120 2,583 2,92117 1,333 1,740 2,110 2,567 2,89818 1,330 1,734 2,101 2,552 2,87819 1,328 1,729 2,093 2,539 2,86120 1,325 1,725 2,086 2,528 2,845
21 1,323 1,721 2,080 2,518 2,83122 1,321 1,717 2,074 2,508 2,81923 1,319 1,714 2,069 2,500 2,80724 1,318 1,711 2,064 2,492 2,79725 1,316 1,708 2,060 2,485 2,787
26 1,315 1,706 2,056 2,479 2,77927 1,314 1,703 2,052 2,473 2,77128 1,313 1,701 2,048 2,467 2,76329 1,312 1,669 2,045 2,462 2,756
1,282 1,645 1,960 2,326 2,576
Tablica B.11: Studentova razdioba sa n stupnjeva slobode t (n)
Vrijednosti t,. za koje je P (ItI � tna) = a
a0,10 0,05 0,02 0,0iJ0,002 0,001
1 6,31’ 12,7 31,82’ 63,7 318,3 637,02 2,92 4,30 6,97 9,92 22,33 31,63 2,35 3,18 4,54 5,84 10,22 12,94 2,13 2,78 3,75 4,60 7,17 8,615 2,01 2,57 3,37 4,03 5,89 6,86
6 1,94 2,45 3,14 3,71 5,21 5,967 1,89 2,36 3,00 3,50 4,79 5,408 1,86 2,31 2,90 3,36 4,50 5,049 1,83 2,26 2,82 3,25 4,30 4,7810 1,81 2,23 2,76 3,17 4,14 4,59
11 1,80 2,20 2,72 3,11 4,03 4,4412 1,78 2,18 2,68 3,05 3,93 4,3213 1,77 2,16 2,65 3,01 3,85 4,2214 1,76 2,14 2,62 2,98 3,79 4,1415 1,75 2,13 2,60 2,95 3,73 4,07
16 1,75 2,12 2,58 2,92 3,69 4,0117 1,74 2,11 2,57 2,90 3,65 3,9618 1,73 2,10 2,55 2,88 3,61 3,9219 1,73 2,09 2,54 2,86 3,58 3,8820 1,73 2,09 2,53 2,85 3,55 3,85
21 1,72 2,08 2,52 2,83 3,53 3,8222 1,72 2,07 2,51 2,82 3,51 3,7923 1,71 2,07 2,50 2,81 3,49 3,7724 1,71 2,06 2,49 2,80 3,47 3,7425 1,71 2,06 2,49 2,79 3,45 3,72 1126 1,71 2,06 2,48 2,78 3,44 3,7127 1,71 2,05 2,47 2,77 3,42 3,69 I_s28 1,70 2,05 2,46 2,76 3,40 3,6629 1,70 2,05 2,46 2,76 3,40 3,6630 1,70 2,04 2,46 2,75 3,39 3,65
U40 1,68 2,02 2,42 2,70 3,31 3,5560 1,67 2,00 2,39 2,66 3,23 3,46120 1,66 1,98 2,36 2,62 3,17 3,37
1,64 1,96 2,33 2,58 3,09 3,29
U!
UIi
-
I_fl
ct. CD
—0
-
CCD
Literatura
i} 2. Paue, Vjerojatnost, Skoiska knjiga, Zagreb 2003.
[2] 2. Paue, Uvod u matematieku statistiku, ko1ska kujiga, Zagreb 2002.
[3] 2. Paue, Vjerojatnost - Informacija - Stohastieki procesi, ko1ska knjiga, Zagreb 1974
[4] 1. Pavliô, Statistieka teorija i primjena, Tehnieka knjiga, Zagreb, 1977.
[5] N. Sarapa, Teorija vjerojatnosti, ko1ska kujiga, Zagreb, 2002.
[6] M. I1ijaeviá i 2. Paue, Rijeeni primjeri i zadaci iz vjerojatnosti i statistike, “Zagreb”,Zagreb, 2000.
[7] N. Elezovie, Zbirka zadataka 12 teorije vjerojatnosti, Liber, Zagreb, 1982.
[Nap.) Buduéi se radi o standardnom sadraju, u popisu je samo preporuëena literatura.
283