114
Sadržaj 1. Uvod u Excel .............................................................................................................................. 1 1.1. Startovanje Excela............................................................................................................... 2 1.2. Radno okruženje ................................................................................................................. 2 1.3. Radni papir i ćelija.............................................................................................................. 2 1.4. Upisivanje i kretanje po ćelijama ..................................................................................... 4 1.5. Formatiranje ćelija .............................................................................................................. 5 1.6. Formatiranje decimalnih brojeva ..................................................................................... 5 1.7 Menjanje boje pozadine i teksta ćelije.............................................................................. 6 1.8 Podešavanje širine i visine ćelija. Ubacivanje i izbacivanje redova i kolona .............. 6 1.9 Spajanje ćelija ....................................................................................................................... 7 1.10 Uokvirivanje ćelija ............................................................................................................. 7 1.11 Premeštanje i kopiranje ćelija .......................................................................................... 8 1.12 Snimanje i zatvaranje dokumenta ................................................................................... 9 1.13 Otvaranje novog i postojećeg dokumenta ..................................................................... 9 1.14 Rad sa formulama ............................................................................................................. 9 1.15 Grafikoni ........................................................................................................................... 25 2. Funkcije raspodele u Excelu .................................................................................................. 28 2.1. Binomna raspodela........................................................................................................... 29 2.2. Poasonova raspodela ....................................................................................................... 34 3. Empirijska raspodela u Excelu .............................................................................................. 47 3.1. Osnovni pojmovi ......................................................................................................... 48 3.2 Empirijska raspodela .................................................................................................. 50 4. Intervalne ocene parametara ................................................................................................. 60 4.1 Ocena srednje vrednosti normalne raspodele sa poznatom disperzijom .............. 61 4.2 Ocena srednje vrednosti normalne raspodele nepoznate disperzije ........................ 66 5. Analiza korelacije .................................................................................................................... 72 5.1 Uzorački koeficijent korelacije ......................................................................................... 75 5.2 Regresione prave ............................................................................................................... 78 5.3 Provera značajnosti korelacije ......................................................................................... 81 5.4 Interpretacija koeficijenata korelacije ............................................................................. 83 6. Regresiona analiza................................................................................................................... 85 6.1 Metod najmanjih kvadrata ............................................................................................... 88 6.2 Srednje kvadratno odstupanje empirijske formule ...................................................... 90 6.3 Koeficijent determinacije .................................................................................................. 90 6.4 Određivanje pravolinijske zavisnosti ............................................................................. 91 6.5 Intervali poverenja odsečka i nagiba .............................................................................. 99 6.6 Testiranje hipoteza u vezi sa odsečkom i nagibom ................................................... 102 6.7 Linearizovane dvoparametarske empirijske formule ............................................... 103 Literatura .................................................................................................................................... 113

Praktikum EXEL

Embed Size (px)

Citation preview

Page 1: Praktikum EXEL

Sadržaj 1. Uvod u Excel ..............................................................................................................................1

1.1. Startovanje Excela...............................................................................................................2 1.2. Radno okruženje.................................................................................................................2 1.3. Radni papir i ćelija..............................................................................................................2 1.4. Upisivanje i kretanje po ćelijama .....................................................................................4 1.5. Formatiranje ćelija ..............................................................................................................5 1.6. Formatiranje decimalnih brojeva .....................................................................................5 1.7 Menjanje boje pozadine i teksta ćelije..............................................................................6 1.8 Podešavanje širine i visine ćelija. Ubacivanje i izbacivanje redova i kolona ..............6 1.9 Spajanje ćelija .......................................................................................................................7 1.10 Uokvirivanje ćelija.............................................................................................................7 1.11 Premeštanje i kopiranje ćelija ..........................................................................................8 1.12 Snimanje i zatvaranje dokumenta...................................................................................9 1.13 Otvaranje novog i postojećeg dokumenta .....................................................................9 1.14 Rad sa formulama .............................................................................................................9 1.15 Grafikoni ...........................................................................................................................25

2. Funkcije raspodele u Excelu ..................................................................................................28 2.1. Binomna raspodela...........................................................................................................29 2.2. Poasonova raspodela .......................................................................................................34

3. Empirijska raspodela u Excelu ..............................................................................................47 3.1. Osnovni pojmovi .........................................................................................................48 3.2 Empirijska raspodela ..................................................................................................50

4. Intervalne ocene parametara .................................................................................................60 4.1 Ocena srednje vrednosti normalne raspodele sa poznatom disperzijom ..............61 4.2 Ocena srednje vrednosti normalne raspodele nepoznate disperzije ........................66

5. Analiza korelacije ....................................................................................................................72 5.1 Uzorački koeficijent korelacije.........................................................................................75 5.2 Regresione prave ...............................................................................................................78 5.3 Provera značajnosti korelacije .........................................................................................81 5.4 Interpretacija koeficijenata korelacije .............................................................................83

6. Regresiona analiza...................................................................................................................85 6.1 Metod najmanjih kvadrata ...............................................................................................88 6.2 Srednje kvadratno odstupanje empirijske formule ......................................................90 6.3 Koeficijent determinacije ..................................................................................................90 6.4 Određivanje pravolinijske zavisnosti .............................................................................91 6.5 Intervali poverenja odsečka i nagiba ..............................................................................99 6.6 Testiranje hipoteza u vezi sa odsečkom i nagibom ...................................................102 6.7 Linearizovane dvoparametarske empirijske formule ...............................................103

Literatura ....................................................................................................................................113

Page 2: Praktikum EXEL

1

1. Uvod u Excel

Page 3: Praktikum EXEL

2

1.1. Startovanje Excela Microsoft Excel je program za tabelarna proračunavanja. Osnovna osobina vršenja takvih proračuna na računaru je da se izmenama određenih podataka menjaju i vrednosti koje su zasnovane na njima. Startovanje Excel-a se vrši preko ikone na desktopu. Dupli klik mišem na ikonu Microsoft Excel i program je pokrenut. Ukoliko ikone programa nema na desktopu tada je Excel potrebno pokrenuti prko Start menija, menija Programs, a zatim kliknuti na Microsoft Excel.

1.2. Radno okruženje Radno okruženje Excel-a čine : Naslovna linija (Title Bar) – se nalazi na samom vrhu ekrana i tu se nalazi ispisano ime dokumenta s kojim se trenutno radi i ime programa. Traka sa menijima (Menu Bar) – se nalazi odmah ipod naslovne linije i u njoj se nalaze meniji u kojima su grupisani razni alati. Paleta standard (Standard Toolbar) ili paleta sa standardnim alatkama se nalazi ispod trake sa menijima i sadrži najčešće korištene alate iz menija (novi dokument, otvaranje, snimanje dokumenta, štampanje dokumenta i slično). Paleta Format (Formatting Toolbar) ili paleta za formatiranje sadrži alate koji se koriste za formatiranje teksta, određivanje vrste, veličine i boje slova, poravnavanja teksta ... Traka za formulu (Formula Bar) je traka gde se unosi formula za ćeliju sa kojom radimo. Statusna linija (Status Bar) opisuje u svom levom uglu stanje u kom se nalazi program-Ready (spreman za rad), Enter (unos u ćeliju), itd. Pord toga u statusnoj liniji možemo videti da li je uključeno prekucavane, kucanje velikih slova itd. Klizači omogućavaju pomeranje papira kako bi se videle sve ćelije.

1.3. Radni papir i ćelija Radni papir (eng. Worksheet) i ćelija (eng. Cell) su osnovni elementi rada u Excelu. Svaki dokument sa kojim se radiu Excelu naziva se naziva se sveska ili knjiga (eng. Book). Da bi se odvoile značajne celine u okviru jendog dokumenta koriste se radni papiri, koji čine knjigu. Dakle, jedan radni papir može da se koristi za proračun, jedan za grafike itd.

Page 4: Praktikum EXEL

3

Slika 1.1.

Sam radni papir sastavljen je od ćelija. Svaka ćelija može sadržati tekst ili brojeve, i za svaku od njih može se definisati tip (tekst, broj, valuta, procenti, datum). Ćelije se u Excel-u mogu povezivati tako da jedna zavise od druge i na taj način formirati formule po kojima se računaju vrednosti. Ubacivanje novog radnog papira- vrši se preko padajućeg menija Insert, opcije Worksheet. Ili, ako se pritisne desni taster miša na bilo koju od kartica postojećih radnih papira, koje se nalaze iznad statusne linije. Otvara se novi meni u kome se odabira opcija Insert, u novootvorenom prozoru dovoljno je kliknuti OK. Uklanjanje radnog papira – vrši se pritiskom desnog tastera miša na karticu radnog papira koji treba obrisati, i u novootvorenom meniju bira se opcija Delete. Otvara se novi prozor u kome se sa OK potvrđuje brisanje, dok se sa Cancel prekida.

Page 5: Praktikum EXEL

4

Menjanje imena radnog papira – koristi se isti meni kao i prethodne dve operacije. Pritisne se desni taster miša na karticu radnog papira čije se ime menja, a zatim u novootvorenom meniju klikne na Rename. Nakon tog upisuje se novo ime i pritisne taster Enter. Premeštanje i kopiranje radnog papira- ponekad je potrebno promeniti redosled radnih papira. Za to se koristi opcija Move or Copy. Otvara se prozor kao sa slike. Otvara se prozor kao sa slike. Polje To Book govori u koju knjigu (dokument) se premešta radni papir. Polje Before Sheet ukazuje na to pre kog radnog papira želimo da postavimo odabrani radni papir. Opcije move to end papir šalje na kraj knjige (dokumenta). Ukoliko je otkačeno polje Create a copy biće napravljena kopija radnog papira. Na kraju se sa OK potvrđuju odabrane opcije. Sekektovanje radnih papira – kada je potrebno obrisati više radnih papira ili se nad njima vrše neke izmene, potrebno ih je prvo označiti – selektovati. Selektovanje se vrši pritiskom na levi taster miša na kartice radnih papira koje se nalaze iznad statusne linije, držeći taster Control – za pojedinačno selektovanje, ili taster Shift- za selektovanje susednih radnih papira.

1.4. Upisivanje i kretanje po ćelijama Da bi se podatak u određenu ćeliju potrebno je da se levim tasterom miša klikne na nju. Ćelija postaje uokvirena crnim pravougaonikom, kao na slici gore. Pritiskom na bilo koji taster sa tastature počinje unos podataka u selektovanu ćeliju. Nakon ukucavanja teksta dovoljno je pritisnuti Enter ili strelicama pomeriti kursor na neku drugu ćeliju. Excel sam rapspoznaje određene tipove podataka. Brisanje teksta iz ćelije se vrši ozmačavanjem ćelije koja se briše a zatim se pritisne taster Delete. Moguće je obrisati i više ćelija odjednom tako što se prvo sve selektuju, a zatim se pritisne taster Delete. Pomeranje kurora na određenu ćeliju najlakše je izvršiti klikom levog miša na tu ćeliju. Međutim u kompleksnijim tabelama koje prelaze jednu stranu radnog papira lakše je nekad direktno otići na željenu ćeliju. Za to se koristi padjući meni Edit i opciju Go To. U novom prozoru u polju Go To dovoljno je ukucati poziciju ćelije, recimo A70 u pritisnuti OK i kursor će se naći na navedenom mestu.

Page 6: Praktikum EXEL

5

1.5. Formatiranje ćelija Formatiranje ćelija podrazumeva podešavanje tipa ćelije (broj, tekst, datum ili valuta), nameštanje poravnanja, vrste slova i veličine, kao i nekoliko drugih opcija. Podešavanje tipa ćelije- većina gore navedenih podešavanja vrši preko padajućeg menija Format opcije Cells. Nakon pokretanja ove opcije otvara se prozor kao sa slike. U polju Category pojavljuje se lista mogućih tipova podataka u ćeliji. U polju Sample vidi se kako će izgledati podatak nakon promene tipa. Nekoliko bitnih tipova su : Number- predstavlja broj, i u ovoj opciji moguće je birati zapis broj kao i broj decimalnih mesta; Date – predstavlja datum, bira se zapis datuma, kod nas je na primer dd-mm-yyyy (dan-mesec-godina); Time predstavlja vreme i bira se načina zapisa vremena, kod nas hh:mm::ss (sati, minute, sekunde), koristi se i Custom koji predstavlja korisnički tip. Poravnjanje teksta u ćeliji – poravnanje teksta se vrši kako horizontalno tako i vertikalno. Horizontalno poravnanje moguće je izvršiti iz Palete Format koristeći

koji redom centriraju tekst levo, u sredinu i desno, poslednje dugme služi za spajanje ćelija u jednu i centriranje teksta koji se nalazi u njima u sredinu. Vertikalno poravnanje kao i horizontalno vrši se preko opcije Format Cells iz padajućeg manija Format. Odabirom kartice Alignment pojavljuje se prozor kao na slici. Polje horizontal predstavlja horizontalno poravnanje, preko polja indent moguće je postaviti koliko će tekst biti omeren od leve ivice ćelije. Polje Orientation nudi mogućnost da se tekst okreće u ćeliji pod određenim uglom. Veoma bitne su stavke pod poljem Text Control. Ako je otkačeno Wrap Text tadaće tekst ukoliko ne može da stane u ćeliju biti prelomljen u dva ili više redova. Ukoliko je otkačeno polje Shrink to fit tada će veličina slova biti smanjena tako da tekst staje u ćeliju. Merge Cells služi za spajanje ćelija. Podešavanje slova u ćeliji – veličina i tip slova može se desiti preko Palete Format

koristeći za promenu tipa slova i za promenu veličine slova. Tekst je moguće iskoristiti i za podebljanje, zakrivljenje ili podvlačenje teksta. Za to se

koriste ikone .

1.6. Formatiranje decimalnih brojeva Kod unosa brojeva može se unapred odrediti željeni broj decimala. To se radi na sledeći način:

1. Označi se ćelija ili ćelije kojima se određuje broj decimala.

2. U padajućem meniju Format odabere se opcija Format Cells.

Page 7: Praktikum EXEL

6

3. U kartici Number u polju Category, odabere se Number, tada se pojavljuju opcije kao na slici.

4. U polju Decimal places bira se broj decimala, ako se otkaći polje Use 1000 separator koristiće se razdvajanje preko 1000 sa zarezom a u polju Negative number bira se izgled negativnog broja.

Decimale se mogu nameštati i preko ikonica iz palete Format. Brojevima u označenim ćelijama pritiskom na prvu ikonicu povećava se broj decimala, a na drugu smanjuje.

1.7 Menjanje boje pozadine i teksta ćelije Boja pozadine ćelija menja se na sledeći način:

1. Označi se ćelija čija se boja pozadine menja. 2. Levim tasterom miša pritisne se crna sterlica pored ikone

kantice u Paleti Format, pojavljuje se prozor kao na slici. 3. Odabira se boja za popunjavanje pozadine selektovanih

ćelija, i time je bojenje pozadine završeno. Boja teksta u ćelijama menja se na sledeći način:

1. Označi se ćlija čija se boja teksta menja. 2. Levim tasterom miša pritisne se na crnu strelicu pored

ikone . 3. U prozoru kao na slici odabere se nova boja teksta u ćelijama

1.8 Podešavanje širine i visine ćelija. Ubacivanje i izbacivanje redova i kolona Širina kolone se podešava tako što :

1. Kursor miša postavlja se na ivicu polja sa imenom kolone označene slovom iznad ćelija. Kursor miša postaje crna uspravna linija sa strelicama u levo i desno.

2. Držeći pritisnut levi taster miša pomera se širina kolone B koliko je potrebno. 3. Na kraju se pusti levi taster miša. Visina reda menja se na sličan način: 1. Kursor miša postavlja se na ivicu polja sa brojem reda levo od ćelija. Kursor miša

postaje vertikalna crna crtica sa strelicama na gore i dole.

Page 8: Praktikum EXEL

7

2. Držeći pritisnut levi taster miša, miš se povlači na gore il na dole smanjujući ili povećavajući tako visinu reda.

3. Nakon nameštanja pušta se levi taser miša. Kolona se dodaje tako što: 1. Kursor se pozicionira u ćeliju koja pripada koloni ispred koje se ubacuje nova

kolona. 2. U padajućem maniju Insert odabere se opcija Columns. Red se dodaje tako što: 1. Kursor se pozicionira u ćeliju koja pripada redu iznad kojeg se ubacuje novi red. 2. U padajućem meniju Insert odabere se opcija Rows. Brisanje kolone ili reda vrši se tako što: 1. Desnim tasterom miša klikne se na ime kolone ili broj reda. 2. U novotvorenom meniju odabere se opcija Delete. Nakon toga ako je obrisana kolona, sve kolone desno od nje premeštaju se ulevo za

jedno mesto, a u slučaju brisanja reda za jedno mesto se premeštaju redovi ispod obrisanog reda.

1.9 Spajanje ćelija Spajanje ćlija podrazumeva spajanje više ćelija u jednu ćeliju. Primer spojenih ćelija, u prikazanoj tabeli , bila bi polja jedan, dva i tri. Spajanje se vrši:

1. Selektuju se ćelije koje treba spojiti. 2. U padajućem meniju Format odabere se Format Cells, a zatim

se u kartici alignment otkači polje Merge Cells. 3. Odabir se potvrđuje sa OK.

Ponekad se pogrešno spoje ćelija pa je potrebno spojene ćelije vratiti u stanje gde je svaka za sebe, to se radi tako što se označi ćelija nastala spajanjem, a zatim u padajućem meniju Format, u Format Cells u kartici Alignment isključi se otkačeno polje Merge Cells.

1.10 Uokvirivanje ćelija Iako je radni papir podeljen na ćelije i između njih postoje linije, te tanke linije pri štampanju neće biti vidljive. Da bi se linije tabele naglasiel potrebno je selektovati ćelije čiji okvir se menja i preko padajućeg menija Format Cells, bira se kartica Border, nakon

Page 9: Praktikum EXEL

8

čega se otvara prozor kao na slici. U polju Line bira se vrsta linije kojom se iscrtavaju okviri, i boja linije. U polju Presets bira se None da bi ćelije bile bez okvira a Outline da bi se uokvirile spoljne ivice. Polje Border koristi se i kada nisu potrebne samo spoljne ivice uokvirene, već možda i iscrtane unutrašnje ili dijagonalne linije. Klikom na dugme koje prikazuje pravac linije uključuje ili isključuje iscrtavanje linija tog pravca.

1.11 Premeštanje i kopiranje ćelija Premeštanje ćelija se vrši tako što se:

1. Selektuju ćelije koje treba premestiti. 2. Kursor miša se pomeri na ivicu selekcije, negde oko

crne tamne linije, i tada bi kursor trebalo da se pretvori u belu strelicu.

3. Držeći pristisnut levi taster miša pomeraju se selektovane ćelije na mesto na koje se trebaju premestiti.

4. Pusti se levi taster miša Na ovaj način podaci se više ne nalaze u ćelijama u kojima su bili već samo u onima u koje su premešteni. Ako podaci treba da ostanu i da se pojave u novim ćelijama tada se koristi kopiranje ćelija. Ćelije se kopiraju na sledeći načn:

1. Selektuju se ćelije koje treba kopirati. 2. Pritisne se dugme Copy iz Palete Standard, čime

su selektovane ćelije zapamćene u memoriji računara, a oko zapamćenih ćelija se pojavljuje trepćući okvir, nakon toga

3. Levim tasterom miša klikne se na ćeliju gde treba da se nađu kopirane ćelije.

4. Pritisne se dugme Paste iz Palete Standard, i ćelije se pojavljuju na papiru. Koristeći opciju Cut iz Palete Standard umesto Copy ćelije bi bile premeštene, ali bi mogle više puta sa opcijom Paste da se „ispuštaju“ u dokument. Ćelije je moguće iskopirati i koristeći mali crni kvadrat u donjem desnom uglu selekcije. Ako se kursor miša postavina taj mali crni kvadrat on se pretvara crnu strelicu. Pritiskom levog tastera miša, ne puštajući ga može se razvući selektovani deo. Nakon puštanja levog tastera ceo označeni deo biće popunjen prethodno selektovanim delom.

Page 10: Praktikum EXEL

9

1.12 Snimanje i zatvaranje dokumenta Ako dokument treba sačuvati da bi se kasnije koristio trebalo bi ga snimiti na hard disk. Snimanje dokumenta se vrši tako što se iz padajućeg menija File izabere Save. Ako je to prvi put da se snima taj dokument u kojem se traži da se unese ime tog dokumenta, odnosno pod kojim imenom da se snimi na hard disk (ili diksketu). U polju Save in može se izabrati folder u koji treba smestiti

dokument, a može se napraviti i novi folder za ovaj dokument klikom na ikonu Create New Folder. U polju File name treba upisati ime dokumenta i potom kliknuti na dugme Save. Ovim je operacija snimanja dokumenta završena. Ako je dokument koji se snima već ranije snimljen pod tim imenom onda se snimanje obavlja automatski, samo odabirom opcije Save iz File menija. Zatvaranje dokumenta Dokument u Excelu se može zatvoriti na više načina, a najčešće se to vrši klikom na u gornjem desnom uglu prozora. Drugi način za zatvaranje aktivnog dokumenta je da se izabere operacija Close iz padajućeg menija File.

1.13 Otvaranje novog i postojećeg dokumenta Prilikom svakog startovanja Excel-a otvara se i nova prazna sveska u kojoj se može započeti rad. Ako je potrebno otvoriti novi prazan dokument, koristi se ikona New Blank Document iz Palete Standard, ili opciju New iz padajućeg menija File. Ako treba otvoriti već postojeći dokument, koji se nalazi na disku računara koristi se ikona Open iz palete Standard, ili opcija Open iz padajućeg menija File.

1.14 Rad sa formulama Excel - rad sa formulama Unos formula Formula se u neku ćeliju unosi tako što prvo unesemo karakter = što će Excel-u nagovestiti da sada sledi unos formule. Šta je formula?. Formula je kombinacija konstanti promenljivih, operatora i funkcija koja koja daje rezultat. Šta znači ovo što je rečeno? Evo nekih primera unešenih formula

Page 11: Praktikum EXEL

10

= 2.8+C2+C3^3 = C2/C3-1.45E-5*(A1+LN(A2)) U prethodnim numeričkim formulama (daju numeričku vrednost kao rezultat) konstante (brojevi) su 2.8,3,1.45E-5,5. Realni brojevi se unose sa fiksnom decimalnom tačkom ili u eksponencijalnom obliku (1.45E-5 znači 1.45·10-5). Promenljive su reference na ćelije (C2,C3,A1,A2) u kojim se nalazi (u ovom slučaju) numerička vrednost. Operatori se dele na unarne ili binarne. Unarni imaju jedan operand a binarni dva (sa leve i desne strane). Excel podražava standardne aritmetičke operatore: sabiranje +, oduzimanje -, deljenje /, množenje *, stepenovanje. Pri tome je prioritet operatora isti kao i u matematici. Promena prioriteta se vrši samo malim zagradama ( ). Funkcije imaju svoje ime i u zagradama argumente razdvojene zarezima. Kada unesemo potrebne argumente funkcija vraća rezultat. U prethodnim primerima smo koristili funkciju LN(A2). Ona zahteva jedan argument (numerički) i vraća kao prirodni logaritam datog argumenta. Operatori i funkcije slično "rade" tj. daju rezultat. Prethodna dva primera ćemo uneti u Excel radni list i uneti date funkcije baš kao što su navedene. Funkcije ćemo uneti u ćelije A4 i B4. Rezultat je sledeći

Obratite pažnju da je po unosu formule i pritiskom na ENTER u ćeliji prikazan rezultat a u liniji za editovanje ono što smo uneli tj. pravi sadržaj ćelije - formula. Jednostavno je unositi proste formule, ali ako je formula komplikovana vrlo lako se možemo izgubiti i pogrešiti. Excel vam nudi pomoć tako što pri unosu formule možete umesto da kucate npr. C2 da se referencirate na tu ćeliju i ona će se pojaviti u formuli. Evo kako smo, korak po korak uneli sledeću formulu Prvo smo uneli znak = , znači sledi formula

Onda smo levim tasterom miša (ili kursorskim strelicama) označili ćeliju C2 (primetite "talasiće" oko ćelije)

Page 12: Praktikum EXEL

11

Sada nam treba operator, unećemo ga

Sada se pozicioniramo na drugu ćeliju

Nastavljamo sa unosom

A1 je već unešeno na prethodno opisan način. Veoma je bitno da u toku unosa ne pritisnete ENTER. Sada nam treba funkcija. Možemo je uneti ali ako ne znamo ime

funkcije ili smo zaboravili, možemo je izabrati iz menija Insert, Function ili izabrati iz palete alata. Dobićemo dijalog prozor za izbor funkcije

Page 13: Praktikum EXEL

12

Nakon OK ova funkcija očekuje jedan argument (broj) pa se pozicioniramo na A2

Sada nam preostaje da kliknemo na OK. Dobićemo sledeću poruku

Page 14: Praktikum EXEL

13

Ona nam kaže da formula nije završena (nedostaje desna zagrada). Excel je to popravio i pita nas da li da završavamo sa unosom (Yes) ili ćemo da nastavimo dalje (No). Kako je formula završena možemo da kliknemo na Yes, ali ako želimo da nastavimo kliknimo na No. Excel će nam još jednom potvrditi da formula nije korektna. Unesimo i poslednju potrebnu desnu zagradu i, što je najbitnije, tek sad pritisnimo ENTER jer je formula formirana.

Dobili smo rezultat. Unos komplikovanih formula je podložan greškama jer se sve unosi u jednom redu. Često se može pogrešiti oko zagrada. Pri samom unosu obratite pažnju da nam Excel pomaže tako što pri unosi desne zagrade ")" na trenutak "podeblja" odgovarajuću levu zagradu "(". U korektno unešenoj formuli broj levih zagrada je isti kao i broj desnih zagrada. Za operatore koje Excel podržava konsultovati Help sistem. Što se funkcija tiče Excel ima veoma veliki izbor funkcija za različite namene. Pri tome argumanti datih funkcija mogu biti konstante, pojedinačne ćelije ili blokovi ćelija. Rezultat takođe može biti smešten u jednoj ćeliji ili bloku ćelija Blok ćelija je pravougaoni deo radnog lista koji je definisan gornjom levom i donjom desnom ćelijom izmedju kojih je dvotačka. Na primer

Ovaj blok se referencira kao B2:D5. U prethodnom primeru smo spomenuli funkciju koja ima jednu ćeliju kao argument i daje rezultat u jednoj ćeliji. Sada ćemo spomenuti možda najčešće korištenu funkciju SUM koja kao argumente može imati blokove ćelija a kao rezultat daje sumu numeričkih vrednosti u datom bloku. Unesimo u dati blok B3:C5 neke vrednosti i u ćeliju B6 unesimo =SUM(

Page 15: Praktikum EXEL

14

Posle =SUM( ne pritisnuti ENTER. Sada možemo nastaviti sa formulom i uneti dati blok ali ćemo se poslužiti već spomenutim označavanjem i obeležićiti ceo blok.

Nedostaje desna zagrada. Unećemo je i tek tada aktivirati ENTER. Dobija se rezultat

Relativno kopiranje formula Počećemo objašnjavanje rada sa formulama u Excel-u na trivijalnom primeru zbira dva broja. Unećemo dva proizvoljna broja i potom ih sabrati

U ćelije B3 i C3 su unete dve numeričke vrednosti a u ćeliju D3 je uneta formula. Prvi karakter formule je znak =. U opštem slučaju u formuli figurišu konstante, reference na ćelije (blokove), operatori i funkcije. U ćeliju D3 je prikazan rezultat izračunavanja date

Page 16: Praktikum EXEL

15

formule. Ovo je normalan rad u Excel-u tj. u liniji za editovanje vidimo šta je unešeno (=B3+C3) a u samoj ćeliji vidimo rezultat (7.01). Ako bi smo u koloni B i koloni C imali više brojeva i želeli bi smo da odgovarajuće vrednosti u kolonama saberemo, možemo ponoviti čitav postupak. Unos brojnih vrednosti je relativno jednostavan postupak, ali unos formule je podložan greškama pogotovo ako je formula komplikovana. Pored toga, ako je formula komplikovana, ponavljanje unosa je dugotrajan i besmislen posao koji treba izbegavati kad je god to moguće. Čisto primera radi, unećemo još nekoliko brojeva u kolone B i C

Sada ćemo da upotrebimo "magiju". Postavićemo pokazivač miša u crni kvadratić ćelije u kojoj se nalazi formula. Pokazivač se menja u crni krstić

Povlačimo levim tasterom miša nadole sve do ćelije D6.

Šta se sad desilo? (Zanemarite pojavu i nastavite sa radom). Ovim smo jednostavno kopirali ćeliju D3 u blok susedenih ćelija u istoj koloni (D4:D6). Međutim u ćeliji D3 se nalazi formula. Kako se to iskopiralo?. Možemo da pogledamo sadržaje ćelija ili jednostavno da prikažemo formule u tabeli umesto rezultata. To ćemo uraditi selektovanjem iz glavnog menija Tools, Options, View, Windows options, Formulas. Tada ćemo u tabeli umesto rezultata videti formule

Page 17: Praktikum EXEL

16

Kao da nas je Excel shvatio šta hoćemo, tj. sam je pri kopiranju promenio formule. Pri kopiranju formule, reference na ćelije se u kopiranim ćelijama menjaju relativno u odnosu na poziciju (referencu) formule. Formula u D3 kaže da u njoj figurišu dve ćelije i u odnosu na D3 su ćelije pozicionirane relativno tj, druga levo (B3) i prva levo (C3). Takođe će u kopiranim ćelijama formule da se promene (pogledajte sliku). U svim formulama figurišu takođe ćelije druga levo i prva levo. Na primer u D6 figurišu druga levo (B6) i prva levo (C6). Pogledajmo šta bi se desilo kada bi smo kopirali formulu iz D3 u ćeliju E3

Opet relativno kopiranje. U E3 figurišu druga levo (C3) i prva levo (D3). Gde god kopirali formulu iz D3 u kopiji će figurisati ista formula (zbir dve ćelije) ali će dve ćelije u kopiranim formulama uvek biti druga levo i prva levo. Kopiranje se zove relativno jer se reference na ćelije pri kopiranju formula uzimaju relativno u odnosu na poziciju formule. Da bi smo to još jednom utvrdili i razjasnili, pogledajmo sledeći trivijalan primer

U formuli koja je unešena u D6 figurišu ćeljie B5 (pozicija - dve ćelije u levo, jedna ćelija gore) B4 (pozicija - dve ćelije u levo, dve ćelije gore) i C5 (pozicija - jedna ćelija u levo, jedna ćelija gore). Ako ovu formulu iskopiramo u drugu ćeliju reference će se relativno promeniti tj.

Page 18: Praktikum EXEL

17

Uporedite sa prethodnom slikom. Nadam se da smo uspeli da razjasnimo šta znači relativno kopiranje formule. Apsolutno kopiranje formula Ako nam je zadat jednostavan problem da pomoću jednačine idealnog gasnog stanja

vTRp ⋅

=

izračunamo pritisak p za zadate vrednosti R, T, v to bi u radni list Excel-a mogli uneti na sledeći način

pri tome su u svakoj ćeliji bloka ćelija B3:E3 uneti tekstualni podaci, u bloku B4:C4 su uneti numerički podaci a u ćeliji E4 je uneta formula. Pogledajte u liniju za unos kako je formula unešena. U formuli figurišu reference na ćelije sa numeričkim vrednostima i operatori množenje (*) i deljenje (/). U samoj ćeliji E4 se prikazuje rezultat. Ovo je uobičajen način rada sa formulama u Excel-u. Ovaj problem i nije tako komplikovan pa bi se čak mogao uraditi i pomoću kalkulatora. Međutim, ako bi bilo potrebno izračunati pritisak za opseg temperatura od 273.15 do 293.15, sa korakom 1, to bi za kalkulator bilo previše. Kako bi smo to uradili u Excel-u?. Kao prvo, treba uneti temperature. Unos pojedinačnih temperatura bi bilo besmisleno i dugotrajno. Koristićemo Excel-ovu "pamet". Unećemo u ćeliju C5 drugu temperaturu po redu, a to je 274.15 i obeležiti obe ćelije u kojoj je prva i druga vrednost temperature. Zatim ćemo postaviti pokazivač miša u donji desni ugao ove dve ćelije tj,

Page 19: Praktikum EXEL

18

povlačenjem levim tasterom na dole Excel će "shvatiti" da želimo unos sledećih ćelija sa određenim korakom (druga - prva). Tako ćemo povlačiti dok ne dobijemo krajnju vrednost a to je 293.15, odnosno

Ako bi smo, bez razmišljanja, takođe formulu iz E3 iskopirali u susedne ćelije u istoj koloni dobili bi smo sledeće, tj Excel bi prijavio grešku #DIV/0 što znači deljenje sa nulom. Kako to?.

Page 20: Praktikum EXEL

19

Prikažimo formule koje figurišu u kopiranim ćelijama

Nadam se da vidite problem. Formula je kopirana relativno (figurišu tri ćelije levo). Ćelija D11 je prazna (nulta vrednost) i otud deljenje s nulom. Kako ćemo "naterati" Excel da pri kopiranju ne menja relativno reference. To se u formuli naznači tako što se ćelije apsolutno referenciraju. To znači da možemo da "fiksiramo" red i/ili kolonu u nekoj formuli. Pri kopiranju se fiksiran red ili kolona neće menjati. Apsolutno referenciranje se ostvaruje znakom $ ispred kolone (fiksirana kolona, npr. $B4) ili ispred reda (fiksiran red, npr. B$4) ili fikirani i kolona i red ($B$4). Ako se formula u kojoj ima apsolutnih referenci ($ ispred kolona, redova) kopira u druge ćelije onda se ovo kopiranje naziva apsolutno kopiranje. Ako pogledamo prethodan primer, potrebno je da promenimo formulu u E4 koja će da bude =B$4*C4/D$4. Zašto? Zato što ne želimo da se ove vrednosti redova ispred kojih je $ promene. Ako to uradimo i iskopiramo datu formulu dobićemo sledeće

Page 21: Praktikum EXEL

20

Radi!. Vidite da se vrednost redova u formulama od E5:E24 ispred kog je $ nije promenio, ostao je 4 kao i u formuli u E4. Ovo je apsolutno adresiranje gde je apsolutan (fiksiran red) u formuli koja se kopira (E4) u druge ćelije (E5:E24). Naravno, možemo da promenimo prikaz i prikažemo vrednosti u ćelijama u kojima su formule.

Page 22: Praktikum EXEL

21

Može se postaviti pitanje, da li je ispravno uneti u E4 formulu =$B$4*C4/$D$4. Može, fiksirali smo još i kolone B i D, mada je suvišno. Ako pogledate sliku sa formulama vidite da se kolone B i D ionako nisu promenile. Zašto? Jednostavno, pri kopiranju jedne ćelije u blok ostali smo u istoj koloni E pa se nijedna referenca na kolone nije promenila. Prikazaćemo ovaj isti problem ali ćemo drugačije da unesemo podatke. Pri tome je uneta samo jedna formula u B4 =$B1*B3/$B1 i iskopirana udesno

Da li možete da objasnite zašto sada stoje $ ispred kolone B i šta bi bilo u ćeliji D4 da kolone nisu fiksirane (Odgovor D4 = D1*D3/D2). Takođe ista priča važi, pri kopiranju nismo promenili red pa $ ispre bilo kog reda nema smisla jer smo ionako kopirali formulu u susedne ćelije ali ostali u istom redu. Da bi smo još više zapetljali stvar, ovaj isti problem ćemo rešiti unosom jedne formule i kopiranjem u druge ćelije koje se nalaze u različitim redovima i kolonama

Ovu ćemo ćeliju iskopirati udesno do kolone F

a onda ovaj blok zatim još 4 reda nadole (jer još toliko ima redova sa temperaturama)

Page 23: Praktikum EXEL

22

Uporedite rezultate sa prethodnim primerom. Obratite pažnju da je samo jednom unešena formula u B8 = $B$1*B3/$B$2 i da je ova formula iskopirana u blok B8:F12. Ovde su reference $B$1 i $B$2 apsolutne (fiksiran i red i kolona) i ostaju iste u svim formulama. Sada moramo staviti $ ispred reda i ispred kolone jer se jedna ćelija kopira u različite redove i kolone. Jedina relativna ćelija u B8 je B3 ona ima relativnu poziciju (5 ćelija gore) i npr. u D11 će se uzeti D6 jer je ona isto 5 ćelija gore.

Kao poslednje razmatranje ovog primera uzećemo da se traži izračunavanja za različite temperature T i različite molske zapremine v. Pri tome ćemo napraviti tabelu tako da su temperature zadate u koloni a zapremine u vrsti.

Page 24: Praktikum EXEL

23

Postavlja se pitanje, kako da unesemo jednu formulu u B5 koja izračunava pritisak na osnovu odgovarajuće zapremine u vrsti 4 i odgovarajuće temperature u koloni A sa vrednosti R u B1 i da rezultujući pritisak bude u odgovarajućoj ćeliji u bloku B5:F10. Pa u samom pitanju se krije i odgovor. Ćelija B1 mora biti apsolutno fiksirana. Takođe treba fiksirati samo vrstu 4 tj B$4 (zapremina) i kolonu A tj $A5 (temperatura) tako da je formula u ćeliji B5 = $B$1*$A5/B$4, odnosno posle kopiranja dobijamo

Imenovanje ćelija i blokova ćelija Kako formule postaju komplikovanije tako je i baratanje sa njima otežano, pogotovo ako postoje apsolutne reference na ćelije. Zato je pogodna osobina Excel-a da imenuje neku ćeliju ili blok. Lakše je pratiti formulu u kojoj umesto besmislenih referenci figurišu neka imena kao na primer: temperatura, zapremina, obim, cena itd. Pravila za imena ćelija i blokova su - sastoje se od slova i cifara - prvi karakter mora biti slovo - ne razlikuju se mala i velika slova tj. IME, ime, Ime se ne razlikuju - nisu dozvoljena prazna mesta - ne smeju imati ista imena kao imena kolona, reference na ćelije - mogu imati tačku (.) ili donju crtu (_) Najsigurnije da ime počne sa najmanje tri slova a ostalo mgu biti slova i cifre. Pri tome je najkorisnije imenovati blokove sa apsolutnim referencama.

Page 25: Praktikum EXEL

24

Tako ćemo u prethodnom primeru imenovati ćeliju B1 i nazvati je gask, blok B4:F4 imenovati kao Zapremina i blok A5:A10 imenovati kao Temperatura. Prvo ćemo se pozicionirati na ćeliju B1 i u tzv. Name Box uneti gask

i pritisnuti ENTER. Na isti način ćemo selektovati određene blokove i definisati imena

Ako kliknemo na strelicu pored Name Box-a možemo videti naša definisana imena i izborom na jedno od njih videti šta imenuje

Page 26: Praktikum EXEL

25

Kakva korist od toga?. To ćemo primetiti ako sada "primenimo" imena u tabelu. Šta to znači? To znači da se umesto referenci koriste odgovarajuća imena. To činimo izborom Insert, Name, Apply. Dobijamo listu imena

Obeležimo sva imena i kliknimo na OK Tada ćemo u našoj tabeli umesto referenci imati imena tj.

Ovako se tabela može učiniti preglednijom, jasnijom i manje podložnom greškama.

1.15 Grafikoni Za grafičko predstavljanje tabela urađenih u Excel-u koriste se grafikoni. Oni na jednostavan i jasan način prikazuju rast ili pad vrednosti i odnose među njima. Postupak predstavljanja grafikon na radu stranu Excel-a sastoji se iz više koraka. Podrazumeva se da je potrebna tabela na osnovu koje se crta grafik. Izrada grafika

može se pokrenuti preko padajućeg menije Insert, opcije Chart ili preko dugmeta u paleti Standard. Otvara se prozor kao naslici. Ovo je prvi od četiri koraka koji se sprovode pri ubacivanju graika u radni list. U prvom koraku bira se vrsta grafika. Klikom na bilo koji član liste polja Chart Type u polju Chart sub-type prikazuju se podtipovi ovog tipa. Klikom na

Page 27: Praktikum EXEL

26

jedan od podtipova bira se izgled grafika. Za prelazaka na sledećei korak treba kliknuti na Next.

U novom prozoru pojavaljuju se dve kartice. Data range označava mesto na kome se podaci nalaze. Druga stavka je Series, pomoću koje se određuju serije na grafiku, tj. koliko će serija biti, kao i šta se nalazi na x, a šta na y osi. Klikom na Next prelazi se na sledeći prozor.

U novom prozoru prva kartica Title služi za podešavanje ili ubacivanje naziva grafika – polje Chart Title, naziva osa – polja Value(X) axes i Value(Y) axes. Kartica Axes omogućava da se uključi/isključi prikazivanje osa. Kartica Gridlines omogućava da se uključi/isključi mrežu ose, i ako je uključeno omogućava da se bira gustina, odnostno da li da se prikazuju i male (Minor gridlines) i veće (Major gridlines). Kartica Legend podešava legendu. Ukoliko je onačeno polje Show Legend tada se u poljima ispod bira pozicija legende (Bottom, Corner, Top, Left, Right).

Page 28: Praktikum EXEL

27

Kartica Data Labels omogućava da uključi prikazivanje vrednosti na samom grafiku. Kartica Data Table omogućava prikazivanje dodatne tabele sa poacima koji se nalaze na grafiku, ako je označeno polje Show Table. Nakon podešavanja svi ovih opcija da bi se prešlo na poslednji prozor za unos grafika treba kliknuti na Next.

Poslednji prozor nudi samo dve mogućnosti. Jedna je da se ovako napravljeni grafik ubaci kao objekat u određeni radni list ili da se grafikon ubaci u novi radni list. Na svaki od prethodnih prozora može se vraćati na klikom na dugme Back. Ako je sve podešeno treba kliknuti na Finish i grafikon je na radnom listu.

Grafik se može pomerati tako što se kursor dovede na deo ekrana koji on zauzima i pritisne se levi taster miša, ne puštajući ga vuče se miš i grafik do mesta na kome treba da stoji. Crni kvadrati na krajevima grafika služe za menjanje veličine grafika. Ako je u nekom od koraka za izradu grafika došlo do greške ili jednostavno treba promeniti neku stavku, tada se koristi padajući meni Chart. Opcija Chart Type vraća na izbor tipa grafika, Chart Options na prozor sa opcijama grafika itd.

273

274

275

276

277

278

279

280

281

282

283

284

0 2 4 6 8 10 12

Series1

Page 29: Praktikum EXEL

28

2. Funkcije raspodele u Excelu

Page 30: Praktikum EXEL

29

2.1. Binomna raspodela

Ova diskretna raspodela ima veliku primenu u kontroli kvaliteta proizvoda Posmatrajmo niz nezavisnih eksperimenata (u literaturi poznat kao Bernulijeva šema) tj. za svaki od njih važi da je njegov ishod nezavisan od ishoda ostalih opita. Neka je za svaki od eksperimenata vezan događaj A i neka je verovatnoća njegovog nastupanja jednaka p, P(A) = p. Binomni zakon daje verovatnoću da će se u n eksperimenata ili proba posmatrani događaj A dogoditi x puta. Dakle, broj nastupanja događaja A u n proba je slučajna veličina X, koja ima binomnu raspodelu verovatnoće.

Možemo sada da izvedemo binomni zakon. Tražimo verovatnoću, b(x,n,p) da u n opita posmatrani događaj A nastupi x puta. Verovatnoća svakog od događaja u kome je A u n proba nastupio x puta je:

pxqn - x

a ukupan broj takvih, međusobno isključivih događaja jednak je broju kombinacija klase x od n elemenata. Tako je,

nxqpx

npnxb xnx ,...,2,1,0,),,( =

= − (2.37)

U Excel-u se za ovu vrstu raspodele koristi funkcija BINOMDIST. Rezultat funkcije je verovatnoća binomne raspodele da će slučajna promenljiva X imati zadatu vrednost. Sintaksa BINOMDIST(number_s, trials, probability_s, cumulative)

Number_s – broj nastupanja nekog događaja u n proba (slučajna promenljiva X)

Trial_s – broj nezavisnih proba, n

Probability_s – verovatnoća nastupanja događaja u svakoj probi

Page 31: Praktikum EXEL

30

Cumulative – logička vrednost koja određuje oblik funkcije, ako je Cumulative=TRUE, BINOMDIST daje kumulativnu raspodelu funkcije, ukoliko je Cumulative= FALSE, rezultat je verovatnoća da će događaj nastupiti X puta.

Primer 2.1.

Neka mašina proizvodi 1000 komponenata/h i svakih 30 minuta je uzimano po 10 uzoraka radi kontrole, tokom dužeg perioda. Tako je konstatovano da je procenat škarta 20%. Kolika je verovatnoća da u slučajnom uzorku od 6 komponenata a) bude 4 defektna b) ne bude više od 3 defektna c) ne bude nijedan defektan

Rešenje Prepoznaje se binomni model. Događaj A je dobijanje defektne komponente, a njegova verovatnoća, dobijena empirijski, je

541,5/1

10020

=−=== pqp

Broj opita, n = 6. Dati su tabela i poligon raspodele.

Tabela se dobija tako što se u red 1 unose podaci za xi, dok se pi izračunava pomoću funkcije BINOMDIST. Dakle, ukoliko je tabela napisana na isti način kao na slici, klikne se na ćeliju J2, a zatim se iz padajućeg menija Insert, odabere opcija Function, kada se otvori novi prozor funkcija BINOMDIST se traži u statističkim funkcijama (Statistical), odabere se BINOMDIST i otvara se novi prozor (kao na slici)

Page 32: Praktikum EXEL

31

Unose se odgovarajući argumenti: Number_s - unosi se vrednost iz ćelije J1, odnosno samo se klikne na ćeliju J1. Trials - upisuje se 6, jer je to broj proizvoda u slučajnom uzorku. Probability_s - upisuje se 0.2, verovatnoća od 20%. Cumulative - upisuje se logička vrednost FALSE, jer je potrebna vrednost za samo jedan događaj, a ne zbir događaja. Potvrđuje se sa OK, i kao rezultat dobija se vrednost za binomnu raspodelu, da bi se popunio ostatak tabele, funkcija se kopira na prethodno objašnjen način. Zatim se na osnovu tabele nacrta grafik.

a) Ovde treba izračunati verovatnoću da su u slučajnom uzorku od 6 proizvoda 4 budu defektna. Problem se rešava korišćenjem funkcije BINOMDIST, kao kod popunjavanja tabele.

b) U pitanju je zbir događaja, jer se traži da ne budu više od 3 defektna proizvoda, problem se takođe rešava korišćenjem funkcije BINOMDIST, ali sa nešto drugačijim argumentima.

Page 33: Praktikum EXEL

32

Number_s - upisuje se 3

Trials - upise se 6

Probabilitiy_s – upisuje se 0.2

Cumulative – upisuje se TRUE jer se radi o zbiru događaja, a ne o pojedinačnom događaju.

c) Ovde se traži da nijedan od proizvoda ne bude defektan, znači da je x = 0 pa imamo

Primer 2.2. Detaljnom proverom kvaliteta ampula punjenih tečnošću utvrđeno je da je na 100 ampula 75 ispravnih. a) Odrediti zakon raspodele verovatnoće slučajne promenljive: broj ispravnih ampula u slučajnom uzorku od 6 ampula b) Odrediti očekivanu vrednost i disperziju slučajne promenljive. c) Koji broj ispravnih ampula u uzorku od 6 komada je nejverovatniji?

Page 34: Praktikum EXEL

33

Rešenje

a) U pitanju je binomni zakon: )43,6,(xb ,

6,...,2,1,0,4

1436

)43,6,()( 6 =⋅

== − x

xxbxp x

x

Slede tabelarni i grafički prikaz zakona raspodele:

Tabela se formira na isti način kao i u 1. zadatku, a nakon toga se na poznati način crta grafik.

b) µx = np = 4.5, D(X) = npq = 1.125 se izračunavaju upisivanjem formula.

c) Najverovatniji broj ampula u uzorku je 5.

Page 35: Praktikum EXEL

34

2.2. Poasonova raspodela

Poasonov (Poisson) zakon raspodele se može dobiti kao granični slučaj binomnog modela, kada obim uzorka n teži beskonačnosti uz uslov da pri tom proizvod obima uzorka i verovatnoće posmatranog događaja,

µ = np

ostane ograničen. Tako se Poasonov model koristi za opisivanje verovatnoće retkih (p je malo), međusobno nezavisnih (uslov za binomni zakon) događaja kao što su:

• radioaktivni raspad nekih izotopa, tj. emitovanje radioaktivnih čestica • incidenti u dobro regulisanom saobraćaju • smetnje u telefonskom saobraćaju i prenosu podataka • greške u računarskim sistemima

Slučajna promenljiva je broj realizacija retkog događaja u vremenskom intervalu date dužine.Dakle, slučajna promenljiva X ima Poasonovu raspodelu ako je

,...2,1,0,!

)( =µ

= µ− xex

xpx

gde je µ neki pozitivan broj.

Srednja vrednost i disperzija

Očekivana vrednost i disperzija za Poasonovu raspodelu mogu se dobiti kao granične vrednosti tih parametara za binomnu raspodelu, kada n → ∞, p → 0, (µ = const):

µ==−=σµ==µ

=→∞→

nppnpnp

constnppnxx )1(lim,

0

2

Dakle, srednja vrednost i disperzija slučajne promenljive X raspodeljene po Poasonovom zakonu su:

µ=σ=µ 2xx

Aproksimacija binomne raspodele Poasonovom

Računanje verovatnoća je znatno obimnije kod binomne nego kod Poasonove raspodele. Za dovoljno veliko n i malo p binomna raspodela se može aproksimirati Poasonovom. Praktični kriterijum za primenljivost takve aproksimacije je [Chatfield C., 1983.]: 5,20 <=µ> npn

Poasonova raspodel u Excelu može se dobiti korišćenjem funkcija POISSON.

Page 36: Praktikum EXEL

35

Sintaksa : POISSON (X, Mean, Cumulative) X – broj događaja Mean – očekivana vrednost Cumulative - logička vrednost koja definiše funkciju raspodele verovatnoće. Ako je taj argument TRUE, rezultat funkcije je kumulativna Poasonova funkcija raspodele verovatnoća da će broj slučajnih događaja biti između 0 i X (uključujući i te vrednosti); ako je FALSE, rezultat je Poasonova funkcija verovatnoće da će broj događaja biti tačno X. Zadatak 2.3.

Procenat škarta pri proizvodnji komponenata u nekoj fabrici je 2%. Odrediti verovatnoću da je u uzorku od 60 komponenata defektno: a) 3 komada b) ne više od 3 c) bar dva

Rešenje U pitanju je binomni zakon. Pošto je n = 60 > 20 i µ = np = 60⋅0.02 = 1.2 < 5 ispunjen je uslov

5,20 <=µ> npn i rešavanje problema se može znatno uprostiti zamenjujući binomni zakon Poasonovim ( iako to u Excelu ne predstavlja problem).

a) Dakle, pošto je ustanovljeno da ja aproskimacija Poasonovom raspodelom moguća, verovatnoća da je u uzorku od 60 komponenata defektno 3 komada, izračunava se na sledeći način.

Page 37: Praktikum EXEL

36

0867.0!3)2.1(

!3)()3( 2.1

33)42.2(

≈=µ

== −µ− eeXP

Ukoliko su podaci unešeni na isti način kao na slici, klikne se na ćeliju B11, zatim se iz padajućeg menija Insert odabere opcija Function, i nakon toga iz statističkih funkcija odabere POISSON,

kada se potvrdi sa OK otvara se sledeći prozor

Page 38: Praktikum EXEL

37

Ovde se unose odgovarajući argumenti, za X se upisuje 3, za Mean se klikne na ćeliju B8 jer je u toj ćeliji izračunata očekivana vrednost, i u polje Cumulative se upisuje FALSE jer se traži vrednost verovatnoće Poasonove raspodele za X=3.

b) Kako je ovde potrebno odrediti verovatnoću da su ne više od 3 komada defektna,

problem se rešava slično kao pod a), osim što se u polje Cumulative upisuje TRUE, pa se kao rezultat dobija kumulativna Poasonova funkcija.

( ) 9662.0)62

1()3()2()1()0(332

≈µ

+µ+=+++=≤ µ−eppppXP

c) Kada je potrebno odrediti verovatnoću da su bar 2 komada defektna, što ustvari znači 2 i više, izračunava se Poasonova kumulativna funkcija za vrednost 1 (uključuje vrednosti verovatnoće za 0 i 1) i onda oduzme od 1.

( ) ( ) [ ] [ ] 3374.01)1()0(1212 ≈µ+−=+−=<−=≥ µ−µ− eeppXPXP

Page 39: Praktikum EXEL

38

Zadatak 2.4. Automat daje 4% defektnih proizvoda. Proizvodi se pakuju u kutije po 10 komada. U kom procentu kutija će se naći najviše jedan defektan proizvod.?

Rešenje

Traženu relativnu frekvencu ω se, u skladu sa statističkom definicijom verovatnoće (ω ≈ p), nalazi kao verovatnoća da se u slučajnom uzorku od 10 komada nađe najviše jedan defektan proizvod. U pitanju je slučajna promenljiva sa binomnom raspodelom b(x, 10, 0.04), pa je:

ω = P(X ≤1) = p(0) + p(1) = b(0, n, p) + b(1, n, p)

%2.949418.096.004.01096.010 910910 ==⋅⋅+=⋅⋅+=ω qpq

Odnosno, u Excelu se ovaj problem rešava funkcijom BINOMDIST.

Problem se može približno rešiti aproksimacijom binomnog zakona Poasonovim, mada prvi od uslova 5,20 <=µ> npn nije ispunjen: [ ] [ ] %8.939384.04.011)1()0( 4.0 ==+=µ+=+=ω −µ− eepp

Sada se koristi funkcija POISSON

Dobija se pak dobra procena, koja se od tačne vrednosti razlikuje manje od 1%.

Page 40: Praktikum EXEL

39

2.3. Normalna raspodela Ovo je najvažnija raspodela za primene u statističkoj obradi eksperimentalnih podataka u društvenim, prirodnim i tehničkim naukama. Za neprekidnu slučajnu promenljivu X kažemo da ima normalnu ili Gausovu raspodelu sa parametrima µ i σ, što se kratko označava sa

X : N(µ,σ)

ako je njena gustina:

0,,2

1)(2

21

>σµπσ

=

σµ−

−x

exf

U Excel-u se za normalnu raspodelu koristi funkcija NORMDIST.

Sintaksa: NORMDIST (x, mean, standard_dev, cumulative) x – vrednost za koju se izračunava funkcija Mean – aritmetička sredina raspodele Standard_dev – standardna devijacija raspodele Cumulative – logička vrednost koja definiše vrstu funkcije, TRUE – kumulativna vrednost raspodele, FALSE – funkcija gustine verovatnoće. Pored funkcije NORMDIST, postoji i inverzna funkcija NORMINV. Rezultat ove funkcije je vrednost promenljiveza koju normalna kumulativna funkcija raspodele ima datu verovatnoću.

Page 41: Praktikum EXEL

40

Sintaksa : NORMINV (probability, mean, standard_dev) Probability – verovatnoća za koju se izračunava vrednost promenljive. Mean – aritmetička sredina raspodele Standard_dev – standardna devijacija raspodele Standardizovana normalna raspodela

Ako je X slučajna promenljiva sa normalnom raspodelom N(µ,σ2), slučajna promenljiva, dobijena linearnom transformacijom,

0, ≠+= abaXY

ima takođe normalnu raspodelu. Dakle, standardizovana normalno raspodeljena slučajna promenljiva,

σµ−

=X

X 0

koja ima nultu srednju vrednost i jediničnu disperziju, 1,000=σ=µ xx , ima takođe normalnu

raspodelu, koja se zove standardizovana normalna raspodela, N(0,1) sa gustinom:

20

2

21)(

x

exf−

i funkcijom raspodele,

dtexXPxFx t

∫∞−

−=<= 2

00

2

21)()(π

Page 42: Praktikum EXEL

41

Za određivanje standardne normalne kumulativne funkcije raspodele koristi se funkcija NORMSDIST.

Sintaksa: NORMSDIST(z) Z – vrednost za koju se izračunava funkcija. Takođe postoji i inverzna funkcija NORMSINV.

Sintaksa: NORMSINV(probability) Probability – verovatnoća za koju se izračunava vrednost promenljive Zadatak 2.5.

Odstupanje, ∆ debljine proizvedene glazirane keramičke pločice, δ od nominalne vrednosti µ, ∆ = δ - µ se može aproksimirati slučajnom veličinom sa normalnom raspodelom, ∆ : N(0, 0.3). Odrediti:

Page 43: Praktikum EXEL

42

a) Očekivani škart u 1000 proizvedenih komada, ako se kao ispravne prihvataju pločice čija debljina odstupa od nominalne najviše 0.5 mm.

b) Očekivani broj pločica u 1000 komada čije su debljine: δ ≤ µ - 0.2 ili δ ≥ µ + 0.5

c) Očekivani broj pločica u 1000 komada čije su debljine u intervalu: µ - 0.3 ≤ δ ≤ µ + 0.4 Rešenje a) Verovatnoća da odstupanje ∆ bude veće od 0.5 dobiće se preko verovatnoće suprotnog događaja. Tj. verovatnoće da odstupanje bude manje od 0.5, međutim, treba uzeti u obzir da je 0.5 apsolutna vrednost, i da se mora izračunati verovatnoća za x ≤0.5 i x ≤ - 0.5, a zatim oduzeti manju od veće verovatnoće.

Koristi se funkcija NORMDIST.

Do funkcije se dolazi na isti način kao i u prethodnim primerima . U polje x upisuje se -0.5, ili ukoliko su podaci uneseni na ista mesta kao na slici klikne se na ćeliju A12, u polje Mean upisuje

Page 44: Praktikum EXEL

43

se 0, u polje Standard_dev 0.3, a u polje Cumulative upisuje se logička vrednost TRUE. Potvrđuje se sa OK. Dalje se klikne na ćeliju u koju se izračunava druga funkcija ( u konkretnom primeru to je ćelija B13) i postupak se ponavlja, samo što se umesto vrednosti -0.5 u polje x upisuje vrednost 0.5 (ili se klikne na ćeliju A13). Pošto su izračunate ove dve vrednosti, njihovu razliku izračunatu na već poznat način treba oduzeti od 1.

Ako postoji verovatnoća događaja - pojava defektne pločice, p = 0.096, onda je u skladu sa binomnim zakonom (ili u skladu sa statističkom definicijom verovatnoće) očekivani broj defektnih pločica m, u slučajnom uzorku od 1000 komada jednak:

m = pn = 1000⋅0.096 = 96

b) )5.0()2.0()5.02.0( +µ≥δ+−µ≤δ=+µ≥δ∨−µ≤δ PPP

Ovde se prvo izračunava kumultaivna funkcija normalne raspodele za vrednost -0.2, a zatim za

0.5,

pa se dobijena vrednost za 0.5 oduzima od 1.

Page 45: Praktikum EXEL

44

Sabiranjem vrednosti u ćelijama B22 i C 23 dobija se tražena verovatnoća, koja se dalje množi sa

1000 i dobija se broj pločica čije su debljine δ ≤ µ - 0.2 ili δ ≥ µ + 0.5

c) )4.03.0( +≤≤− µδµP

Slično se rešava i ovaj problem, računaju se kumulativne funkcije normalne raspodele za vrednosti -0.3 i 0.4

Verovatnoća za vrednost -0.3 se oduzima od one za 0.4, i dobijeni rezultat se množi sa 1000.

Zadatak 2.6.

Vek trajanja elektronske lampe, h u časovima ima normalnu raspodelu N(100,5)

a) Naći verovatnoću da nova elektronska lampa istog tipa traje najmanje 105 časova. b) Ako je jedna elektronska lampa već izdržala 90 časova, kolika je verovatnoća da će izdržati još 15?

Rešenje

a) Tražena verovatnoća se izračunava iz verovatnoće suprotnog događaja, koristi se funkcija NORMDIST, na već opisan način.

Page 46: Praktikum EXEL

45

b) Traži se uslovna verovatnoća: verovatnoća da će nastupiti događaj, 105>X pošto je nastupio događaj, 90>X i računa se pomoću formule :

[ ]

)90()105(

)90()90)(105()90/105(

>>

=>

>>=>>

XPXP

XPXXPXXP

Dakle, pomoću funkcije NORMDIST dobija se verovatnoća za 90h, a zatim se podeli sa verovatnoćom za 105h.

Kao što se moglo očekivati, dobijena je nešto veća verovatnoća nego u a) Zadaci za vežbu

2.1.Događaj A nastupa u nekom eksperimentu sa verovatnoćom p = 0.3. Neka je X broj nastupanja događaja A u nizu od 5 opita. a) Kako glasi zakon verovatnoće za X, b) Izračunati P(X ≤ 3), c) izračunati srednju vrednost i disperziju.

2.2 Odrediti, a) Verovatnoću da se u 8 bacanja kocke šestica pojavi 3 puta b) Očekivani broj šestica u 180 bacanja kocke?

2.3 Verovatnoća pogotka cilja u jednom gađanju je p = 0.2. Koliko gađanja treba izvesti da bi sa verovatnoćom ne manjom od 0.9 cilj bio pogođen bar jednom?

Događaj A nastupa u nekom eksperimentu sa verovatnoćom p = 0.3. Neka je X broj nastupanja događaja A u nizu od 5 opita. a) Kako glasi zakon verovatnoće za X, b) Izračunati P(X ≤ 3), c) izračunati srednju vrednost i disperziju.

Page 47: Praktikum EXEL

46

2.4 Odrediti, a) Verovatnoću da se u 8 bacanja kocke šestica pojavi 3 puta b) Očekivani broj šestica u 180 bacanja kocke?

2.5 Verovatnoća pogotka cilja u jednom gađanju je p = 0.2. Koliko gađanja treba izvesti da bi sa verovatnoćom ne manjom od 0.9 cilj bio pogođen bar jednom?

2.6 Automat daje 4% defektnih proizvoda. Proizvodi se pakuju u kutije po 50 komada. a) U koliko će se posto kutija nalaziti najviše jedan defektan komad? b) Postiže li se Poasonovom raspodelom zadovoljavajuća aproksimacija, ako se dozvoljava maksimalna greška rezultata od 1.5%?

2.7. Jedna velika serija sadrži 4% defektnih proizvoda. Proizvodi se bez prethodne kontrole i izdvajanja loših pakuju u kutije od 50 komada. a) Koliko će defektnih proizvoda sadržavati najveći broj kutija? b) Koliki je procenat takvih kutija?

2.8 Slučajne greške merenja imaju normalnu raspodelu sa µ = 0, σ = 8mm. Naći verovatnoću da od tri greške međusobno nezavisnih merenja a) bar jedna ne bude veća od 4mm, b) bar jedna, po apsolutnoj vrednosti, ne bude veća od 4mm.

2.9 Slučajna promenljiva ima normalnu raspodelu N(3,4). Izračunati ( )9>XP i ( )5/9 >> XXP

2.10 Neki proizvođač deterdženta ima mašinu za pakovanje po 500g deterdženta u jednu kutiju. Dužom kontrolom proizvoda utvrđeno je da je srednja masa deterženta u kutiji 506g, sa standardnim odstupanjem 12g. Uz pretpostavku da mase deterdženta u kutijama imaju normalnu raspodelu, a) izračunati procenat kutija koje sadrže više od propisane količine deterdženta., b) izračunati onu srednju vrednost i standardno odstupanje raspodele masa deterdženta, koji bi prepolovili procenat prepunjenih kutija i u isto vreme obezbedili da najviše 1% kutija sadrži manje od 497g. c) kolika bi se prosečna ušteda u deterdžentu (%) postigla?

2.11. Otpor električnih otpornika ima normalnu raspodelu N(5Ω, 0.2Ω). Slučajnim izborom uzmemo dva takva otpornika i vežemo ih na red. Kolika je verovatnoća da taj spoj ima otpor između 9.5 i 10.5Ω ?

Page 48: Praktikum EXEL

47

3. Empirijska raspodela u Excelu

Page 49: Praktikum EXEL

48

3.1. Osnovni pojmovi Statistika, kao naučna disciplina, izučava masovne pojave u društvu, prirodi i tehnici. Za

masovne pojave je karakteristično da pojedinačni slučajevi manje ili više odstupaju od onog što se može smatrati njenom karakteristikom. Na primer, prosečni životni vek stanovništva neke države predstavlja važnu karakteristiku od koje, manje ili više, odstupaju dužine života pojedinih građana. Drugi primer su rezultati merenja neke fizičke veličine, koja sama, za razliku od životnog veka, nije slučajna veličina (na primer gustina gasa na datoj temperaturi i pritisku). Rezultati ponovljenih merenja se međutim razlikuju među sobom, kao i od tražene tačne vrednosti merene veličine, zbog slučajne greške merenja.

Statističko obeležje i populacija

Ono što se u teoriji verovatnoće naziva slučajna promenljiva, statističari nazivaju - statističko obeležje. Tako je životni vek građanina neke države primer statističkog obeležja. Statističko obeležje je vezano za jasno definisan elemenat (entitet) koga nazivamo statistička jedinica. U poslednjem primeru to je osoba - građanin neke države.

Skup svih elemenata - statističkih jedinica naziva se populacija ili generalni skup ili osnovni skup. Osnovni skup po pravilu ima veliki broj elemenata - statističkih jedinica (masovnost) koji može biti i beskonačan. Na primer, u posmatranom primeru, populaciju čine svi stanovnici jedne države. U slučaju bacanja dve kocke za igru, statistička jedinica je definisana kao svaka od mogućih položaja dve bačene kocke, statističko obeležje je posmatrani rezultat (recimo suma dobijena dva broja), a osnovni skup je beskonačan jer se može zamisliti beskonačan broj bacanja kocke. Slično, pri kontroli neke procesne veličine (pritisak, temperatura, koncentracija, itd.) može se zamisliti beskonačan broj merenja. U slučaju kontrole kvaliteta proizvoda, svaki test je statistička jedinica. Ako kontrolišemo, recimo, debljine proizvedenih keramičkih pločica, onda je populacija ograničena - broj elemenata jednak je broju proizvedenih pločica u nekom periodu vremena. U slučaju pak praćenja sadržaja sumpora u proizvedenoj gumi, populacija se smatra beskonačnom, odnosno neophodna je izvesna apstrakcija koja kao rezultat ima hipotetičnu beskonačnu populaciju. Zamišljamo naime, beskonačno velik komad gume i beskonačan niz analiza pod istim uslovima.

Statistički uzorak

Osnovni zadatak statistike je definisanje raspodele frekvenci posmatranog obeležja, tj. raspodele verovatnoće. Pri tome je retko moguće izmeriti obeležja svih statističkih jedinica osnovnog skupa. To je svakako nemoguće u slučaju beskonačnog osnovnog skupa, ali i u slučaju konačnih populacija, to retko dolazi u obzir jer je ili neekonomično ili praktično neizvodljivo. Primeri su demografska ispitivanja i testova kvaliteta proizvoda, koji su destruktivni (proizvod u toku testa biva oštećen). Zato se iz populacije izdvaja jedan konačan podskup statističkih jedinica koji se naziva (statistički) uzorak. Uzorak se ispituje radi donošenja zaključaka o raspodeli slučajne promenljive - obeležja u osnovnom skupu, koja se naziva i teorijska raspodela. Umesto izraza: uzorak iz osnovnog skupa sa pretpostavljenom raspodelom (recimo normalnom) često se koristi kraći termin: uzorak iz pretpostavljene raspodele (npr. normalne).

Page 50: Praktikum EXEL

49

Jasno je da se ne može očekivati potpuno tačno opisivanje ili reprezentacija populacije na osnovu analize uzorka. Jedno od najvećih ograničenja pri tome je svakako obim uzorka pod kojim se podrazumeva broj elemenata populacije izdvojenih u uzorak. Međutim, veličina uzorka nije jedini faktor koji ograničava tačnost zaključaka - čak i veliki uzorak može da dovede do pogrešnog modela. Teorija uzoraka kao deo statistike, bavi se problemom izbora takvog uzorka koji će obezbediti dovoljnu pouzdanost zaključaka o populaciji. Takav uzorak, čija se struktura u odnosu na posmatrano obeležje ne razlikuje značajno od strukture osnovnog skupa, naziva se reprezentativan uzorak. Da bi uzorak bio reprezentativan, mora biti tako formiran da svaki element populacije ima jednaku šansu da, nezavisno od ostalih, uđe u uzorak. Za takav uzorak kažemo da je slučajan uzorak. Formiranje slučajnog uzorka iz ograničene populacije (recimo stanovništvo), vrši se uz pomoć tablice slučajnih brojeva koji se mogu naći u priručnicima iz statistike, ili se mogu kompjuterski generisati pomoću odgovarajuće funkcije. Tablica slučajnih brojeva formira se iz dugačkog niza cifara, 0 - 9, koji se “iseče” na brojeve sa istim odabranim brojem cifara (tablice iz literature najčešće sadrže četvorocifrene brojeve). Svaka od cifara 0 - 9 se u polaznom nizu brojeva približno pojavljuje jednak broj puta (dakle, sa relativnom frekvencom 0.1). Najjednostavniji postupak za formiranje slučajnog uzorka je sledeći. Svi elementi populacije se numerišu. Ako recimo osnovni skup ima manje od 100 elemenata, potreban je niz slučajnih dvocifrenih brojeva (ili se svaki četvorocifren broj iz tablice interpretira kao dva dvocifrena). Počev od nasumce odabranog broja u tablici, uzimaju se redom slučajni dvocifreni brojevi i u uzorak uključuju elementi označeni tim brojevima. Ako takav element ne postoji, taj broj iz tablice jednostavno ispuštamo i nastavljamo postupak.

Statistička analiza

Zadatak statističke analize je, kao što smo već naveli, da na osnovu informacija iz uzorka izvede neke zaključke o osnovnom skupu. U postupku statističke analize mogu se izdvojiti sledeće faze:

• statističko posmatranje • sređivanje podataka • obrada i naučna analiza rezultata

Statističko posmatranje se sastoji u planskom prikupljanju podataka o statističkim jedinicama putem anketa, posmatranja, merenja itd. Tako na primer, iz slučajnog uzorka obima n dobijamo niz od n vrednosti (xi, i = 1,...,n)

Sređivanje podataka se sastoji u njihovom tabelarnom i grafičkom prikazivanju, da bi smo dobili neku predstavu o raspodeli posmatrane slučajne veličine. Prvi korak pri tom je uređivanje po veličini dobijenog niza od n brojeva, a rezultat je uređen niz koji se u statistici zove varijacioni niz:

nxxx ,,, 21

Obrada i analiza rezultata obuhvata matematičku obradu sređenih podataka i njihovu interpretaciju.

Page 51: Praktikum EXEL

50

3.2 Empirijska raspodela Polazeći od varijacionog niza nxxx ,,, 21 za svaku od vrednosti u nizu može se odrediti

(apsolutna) frekvenca pojavljivanja, mi. Dobijeni rezultat je empirijska raspodela frekvenci, koja predstavlja niz parova:

( ) ( ) ( ) nkmxmxmx kk ≤,,,,,,, *2

*21

*1

za koji se takođe kaže da predstavlja grupisane podatke. Primetimo da je:

nmxxxxk

iink === ∑

=

∗∗

111 ,,

Ako se za grupisane podatke izračunaju relativne frekvence ωi = mi/n, dobija se empirijska raspodela relativnih frekvenci u obliku niza parova:

nkxxx kk ≤ωωω ),,(,),,(),,( *2

*21

*1 …

Jasno je da pri tome važi,

1,11

=ω= ∑∑==

k

ii

k

ii nm

Ako su u pitanju vrednosti neke diskretne slučajne promenljive X, tada empirijska raspodela relativnih frekvenci predstavlja aproksimaciju zakona raspodele verovatnoće slučajne promenljive X tj. teorijske raspodele i može se prikazati tabelarno, u vidu trakastog dijagrama ili poligona raspodele Što se tiče rešavanja problema vezanih za empirijsku raspodelu, oni će se u Excelu svesti na formiranje odgovarajućih tabela i crtanje dijagrama.. Primer 3.1. U grupi od 25 studenata II godine studija su anketiranjem dobijeni podaci o starosti u godinama:

22, 21, 20, 23, 22, 24, 25, 21, 22, 23, 21, 22, 21, 23, 22, 22, 21, 25, 21, 26, 23, 21, 22, 21, 21

Treba formirati empirijsku raspodelu starosti studenata u apsolutnim i relativnim iznosima. Rešenje Prvo treba formirati varijacioni niz na sledeći način: U kolonu C se upisuju se podaci o starosti u godinama, oni se mogu prepisati redom iz zadataka, nakon toga sortirati. Sortiranje podatak u tabeli se vrši tako što se obeleže podaci i klikne na ikonicu Sort Ascending

Page 52: Praktikum EXEL

51

i kao rezultat dobija se kolona C koja izgleda kao na slici (desno). Nakon toga korišćenjem funkcije COUNT prebrojavaju se podaci. Funkcija se dobija iz padajućeg menija Insert, opcije Function, i iz statističkih funkcija odabere COUNT.

Argumente funkcije predstavljaju članovi varijacionog niza. U sledećem koraku formira se nova tabela, ona sadrži grupisane podatke o broju godina.

Vrednosti za m se dobijaju opet korišćenjem funkcije COUNT, i to prebrojavanjem podataka za određenu vrednost x*, na primer :

I na kraju se izračunavaju vrednosti ω, i to kao odnos m i n, za odgovarajuću grupu podataka. Ovde se pri kopiranju formula na ostatak reda mora voditi računa o tome da je n konstanta, i da njen položaj mora biti fiksiran, tj. da se ispred oznake reda i kolone mora staviti znak $.

Pošto je tabela konačno formirana crta se grafik. Iako je crtanje grafika već prethodno objašnjeno, ovde će još jednom biti prikazano na konkretnom primeru. Crtanje se započinje ili odabirom Chart iz padajućeg menija Insert, ili klikom na ikonicu Chart Wizard. Tada se otvara novi prozor, u kome se bira tip grafika (Chart type), i odabere se XY (Scatter).

Page 53: Praktikum EXEL

52

Klikne se na Next, i u sledećem prozoru odabere kartica Series, gde će se obeležiti podaci na osnovu kojih se crta grafik. Na x osi treba da budu vrednosti za x*, a na y osi za m i ω. Serije podataka se dodaju klikom na „dugme“ Add, a zatim se u poljima X values i Y values upisuju odgovarajuće vrednosti.

Klikne se na Next, i u sledećem prozoru urade ostala podešavanja grafika, kao što su oznake za x i y osu, naziv grafika i slično. Nakon toga se ponovo klikne na Next i u sledećem prozoru na Finish, čime se crtanje grafika završava, a dodatna podešavanja se rade na grafiku, kada se desnim tasterom miša klikne na grafik i odabere opcija format.

Page 54: Praktikum EXEL

53

Pošto bi ovde trebalo prikazati zavisnost ω od x* na sekundarnoj osi, desnim tasterom se klikne na seriju ω, Format Data Series, kada se otvori novi prozor klikne se na karticu Axis i odabere opcija Plot Series on – Secondary axis, potvrđuje se sa OK.

Kao rezultat dobija se grafik sa primarnom i sekundarnom osom, tj. poligon raspodele starosti studenata u apsolutnim i relativnim i znosima.

Page 55: Praktikum EXEL

54

Intervalno sređivanje podataka

Ako je obim uzorka veliki i ako niz (4.1) sadrži veliki broj međusobno različitih vrednosti obeležja X, vrši se tzv. intervalno sređivanje podataka. Intervalno sređivanje se inače praktikuje kada su u pitanju podaci o neprekidnoj slučajnoj promenljivoj. Interval [a, b) kome pripadaju sve vrednosti X za uzorak, deli se na k podintervala:

[a, u1), [ u 1, u 2), [ u 2, u 3), . . ., [ u k-1, b)

koji se nazivaju klase. Obično se uzima da su klase jednake širine. Sredine klasa ćemo označiti sa *

ix :

kiuux iii ,...,1,

21* =+

= −

Frekvence mi, i = 1,...,k sada predstavljaju broj vrednosti obeležja X koje pripadaju prvoj, drugoj, …, k-toj klasi. Za broj klasa ne postoji striktno pravilo. Preporučuje se da ono bude od 5 – 21, zavisno od obima uzorka [Vukadinovic S., 1990.], a u literaturi se sreću i empirijske formule za izbor k, [Ahnazarova S., Kafarov V., 1985.]. Tabelarni prikaz intervalno sređenih podataka dat je u Tab. 4.1. Poslednje tri kolone daju empirijsku raspodelu apsolutnih i empirijsku raspodelu relativnih frekvenci.

Tabela 4.1 Intervalno sređeni podaci

Pored poligona raspodele, kao grafički prikaz intervalno sređenih podataka koristi se histogram empirijske raspodele. To je niz pravougaonika čije su osnove intervali [ui-1, ui), a visine odabrane tako da su im površine jednake relativnim frekvencama. Primer 3.2. Mereno je vreme izvođenja neke radne operacije u sekundama:

24 28 22 26 24 27 26 25 26 23 30 26 29 25 27 24 26 25 24 27

Formirati tabelu intervalno sređenih podataka u 5 klasa i histogram.

klase sredine klasa

frekvence relativne frekvence

1 [a, u1) *1x m1 ω1

2 [ u 1, u 2) *2x m2 ω2

k [ u k-1, b) *kx mk ωk

∑ n 1

Page 56: Praktikum EXEL

55

Rešenje U pitanju je neprekidna slučajna promenljiva. Naravno, podaci iz uzorka su uvek diskretni, ali samo obeležje može biti diskretno ili kontinualno (kao što je ovde slučaj). Najmanji interval u kome leže svi podaci, a njegova širina je deljiva sa 5, je interval [22, 32), pa ćemo usvojiti klase širine,

d = (32 - 22)/5 = 2.

Kao i u prethodnom primeru formira se varijacioni niz (kolona D na slici),

na osnovu koga se formira nova tabela. Prva kolona nove tabele sadrži nazive klasa, druga sredine klasa, treća frekvence, četvrta relativne frekvence, a peta visinu pravougaonika u histogramu, tj. odnos ω/d.

U prvu kolonu se samo upišu podaci. Da bi se izračunale sredine klasa koristi se funkcija AVERAGE. Ona se kao i ostale funkcija poziva iz menija Insert, opcije Function, a nalazi se u statističim funkcijama. Argument predstavlja skup vrednosti čija se srednja vrednost traži.

Page 57: Praktikum EXEL

56

Treća kolona se popunjava kao i prethodnom primeru pomoću funkcije COUNT, četvrta kao odnos broja m i n, a peta kao odnos ω i d, u ova dva slučaja mora se voditi računa o tome kako se zapisuju n i d, jer se radi o konstantama. Dalje se pomoću Chart Wizard-a crta histogram. U prvom koraku (Chart Type) bira se Column. Dalje se na Series – Add ubacuju podaci na osnovu koji se crta histogram, u polju Values se označavaju vrednosti ω/d, u polju Category (X) axis labels klase, u konkretnom slučaju obeleži se ćelije od E2 do E6.

U trećem koraku izvrše se podešavanja oko naslova, osa i legende, u četvrtom se završava crtanje grafika.

Kao rezultat dobija se sledeći histogram.

Page 58: Praktikum EXEL

57

Empirijska funkcija raspodele

Pretpostavimo da smo grupisanjem podataka iz varijacionog niza xi, i =1,...,n (4.1), dobili empirijsku raspodelu frekvenci: kimx ii ,...,1),,( * = pri čemu, u slučaju intervalno sređenih

podataka, vrednosti *ix predstavljaju sredine klasa (vidi tabelu 4.2). Neka je x bilo koja vrednost

na x-osi. Ukupan broj tačaka ix , koje leže levo od odabrane tačke x, zove se kumulativna frekvenca N(x) i dobija se kao suma:

∑<

=xx

ii

mxN*

)(

Deljenjem kumulativne frekvence za tačku x ukupnim brojem podataka n, dobijamo relativnu kumulativnu frekvencu, )(* xFn ,

∑<

ω==xx

ini

nxNxF

*

)()(* (*)

Jednačina (*) predstavlja definiciju empirijske funkcije raspodele. Grafik empirijske funkcije raspodele )(* xFn , potpuno je analogan grafiku funkcije raspodele F(x) za diskretnu slučajnu promenljivu (Sl. 2.3). Empirijska funkcija raspodele predstavlja aproksimacije funkcije raspodele populacije (teorijska funkcija raspodele) i ukoliko je obim uzorka, n veći, aproksimacija će biti bolja (teorema Glivenka). Primer 3.3 Za uzorak iz primera 3.1 nacrtati grafik empirijske funkcije raspodele. Rešenje Prvo se formira varijacioni niz, kao i u primeru 3.1, odredi broj elemenata pomoću funkcije COUNT, i na osnovu toga formira tabela. Prve tri kolone (x*, m i ω ili w) dobijaju se na već poznat način. Četvrta kolona dobija se pomoću funkcije SUM i to za svaku ćeliju posebno.

Page 59: Praktikum EXEL

58

Poslednja kolona F(x*+0) dobija se kao N(x*+0)/n, kao što se vidi na slici. Opet se mora uzeti u obzir da je n konstanta i na odgovarajući način je obeležiti u formuli. Formula za prvi red u koloni može se kopirati na preostale redove.

Pošto je formirana tabela crta se histogram za F(x*+0) pomoću Chart Wizard-a.

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

20 21 22 23 24 25 26

F(x*

+0)

Primer 3.4 U tabeli je dat je uzorak sa grupisanim podacima. Proceniti a) srednju vrednost i disperziju osnovnog skupa. b) standardnu grešku srednje vrednosti uzorka Tabela uz Primer 3.4

Klase Sredina klasa Frekvence

x* m 1. 1.45 - 1.95 1.7 2 2. 1.95 - 2.45 2.2 1 3. 2.45 - 2.95 2.7 4 4. 2.95 - 3.45 3.2 15 5. 3.45 - 3.95 3.7 10 6. 3.95 - 4.45 4.2 5 7. 4.45 - 4.95 4.7 3

Page 60: Praktikum EXEL

59

Rešenje Prvo se formira nova tabela:

a) Na osnovu tabele pomoću formula prikazanih na slici izračanuavaju se srednja vrednost i disperzija.

b) Na sličan način se po odgovarajućim formulama se izračunava standardna greška

Page 61: Praktikum EXEL

60

4. Intervalne ocene parametara

raspodele

Page 62: Praktikum EXEL

61

Interval poverenja

Ocene parametra θ, u vidu intervala, zovu se intervalne ocene. Intervalna ocena se zove i

interval poverenja ili pouzdanosti. Interval ( )*2

*1 ,θθ je interval pouzdanosti ili interval poverenja

za parametar θ, sa nivoom pouzdanosti ili poverenja γ, ako sa unapred zadatom verovatnoćom, γ možemo da tvrdimo da sadrži tačnu vrednost parametra, odnosno ako važi:

α−=γ=<θ< θθ 1)( *2

*1P

Jasno je da je:

α=≥θ∨≤θ θθ )( *2

*1P

pa se verovatnoća α = 1 - γ naziva i rizik, jer predstavlja verovatnoću da tačna vrednost parametra bude izvan procenjenog intervala. Granice intervala pouzdanosti *

2*1 ,θθ se nazivaju

granice pouzdanosti ili poverenja, a širina intervala θ θ2 1* *− predstavlja meru preciznosti

intervalne ocene parametra (što je širina intervala manja, preciznost intervalne ocene je veća). Za interval poverenja kažemo da je simetričan, ako važi:

2/)()( *2

*1 α=>θ=<θ θθ PP

4.1 Ocena srednje vrednosti normalne raspodele sa poznatom disperzijom

Pretpostavimo da je slučajni uzorak obima n uzet iz populacije sa normalnom raspodelom N (µ,σ), čija je disperzija σ2 poznata. Uzoračka srednja vrednost X tada ima raspodelu ,

X : N ( )nxxσ

=σσµ ,,

Odredimo sada, za zadatu verovatnoću, γ granicu apsolutnog odstupanja aritmetičke sredine X od njene srednje vrednosti µ, sa njenim standardnim odstupanjem nx σ=σ kao jedinicom mere (koliko standardnih odstupanja xσ , iznosi ta granica?). Odredimo dakle faktor zα, takav da važi:

( ) α−=γ=σ<µ− α 1xzXP (4.1)

gde je γ zadato. Uzećemo jednačinu

σε

Φ=ε<∆ 2)( XP i primeniti je na posmatrani problem.

Znači da treba u jednačini,

Page 63: Praktikum EXEL

62

• apsolutno odstupanje X∆ zameniti sa µ−X ,

• za granicu odstupanja ε uzeti xz σα , • σ zameniti sa xσ

Rezultat je:

( ) ( ) γ=Φ=σ<µ− αα zzXP x 2

Dakle, traženi faktor αz se dobija kao rešenje jednačine:

( )2

1 α−=Φ αz

odnosno predstavlja onu vrednost standardizovane slučajne promenljive sa normalnom raspodelom za koju Laplasova funkcija dobija vrednost ( ) 21 α− . Relaciji xzX σ<µ− α su

ekvivalentne sledeće relacije xx zXz σ+µ<<σ−µ αα (4.2a)

xx zXzX σ+<µ<σ− αα (4.2b)

pa se jedn. (4.1) može interpretirati na dva različita načina:

• Relacija (4.2a) predstavlja događaj da uzoračka srednja vrednost, kao slučajna promenljiva, upadne u interval sa fiksnim granicama (zα, xσ i µ su konstante), koga

možemo zvati verovatan interval za uzoračku srednju vrednost, X . Jednačina (4.1), tako definiše granice verovatnog intervala za X , pod uslovom da je poznata srednja vrednost µ

• Događaj (4.2b) uz zadatu verovatniću γ, po definiciji α−=γ=<θ< θθ 1)( *2

*1P

predstavlja interval poverenja za nepoznatu srednju vrednost µ, izračunat iz datog uzorka.

Zaključujemo da, pri poznatoj disperziji osnovnog skupa, interval pouzdanosti sa nivoom pouzdanosti γ = 1 - α, za srednju vrednost osnovnog skupa µ, glasi:

( ) nzxnzxnzx / ili,/,/ σ±=µσ+σ− ααα (4.3)

gde je zα definisano jednačinom ( )2

1 α−=Φ αz i zvaćemo ga koeficijent pouzdanosti (J.O.Bird).

Ekvivalentna definicija koeficijenta pouzdanosti je (vidi sliku 4.1): ona vrednost standardizovane slučajne promenljive sa normalnom raspodelom za koju važi,

( ) α=≥ αzXP 0 (4.3a)

Zaista,

Page 64: Praktikum EXEL

63

( ) ( ) ( )ααα ≥=

σµ−

=σ≥µ−=α zXPzXPzXPx

x 0

5.6

( ) 20

2

21 x

exf−

π=

Slika 6.1. Ilustracija jednačine 4.3a

U Tab. 4.1. date su vrednosti koeficijenta pouzdanosti za tri nivoa pouzdanosti γ, koje se najčešće koriste u praksi.

Tabela 4.1 - koeficijenti pozdanosti, zα

γ α αz 0.90 0.10 1.64 0.95 0.05 1.96 0.99 0.01 2.58

Treba zapaziti da su granice intervala poverenja (4.3) slučajne vrednosti ( X je slučajna veličina). Dakle interval poverenja predstavlja jedan slučajan interval, koji sa zadatom verovatnoćom γ obuhvata nepoznatu ali fiksnu vrednost µ. Tako, ako bi postupak uzimanja uzorka i određivanja intervala poverenja ponavljali, svaki put bi dobili drugačiji interval poverenja, ali bi mogli očekivati da će u (γ⋅100) % (recimo 95%) svih slučajeva izračunati interval pouzdanosti obuhvatiti parametar µ. Jasno je sada zašto se za verovatnoću γ kaže da predstavlja nivo pouzdanosti intervalne ocene.

Aritmetička sredina četiri izmerene temperature peći optičkim pirometrom je 22500C. Ako je greška merne metode, σ = 100C, a) Naći sa pouzdanošću od 95% interval u kome leži prava vrednost temperature. b) Koliko je ponovljenih merenja temperature neophodno, da bi preciznost procene odstupanja tačne temperature od izmerene (sa datim nivoom pouzdanosti) bila 50C?

Rešenje

a) Za γ = 0.95, iz tablice : 96.1975.021 ==α− zz , pa je, interval poverenja srednje vrednosti merenih temperatura peći:

Page 65: Praktikum EXEL

64

odnosno, sa pouzdanošću od 95%, prava temperatura peći, t leži u intervalu

Ct 08.22592.2240 <<

b) Preciznost procene predstavlja poluširinu intervala pouzdanosti, pa je uslov:

35.1592.3

92.351096.1

2

1 2

=≥

≥⇒≤=σ

⋅α−

n

nnn

z

Odnosno u Excelu ovo izračunavanje izgleda ovako:

Usvaja se kao minimalan broj neophodnih merenja: n = 16

Aproksimacija za velike uzorke iz raspodele sa nepoznatom disperzijom

U skladu sa centralnom graničnom teoremom, za veće uzorke iz bilo koje raspodele sa parametrima µ i σ, primenljiva je aproksimacija da aritmetička sredina X ima normalnu raspodelu N ( nσµ, ). S druge strane, za velike uzorke (n ≥ 30) je primenljiva i aproksimacija:

( ) 222 σ=σ=∗s

pa se za veće uzorke (n ≥ 30) iz raspodele sa nepoznatom disperzijom, interval (4.3) aproksimira intervalom:

( ) nszxnszxnszx / ili,/,/ ααα µ ±=+− (4.4)

bez obzira na tip raspodele.

Page 66: Praktikum EXEL

65

Primer 4.2

Obavljeno je 100 merenja mase čokolada, čija je deklarisana masa 100g (prva kolona tabele).

a) Odrediti granice u kojima se nalazi srednja masa čokolada “od 100grama”, sa pouzdanošću od 90%, b) Ponoviti proračun za nivo pouzdanosti 99%. c) Da li se sa pouzdanošću od 90% može tvrditi da je srednja masa čokolade “od 100grama” manja od nominalne (100g), tako da ukazuje na poremećaj u procesu? Da li se ista tvrdnja može dati i sa sa pouzdanošću od 99% ?

Rešenje

Najpre izračunavamo uzoračku srednju vrednost i uzoračku disperziju iz formula za grupisane podatke

a) Za pouzdanost 90%, 64.1=αz , pa je poluširina intervala pouzdanosti:

Page 67: Praktikum EXEL

66

g46.006.99 ±=µ

b) Za pouzdanost 99%, 58.2=αz ,

Prema očekivanju, sa povećanjem nivoa pozdanosti smanjena je preciznost intervalne ocene (širi interval)

c) Sa pouzdanošću γ = 0.9, srednja masa proizvedenih čokolada “od 100grama” leži u intervalu:

( ) ( )52.99,60.9846.006.99,46.006.99 ⇒+−

Pošto taj interval ne obuhvata nominalnu vrednost 100g i leži ispod te vrednosti, sa datom pouzdanošću možemo da tvrdimo da je srednja vrednost populacije, tj. srednja masa proizvedene čokolade manja od deklarisane.

4.2 Ocena srednje vrednosti normalne raspodele nepoznate disperzije

U slučajevima kada je disperzija σ2 nepoznata i uzorak nije veliki (n < 30) određivanje intervala pouzdanosti srednje vrednosti populacije sa normalnom raspodelom N (µ, σ), bazira se na Studentovoj ili t - raspodeli.

Primer 4.3

Procenat bakra u nekoj supstanci meren je 6 puta i aritmetička sredina 6 merenja je 1.14=x %. Odrediti interval u kome sa pouzdanošću γ = 95% leži pravi sadržaj bakra,

a) Ako je poznata greška metode, σ = 2.5 b) Iz datog uzorka procenjena je greška metode, s = 2.1

Page 68: Praktikum EXEL

67

Na osnovu ovih podataka prema formuli se na sledeći način izračunava interval:

Kada je poznata procenjena greška metode, izračunava se td,α pomoću funkcije TINV. Funkcija se poziva iz padajućeg menije Insert, opcije Function, i odabirom TINV iz statističkih funkcija.

Sintaksa:

TINV(Probability, Deg_freedom)

Probability – verovatnoća da vrednost x bude izvan intervala (–x,x).

Deg_freedom – je broj koji označava broj stepeni slobode karakterističan za raspodelu.

Rezultat funkcije je vrednost za koju Studentova raspodela „t“ ima zadatu verovatnoću.

U konkretnom slučaju kako je pouzdanost 95%, verovtanoća je 1-0.95=0.05, što se i upisuje u polje Probability, a broj stepeni slobode je n-1=6-1=5, i upisuje se u polje Deg_freedom. Dobijeni rezultat je vrednost td,α, koja se dalje koristi za izračunavanje intervala po formuli:

Page 69: Praktikum EXEL

68

Primer 4.4.

Radi provere tačnosti metode, fotometrijskom titracijom je određivan berilijum u probi sa poznatom količinom berilijuma od 3.179mg. Rezultati ponovljenih analiza (mg) su:

3.167, 3.177, 3.177, 3.169, 3.173, 3.177, 3.177, 3.177, 3.171, 3.169

a) Proceniti interval pouzdanosti za sistematsku grešku (bias) metode, b:

179.3−µ=b

sa 95% nivoom pouzdanosti, gde je µ srednja vrednost zamišljenog osnovnog skupa, koji sadrži beskonačan broj svih mogućih rezultata određivanja berilijuma u datoj probi.

Rešenje

Prvo sve podatke treba uneti u tabelu na sledeći način:

a) Ocena sistematske greške iz datog uzorka od 10 merenja je:

179.3* −= xb .

Srednja vrednost x se izračunava pomoću funkcija AVERAGE.

interval pouzdanosti za njenu srednju vrednost b, dobija se kao

1005.0,9

* stbb ±=

Iz datog uzorka izračunava se:

0057.0,1733.3 * −== bx

Zatim se pomoću funkcije TINV izračunava t:

Page 70: Praktikum EXEL

69

s se izračunava pomoću funkcije STDEV

Funkcija STDEV procenjuje standardnu devijaciju na osnovu uzorka.

Sintaksa: STDEV(number1, number2...)

Number1, number2.. je 1 do 30 brojeva koji se odnose na uzorak populacije. To može da bude i samo jedan niz ili referenca niza umesto argumenata rastavljenih zarezom.

Funkcija STDEV poziva se iz menija Insert, izborom opcije Function , Statistical , STDEV.

Interval je dalje :

Primer 4.5

Za uzorke u Primeru 3.2 izračunati intervalnu ocenu standardnog odstupanja sa pouzdanošću 90%. Rešenje:

Prvo treba formirati sledeću tabelu:

Page 71: Praktikum EXEL

70

Zatim treba upisati sledeće podatke i izračunati disi2 i d

Dalje se izračunava s2 i s po formuli:

Pomoću funkcije CHIINV izračunava se : 69.23,57.6 205.0,14

2,14

295.0,14

21,14 22

=χ=χ=χ=χ αα−

Funkcija CHIINV se takođe nalalazi u statističkim funkcijama. Rezultat funkcije je inverz funkcije raspodele hi- kvadrat. Funkcija CHIINV do rezultata dolazi iteracijama. Kada se zadda vrednost verovatnoće, funkcija CHIINv pravi iteracije dok se ne dobije rezultat tačan do ±3 10-7. Ako funkcija ne kovergira ni posle 100 iteracija, rezultat će biti vrednost greške #N/A. Sintaksa: CHIINV (Probability, Deg_freedom)

Probability - verovatoća raspodele hi-kvadrat za koju se izračunava x.

Deg_freedom – broj stepeni slobode.

Pa je :

Page 72: Praktikum EXEL

71

Page 73: Praktikum EXEL

72

5. Analiza korelacije

Page 74: Praktikum EXEL

73

Predmet ove glave je analiza međuzavisnosti (korelacije) dve neprekidne slučajne promenljive, na bazi paralelnog praćenja njihovih vrednosti. Najočigledniji primer međuzavisnosti dve slučajne veličine su visina i masa čoveka i u pitanju je ne funkcionalna, već stohastička veza između ta dva obeležja. Drugi primer je uticaj sadržaja neke komponente u složenom materijalu, recimo građevinskom, na neko svojstvo tog materijala, recimo čvrstinu. Želimo metodama statistike da, na osnovu merenja, dođemo do zaključka da li posmatrani sadržaj komponente utiče na čvrstinu građevinskog materijala i uz to,

• koliko je ta korelacija izražena (jaka), • da li je ona pozitivna ili negativna, tj. da li sa porastom sadržaja posmatrane

komponente čvrstina građevinskog materijala raste ili opada. Dijagram rasipanja Za statističku analizu korelisanosti dve slučajne promenljive (obeležja) X i Y,

neophodno je raspolagati parovima (odgovarajućih) vrednosti promenljivih:

( ) niyx ii ,...,2,1,, = (5.1)

ili tzv. vezanim uzorkom (5.1), umesto sa dva nevezana ili nezavisna uzorka: ( )nixi ,...2,1, = i ( )miyi ,...2,1, = gde su merenja xi i yi nepovezana.

Prvi korak u analizi korelacije je ucrtavanje uređenih parova (xi, yi), kao tačaka, u xy koordinatni sistem. Dobijeni dijagram se naziva dijagram rasipanja (scatter diagram). Na osnovu rasporeda tačaka u dijagramu, može se grubo proceniti:

• da li postoji stohastička zavisnost promenljivih (korelacija), • ako postoji korelacija, da li je ona linearna ili nelinearna, • ako postoji korelacija, da li je ona slaba ili jaka,

Slika 5.1. Ilustracije linearne korelacije: a) jaka pozitivna, b) slaba pozitivna, c) negativna

Page 75: Praktikum EXEL

74

x x

y y

a) b)

Slika 5.2. (a) Nelinearna korelacija, (b) Nema korelacije

Na slikama 5.1a - c, eksperimentalne tačke leže oko neke prave, što daje osnovu za pretpostavku da su X i Y približno ili tačno, linearno povezane. Ako tačke leže blizu prave (Sl 5.1a), u pitanju je jaka korelacija, a ako je rasipanje tačaka oko prave veliko, korelacija je slaba (Sl.5.1). Slike (5.1a,b), ukazuju na pozitivnu korelaciju ili pozitivan trend, jer su velike vrednosti za Y , uglavnom, u paru sa velikim vrednostima X, dok Sl.5.1c ilustruje negativnu korelaciju ili trend, gde su velike vrednosti za X praćene uglavnom malim vrednostima za Y.

Slika 5.2a ilustruje slučaj nelinearne korelacije ili nelinearne stohastičke veze, jer se tačke rasipaju oko neke krive. Konačno, na Sl. 5.2b, ne uočava se povezanost između X i Y, tj. nema ni pozitivnog ni negativnog trenda, pa zaključujemo da su one nezavisne ili nekorelisane.

Iz teorije verovatnoće znamo da dijagrami (5.1a-c, 5.2a), na kojima su eksperimentalne tačke raspoređene duž neke prave ili krive ukazuju na (funkcionalnu) zavisnost uslovne srednje vrednosti slučajne promenljive Y od druge promenljive X. Dalje, linija na dijagramu rasipanja, u blizini koje leže eksperimentalne tačke, predstavlja u stvari grubu ocenu iz datog uzorka (5.1), funkcije (linije) regresije:

)(1 xxy ϕ=µ

Pri tom, ako je zavisnost pravolinijska, znači da dvodimenzionalna promenljiva (X,Y) ima normalnu raspodelu.

U ovom materijalu, ograničićemo se na linearnu korelaciju, što znači,

• da će se statistička analiza bazirati na pretpostavci o normalnoj raspodeli dvodimenzionalne promenljive (X,Y),

• da će predmet analize biti uzorački koeficijent korelacije, kao mera jačine i pokazatelj pozitivne ili negativne korelacije

Page 76: Praktikum EXEL

75

5.1 Uzorački koeficijent korelacije

Ocenu koeficijenta korelacije slučajnih promenljivih X i Y :

yx

xyxy σσ

σ=ρ

iz uzorka (5.1) dobićemo iz ocena kovarijanse xyσ , i standardnih odstupanja σx, σy, iz istog uzorka:

yx

xyxy ss

sr = (5.2)

Nepristrasne ocene sx i sy standardnih odstupanja, dobijaju se iz vrednosti statistike S2,

∑∑==

−−

=−−

=n

iiy

n

iix yy

nsxx

ns

1

22

1

2 )(1

1,)(1

1 (5.3)

a sxy kao:

∑=

−−−

=n

iiixy yyxx

ns

1

))((1

1 (5.4)

tj. kao vrednost statistike:

∑=

−−−

=n

iiixy YYXX

nS

1

))((1

1 (5.5)

za koju se može pokazati da predstavlja nepristrasnu ocenu kovarijanse xyσ (3.16b). Smena izraza (5.3) i (5.4) u (5.2) i transformacije analogne onoj, koja je primenjena za izvođenje praktične formule za računanje uzoračke disperzije (4.14a), daju sledeću praktičnu formulu za izračunavanje uzoračkog koeficijenta korelacije:

1,))((

2

11

22

11

2

111 ≤

−=

∑∑∑∑

∑∑∑

====

===xy

n

ii

n

ii

n

ii

n

ii

n

ii

n

ii

n

iii

xy r

yynxxn

yxyxnr (5.6)

U matematičkoj statistici se dokazuje da je ocena koeficijenta korelacije ρxy dobijena formulom (5.6) konzistentna i asimptotski nepristrasna.

Iz izračunate vrednosti uzoračkog koeficijenta korelacije, može se dati ocena jačine linearne korelacije na osnovu empirijskog pravila [Vukadinović, 1990] datog u Tabeli 5.1.

Page 77: Praktikum EXEL

76

Tabela 5.1 - Jačina linearne korelacije

Primer 5.1 Primećeno je da je visok sadržaj supstance A u sirovini, obično praćen i visokim sadržajem supstance B. Radi utvrđivanja eventualne linearne korelacije između sadržaja dve komponente izvršeno je merenje sadržaja A i B u 10 slučajnih uzoraka sirovine. Rezultati su dati u prve dve kolone Tabele 5.1. Tabela uz Primer 5.1

Rešenje

Tačke (xi, yi) treba ucrtati u dijagram rasipanja. Očigledan je pozitivan linearan trend: porast sadržaja jedne suspstance, praćen je porastom sadržaja druge. Kao meru jačine linearne veze između sadržaja supstanci A i B, mže se izračunati po jedn. (5.6) uzorački koeficijent korelacije. Pomoćni proračuni su dati u tabeli.

933.01743182104992711510

17449992281022=

−⋅−⋅

⋅−⋅=xyr

rxy jačina linearne veze:

r ≤ 0.3 neznačajna korelacija

0.5 < r < 0.7 značajna korelacija

0.7 ≤ r ≤ 0.9 jaka korelacija

r > 0.9 vrlo jaka korelacija

x (% A) y (% B) x2 y2 xy

67 24 4489 576 1608 54 15 2916 225 810 72 23 5184 529 1656 64 19 4096 361 1216 39 16 1521 256 624 22 11 484 121 242 58 20 3364 400 1160 43 16 1849 256 688 46 17 2116 289 782 34 13 1156 169 442

∑ 499 174 27175 3182 9228

Page 78: Praktikum EXEL

77

0

5

10

15

20

25

30

0 10 20 30 40 50 60 70 80

x(%A)

y(%

B)

Dakle uzorački koeficijent se može izračunati po formuli, ali postoji i znatno jednostavniji način za njegovo izračunvanje, gde nisu potrebni pomoćni proračuni. Uzorački koeficijent korelacije može se izračunati i korišćenjem funkcije PEARSON. Funkcija PEARSON nalazi se u statističkim funkcijama, rezultat je Pearson-ov koeficijent korelacije r koji pokazuje linearnu korelaciju dva skupa podataka. Sintaksa: PEARSON(Array1, Array2) Array1 – je skup nezavisnih podataka. Array2 – je skup zavisnih podataka.

Page 79: Praktikum EXEL

78

Prema empirijskom kriterijumu (Tab.5.1), u pitanju je vrlo jaka linearna veza.

5.2 Regresione prave

Ako smo na osnovu veličine uzoračkog koeficijenta korelacije rxy, zaključili da posmatrane slučajne promenljive nisu nezavisne, korisno je izračunati koeficijente u pravolinijskim zavisnostima jedne od druge promenljive, koje predstavljaju ocene iz datog uzoraka (5.1), linearnih regresionih funkcija:

)(/ xx

yxyyxy x µ−σσ

ρ+µ=µ (3.35b)

)(/ yy

xxyxyx y µ−σσ

ρ+µ=µ (3.36b)

Dobijene pravolinijske zavisnosti zvaćemo regresione prave (regression lines) i iz njih možemo da procenimo ili predvidimo (predict) vrednost jedne slučajne promenljive na osnovu vrednosti druge.

Regresionu pravu y(x), kao ocenu regresione funkcije (3.35b) ćemo, logično, tražiti u obliku:

xbbxxss

ryyx

yxy 10)( +=−+=

odakle slede formule za izračunavanje nagiba b1 i odsečka b0:

Page 80: Praktikum EXEL

79

2

11

2

11121

))((

−===

∑∑

∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

x

xy

x

yxy

xxn

yxyxn

ss

ss

rb (5.7a)

xbyb 10 −= (5.7b)

Slično, regresionu pravu x(y), dobijamo kao ocenu regresione funkcije (3.36b):

yccyyssrxx

y

xxy 10)( +=−+=

i formule za nagib c1 i odsečak c0 su:

2

11

2

11121

))((

−===

∑∑

∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

y

xy

y

xxy

yyn

yxyxn

ss

ssrc (5.5a)

ycxc 10 −= (5.8b)

Primer 5.2 Iz podataka datih u prethodnom primeru, potrebno je a) proceniti sadržaj komponente B u sirovini, ako ona sadrži 55% supstance A b) proceniti sadržaj komponente A u sirovini, ako ona sadrži 20% supstance B

Rešenje

a) Traženu procena dobija se iz regresione prave y(x). Dakle prvo je potrebno izračunati parametre ove prave. Parameti se mogu izračunati korišćenjem statističkih funkcija SLOPE i INTERCEPT.

Za x = 55, računa se y iz regresione prave, odnosno procenu sadržaja supstance B:

Page 81: Praktikum EXEL

80

Rezultat funkcije SLOPE je nagib linearne regresije. Sintaksa: SLOPE(Known_y's, Known_x's) Known_y's - je matrica ili skup ćelija zavisnih numeričkih pojedinačnih podatak. Known_x's – je skup nezavisnih pojedinačnih podataka.

Rezultat funkcije INTERCEPT je tačka preseka linearne regresije sa y osom. Sintaksa: INTERCEPT(Known_y's, Known_x's) Known_y's - je matrica ili skup ćelija zavisnih numeričkih pojedinačnih podatak. Known_x's – je skup nezavisnih pojedinačnih podataka.

b) Procena sadržaja x supstance A za dati sadržaj y supstance B, ne računa se iz prethodno dobijene prave (rešavajući njenu jednačinu po x), već iz prave, koja predstavlja ocenu regresije x po y i čiji su parametri:

Page 82: Praktikum EXEL

81

Za sadržaj komponente B, y = 20, procenjeni sadržaj x druge komponente biće:

%592053.36.1110 =⋅+−=+= yabx što se veoma dobro slaže sa eksperimentalnom vrednošću (58%). To se moglo očekivati, s obzirom na jaku korelaciju (rxy > 0.9), tj. približavanje linearne stohastičke zavisnosti, funkcionalnoj.

5.3 Provera značajnosti korelacije

Ako je dobijena vrednost uzoračkog koeficijenta korelacije (5.6) mala po apsolutnoj vrednosti, postavlja se pitanje da li ona ukazuje na postojanje linearne korelacije između slučajnih promenljivih X i Y , ili je samo rezultat slučajnih varijacija vrednosti statistike Rxy, definisane formulom (5.6), oko nule kao njene srednje vrednosti. Zato proveravamo statističku značajnost izračunatog uzoračkog koeficijenta korelacije ili, drugim rečima hipotezu:

0:0 =ρxyH (5.9)

Teorijska osnova za formulisanje testa je sledeći stav (teorema): Ako slučajna promenljiva (X,Y) ima dvodimenzionalnu normalnu raspodelu, sa nultom vrednošću koeficijenta korelacije ρxy (X i Y su nezavisne), tada slučajna promenljiva:

21

2

xy

xy

R

nRT

−= (9.9)

gde su: n - obim uzorka (5.1)

Page 83: Praktikum EXEL

82

Rxy - uzorački koeficijent korelacije (5.6)

ima t - raspodelu sa d = n - 2 stepena slobode. Odatle slede kriterijumi značajnosti uzoračkog koeficijenta korelacije, odnosno odbacivanja hipoteze (5.9) i dati su u Tab.5.2 Tabela 5.2 - Testiranje hipoteze H0: ρ = 0

Primer 5.3 Izmerene vrednosti sadržaja kalaja u leguri (x, %) i odgovarajuće izmerene tačke topljenja (y, 0C) date su u prve dve kolone tabele: x, % 44.1 44.9 44.4 44.7 45.1 45.0 44.7 44.6 46.3 y, 0C 513 512 511 510 513 514 521 514 526

x, % 44.9 45.1 44.5 45.1 43.0 44.8 44.2 45.2 45.5 y, 0C 525 522 521 513 537 513 519 512 514

Proceniti koeficijent korelacije između sadržaja kalaja i tačke topljenja i testirati njegovu značajnost sa α=0.05.

Rešenje

Pomoću funkcije PEARSON izračunava se koeficijent korelacije r

Testira se hipoteza:

H0: ρ = 0

Pošto je poznato da povećanje sadržaja kalaja u leguri po praviliu snižava temperaturu topljenja legure (negativna korelacija) to se, u cilju smanjenja rizika prihvatanja pogrešne nulte hipoteze, bira jednostrani test, tj. alternativna hipoteza:

H1: ρ < 0

Alternativna hipoteza, H1

Statistika: Kriterijum odbacivanja hipoteze:

ρ ≠ 0 α−> ,2ntt ρ > 0

α−> 2,2ntt ρ < 0

21

2

xy

xy

R

nRT

−=

vrednost za Rxy se računa iz α−> 2,2ntt

Page 84: Praktikum EXEL

83

Vrednost T - statistike izračunava se pomoću funkcije TINV, a zatim se po

formuli računa kritična vrednost:

75.1,27.1302.01

16302.01

21.0,1622=−=

−=

−= t

rnrt

Pošto je 1.27 < 1.75, izvodimo zaključak da rezultati merenja ne ukazuju na značajnu korelaciju između sadržaja kalaja i tačke topljenja legure.

5.4 Interpretacija koeficijenata korelacije

S obzirom na smisao teoretskog koeficijenta korelacije ρxy, njegovu procenu rxy, ima smisla računati samo kada ima indikacija (teoretska znanja, dijagram rasipanja) da je veza između posmatranih promenljivih linearna ili približno linearna. Ako je veza nelinearna, uzorački koeficijent korelacije r xy nije merilo jačine korelacije i može biti i blizak nuli, uprkos jakoj vezi.

Takođe je važno imati u vidu da statistički značajna vrednost koeficijenta korelacije nije dokaz da između posmatranih promenljivih postoji kauzalna (suštinska) veza. Tako, visoka vrednost rxy može biti rezultat delovanja treće promenljive, koja se menja u toku eksperimenata, a koja je prouzrokovala istovremene promene posmatranih promenljivih i privid njihove međuzavisnosti. Instruktivan i duhovit primer daju Boks i sar. [Box G., Hunter W i Hunter S, 1978]. U periodu od 7 godina, na kraju svake godine, je određivan broj stanovnika Oldenburga i broj roda i zapažena je jaka linearna korelacija između te dve veličine. Da li iz toga treba zaključiti da je porast nataliteta prouzrokovan porastom broja roda (rode donose decu?)? U ovom primeru, treća promenljiva, sa kojom su rasle posmatrane dve jeste vreme. U laboratorijskim i pogonskim merenjima, primer "treće" ili "nekontrolisane" promenljive je temperatura, koja deluje na veliki broj fizičko-hemijskih parametara i ako se ne kontroliše (drži konstantnom) u toku praćenja neke dve veličine, može stvoriti privid kauzalne veze izmedju njih.

Tako, da bi se utvrdila suštinska povezanost između dve promenljive, neophodno je dobro poznavati njihovu fizičko-hemijsku prirodu s jedne strane, i vrlo pažljivo kontrolisati eksperimente, s druge strane.

Page 85: Praktikum EXEL

84

ZADACI

5.1 Radi provere Njutnovog zakona hlađenja, prema kome temperatura hlađenog medijuma, y približno linearno opada sa vremenom, x izvršena su merenja i dobijeni rezultati:

Izračunati na tri decimale koeficijent korelacije i na osnovu njegove vrednosti oceniti jačinu korelacije i njen znak.

5.2 Radi provere Hukovog zakona (linearna veza između jačine sile i deformacije) dobijeni su sledeći rezultati merenja: Izračunati na tri decimale koeficijent korelacije i na osnovu njegove vrednosti oceniti jačinu korelacije i njen znak.

5.3 Dati su eksperimentalni podaci:

x: 6 5 8 8 7 6 10 4 9 7 y: 8 7 7 10 5 8 10 6 8 6

a) Nacrtati dijagram rasipanja i na osnovu njega proceniti jačinu i znak korelacije b) Izračunati koeficijent korelacije na tri decimale c) Izračunati koeficijente regresionih pravih y(x) i x(y), sa tačnošću od 3 decimale d) Izračunati, sa jednom decimalom, y za x = 6 i x za y = 9 e) Testirati značajnost koeficijenta korelacije sa nivoom značajnosti α = 0.05 5.4 Praćen je prinos (y, %) neke supstance u procesu, na različitim temperaturama (x, 0C):

x, 0C y, % x, 0C y, % 1100 8.5 11.6 1175 37.5 40 42.3 1125 19.0 28.2 21.8 1200 50.5 50.0 1150 29.5 30.6 1225 57.2 60.3 62.7

a) Nacrtati dijagram rasipanja i na osnovu njega proceniti jačinu i znak korelacije b) Izračunati koeficijent korelacije (sa tri decimale) i proveriti njegovu značajnost sa

nivoom α = 0.01 c) Izračunati odsečak regresione prave y(x) sa jednom decimalom i nagib sa 4

decimale. d) Izračunati prinos na temperaturi 1160 0C

Vreme, min 4 8 10 12 16 22 Temper. 0C 46 34 30 26 24 20

Sila, N 2 5 8 11 15 Istezanje, mm 2 23 62 119 223

Page 86: Praktikum EXEL

85

6. Regresiona analiza

Page 87: Praktikum EXEL

86

Često, od dve slučajne promenljive, jednu promenljivu (X) smatramo nezavisno-, a drugu (Y) zavisno-promenljivom. Tako je u Primeru 8.3, logično sadržaj kalaja u leguri smatrati nezavisno-, a temperaturu topljenja legure zavisno-promenljivom. Budući da daje srednju vrednost promenljive Y za zadatu vrednost X, najbolja funkcija za predskazivanje vrednosti Y za dato X je regresiona funkcija:

)(1 xxy ϕ=µ

Tako je u mnogim praktičnim problemima u nauci i tehnici od interesa naći približnu regresionu funkciju i predmet regresione analize je formulisanje približnih regresionih funkcija, koje se nazivaju regresione jednačine ili empirijske formule (jednačine), na osnovu uzorka (8.1).

Zadatak regresione analize obuhvata:

• Izbor oblika regresione funkcije,

),...,,,( 10 kxy x βββϕ=µ (6.1)

gde su βj, j = 0,1,...,k parametri ili koeficijenti, koji figurišu u funkciji (6.1) i zovu se pravi ili teorijski regresioni koeficijenti.

• Ocenjivanje regresionih koeficijenata βj, j = 0,1,...,k, tj. određivanje njihovih približnih vrednosti: b j, j = 0,1,...,k, tako da regresiona jednačina,

),...,,,()( 10 kbbbxxy ϕ= (6.2)

predstavlja što bolju aproksimaciju regresione funkcije (6.1). Koeficijenti bj se zovu empirijski regresioni koeficijenti ili parametri u empirijskoj formuli.

• Statističku analizu dobijene jednačine: preciznost predskazivanja, intervali poverenja teorijskih regresionih koeficijenata itd.

Izbor oblika regresione jednačine (empirijske formule)

Iz definicije regresione funkcije, sledi da izbor oblika regresione jednačine (6.1) zahteva poznavanje raspodele verovatnoće dvodimenzionalne slučajne promenljive (X,Y). Tako, ako je ona normalna, izveli smo (Pogl. 3.6) pravolinijsku zavisnost:

xx xyxx

yyxy 11/

0

)( β+µβ−µ=µ−σσ

ρ+µ=µβ

sa teorijskim koeficijentima regresije:

xyx

y µβ−µ=βσσ

ρ=β 101 ,

Regresiona jednačina ili empirijska formula tada glasi:

xbbxy 10)( +=

Page 88: Praktikum EXEL

87

čiji parametri b0 i b1 predstavljaju ocene teorijskih koeficijenata 10 , ββ i intuitivno smo ih izveli u Pogl. 8.2 (Jedn. 8.7a,b). Može se pokazati da te formule daju najverodostojnije ocene teorijskih regresionih koeficijenata, dakle one koje bi dobili primenom metode maksimalne verodostojnosti (Pogl. 4.4).

Kako u opštem slučaju, dvodimenzionalna raspodela nije poznata, problem izbora oblika regresione jednačine ili empirijske formule se rešava približno na osnovu:

• teoretskih znanja i iskustva u vezi sa uticajem neke fizičke veličine X na drugu fizičku veličinu Y

• dijagrama rasipanja eksperimentalnih tačaka ( ) niyx ii ,...,2,1,, = Na primer, poznato je da temperatura ima jak uticaj na brzinu hemijske reakcije. U hemijskoj kinetici se izraz za brzinu r nepovratne hemijske reakcije, najčešće traži u obliku:

⋅= 32121 ,...),()(),...,,(

msmolccfTkTccr

gde su c1,c2,..., molske koncentracije reaktanata, a k(T) se zove konstanta brzine hemijske reakcije, mada zavisi od temperature. Tako se pri ispitivanju uticaja temperature na brzinu neke reakcije, meri temperatura T(K) i eksperimentalno određuju odgovarajuće vrednosti konstante brzine hemijske reakcije k. Na osnovu poznavanja osnovnih zakonitosti u hemijskoj kinetici, empirijsku jednačinu k(T) tražimo u obliku poznate Arenijusove (Arrenius) formule:

TbRTE ebekTk /0

/0

1)( −− ==

Zbog svoje jednostavnosti i osobine da mogu dobro da aproksimiraju različite funkcije, kao empirijske formule se često koriste polinomi drugog i višeg stepena:

)2()( 2210 ≥+++= kxbxbxbbxy k

k (6.3)

Ako odabrana empirijska formula,

),...,,,()( 10 kbbbxfxy = (6.4)

nema kao osnovu regresionu funkciju (3.31a), već ima čisto empirijski karakter, tada se naravno ne može govoriti o parametrima bj, j = 0,1,...,k kao ocenama teorijskih regresionih koeficijenata.

Statistička analiza regresione jednačine

Ovo je veoma složen problem, jer zahteva poznavanje raspodela empirijskih regresionih koeficijenata, bj, j = 0,1,...,k , kao funkcija uzorka. Tako je on, u opštem slučaju rešiv samo uz pretpostavku da nezavisna promenljiva nije slučajna, već determinisana (kontrolisana) promenljiva. Drugim rečima, eksperimentalne vrednosti xi, i = 1,2,..,n u uzorku (8.1) su unapred odabrane ili fiksirane. Praktično, ovaj uslov će biti zadovoljen ako su slučajne varijacije (greške merenja) u vrednostima slučajne promenljive Y mnogo veće od onih u vrednostima X ( 22

xy σ>>σ ). Na primer, pri određivanju koeficijenata u Arenijusovoj zavisnosti konstante brzine

Page 89: Praktikum EXEL

88

hem. reakcije od temperature, slučajne greške merenja temperature su daleko manje od slučajnih grešaka pri određivanju konstanti brzine reakcije (posredna merenja).

6.1 Metod najmanjih kvadrata

Princip najmanjih kvadrata je formulisao Ležandr (Legendre): najverovatnija vrednost bilo koje veličine, koju određujemo na bazi ponovljenih merenja, je ona za koju je suma kvadrata odstupanja merenja od te vrednosti najmanja. Uzmimo na primer da je radi procenjivanja tačne vrednosti r neke fizičke veličine, izvedeno n ponovljenih merenja, sa rezultatima: xi, i = 1,2,...,n i pretpostavimo da merenja imaju normalnu raspodelu i da ne sadrže sistematske i grube greške. Prema principu najmanjih kvadrata, kao najverovatniju vrednost za r uzimamo onu za koju suma kvadrata odstupanja:

( )∑=

−=n

ii rxrS

1

2)(

ima minimum. Dobijamo je iz uslova minimuma funkcije S(r):

( )∑=

=−−=n

ii rx

drdS

1

02

kao:

∑=

==n

ii xx

nr

1

1

Prepoznajemo aritmetičku sredinu, za koju smo u Pogl. 4.5 pokazali, da predstavlja najverodostojniju ocenu srednje vrednosti rezultata merenja kao slučajne veličine, koja je, pod uslovom da merenje ne sadrže sistematske i grube greške, upravo jednaka tačnoj vrednosti merene veličine (Pogl.2.3).

Određivanje parametara u empirijskoj formuli

Neka raspolažemo eksperimentalnim tačkama (xi,yi), i = 1,2,...,n. Pretpostavimo, za početak, da su svih n vrednosti nezavisno promenljive u uzorku različite tj. da nema ponovljenih merenja zavisno promenljive za jednu vrednost nezavisne. Neka smo odabrali oblik empirijske formule (6.4), pri čemu je neophodno da broj parametara (k+1) u formuli, bude manji od broja eksperimentalnih tačaka:

k + 1 < n

Traže se vrednosti parametara bj, j = 0,1,...,k u odabranoj empirijskoj formuli, takve da se računske vrednosti zavisno promenljive dobijene iz nje:

nibbbxfy kiraci ,...,2,1),,...,,,( 10 == (6.5)

Page 90: Praktikum EXEL

89

najmanje razlikuju od eksperimentalnih (iz uzorka): yi, i = 1,2,...,n u smislu principa najmanjih kvadrata, a to znači da suma kvadrata odstupanja ei, i = 1,2,...,n eksperimentalnih od računskih vrednosti zavisno promenljive:

)1()(),...,,(1

2

1

210 +>−=== ∑∑

==

knyyebbbSSn

i

racii

n

iik (6.6)

bude najmanja. Geometrijski interpretirano, biraju se tako vrednosti parametara, da se kriva (6.4) "provlači" što bliže eksperimentalnim tačkama (Sl.6.1), pri čemu je mera odstupanja krive od eksperimentalnih tačaka, suma kvadrata odstupanja (6.6).

Slika 6.1 - Provlačenje krive između eksperimentalnih tačkaka

Primetimo da je suma kvadrata odstupanja S, funkcija samo nepoznatih parametara, jer su vrednosti ( ) niyx ii ,...,2,1,, = poznate, a računske vrednosti niyrac

i ,...,2,1, = su, prema (6.5), funkcije parametara. Problem izračunavanja parametara bj, j = 0,1,...,k se tako svodi na problem određivanja minimuma funkcije više promenljivih (6.6). Oni se dobijaju rešavanjem sistema jednačina, koji predstavljaju potreban uslov minimuma funkcije (6.6) i kojih ima tačno onoliko koliki je broj traženih parametara:

kjb

bbbS

j

k ,...,1,0,0),...,,( 10 ==∂

∂ (6.7)

Jednačine (6.7) su u literaturi poznate pod nazivom normalne jednačine.

Neka u uzorku, ( ) niyx ii ,...,2,1,, = ima ponovljenih merenja zavisno promenljive Y pri jednoj vrednosti za x, što znači da među vrednostima xi, i = 1,2,...,n ima jednakih. Tada, uz uslov da je broj različitih vrednosti nezavisno promenljive m (tj. broj njenih vrednosti u grupisanom uzorku) veći od broja parametara (k+1) u empirijskoj formuli:

m > k+1

važe sva prethodna razmatranja.

Page 91: Praktikum EXEL

90

6.2 Srednje kvadratno odstupanje empirijske formule Neka smo metodom najmanjih kvadrata odredili parametre bj, j = 0,1,...,k u odabranoj

empirijskoj formuli (6.4):

),...,,,()( 10 kbbbxfxy =

Nekada smo međutim suočeni sa problemom da od više empirijskih jednačina, koje mogu da sadrže različit broj paramatara, odaberemo najbolju, tj. onu koja najbolje opisuje ili "fituje" (od glagola to fit) date eksperimentalne podatke, odnosno najmanje u određenom smislu odstupa od njih. Za rešavanje tog problema, potrebna nam je neka mera odstupanja empirijske formule, čiji su parametri izračunati metodom najmanjih kvadrata, od eksperimentalnih podataka. U skladu sa principom najmanjih kvadrata, kao tražena mera, koristi se srednje kvadratno odstupanje empirijske formule ili regresione jednačine (6.4), definisano kao:

)1(

)),...,,,((

)1(

)(1

210

1

2

2

+−

−=

+−

−=

∑∑==

kn

bbbxfy

kn

yys

n

ikii

n

i

racii

(6.8)

Kao što vidimo, suma kvadrata odstupanja eksperimentalnih od računskih vrednosti iz dobijene empirijske formule, deli se razlikom ukupnog broja eksperimentalnih tačaka i ukupnog broja parametara u formuli. Tako se mogu porediti regresione jednačine sa različitim brojem parametara, pri čemu je pri jednakim sumama kvadrata odstupanja za dve formule, bolja ona koja sadrži manji broj parametara. Srednje kvadratno odstupanje (6.8) se u regresionoj analizi koristi za:

• poređenje kvaliteta više regresionih jednačina, • analizu adekvatnosti neke regresione jednačine

Ako se neka regresiona jednačina oceni kao adekvatna (adekvatno opisuje zavisnost srednje vrednosti slučajne promenljive Y od kontrolisane promenljive x), onda njeno srednje kvadratno odstupanje s2:

• daje nepristrasnu ocenu disperzije slučajne promenljive Y • predstavlja meru jačine stohastičke zavisnosti Y od x (ukoliko je s2 veće, veza je slabija)

6.3 Koeficijent determinacije

Kao mera jačine linearne stohastičke veze između promenljivih služi koeficijent korelacije

(Glava 5). Da bi smo definisali opštu meru jačine veze (linearne ili nelinearne) između slučajne promenljive Y i kontrolisane promenljive x, razmotrićemo značenje dve sume kvadrata odstupanja izračunate iz uzorka (xi, yi) i = 1,2,...,n. Suma:

∑=

−=n

ii yySST

1

2)(

predstavlja meru ukupne varijacije u eksperimentalnim vrednostima, yi. Suma,

Page 92: Praktikum EXEL

91

∑∑==

−=−=n

ik

n

i

raci ybbbxfyySSF

1

210

1

2 )),...,,,(()(

meri varijacije računskih vrednosti koje daje regresiona jednačina, oko aritmetičke sredine y kao odabrane referentne vrednosti. Može se reći da SSF predstavlja objašnjenu (empirijskom formulom) varijaciju oko y .

U slučaju da Y ne zavisi od x, odnosno da je:

yxy µ=µ /

empirijska jednačina, koja daje ocene srednje vrednosti za Y, će kao procene dati

niyyraci ,...,2,1, =≈

što kao rezultat ima vrednost SSF blisku nuli, odnosno količnik dve sume blizak nuli:

0≈SSTSSF

Drugi granični slučaj je funkcionalna veza između dve promenjive što znači da ni Y nije slučajna promenljiva. Tada će, pod pretpostavkom da je forma regresione jednačine tačna, ona tačno reprodukovati eksperimentalne tačke :

niyy iraci ,...,2,1, ==

pa će količnik dve sume biti jednak jedinici:

1=SSTSSF

Dakle, kao pogodna mera jačine veze između x i Y nameće se količnik dve sume:

10,)(

)(2

1

2

1

2

2 ≤≤−

−=

=

= Ryy

yyR n

ii

n

i

raci

(6.6)

koji se zove koeficijent determinacije. Za koeficijent determinacije važi: 0 ≤ R2 ≤ 1 pa se on može interpretirati kao deo ukupne varijacije koji je objašnjen empirijskom formulom. S obzirom na ovu osobinu, koeficijent determinacije je pogodnija mera jačine veze između Y i x nego srednje kvadratno odstupanje s2 (6.8).

6.4 Određivanje pravolinijske zavisnosti

Pretpostavimo da srednja vrednost slučajne promenljive Y linearno zavisi od kontrolisane promenljive x:

xxy 10 β+β=µ (6.10)

Page 93: Praktikum EXEL

92

Drugim rečima, zavisno promenljivu Y možemo da prikažemo u obliku zbira njene srednje vrednosti (6.10) i slučajnog odstupanja (greške) E :

0)(1 =+β+β= EE M,xY o (6.11)

Iz uzorka ( ) niyx ii ,...,2,1,, = procenjujemo vrednosti teorijskih regresionih koeficijenata 10 ,ββ , ili drugim rečima, izračunavamo parametre b0, b1 (odsečak prave i njen nagib) u empirijskoj formuli:

xbby 10 += (6.12)

Metodom najmanjih kvadrata, uzoračke regresione koeficijente b0, b1 dobijamo iz uslova minimuma sume kvadrata odstupanja eksperimentalnih od računskih vrednosti (6.6), koja u slučaju formule (6.12) izgleda:

∑∑==

+−=−=n

iii

n

i

racii xbbyyybbS

1

210

1

210 )]([)(),(

Primenjujući pravilo da je prvi izvod sume jednak sumi prvih izvoda, za uslove minimuma dobijamo:

∑=

=−+−=∂∂ n

iii xbby

bS

110

0

0)1)](([2

∑=

=−+−=∂∂ n

iiii xxbby

bS

110

1

0))](([2

odnosno, nakon deljenja jednačina sa (-2) i sređivanja:

∑ ∑= =

=−−n

i

n

iii xbnby

1 110 0

∑ ∑∑= ==

=−−n

i

n

ii

n

iiii xbxbyx

1 1

21

10 0

Konačno, nakon prebacivanja poznatih vrednosti na drugu stranu jednačina, dobijamo sistem od dve linearne jednačine po traženim parametrima:

∑∑==

=

+

n

ii

n

ii ybxnb

11

10 (6.13a)

∑∑∑===

=

+

n

iii

n

ii

n

ii yxbxbx

11

1

20

1 (6.13b)

koje predstavljaju normalne jednačine (6.7) za slučaj pravolinijske regresije. Rešenja dobijenog sistema jednačina se mogu prikazati u obliku identičnom formulama (5.7a,b):

Page 94: Praktikum EXEL

93

2

11

2

1111

))((

−=

∑∑

∑∑∑

==

===

n

ii

n

ii

n

ii

n

ii

n

iii

xxn

yxyxnb (6.14a)

xbyb 10 −= (6.14b)

Tako, pri sledećim pretpostavkama:

• važi linearan model (6.11) za merenja Yi, i = 1,2,...,n • disperzija slučajnih varijacija zavisno promenljive Y je konstantna:

( ) .2 constD y =σ=E

• merenja Yi, i = 1,2,...,n su nezavisna i imaju normalnu raspodelu

metod najmanjih kvadrata daje saglasne i nepristrasne ocene regresionih koeficijenata:

( ) 1,0, =β= jBM jj (6.15)

identične onima koje daje metod maksimalne verodostojnosti. U Jedn. 6.12, Bj su statistike čije se vrednosti računaju formulama (6.11a,b). Uz to, pokazuje se da srednjekvadratno odstupanje računskih vrednosti (6.8),

( )∑=

−−−

=n

iii xbby

ns

1

210

2

21

(6.16)

kao vrednost statistike:

( )∑=

−−−

=n

iii xbbY

nS

1

210

2

21

(6.17)

predstavlja nepristrasnu ocenu disperzije zavisno promenljive:

( ) 22ySM σ=

Formuli (6.16) ekvivalentna je sledeća:

)(21 22

122

xy sbsnns −−−

= (6.18)

gde su 22 i yx ss srednji kvadrati odstupanja:

1

/)(,

1/)( 22

222

2

−−

=−

−= ∑∑∑∑

nnyy

sn

nxxs ii

yii

x (6.19)

Primer 6.1 Zbog zajedničkog jona −Cl rastvorljivost BaCl2, y(%) u vodi, pri konstantnoj temperaturi približno linearno opada sa porastom koncentracije CaCl2, x(%) u vodi. a) Formulisati empirijsku jednačinu za procenjivanje rastvorljivosti BaCl2 pri različitim sadržajima CaCl2 u vodi, na bazi podataka datih u prve tri kolone tabele

Page 95: Praktikum EXEL

94

b) Proceniti rastvorljivost BaCl2 pri koncentraciji CaCl2 od 13%.

Tabela uz Primer 6.1

Rešenje

a) Nagib i odsečak u traženoj empirijskoj pravolinijskoj zavisnosti mogu se dobiti pomoću funkcija SLOPE i INTERCEPT. Iako funkcije SLOPE i INTERCEPT ne izračunavaju nagib i odsečak po metodi najmanjeg kvadrata, nego se traže parametri koji daju najbolje slaganje sa eksperimentalnim podacima, rezultat će svakako biti dobar pa njihovo korišćenje ne predstavlja grešku.

pa je empirijska prava:

xy 355.143.31 −=

U dijagram su ucrtane eksperimentalne tačke i dobijena prava.

N0 x y x2 xy 1 0 32 0 1024 2 5 25 25 625 3 8 20 64 400 4 10 17 100 289 5 15 11 225 121 6 20 5 400 25 ∑ = 58 110 814 720

Page 96: Praktikum EXEL

95

y = -1.3553x + 31.434

0

5

10

15

20

25

30

35

0 5 10 15 20 25

x

y

Series1Linear (Series1)

Slika uz Primer 6.1

Prvo se nacrta dijagram na osnovu eksperimentalnih podataka, a zatim se dodaje prava (trendline). To se radi na sledeći način: Pošto je nacrtan dijagram desnim tasterom klikne se na neku od tačaka i odabere opcija Add Trendline.

Nakon toga otvara se novi prozor u kome se bira tip linije, (odabere se Linear), zatim se klikne

na karticu Options

Page 97: Praktikum EXEL

96

Gde se vrše ostala podešavanja vezana za pravu, između ostalog može se na dijagramu prikazati i jednačina ove prave, ukoliko se označi polje Display equation on chart. Potvrđuje se sa OK, i linija je na dijagramu.

b) Smenom zadate rastvorljivosti CaCl2, x = 13 u dobijenu empirijsku jednačinu, dobijamo procenu odgovarajuće rastvorljivosti BaCl2:

%8.1313355.143.31 =⋅−=y

Primer 6.2 Merene su električne otpornosti R metalnog provodnika na različitim temperaturama t:

t, 0C 30 35 40 45 50 55 60 R,Ω 86.67 92.01 93.92 96.60 97.77 99.77 101.82

Potrebno je iz podataka,

a) izračunati temperaturni koeficijent otpornosti metala α, koji je definisan jednačinom temperaturne zavisnosti otpora:

( )tRtR α+= 1)( 0

b) proceniti standardnu grešku primenjene metode merenja otpornosti.

Rešenje

a) Pošto su u datoj pravolinijskoj zavisnosti otpora od temperature:

( ) tbbtRRtRtR 10000 1)( +=α+=α+=

odsečak i nagib jednaki:

b0 = R0 b1 = R0α

traženi temperaturni koeficijent α se dobija iz njih kao:

0

1

0

1

bb

Rb

==α

Uz x = t, y = R, računa se nagib i odsečak pomoću funkcija INTERCEPT i SLOPE:

Page 98: Praktikum EXEL

97

i iz njih koeficijent α:

0062.00

1 ==αbb

Dijagram rasipanja eksperimentalnih tačaka i regresiona prava su dati na slici uz primer.

y = 0.463x + 74.674

84

86

88

90

92

94

96

98

100

102

104

30 40 50 60 70

Series1Linear (Series1)

Slika uz Primer 6.2

b) Kao ocenu standardne greške merne metode σR, može se uz pretpostavke navedene u prethodnom tekstu, da uzmemo srednje kvadratno odstupanje (6.16):

( )∑=

Ω==−−−

=n

iiiR xbby

ns

1

210 43.1

5125.7

21

Koje se takođe može izračunati kvadriranjem rezultata dobijenog korišćenjem funkcije STEYX. Funkcija se nalazi u statističkim funkcijama, a njen rezultat je standardna greška predviđene vrednosti y za svako x u regresiji. Sintaksa: STEYX(Known_y's, Known_x's) Known_y's – niz ili skup zavisnih pojedinačnih podataka. Known_x's - niz ili skup nezvavisnih pojedinačnih podataka

Page 99: Praktikum EXEL

98

Koeficijent determinacije i koeficijent korelacije

Koeficijent determinacije, kao opšta mera jačine veze između Y i x, u slučaju pravolinijske zavisnosti dobija oblik:

2

22

1

1

2

1

221)14.9(

1

2

1

210

1

2

1

2

2

)(

)(

)(

)(

)(

)(

y

xn

ii

n

iib

n

ii

n

ii

n

ii

n

i

raci

ssb

yy

xxb

yy

yxbb

yy

yyR =

−=

−+=

−=

=

=

=

=

=

= (6.20)

gde su 22 , yx ss srednji kvadrati odstupanja (6.19). Ako parametar b1 izrazimo preko koeficijenta korelacije rxy, pomoću Jedn. (8.7a):

x

yxy s

srb =1

dobijamo da je koeficijent determinacije jednak kvadratu koeficijenta korelacije:

xyxy rRRrR === 222 ili

što smo, s obzirom na značenje tih koeficijenata mogli da očekujemo. U slučaju linearne

zavisnosti Y od x, 2R dakle daje jačinu linearne veze, ali pošto je uvek pozitivan, ne daje (za razliku od rxy) informaciju o tome da li Y opada ili raste sa x.

Page 100: Praktikum EXEL

99

6.5 Intervali poverenja odsečka i nagiba

Određivanje intervala poverenja odsečka β0 i nagiba β1 u pravolinijskoj regresionoj funkciji (6.10), zahteva poznavanje raspodela njihovih ocena, tj. statistika Bj, j = 0,1. Sa pretpostavkama navedenim u prethodnom poglavlju, može se pokazati da uzorački regresioni koeficijenti imaju normalne raspodele:

Bj: N 1,0),,( =σβ jjbj (6.21)

sa disperzijama:

212

22

)1(1 yx

yb c

snσ=

σ=σ (6.21a)

20

22

1

2

2

)1(0 yyx

n

ii

b csnn

xσ=σ

−=σ

∑= (6.21b)

gde je 2xs srednji kvadrat odstupanja (6.16), a c0 i c1 koeficijenti, definisani samim jednačinama

(6.21a-b). Formule (6.14a,b) pokazuju da su statistike Bj, j = 0,1 linearne kombinacije slučajnih promenljivih Yi, i =1,2,..,n, koje prema pretpostavkama imaju raspodele:

Yi: N nix yi ,...,2,1),,( 10 =σβ+β

i tako relacije (6.21, 6.21a-b) slede iz osobine linearnosti normalne raspodele, tj. iz jednačina (2.57) i (2.58).

Ocene disperzija uzoračkih regresionih koeficijenata 1,0,2 =jsjb dobijamo kada u Jedn.

(6.21a-b) umesto disperzije 2yσ zavisno promenljive, zamenimo njenu ocenu s2:

1,0,22 == jscs jbj (6.22)

koja se računa formulom (6.16) ili (6.18):

Iz izloženog sledi, da standardizovana slučajna veličina:

1,0,)(

β−=

σ−

= jc

BBMBZ

yj

jj

b

jj

j

(6.23)

gde su koeficijenti cj, j = 0,1 definisani jednačinama (6.21a,b) ima raspodelu N (0,1). Kao što smo se u Pogl. 6.2 upoznali, to dalje znači da bezdimenziona statistika:

1,0,)(

=β−

=−

= jSc

BS

BMBT

j

jj

b

jj

j

(6.24)

gde je statistika S definisana jednačinom (6.17), ima t - raspodelu sa

d = n - 2

Page 101: Praktikum EXEL

100

stepeni slobode. Sada imamo sve što je neophodno, da bi mogli da definišemo intervale poverenja teorijskih regresionih koeficijenata, sa nivoom poverenja γ = 1-α:

1,0,,2,2 =+<β<+− α−α− jcstbbcst jnjjjjn (6.25)

Primer 6.3 Za uzorak od 12 studenata dati su u tabeli brojevi poena osvojeni u testu inteligencije (x) i brojevi poena osvojeni na ispitu iz hemije (y):

x: 50 50 55 55 55 55 65 65 65 70 70 70 y: 74 76 76 85 81 74 85 90 94 87 98 91

a) Izračunati nagib i odsečak u empirijskoj pravolinijskoj zavisnosti

xbby 10 += b) Proceniti jačinu linearne veze c) Dati intervalne ocene za prave regresione koeficijente β0 i β1 sa nivoom pouzdanosti 95%.

Rešenje

a) Nagi i odsečak se izračunaju pomoću funkcija SLOPE i INTERCEPT.

70

75

80

85

90

95

100

45 50 55 60 65 70 75

x

y

Page 102: Praktikum EXEL

101

b) Izračunaju se srednji kvadrati odstupanja pomoću funkcije STDEV :

a onda pomoću funkcije RSQ se izračunava koeficijent determinacije:

Rezultat funkcije RSQ je kvadrat Pirsonovog koeficijenta korelacije, odnosno koeficijent determinacije

Sintaksa: RSQ(Known_y's, Known_x's) Known_y's – niz ili skup zavisnih pojedinačnih podataka. Known_x's - niz ili skup nezvavisnih pojedinačnih podataka

Koeficijent korelacije, kao mera jačine linearne veze može se izračunati kao koren koeficijenta determinacije ili pomoću funkcije PEARSON:

(jaka linearna veza, prema Tab.8.1)

Na osnovu vrednosti koeficijenta determinacije, možemo da konstatujemo da je 74.4% ukupne varijacije u bodovima ostvarenim na ispitu iz hemije objašnjeno varijacijama u broju bodova osvojenih u testu inteligencije (varijacija objašnjena regresionom jednačinom). Ostatak od 25.6% ukupne varijacije u bodovima ostvarenim na ispitu je neobjašnjen.

Page 103: Praktikum EXEL

102

c) Za izračunavanje itervala poverenja (6.25), potrebna je ocena standardnog odstupanja vrednosti Y, koja se dobija kao koren srednjeg kvadrata odstupanja dobijene empirijske jednačine od eksperimentalnih tačaka (6.18), odnosno pomoću funkcije STEYX

Dalje, treba izračunati koeficijenti c0 i c1,

3212

1

2

0 10486.1)1(

1,508.5174.611112

44470)1(

−= ⋅=−

==⋅⋅

=−

=∑

xx

n

ii

snc

snn

xc

Za date podatke pomoću funkcije TINV izračunava se t vrednost:

i poluširine intervala poverenja regresionih koeficijenata su:

605.22508.5319.4228.2005.0,10 =⋅⋅=cst

371.010486.1319.4228.2 3105.0,10 =⋅⋅⋅= −cst

Konačno, traženi intervali poverenja su:

268.1526.0,65.5244.7 10 <β<<β<

6.6 Testiranje hipoteza u vezi sa odsečkom i nagibom

Proveravamo hipoteze: 1,0,: 0

0 =β=β jH jj (6.26) nasuprot hipoteza: 1,0,: 0

1 =β≠β jH jj (6.27) Imajući u vidu (Pogl. 7.5) da interval poverenja regresionog koeficijenta (6.25) sa nivoom poverenja γ = 1 - α, uključujući i njegove granice,

Page 104: Praktikum EXEL

103

1,0,,2 =≤β− α− jcstb jnjj

predstavlja oblast prihvatanja nulte hipoteze (6.26), oblast odbacivanja te hipoteze uz rizik prve vrste α, biće,

1,0,,2 =>β− α− jcstb jnjj

ili, što je ekvivalentno:

1,0,,2 =>β−

= α− jtcs

bt n

j

jjj (6.28)

Relacija (6.28) daje kriterijume odbacivanja hipoteza (6.26)

6.7 Linearizovane dvoparametarske empirijske formule Može se pokazati da su normalne jednačine (6.7) za izračunavanje parametara u nekoj dvoparametarskoj empirijskoj formuli, linearne, samo ako je formula linearna po parametrima, a to znači da ima oblik:

)()( 1100 xbxby ϕ+ϕ= (6.29)

gde su ϕ0(x) i ϕ1(x) bilo kakve funkcije, u kojima ne figurišu nepoznati parametri. Na primer kod pravolinijske regresije, funkcije ϕ0(x) i ϕ1(x) su:

xxx =ϕ=ϕ )(,1)( 10

Ako dvoparametarska empirijska formula:

),,( 10 bbxfy = (6.30)

nema oblik (6.29), normalne jednačine su nelinearne i njihovo rešavanje nije jednostavno. Da bi se računski problemi olakšali pristupa se, kad god je to moguće, “ispravljanju” ili linearizaciji jednačine, pogodnom smenom promenjivih. Na primer, formula:

baxy = (6.31)

gde su a i b parametri, se može linearizovati logaritmovanjem:

xbay logloglog +=

i smenom promenljivih:

z = log y, v = log x,

što kao rezultat daje linearnu formulu po novim promenljivima v i z:

bBaABvAz ==+= ,log, (6.33)

Pošto izračunamo odsečak A i nagib B iz vrednosti novih promenljivih,

zi = log yi, vi = log xi, i = 1,2,...,n

Page 105: Praktikum EXEL

104

originalne parametre a i b, prema (6.33), dobijamo kao:

b = B, a = 10A

U Tab.6.1 date su smene promenljivih za linearizaciju nekih dvoparametarskih neliearnih formula, a na Sl.6.2 grafici datih nelinearnih funkcija. Na žalost, rigorozna statistička analiza linearizovane formule je nemoguća ili vrlo otežana, jer neophodne pretpostavke, koje važe za originalnu zavisno promenljivu (Pogl.6.4) zbog izvedene transformacije, ne važe za novu zavisnu promenljivu..

Tabela 6.1 - Linearizacija dvoparametarskih formula

Primer 6.5 Odabrati formu dvoparametarske empirijske jednačine koja opisuje zavisnost y od x, prema eksperimentalnim vrednostima datim u tabeli (prve od dve kolone). Izračunati parametre u odabranoj zavisnosti i koeficijent determinacije. Rešenje

Na slici 1. uz primer, ucrtane su eksperimentalne tačke (xi, yi), i = 1,2,...,7. Zamišljena linija, koja bi približno povezivala tačke, liči na sledeće krive na Sl.6.2:

formula smena promenljivih linearizovana formula

1. bxa

y+

=1

y

z 1= z = a + bx

2. xbay +=

xv 1= y = a + bv

3. bxa

xy+

= yxz = z = a + bx

4. bxay ⋅= yzxv ln,ln == z = A + bv gde je A = lna

5. xbay ⋅= yz ln= z = A + Bx gde je A = lna, B = lnb

x y x/y 1 62.1 0.01610 2 87.2 0.02294 3 109.5 0.02740 4 127.3 0.03142 5 134.7 0.03712 6 136.2 0.04405 7 134.9 0.05189

Page 106: Praktikum EXEL

105

• linije 2 i 4 familije krivih sa jednačinom: bxa

xy+

=

• liniju 2 familije krivih sa jednačinom: baxy =

Zato u uži izbor formula ulaze navedene dve.

a) jednačina bxa

xy+

=

Smena koja linearizuje jednačinu je:

v = x, z = x/y

U 3. koloni tabele uz primer, upisane su izračunate vrednosti za z = x/y, a na slici 2 uz primer ucrtane su tačke (xi, zi), i = 1,2,...,7.

0 2 4 6 8 10 12-10

-5

0

5

10

3.01=

+= b,

bxay

1: a = -0.12: a = 0.13: a = -0.54: a = 0.5

4

3

1 32

y

x

0 2 4 6 8 10 120

2

4

6

8

10

12

y = a + b/x, b = 0.3

1: a = -0.12: a = 23: a = 44: a = 64

3

1

2

y

x

0 2 4 6 8 10 120

2

4

6

8

10

12

3.0, =+

= bbxa

xy

1: a = -0.12: a = 23: a = -0.44: a = 4

4

31

2

y

x

0 2 4 6 8 10 120.0

0.5

1.0

1.5

2.0

2.5

3.0

y = abx, a = 2

b = 1.3 b = 1.04

b = 1.2

b = 0.95

b = 0.8b = 0.3

b = 0.2

y

x

Page 107: Praktikum EXEL

106

0 2 4 6 8 10 120

2

4

6

8

10

12

14

y = axb, a = 4

1: b = 0.52: b = 0.33: b = -0.34: b = -0.5

4

3

1

2

yx

Slika 6.2 - Grafici nelinearnih funkcija iz Tab. 6.1

0

20

40

60

80

100

120

140

160

0 1 2 3 4 5 6 7 8

x

y

Slika 1 uz Primer 6.5 - Eksperimentalne tačke

0.00000

0.01000

0.02000

0.03000

0.04000

0.05000

0.06000

0 2 4 6 8

x

x/y

Slika 2 uz Primer 6.5 - Tačke u koordinatama x - z

Page 108: Praktikum EXEL

107

U dijagramu sa transformisanim koordinatama tačke približno leže na pravoj liniji. b) jednačina baxy =

Nove promenljive su: v = lnx; z = lny. Tačke, ucrtane u korrdinatama v - z, ne leže duž neke prave i ova jednačina se odbacuje

44.14.24.34.44.54.64.74.84.9

5

0 0.5 1 1.5 2 2.5

v=lnx

z=ln

y

Series1

Slika 3 uz Primer 6.5 - Eksperimentalne tačke u koordinatama lnx-lny

Parmetri u prihvaćenoj formuli se dobijaju iz parametara linearizovane jednačine:

xvyxzvbbz ==+= ,/,10 kao:

a = b0, b = b1

Pomoću funkcija SLOPE i INTERCEPT dobija se

a = 0.010229, b = 0.0056899

i eksperimentalni podaci su približno opisani jednačinom:

x

xy0056899.0010229.0 +

=

Page 109: Praktikum EXEL

108

U tabeli su data odstupanja eksperimentalnih od računskih vrednosti, ei:

0

20

40

60

80

100

120

140

160

0 1 2 3 4 5 6 7 8

x

y

Slika 4 uz Primer 6.5 - Eksperimentalne tačke i dobijena kriva

Koeficijent determinacije (6.9) računa se pomoću funkcije RSQ

Dakle, dobijena empirijska formula objašnjava 90% od ukupnih promena u vrednostima zavisno promenljive.

Primer 6.6 Date su eksperimentalne vrednosti specifične električne provodljivosti stakla (y) u funkciji od temperature, (x, 0C). Odabrati empirijsku formulu i odrediti parametre u njoj.

x 14.5 30.0 64.5 74.5 86.7 94.5 98.9 y 0 0.004 0.018 0.029 0.051 0.073 0.090

lny - -5.52 -4.02 -3.54 -2.98 -2.62 -2.41

Page 110: Praktikum EXEL

109

Rešenje

Poređenjem izgleda zamišljene linije koja bi spajala eksperimentalne tačke na Sl. 1 uz primer, sa graficima dvoparametarskih emirijskih formula zapaža se da bi moguć adekvatan oblik formule bio:

xaby =

Smenom z = lny dobija se linearna jednačina:

z = lna + lnbx

Smena nije primenljiva na prvu eksperimentalnu tačku jer je: ln(0) = ∞. Pošto eksperimentalne tačke u transformisanim koordinatama (Sl.2 uz primer) približno leže duž neke prave, formula se prihvata.

0

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.1

0 20 40 60 80 100 120

x

y

Slika 1. uz Primer 6.6 - Eksperimentalne tačke

Page 111: Praktikum EXEL

110

-6.00

-5.00

-4.00

-3.00

-2.00

-1.00

0.000 20 40 60 80 100 120

x

y Series1

Slika 2. uz Primer 6.6 - Eksperimentalne tačke u transformisanim koordinatama

A = -6.897, B = 0.4518

i parametre u polaznoj, nelinearnoj formuli:

a = eA = 0.001011, b = eB = 1.046

Dobija se empirijska jednačina: xy 046.110011.1 3 ⋅⋅= −

Page 112: Praktikum EXEL

111

ZADACI 6.1 Meren je stepen konverzije reaktanta u reaktoru (y, %) na raznim temperaturama (x, 0C):

x, 0C 207.1 210.3 200.4 201.1 203.4 y, % 92.30 92.58 91.56 91.63 91.83

a) Uveriti se na osnovu dijagrama rasipanja da se može pretpostaviti linearna zavisnost stepena konverzije od temperature b) Izračunati sa 4 decimale odsečak i sa 3 decimale nagib regresione prave y(x) c) Izračunati srednji kvadrat odstupanja regresione prave od eksp. podataka d) Izračunati koeficijente determinacije i korelacije i dati interpretaciju e) Izračunati intervalne ocene odsečka i nagiba, sa nivoom poverenja 0.95.

6.2 Proveriti statističku značajnost nagiba regresione prave y(x) (da li je izračunati nagib značajno različit od nule), sa α = 0.05: a) u problemu 8.3, b) u problemu 9.1 Povezati rezultate sa značajnošću izračunatih koeficijenata korelacije.

6.3 Merene su gustine ρ (g/ l) neke supstance na različitim temperaturama t: a)

Odrediti odsečak sa jednom i nagib sa tri decimale u pravolinijskoj zavisnosti gustine od temperature. b) Proceniti gustinu na temperaturi 74 0C c) Dati intervalnu ocenu, sa nivoom poverenja 0.95, temperaturnog koeficijenta gustine (promena gustine, pri povećanju temperature za 1 0C).

6.4 Koje smene promenljivih "ispravljaju" sledeće krivolinijske dvoparametarske zavisnosti:

a) baxy += 2 , b) bxay +=2 , c) bxa

y++= )3(1

d) bxaey += e) 1−

+=

xbaxy

6.5 a) Ucrtavajući eksperimentalne tačke u odgovarajući koordinatni sistem, uveriti se da podaci o temperaturama (t, 0C) i odgovarajućim masenim protocima (m, g/s) navode na zaključak da maseni protok varira linearno sa korenom temperature: btam +=

t, 0C 10 20 40 80 100 m, g/s 14.76 20.14 27.73 38.47 42.82

b) Dati intervalne ocene odsečka i nagiba sa nivoom pouzdanosti 0.95.

6.6 Date su eksperimentalne vrednosti:

t, 0C 20 30 40 50 60 70 ρ, (kg/ l) 640 652 668 680 684 692

x 1.0 2.0 3.0 5.0 10.0 y 0.279 0.194 0.168 0.120 0.083

Page 113: Praktikum EXEL

112

. Izračunati, sa tri decimale, parametre a i b u empirijskoj jednačini:

bxa

y+

=1

6.7 Pretpostavlja se da za neki gas približno važi sledeća jednačina stanja:

cpvm =

gde su: p - pritisak, v -molska zapremina, m i c -parametri. Za date podatke:

a) Proveriti pretpostavku, pomoću dijagrama rasipanja b) Izračunati parametre m i c i srednje kvadratno odstupanje empirijske formule. 6.8 Radi kalibracije higrometra, variran je sadržaj vode u gasu (x, %) i očitavana vrednost na skali higrometra (y). Rezultati su dati u tabeli:

a) Na osnovu dijagrama

rasipanja odabrati dvoparametarsku empirijsku zavisnosti y(x) b) Izračunati parametre u odabranoj formuli. 6.9 Dati su viskoziteti vode, η na različitim temperaturama T (K): a) Izračunati parametre u formuli:

Tb

ae=η b) Proceniti viskozitet vode na 300K

v, cm3/mol 50.5 61.0 71.5 81.2 105 p, bar 64.7 51.3 40.5 25.9 7.8

x 5 20 40 60 80 y 0.011 0.044 0.083 0.126 0.170

T 283 293 303 313 323 333 343 η 1.308 1.005 0.801 0.656 0.549 0.469 0.406

Page 114: Praktikum EXEL

113

Literatura Paunović R.; Omorjan R.; Osnovi inženjerske statistike, autorska skripta

Božić D.; Kompjuter za početnike; Primatron; Novi Sad; 2003.

maranGraphics Inc.; Excel 2000 Simplified; IDG Books Worldwide, Inc., Foster City, CA;

1999.