24
UNIVERZITET U BANJOJ LUCI EKONOMSKI FAKULTET Predmet: KVANTITATIVNE METODE U MENADŽMENTU Tema: STATISTIČKA ANALIZA: INTERVALI POVJERENJA by Željko Radosavac

Intervali povjerenja

Embed Size (px)

DESCRIPTION

statistička analiza

Citation preview

Page 1: Intervali povjerenja

UNIVERZITET U BANJOJ LUCIEKONOMSKI FAKULTET

Predmet: KVANTITATIVNE METODE U MENADŽMENTUTema:

STATISTIČKA ANALIZA:INTERVALI POVJERENJA

by Željko Radosavac

Banjaluka, mart 2009. godine

Page 2: Intervali povjerenja

SADRŽAJ:

1. Uvod ……..………………………………………………………. 3

2. Tačkasto i intervalno ocjenjivanje …………………………….….42.1 Osobine ocjena …………………………………………...4

3. Interval povjerenja za aritmetičku sredinu populacije μ kada je poznata standardna devijacija populacije ...................................... 5

4. Interval povjerenja za aritmetičku sredinu populacije μ kada nije poznata standardna devijacija populacije ...................................... 9

4.1 t distribucija ………….…………………………………..9

5. Interval povjerenja za proporciju populacije π ………………...11

6. Određivanje veličine uzorka …………………………………....13

7. Veza između interval povjerenja i testiranja hipoteza ……….....14

8. Zaključak ……………………………………………………….16

9. Literatura ……………………………………………………….17

2

Page 3: Intervali povjerenja

1. UVOD

Činjenica je da je uzorkovanje postalo dominantan način određivanja vrijednosti parametara osnovnog skupa, prije svega zbog limitiranosti vremenom i sredstvima. U tom slučaju statistička metodologija mora da izbalansira rizik da ocjenjene vrijednosti parametara populacije mogu da budu približne ili pak netačne sa postupkom minimizovanja ili svjesnog uvođenja greške u procesu statističkog zaključivanja, sa ciljem donošenja zaključka o vrijednostima parametara osnovnog skupa.

Statističko zaključivanje se provodi kao statističko ocjenjivanje ili kroz testiranje statističkih hipoteza. Koji od ova dva načina će biti korišten zavisi prije svega od dostupnosti informacija kojima raspolažemo prije početka samog postupka.

Statističko ocjenjivanje karakteriše manjak informacija, najčešće aritmetička sredina, proporcija i standardna devijacija osnovnog skupa, na osnovu kojih bi se mogle pretpostaviti vrijednosti nekog parametra osnovnog skupa. Kao rezultat dobijamo interval vrijednosti u kojem se sa određenom vjerovatnoćom očekuje vrijednost parametara osnovnog skupa tako da se zaključak u ocjenjivanju uvijek izvodi sa pouzdanošću manjom od 100%.

Kada raspolažemo određenim informacijama o vrijednostima parametara osnovnog skupa koristićemo drugi način u postupku statističkog zaključivanja-testiranje statističkih hipoteza. Postupak testiranja hipoteza se sastoji u provjeri održivosti postavljenih hipoteza o vrijednostima parametara osnovnog skupa dobijenih na osnovu informacija iz prethodnih istraživanja, mišljenjima eksperata i slično. Zaključak o parametru osnovnog skupa je posljedica prihvatanja ili odbacivanja postavljene hipoteze.

3

Page 4: Intervali povjerenja

2. TAČKASTO I INTERVALNO OCJENJIVANJE

Statističko ocjenjivanje, kao procedura kojom se na osnovu rezultata iz uzorka izvode zaključci o vrijednostima parametara skupa, izvodi se na dva načina: tačkastim ocjenjivanjem i intervalnim ocjenjivanjem.

Tačkasto ocjenjivanje kao polaznu osnovu uzima statistiku uzorka koja se koristi za ocjenu stvarne vrijednosti parametra populacije. Drugim riječima, bilo koja statistika uzorka (aritmetička sredina, proporcija, varijansa i sl.) odredi kao ocjena vrijednosti parametra populacije. Kako se radi o jednom od velikog broja mogućih uzoraka i jednoj realizaciji statistike uzorka, logično se nameće zaključak da ova vrsta ocjenjivanja ne obezbjeđuje tačnost i preciznost dobijene informacije.

S druge strane intervalno ocjenjivanje podrazumjeva formiranje intervala u kome se sa određenom vjerovatnoćom očekuje vrijednost parametra osnovnog skupa. Interval koji se formira ima posebnu osobinu pouzdanosti, odnosno povjerenja, te se zbog toga i naziva interval povjerenja. Dakle, interval povjerenja predstavlja raspon vrijednosti za koje se vjeruje da uključuju nepoznatu vrijednost parametra poulacije. Uz ovaj interval ide i informacija o mjeri povjerenja sa kojom očekujemo da ovaj interval zaista sadrži vrijednost posmatranog parametra.1

2.1 Osobine ocjena

Statistika uzorka na osnovu koje se ocjenjuje parametar populacije naziva se ocjena parametra populacije i predstavlja slučajnu promjenjivu. Poželjne osobine ocjene na osnovu koje izvodimo određeni zaključak su:

-nepristrasnost-efikasnost-konzistentost i-dovoljnost.

Nepristristrasna ocjena parametra populacije je ona čija je očekivana vrijednost jednaka parametru populacije.

1 Lovrić Miodrag, Komić Jasmin, Stević Stevan: Statistička analiza- metodi i primjena, Ekonomski fakultet Banjaluka, Banjaluka 2006.

4

Page 5: Intervali povjerenja

Efikasnost ocjene podrazumjeva njenu karakteristiku varijabiliteta, odnosno za ocjenu kažemo da je utoliko efikasnija ukoliko ima manju varijansu, odnosno standardnu grešku, za uzorke iste veličine.

Za ocjenu kažemo da je konzistentna ukoliko reagujući na povećanje veličine uzorka ona teži vrijednosti parametra populacije.

Ocjena je pak dovoljna ako uzima u obzir cjelovitu informaciju iz uzorka (primjer promjene vrijednosti aritmetičke sredine u uzorku nastale promjenom bilo koje vrijednosti).

3. INTERVAL POVJERENJA ZA ARITMETIČKU SREDINU POPULACIJE μ KADA JE POZNATA STANDARDNA

DEVIJACIJA POPULACIJE

Ako je populacija normalno raspoređena, tada je aritmetička sredina uzorka takođe normalno raspoređena za bilo koju veličinu uzorka. Za standardizovanu normalnu promjenjivu Z vjerovatnoća je 0,95 da uzme vrijednost između -1,96 i +1,96. Transformacija Z u slučajno promjenjivu X omogućava da se prije uzorkovanja ustanovi vjrovatoća 0,95 da će X biti u intervalu:

μ+-1,96Ϭ/√n

Izborom slučajnog uzorka dobijamo određenu pojedinačnu vrijednost aritmetičke sredine x, kao jednu od mogućih s obzirom na uzoračku distribuciju a koja jeste ili nije u intervalu vrijednosti s obzirom da nam μ nije poznata. S obzirom da i prije početka uzorkovanja vjerovatnoća da će X biti u intervalu inosi 0,95,a što znači da će oko 95% vrijednosti X dobijenih u velikom broju ponovljenih uzoraka biti u ovom intervalu, možemo reći da smo 95% uvjereni da će dobijena pojedinačna vrijednost x biti u ovom intervalu. Grafički smo ovo predstavili na slici 1.

5

Page 6: Intervali povjerenja

Uočljivo je sa slike da će se x naći u intervalu μ+-1,96Ϭ/√n samo onda ako se μ nalazi u intervalu x+-1,96Ϭ/√n. Velikim brojem ponovljenih pokušaja ovo se dešava u 95% slučajeva. Stoga interval x+-1,96Ϭ/√n nazivamo 95%-tni interval povjerenja za nepoznatu vrijednost aritmetičke sredine populacije μ, a što je i predstavljeno na slici 2. Dakle, 95% smo sigurni da se μ nalazi u ovako dobijenom intervalu. Veličina 1,96Ϭ/√n često se naziva i granica greške ili uzoračka greška.

Bitno je naglasiti da je ovaj interval najčešće korišćen u poslovanju, mada možemo odabrati bilo koji drugi nivo pouzdanosti a zatim novu vrijednost z standardizovanog normalnog rasporeda uvrstiti u jednačinu umjesto vrijednosti 1,96. Na taj način dobijamo interval sa željenim nivoom pouzdanosti (npr za 90% z=1,65, za 99% z=2,58 itd).

6

Page 7: Intervali povjerenja

Ako pažljivo pogledamo sliku 2 primjećujemo da vrijednosti -1,96 i +1,96 odsjecaju površine od po 0,025 sa obe strane. Površina između ovih dviju vrijednosti je jednaka 1-α=1-2(0.025)=0,95. Dio površine ispod standardizovane normalne krive 1-α označava se kao koeficijent pouzdanosti, dok α predstavlja vjerovatnoću greške. Ukoliko koeficijent pouzdanosti pomnožimo sa 100 dobijamo izraz u procentima i nazivamo ga nivoom pouzdanosti.Konačno možemo konstatovati da (1- α)100% interval povjerenja za μ kada je poznata Ϭ, a uzorkovanje se vrši iz normalno raspoređene populacije je dat izrazom:

x+-z α/2 Ϭ/√n

Uočljivo je takođe da što je veći nivo povjerenja, veći je odgovarajući interval povjerenja a time i manje korisna informacija. Ako uzmemo nivo povjerenja od 100% tada bi se interval povjerenja protezao od –besk. do +besk. a što nam u suštini ne pruža nikakve precizne informacije.2

2 Jan Kmenta: Počela ekonometrije,Mate, Zagreb 1997.

7

Page 8: Intervali povjerenja

PRIMJER 1. Koristeći 3B Stat softver tvrdnje o odnosu nivoa pouzdanosti i širine intervala povjerenja potkrepljujemo primjerom:

23.03.2009 17:02 Analiza Broj: 1 "Željko Radosavac"

Z Interval povjerenja za aritmetièku sredinu osnovnog skupaVarijabla:Veličina uzorka: 25Aritmetièka sredina uzorka: 122Standardna devijacija uzorka: 20Standardna greška: 4R E Z U L T A T I O C J E NJ I V A NJ A95 % interval povjerenja( 114,16 ; 129,84 )Zaključak: Sa pouzdanošau od 95% tvrdimo da se aritmetieka sredina skupa nalazi u intervalu od 114,16 do 129,84

23.03.2009 17:05 Analiza Broj: 2 "Željko Radosavac"

Z Interval povjerenja za aritmetièku sredinu osnovnog skupaVarijabla:Veličina uzorka: 25Aritmetièka sredina uzorka: 122Standardna devijacija uzorka: 20Standardna greška: 4R E Z U L T A T I O C J E NJ I V A NJ A80 % interval povjerenja( 116,874 ; 127,126 )Zaključak: Sa pouzdanošau od 80% tvrdimo da se aritmetieka sredina skupa nalazi u intervalu od 116,874 do 127,126

23.03.2009 17:35 Analiza Broj: 3 "Željko Radosavac"

Z Interval povjerenja za aritmetièku sredinu osnovnog skupaVarijabla:Veličina uzorka: 25Aritmetièka sredina uzorka: 122Standardna devijacija uzorka: 20Standardna greška: 4R E Z U L T A T I O C J E NJ I V A NJ A99 % interval povjerenja( 111,697 ; 132,303 )Zaključak: Sa pouzdanošau od 99% tvrdimo da se aritmetieka sredina skupa nalazi u intervalu od 111,697 do 132,303

8

Page 9: Intervali povjerenja

4. INTERVAL POVJERENJA ZA ARITMETIČKU SREDINU POPULACIJE μ KADA NIJE POZNATA STANDARDNA

DEVIJACIJA POPULACIJE

4.1 t distribucija

Ukoliko nam nije poznata vrijednost standardne devijacije, a što je slučaj u praktičnim istraživanjima, onemogućeno nam je da formiramo interval povjerenja za aritmetičku sredinu populacije μ. Postupak formiranja intervala povjerenja nastavićemo u tom slučaju tako što ćemo kao zamjenu za Ϭ uzeti standardnu devijaciju uzorka S kao najlogičniju vrijednost.

Pod uslovom da populacija slijedi normalan raspored standardizovana statistika ima oblik:

X - μ t = S / √n i ima t raspored sa n-1 stepeni slobode.

Ova distribucija se naziva i Student-ova t distribucija a karakteriše je parametar df, odnosno broj stepeni slobode, gdje za bilo koju cijelu vrijednost df=1, 2, 3,.., postoji odgovarajuća t vrijednost distribucije. t distribucija je takođe simetrična i zvonastog oblika, a vrijednost aritmetičke sredine je 0.Broj stepeni slobode predstavlja broj nezavisnih vrijednosti u uzorku, koji se dobije kada se broj raspoloživih vrijednosti umanji za broj ograničenja koja se nameću ovim vrijednostima3.

Vrijednosti t distribucije za odgovarajuće vjerovatnoće date su tablici Student-ovog t rasporeda. Neke od ovih vrijednosti prikazane su na slici 3.Važno je napomenuti da se t distribucija približava normalnoj ukoliko povećavamo broj stepeni slobode tako da za beskonačno veliki broj stepeni se ove dvije distribucije izjednačavaju a što je vidljivo i u tablicama.

3 Lovrić Miodrag, Komić Jasmin, Stević Stevan: Statistička analiza- metodi i primjena, Ekonomski fakultet Banjaluka, Banjaluka 2006.

9

Page 10: Intervali povjerenja

Slika 3. t-distribucija (df=10)

(1- α)100% interval povjerenja za aritmetičku sredinu populacije μ, u slučaju kada nije poznata standardna devijacija populacije Ϭ, uz pretpostavku da je populacija normalno raspoređena, je dat izrazom:

x ± tα/2 s/√n gdje je

tα/2 vrijednost t distribucije sa n-1 stepeni slobode i za vjerovatnoću α/2.

PRIMJER 2. Slučajnim izborom 24 radnika jednog preduzeća ustanovljeno je da u toku jednog časa proizvedu sledeći broj proizvoda:

8 11 7 12 12 15 9 10 9 12 7 1316 10 5 8 11 12 12 8 14 16 12 9

Uz pretpostavku da proizvodnja ovog proizvoda slijedi normalan raspored i uz rizik greške α=0.1 ocijeniti prosječnu proizvodnju radnika preduzeća.4

4 Komić Jasmin: Metodi statističke analize kroz primjere, Ekonomski fakultet Banjaluka, Banjaluka 2000.

10

Page 11: Intervali povjerenja

Upotrebom 3B Stat softvera dobijamo sledeći interval povjerenja:

24.03.2009 08:57 Analiza Broj: 1 "Željko Radosavac"

t-Interval povjerenja za aritmetièku sredinu osnovnog skupaVarijabla: broj proizvoda po radnikuVeličina uzorka: 24Aritmetièka sredina uzorka: 10,75Standardna devijacija uzorka: 2,89Standardna greška: 0,591R E Z U L T A T I O C J E NJ I V A NJ A90 % interval povjerenja( 9,738 ; 11,762 )Zaključak: Sa pouzdanošau od 90% tvrdimo da se aritmetieka sredina skupa nalazi u intervalu od 9,738 do 11,762

Bez obzira što standardna devijacija populacije nije poznata i uz pretpostavku da je populacija normalno raspoređena , treba koristiti t distribuciju sa n-1 stepeni slobode. Za veliki broj stepeni slobode t distribuciju možemo aproksimirati Z distribucijom.

5. INTERVAL POVJERENJA ZA PROPORCIJU POPULACIJE π (na osnovu velikih uzoraka)

U istraživanjima nam se često javlja potreba da unutar populacije ustanovimo relativnu frekvenciju pojavljivanja određenih elemenata sa određenim karakteristikama. U takvim slučajevima ocjenjujemo proporciju populacije π.Ocjena proporcije populacije π je proporcija uzorka P, gdje je prosječna vrijednost uzoračke distribucije proporcije P jednaka vrijednosti proporcije poulacije π, a standardna greška proporcije je data izrazom:

π(1- π)√ n

11

Page 12: Intervali povjerenja

Kako je vrijednost π nepoznata koristićemo realizovanu vrijednost statistike uzorka p tako da standardna devijacija ima oblik

p(1- p)√ n

Dovoljno velikim se smatraju oni uzorci kada je n π>5 i n(1- π)>5.(1- α)100% interval povjerenja proporcije populacije π dat je izrazom:

p ± zα/2 √p(1-p)/n gdje proporcija uzorka p predstavlja učešće elemenata uzorka sa određenom karakteristikom (x) u uzorku veličine n , odnosno p=x/n.

PRIMJER 3. Prilikom ocjene proporcije stanovnika jednog grada koji redovno posjećuju pozorište anketirano je 250 stanovnika. Njih 40 je reklo da su redovni posjetioci pozorišta. Ocijeniti učešće stanovnika ovog grada od 85000 ljudi koji su redovni posjetioci pozorišta uz rizik greške od 0,08.

n1/n = 40/250 = 0,16zα/2 = 1,75

Konsultujući tablice a uzimajući u obzir dati rizik greške od 0,08 ocjenjujemo da je učešće stanovnika koji redovno posjećuju pozorište u intervalu od 11,9% do 20,1%. Korištenjem 3B Stat softvera prozor rješenja izgleda ovako:

24.03.2009 09:54 Analiza Broj: 2 "Željko Radosavac"

Z-Interval za proporciju osnovnog skupaVarijabla Proizvoljan skupVeličina uzorka: 250Broj uspjeha: 40Proporcija u uzorku: 0,16Standardna greška: 0,023R E Z U L T A T I O C J E NJ I V A NJ A92% interval povjerenja( 0,119 ; 0,201 )Zaključak: Sa pouzdanošau od 92% tvrdimo da se proporcija skupa nalazi u intervalu od 0,119 do 0,201

12

Page 13: Intervali povjerenja

U mnogim istraživanjima kao svojevrsna konvencija je uvedena pouzdanost od 95% kao standard. Ostaje međutim činjenica da je povećanje uzorka uvijek poželjan mehanizam u nastojanju da se dobije veća preciznost intervala povjerenja.

6. ODREĐIVANJE VELIČINE UZORKA

S obzirom da smo prilikom uzorkovanja limitirani vremenom i novcem, a sa druge strane težimo da dobijemo validne i zadovoljavajuće rezultate, problem može da nam predstavlja određivanje minimalne veličine uzorka koja može da zadovolji određene standarde preciznosti. Istraživač u ovom slučaju treba da da jasne odgovore na sledeća pitanja:

- koliko blizu treba da je ocjena uzorka parametru populacije (granica G), - koliki treba da je interval povjerenja tako da udaljenost između ocjene i

parametra populacije bude manja ili jednaka G, - koja je i kako je dobijena ocjena varijanse ili standardne devijacije

populacije.

Kada se dobiju odgovori na prethodna pitanja, potrebno je uvrstiti vrijednosti u izraz kojim se određuje minimalna veličina uzorka prilikom ocjenjivanja aritmetičke sredine populacije μ:

z²α/2 Ϭ²n =

Minimalna veličina uzorka prilikom ocjenjivanja proporcije populacije π je:

z²α/2 π(1- π)n =

U slučaju aritmetičke sredine populacije, G je polovina od (1-α)100% intrvala povjerenja za aritmetičku sredinu populacije pa je

G = zα/2 Ϭ/ √n

13

Page 14: Intervali povjerenja

S obzirom da je G granica greške, postupak rješenja se svodi na pronalaženje minimalne veličine uzorka za datu granicu greške. Posmatrajući prethodne izraze možemo uočiti da izraz π(1- π) predstavalja varijansu populacije. Da bi jednačina bila iskoristiva potrebno je naći zamjenu za π na nači da se izabere neka a priori ocjena, pilot uzorak ili jednostavno zamjeni sa vrijednošću 0,5.

PRIMJER 4: Jedan proizvođač automobila želi da ocjeni učešće stanovništva sa određenim primanjima koji su zainteresovani za kupovinu novog modela. Kompanija želi da dobije ocjenu proporcije populacije π u intervalu veličine 0,10 i sa 99% pouzdanosti. Prema raspoloživim podacima kompanije učešće potencijalnih kupaca u grupi stanovnika sa određenim rasponom primanja moglo bi biti 0,25. potrebno je odreditiminimalnu veličinu uzorka za ovo istraživanje.

G = 0,10, π = 0,25, 1-π = 0,75, zα/2 = 2,58

2,58²·0,25·0,75n = = 124,423

0,10²

Dakle, potrebno je obuhvatiti najmanje 125 stanovnika iz grupe sa određenom visinom primanja.

7. VEZA IZMEĐU INTERVALA POVJERENJA I TESTIRANJA HIPOTEZA

Obzirom da inferencijalna statistika koristi dva metoda, ocjenjivanje i testiranje statističkih hipoteza, kako bi što preciznije na osnovu uzorka dala informacije o statističkom skupu, sasvim je izvjesna veza između ova dva metoda. Ono što karakteriše interval povjerenja kao krajnji produkt ocjenjivanja su svakako koeficijent povjerenja i interval mogućih vrijednosti koje parametar može da ima. S druge strane statističim testom testiramo samo jednu moguću vrijednost parametra, nazvanu hipotetična vrijednost.

Veza između ova dva metoda se ogleda u tome da ako uzmemo bilo koju vrijednost obuhvaćenu dobijenim intervalom povjerenja i nju postavimo kao nultu hipotezu, nećemo je moći odbaciti. Suprotno, ako uzmemo bilo koju vrijednost van intervala povjerenja kao hipotetičnu vrijednost, ni statistički test je neće podržati (slika 4).

14

Page 15: Intervali povjerenja

Drugim riječima, ako se hipotetična vrijednost dvosmjerne hipoteze nalazi unutar (1-α)100% intervala povjerenja (npr.95%), ona neće biti odbačena pri nivou značajnosti α (npr. 0,05). Ako se pak dvosmjerna hipoteza nalazi van navedenog intervala, nulta hipoteza će biti odbačena pri datom nivou značajnosti α.

Na osnovu navedenog zaključujemo da interval povjerenja sadrži daleko veću i važniju informaciju jer predstavlja svojevrstan skup hipotetičkih vrijednosti koje ne bi bile odbačene prilikom testiranja.

15

Page 16: Intervali povjerenja

8. ZAKLJUČAK

Ocjenjivanje kao metod inferencijalne statistike ima kao krajnji produkt interval povjerenja. On sadrži veoma važnu informaciju o nepoznatom parametru statističkog skupa. Na osnovu dobijenog intervala povjerenja istraživač je u stanju da formuliše probablistički stav i da sa određenom pouzdanošću tvrdi da se nepoznati parametar nalazi u tako dobijenom intervalu. Nastojanje statističke metodologije kreće se ka dobijanju što preciznijeg, a u isto vrijeme što tačnijeg intervala. Ta granica preciznosti ili tačnosti zavisi u mnogome od same prirode pojava i istraživanja, postavljenih ciljeva istraživanja i slično. U poslovnoj praksi je uobičajno da se 95% nivo pouzdanosti tretira kao svojevrstan standard. Neki autori favorizuju interval povjerenja u odnosu na testiranje statističkih hipoteza iz razloga što korišćenjem intervala povjerenja ne možemo doći do besmislenih i nepreciznih zaključaka.

16

Page 17: Intervali povjerenja

9. LITERATURA:

1. Lovrić Miodrag, Komić Jasmin, Stević Stevan: Statistička analiza- metodi i primjena, Ekonomski fakultet Banjaluka, Banjaluka 2006.

2. Komić Jasmin: Metodi statističke analize kroz primjere, Ekonomski fakultet Banjaluka, Banjaluka 2000.

3. Jan Kmenta: Počela ekonometrije, Mate, Zagreb 1997.

4. Njegić Radmila, Žižić Mileva, Lovrić Miodrag, Pavličić Dubravka: Osnovi statističke analize, Savremena administracija, Beograd 1991.

5. www.efbl.org / nastavni materijali

17