XIII. Osnovi Teorije Uzoraka

1

1

Osnovi teorije uzorkovanja

Prof. dr Rabija Somun KapetanovićDoc. dr Emina Resić

2

Sadržaj predavanja Definicija uzorka Cilj uzorkovanja Greška uzorkovanja Vrste uzoraka

Slučajni Namjerni

Procjena aritmetičke sredine populacije Procjena varijanse populacije Standardna greška Intervali povjerenja – opšti model Statistički testovi – opšti model

3

Nakon ovih predavanja moćićete...

Izabrati adekvatan način uzorkovanja.

Odrediti veličinu i tip uzorka potrebnog ukonkretnom statističkom istraživanju.

Izvesti opšti model i objasniti sastavne elementeza: Interval povjerenja za karakteristiku populacije Statistički test o karakteristici populacije

4

Zašto uzorak?

Za analizu masovnih pojava koje su predmet statističkihistraživanja mi smo do sada prezentirali statističke metodekojima se analizira osnovni skup ili populacija.

Za primjenu metoda potrebno je prikupiti podatke oosnovnom skupu.

Kako statistički skupovi imaju vrlo veliki broj elemenatapotpuno prikupljanje podataka je veoma složen, dugotrajani skup posao.

Zbog toga se taj postupak pojednostavljuje ispitivanjemosnovnog skupa metodom uzorka.

Pod uzorkom se podrazumijeva dio skupa na osnovu kojegistražujemo i analiziramo obilježja elemenata osnovnogskupa.

5

Deskriptivna versus inferencijalnastatistika

Kao i u deskriptivnoj statistici osnovno pitanjeinferencijalne statistike je: « Kako analiziratipodatke da bismo dobili korisnuinformaciju? »

Da bismo dobili informaciju o populaciji,inferencijalna statistika ima jednu dodatnuetapu čiji je cilj da odredi (inferira) polazećiod posmatranih karakteristika na uzorkuvjerovatnu (očekivanu) vrijednost tihkarakteristika za ukupnu populaciju.

6

Kompletnost podataka:Populacija versus uzorak

Popis – svaki element populacije se uključuje uistraživanje.

Popis – populacija – parametar

Uzorak – samo dio elemenata populacije seuključuje u istraživanje.

Uzorak je dio osnovnog skupa i cilj izbora uzorka jeda u što kraćem vremenu i uz što manje troškovedobijemo informaciju o karakteristikama osnovnogskupa iz kojeg smo odabrali uzorak

Uzorak – dio - statistika

2

7

Metoda uzorkovanja

Razlozi zbog kojih istraživanje vršimo na uzorku: Manje vremena - efikasnost Manje troškova - ekonomičnost Jednostavnije administrativno praćenje Racionalnost

Okvir uzorka – lista svih elemenata populacije Vrste uzoraka

Slučajni uzorak (probability sampling) - jedinicepopulacije se slučajno biraju u uzorak

Namjerni uzorak (nonprobability sampling) - odabran naosnovu subjektivnih kriterija

8

Reprezentativnost uzorka

Da bi zaključci koje donosimo okarakteristikama osnovnog skupa na osnovuuzorka bili pouzdani uzorak mora bitireprezentativan.

Uzorak je reprezentativan ako je po svojojstrukturi sličan osnovnom skupu, odnosno akopredstavlja umanjenu sliku osnovnog skupa.

Reprezentativnost se postiže pravilnimizborom elemenata osnovnog skupa koji ćepredstavljati uzorak.

9

Cilj uzorkovanja

1. Da se na osnovu karakteristika uzorka dođe doprocjene karakteristika osnovnog skupa

2. Da se statističkim metodama odreditipouzdanost i preciznost te procjene.

Na osnovu ciljeva definišemo zadatkeuzorkovanja: na osnovu uzorka izabranog iz osnovnog skupa

procijeniti karakteristike osnovnog skupa. na osnovu podataka dobivenih uzorkom donijeti

odluku o prihvatanju ili odbacivanju određenehipoteze koja se odnosi na osnovni skup.

10

Greška u statističkom istraživanju Ukupna greška procjene sadrži sistematsku i slučajnu grešku. Slučajna greška

predstavlja razliku između stvarne i ocijenjene vrijednosti parametra populacije. nastaje zbog slučajnog izbora elemenata u uzorak i utiče na preciznost ocjene.

Slučajna greška se smanjuje i preciznost ocjene se povećava sa porastomveličine uzorka.

Sistematske greške nastaju zbog više razloga i teško ih je kontrolisati.Najčešći razlozi zbog kojih nastaju sistematske greške su: loše odabrana baza i okvir za izbor uzorka, nepravilna realizacija slučajnog izbora

elemenata u uzorak, nepreciznosti upitnika, grešaka anketara, tehničke greške prilikom obrade podataka, itd.

Veličina uzorka ne utiče na promjenu sistematske greške. Uzorak sa sistematskom greškom je pristrasan uzorak, a uzorak sa

slučajnom greškom je nepristrasan. Da bi se smanjila pristrasnost ocjene (sistematska greška) neophodno je

primijeniti objektivnu proceduru u izboru jedinica osnovnog skupa u uzorak.

11

Koraci za efikasnost uuzorkovanju

Neophodno je precizno i jasno definisati: cilj istraživanja populaciju koja se želi analizirati jedinice populacije plan uzorka bazu uzorka veličinu uzorka odrediti nivo preciznosti

12

Slučajan i kontrolisani izbor

Kada su elementi izabrani slučajno tada tada se narezultate tog uzorka može primjeniti teorija vjerovatnoće,može se odrediti greška koja je nastala u procjenikarakteristika osnovnog skupa ili u postupku testiranjahipoteza.

Slučajni izbor se može izvršiti na više načina.Najjednostavniji je onaj uzorak koji je jednostavno slučajnoizabran tako da svaki elemenat osnovnog skupa ima jednakuvjerovatnoću da bude izabran za uzorak.

Kontrolisani slučajni uzorci pripadaju grupi uzoraka saograničenjima. Polazi se od ograničenja da svaka jedinicaima poznatu vjerovatnoću izbora u uzorak, koja može ali nemora biti jednaka za sve jedinice.

3

13

Vrste slučajnih uzoraka

Slučajni uzorciSlučajni uzorci

Jednostavni slučajni uzorakJednostavni slučajni uzorak Sistematski uzorakSistematski uzorak Klaster uzorakKlaster uzorakStratifikovani uzorakStratifikovani uzorak

Jedinice se biraju u uzorak slučajnoi unaprijed je poznata vjerovatnoća

izbora svake jedinice u uzorak

Jedinice se biraju u uzorak slučajnoi unaprijed je poznata vjerovatnoća

izbora svake jedinice u uzorak

Sa ponavljanjemSa ponavljanjem Bez ponavljanjaBez ponavljanjaPanel uzorakPanel uzorak Višeetapni uzorakVišeetapni uzorak

14

Jednostavni slučajni uzorak Svaki elemenat u populaciji ima jednaku šansu (vjerovatnoću)

da bude izabran u uzorak. Svaka kombinacija elemanata populacije ima također jednaku

vjerovatnoću da predstavlja uzorak. Najjednostavniji za primjenu i najčešće se koristi. Homogena populacija. Veći uzorak – veći nivo reprezentativnosti. Prednosti:

Nema greške klasifikacije. Ne zahtijeva visok nivo poznavanja populacije.

Osnovni nedostatak ovog tipa uzorka je mogućanereprezentativnost ako je populacija heterogena.

Tablica slučajnih brojeva ili Excel – Data analysis - Sampling

15

Jednostavni slučajni uzorak -Excel

Imamo informacijeza 60 proizvoda osljedećimkarakteristikama: Cijena Kalorijski sadržaj Porijeklo

Želimo napravitiuzorak od 10proizvoda.

16

Jednostavni slučajni uzorak –Excel, cont.

Konvertujemo bazu u Excel (jedna kolona) U Tools opciji izaberemo Data Analysis -

Sampling

17

Jednostavni slučajni uzorak –Excel, cont.

Zadamo niz saorginalnimpodacima kaoInput range

Biramo Randomkao slučajanuzorak izadajemoveličinu uzorka(10)

Output range –zadajemo praznećelije za rezultat

U koloni F dobićemoredne brojeveproizvoda slučajnoodabranih u našuzorak. 18

Jednostavni slučajni uzorak veličine nelemenata dobijamo iz skupa od Nelemenata ako se izbor obavlja tako da svakiuzorak veličine n koji se može slučajnoizabrati iz osvovnog skupa ima istuvjerovatnoću da bude izabran.

Pitanje:Koliko se uzoraka veličine n može izabrati izkonačnog osnovnog skupa veličine N ako seizbor vrši bez ponavljanja?

Broj jednostavnih slučajnihuzoraka

4

19

Broj jednostavnih slučajnihuzoraka, cont.

Odgovor:Onoliko koliko imamogućih kombinacijaod n različitihelemenata iz ukupnoN elemenata:

Vjerovatnoća za svakukombinaciju ili uzorakod n elemenata dabude izabrana jejednaka:

!

! !nN

N NC

n n N n

n

N1

20

Primjer 1

Iz osnovnog skupa od N=30 elemenatamožemo odabrati:

uzoraka od n=5 elementa Za svaki od 142 506 uzoraka vjerovatnoća

da upravo on bude izabran je 1/142 506.

530

30! 26 27 28 29 30142506

5! 30 5! 120C

21

Prost slučajan uzorak može biti i sa ponavljanjem. U tom slučaju svaki element može biti izabran u

uzorak više puta. Broj mogućih uzoraka je

i vjerovatnoća izbora za svaku kombinaciju ili uzorakod n elemenata je jednaka

Ovim načinom izbora je obezbjeđena međusobnanezavisnost uzastopnih izbora elemenata u uzorak.

nNk

nNk /1/1

Broj jednostavnih slučajnihuzoraka sa ponavljanjem

22

Sistematski uzorak

Slučajan uzorak u kojem izbor elemenata u uzorak vršimo ponekom sistematskom redu odabirući slučajno početak.

Podrazumjeva izbor svakog k-tog elementa iz okvira uzorka,gdje se k izračunava kao:

k = veličina populacije (N) / veličina uzorka (n) Svaki element populacije ima istu vjerovatnoću izbora. Na slučaj se bira početna tačka. Prednost - jednostavnost izbora uzorka. Nedostatak - nereprezentativnost u slučajevima kada postoji

određeni način prema kojem je populacija upisana u listu i akose taj način poklapa sa intervalom uzorka.

23

Primjer 2

Primjer sistematskog uzorka: Iz ulice kojoj ima120 kuća trebamo u uzorak izabrati 8 kuća.

Prvo određujemo k:120/8=15, dakle biramo svaku 15-tu kuću počevod slučajno odabrane tačke.

Npr: Ako je slučajno odabrana tačka 11, trebamo uuzorak uzeti kuće sa rednim brojevima 11, 26, 41,56, 71, 86, 101 i 116.

24

Stratifikovaniuzorak

Stratifikacija (tipski izbor) - proces grupisanja jedinicapopulacije u podpopulacije (stratume) koje su unutarsebe homogene a između sebe heterogene.

Heterogena populacija – mogu se generisati stratumi(npr. studenti I, II ili III godine Fakulteta)

Prednosti: Osigurava zastupljenost jedinica iz svakog stratuma. Povećava efikasnost i preciznost jer omogućava kontrolu strukture

uzorka.

Kod proporcionalnog izbora važi sljedeće Proporcija:

Veličina populacije : Veličina stratuma k =Veličina uzorka : Veličina poduzorka uzetog iz stratuma k

5

25

Primjer 3

Struktura zaposlenih u jednoj kompaniji je: Muški spol, stalni radni odnos: 90 Muški spol, do pola radnog vremena: 18 Ženski spol, stalni radni odnos: 9 Ženski spol, do pola radnog vremena: 63 Ukupno zaposlenih: 180

Trebamo kreirati uzorak od 40 zaposlenih,stratifikovan prema zadanim kategorijama.

26

Primjer 3, cont.

Prvi korak jeste da izračunamo % zastupljenost svakeod kategorija u ukupnoj populaciji svih 180 zaposlenih:

% Muški spol, stalni radni odnos = (90/180) x 100 = 50% % Muški spol, do pola radnog vremena = (18/180) x100 =

10% % Ženski spol, stalni radni odnos = (9/180) x 100 = 5% % Ženski spol, do pola radnog vremena = (63/180) x 100 =

35%.

27

Primjer 3, cont.

Prema tome ako želimo sačuvati istu proporciju uuzorku kao u populaciji, trebamo odabrati od svakekategorije po:

50% treba biti Muški spol, stalni radni odnos (50% od 40je 20).

10% treba biti Muški spol, do pola radnog vremena (10%od 40 je 4).

5% treba biti Ženski spol, stalni radni odnos (5% od 40 je2).

35% treba biti Ženski spol, do pola radnog vremena(35% od 40 je 14).

28

Klaster uzorak – uzorak skupina

Procedura uzorkovanja za klaster uzorak:1. Populacija se dijeli na skupine.2. Bira se slučajno određeni broj skupina (klastera) koje predstavljaju

populaciju.3. U uzorak se uključuju sve jedinice koje se nalaze u izabranim

skupinama (klasterima) Korisno je primjeniti klaster uzorak kada:

ne raspolažemo listom svih jedinica, odnosno odgovarajućom bazomuzorka ili

je osnovni skup velik i sastavljen od jedinica koje su npr. prostornovrlo udaljene tada troškovi ankete mogu biti vrlo veliki.

Manja efikasnost nego u slučaju jednostavnog slučajnoguzorka.

29

Panel uzorak

Koristi se: da bi se istražile promjene karakteristika populacije u

vremenu, da se kontinuirano prate neke pojave, u istraživanju tržišta, praćenju troškova života, itd.

Izabrani potrošači odgovaraju na povremeneankete.

Promjena ispitivanih jedinica kao i promjena pojavesu značajni nedostaci ovog tipa uzorka.

Primjena panel uzorka je ograničena na prethodnaistraživanja u primjeni ankete.

30

Višeetapni uzorak

Populacija se podijeli na podskupoveprema hijerarhijskom principu

Postepeno, po etapama izbora: prva etapa - biramo jedinice prvog

stepena. druga etapa - iz svake jedinice prvog

stepena biramo jedinice drugog stepena... posljednja etapa – formira se uzorak

6

31

Vrste namjernih uzoraka

Namjerni uzorci

Prigodan uzorak – uzimamo uuzorak elemente koji

su nam na “dohvat ruke” (npr.uzorak koji pravi profesor

od svojih studenata)

Kvota uzorak

Dobrovoljan uzorak –u uzorak uzimamo osobe

koje su izrazile spremnostda budu dio našeg uzorka

(npr testiranje lijekova)

Jedinice se birajubez poznavanja

i respektovanja vjerovatnoćenjihovog izbora u uzorak

Ekspertni uzorak –u uzorak se biraju jedinice

tipične za populacijukoja se istražuje

32

Kvota uzorak

U skladu sa specifičnim kriterijem i ciljem istraživanjaizaberu se podpopulacije iz kojih se mora anketiratiodređeni broj jedinica prema zadanoj kvoti i to je jediniuslov kod ovog tipa uzorkovanja.

U okviru datih podpopulacija selekciju u uzorak vršiistraživač.

Kvota je unaprijed zadana (recimo 65% žena) i istraživačjedino mora zadovoljiti tu kvotu te ne mora uvažavatiprincip slučajnog izbora.

Nije skup, jednostavno se realizuje i poštuje kroz zadanukvotu proporcije u populaciji.

Često se primjenjuje u ispitivanju javnog mijenja.

33

PitanjeUzorak trgovačkih firmi prema mjestu gdje se nalaze dao je

sljedeće rezultate:

Kako nazivamo uzorak formiran na ovaj način? Jednostavan Panel Stratifikovani Višefazni

34216Prigradskanaselja

44852Širi centar

66037Centar

Standardnadevijacijau uzorku

Prosječanpromet po

m2

u uzorku

Veličinauzorka

Trgovačkefirme

34

Iz osnovnog skupa od N elemenata možemoizabrati različitih uzoraka veličine n.Za svaki od tih uzoraka možemo izračunati

određenu karakteristiku pomoću kojemožemo procijeniti karakteristiku osnovnogskupa. Ova karakteristika je:

• različita od iste karakteristike osnovnogskupa i• različita za svaki od uzoraka.

n

N

Karakteristika (statistika) izuzorka

35

(Ne)pristrasan uzorak

Nepristrasan uzorak daje oblikdistribucije frekvencija sličan onom kodpopulacije.

Dakle, nepristrasan uzorak jereprezentativan.

Sa nepristrasnim uzorkom možemo sazadanim nivoom pouzdanosti vršitipredviđanja za populaciju.

36

Uzorci izabrani slučajno, vrijednosti karakteristikesu slučajne slučajna varijabla.

Vrijednosti ove varijable su slučajno raspoređeneprema nekoj distribuciji vjerovatnoće.

Ako možemo odrediti distribuciju vjerovatnoće ovevarijable onda možemo odrediti vjerovatnoću sakojom će imati vrijednost manju ili jednaku odnekog realnog broja ako je riječ o prekidnoj varijabli ilivjerovatnoću da će se nalaziti u nekom intervalurealnih brojeva ako je riječ o kontinuiranoj varijabli.

Za datu distribuciju možemo odrediti očekivanuvrijednost, varijansu i standardnu devijaciju.

Raspored karakteristika(statistika) iz uzorka

7

37

Procjenu karakteristike osnovnog skupa pomoću izračunate karakteristike iz uzorkaćemo vršiti pomoću intervalne procjene.

Izračunava se donja i gornja granica intervalau kojem se sa određenom vjerovatnoćomnalazi karakteristika osnovnog skupa .

Taj interval izražavamo na sljedeći način:

procjenegreškaˆprocjenegreškaˆ

Interval povjerenja

38

Opšti model intervala povjerenja

gdje je: - vrijednost parametra u uzorku - vrijednost parametra u populaciji h – okolina (greška procjene) - sigurnost (pouzdanost, signifikantnost) - greška prve vrste

ˆ ˆ( ) 1P h h

39

Ocjena parametra osnovnog skupa pomoćuodgovarajuće statistike iz uzorka će bitinepristrasna ako je očekivana vrijednost(aritmetička sredina) statistika iz uzorkajednaka vrijednosti parametra iz osnovnog skupa.

ˆE

Nepristrasna ocjena

40

Aritmetička sredina distribucijearitmetičkih sredina

Ako iz osnovnog skupa N izvučemo kuzoraka veličine n i za svaki od tihuzoraka izračunamo aritmetičku sredinu dobićemo onoliko aritmetičkihsredina koliko imamo uzoraka.

Kako su uzorci izabrani slučajnoaritmetička sredina uzoraka je slučajnavarijabla za koju možemo izračunatiaritmetičku sredinu.

Aritmetička sredina distribucijearitmetičkih sredina je jednaka:

1

1 n

i ii

x xn

1

1 k

ii

X xk

41

Očekivanu vrijednost (aritmetičku sredinu) aritmetičkihsredina uzoraka možemo posmatrati kao očekivanuvrijednost aritmetičke sredine uzorka:

Time se dokazuje da je aritmetička sredina aritmetičkihsredina uzorka jednaka aritmetičkoj sredini osnovnogskupa.

Slijedi da je ovaj parametar procjene nepristrasan.

1

1 1

1( ) ( )

1 1 1( )

n

i ii

n n

ii i

E X E x E xn

E x nn n n

Aritmetička sredina distribucijearitmetičkih sredina, cont.

42

Centralna granična teorema

U beskonačnoj populaciji (bilo kakavraspored da populacija ima), rasporedaritmetičkih sredina uzoraka teži da zauzmenormalan raspored

kada veličina uzorka raste neograničeno(n>30).

22,X XN

n

8

43

Kako su varijable Xi nezavisne možemoodrediti i varijansu aritmetičke sredine uzorakasa ponavljanjem:

Ovaj parametar služi za mjerenje disperzijearitmetičkih sredina oko aritmetičke sredineosnovnog skupa što omogućava mjerenjegreške uzorka.

nn

nnx

nx

n

i

n

iiix

22

21

22

1

222 111)(

Varijansa aritmetičke sredineuzoraka sa ponavljanjem

44

Drugi korijen iz varijanse distribucije aritmetičkihsredina uzoraka daje standardnu devijaciju distribucijesredina uzoraka koja se zove standard error ilistandardna greška procjene aritmetičke sredineosnovnog skupa.

( )x ixn

Standardna greška procjenearitmetičke sredine osnovnog skupa

45

Ako varijansa osnovnog skupa nije poznatanjenu procjenu ne možemo vršiti na osnovuvarijanse uzorka.

Varijabilitet u uzorcima je manji od varijabilitetau osnovnom skupu i u tom slučaju procjenavarijanse bi bila pristrasna ako bismo koristiliizraz:

2

1

2 1

n

iii xx

n

Procjena varijanse osnovnog skupa

46

Za dobijanjenepristrasne ocjenevarijansese koristi izraz:

2

1

2

1

1ˆ

n

ii xx

n

Ovaj izrazmožemo napisatiu slijedećemobliku i naziva sei korigovanavarijansa:

22

1

2

11

1ˆ i

n

ii n

n

n

nxx

n

Procjena varijanse osnovnogskupa, cont.

47

Predhodno prezentirani izraz je nepristrasna ocjenavarijanse osnovnog skupa u kojoj je izraz n/(n-1)faktor korekcije pristrasnosti ocjene.

Za velike uzorke n≥30 faktor korekcije se približavajedinici pa se u praktičnim izračunavanjima može izanemariti.

Standardnu devijaciju osnovnog skupa trebazamijeniti izrazom za korigovanu standardnu devijaciju.

Procjena varijanse osnovnogskupa, cont.

48

Kada varijansa osnovnog skupa nije poznatastandardna greška za procjenu aritmetičke sredineizračunava se iz podataka za uzorak na slijedećinačin:

1

ni

x

11

N

nN

ni

x

Za uzorkesa ponavljanjem:

Za uzorkebez ponavljanja:

Standardna greška procjenearitmetičke sredine

9

49

Ako je frakcija izbora manja od0,05 (0,03) i za uzorke sponavljanjem biće:

Smanjenje varijanse se postižepovećanjem veličine uzorka do temjere da varijansa teži nuli.

Za ocjenu koja se izvodi sapovećanjem uzorka kažemo da jekonzistentna ocjena.

1i

xn

Standardna greška procjenearitmetičke sredine, cont.

50

Testiranje hipoteza

Informacije iz uzorka koristimo da bismo ispitalineke pretpostavke o karakteristikama iparametrima osnovnog skupa.

Statistička hipoteza - precizno formulisana tvrdnjaili pretpostavka o osobinama osnovnog skupa

Testiranje statističke hipoteze - naučni metodkojim provjeravamo prihvatljivost prethodnodefinisane tvrdnje ili pretpostavke.

51

Testiranje hipoteza, cont. Formuliše se nulta hipoteza (H0) koja se može

odnositi na: Zamišljenu vrijednost nekog parametra na nivou

populacije; Oblik teorijskog rasporeda koji odgovara toj populaciji

vezano za određenu karakteristiku procesa; Nepostojanje razlike između nekog parametra procesa za

dvije različite populacije.

Alternativna hipoteza (H1) je negacija nulte hipoteze. Zatim se, na bazi podataka iz uzorka, vrši testiranje

postavljene nulte/alternativne hipoteze. 52

Testiranje statističke hipoteze

1. Pretpostavimo da neka karakteristika osnovnogskupa ima određenu vrijednost

2. Na osnovu uzorka odabranog iz tog skupaizračunamo tu karakteristiku

3. Uporedimo tako izračunatu karakteristiku sanjenom pretpostavljenom vrijednošću

4. Ako razlika nije velika može se smatratislučajnom i pretpostavka mogućom, u suprotnompretpostavka se odbacuje jer nije moguća.

53

Odbijanje ili neodbijanje nultehipoteze

54

Različite vrste greški

Greška I vrste nastaje ako se odbaci nulta hipoteza H0

koja je tačna. Vjerovatnoća nastanka greške prvevrste je .

Greška II vrste nastaje ako se ne odbaci nultahipoteza H0 koja nije tačna. Vjerovatnoća nastankagreške prve vrste je .

Koeficijent pouzdanosti (1-) je vjerovatnoća da nultahipoteza H0 koja je tačna neće biti odbačena.

Jačina testa (1-) je vjerovatnoća da će nulta hipotezaH0 koja nije tačna biti odbačena.

10

55

Rizik u procesudonošenja odluka

Ispravna odlukaJačina testa=(1-)

Greška I vrstep(greške I vrste)=

Odbiti H0

Greška II vrstep(greške II vrste)=

Ispravna odlukaPouzdanost=(1-)

Ne odbiti H0

H0 netačnoH0 tačno

Stvarna situacijaOdluka

Uobičajeno je da se izaberekontrola i da se definišepravilo odbacivanja hipotezekoje će rezultirati da budešto je moguće manja.

56

Greška II vrste

Vrijednost greške je određena slijedećimfaktorima:

stvarnom vrijednošću testiranog parametra nivoom značajnosti testa veličinom uzorka oblikom testa

57

Pitanje

Šta smo napravili ukoliko prihvatimoneistinitu (neispravnu) nultu hipotezu?

1. Grešku prve vrste2. Grešku druge vrste3. Korektnu odluku4. Ispravnu odluku

58

Proces provođenja statističkogtesta

1. Formulisanje nulte i alternativne hipoteze2. Teorijska vrijednost se određuje na osnovu

odgovarajućeg teorijskog rasporeda uz zadaninivo pouzdanosti. Izbor rasporeda zavisi odparametra koji se testira i veličine uzorka.

3. Izračunata vrijednost se određuje na baziparametara iz uzorka.

4. Upoređivanjem teorijske i izračunate vrijednostidonosi se odluka o neodbacivanju iliodbacivanju nulte hipoteze.

59

Formulisanje hipoteza Nulta i alternativna hipoteza - dvije međusobno

isključive tvrdnje o osobinama osnovnog skupa kojesu izražene vrijednostima parametara osnovnogskupa.

Nulta hipoteza - tvrdnja o vrijednosti parametraosnovnog skupa koju testiranjem nastojimo osporiti.

Nultom hipotezom tvrdimo da je parametar osnovnogskupa jednak nekoj pretpostavljenoj vrijednosti.

Svakoj nultoj hipotezi se pridružuje alternativna iliistraživačka hipoteza.

Pretpostavku koju smatramo tačnom i koju tokomtestiranja želimo da potvrdimo izražavamoalternativnom hipotezom. 60

Formulisanje hipoteza, cont. Testiramo samo nultu hipotezu polazeći od

pretpostavke da je istinita i cilj je da je odbacimo. Za testiranje hipoteza mogu se koristiti dvosmjerni i

jednosmjerni testovi. Češće se koriste dvosmjerni testovi kojima se želi

utvrditi da li postoji statistički značajna razlikaizmeđu pretpostavljene i stvarne karakteristikeosnovnog skupa bez obzira na smjer razlike.

Kod dvosmjernog testa oblast odbacivanja nultehipoteze se nalazi simetrično na oba krajadistribucije.

Kod jednosmjernih testova oblast odbacivanja senalazi na jednom kraju distribucije.

11

61

Dvosmjerni test

Hipoteza koju treba testirati je nultahipoteza da je parametar osnovnog skupajednak pretpostavljenoj vrijednosti:

Alternativna hipoteza je da je parametarosnovnog skupa različit od pretpostavljenevrijednosti:

00 : H

01 : H62

Dvosmjerni test, cont.

Neka je: • θ = parametar iz osnovnog skupa• θ0 = pretpostavljena vrijednost θ• H0 = nulta hipoteza• H1 = alternativna hipoteza

Tada je: H0 : θ = θ0

H1 : θ ≠ θ0 H0

α/2 α/2

α/2 1 – α/2

H1H1

63

Jednosmjerni test GG

Za jednosmjerni test na gornju granicu nultai alternativna hipoteza su formulisane naslijedeći način:

Kritična oblast se nalazi na desnom krajudistribucije

0100 :: HH

64

Jednosmjerni test GG, cont.

Neka je: θ = parametar iz osnovnog skupaθ0 = pretpostavljena vrijednost θH0 = nulta hipotezaH1 = alternativna hipoteza

Tada je: H0 : θ ≤ θ0

H1 : θ > θ0

H0 H1

α1 - α

Interval povjerenja

- prihvatanjenulte hipoteze

65

Jednosmjerni test DG

Za jednosmjerni test na donju granicu nulta ialternativna hipoteza su formulisane naslijedeći način:

Kritična oblast se nalazi na lijevom krajudistribucije

0 0 1 0: :H H

66

Jednosmjerni test DG, cont.

Neka je:

Tada je: H0 : θ ≥ θ0

H1 : θ < θ0H0

H1

α

Rizik

- prihvatanjenulte hipoteze

θ = parametar iz osnovnog skupaθ0 = pretpostavljena vrijednost θH0 = nulta hipotezaH1 = alternativna hipoteza

12

67

Izbor statistike testa i određivanjerasporeda vjerovatnoće

Statistika testa - kriterij na osnovu kojegvršimo testiranje.

Najčešće koristimo nepristrasnu ocjenuparametra ili odgovarajuću transformaciju.

Od realizovane vrijednosti statistike testazavisi da li ćemo odbaciti ili prihvatiti nultuhipotezu.

68

Empirijski nivo značajnostip-vrijednost

U statističkim programima se sve više umjesto teorijskog nivoa značajnosti koji jesastavni dio svakog testa izračunava p-vrijednost kao: Empirijski nivo značajnosti koji se izračunava pomoću podataka iz uzorka pomoću

empirijskih z ili t vrijednosti. najmanji nivo značajnosti uz koji se nulta hipoteza može odbaciti na osnovu podataka iz

uzorka. realizovani nivo značajnosti.

Postupak donošenja odluke na osnovu p - vrijednosti se zasniva na poređenju ovevrijednosti sa teorijskim nivoom značajnosti: Ako je p-vrijednost manja od α odbacuje se nulta hipoteza. Ako je p-vrijednost veća od α prihvata se nulta hipoteza. Manja p-vrijednost znači manju empirijski utvrđenu vjerovatnoću odbacivanja istinite

nulte hipoteze. U postupku testiranja hipoteza o aritmetičkoj sredini baza za izračunavanje p-

vrijednosti je empirijska z ili t vrijednost u zavisnosti od toga da li se radi o velikomili malom uzorku.

Ukoliko je nulta hipoteza istinita Z varijabla se ponaša po standardizovanojnormalnoj distribuciji i u tom slučaju p-vrijednost predstavlja vjerovatnoću davarijabla Z uzme vrijednost veću od vrijednosti izračunate na osnovu datog uzorka

69

Izvori

R. Somun-Kapetanović, “Statistika uekonomiji i menadžmentu”, Ekonomskifakultet u Sarajevu, Sarajevo 2006.

Curwin J. and Slater R., QuantitativeMethods for Business Decisions,Thomson Learning – fifth edition 2002.

70

Hvala na pažnji!

Documents

XIII. Osnovi Teorije Uzoraka