Upload
hum-sarajevo
View
1.261
Download
2
Embed Size (px)
Citation preview
1
1
Osnovi teorije uzorkovanja
Prof. dr Rabija Somun KapetanovićDoc. dr Emina Resić
2
Sadržaj predavanja Definicija uzorka Cilj uzorkovanja Greška uzorkovanja Vrste uzoraka
Slučajni Namjerni
Procjena aritmetičke sredine populacije Procjena varijanse populacije Standardna greška Intervali povjerenja – opšti model Statistički testovi – opšti model
3
Nakon ovih predavanja moćićete...
Izabrati adekvatan način uzorkovanja.
Odrediti veličinu i tip uzorka potrebnog ukonkretnom statističkom istraživanju.
Izvesti opšti model i objasniti sastavne elementeza: Interval povjerenja za karakteristiku populacije Statistički test o karakteristici populacije
4
Zašto uzorak?
Za analizu masovnih pojava koje su predmet statističkihistraživanja mi smo do sada prezentirali statističke metodekojima se analizira osnovni skup ili populacija.
Za primjenu metoda potrebno je prikupiti podatke oosnovnom skupu.
Kako statistički skupovi imaju vrlo veliki broj elemenatapotpuno prikupljanje podataka je veoma složen, dugotrajani skup posao.
Zbog toga se taj postupak pojednostavljuje ispitivanjemosnovnog skupa metodom uzorka.
Pod uzorkom se podrazumijeva dio skupa na osnovu kojegistražujemo i analiziramo obilježja elemenata osnovnogskupa.
5
Deskriptivna versus inferencijalnastatistika
Kao i u deskriptivnoj statistici osnovno pitanjeinferencijalne statistike je: « Kako analiziratipodatke da bismo dobili korisnuinformaciju? »
Da bismo dobili informaciju o populaciji,inferencijalna statistika ima jednu dodatnuetapu čiji je cilj da odredi (inferira) polazećiod posmatranih karakteristika na uzorkuvjerovatnu (očekivanu) vrijednost tihkarakteristika za ukupnu populaciju.
6
Kompletnost podataka:Populacija versus uzorak
Popis – svaki element populacije se uključuje uistraživanje.
Popis – populacija – parametar
Uzorak – samo dio elemenata populacije seuključuje u istraživanje.
Uzorak je dio osnovnog skupa i cilj izbora uzorka jeda u što kraćem vremenu i uz što manje troškovedobijemo informaciju o karakteristikama osnovnogskupa iz kojeg smo odabrali uzorak
Uzorak – dio - statistika
2
7
Metoda uzorkovanja
Razlozi zbog kojih istraživanje vršimo na uzorku: Manje vremena - efikasnost Manje troškova - ekonomičnost Jednostavnije administrativno praćenje Racionalnost
Okvir uzorka – lista svih elemenata populacije Vrste uzoraka
Slučajni uzorak (probability sampling) - jedinicepopulacije se slučajno biraju u uzorak
Namjerni uzorak (nonprobability sampling) - odabran naosnovu subjektivnih kriterija
8
Reprezentativnost uzorka
Da bi zaključci koje donosimo okarakteristikama osnovnog skupa na osnovuuzorka bili pouzdani uzorak mora bitireprezentativan.
Uzorak je reprezentativan ako je po svojojstrukturi sličan osnovnom skupu, odnosno akopredstavlja umanjenu sliku osnovnog skupa.
Reprezentativnost se postiže pravilnimizborom elemenata osnovnog skupa koji ćepredstavljati uzorak.
9
Cilj uzorkovanja
1. Da se na osnovu karakteristika uzorka dođe doprocjene karakteristika osnovnog skupa
2. Da se statističkim metodama odreditipouzdanost i preciznost te procjene.
Na osnovu ciljeva definišemo zadatkeuzorkovanja: na osnovu uzorka izabranog iz osnovnog skupa
procijeniti karakteristike osnovnog skupa. na osnovu podataka dobivenih uzorkom donijeti
odluku o prihvatanju ili odbacivanju određenehipoteze koja se odnosi na osnovni skup.
10
Greška u statističkom istraživanju Ukupna greška procjene sadrži sistematsku i slučajnu grešku. Slučajna greška
predstavlja razliku između stvarne i ocijenjene vrijednosti parametra populacije. nastaje zbog slučajnog izbora elemenata u uzorak i utiče na preciznost ocjene.
Slučajna greška se smanjuje i preciznost ocjene se povećava sa porastomveličine uzorka.
Sistematske greške nastaju zbog više razloga i teško ih je kontrolisati.Najčešći razlozi zbog kojih nastaju sistematske greške su: loše odabrana baza i okvir za izbor uzorka, nepravilna realizacija slučajnog izbora
elemenata u uzorak, nepreciznosti upitnika, grešaka anketara, tehničke greške prilikom obrade podataka, itd.
Veličina uzorka ne utiče na promjenu sistematske greške. Uzorak sa sistematskom greškom je pristrasan uzorak, a uzorak sa
slučajnom greškom je nepristrasan. Da bi se smanjila pristrasnost ocjene (sistematska greška) neophodno je
primijeniti objektivnu proceduru u izboru jedinica osnovnog skupa u uzorak.
11
Koraci za efikasnost uuzorkovanju
Neophodno je precizno i jasno definisati: cilj istraživanja populaciju koja se želi analizirati jedinice populacije plan uzorka bazu uzorka veličinu uzorka odrediti nivo preciznosti
12
Slučajan i kontrolisani izbor
Kada su elementi izabrani slučajno tada tada se narezultate tog uzorka može primjeniti teorija vjerovatnoće,može se odrediti greška koja je nastala u procjenikarakteristika osnovnog skupa ili u postupku testiranjahipoteza.
Slučajni izbor se može izvršiti na više načina.Najjednostavniji je onaj uzorak koji je jednostavno slučajnoizabran tako da svaki elemenat osnovnog skupa ima jednakuvjerovatnoću da bude izabran za uzorak.
Kontrolisani slučajni uzorci pripadaju grupi uzoraka saograničenjima. Polazi se od ograničenja da svaka jedinicaima poznatu vjerovatnoću izbora u uzorak, koja može ali nemora biti jednaka za sve jedinice.
3
13
Vrste slučajnih uzoraka
Slučajni uzorciSlučajni uzorci
Jednostavni slučajni uzorakJednostavni slučajni uzorak Sistematski uzorakSistematski uzorak Klaster uzorakKlaster uzorakStratifikovani uzorakStratifikovani uzorak
Jedinice se biraju u uzorak slučajnoi unaprijed je poznata vjerovatnoća
izbora svake jedinice u uzorak
Jedinice se biraju u uzorak slučajnoi unaprijed je poznata vjerovatnoća
izbora svake jedinice u uzorak
Sa ponavljanjemSa ponavljanjem Bez ponavljanjaBez ponavljanjaPanel uzorakPanel uzorak Višeetapni uzorakVišeetapni uzorak
14
Jednostavni slučajni uzorak Svaki elemenat u populaciji ima jednaku šansu (vjerovatnoću)
da bude izabran u uzorak. Svaka kombinacija elemanata populacije ima također jednaku
vjerovatnoću da predstavlja uzorak. Najjednostavniji za primjenu i najčešće se koristi. Homogena populacija. Veći uzorak – veći nivo reprezentativnosti. Prednosti:
Nema greške klasifikacije. Ne zahtijeva visok nivo poznavanja populacije.
Osnovni nedostatak ovog tipa uzorka je mogućanereprezentativnost ako je populacija heterogena.
Tablica slučajnih brojeva ili Excel – Data analysis - Sampling
15
Jednostavni slučajni uzorak -Excel
Imamo informacijeza 60 proizvoda osljedećimkarakteristikama: Cijena Kalorijski sadržaj Porijeklo
Želimo napravitiuzorak od 10proizvoda.
16
Jednostavni slučajni uzorak –Excel, cont.
Konvertujemo bazu u Excel (jedna kolona) U Tools opciji izaberemo Data Analysis -
Sampling
17
Jednostavni slučajni uzorak –Excel, cont.
Zadamo niz saorginalnimpodacima kaoInput range
Biramo Randomkao slučajanuzorak izadajemoveličinu uzorka(10)
Output range –zadajemo praznećelije za rezultat
U koloni F dobićemoredne brojeveproizvoda slučajnoodabranih u našuzorak. 18
Jednostavni slučajni uzorak veličine nelemenata dobijamo iz skupa od Nelemenata ako se izbor obavlja tako da svakiuzorak veličine n koji se može slučajnoizabrati iz osvovnog skupa ima istuvjerovatnoću da bude izabran.
Pitanje:Koliko se uzoraka veličine n može izabrati izkonačnog osnovnog skupa veličine N ako seizbor vrši bez ponavljanja?
Broj jednostavnih slučajnihuzoraka
4
19
Broj jednostavnih slučajnihuzoraka, cont.
Odgovor:Onoliko koliko imamogućih kombinacijaod n različitihelemenata iz ukupnoN elemenata:
Vjerovatnoća za svakukombinaciju ili uzorakod n elemenata dabude izabrana jejednaka:
!
! !nN
N NC
n n N n
n
N1
20
Primjer 1
Iz osnovnog skupa od N=30 elemenatamožemo odabrati:
uzoraka od n=5 elementa Za svaki od 142 506 uzoraka vjerovatnoća
da upravo on bude izabran je 1/142 506.
530
30! 26 27 28 29 30142506
5! 30 5! 120C
21
Prost slučajan uzorak može biti i sa ponavljanjem. U tom slučaju svaki element može biti izabran u
uzorak više puta. Broj mogućih uzoraka je
i vjerovatnoća izbora za svaku kombinaciju ili uzorakod n elemenata je jednaka
Ovim načinom izbora je obezbjeđena međusobnanezavisnost uzastopnih izbora elemenata u uzorak.
nNk
nNk /1/1
Broj jednostavnih slučajnihuzoraka sa ponavljanjem
22
Sistematski uzorak
Slučajan uzorak u kojem izbor elemenata u uzorak vršimo ponekom sistematskom redu odabirući slučajno početak.
Podrazumjeva izbor svakog k-tog elementa iz okvira uzorka,gdje se k izračunava kao:
k = veličina populacije (N) / veličina uzorka (n) Svaki element populacije ima istu vjerovatnoću izbora. Na slučaj se bira početna tačka. Prednost - jednostavnost izbora uzorka. Nedostatak - nereprezentativnost u slučajevima kada postoji
određeni način prema kojem je populacija upisana u listu i akose taj način poklapa sa intervalom uzorka.
23
Primjer 2
Primjer sistematskog uzorka: Iz ulice kojoj ima120 kuća trebamo u uzorak izabrati 8 kuća.
Prvo određujemo k:120/8=15, dakle biramo svaku 15-tu kuću počevod slučajno odabrane tačke.
Npr: Ako je slučajno odabrana tačka 11, trebamo uuzorak uzeti kuće sa rednim brojevima 11, 26, 41,56, 71, 86, 101 i 116.
24
Stratifikovaniuzorak
Stratifikacija (tipski izbor) - proces grupisanja jedinicapopulacije u podpopulacije (stratume) koje su unutarsebe homogene a između sebe heterogene.
Heterogena populacija – mogu se generisati stratumi(npr. studenti I, II ili III godine Fakulteta)
Prednosti: Osigurava zastupljenost jedinica iz svakog stratuma. Povećava efikasnost i preciznost jer omogućava kontrolu strukture
uzorka.
Kod proporcionalnog izbora važi sljedeće Proporcija:
Veličina populacije : Veličina stratuma k =Veličina uzorka : Veličina poduzorka uzetog iz stratuma k
5
25
Primjer 3
Struktura zaposlenih u jednoj kompaniji je: Muški spol, stalni radni odnos: 90 Muški spol, do pola radnog vremena: 18 Ženski spol, stalni radni odnos: 9 Ženski spol, do pola radnog vremena: 63 Ukupno zaposlenih: 180
Trebamo kreirati uzorak od 40 zaposlenih,stratifikovan prema zadanim kategorijama.
26
Primjer 3, cont.
Prvi korak jeste da izračunamo % zastupljenost svakeod kategorija u ukupnoj populaciji svih 180 zaposlenih:
% Muški spol, stalni radni odnos = (90/180) x 100 = 50% % Muški spol, do pola radnog vremena = (18/180) x100 =
10% % Ženski spol, stalni radni odnos = (9/180) x 100 = 5% % Ženski spol, do pola radnog vremena = (63/180) x 100 =
35%.
27
Primjer 3, cont.
Prema tome ako želimo sačuvati istu proporciju uuzorku kao u populaciji, trebamo odabrati od svakekategorije po:
50% treba biti Muški spol, stalni radni odnos (50% od 40je 20).
10% treba biti Muški spol, do pola radnog vremena (10%od 40 je 4).
5% treba biti Ženski spol, stalni radni odnos (5% od 40 je2).
35% treba biti Ženski spol, do pola radnog vremena(35% od 40 je 14).
28
Klaster uzorak – uzorak skupina
Procedura uzorkovanja za klaster uzorak:1. Populacija se dijeli na skupine.2. Bira se slučajno određeni broj skupina (klastera) koje predstavljaju
populaciju.3. U uzorak se uključuju sve jedinice koje se nalaze u izabranim
skupinama (klasterima) Korisno je primjeniti klaster uzorak kada:
ne raspolažemo listom svih jedinica, odnosno odgovarajućom bazomuzorka ili
je osnovni skup velik i sastavljen od jedinica koje su npr. prostornovrlo udaljene tada troškovi ankete mogu biti vrlo veliki.
Manja efikasnost nego u slučaju jednostavnog slučajnoguzorka.
29
Panel uzorak
Koristi se: da bi se istražile promjene karakteristika populacije u
vremenu, da se kontinuirano prate neke pojave, u istraživanju tržišta, praćenju troškova života, itd.
Izabrani potrošači odgovaraju na povremeneankete.
Promjena ispitivanih jedinica kao i promjena pojavesu značajni nedostaci ovog tipa uzorka.
Primjena panel uzorka je ograničena na prethodnaistraživanja u primjeni ankete.
30
Višeetapni uzorak
Populacija se podijeli na podskupoveprema hijerarhijskom principu
Postepeno, po etapama izbora: prva etapa - biramo jedinice prvog
stepena. druga etapa - iz svake jedinice prvog
stepena biramo jedinice drugog stepena... posljednja etapa – formira se uzorak
6
31
Vrste namjernih uzoraka
Namjerni uzorci
Prigodan uzorak – uzimamo uuzorak elemente koji
su nam na “dohvat ruke” (npr.uzorak koji pravi profesor
od svojih studenata)
Kvota uzorak
Dobrovoljan uzorak –u uzorak uzimamo osobe
koje su izrazile spremnostda budu dio našeg uzorka
(npr testiranje lijekova)
Jedinice se birajubez poznavanja
i respektovanja vjerovatnoćenjihovog izbora u uzorak
Ekspertni uzorak –u uzorak se biraju jedinice
tipične za populacijukoja se istražuje
32
Kvota uzorak
U skladu sa specifičnim kriterijem i ciljem istraživanjaizaberu se podpopulacije iz kojih se mora anketiratiodređeni broj jedinica prema zadanoj kvoti i to je jediniuslov kod ovog tipa uzorkovanja.
U okviru datih podpopulacija selekciju u uzorak vršiistraživač.
Kvota je unaprijed zadana (recimo 65% žena) i istraživačjedino mora zadovoljiti tu kvotu te ne mora uvažavatiprincip slučajnog izbora.
Nije skup, jednostavno se realizuje i poštuje kroz zadanukvotu proporcije u populaciji.
Često se primjenjuje u ispitivanju javnog mijenja.
33
PitanjeUzorak trgovačkih firmi prema mjestu gdje se nalaze dao je
sljedeće rezultate:
Kako nazivamo uzorak formiran na ovaj način? Jednostavan Panel Stratifikovani Višefazni
34216Prigradskanaselja
44852Širi centar
66037Centar
Standardnadevijacijau uzorku
Prosječanpromet po
m2
u uzorku
Veličinauzorka
Trgovačkefirme
34
Iz osnovnog skupa od N elemenata možemoizabrati različitih uzoraka veličine n.Za svaki od tih uzoraka možemo izračunati
određenu karakteristiku pomoću kojemožemo procijeniti karakteristiku osnovnogskupa. Ova karakteristika je:
• različita od iste karakteristike osnovnogskupa i• različita za svaki od uzoraka.
n
N
Karakteristika (statistika) izuzorka
35
(Ne)pristrasan uzorak
Nepristrasan uzorak daje oblikdistribucije frekvencija sličan onom kodpopulacije.
Dakle, nepristrasan uzorak jereprezentativan.
Sa nepristrasnim uzorkom možemo sazadanim nivoom pouzdanosti vršitipredviđanja za populaciju.
36
Uzorci izabrani slučajno, vrijednosti karakteristikesu slučajne slučajna varijabla.
Vrijednosti ove varijable su slučajno raspoređeneprema nekoj distribuciji vjerovatnoće.
Ako možemo odrediti distribuciju vjerovatnoće ovevarijable onda možemo odrediti vjerovatnoću sakojom će imati vrijednost manju ili jednaku odnekog realnog broja ako je riječ o prekidnoj varijabli ilivjerovatnoću da će se nalaziti u nekom intervalurealnih brojeva ako je riječ o kontinuiranoj varijabli.
Za datu distribuciju možemo odrediti očekivanuvrijednost, varijansu i standardnu devijaciju.
Raspored karakteristika(statistika) iz uzorka
7
37
Procjenu karakteristike osnovnog skupa pomoću izračunate karakteristike iz uzorkaćemo vršiti pomoću intervalne procjene.
Izračunava se donja i gornja granica intervalau kojem se sa određenom vjerovatnoćomnalazi karakteristika osnovnog skupa .
Taj interval izražavamo na sljedeći način:
procjenegreškaˆprocjenegreškaˆ
Interval povjerenja
38
Opšti model intervala povjerenja
gdje je: - vrijednost parametra u uzorku - vrijednost parametra u populaciji h – okolina (greška procjene) - sigurnost (pouzdanost, signifikantnost) - greška prve vrste
ˆ ˆ( ) 1P h h
39
Ocjena parametra osnovnog skupa pomoćuodgovarajuće statistike iz uzorka će bitinepristrasna ako je očekivana vrijednost(aritmetička sredina) statistika iz uzorkajednaka vrijednosti parametra iz osnovnog skupa.
ˆE
Nepristrasna ocjena
40
Aritmetička sredina distribucijearitmetičkih sredina
Ako iz osnovnog skupa N izvučemo kuzoraka veličine n i za svaki od tihuzoraka izračunamo aritmetičku sredinu dobićemo onoliko aritmetičkihsredina koliko imamo uzoraka.
Kako su uzorci izabrani slučajnoaritmetička sredina uzoraka je slučajnavarijabla za koju možemo izračunatiaritmetičku sredinu.
Aritmetička sredina distribucijearitmetičkih sredina je jednaka:
1
1 n
i ii
x xn
1
1 k
ii
X xk
41
Očekivanu vrijednost (aritmetičku sredinu) aritmetičkihsredina uzoraka možemo posmatrati kao očekivanuvrijednost aritmetičke sredine uzorka:
Time se dokazuje da je aritmetička sredina aritmetičkihsredina uzorka jednaka aritmetičkoj sredini osnovnogskupa.
Slijedi da je ovaj parametar procjene nepristrasan.
1
1 1
1( ) ( )
1 1 1( )
n
i ii
n n
ii i
E X E x E xn
E x nn n n
Aritmetička sredina distribucijearitmetičkih sredina, cont.
42
Centralna granična teorema
U beskonačnoj populaciji (bilo kakavraspored da populacija ima), rasporedaritmetičkih sredina uzoraka teži da zauzmenormalan raspored
kada veličina uzorka raste neograničeno(n>30).
22,X XN
n
8
43
Kako su varijable Xi nezavisne možemoodrediti i varijansu aritmetičke sredine uzorakasa ponavljanjem:
Ovaj parametar služi za mjerenje disperzijearitmetičkih sredina oko aritmetičke sredineosnovnog skupa što omogućava mjerenjegreške uzorka.
nn
nnx
nx
n
i
n
iiix
22
21
22
1
222 111)(
Varijansa aritmetičke sredineuzoraka sa ponavljanjem
44
Drugi korijen iz varijanse distribucije aritmetičkihsredina uzoraka daje standardnu devijaciju distribucijesredina uzoraka koja se zove standard error ilistandardna greška procjene aritmetičke sredineosnovnog skupa.
( )x ixn
Standardna greška procjenearitmetičke sredine osnovnog skupa
45
Ako varijansa osnovnog skupa nije poznatanjenu procjenu ne možemo vršiti na osnovuvarijanse uzorka.
Varijabilitet u uzorcima je manji od varijabilitetau osnovnom skupu i u tom slučaju procjenavarijanse bi bila pristrasna ako bismo koristiliizraz:
2
1
2 1
n
iii xx
n
Procjena varijanse osnovnog skupa
46
Za dobijanjenepristrasne ocjenevarijansese koristi izraz:
2
1
2
1
1ˆ
n
ii xx
n
Ovaj izrazmožemo napisatiu slijedećemobliku i naziva sei korigovanavarijansa:
22
1
2
11
1ˆ i
n
ii n
n
n
nxx
n
Procjena varijanse osnovnogskupa, cont.
47
Predhodno prezentirani izraz je nepristrasna ocjenavarijanse osnovnog skupa u kojoj je izraz n/(n-1)faktor korekcije pristrasnosti ocjene.
Za velike uzorke n≥30 faktor korekcije se približavajedinici pa se u praktičnim izračunavanjima može izanemariti.
Standardnu devijaciju osnovnog skupa trebazamijeniti izrazom za korigovanu standardnu devijaciju.
Procjena varijanse osnovnogskupa, cont.
48
Kada varijansa osnovnog skupa nije poznatastandardna greška za procjenu aritmetičke sredineizračunava se iz podataka za uzorak na slijedećinačin:
1
ni
x
11
N
nN
ni
x
Za uzorkesa ponavljanjem:
Za uzorkebez ponavljanja:
Standardna greška procjenearitmetičke sredine
9
49
Ako je frakcija izbora manja od0,05 (0,03) i za uzorke sponavljanjem biće:
Smanjenje varijanse se postižepovećanjem veličine uzorka do temjere da varijansa teži nuli.
Za ocjenu koja se izvodi sapovećanjem uzorka kažemo da jekonzistentna ocjena.
1i
xn
Standardna greška procjenearitmetičke sredine, cont.
50
Testiranje hipoteza
Informacije iz uzorka koristimo da bismo ispitalineke pretpostavke o karakteristikama iparametrima osnovnog skupa.
Statistička hipoteza - precizno formulisana tvrdnjaili pretpostavka o osobinama osnovnog skupa
Testiranje statističke hipoteze - naučni metodkojim provjeravamo prihvatljivost prethodnodefinisane tvrdnje ili pretpostavke.
51
Testiranje hipoteza, cont. Formuliše se nulta hipoteza (H0) koja se može
odnositi na: Zamišljenu vrijednost nekog parametra na nivou
populacije; Oblik teorijskog rasporeda koji odgovara toj populaciji
vezano za određenu karakteristiku procesa; Nepostojanje razlike između nekog parametra procesa za
dvije različite populacije.
Alternativna hipoteza (H1) je negacija nulte hipoteze. Zatim se, na bazi podataka iz uzorka, vrši testiranje
postavljene nulte/alternativne hipoteze. 52
Testiranje statističke hipoteze
1. Pretpostavimo da neka karakteristika osnovnogskupa ima određenu vrijednost
2. Na osnovu uzorka odabranog iz tog skupaizračunamo tu karakteristiku
3. Uporedimo tako izračunatu karakteristiku sanjenom pretpostavljenom vrijednošću
4. Ako razlika nije velika može se smatratislučajnom i pretpostavka mogućom, u suprotnompretpostavka se odbacuje jer nije moguća.
53
Odbijanje ili neodbijanje nultehipoteze
54
Različite vrste greški
Greška I vrste nastaje ako se odbaci nulta hipoteza H0
koja je tačna. Vjerovatnoća nastanka greške prvevrste je .
Greška II vrste nastaje ako se ne odbaci nultahipoteza H0 koja nije tačna. Vjerovatnoća nastankagreške prve vrste je .
Koeficijent pouzdanosti (1-) je vjerovatnoća da nultahipoteza H0 koja je tačna neće biti odbačena.
Jačina testa (1-) je vjerovatnoća da će nulta hipotezaH0 koja nije tačna biti odbačena.
10
55
Rizik u procesudonošenja odluka
Ispravna odlukaJačina testa=(1-)
Greška I vrstep(greške I vrste)=
Odbiti H0
Greška II vrstep(greške II vrste)=
Ispravna odlukaPouzdanost=(1-)
Ne odbiti H0
H0 netačnoH0 tačno
Stvarna situacijaOdluka
Uobičajeno je da se izaberekontrola i da se definišepravilo odbacivanja hipotezekoje će rezultirati da budešto je moguće manja.
56
Greška II vrste
Vrijednost greške je određena slijedećimfaktorima:
stvarnom vrijednošću testiranog parametra nivoom značajnosti testa veličinom uzorka oblikom testa
57
Pitanje
Šta smo napravili ukoliko prihvatimoneistinitu (neispravnu) nultu hipotezu?
1. Grešku prve vrste2. Grešku druge vrste3. Korektnu odluku4. Ispravnu odluku
58
Proces provođenja statističkogtesta
1. Formulisanje nulte i alternativne hipoteze2. Teorijska vrijednost se određuje na osnovu
odgovarajućeg teorijskog rasporeda uz zadaninivo pouzdanosti. Izbor rasporeda zavisi odparametra koji se testira i veličine uzorka.
3. Izračunata vrijednost se određuje na baziparametara iz uzorka.
4. Upoređivanjem teorijske i izračunate vrijednostidonosi se odluka o neodbacivanju iliodbacivanju nulte hipoteze.
59
Formulisanje hipoteza Nulta i alternativna hipoteza - dvije međusobno
isključive tvrdnje o osobinama osnovnog skupa kojesu izražene vrijednostima parametara osnovnogskupa.
Nulta hipoteza - tvrdnja o vrijednosti parametraosnovnog skupa koju testiranjem nastojimo osporiti.
Nultom hipotezom tvrdimo da je parametar osnovnogskupa jednak nekoj pretpostavljenoj vrijednosti.
Svakoj nultoj hipotezi se pridružuje alternativna iliistraživačka hipoteza.
Pretpostavku koju smatramo tačnom i koju tokomtestiranja želimo da potvrdimo izražavamoalternativnom hipotezom. 60
Formulisanje hipoteza, cont. Testiramo samo nultu hipotezu polazeći od
pretpostavke da je istinita i cilj je da je odbacimo. Za testiranje hipoteza mogu se koristiti dvosmjerni i
jednosmjerni testovi. Češće se koriste dvosmjerni testovi kojima se želi
utvrditi da li postoji statistički značajna razlikaizmeđu pretpostavljene i stvarne karakteristikeosnovnog skupa bez obzira na smjer razlike.
Kod dvosmjernog testa oblast odbacivanja nultehipoteze se nalazi simetrično na oba krajadistribucije.
Kod jednosmjernih testova oblast odbacivanja senalazi na jednom kraju distribucije.
11
61
Dvosmjerni test
Hipoteza koju treba testirati je nultahipoteza da je parametar osnovnog skupajednak pretpostavljenoj vrijednosti:
Alternativna hipoteza je da je parametarosnovnog skupa različit od pretpostavljenevrijednosti:
00 : H
01 : H62
Dvosmjerni test, cont.
Neka je: • θ = parametar iz osnovnog skupa• θ0 = pretpostavljena vrijednost θ• H0 = nulta hipoteza• H1 = alternativna hipoteza
Tada je: H0 : θ = θ0
H1 : θ ≠ θ0 H0
α/2 α/2
α/2 1 – α/2
H1H1
63
Jednosmjerni test GG
Za jednosmjerni test na gornju granicu nultai alternativna hipoteza su formulisane naslijedeći način:
Kritična oblast se nalazi na desnom krajudistribucije
0100 :: HH
64
Jednosmjerni test GG, cont.
Neka je: θ = parametar iz osnovnog skupaθ0 = pretpostavljena vrijednost θH0 = nulta hipotezaH1 = alternativna hipoteza
Tada je: H0 : θ ≤ θ0
H1 : θ > θ0
H0 H1
α1 - α
Interval povjerenja
- prihvatanjenulte hipoteze
65
Jednosmjerni test DG
Za jednosmjerni test na donju granicu nulta ialternativna hipoteza su formulisane naslijedeći način:
Kritična oblast se nalazi na lijevom krajudistribucije
0 0 1 0: :H H
66
Jednosmjerni test DG, cont.
Neka je:
Tada je: H0 : θ ≥ θ0
H1 : θ < θ0H0
H1
α
Rizik
- prihvatanjenulte hipoteze
θ = parametar iz osnovnog skupaθ0 = pretpostavljena vrijednost θH0 = nulta hipotezaH1 = alternativna hipoteza
12
67
Izbor statistike testa i određivanjerasporeda vjerovatnoće
Statistika testa - kriterij na osnovu kojegvršimo testiranje.
Najčešće koristimo nepristrasnu ocjenuparametra ili odgovarajuću transformaciju.
Od realizovane vrijednosti statistike testazavisi da li ćemo odbaciti ili prihvatiti nultuhipotezu.
68
Empirijski nivo značajnostip-vrijednost
U statističkim programima se sve više umjesto teorijskog nivoa značajnosti koji jesastavni dio svakog testa izračunava p-vrijednost kao: Empirijski nivo značajnosti koji se izračunava pomoću podataka iz uzorka pomoću
empirijskih z ili t vrijednosti. najmanji nivo značajnosti uz koji se nulta hipoteza može odbaciti na osnovu podataka iz
uzorka. realizovani nivo značajnosti.
Postupak donošenja odluke na osnovu p - vrijednosti se zasniva na poređenju ovevrijednosti sa teorijskim nivoom značajnosti: Ako je p-vrijednost manja od α odbacuje se nulta hipoteza. Ako je p-vrijednost veća od α prihvata se nulta hipoteza. Manja p-vrijednost znači manju empirijski utvrđenu vjerovatnoću odbacivanja istinite
nulte hipoteze. U postupku testiranja hipoteza o aritmetičkoj sredini baza za izračunavanje p-
vrijednosti je empirijska z ili t vrijednost u zavisnosti od toga da li se radi o velikomili malom uzorku.
Ukoliko je nulta hipoteza istinita Z varijabla se ponaša po standardizovanojnormalnoj distribuciji i u tom slučaju p-vrijednost predstavlja vjerovatnoću davarijabla Z uzme vrijednost veću od vrijednosti izračunate na osnovu datog uzorka
69
Izvori
R. Somun-Kapetanović, “Statistika uekonomiji i menadžmentu”, Ekonomskifakultet u Sarajevu, Sarajevo 2006.
Curwin J. and Slater R., QuantitativeMethods for Business Decisions,Thomson Learning – fifth edition 2002.
70
Hvala na pažnji!