Upload
trinhkiet
View
289
Download
9
Embed Size (px)
Citation preview
1
1
Testimi i hipotezave/Kontrollimi i
hipotezave Mostra e madhe
Ligjërata e tetë
2
Testimi i hipotezave/Mostra e madhe Qëllimet Pas orës së mësimit ju duhet ë jeni në gjendje që të:
Definoni termet: “hipotezë” dhe “testimi i hipotezave”
Përshkruani hapat në procedurën e testimit të hipotezave
Bëni dallimin në mes të testimit të hipotezave të testit një-anësor dhe dy-anësor.
Testoni hipotezën rreth mesatares së populacionit dhe proporcionit të populacionit
Testoni hipotezën rreth dallimeve në mes të dy mesatareve të populacionit dhe dy proporcioneve të populacionit.
Definoni gabimet e Llojit të Parë dhe Llojit të Dytë.
2
Testimi i hipotezave
Analizojmë një rast jostatistikor:
Ekziston dyshimi se personi i caktuar ka kryer vepër penale dhe për këtë duhet të gjykohet. Në bazë të dhënave dhe dëshmive, gjykatësi do të bjerë një nga vendimet e mundshme:
1. Personi është i pafajshëm
2. Personi është i fajshëm.
Në fillim të gjykimit gjithmonë konsiderohet se personi nuk është fajtor.
3
Testimi i hipotezave
Dy hipoteza:
Në statistikë shprehja:
“Personi është i pafajshëm”, quhet “Hipotezë zero”, derisa shprehja
“Personi është i fajshëm” quhet
“hipotezë alternative”
Hipoteza zero: H0 Personi është i pafajshëm
Hipoteza alternative: H1 Personi është i fajshëm
4
3
5
Çka është hipoteza?
Hipoteza: Supozim (pohim)
rreth vlerës së parametrit
të populacionit e zhvilluar
për qëllime të testimit.
Shembuj të parametrave
janë mesatarja e populacionit
ose proporcioni i populacionit
Parametrat duhet
të identifikohen
para analizës
Unë pohoj se nota mesatare e
kësaj klase është µ= 3.5!
6
Çka është testimi i hipotezave?
Testimi i hipotezave: Procedurë, e bazuar në të dhënat e mostrës dhe teorinë e probabilitetit, të përdoruara për të përcaktuar se hipoteza a është një deklarim i arsyeshëm dhe nuk duhet të refuzohet, ose është i paarsyeshëm dhe duhet të refuzohet.
9-4
4
Hipoteza zero H0
7
Hipoteza zero H0: Pohimi (Supozimi) rreth vlerës së parametrit të populacionit
Fillon me supozimin se hipoteza zero është e vërtetë.
- Ngjashëm me rastin e personit që do të jetë i pafajshëm derisa të vërtetohet fajësia e tij.
Gjithmonë e përmban shenjën e “=”, “≤” ose “”
Mundet ose nuk mund të refuzohet.
Zakonisht formulohet: “Nuk ka dallime signifikante në mes të …..”
Hipoteza alternative H1
Hipoteza alternative H1: Pohimi/supozimi që pranohet nëse të dhënat e mostrës sigurojnë evidencën se hipoteza zero nuk është e vërtetë.
Është e kundërta e hipotezës zero.
Kurrë nuk e përmban shenjën e “=”, “≤” ose “”
Gjithmonë përmban njërën nga shenjat: “≠”, “<” ose “>”
Mund ose jo të pranohet.
Në përgjithësi është hipotezë që besohet (ose ka nevojë të
provohet) të jetë e vërtetë nga hulumtuesi.
8
5
Procesi i testimit të hipotezave
Zgjedhja e mostrës
Hipotezën zero
Identifikimi i populacionit
Supozojmë se
mosha mesatare e populacionit është 50.
( )
Refuzo
Jo, nuk është e mundshme!
X 20 a është e mundur Nëse ?
0 : 50H
20X
10
Distribucioni sampling i X
μ = 50 Nëse H0 është e
vërtetë Nuk ka mundësi që
të fitojmë mesataren
nga mostra në këtë
vlerë ...
... Për këtë ne
refuzojmë
hipotezën zero
μ = 50.
Arsyet për refuzimin e H0
20
... Në se në të vërtetë kjo
do të ishte mesatarja e
popullimit……
X
6
11
Niveli i signifikancës/rrezikut (α)
Niveli i signifikancës: Probabiliteti i hedhjes së hipotezës zero kur ajo është e vërtetë.
Quhet regjioni i hedhjes së distribucionit të mostrave.
Shënohet me α (niveli i signifikancës)
Vlerat tipike janë 0.01, 0.05, 0.10
Zgjedhet nga hulumtuesi që në fillim
Siguron vlerat kritike të testit.
12
Niveli i signifikancës dhe regjioni i refuzimit
H0: μ ≥ 3
H1: μ < 3
0
H0: μ ≤ 3
H1: μ > 3
a
a
(Vlerat
kritike)
Testi i poshtëm/ i majtë- Test i njëanësor
Niveli i signifikancës = a
0 Testi i epërm/ i djathtë -Test i njëanësor
Testi dyanësor
Regjioni i
refuzimit
është me
hije
/2
0
a /2 a H0: μ = 3
H1: μ ≠ 3
7
13
Gabimet në marrjen e vendimeve
Gabimi i Llojit të Parë Refuzimi i hipotezës zero kur ajo është e
vërtetë Ka pasoja serioze Probabiliteti për Gabimin e llojit të Parë
është α Quhet niveli i signifikancës Vendoset nga hulumtuesi
Gabimi i Llojit të Dytë Dështimi në refuzimin e hipotezës zero kur ajo
nuk është e vërtetë.
Probabiliteti i Gabimit të llojit të dytë është β Fuqia e testit është (1- β)
Gabimet në marrjen e vendimeve
Probabiliteti për të mos bërë gabimin e Llojit të Parë është
Quhet koeficienti i besueshmërisë ose konfidencës.
1 a
(vazhdim
8
Qasjet në tesitimin e hipotezave
Qasja e vlerës kritike
Qasja e vlerës së probabilitetit/ “vlera p”
15
Qasja e Vlerës kritike për testim të hipotezave
Konvertimi i statistikave të mostrës (p.sh. : ) në teste statistikore (p.sh. Z, t ose F –testi)
Sigurimi i vlerave kritike) për një vlerë të specifikuar të nga tabela ose kompjutori
Nëse testi statistikor gjindet në regjionin kritik, atëherë refuzohet H0
Në të kundërtën nuk refuzohet H0
X
a
9
Qasja e probabilitetit- Vlerës p - për testimin e hipotezave
Konvertimi i statistikave të mostrës (p.sh. ) në teste statistikore (p.sh. Z, t ose F –testi)
Sigurimi i vlerave të p nga tabela ose përmes kompjuterit
Nëse vlera e p është më e madhe se niveli i
signifikancës α , H0 nuk refuzohet.
Nëse vlera e p është më e vogël se niveli i signifikancës α , H0 refuzohet.
Krahasohen vlerat e p me α
Nëse vlera e p , Mos refuzo H0 Nëse vlera e p Refuzo H0
X
a
a
18
Fazat e Testimit të hipotezave
Hapi I. Formulimi i Hipotezës Zero (H0) dhe Hipotezës Alternative (H1)
Hapi 2. Zgjedhja e nivelit të signifikancës/rrezikut
Hapi 3. Identifikimi i Testit statistikor ( Z, t, F, Testi hi në katror)
Hapi 4. Formulimi i Rregullës së vendosjes
Hapi 5. Zgjedhja e mostrës dhe marrja e vendimit
Mos e refuzo hipotezën zero H0 Refuzo H0 dhe prano H1
10
19
Testimi për mesataren aritmetike: Mostra e madhe , Devijimi standard i populacionit
është i njohur
Kur bëjmë testimin për mesataren e populacionit nga mostra e madhe dhe kur dihet devijimi standard i populacionit testi statistikor jepet me këtë formulë:
( , .334)( )/ n
mX X X
Z ose T si ne liber fqg X
20
Shembull 1
Procesori i firmës për prodhimin e keçapit tregon shenjën se një shishe keçap ka 16 ons (28,35gr) keçap. Një mostër prej 36 shisheve është matur dhe ka dalë se pesha mesatare është 16.12 ons keçap me devijim standard 0.5 ons. Me nivel të signifikancës 0.05 a është procesi jashtë kontrollit?
9-13
11
21
Shembull 1 vazhdim
Hapi 1: Formulimi i hipotezës zero dhe hipotezës alternative
Hapi 2: Niveli i signifikancës 0.05, kurse probabiliteti është 0,95, testi është dyanësor, ɑ/2=0.05/2=0.025, vlera kritike është 1.96
Hapi 3: Vendosja e rregullës së marrjes së vendimit:
Hapi 4: Llogaritja e testit statistikor Z:
Hapi 5: Vendimi për H0 : H0 nuk refuzohet sepse vlera e Z=+ 1.44 është më e vogël se vlera kritike 1.96
0 1: 16 : 16H H
0 1.96H refuzohet nese z
[16.12 16]/[0.5/ 36] 1.44z
9-14
Shembull : Testi dyanësor Kutia me drithëra në
mesatare a përmban 368
gram drithëra? Një
mostër e rastësishme prej
25 kutive ka treguar
peshën = 372.5.
Kompania ka specifikuar
që të jetë 15 gram.
Testoni në nivelin e
signifikanës a 0.05.
368 gm.
H0: 368
H1: 368
X
12
372.5 3681.50
1525
XZ
n
a = 0.05
n = 25
Vlera kritike: ±1.96
Zgjedhja e shembullit: Testi
dyanësor/Qasja e vlerës kritike
Testi statistikor:
Vendimi:
Konkluzion:
Mos refuzo në nivelin a = .05
Nuk ka të dhëna që mesatarja e vërtetë nuk është 368 Z 0 1.96
.025
Refuzo
-1.96
.025
H0: 368
H1: 368
Z=1.50
Zgjedhja përmes vlerës së P
(Vlera e p = 0.1336) (a = 0.05)
Mos refuzo.
0 1.50
Z
Refuzo
a = 0.05
1.96
Vlera e p = 2 x 0.0668
Testi statistikor 1.50 është në “regjionin Mos refuzo “
Refuzo
13
Testi njëanësor Z për mesatare
( dihet )
Supozimet
Populacioni ka shpërndarje normale
Nëse nuk është normal kërkohen mostra më të mëdha
Vetëm Hipoteza zero ka shenjën ose
Z Testi statistikor
/
X
X
X XZ
n
Shembull : Testi njëanësor
Kutia me drithëra në
mesatare a përmban më
shumë se 368 gram
drithëra? Një mostër e
rastësishme prej 25
kutive ka treguar peshën
= 372.5. Kompania ka
specifikuar që të jetë
15 gram. Testoni në
nivelin e signifikanës a
0.05
368 gm.
H0: 368
H1: > 368
X
14
Gjetja e Vlerës kritike: Njëra anë
Z .04 .06
1.6 0.4495 .4505 .4515
1.7 .4591 .4599 .4608
1.8 .4671 .4678 .4686
.4738 .4750
Z 0 1.645
.05
1.9 .4744
Pjesë e Tabeles se distribucionit standard normal
a = 0.05?
a = .05
Vlera kritike =
1.645
.45
1Z
Zgjedhja e shembullit : Testi një
anësor
a = 0.5
n = 25
Vlera kritike: 1.645
Test Statistic:
Vendimi:
Konkluzion:
Mos refuzo në nivelin a = .05
Nuk ka evidencë se mesatarja e vërtetë është më e madhe se 368 gr.
Z 0 1.645
.05
Refuzo
H0: 368
H1: > 368 372.5 368
1.5015 / 25
XZ
n
1.50
15
Zgjedhja përmes vlerës së P
Z 0 1.50
Vlera eP =0.0668
Vlera e Z për statistikën e
mostrës
Nga tabela Z: shiko te
1.50 për të gjetur 0.4332
Përdorë
hipotezën
alternative për
të gjetur
drejtimin e
regjionit të
refuzimit.
0.5000
- 0.4332
.0668
Vlera e p është P(Z 1.50) = 0.0668
© 2002 Prentice-Hall, Inc.
Zgjedhja përmes vlerës së P (vazhdim)
0 1.50
Z
Refuzo
(Vlera e P = 0.0668) (a = 0.05)
Mos refuzo.
Vlera e p = 0.0668
a = 0.05
Testi statistikor 1.50 është në “Regjionin Mos refuzo”
1.645
16
31
Testimi i hipotezave për barabarësinë e Dy mesatareve të populacionit
9-20
Supozojmë parametrat për dy populacione janë :
Për mostra të mëdha testi statistikor është:
1 2 1 2, , , dhe
1 2
2 2
1 2
1 2
X Xz
n n
32
Testimi i hipotezave për barabarësinë e Dy mesatareve të populacionit
Kur nuk dihen mirëpo madhësia e mostrës janë më të mëdha ose të babrabarta me 30, testi statistikor është:
1 2 dhe
1 2 dhe n n
1 2
2 2
1 2
1 2
X Xz
n n
9-21
17
Shembull
33
Samsung Nokia
Mesatarja - 9.7h 10.0h
Varianca - σ2 (1h )2 (1.2h )2
Madhësia e mostrës (n)
25 16
X
Supozojmë se ekziston dyshimi se bateritë e telefonave mobil te firmave Samsung dhe Nokia nuk janë të kualitetit të njëjtë në kuptimin e qëndrueshmërisë. Për të verifikuar këtë supozim kemi marrë mostra nga dy llojet e baterive. Të dhënat e fituara janë dhenë në tabelën vijuese” Testoni se a është i arsyeshëm supozimi, në nivelin e signifikancës 0.01
34
Zgjedhja përmes vlerës kritike vazhdim
Hapi 1:
Hapi 2 Niveli i signifikancës 0,01, testi dyanësor, α/2= 0.01/2=0.005, Vlera akritike 2.58
Hapi 3: Zgjedhim testin Z;
Hapi 4: Rregulla e vendosjes: Refuzo H0 nëse z >2.58
Hapi 5: Meqenëse Z = -0.88<2.58, H0 nuk refuzohet. Nuk ka arsye që të dyshojmë se bateritë e telefonave Samsung dhe Nokia janë të kualitetit të ndryshëm.
0 1 2 1 1 2: :H H
9-23
1 2
2 2
1 2
1 2
9.7 10.00.88
1 1.2
25 16
X Xz
n n
18
Zgjidhje përmes vlerës së probabilitetit (Vlera p)
Për z=-0.88, sipërfaqja nën lakoren normale është 0,3106. Vlera e probabilitetit 0.5- 0,3106=0.1894
Meqe testi është dyanësor atëherë vlera e p është 2x0.1894=0.3788
p=0.3788; α=0.01
Meqenëse p> α, atëherë nuk e refuzojmë hipotezën zero, dhe konkludojme se nuk ka dallime ne kualitetin e baterive në mes të Samsung dhe Nokia.
35
36
Testet në lidhje me proporcionin/përpjesën
Proporcioni: Pjesa ose përqindja që tregon pjesën e populacionit ose mostrës që është me interes të veçantë për të trajtuar.
Proporcioni/përpjesa i mostrës
numri i rasteve te volitshme
numri i elementeve te mostresm
mp
n
9-24
19
37
Testi statistikor për testimin e një proporcioni të populacionit
9-25
-
m
m
p pz
p q
n
p proporcioni i populacionit
p proporcioni i mostres
38
Shembull
Në të kaluarën , 15% e kërkesave të rregullta për ndihma bamirësie ka rezultuar në kontribute financiare. Një letër e re e kërkesave është përpiluar dhe është dërguar te 200 njerëz dhe 45 prej tyre janë përgjigjur duke ofruar ndihmë financiare. Me nivel të signifikancës 0.05, gjegjësisht me probabilitet 0,95 a mund të përfundohet se letra e re është më efektive?
9-26
20
39
Shembull vazhdim
Hapi 1:
Hapi 2: Niveli i signifikancës 0,05,
Hapi 3: H0 refuzohet kur z>1.645
Hapi 4:
Hapi 5: Meqë z = 2.97 >1.645, H0 Refuzohet. Letra
e re ka qenë më efektive
0 1: 0.15 : 0.15H P H P
450.15
200 2.97(0.15)(0.85)
200
z
9-27
40
Testi që përfshin dallimet në mes të
proporcioneve e dy populacioneve
9-28
Testi statistikor në këtë rast është :
1 2
1 1 2 2
1 2
p pz
p q p q
n n
21
41
Shembull
Shembulli nga libri , fq. 340
Një ndërmarrje ka blerë bateri elektrike prej dy prodhuesve. Nga prodhuesi i parë janë zgjedhur 220 bateri dhe është konstatuar se 35 janë defekte. Nga prodhuesi i dytë janë zgjedhur 260 bateri dhe 26 prej tyre janë me defekt. Me probabilitet 90% ose nivel të signifikancës 10% të vërtetohet se a ekziston dallim i rëndësishëm në cilësinë e baterive në mes të këtyre dy prodhuesve.
9-30
42
shembull 5 vazhdim
Hapi 1:
Hapi 2: Niveli i signifikances 0,10, probabiliteti 90%, vlera kritike është 1.645
Hapi 3: H0 refuzohet nëse z >1.645
Hapi 4:
0 1 1 1 1 1: :H P P H P P
0,159 0.101,916
0.159 0,841 0,10 0,90
220 260
z
9-31
22
43
Shembull 5 vazhdim
Hapi 5: H0 nuk pranohet dhe hidhet poshtë, dmth. pranohet hipoteza alternative se dallimi në mes të kualitetit të baterive në mes të dy prodhuesve është signifikant.
Meqenëse vlera e llogaritur e testit është më e madhe se vlera kritike tabelore hedhet poshtë hipoteza zero. 1,916>1,645.
9-32
Shënim
44
Testi dyanësor Nëse Z<-zɑ/2 ose Z>zɑ/2 refuzo hipotezën zero dhe prano hipotezën alternative….
Testi një anësor i majtë Nëse Z<-zɑ refuzo hipotezën zero…..
Testi një anësor i djathtë Nëse Z>zɑ refuzo hipotezën zero…