STATISTIK PENDIDIKAN EDU5950 SEM1 2013-14 K9 SEM1... · ANALISIS VARIANS (ANOVA) •Pengujian...

Preview:

Citation preview

STATISTIK PENDIDIKAN

EDU5950

SEM1 2013-14

STATISTIK INFERENSI: PENGUJIAN HIPOTESIS BAGI PERBANDINGAN

LEBIH DARIPADA DUA MIN

(UJIAN-F)

Rohani Ahmad Tarmizi -

EDU5950 1

STATISTIK INFERENSI ATAU PENTAKBIRAN (Inferential Statistics)

• Bertujuan untuk menerangkan ciri populasi berdasarkan data yang dikumpul daripada sampel.

• Tujuan ini berkait rapat dengan objektif kajian serta hipotesis atau soalan kajian.

• Membolehkan penyelidik membuat kesimpulan bahawa terdapat “statistik yang signifikan” atau “statistical significance” yang bermaksud boleh diterima pakai dengan meluas, meyakinkan.

LANGKAH PENGUJIAN HIPOTESIS • L1. Nyatakan hipotesis hipotesis statistik/sifar (H0) dan

hipotesis penyelidikan (HA) – BERARAH ATAU TIDAK BERARAH

• L2. Tetapkan aras signifikan, taburan persampelan dan statistik pengujian yang akan digunakan – ARAS ALPHA = 0.01/ 0.05/ 0.10, TABURAN PERSAMPELAN z, t, F, r… STATISTIK PENGUJIAN (z, t, F, r…)

• L3. Tentukan nilai kritikal bagi taburan persampelan yang akan digunakan - RUJUK JADUAL z, t, F, r…

• L4. Kirakan statistik pengujian (tests statistics) bagi taburan persampelan tersebut – RUJUK FORMULA

• L5. Buat keputusan, kesimpulan dan tafsiran.

L1. Nyatakan hipotesis

• Hipotesis penyelidikan –

Terdapat perbezaan yang signifikan antara min tahap kepimpinan pengajaran Pengetua di Sekolah berprestasi tinggi berbanding dengan sekolah Swasta .

• Hipotesis nol/sifar –

Tiada terdapat perbezaan yang signifikan antara min tahap kepimpinan pengajaran Pengetua di sekolah berprestasi tinggi berbanding dengan sekolah Swasta.

L1. Nyatakan hipotesis (dua kumpulan)

• Hipotesis penyelidikan –

Terdapat perbezaan yang signifikan antara tahap kepimpinan pengajaran Pengetua dan GPK1.

• Hipotesis nol/sifar –

Tiada terdapat perbezaan yang signifikan antara tahap kepimpinan pengajaran Pengetua dan GPK1.

HO : µ1 = µ2

HA : µ1 ≠ µ2

HO : µ1 ≥ µ2

HA : µ1 < µ2

HO : µ1 ≤ µ2

HA : µ1 > µ2

1. Nyata hipotesis nol dan penyelidikan.

L2. TETAPKAN ARAS ALPHA = 0.01/ 0.05/ 0.10, TABURAN PERSAMPELAN, STATISTIK PENGUJIAN

• Nilai alpha ditetapkan oleh penyelidik.

• Ia merupakan nilai penetapan bahawa penyelidik akan menerima sebarang ralat semasa membuat keputusan pengujian hipotesis tersebut.

• Ralat yang sekecil-kecilnya ialah 0.01 (1%), 0.05 (5%) atau 0.10(10%).

• Nilai ini juga dipanggil nilai signifikan, aras signifikan, atau aras alpha.

L2. Taburan Persampelan

• Taburan yang bersesuaian dengan analisis yang dijalankan. Ia merupakan model taburan dan mengambil pelbagai bentuk:

– Taburan persampelan min-min, ujian-z (n>30)

– Taburan persampelan min-min, ujian-t (n<30)

– Taburan persampelan perbezaan min-min t bebas

– Taburan persampelan perbezaan min-min t sandar

– Taburan persampelan F atau varians

L3. Nilai Kritikal

• Nilai kritikal adalah nilai yang menjadi sempadan bagi kawasan Ho benar dan Hp benar.

• Nilai ini merupakan nilai dimana penyelidik meletakkan penetapan sama ada cukup bukti untuk menolak Ho (maka boleh menerima Hp) ataupun tidak cukup bukti menolak Ho (menerima Ho).

• Nilai ini bergantung kepada nilai alpha dan arah pengujian hipotesis yang dilakukan.

L4. Nilai Statistik Pengujian

• Ini adalah nilai yang dikira dan dijadikan bukti sama ada hipotesis sifar benar atau salah.

• Jika nilai statistik pengujian masuk dalam kawasan kritikal maka Ho adalah salah, ditolak dan Hp diterima

• Jika nilai statistik pengujian masuk dalam kawasan tak kritikal maka Ho adalah benar, maka terima Ho.

L4. Nilai Statistik Pengujian

Z diuji =

t diuji =

L5. Membuat Keputusan, Kesimpulan dan tafsiran

• Jika nilai statistik pengujian masuk dalam kawasan tak kritikal maka Ho adalah benar, maka terima Ho.

L5. Membuat Keputusan, Kesimpulan dan Tafsiran

• Jika nilai statistik pengujian masuk dalam kawasan kritikal maka Ho adalah tak benar, maka Ho ditolak dan seterusnya, Hp diterima (bermakna ada bukti Hp adalah benar)

UJIAN-t TAK BERSANDAR

• Ujian yang digunakan bagi membanding dua kumpulan yang tidak bersandar atau berkait antara satu sama lain.

• Contohnya, membezakan tahap CGPA, IQ, MOTIVASI antara kumpulan lelaki dan perempuan.

• Kenal pasti p/u tak bersandar dan juga p/u bersandar.

• Hanya terdapat dua kumpulan untuk dibandingkan dalam sesuatu analisis.

Terdapat perbezaan prestasi ujian menaakul selepas eksperimen antara dua kumpulan pelajar yang

mendapat pengajaran secara SCL dengan pengajaran konvensional

S1=2

0

S2=2

5

S3=3

6

..

..

S1=2

8

S2=3

5

S3=4

6

..

..

Kumpulan

KONV

Kumpulan

SCL

4. Kirakan nilai statistik pengujian

sp² = (n1 - 1)s1² + (n2 - 1)s2²

n1 + n2 - 2

Equal variance

formula

t = X1 – X2

sp² sp²

n1 n2 +

n1 adalah bilangan dalam sampel 1

n2 adalah bilangan dalam sampel 2

S1 adalah sisihan piawai bagi sampel 1

S2 adalah sisihan piawai bagi sampel 2

Ujian-t Bersandar (Paired sample t-test)

• Ujian ini digunakan untuk mengkaji perbezaan bagi satu perkara ia itu p/u bersandar antara dua kumpulan ia itu p/u tak bersandar tetapi berkait, berpadanan atau “matched-pair”.

n

s

dt

d

d

4. Kirakan statistik pengujian

Terdapat perbezaan prestasi ujian menaakul sebelum eksperimen berbanding dengan selepas

eksperimen.

S1=2

0

S2=2

5

S3=3

6

..

..

S1=2

8

S2=3

5

S3=4

6

..

..

Sebelum

eksperimen

Selepas

eksperimen

PENGUJIAN HIPOTESIS PERBANDINGAN LEBIH DARIPADA DUA KUMPULAN

ANALISIS VARIANS (ANOVA)

• Pengujian hipotesis ini adalah lanjutan daripada PH perbandingan dua min.

• Ia melibatkan perbandingan lebih daripada dua min ia itu membanding min-min antara tiga, empat, lima atau lebih kumpulan atau subpopulasi.

• Min merupakan asas bagi perbandingan antara kumpulan.

MODEL PENGUJIAN

POPULASI

SUB-POPULASI 1

SUB-POPULASI 2

SUB-POPULASI 3

• Pengujian hipotesis ini telah dikemukakan oleh Sir Ronald Fisher.

• Oleh itu beliau menamakan taburan persampelan yang digunakan sebagai taburan F.

• Taburan persampelan F merupakan taburan varians (perbezaan antara skor-skor bagi kumpulan-kumpulan yang dikaji.)

• Oleh kerana itu pengujian hipotesis ini dipanggil ujian F ataupun ujian ANALISIS VARIANS (Analysis of Variance- ANOVA)

• Bentuk taburan persampelan ini adalah pencong kanan oleh kerana ia bukan taburan min-min tetapi varian-varians.

• Kawasan dikiri menunjukkan bahawa min-min yang dibanding tidak jauh berbeza.

• Manakala dikanan (kawasan kritikal) menunjukkan bahawa min-min yang dibanding adalah jauh berbeza – ia itu “statistically” ataupun “berbeza dengan bererti atau signifikan”.

• Dengan menggunakan nilai kritikal ini kawasan kritikal dapat ditentukan.

• Kawasan kritikal menunjukkan kawasan terdapat bukti bahawa hipotesis sifar (H0) adalah palsu dan hipotesis penyelidikan (Hp/ Ha) adalah benar.

• Jika F uji termasuk dikawasan kritikal maka, “terdapat perbezaan yang signifikan antara min-min kumpulan-kumpulan (sub-populasi) tersebut.

• Seterusnya, buat keputusan, tafsiran dan kesimpulan.

• Statistik pengujian bagi ujian ini adalah F uji atau F ratio Nisbah-F

• Nilai kritikalnya adalah nilai F krit

• Seperti ujian-t, ujian F melibatkan perbandingan min bagi pembolehubah bersandar.

• Setiap kumpulan atau sub-populasi merupakan p/u bebas atau p/u tak bersandar.

• Sebagai contoh, perbandingan min pencapaian antara kumpulan pelajar daripada program Masters Sains BK, PP, dan SS.

• P/u bebas – Program pengajian

• P/u bersandar – min pencapaian

PENGIRAAN NILAI KRITIKAL

• Tetapkan aras signifikan

• Kirakan darjah kebebasan

– Dk antara kumpulan = k-1

– Dk dalam kumpulan = n-k

– k adalah bilangan kumpulan

– n adalah bilangan cerapan

• Carikan nilai kritikal yang sepadan di Jadual F

4. Kirakan nilai statistik pengujian (ANOVA)

F uji = Variansak = SSak / dkak

Variansdk SSdk / dkdk

4. Kirakan nilai statistik pengujian (ANOVA)

1. Kirakan “sum of squares” (SS)

2. Determine degrees of freedom (dk)

a. SSj = ΣX² -

b. SSak = [(∑X1)²/ n1 + (∑X2)²/ n2 + (∑X3)²/ n3 +….]- (∑X)² / n

(ΣX)²

N

c. SSdk = SST - SSB

a. dkak = k - 1

b. dkdk = N- k

c. dkj = N - 1

F uji = SSak / dkak

SSdk / dkdk

• Dengan menggunakan nilaik kritikal ini kawasan kritikal dapat ditentukan.

• Kawasan kritikal menunjukkan kawasan terdapat bukti bahawa hipotesis sifar (H0) adalah palsu dan hipotesis penyelidikan (Hp/ Ha) adalah benar.

• Jika F uji termasuk dikawasan kritikal maka, “terdapat perbezaan yang signifikan antara min-min kumpulan-kumpulan (sub-populasi) tersebut.

• Seterusnya, buat keputusan, tafsiran dan kesimpulan.

Kes 1: Dr. Durraini ingin menentukan sama ada tahap

pengetahuan IT antara guru sekolah bandar, pinggir

bandar dan luar bandar berbeza. Beliau telah memilih

secara rawak satu sekolah yang telah dikategorikan

oleh pihak Kementerian Pendidikan sebagai sekolah

bandar, pinggir bandar dan luar bandar. Daripada

wakil setiap jenis sekolah tersebut beliau telah

mengumpul maklumat tentang aspek IT dalam

pengajaran dan pembelajaran. Salah satu aspek yang

telah dikaji adalah tahap pengetahuan IT. Bagi

mengesahkan perbezaan tahap IT dikalangan guru

yang dikaji, Dr. Durraini telah menjalankan satu ujian

bagi mengukur tahap pengetahuan IT guru-guru

sekolah tersebut.

Nyatakan objektif kajian bagi kes

tersebut.

Nyatakan persoalan kajian bagi kes

tersebut .

Jalankan pengujian hipotesis yang

sesuai.

Bandar

Pinggir

Bandar Luar banadar

x x x

40 33 23

45 39 32

45 51 33

53 40 29

49 42 40

40 25

28

232 245 210

KES 1: DATA

BANDAR PGR BANDAR LUAR BANDAR

X1

2

X1

X2

2

X2

X3

2

X3

40

1600

33

1089

23

529

45

2025

39

1521

32

1024

45

2025

51

2601

33

1089

53

2809

40

1600

29

841

49

2401

42

1764

40

1600

40

1600

25

625

28

784

232

10860

245

10175

210

6492

1: Bentuk hipotesis kajian a. Pembolehubah bersandar : Pengetahuan IT guru b. Pembolehubah tak bersandar : Lokasi sekolah c. Ho : Tidak terdapat perbezaan pengetahuan IT berdasarkan

sekolah yang berbeza lokasi dalam kalangan guru di Hulu Selangor.

Ha : Terdapat perbezaan pengetahuan IT berdasarkan sekolah

yang berbeza lokasi dalam kalangan guru di Hulu Selangor.

Min pengetahuan IT bagi kumpulan bandar = 46.40

Min pengetahuan IT bagi kumpulan pinggir bandar= 40.83

Min pengetahuan IT bagi kumpulan luar bandar = 30.00

2. Tetapkan tahap alpha, taburan persampelan,statistik pengujian

Aras signifikan : α = 0.05

Taburan persampelan : Taburan f Statistik pengujian : F uji (Nisbah F)

dk antara kump = k-1 = 3-1 = 2

dk dalam kump = n-k = 18 – 3 = 15

3. Tetapkan nilai kritikal dan kawasan kritikal

Aras signifikan : α = 0.05

Taburan persampelan : Taburan F Statistik pengujian : F uji (Nisbah F)

Fk=3.68

dk antara kump = k-1 = 3-1 = 2 dk dalam kump = n-k = 18 – 3 = 15 Fk = 3.68

4. Kirakan Statistik Pengujian i. Varians Antara kumpulan

a. SSak

= (∑X1)² + (∑X2)² + (∑X3)² _ (∑X)² n1 n2 n3 n

= (232)² + (245)² + (210)² _ (687)² 5 6 7 18

= 848.47

b. dk ak = k – 1 = 3-1 = 2 c. Varians antara kumpulan = SS ak dk ak

= 848.47 = 424.24 2

ii Varians dalam kumpulan

a. SS dk

= ∑X² _ (∑X)² _ SS ak

n = (27527 – [687] 2 /18) - 848.47 = 1306.5 – 848.47 = 458.03

b. dk dk = n -k = 18- 3 = 15 c. Varians dalam kumpulan = SS dk

dk dk

= 458.24 15 = 30.54

iv. F uji (Nisbah F)

F uji = Varians antara kumpulan

Varians dalam kumpulan

F uji = SSak / dkak

SSdk / dkdk

= 424.24

30.54

F uji = 13.89

5. Keputusan, Tafsiran dan cadangan

F uji berada dalam kawasan Hp benar.

Keputusannya, terima Hp, tolak Ho

Oleh itu, dapatan kajian menunjukkan bahawa terdapat perbezaan tahap pengetahuan IT berdasarkan lokasi sekolah dalam kalangan guru di Hulu Selangor dengan signifikan, F (2, 18) = 13.89, p <0.05

Skor min pengetahuan IT bagi guru sekolah bandar adalah

46.40, guru sekolah pinggir bandar adalah 40.83. manakala

bagi guru sekolah luar bandar adalah 30.00.

Hasil analisis ujian-F menunjukkan bahawa terdapat

perbezaan yang signifikan antara ketiga-tiga min

pengetahuan IT bagi guru daripada sekolah bandar, pinggir

bandar dan luar bandar, F(2,15) = 13.89, p<.05. Dengan itu,

dapatan kajian menunjukkan bahawa pengetahuan IT di

antara guru yang berlainan lokasi sekolah adalah berbeza

dengan signifikan. Analisis deskriptif menunjukkan bahawa

guru dari kumpulan bandar adalah lebih mahir dalam

pengetahuan IT daripada kumpulan yang lain-lain. Dapatan

juga menunjukkan bahawa tahap pengetahuan IT bagi

kumpulan guru luar bandar dan pinggir bandar didapati agak

rendah.Sehubungan dengan itu, dapatan ini menunjukkan

bahawa guru di sekolah luar bandar dan pinggir bandar perlu

diberi perhatian yang lebih dalam aspek meningkatkan

kemahiran IT di kalangan guru.

DUA PERINGKAT ANALISIS – DESKRIPTIF DAN INFERENSI

• Secara deskriptif dihuraikan min-min kumpulan tersebut dan nyatakan terdapat perbezaan min antara kumpulan tersebut jika ada.

• Secara inferensi perbezaan min ini hendaklah disahkan melalui LIMA LANGKAH - PENGUJIAN HIPOTESIS.

• Dengan itu pengkaji dapat menghebahkan bahawa terdapat perbezaan yang signifikan antara min-min tersebut ataupun disebaliknya.

UJIAN ANALISIS VARIANS (ANOVA)

• Ujian yang dikemukakan oleh Sir Ronald Fisher bagi tujuan membanding lebih daripada dua kumpulan.

• Ujian ini juga dipanggil singkatan ANOVA.

• Ada beberapa jenis ANOVA: SIMPLE DAN MULTIPLE.

• Kenal pasti p/u bersandar dan juga p/u tak bersandar bagi setiap analisis.

• Telitikan nilai F dan nilai signifikan bagi F untuk membuat keputusan.

LATIHAN - ANOVA

X1 X2 X3 X4

0 1 4 1

1 3 3 2

3 2 6 2

1 2 3 0

0 2 4 0

x1 x12 x2 x2

2 x3 x32 x4 x4

2

0 0 1 1 4 16 1 1

1 1 3 9 3 3 2 4

3 9 2 4 6 36 2 4

1 1 2 4 3 9 0 0

0 0 2 4 4 16 0 0

5 11 10 22 20 86 5 9

x1 x12 x2 x2

2 x3 x32

2 4 10 100 10 100

3 9 8 64 13 169

7 49 7 49 14 196

2 4 5 25 13 169

6 36 10 100 15 225

N1 =5 N2= 5 N3 =5

20 102 40 338 65 859

4.00 8.00 13.00

sum

mean

Analysis of Variance (ANOVA) can be used to test for the equality of three or more population means.

Data obtained from observational or experimental studies can be used for the analysis.

We want to use the sample results to test the following hypotheses:

H0: 1=2=3=. . . = k

Ha: Not all population means are equal

H0: 1=2=3=. . . = k

Ha: Not all population means are equal

If H0 is rejected, we cannot conclude that all population means are different.

Rejecting H0 means that at least two population means have different values.

SCENARIO 1

Objective: To compare differences between group means

Hypothesis: Is there any significant difference in satisfaction between users of the following three computer operating systems.

The Variables Type Scale

Satisfaction Dependent Interval

Operating systems Independent Nominal

SCENARIO 2

Which of the following data sets indicate differences between the two groups?

Data 1:

A B C

30 21 22

14 28 27

26 14 16

15 31 29

27 16 14

13 12 14

25 27 27

Range

Mean

Data 2:

A B C

13 25 35

12 26 36

15 28 38

14 27 37

15 26 36

12 30 40

17 29 39

Range

Mean

Randomized Design Example

Factor (Training Method) Factor levels

(Treatments)

Type1

Type2

Type3

Experimental

units

(students)

Dependent

variable

(Response)

Analysis of Variance

• Evaluate the Difference Among the Means of

2 or More Populations

– e.g., Several Types of Training, Group Settings, Race

• Assumptions: – Samples are randomly and independently drawn

(This condition must be met.)

– Populations are normally distributed or each sample is large

(F test is robust to moderate departures from normality.)

– Populations have equal variances

Assumption Underlying

One-way ANOVA

1. The dependent variable is normally distributed for each of the populations as defined by the different levels of the factor (independent variables)

2. The variances of the dependent variable are the same for all populations

3. The cases represent random samples from the populations and the scores on the test variable are independent of each other

Why ANOVA?

• We could compare the means, one by one using t-tests for difference of means.

• Problem: each test contains type I error

• The total type I error is where k is the number of means.

• For example, if there are 5 means and you use a=.05, you must make 10 two by two comparisons. Thus, the type I error is 1-(.95)10, which is .95. That is, 95% of the time you will reject the null hypothesis of equal means in favor of the alternative!

k11 a

ANOVA’S Hypothesis

H0: 1 = 2 = 3 = ... = c

•All population means are equal

•No treatment effect (NO variation in means among groups)

H1: not all the k are equal

•At least ONE population mean is different

(Others may be the same!)

•There is treatment effect

Does NOT mean that all the means are different:

1 2 ... c

ANOVA: No Treatment Effect

H0: 1 = 2 = 3 = ... = c

H1: not all the k are equal

The Null

Hypothesis is

True

ANOVA: Treatment Effect Present

H0: 1 = 2 = 3 = ... = c

H1: not all the k are equal

The Null

Hypothesis is

NOT True

Basis for the Comparison

Total variance which is partitioned into Between and Within-group

Total Variance

Within group

Between Group

Calculation of the test statistic for ANOVA

1. Calculate sum of squares

2. Determine degrees of freedom

a. SST = ΣX² -

b. SSB = [(∑X1)²/ n1 + (∑X2)²/ n2 + (∑X3)²/ n3 +….]- (∑X)² / n

(ΣX)²

N

c. SSW = SST - SSB

a. dfB = k - 1

b. dfW = N- k

c. dfT = N - 1

ANOVA Test Statistic

F = SSB / dfB = MSB

SSW / dfW MSW

• MSB is Mean Square Between Groups • MSW is Mean Square Within Groups

One-Way ANOVA Summary Table

• The F-statistic is the ratio of the BETWEEN

estimate of the variance and the WITHIN estimate

of the variance. Therefore, it must always be

positive.

•If the null hypothesis of equal means is true, then

this ratio should be 1.

•The degrees of freedom in the denominator will

typically be large, (n-c) while the degrees of

freedom in the numerator will be small (c-1). The

numerator is expected to be greater than the

denominator.

What to expect?

Test

Hypothesis

Post hoc

comparison

Omega and

Eta squares

1. Write the null and alternative hypothesis

2. Identify the sampling distribution –

alpha level and critical region

4. Calculate the test statistics - F-ratio

3. Determine the critical value

5. Make your decision Interpret your decision

Steps in ANOVA

1. State the null and alternative hypotheses

HO : µ1 = µ2 = µ3

HA : Not all means are equal

2. Identify the sampling distribution, alpha level, critical region, test statistics

3. Determine the critical value

4. Calculate the test statistic

F – ratio

5. Make your decision, conclusion, and implications