BAB 1 PENGENALAN 1.0 Pendahuluan Mengukur pencapaian

BAB 1

PENGENALAN

1.0 Pendahuluan

Mengukur pencapaian pelajar sering kali dijalankan dalam penyelidikan

pendidikan. Pencapaian pelajar adalah sebahagian aspek utama dalam

pendidikan. Semasa aktiviti pengajaran pembelajaran berlangsung di bilik

darjah, aktiviti menguji dan menilai menyumbangkan berperanan penting

dalam mengenal pasti masalah yang dihadapi oleh pelajar. Tambahan

pula penilaian yang dijalankan semasa sesi pengajaran berjalan dapat

memberikan maklum balas terhadap prosedur pengajaran yang dilaksana di

bilik darjah. Dengan itu, guru dapat mengubah suai aktiviti pengajaran

mengikut keperluan kumpulan pelajar atau berdasarkan keperluan individu.

Ujian ialah satu alat atau instrumen bagi membekalkan maklumat kepada

para pelajar, guru-guru mahupun ibu bapa. Di samping membekalkan

maklumat prestasi pencapaian pelajar, ujian yang dijalankan dapat

membekalkan maklumat tentang kelemahan dan masalah yang timbul

daripada aktiviti pengajaran dan pembelajaran yang berlangsung.

Manakala ibu bapa mendapatkan maklum balas tentang perkembangan,

kemajuan dan prestasi anak-anak mereka dalam pelajaran di sekolah

2

melalui laporan kemajuan yang diterima hasil daripada ujian yang

dijalankan.

Selain itu, ujian yang standard juga berperanan untuk meramal

pencapaian pelajar dalam sesuatu persekitaran bagi tujuan menjelaskan

proses pengajaran yang berlangsung dalam bilik darjah. Oleh itu, ujian

perlu ditadbir dan dibentuk dengan perancangan yang terperinci bagi

membekalkan maklumat yang tepat kepada pihak terbabit. Jika ujian

berkenaan gagal dalam menepati matlamat dan prosedur yang seharusnya

diikuti, adalah dibimbangi maklumat yang diperolehi juga adalah tidak

tepat dan diragui. Dengan itu, dan tindakan lanjut yang diambil juga adalah

tidak bersesuaian dengan keperluan sebenar.

1.1 Latar belakang Kajian

Pembentukan instrumen ujian bukanlah sesuatu yang mudah. Seseorang

guru atau jawatankuasa penggubal instrumen ujian perlu merancang

dengan teliti item-item yang bakal digubal agar benar-benar memenuhi

objektif ujian yang telah ditetapkan. Instrumen yang digubal tidak boleh

dibentuk dengan sewenang-wenangnya, tetapi memerlukan perancangan

yang cukup teliti. Perancangan yang teliti dan sistematik akan memastikan

ujian yang dihasilkan berkenaan benar-benar berkesan dan memberikan

maklumat yang tepat kepada pelajar, guru dan pihak yang berkenaan.

Dalam hal ini, Gronlund (1977) memberikan penekanan bahawa:

3

The key effective achievement testing is careful

planning. It provides greater assurance that our test will

measure relevant learning outcomes…measure a

representative sample of the desired behaviours…and

provide dependable information on which to base

instructional decisions….Test planning involves the

identification and specification of precisely what is to

be measure (hlm.18).

Seperti dalam proses merancang pengajaran dan pembelajaran, penentuan

objektif yang tepat dapat membantu dalam membina instrumen yang baik

dan berkesan. Objektif ujian juga dapat menentukan tindakan yang bakal

diambil apabila ujian dibentuk kelak. Dalam hal ini, tindakan yang perlu

diberikan perhatian termasuklah dari aspek tujuan ujian berkenaan

dilaksanakan, jenis ujian, jangka masa ujian, bentuk item dan sebagainya.

Dengan itu, perancangan perlulah dibuat dengan teliti supaya penyediaan

item dapat dilaksanakan baik. Ia memerlukan masa yang panjang,

kesabaran yang tinggi, kebolehan dan kemahiran tentang penulisan item

dan pengetahuan tentang kandungan yang akan dijadikan bahan ujian.

Beberapa aspek perlu diberikan perhatian oleh penggubal item dalam

membentuk item berkenaan. Antaranya ialah:

i. memudahkan pemahaman pelajar yang memiliki pelbagai peringkat

kebolehan;

ii. mengelakkan kekaburan sesetengah perkataan yang digunakan;

iii. memastikan tidak terdapat petunjuk atau klu dalam item yang

dibina; dan

4

iv. memastikan item berkenaan mempunyai kaitan dengan pengetahuan

kemahiran yang penting.

Selain perkara yang dinyatakan tersebut, aspek bahasa yang digunakan

dalam penggubalan item pengujian juga perlu diberikan perhatian. Dalam

konteks ini, isu pengajaran Matematik dan Sains dengan menggunakan

Bahasa Inggeris sebagai bahasa pengantar adalah menarik untuk

diperkatakan. Pembelajaran sesuatu mata pelajaran dalam bahasa yang

bukan bahasa pertama bagi kebanyakan pelajar telah dilaksanakan di

kebanyakan negara bagi tujuan tertentu seperti tujuan politik,

pembangunan teknologi dan pembangunan sistem komunikasi. Dalam hal

ini, Malaysia turut tidak terkecuali dalam melaksanakan dasar tersebut.

Pelaksanaan dasar pengajaran Matematik dan Sains dalam Bahasa Inggeris

timbul apabila Kementerian Pendidikan Malaysia mengeluarkan Surat

Pekeliling Ikhtisas Bil. 11/2002 yang mewajibkan pengajaran kedua-dua

mata pelajaran berkenaan dalam Bahasa Inggeris bermula pada tahun 2003

bagi pelajar Tahun Satu di Sekolah Kebangsaan (SK) dan Sekolah Rendah

Jenis Kebangsaan Tamil (SRJKT) dan pada peringkat Tingkatan Satu di

Sekolah Menengah (SM). Menjelang tahun 2008 semua pengajaran dan

pembelajaran serta peperiksaan bagi kedua-dua mata pelajaran berkenaan

akan menggunakan Bahasa Inggeris sepenuhnya.

5

Sebelum pelaksanaan dasar ini, sistem pendidikan negara telah melalui

sejarah yang panjang dalam perkembangan bahasa pengantar. Sebelum

merdeka sistem persekolahan yang berbentuk vernakular telah

menggunakan bahasa pengantar mengikut jenis sekolah milik kaum

tertentu. Namun, selepas kemerdekaan Malaysia, penggunaan Bahasa

Melayu sebagai bahasa pengantar utama sekolah rendah mula

dilaksanakan sejak tahun 1970. Kemudian Bahasa Melayu dilaksanakan

sebagai bahasa pengantar utama di sekolah menengah pada tahun 1976

dan pada peringkat pengajian tinggi atau universiti pada tahun 1983.

Dengan itu, Bahasa Melayu sudah lama mendapat tempat dalam

perkembangan pendidikan dan menjadi bahasa penyebaran ilmu

pengetahuan lebih daripada 30 tahun. Dalam tempoh tersebut tidak kurang

dari 5.4 juta lepasan peringkat Sijil Pelajaran Malaysia (SPM) dengan

sebahagiannya telah melanjutkan ke peringkat pengajian tinggi dan

menjadi penggerak pembangunan negara dalam pelbagai bidang.

Perkembangan yang berlaku sejak akhir-akhir ini telah menimbulkan

kegusaran dan polemik di kalangan masyarakat khususnya para ibu bapa,

guru-guru, badan-badan bukan kerajaan (NGO) pertubuhan politik dan

sebagainya. Pelbagai pihak memberikan reaksi yang berbeza-beza sama

ada positif mahupun negatif. Namun, kebanyakan reaksi masyarakat

memperlihatkan rasa bimbang akan penguasaan dan pencapaian anak-anak

mereka dalam kedua-dua mata pelajaran berkenaan akan merosot. Begitu

6

juga dengan para guru menghadapi cabaran baru bagi menyampaikan

pengajaran dan pembelajaran dalam bahasa Inggeris di samping turut

bimbang dengan pencapaian pelajar-pelajar mereka. Sementara bagi NGO

dan pertubuhan politik, pelaksanaan dasar ini dikhuatiri akan menghakis

peranan Bahasa Melayu yang sudah lama dilaksanakan sebagai bahasa

ilmu pengetahuan (Awang Sariyan, 2003).

Kajian tentang aspek penilaian atau pengujian sesuatu mata pelajaran

dalam bahasa Inggeris sebagai bahasa kedua mempunyai pertalian dengan

latar belakang bahasa mereka dan kecekapan berbahasa Inggeris. Ini

memberikan kesan kepada aspek pengajaran dan penilaian di kalangan

pelajar yang belajar dalam bahasa Inggeris. Menurut Abedi (2004) pelajar

yang belajar sesuatu mata pelajaran dalam bahasa Inggeris menunjukkan

pencapaian yang rendah berbanding pelajar yang bahasa ibundanya

bahasa Inggeris. Kajian beliau juga menunjukkan bahawa wujud jurang

yang luas antara kedua-dua kumpulan pelajar berkenaan. Malah kajian

juga menunjukkan bahawa bahasa yang kompleks dalam item pengujian

dapat mengurangkan aspek kesahan dan kebolehpercayaan ujian

pencapaian khususnya kepada pelajar yang belajar dalam bahasa yang

bukan bahasa pertamanya (Abedi, 2002; Abedi & Leon, 1999; Abedi, Leon

& Mirocha, 2003, Abedi & Lord, 2001, Abedi, Lord, Hofstetter & Baker,

2000).

7

Sementara kajian yang dijalankan oleh Nor Hashimah Jamaluddin (2004)

pensyarah Universiti Kebangsaan Malaysia pula menunjukkan

ketidaksediaan pelajar belajar sains dan matematik dalam bahasa Inggeris.

Dapatan kajiannya menunjukkan 75 peratus pelajar tidak bersetuju sains

dan matematik diajar dalam bahasa Inggeris. 71 peratus meminati sains

dan matematik kerana diajar dalam bahasa Melayu dan 70 peratus yakin

akan cemerlang dalam sains dan matematik jika disampaikan dalam bahasa

Melayu. Kajian ke atas guru yang dijalankan oleh Dewan Bahasa dan

Pustaka - Universiti Kebangsaan Malaysia (UKM) (2004) di 242 buah

sekolah menunjukkan bahawa guru tidak bersedia untuk mengajar kedua-

dua mata pelajaran berkenaan dalam bahasa Inggeris.

Berdasarkan perkembangan tersebut, semua pihak khususnya guru-guru

dan pihak penggubal item penilaian perlu memikirkan kesan perubahan

bahasa sebagai medium pengajaran dan penilaian kepada para-pelajar serta

faktor lain yang mempengaruhi pencapaian pelajar, di samping mencari

jalan penyelesaian atau alternatif yang boleh dipercayai dalam membantu

meningkatkan pencapaian para pelajar dalam peperiksaan.

1.2 Penyataan Masalah

Pelaksanaan pengajaran matematik dan sains dalam bahasa Inggeris dalam

konteks negara Malaysia seperti yang tercatat dalam Surat Pekeliling

Ikhtisas Bil. 11/2002 bertujuan membolehkan pelajar mengakses maklumat

8

yang berkaitan melalui pelbagai media supaya mereka mampu menguasai

ilmu sains dan matematik dengan lebih berdaya saing pada peringkat

antara bangsa. Di samping itu, pengajaran dalam bahasa tersebut juga

diharapkan dapat melahirkan generasi yang kukuh dalam penggunaan

bahasa Inggeris. Serentak pelaksanaan pengajaran dalam bahasa Inggeris

bagi kedua mata pelajaran berkenaan membawa implikasi kepada

pelaksanaan pengujian mata pelajaran berkenaan yang turut dilaksanakan

dalam bahasa Inggeris. Keadaan ini menimbulkan persoalan dari aspek

kebolehpercayaan dan ketunggalan dimensi instrumen berkenaan.

Penilaian yang baik seharusnya boleh dipercayai (Abu Bakar Nordin,

1986). Pelaksanaan pengajaran dan penilaian matematik dalam bahasa

Inggeris telah membangkitkan isu dalam masyarakat. Dalam hal ini,

Awang Sariyan (2003) menegaskan bahawa pelaksanaan dasar ini

merupakan suatu malapetaka besar terhadap peradaban Melayu. Implikasi

negatif terutama kepada pelajar luar bandar khususnya masyarakat Melayu

yang masih jauh ketinggalan dalam pelbagai aspek. Ini berlaku apabila

para pelajar berhadapan dengan masalah untuk memindahkan konsep-

konsep sains dan matematik daripada bahasa asing ke dalam bahasa ibunda

dalam keadaan pelajar berkenaan tidak atau belum menguasai bahasa

asing tersebut (Awang Sariyan, 2003). Malah pelaksanaan ini juga

bertentangan dengan pandangan dengan Donim & Silva (1994) yang

berpendapat bahawa penilaian yang baik seharusnya menilai pengetahuan

9

murid dalam bahasa ibunda mereka bagi membolehkan murid bebas

memberikan jawapan berdasarkan pengetahuan dan pemahaman terhadap

sesuatu perkara dengan lebih baik.

Kajian Alderson (1984), Farreant & Segalowitz (1982) dan Segalowitz

(1982) menjelaskan bahawa membaca dalam bahasa kedua adalah lebih

sukar dan lebih lambat berbanding bahasa pertama. Pelajar-pelajar perlu

menguasai terlebih dahulu bahasa kedua berkenaan dari aspek kemahiran

membaca dan pengetahuan bahasa kedua. Apabila pengetahuan diuji

dalam bahasa kedua, murid perlu mendapatkan sebanyak mungkin aspek

leksikal dan struktur ayat dalam bahasa kedua dan mengaitkan dengan

struktur makna sebagai satu wacana (Donim & Silva, 1994). Keadaan ini

akan menyumbang kepada ralat pengukuran yang boleh mempengaruhi

skor pencapaian pelajar-pelajar (Alias Baba,1997).

Sebaliknya kajian yang dijalankan oleh Abedi, Lord dan Plummer (1997)

serta Margeret (2005) menunjukkan bahawa penggunaan soalan alternatif

dalam bahasa Inggeris yang dipermudahkan daripada soalan asal dapat

membantu pelajar mendapat pencapaian dengan lebih baik tanpa

mengurangkan integriti ujian yang dilaksanakan. Ini juga selaras dengan

prinsip ketunggalan dimensi yang ditekankan dalam teori pengujian yang

menekankan kepada aspek (kandungan) yang ingin diuji bukan aspek

kemahiran bahasa pelajar. Dengan itu, dasar yang dilaksanakan oleh

10

kerajaan ini masih boleh dilaksanakan. Sementara mekanisme item ujian

berkenaan perlulah diubah suai bagi memudahkan pemahaman pelajar

agar faktor bahasa bukan menjadi faktor utama yang mempengaruhi

pencapaian pelajar.

Di samping itu, facet yang menyumbang kepada ralat pengukuran dan

faktor lain seperti sikap terhadap mata pelajaran yang mempengaruhi skor

pencapaian pelajar juga harus dikaji. Dalam hal ini, Maree (1997)

berpendapat ada sebilangan pelajar yang mempunyai sikap positif

terhadap matematik yang menunjukkan pencapaian yang rendah dan ada

yang mempunyai sikap yang negatif menunjukkan pencapaian yang tinggi.

Bagi menjawab persoalan ini, satu kajian yang praktik dengan

menggunakan soalan alternatif yang diubah suai wajar dijalankan bagi

mengetahui keberkesanan item berkenaan. Teori Generalizabiliti dapat

digunakan bagi menjelaskan dependability skor pencapaian ujian

Matematik menggunakan item ujian berkenaan dan seterusnya mengenal

pasti faktor utama dalam mempengaruhi pencapaian matematik KBSM

Tingkatan 2 serentak perubahan bahasa pengantar dari bahasa Melayu

kepada bahasa Inggeris. Dengan memahami aspek ini, maka pencapaian

pelajar dapat ditingkatkan dan ralat pengukuran yang wujud dapat

dikurangkan (Eason, 1989).

11

1.3 Objektif Kajian

Pada umumnya, kajian ini bertujuan untuk mendapatkan maklumat

tentang faktor yang paling menyumbang kepada wujudnya ralat

pengukuran dalam instrumen pengujian mata pelajaran matematik KBSM

Tingkatan 2. Secara lebih khusus lagi kajian ini bertujuan untuk:

- Menentukan dependability skor ujian pencapaian mata pelajaran

matematik KBSM Tingkatan 2 mengikut Teori Generalizabiliti.

- Menjelaskan bagaimana pemboleh ubah terpilih mempengaruhi

skor ujian pencapaian matematik KBSM Tingkatan 2.

1.4 Soalan Kajian

Berdasarkan tujuan kajian yang telah ditetapkan, kajian cuba menjawab

soalan seperti di bawah:

1. Apakah dependability skor ujian pencapaian mata pelajaran

matematik KBSM Tingkatan 2 mengikut Teori Generalizabiliti?

2. Apakah sumbangan setiap facet terhadap varians ralat mengikut

Teori Generalizabiliti?

3. Sejauhmanakah model cadangan fit data pemboleh ubah bebas dan

pembolehubah bersandar?

4. Adakah model yang dicadangkan fit dengan jantina lelaki dan

perempuan?

12

5. Adakah model yang dicadangkan fit dengan lokasi sekolah bandar

dan luar bandar?

6. Adakah terdapat kesan faktor peramal dalam model yang

dicadangkan terhadap skor pencapaian secara signifikan?

1.5 Hipotesis Kajian

Berdasarkan objektif kajian, penyelidik mempertimbangkan beberapa

hipotesis bagi menjawab soalan kajian.

1. Model cadangan fit data kajian. (Ho : Σ(θ) – S = 0)

2. Tidak ada perbezaan yang signifikan antara pencapaian lelaki dan

perempuan. (Ho : Σ(θ) – S = 0)

3. Tidak ada perbezaan yang signifikan antara pencapaian pelajar

sekolah di bandar dan luar bandar. (Ho : Σ(θ) – S = 0)

4. Tidak ada kesan yang signifikan antara faktor peramal dengan

pencapaian. (Ho : β = 0)

13

1.6 Kerangka Teori

Kerangka teori yang diguna sebagai landasan kepada kajian ini adalah

berdasarkan kombinasi dua teori utama. Pertama berdasarkan Teori

Generalizabiliti dan Teori Pemerolehan Bahasa Kedua.

1.6.1 Teori Generalizabiliti

Pengukuran ialah proses mengenal pasti nilai (angka atau kategori) objek

pengukuran yang ditunjukkan dalam bentuk kuantiti atau kualiti trait. Nilai

ditentukan secara sistematik berdasarkan prosedur atau peraturan yang

telah ditetapkan. Sesetengah perancangan berkenaan dikenali sebagai

model skala. Dalam penggunaan yang mudah, skala digunakan untuk

merumuskan secara menyeluruh dan berterusan tentang kedudukan objek

pengukuran dengan jelas (Nunnally, 1978). Misalnya, pembaris yang

digunakan sebagai skala untuk mengukur ketinggian tiga orang pelajar di

dalam sesebuah bilik darjah.

Matlamat pengukuran ialah untuk mengenal pasti perbezaan sebenar

individu dalam sesuatu perkara yang telah ditentukan. Penentuan nilai

berkenaan disebut juga sebagai skor dapatan (observed scored), yang

mencerminkan posisi secara relatif dan membabitkan pemangkatan objek

pengukuran secara menyeluruh berdasarkan skala tertentu. Banyak perkara

dalam trait yang diukur boleh mempengaruhi skor. Pengaruh yang tidak

dapat ditentukan dalam skala berkenaan dikenali sebagai ralat pengukuran.

14

Skor benar (true score) ialah skor yang diperolehi oleh seseorang pelajar

dengan menggunakan sesuatu instrumen pengukuran tanpa sebarang ralat.

Apabila ralat pengukuran kecil, skor dapatan memberikan maklum balas

yang tepat kepada skor benar. Sebaliknya jika besar ralat pengukuran,

maka skor sebenar mungkin tidak tepat. Ini menunjukkan bahawa, skor

yang diperolehi itu tidak mencerminkan kebolehan sebenar seseorang

pelajar. Kesimpulannya skor yang diperolehi adalah terdiri daripada skor

yang menggambarkan kebolehan dan skor ralat (Alias Baba, 1997).

Apabila ingin mengukur sesuatu perkara, alat yang digunakan bagi

membuat ukuran amat penting bagi memastikan pengukuran dibuat adalah

tepat. Menggunakan alat atau instrumen yang betul untuk mengukur

bermakna instrumen itu sah dan dapat mengukur tanpa sebarang

perubahan nilai. Dalam hal ini, Teori Generalizabiliti (Generalizability

Theory[GT]) dijadikan landasan untuk menentukan kebolehpercayaan

instrumen yang digunakan serta dependability skor pencapaian yang

diperolehi.

Dalam menghuraikan sumber ralat pengukuran dalam sesuatu ujian,

terdapat beberapa teori utama yang mendasarinya seperti Teori Ujian

Klasik (CTT) dan Teori Generalizabiliti (GT). CTT telah mencadangkan

struktur model ringkas yang bagi menunjukkan hubungan antara skor

dapatan, skor benar dan ralat penskoran. Model berkenaan ditunjukkan

seperti di sebelah.

15

X = T + e

Di mana:

X = skor dapatan

T = skor benar

e = ralat pengukuran (skor ralat)

Skor ralat diperolehi daripada beberapa faktor yang mungkin

mempengaruhi seseorang pelajar dalam menduduki peperiksaan atau ujian.

Misalnya kesihatan pelajar (person) yang terjejas mungkin menyebabkan

skor yang diperolehi dalam sesuatu ujian itu terjejas daripada yang

sepatutnya diperolehi. Ralat juga berlaku apabila instrumen ujian (item)

berkenaan mungkin mengelirukan pelajar yang menyebabkan mereka

sukar memahami kehendak soalan. Selain itu, aspek pentadbiran juga

boleh menyebabkan wujudnya ralat. Ini termasuklah dari segi tempoh

ujian (occasion), lokasi, sikap pengawas dan suasana dewan atau tempat

ujian dijalankan. Sementara, pemeriksa pula boleh menyumbang kepada

ralat penskoran. Misalnya pemeriksa yang teliti dan pemeriksa yang

kurang teliti sudah pasti memberikan perbezaan skor yang ketara dan

kurang tepat.

Semua aspek yang dijelaskan tersebut ini merupakan faktor yang

mempengaruhi sesuatu skor yang diperolehi pelajar yang disebut sebagai

ralat. Skor ralat mungkin wujud secara sistematik atau secara rawak. Ralat

16

yang wujud secara sistematik seperti menggunakan alat penimbang yang

tidak tepat, misalnya berlaku kerosakan pada keanjalan alat penimbang

memungkinkan timbangan yang diperolehi menjadi sentiasa tidak tepat.

Ralat yang berlaku secara rawak tidak menunjukkan perubahan secara

sistematik. Ia mungkin bernilai sama ada positif atau negatif. Sekiranya

ukuran dijalankan beberapa kali jumlah ralat akan menjadi kosong.

Taburan ralat juga dianggap sebagai normal dan tidak mempunyai korelasi

antara satu sama lain dengan skor benar (Alias Baba, 1997).

Nilai kebolehpercayaan sesuatu instrumen berkenaan boleh diperolehi

dengan menggunakan beberapa kaedah seperti:

i) Kaedah Bahagi Dua. Ujian diberikan kepada murid dan skor yang

diperolehi dijumlahkan kepada dua kumpulan bagi dikorelasikan.

Korelasi yang tinggi menunjukkan kedua-dua bahagian ujian

memberikan petunjuk bahawa wujud persamaan bagi isi sampel

ujian yang diuji.

Kebolehpercayaan = 2 X kebolehpercayaan ½ ujian

Seluruh ujian 1 + kebolehpercayaan ½ ujian

ii) Kaedah Kuder-Richardson. Kebolehpercayaan ini ditentukan

dengan menggunakan formula yang dicadangkan oleh Kuder-

Richardson, iaitu KR20 dan KR21.

17

KR20 = k 1 – Σp(1 – p)

k – 1 s²

dengan k = bilangan item ujian

p = nisbah murid yang menjawab item dengan betul

(1 – p) = nisbah murid yang item menjawab dengan salah

s² = varian skor ujian

Σ = jumlah

KR21 = k 1 – m(k – m)

k – 1 ks²

dengan k = bilangan item ujian

m = min skor ujian

s² = varian skor ujian

Pekali Alfa (α). Formula ini sama dengan formula KR20, kecuali Σp

digantikan dengan Σs²i apabila s²i ialah varian bagi satu item.

α = k 1 – Σs²i

k – 1 s²x

Sementara GT adalah kesinambungan CTT yang mengakui wujudnya

kepelbagaian bentuk dan sumber ralat yang mungkin mempengaruhi

pengukuran (Brennan 1992). Kepelbagaian aspek yang mungkin

mempengaruhi skor dapatan seperti rater, bentuk ujian, atau tempoh ujian

yang boleh dikenal pasti secara terpisah dalam ralat secara rawak

18

mengikut GT. GT mampu untuk menilai dengan jelas sumber ralat dalam

skor dapatan secara signifikan. Sejauh mana sampel skor dapatan

diperolehi dengan baik bergantung kepada sesetengah keadaan yang

boleh disimpulkan kepada keadaan lain mengikut jumlah varian skor

dapatan yang relatif berdasarkan situasi pengukuran yang khusus.

GT mengandaikan bahawa setiap pemerhatian adalah secara rawak dan

sampel adalah bebas daripada pengukuran yang ingin dijalankan

(Cronvach, Gleser, Nanda & Rajaratnam, 1972). Berbeza dengan CTT,

model pengukuran skor dapatan adalah seperti berikut.

X = T + C+ e

Di mana:

X = skor dapatan

T = skor benar

C = keadaan yang mempengaruhi secara khusus

e = ralat dan sumber ralat yang lain.

Skor benar ialah sebuah konsep secara purata bagi skor individu yang

mungkin daripada pelbagai kombinasi keadaan dengan menggunakan

model skala yang dapat dilaksanakan. Misalnya, model pengukuran hanya

melibatkan penilai (C) yang berbeza mungkin disebabkan oleh perbezaan

rater. Skor benar ialah min skor dapatan yang diberikan oleh rater secara

19

tidak terbatas. Dalam hal ini, GT cuba menyimpulkan pengukuran

daripada sampel yang diperhatikan yang diperolehi daripada rater yang

berbeza.

Model pengukuran, X = T + C + e boleh ditulis semula secara linear

seperti di bawa.

Xpr = µ + µp + µr + µpr + e

di mana µ pengaruh populasi yang dikaji;

µp ialah pengaruh murid p(µp – µ);

µr ialah pengaruh rater r (µr – µ);

µpr ialah mungkin interaksi pengaruh rater r x murid p

(Xpr - µp - µr + µ);

e ialah ralat secara dari sumber ralat lain.

GT menghasilkan “generalizability coefficient” yang sama seperti

koeffesien kebolehpercayaan dalam CTT. Ia lebih memberikan penekanan

kepada magnitud pelbagai sumber ralat. Tambahan pula GT mengambil

kira dua aspek dalam sesuatu kajian, iaitu generalizability (G) studies

(kajian genelizabiliti) dan decision (D) studies (kajian membuat

keputusan). Kajian generalizabiliti dibentuk bagi mentafsir sejumlah

sumber ralat yang mungkin wujud sementara kajian membuat keputusan

cuba mengukur bagi tujuan membuat keputusan tertentu. Sebagai contoh,

20

Kajian generalizabiliti dibentuk bagi mengesahkan bahawa komponen

varian bagi individu, item, rater, dan hubungan secara berpasangan bagi

semua aspek berkenaan sebagai ralat tambahan secara rawak. Sedangkan

kajian membuat keputusan hanya memerlukan ukuran yang boleh

dipercayai bagi membuat sesuatu keputusan. Ia mungkin munasabah

menggunakan kajian membuat keputusan yang melibatkan hanya satu

rater. Maklumat daripada kajian generalizabiliti boleh digunakan bagi

merangka bentuk kajian membuat keputusan apabila mendapatkan tahap

kebolehpercayaan pengukuran yang diperlukan bagi tujuan membuat

keputusan.

GT adalah berkaitan dengan objek pengukuran (kebiasaannya individu)

dan ketepatan skor bagi membenarkan dibuat kesimpulan yang menyeluruh

terhadap tingkah laku pelajar dalam menjelaskan situasi yang sebenar.

Skor yang diperolehi mungkin boleh dipecahkan kepada beberapa kadar

varian dari setiap keadaan pengukuran atau facet. Dengan itu, penyelidik

dapat mengetahui sumber ralat seperti item ujian, tempoh ujian, atau rater

(guru sebagai pengukur) yang disebut sebagai facet. Setiap rater dinilai

bagi setiap respons yang diberikan bagi setiap item. Jika empat rater maka

akan mewakili empat facet rater dan lima item mewakili lima facet item

berkenaan. Biasanya facet dipengaruhi secara rawak kerana diandaikan

bahawa situasi pengujian yang mengambil sampel secara rawak bagi

setiap facet atau keadaan yang diwakili “telah bersilih ganti” dan menjadi

21

sebahagian daripada keadaan sebenar. Misalnya, empat rater sama ada

sampel secara rawak telah memungkinkan rater yang layak sebahagiannya

telah “bersilih ganti” daripada rater yang layak.

Umumnya facet dan objek pengukuran adalah faktor kepada reka bentuk

analisis faktorial. Dengan itu, semua faktor berkenaan adalah secara rawak.

GT pada dasarnya adalah komponen varian bagi menaksir masalah.

Tempoh ujian adalah facet yang tetap (dan masih boleh diubah suai).

Analisis statistik yang digunakan dalam GT ialah analisis varian

(ANOVA). Penggunaan ANOVA sebagai kaedah analisis membolehkan

penyelidik mendapat min kuasa dua (mean square) bagi setiap sumber

varian. Daripada maklumat berkenaan, penyelidik boleh mengenal pasti

sejauh mana varian dikira bagi setiap sumber. Keadaan ini menunjukkan

bahawa ralat pengukuran telah diminimumkan.

GT menghasilkan dua perbezaan koeffisien kebolehpercayaan. Koeffisien

G dalam GT menyamai koeffisien dalam CTT bagi rujukan norma atau

keputusan relatif. Dalam membuat keputusan relatif, kepelbagaian ralat

rawak adalah jumlah komponen varian bagi ralat dan semua komponen

berinteraksi dengan pelajar (person). Misalnya, skor ujian matematik boleh

disusun daripada skor terendah ke skor tertinggi. Skor berkenaan boleh

diinterpretasi berdasarkan pencapaian keseluhan pelajar dalam kumpulan

berkenaan. Ini disebut sebagai keputusan relatif (relative decision).

22

Nilai koeffisien phi adalah koeffisien kebolehpercayaan bagi rujukan

kriteria atau keputusan mutlak. Bagi keputusan mutlak yang dilakukan,

kepelbagaian ralat rawak adalah jumlah semua sumber ralat tetapi tidak

melibatkan komponen varian pelajar. Dalam erti kata yang lain,

pengukuran yang digunakan berdasarkan indeks yang mutlak tanpa

berdasarkan pencapaian pelajar lain. Misalnya ujian kederasan menaip

berdasarkan jumlah perkataan setiap minit yang tidak bergantung kepada

kederasan menaip pelajar lain. Jika penetapan telah dibuat menetapkan

skor yang mesti diperolehi pelajar ialah 80% bagi mewakili dalam sesuatu

tugas tertentu, maka jika pelajar berkenaan gagal memperolehi skor 80%,

dia tetap tidak akan terpilih walaupun skornya tertinggi dalam kumpulan

berkenaan. Dalam hal ini, keputusan yang diambil disebut sebagai

keputusan mutlak (absolute decisions).

Dalam GT skor benar ialah skor purata bagi objek pengukuran (individu)

dengan mengambil kira semua kombinasi. Skor benar ialah pengukuran

ideal yang tidak mungkin diperolehi (Shavelson & Webb, 1991).

Sebaliknya skor ujian masih boleh diperolehi. Skor ujian ialah purata

sampel rawak bagi keadaan setiap facet. Daripada skor ujian ini

dianggarkan skor benar. Apabila tingkah laku diperhati berdasarkan

tempoh masa (masa sebagai facet) andaian penting dalam GT ialah

perbezaan individu adalah tetap mengatasi masa.

23

Justeru, maklumat yang diperolehi dari kajian generalizabiliti

membolehkan penyelidik menjalankan kajian membuat keputusan. Kajian

membuat keputusan membenarkan setiap individu dimanipulasikan bagi

mengenal pasti cara yang lebih efektif dan efisien untuk menggunakan

instrumen berkenaan (Eason, 1989). Sebagai contoh, dengan memanipulasi

item, penyelidik boleh mengenal pasti jumlah item yang sesuai bagi

mendapatkan data yang lengkap. Sebagai alternatif, penyelidik juga boleh

mengenal pasti bilangan rater yang diperlukan untuk mendapatkan data

yang lengkap. GT banyak membantu penyelidik kerana dapat mengenal

pasti sumber ralat dengan khusus. Apabila dapat mengenal pasti sumber

ralat, maka sesuatu pengukuran itu dapat dikurangkan ralat pengukurannya

(Eason, 1989).

Secara ringkasnya kelebihan GT berbanding CTT ialah:

i. GT mempertimbangkan pelbagai sumber ralat secara serentak dan

menjadi model yang lebih tepat dalam situasi pengukuran

berbanding hanya kaedah satu model sumber ralat dalam CTT yang

hanya mempertimbangkan satu sumber ralat pengukuran bagi

membuat keputusan yang relatif.

ii. GT melengkapkan pendekatan secara bersepadu bagi menunjukkan

kepelbagaian sumber ralat. Kaedah yang sama boleh diaplikasikan

sama ada sumber ralat berkenaan adalah item, tempoh masa,

bentuk atau rater. Tambahan pula GT dapat mempertimbangkan

24

sebarang perbezaan sumber ralat dengan melibatkan kombinasi

mana-mana facet berkenaan.

iii. GT menghasilkan pendekatan yang lebih bersepadu bagi menaksir

kebolehpercayaan pengukuran yang dijalankan sama ada bagi

tujuan membuat keputusan yang relatif (ujian rujukan norma) atau

keputusan sebenar (ujian rujukan kriteria). Keputusan yang relatif

adalah berdasarkan kedudukan individu dalam kumpulan

berbanding keputusan sebenar. Keputusan sebenar adalah

berdasarkan skor benar tanpa sebarang perbandingan dengan skor

individu yang lain dalam kumpulan (Ary, Jacob & Razavieh, 1996).

iv. GT tidak membuat andaian tentang perbandingan sumber ralat

tetapi menganggar secara serentak kepelbagaian sumber ralat

termasuklah interaksi antara ralat-ralat berkenaan (Thomson 1992,

1991). CTT mengandaikan bahawa wujud sumber ralat secara

bertindihan dan tidak mempertimbangkan kemungkinan bahawa

ralat berkenaan menghasilkan ralat pengukuran yang lain atau ralat

tambahan.

Sebagai kesimpulannya, GT menghasilkan alternatif kepada CTT dalam

mendapatkan koefesien kebolehpercayaan dalam pelbagai situasi. GT turut

memiliki kelebihan yang jelas dalam mengenal pasti sumber ralat.

Misalnya, satu item boleh dinilai oleh dua rater. Rater adalah sumber ralat

dan kebolehpercayaan antara rater adalah sama ada dua atau lebih rater.

25

GT turut menghasilkan teori dan kaedah untuk membantu menghasilkan

kebolehpercayaan pengukuran bagi tujuan proses membuat keputusan.

Di samping itu, GT juga memperkembangkan model pengujian agar lebih

sensitif bagi membuktikan bahawa pelajar yang mempunyai kemahiran

bilingual mungkin amat berbeza merentasi bahasa (Bialystok, 1997;

Solano-Flores & Li, 2006; Valdes & Figueroa, 1994). Malah GT juga

membenarkan pemeriksaan sejumlah kepelbagaian skor kesan daripada

interaksi pelajar (objek pengukuran) dan facet (sumber ralat pengukuran)

seperti item, rater, tempoh ujian, dan bentuk arahan (Baxter, Shavelson,

Goldman & Pine, 1992); Ruiz-Primo & Shavelson, 1996; Webb,

Schlackman & Sugrue, 2000).

1.6.2 Teori Pemerolehan Bahasa Kedua

Pemerolehan bahasa kedua berbeza daripada pemerolehan bahasa pertama.

Ia diperolehi bukan daripada pemerolehan tetapi melalui pembelajaran

yang lebih formal dan memerlukan banyak melakukan latih tubi serta

pengulangan bagi menjadikan satu tabiat (Kamaruddin Haji Husin, 1998).

Moulton (1961) telah menyenaraikan beberapa prinsip dalam mengajar

bahasa kedua, iaitu (1) kemahiran lisan (2) penggunaaan ajukan dan

menghafal (3) melatih bentuk-bentuk bahasa agar menjadi satu tabiat,

dan (4) penggunaan bahan bantuan seperti peralatan makmal bahasa dan

mewujudkan rancangan pembelajaran kendiri.

26

Krashen (1987) menyenaraikan lima hipotesis utama berhubung

pemerolehan bahasa kedua, iaitu:

- Hipotesis pemerolehan-pembelajaran. Terdapat dua sistem bebas

dalam prestasi bahasa kedua, iaitu sistem perolehan dan sistem

pembelajaran. Sistem perolehan melibatkan proses yang tidak disedari

yang sering terjadi kepada kanak-kanak sedang membesar yang

memperolehi bahasa pertama melalui aktiviti berkomunikasi dengan

orang lain. Sistem pembelajaran pula adalah hasil daripada bentuk

pengajaran yang formal dan berlaku secara sedar. Misalnya

pengetahuan tentang tatabahasa yang diperolehi melalui pembelajaran.

Bagi Krashen (1987) pemerolehan lebih penting daripada

pembelajaran.

- Hipotesisis pengawasan. Hipotesis ini menerangkan hubungan antara

pemerolehan dan pembelajaran. Fungsi pengawasan dapat dilihat

melalui hasil pembelajaran tatabahasa yang diaplikasikan oleh individu

berkenaan. Menurut Krashen lagi, sistem pemerolehan bermula dengan

ujaran. Manakala sistem pembelajaran berfungsi sebagai peraturan

yang mengawal atau memperbetulkan. Tindakan pengawasan berlaku

dalam bentuk perancangan, mengedit dan membetulkan. Keadaan ini

menunjukkan bahawa pembelajaran secara sedar adalah terhad dalam

prestasi pembelajaran bahasa kedua. Krashen turut menegaskan bahawa

27

terdapat perbezaan individu di kalangan pelajar bahasa dalam

mengawas bahasa mereka.

- Hipotesis aturan natural. Hipotesis ini berdasarkan dapatan kajian

(Dulay & Burt, 1974; Fathman, 1975; Makino, 1980 seperti yang

dipetik dalam Krashen, 1987) yang mendapati bahawa pemerolehan

struktur tatabahasa adalah berdasarkan aturan yang natural atau

semulajadi. Bagi bahasa pertama, sesetangah struktur tatabahasa

cenderung diperolehi pada peringkat awal dan sesetengah yang lain

lebih lewat.

- Hipotesis input. Hipotesis ini cuba menjelaskan cara pelajar

memperolehi bahasa kedua. Hipotesis input hanya berkaitan dengan

“pemerolehan” bukan “pembelajaran”. Berdasarkan hipotesis ini

pelajar akan memperbaiki bahasa mereka sepanjang proses menerima

input bahasa kedua. Dalam hal ini, tidak semua pelajar akan berada

pada tahap penguasaan bahasa yang sama pada waktu yang sama.

- Hipotesis saringan efektif. Terdapat sejumlah pemboleh ubah yang

efektif yang berperanan mempengaruhi bahasa kedua, seperti motivasi,

keyakinan diri dan kebimbangan. Menurut Krashen, pelajar yang

mempunyai motivasi, berkeyakinan diri, imej yang baik, dan kurang

rasa kebimbangan adalah lebih bersedia untuk menguasai bahasa kedua

dengan baik. Dalam erti kata yang lain, pelajar yang memiliki sikap

yang positif akan lebih baik dalam menguasai bahasa kedua.

28

Dengan memahami proses pemerolehan bahasa akan membantu seseorang

guru dalam mengembangkan strategi pengajaran dan penilaian serta

membantu perkembangan bahasa pelajar dengan berterusan. Pengetahuan

tentang teori ini akan membantu guru secara langsung untuk menguasai

kandungan sesuatu mata pelajaran kepada pelajar yang menggunakan

bahasa Inggeris sebagai bahasa kedua. Ini penting kepada sekolah atau

daerah terpencil yang kekurangan bahan sokongan dalam membantu

pengajaran dan pembelajaran.

1.7 Kerangka Konseptual

Kerangka teori berfungsi sebagai landasan bagi penerangan dan

panduan dalam menyelesaikan sesuatu masalah kajian (Littlejohn, 1995).

Teori yang digunakan dalam kajian ini ialah GT yang menjelaskan sejauh

mana sumbangan setiap facet yang dikaji menyumbang kepada wujudnya

ralat dalam sesuatu pengukuran dan seterusnya menganggar dependability

skor pencapaian yang diperolehi oleh pelajar-pelajar. Sementara Teori

Pemerolehan Bahasa Kedua memberikan penekanan kepada kepentingan

aspek kemahiran bahasa dalam menguasai bidang ilmu lain.

Kajian-kajian lepas (Bassette, 2004;Bershinky, 1993; Ma & Kishor, 1997;

TIMMS 2003) juga menunjukkan bahawa terdapat beberapa sumber

menyumbang kepada pencapaian pelajar seperti faktor demografi dan

29

sikap menyumbang kepada pencapaian pelajar. Sementara kajian AAbbeeddii

((22000022)),, AAbbeeddii && LLeeoonn ((11999999)),, AAbbeeddii,, LLeeoonn && MMiirroocchhaa ((22000033)) AAbbeeddii &&

LLoorrdd ((22000011)) ddaann AAbbeeddii,, LLoorrdd,, HHooffsstteetttteerr && BBaakkeerr (( 22000000)) mmeennuunnjjuukkkkaann

bbaahhaawwaa aassppeekk llaattaarr bbeellaakkaanngg bbaahhaassaa mmeemmppuunnyyaaii ppeennggaarruuhh yyaanngg kkuuaatt

tteerrhhaaddaapp ppeennccaappaaiiaann mmaatteemmaattiikk..

Selain itu, Begle (1979) menyarankan beberapa kategori pemboleh ubah

yang boleh dikaitkan dengan pencapaian matematik seperti pemboleh ubah

kognitif, afektif dan non-intellective. Pemboleh ubah kognitif termasuklah

pencapaian matematik, kecerdasan IQ dan pemikiran logik. Manakala

pemboleh ubah afektif merujuk kepada sikap pelajar termasuklah dari segi

kebimbangan, perasaan dan kepercayaan. Pemboleh ubah non-intellective

pula berkaitan dengan jantina serta lokasi sekolah. Sikap terhadap mata

pelajaran penting bagi seseorang pelajar untuk mengambilnya sebagai satu

mata pelajaran dan ia amat memberikan kesan kepada skor pencapaian

(Bassette, 2004). Bershinky (1993) berpendapat sikap dan demografi

adalah sumber yang turut mempengaruhi pencapaian matematik pelajar.

Ma & Kishor (1997) dan Mc Leod (1992) berpendapat bahawa sikap amat

penting dalam menentukan pencapaian pelajar dalam mata pelajaran

matematik. Ini kerana murid yang mempunyai sikap yang positif terhadap

matematik akan berusaha dengan lebih berbanding dengan murid yang

bersikap negatif. (Ma & Kishor, 1997).

30

Daripada kerangka teori serta kajian lepas (Abedi, 2002; Abedi & Leon,

1999; Abedi, Leon & Mirocha, 2003; Abedi & Lord, 2001; Abedi, Lord,

Hofstetter & Baker, 2000; Bassette, 2004; Begle, 1979; Bershinky,1993;

dan Ma & Kishor, 1997) jelas menunjukkan bahawa aspek demografi

seperti jantina dan lokasi sekolah, latar belakang bahasa dan sikap terhadap

bahasa Inggeris dan sikap terhadap matematik boleh mempengaruhi

pencapaian matematik. Sehubungan itu, disimpulkan aspek berkenaan

sebagai kerangka konseptual kajian seperti rajah di sebelah.

Rajah 1.1 Kerangka Konseptual Kajian

Rajah 1.1 menggambarkan beberapa pemboleh ubah yang boleh

menyumbang kepada pencapaian skor ujian responden seperti item

SIKAP

- BI

- Matematik

LTR.BLKG BAHASA

- kemahiran BI

- gred BI UPSR

ITEM UJIAN

- asal

- ubah suai

DEMOGRAFI

- jantina

- lokasi sekolah

SKOR UJIAN

31

pengujian yang digunakan (item asal dan item yang diubah suai), sikap

pelajar (sikap terhadap matematik dan sikap terhadap Bahasa Inggeris),

latar belakang bahasa (kemahiran bahasa Inggeris responden dang red

Bahasa Inggeris dalam peperiksaan UPSR) serta aspek demografi pelajar

(jantina dan lokasi sekolah). Di samping kesan pemboleh ubah berkenaan

terhadap skor ujian, pengaruh aspek demografi dan sikap pelajar terhadap

mata pelajaran juga mungkin menyumbang kepada aspek latar belakang

bahasa responden.

1.8 Model Kajian

Satu model telah dicadangkan dalam memberikan penjelasan tentang

perhubungan antara pemboleh ubah – pemboleh ubah yang dikaji.

Model yang dicadangkan ini dirangka dan dibentuk dengan berasaskan

kerangka teori dan kerangka konsep yang telah dibincangkan. Model

berkenaan menggunakan rajah jalur (path diagram) yang memungkinkan

dapat menjelaskan pencapaian ujian matematik KBSM Tingkatan 2 dalam

bahasa Inggeris. Pemboleh ubah yang dikaji ialah:

- kemahiran bahasa

- gred bahasa

- sikap terhadap bahasa Inggeris

- sikap terhadap matematik

- skor ujian matematik

32

Kemahiran BI

AttBI

AttMat

SkorMat

Gred BI UPSR

Dalam model yang dicadangkan ini dianalisis memperlihatkan

perhubungan antara pemboleh ubah-pemboleh ubah berkenaan dalam

menjelaskan pencapaian ujian matematik menggunakan teknik analisis

SEM. Rajah 1.2 di sebelah memaparkan model yang dicadangkan.

Rajah 1.2 Model Cadangan

1.9 Justifikasi Kajian

Kajian ini menggunakan soalan berbentuk penyelesaian masalah

matematik kerana ia lebih banyak menggunakan aspek bahasa. Kajian

SEAMEO RECSAM (seperti yang dipetik dalam Ibrahim, 1997)

menunjukkan bahawa 71 peratus ralat wujud dalam soalan berbentuk

33

penyelesaian masalah. Keadaan ini menunjukkan bahawa pelajar-pelajar di

Malaysia menanggung kesukaran dalam memahami sesuatu masalah

berbanding dengan kemahiran mengira serta murid-murid mungkin terlalu

ditekankan kemahiran asas matematik berbanding bahasa matematik.

1.9.1 Justifikasi Pemboleh Ubah yang Dipilih dalam Model Kajian

Aspek yang dijangka dapat meramal pencapaian skor ujian matematik

KBSM Tingkatan 2 dalam kajian ini dipilih berdasarkan kombinasi cetusan

Krashen (1987) dan kajian TIMMS (2003) yang berkaitan dengan aspek

penilaian dalam bahasa kedua, iaitu dengan mengambil kira aspek

kemahiran bahasa dan sikap pelajar terhadap mata pelajaran.

Kemahiran bahasa adalah aspek penting bagi pelajar dalam menguasai

sesuatu ilmu. Seandainya kemahiran bahasa yang terhad akan

menyukarkan seseorang pelajar untuk memahami dan menguasai sesuatu

bidang ilmu. Apabila kemahiran bahasa dapat dikuasai dengan baik maka

pencapaian pelajar dalam bahasa berkenaan juga akan meningkat.

Keadaan ini disebabkan pengetahuan dan kemahiran yang baik dalam

bahasa kedua akan memudahkan pelajar dapat memahami kehendak soalan

dan menjawab dengan lebih baik (Adnan Khamis,1985; Benson, 1991;

Abu-Rabia, 1996).

34

Sikap terhadap bahasa pula penting dalam mempengaruhi pencapaian

akademik pelajar. Ini didasarkan kepada kajian Gardner (1959) yang

mendapati sikap pelajar terhadap bahasa kedua menjadi aspek penting

dalam bentuk penilaian yang dijalankan dalam bahasa berkenaan. Banyak

kajian (Bershinky, 1993; Mc Leod, 1992; Ma & Kishor, 1997;

Arsaythamby, 2005) menunjukkan bahawa sikap adalah pemboleh ubah

penting dalam menentukan pencapaian pelajar dalam sesuatu mata

pelajaran, khususnya mata pelajaran matematik.

1.10 Signifikan Kajian

Aspek penilaian merupakan aspek yang penting dalam dunia pendidikan

dengan memberikan maklumat kepada pelbagai pihak. Maklumat

terpenting yang merupakan salah satu petunjuk kejayaan usaha ke arah ini

ialah pencapaian akademik pelajar. Sistem peperiksaan yang diamalkan

dalam konteks negara Malaysia merupakan suatu mekanisme untuk

membekalkan maklum balas kepada pembuat dasar dalam menentukan

sistem penilaian yang diamalkan berada pada landasan yang betul atau

sebaliknya ke arah mencapai matlamat Falsafah Pendidikan Kebangsaan.

Di samping itu, perancangan yang menyeluruh dan lebih sistematik dengan

fakta yang ada daripada kajian yang dijalankan dapat menggalakkan

pelajar untuk mencapai kecemerlangan akademik. Penyesuaian mungkin

diperlukan dalam membina item penilaian agar lebih membantu pelajar

35

dalam memahami kehendak soalan dan seterusnya memberikan jawapan

kepada soalan yang ditanya.

Kajian ini penting bagi mengetahui akan sikap pelajar terhadap mata

pelajaran matematik sama ada dalam bahasa Melayu mahupun bahasa

Inggeris. Dengan itu pihak Kementerian Pelajaran dapat merancang serta

memberikan perhatian berdasarkan maklum balas yang diterima.

Dapatan kajian ini juga dapat membantu pihak Lembaga Peperiksaan

Malaysia untuk mengemaskinikan aspek penggubalan item penilaian bagi

semua peperiksaan umum yang dikendalikan pihak terbabit. Dengan itu,

pihak berkenaan dapat merancang pembentukan item agar memenuhi

kriteria penilaian dan memberikan maklumat yang tepat berhubung

pencapaian pelajar.

Akhir sekali kajian ini diharapkan dapat membekalkan maklumat tentang

isu-isu dan cadangan-cadangan dalam menyelesaikan masalah berkaitan

pelaksanaan penilaian dalam bagi mata pelajaran matematik. Dapatan

kajian ini juga diharapkan dapat menjadi asas kepada kajian-kajian

selanjutnya berhubung pembentukan item penilaian. Dengan itu, dapat

memastikan sistem peperiksaan kita sentiasa terkini dan membekalkan

maklumat yang benar dan berfaedah kepada semua pihak.

36

1.11 Skop dan Batasan

Kajian ini menumpukan kepada mendapatkan maklumat serta mengenal

pasti tentang komponen varian yang memberikan pengaruh yang besar

dalam ralat pengukuran serta hubungan sikap terhadap mata pelajaran dan

kebolehan bahasa, jantina serta lokasi sekolah terhadap pencapaian

akademik mereka. Responden yang terlibat dalam kajian ini hanya pelajar

tingkatan dua di sekolah menengah kebangsaan (SMK) di negeri Kedah

Darulaman. Sekolah yang dipilih dalam kajian ini adalah terdiri daripada

sekolah di bandar dan di luar bandar seperti yang telah dikategorikan oleh

Jabatan Pelajaran Kedah.

Dapatan kajian ini turut membataskan kepada penyelidikan bagi mata

pelajaran Matematik sahaja. Ini bermakna pencapaian pelajar dalam mata

pelajaran lain tidak diambil kira.

Kandungan ujian dalam kajian ini hanya terhad kepada topik awal dalam

Sukatan Pelajaran Matematik Tingkatan 2. Yakni menyentuh tiga aspek

utama (Nombor, Bentuk dan Ruang, Perkaitan) kandungan matematik

KBSM dengan meliputi hanya topik asas nombor, pecahan, ukuran asas,

nombor bulat, bulatan, algebra dan statistik. Tumpuan bentuk soalan

dalam kajian ini pula menjurus kepada masalah matematik yang berkaitan

dengan ayat matematik. Ini kerana soalan berbentuk demikian tidak boleh

37

terus diselesaikan tetapi memerlukan proses menukarkan terlebih dahulu

kepada soalan kira-kira. Kegagalan dalam menukarkan masalah matematik

kepada kira-kira akan menyebabkan kesilapan dalam memberikan jawapan

(Ibrahim Md Noh, 1997). Di samping itu, tumpuan diberikan kepada

masalah matematik kerana soalan dalam bentuk begini begitu ketara dalam

kurikulum pendidikan, yakni lebih 70% soalan soalan adalah jenis

penyelesaian masalah.

Model yang diterima dalam meramal pencapaian ujian matematik dalam

kajian ini adalah hasil analisis model yang dicadangkan. Pengubahsuaian

dijalankan menggunakan data sampel yang sama yang memungkinkan ia

adalah unik untuk data berkenaan sahaja. Namun, ia masih dapat diatasi

melalui melalui penggunaan sampel pelajar lokasi sekolah yang berlainan

di samping penggunaan analisis Bootsrapping bagi mengelakkan kesan

keunikkan data dalam model tersebut.

Model yang diterima dengan menggunakan indeks statistiks dalam kajian

ini tidak menafikan terdapatnya model alternatif lain yang boleh

dipertimbangkan bagi menjelaskan pencapaian dalam ujian matematik. Ini

kerana mungkin terdapat implikasi daripada model berkenaan yang boleh

sahaja betul tetapi tidak berguna (Arbuckle & Wothke, 1999).

38

1.12 Definisi Operasional

Bagi menjelaskan penyelidikan ini, beberapa istilah disenaraikan untuk

didefinisikan dalam bahagian definisi operasional ini.

Pengujian

Satu instrumen atau prosedur yang sistematik bagi melihat atau

menerangkan satu atau lebih ciri-ciri pelajar dengan menggunakan skala

nombor atau skema pengelasan (Nitko, 2000).

Penilaian

Satu proses membuat pengadilan atau pertimbangan tentang nilai daripada

perubahan tingkah laku pelajar serta memberikan gred. Penilaian berlaku

setelah maklumat dikumpul, dianalisis dan dipertimbangkan. Penilaian

menjadi asas kepada membuat sesuatu berhubung keputusan yang akan

diambil (Airasian, 2005).

Kebolehpercayaan

Kebolehpercayaan didefinisikan sebagai sejauh mana skor yang diperolehi

oleh pelajar atau murid dalam kajian ini tidak berubah sekiranya murid

berkenaan mengambil ujian yang sama beberapa kali dalam tempoh

tertentu. Kebolehpercayaan yang tinggi bermaksud komponen skor benar

adalah tinggi dari komponen skor ralat (Alias Baba, 1997).

39

Varian

Varian didefinisikan sebagai min (purata) kepada jumlah kuasa dua skor

sisihan daripada min (Iran Herman, 2004).

Varian Ralat

Varian ralat ialah kebolehubahan skor kerana kesilapan yang mungkin

berlaku dalam pengukuran (Alias Baba, 1997).

Ralat Pengukuran

Ralat pengukuran ialah perbezaan antara skor yang diperhati dengan skor

benar (Alias Baba, 1997).

Versi Item Ujian

Bentuk penggubalan item yang digunakan untuk menguji pelajar. Dalam

kajian ini, dua versi yang digunakan, iaitu versi A mengandungi soalan

asal matematik dalam bahasa Inggeris. Versi B ialah soalan asal yang

didiubah suai dengan menggunakan bahasa Inggeris.

Facet

Facet dalam Teori Generalizabiliti didefinisikan sebagai satu sumber

utama yang menyumbang kepada varian. Dalam konteks kajian ini facet

ialah item.

40

Dependability

Depandability merujuk kepada ketepatan dalam mengeneralisasikan skor

yang diperolehi pelajar dalam sesuatu ujian kepada skor purata yang

diperolehi oleh pelajar dalam pelbagai suasana (Shavelson & Webb,

1991). Dalam konteks kajian ini, dependability ialah indeks yang

diperolehi dalam analisis ujian berdasarkan perbezaan individu dan

bilangan item.

Bahasa Kedua

Bahasa kedua yang dipelajari oleh seseorang individu di samping bahasa

ibunda. Bahasa kedua lazimnya adalah bahasa asing yang dipelajari untuk

tujuan-tujuan tertentu (Kamaruddin Haji Husin, 1988). Dalam konteks

kajian ini bahasa kedua ialah bahasa Inggeris.

Pencapaian akademik

Merujuk kepada pencapaian pelajar dalam ujian matematik yang diduduki

oleh responden kajian ini. Skor yang diperolehi daripada ujian yang

ditadbir ini menghasilkan pencapaian akademik pelajar.

Sikap

Merujuk kepada perasaan, pendapat, kepercayaan, penghargaan individu

secara langsung atau tidak langsung yang ditunjukkan melalui tingkah

41

laku terhadap mata pelajaran matematik sama ada positif atau negatif

(Allport, 1967).

1.13 Kesimpulan

Bab ini telah membincangkan latar belakang dan permasalahan kajian

berhubung pelaksanaan penilaian matematik dalam bahasa Inggeris. Di

samping itu, bab ini juga telah menyentuh kerangka teori, kerangka

konseptual, objektif, kepentingan dan skop dan batasan kajian. yang

mendasari kajian ini serta objektif, skop dan batasan kajian.

Documents

BAB 1 PENGENALAN 1.0 Pendahuluan Mengukur pencapaian