Upload
phunganh
View
246
Download
1
Embed Size (px)
Citation preview
BAB 1
PENGENALAN
1.0 Pendahuluan
Mengukur pencapaian pelajar sering kali dijalankan dalam penyelidikan
pendidikan. Pencapaian pelajar adalah sebahagian aspek utama dalam
pendidikan. Semasa aktiviti pengajaran pembelajaran berlangsung di bilik
darjah, aktiviti menguji dan menilai menyumbangkan berperanan penting
dalam mengenal pasti masalah yang dihadapi oleh pelajar. Tambahan
pula penilaian yang dijalankan semasa sesi pengajaran berjalan dapat
memberikan maklum balas terhadap prosedur pengajaran yang dilaksana di
bilik darjah. Dengan itu, guru dapat mengubah suai aktiviti pengajaran
mengikut keperluan kumpulan pelajar atau berdasarkan keperluan individu.
Ujian ialah satu alat atau instrumen bagi membekalkan maklumat kepada
para pelajar, guru-guru mahupun ibu bapa. Di samping membekalkan
maklumat prestasi pencapaian pelajar, ujian yang dijalankan dapat
membekalkan maklumat tentang kelemahan dan masalah yang timbul
daripada aktiviti pengajaran dan pembelajaran yang berlangsung.
Manakala ibu bapa mendapatkan maklum balas tentang perkembangan,
kemajuan dan prestasi anak-anak mereka dalam pelajaran di sekolah
2
melalui laporan kemajuan yang diterima hasil daripada ujian yang
dijalankan.
Selain itu, ujian yang standard juga berperanan untuk meramal
pencapaian pelajar dalam sesuatu persekitaran bagi tujuan menjelaskan
proses pengajaran yang berlangsung dalam bilik darjah. Oleh itu, ujian
perlu ditadbir dan dibentuk dengan perancangan yang terperinci bagi
membekalkan maklumat yang tepat kepada pihak terbabit. Jika ujian
berkenaan gagal dalam menepati matlamat dan prosedur yang seharusnya
diikuti, adalah dibimbangi maklumat yang diperolehi juga adalah tidak
tepat dan diragui. Dengan itu, dan tindakan lanjut yang diambil juga adalah
tidak bersesuaian dengan keperluan sebenar.
1.1 Latar belakang Kajian
Pembentukan instrumen ujian bukanlah sesuatu yang mudah. Seseorang
guru atau jawatankuasa penggubal instrumen ujian perlu merancang
dengan teliti item-item yang bakal digubal agar benar-benar memenuhi
objektif ujian yang telah ditetapkan. Instrumen yang digubal tidak boleh
dibentuk dengan sewenang-wenangnya, tetapi memerlukan perancangan
yang cukup teliti. Perancangan yang teliti dan sistematik akan memastikan
ujian yang dihasilkan berkenaan benar-benar berkesan dan memberikan
maklumat yang tepat kepada pelajar, guru dan pihak yang berkenaan.
Dalam hal ini, Gronlund (1977) memberikan penekanan bahawa:
3
The key effective achievement testing is careful
planning. It provides greater assurance that our test will
measure relevant learning outcomes…measure a
representative sample of the desired behaviours…and
provide dependable information on which to base
instructional decisions….Test planning involves the
identification and specification of precisely what is to
be measure (hlm.18).
Seperti dalam proses merancang pengajaran dan pembelajaran, penentuan
objektif yang tepat dapat membantu dalam membina instrumen yang baik
dan berkesan. Objektif ujian juga dapat menentukan tindakan yang bakal
diambil apabila ujian dibentuk kelak. Dalam hal ini, tindakan yang perlu
diberikan perhatian termasuklah dari aspek tujuan ujian berkenaan
dilaksanakan, jenis ujian, jangka masa ujian, bentuk item dan sebagainya.
Dengan itu, perancangan perlulah dibuat dengan teliti supaya penyediaan
item dapat dilaksanakan baik. Ia memerlukan masa yang panjang,
kesabaran yang tinggi, kebolehan dan kemahiran tentang penulisan item
dan pengetahuan tentang kandungan yang akan dijadikan bahan ujian.
Beberapa aspek perlu diberikan perhatian oleh penggubal item dalam
membentuk item berkenaan. Antaranya ialah:
i. memudahkan pemahaman pelajar yang memiliki pelbagai peringkat
kebolehan;
ii. mengelakkan kekaburan sesetengah perkataan yang digunakan;
iii. memastikan tidak terdapat petunjuk atau klu dalam item yang
dibina; dan
4
iv. memastikan item berkenaan mempunyai kaitan dengan pengetahuan
kemahiran yang penting.
Selain perkara yang dinyatakan tersebut, aspek bahasa yang digunakan
dalam penggubalan item pengujian juga perlu diberikan perhatian. Dalam
konteks ini, isu pengajaran Matematik dan Sains dengan menggunakan
Bahasa Inggeris sebagai bahasa pengantar adalah menarik untuk
diperkatakan. Pembelajaran sesuatu mata pelajaran dalam bahasa yang
bukan bahasa pertama bagi kebanyakan pelajar telah dilaksanakan di
kebanyakan negara bagi tujuan tertentu seperti tujuan politik,
pembangunan teknologi dan pembangunan sistem komunikasi. Dalam hal
ini, Malaysia turut tidak terkecuali dalam melaksanakan dasar tersebut.
Pelaksanaan dasar pengajaran Matematik dan Sains dalam Bahasa Inggeris
timbul apabila Kementerian Pendidikan Malaysia mengeluarkan Surat
Pekeliling Ikhtisas Bil. 11/2002 yang mewajibkan pengajaran kedua-dua
mata pelajaran berkenaan dalam Bahasa Inggeris bermula pada tahun 2003
bagi pelajar Tahun Satu di Sekolah Kebangsaan (SK) dan Sekolah Rendah
Jenis Kebangsaan Tamil (SRJKT) dan pada peringkat Tingkatan Satu di
Sekolah Menengah (SM). Menjelang tahun 2008 semua pengajaran dan
pembelajaran serta peperiksaan bagi kedua-dua mata pelajaran berkenaan
akan menggunakan Bahasa Inggeris sepenuhnya.
5
Sebelum pelaksanaan dasar ini, sistem pendidikan negara telah melalui
sejarah yang panjang dalam perkembangan bahasa pengantar. Sebelum
merdeka sistem persekolahan yang berbentuk vernakular telah
menggunakan bahasa pengantar mengikut jenis sekolah milik kaum
tertentu. Namun, selepas kemerdekaan Malaysia, penggunaan Bahasa
Melayu sebagai bahasa pengantar utama sekolah rendah mula
dilaksanakan sejak tahun 1970. Kemudian Bahasa Melayu dilaksanakan
sebagai bahasa pengantar utama di sekolah menengah pada tahun 1976
dan pada peringkat pengajian tinggi atau universiti pada tahun 1983.
Dengan itu, Bahasa Melayu sudah lama mendapat tempat dalam
perkembangan pendidikan dan menjadi bahasa penyebaran ilmu
pengetahuan lebih daripada 30 tahun. Dalam tempoh tersebut tidak kurang
dari 5.4 juta lepasan peringkat Sijil Pelajaran Malaysia (SPM) dengan
sebahagiannya telah melanjutkan ke peringkat pengajian tinggi dan
menjadi penggerak pembangunan negara dalam pelbagai bidang.
Perkembangan yang berlaku sejak akhir-akhir ini telah menimbulkan
kegusaran dan polemik di kalangan masyarakat khususnya para ibu bapa,
guru-guru, badan-badan bukan kerajaan (NGO) pertubuhan politik dan
sebagainya. Pelbagai pihak memberikan reaksi yang berbeza-beza sama
ada positif mahupun negatif. Namun, kebanyakan reaksi masyarakat
memperlihatkan rasa bimbang akan penguasaan dan pencapaian anak-anak
mereka dalam kedua-dua mata pelajaran berkenaan akan merosot. Begitu
6
juga dengan para guru menghadapi cabaran baru bagi menyampaikan
pengajaran dan pembelajaran dalam bahasa Inggeris di samping turut
bimbang dengan pencapaian pelajar-pelajar mereka. Sementara bagi NGO
dan pertubuhan politik, pelaksanaan dasar ini dikhuatiri akan menghakis
peranan Bahasa Melayu yang sudah lama dilaksanakan sebagai bahasa
ilmu pengetahuan (Awang Sariyan, 2003).
Kajian tentang aspek penilaian atau pengujian sesuatu mata pelajaran
dalam bahasa Inggeris sebagai bahasa kedua mempunyai pertalian dengan
latar belakang bahasa mereka dan kecekapan berbahasa Inggeris. Ini
memberikan kesan kepada aspek pengajaran dan penilaian di kalangan
pelajar yang belajar dalam bahasa Inggeris. Menurut Abedi (2004) pelajar
yang belajar sesuatu mata pelajaran dalam bahasa Inggeris menunjukkan
pencapaian yang rendah berbanding pelajar yang bahasa ibundanya
bahasa Inggeris. Kajian beliau juga menunjukkan bahawa wujud jurang
yang luas antara kedua-dua kumpulan pelajar berkenaan. Malah kajian
juga menunjukkan bahawa bahasa yang kompleks dalam item pengujian
dapat mengurangkan aspek kesahan dan kebolehpercayaan ujian
pencapaian khususnya kepada pelajar yang belajar dalam bahasa yang
bukan bahasa pertamanya (Abedi, 2002; Abedi & Leon, 1999; Abedi, Leon
& Mirocha, 2003, Abedi & Lord, 2001, Abedi, Lord, Hofstetter & Baker,
2000).
7
Sementara kajian yang dijalankan oleh Nor Hashimah Jamaluddin (2004)
pensyarah Universiti Kebangsaan Malaysia pula menunjukkan
ketidaksediaan pelajar belajar sains dan matematik dalam bahasa Inggeris.
Dapatan kajiannya menunjukkan 75 peratus pelajar tidak bersetuju sains
dan matematik diajar dalam bahasa Inggeris. 71 peratus meminati sains
dan matematik kerana diajar dalam bahasa Melayu dan 70 peratus yakin
akan cemerlang dalam sains dan matematik jika disampaikan dalam bahasa
Melayu. Kajian ke atas guru yang dijalankan oleh Dewan Bahasa dan
Pustaka - Universiti Kebangsaan Malaysia (UKM) (2004) di 242 buah
sekolah menunjukkan bahawa guru tidak bersedia untuk mengajar kedua-
dua mata pelajaran berkenaan dalam bahasa Inggeris.
Berdasarkan perkembangan tersebut, semua pihak khususnya guru-guru
dan pihak penggubal item penilaian perlu memikirkan kesan perubahan
bahasa sebagai medium pengajaran dan penilaian kepada para-pelajar serta
faktor lain yang mempengaruhi pencapaian pelajar, di samping mencari
jalan penyelesaian atau alternatif yang boleh dipercayai dalam membantu
meningkatkan pencapaian para pelajar dalam peperiksaan.
1.2 Penyataan Masalah
Pelaksanaan pengajaran matematik dan sains dalam bahasa Inggeris dalam
konteks negara Malaysia seperti yang tercatat dalam Surat Pekeliling
Ikhtisas Bil. 11/2002 bertujuan membolehkan pelajar mengakses maklumat
8
yang berkaitan melalui pelbagai media supaya mereka mampu menguasai
ilmu sains dan matematik dengan lebih berdaya saing pada peringkat
antara bangsa. Di samping itu, pengajaran dalam bahasa tersebut juga
diharapkan dapat melahirkan generasi yang kukuh dalam penggunaan
bahasa Inggeris. Serentak pelaksanaan pengajaran dalam bahasa Inggeris
bagi kedua mata pelajaran berkenaan membawa implikasi kepada
pelaksanaan pengujian mata pelajaran berkenaan yang turut dilaksanakan
dalam bahasa Inggeris. Keadaan ini menimbulkan persoalan dari aspek
kebolehpercayaan dan ketunggalan dimensi instrumen berkenaan.
Penilaian yang baik seharusnya boleh dipercayai (Abu Bakar Nordin,
1986). Pelaksanaan pengajaran dan penilaian matematik dalam bahasa
Inggeris telah membangkitkan isu dalam masyarakat. Dalam hal ini,
Awang Sariyan (2003) menegaskan bahawa pelaksanaan dasar ini
merupakan suatu malapetaka besar terhadap peradaban Melayu. Implikasi
negatif terutama kepada pelajar luar bandar khususnya masyarakat Melayu
yang masih jauh ketinggalan dalam pelbagai aspek. Ini berlaku apabila
para pelajar berhadapan dengan masalah untuk memindahkan konsep-
konsep sains dan matematik daripada bahasa asing ke dalam bahasa ibunda
dalam keadaan pelajar berkenaan tidak atau belum menguasai bahasa
asing tersebut (Awang Sariyan, 2003). Malah pelaksanaan ini juga
bertentangan dengan pandangan dengan Donim & Silva (1994) yang
berpendapat bahawa penilaian yang baik seharusnya menilai pengetahuan
9
murid dalam bahasa ibunda mereka bagi membolehkan murid bebas
memberikan jawapan berdasarkan pengetahuan dan pemahaman terhadap
sesuatu perkara dengan lebih baik.
Kajian Alderson (1984), Farreant & Segalowitz (1982) dan Segalowitz
(1982) menjelaskan bahawa membaca dalam bahasa kedua adalah lebih
sukar dan lebih lambat berbanding bahasa pertama. Pelajar-pelajar perlu
menguasai terlebih dahulu bahasa kedua berkenaan dari aspek kemahiran
membaca dan pengetahuan bahasa kedua. Apabila pengetahuan diuji
dalam bahasa kedua, murid perlu mendapatkan sebanyak mungkin aspek
leksikal dan struktur ayat dalam bahasa kedua dan mengaitkan dengan
struktur makna sebagai satu wacana (Donim & Silva, 1994). Keadaan ini
akan menyumbang kepada ralat pengukuran yang boleh mempengaruhi
skor pencapaian pelajar-pelajar (Alias Baba,1997).
Sebaliknya kajian yang dijalankan oleh Abedi, Lord dan Plummer (1997)
serta Margeret (2005) menunjukkan bahawa penggunaan soalan alternatif
dalam bahasa Inggeris yang dipermudahkan daripada soalan asal dapat
membantu pelajar mendapat pencapaian dengan lebih baik tanpa
mengurangkan integriti ujian yang dilaksanakan. Ini juga selaras dengan
prinsip ketunggalan dimensi yang ditekankan dalam teori pengujian yang
menekankan kepada aspek (kandungan) yang ingin diuji bukan aspek
kemahiran bahasa pelajar. Dengan itu, dasar yang dilaksanakan oleh
10
kerajaan ini masih boleh dilaksanakan. Sementara mekanisme item ujian
berkenaan perlulah diubah suai bagi memudahkan pemahaman pelajar
agar faktor bahasa bukan menjadi faktor utama yang mempengaruhi
pencapaian pelajar.
Di samping itu, facet yang menyumbang kepada ralat pengukuran dan
faktor lain seperti sikap terhadap mata pelajaran yang mempengaruhi skor
pencapaian pelajar juga harus dikaji. Dalam hal ini, Maree (1997)
berpendapat ada sebilangan pelajar yang mempunyai sikap positif
terhadap matematik yang menunjukkan pencapaian yang rendah dan ada
yang mempunyai sikap yang negatif menunjukkan pencapaian yang tinggi.
Bagi menjawab persoalan ini, satu kajian yang praktik dengan
menggunakan soalan alternatif yang diubah suai wajar dijalankan bagi
mengetahui keberkesanan item berkenaan. Teori Generalizabiliti dapat
digunakan bagi menjelaskan dependability skor pencapaian ujian
Matematik menggunakan item ujian berkenaan dan seterusnya mengenal
pasti faktor utama dalam mempengaruhi pencapaian matematik KBSM
Tingkatan 2 serentak perubahan bahasa pengantar dari bahasa Melayu
kepada bahasa Inggeris. Dengan memahami aspek ini, maka pencapaian
pelajar dapat ditingkatkan dan ralat pengukuran yang wujud dapat
dikurangkan (Eason, 1989).
11
1.3 Objektif Kajian
Pada umumnya, kajian ini bertujuan untuk mendapatkan maklumat
tentang faktor yang paling menyumbang kepada wujudnya ralat
pengukuran dalam instrumen pengujian mata pelajaran matematik KBSM
Tingkatan 2. Secara lebih khusus lagi kajian ini bertujuan untuk:
- Menentukan dependability skor ujian pencapaian mata pelajaran
matematik KBSM Tingkatan 2 mengikut Teori Generalizabiliti.
- Menjelaskan bagaimana pemboleh ubah terpilih mempengaruhi
skor ujian pencapaian matematik KBSM Tingkatan 2.
1.4 Soalan Kajian
Berdasarkan tujuan kajian yang telah ditetapkan, kajian cuba menjawab
soalan seperti di bawah:
1. Apakah dependability skor ujian pencapaian mata pelajaran
matematik KBSM Tingkatan 2 mengikut Teori Generalizabiliti?
2. Apakah sumbangan setiap facet terhadap varians ralat mengikut
Teori Generalizabiliti?
3. Sejauhmanakah model cadangan fit data pemboleh ubah bebas dan
pembolehubah bersandar?
4. Adakah model yang dicadangkan fit dengan jantina lelaki dan
perempuan?
12
5. Adakah model yang dicadangkan fit dengan lokasi sekolah bandar
dan luar bandar?
6. Adakah terdapat kesan faktor peramal dalam model yang
dicadangkan terhadap skor pencapaian secara signifikan?
1.5 Hipotesis Kajian
Berdasarkan objektif kajian, penyelidik mempertimbangkan beberapa
hipotesis bagi menjawab soalan kajian.
1. Model cadangan fit data kajian. (Ho : Σ(θ) – S = 0)
2. Tidak ada perbezaan yang signifikan antara pencapaian lelaki dan
perempuan. (Ho : Σ(θ) – S = 0)
3. Tidak ada perbezaan yang signifikan antara pencapaian pelajar
sekolah di bandar dan luar bandar. (Ho : Σ(θ) – S = 0)
4. Tidak ada kesan yang signifikan antara faktor peramal dengan
pencapaian. (Ho : β = 0)
13
1.6 Kerangka Teori
Kerangka teori yang diguna sebagai landasan kepada kajian ini adalah
berdasarkan kombinasi dua teori utama. Pertama berdasarkan Teori
Generalizabiliti dan Teori Pemerolehan Bahasa Kedua.
1.6.1 Teori Generalizabiliti
Pengukuran ialah proses mengenal pasti nilai (angka atau kategori) objek
pengukuran yang ditunjukkan dalam bentuk kuantiti atau kualiti trait. Nilai
ditentukan secara sistematik berdasarkan prosedur atau peraturan yang
telah ditetapkan. Sesetengah perancangan berkenaan dikenali sebagai
model skala. Dalam penggunaan yang mudah, skala digunakan untuk
merumuskan secara menyeluruh dan berterusan tentang kedudukan objek
pengukuran dengan jelas (Nunnally, 1978). Misalnya, pembaris yang
digunakan sebagai skala untuk mengukur ketinggian tiga orang pelajar di
dalam sesebuah bilik darjah.
Matlamat pengukuran ialah untuk mengenal pasti perbezaan sebenar
individu dalam sesuatu perkara yang telah ditentukan. Penentuan nilai
berkenaan disebut juga sebagai skor dapatan (observed scored), yang
mencerminkan posisi secara relatif dan membabitkan pemangkatan objek
pengukuran secara menyeluruh berdasarkan skala tertentu. Banyak perkara
dalam trait yang diukur boleh mempengaruhi skor. Pengaruh yang tidak
dapat ditentukan dalam skala berkenaan dikenali sebagai ralat pengukuran.
14
Skor benar (true score) ialah skor yang diperolehi oleh seseorang pelajar
dengan menggunakan sesuatu instrumen pengukuran tanpa sebarang ralat.
Apabila ralat pengukuran kecil, skor dapatan memberikan maklum balas
yang tepat kepada skor benar. Sebaliknya jika besar ralat pengukuran,
maka skor sebenar mungkin tidak tepat. Ini menunjukkan bahawa, skor
yang diperolehi itu tidak mencerminkan kebolehan sebenar seseorang
pelajar. Kesimpulannya skor yang diperolehi adalah terdiri daripada skor
yang menggambarkan kebolehan dan skor ralat (Alias Baba, 1997).
Apabila ingin mengukur sesuatu perkara, alat yang digunakan bagi
membuat ukuran amat penting bagi memastikan pengukuran dibuat adalah
tepat. Menggunakan alat atau instrumen yang betul untuk mengukur
bermakna instrumen itu sah dan dapat mengukur tanpa sebarang
perubahan nilai. Dalam hal ini, Teori Generalizabiliti (Generalizability
Theory[GT]) dijadikan landasan untuk menentukan kebolehpercayaan
instrumen yang digunakan serta dependability skor pencapaian yang
diperolehi.
Dalam menghuraikan sumber ralat pengukuran dalam sesuatu ujian,
terdapat beberapa teori utama yang mendasarinya seperti Teori Ujian
Klasik (CTT) dan Teori Generalizabiliti (GT). CTT telah mencadangkan
struktur model ringkas yang bagi menunjukkan hubungan antara skor
dapatan, skor benar dan ralat penskoran. Model berkenaan ditunjukkan
seperti di sebelah.
15
X = T + e
Di mana:
X = skor dapatan
T = skor benar
e = ralat pengukuran (skor ralat)
Skor ralat diperolehi daripada beberapa faktor yang mungkin
mempengaruhi seseorang pelajar dalam menduduki peperiksaan atau ujian.
Misalnya kesihatan pelajar (person) yang terjejas mungkin menyebabkan
skor yang diperolehi dalam sesuatu ujian itu terjejas daripada yang
sepatutnya diperolehi. Ralat juga berlaku apabila instrumen ujian (item)
berkenaan mungkin mengelirukan pelajar yang menyebabkan mereka
sukar memahami kehendak soalan. Selain itu, aspek pentadbiran juga
boleh menyebabkan wujudnya ralat. Ini termasuklah dari segi tempoh
ujian (occasion), lokasi, sikap pengawas dan suasana dewan atau tempat
ujian dijalankan. Sementara, pemeriksa pula boleh menyumbang kepada
ralat penskoran. Misalnya pemeriksa yang teliti dan pemeriksa yang
kurang teliti sudah pasti memberikan perbezaan skor yang ketara dan
kurang tepat.
Semua aspek yang dijelaskan tersebut ini merupakan faktor yang
mempengaruhi sesuatu skor yang diperolehi pelajar yang disebut sebagai
ralat. Skor ralat mungkin wujud secara sistematik atau secara rawak. Ralat
16
yang wujud secara sistematik seperti menggunakan alat penimbang yang
tidak tepat, misalnya berlaku kerosakan pada keanjalan alat penimbang
memungkinkan timbangan yang diperolehi menjadi sentiasa tidak tepat.
Ralat yang berlaku secara rawak tidak menunjukkan perubahan secara
sistematik. Ia mungkin bernilai sama ada positif atau negatif. Sekiranya
ukuran dijalankan beberapa kali jumlah ralat akan menjadi kosong.
Taburan ralat juga dianggap sebagai normal dan tidak mempunyai korelasi
antara satu sama lain dengan skor benar (Alias Baba, 1997).
Nilai kebolehpercayaan sesuatu instrumen berkenaan boleh diperolehi
dengan menggunakan beberapa kaedah seperti:
i) Kaedah Bahagi Dua. Ujian diberikan kepada murid dan skor yang
diperolehi dijumlahkan kepada dua kumpulan bagi dikorelasikan.
Korelasi yang tinggi menunjukkan kedua-dua bahagian ujian
memberikan petunjuk bahawa wujud persamaan bagi isi sampel
ujian yang diuji.
Kebolehpercayaan = 2 X kebolehpercayaan ½ ujian
Seluruh ujian 1 + kebolehpercayaan ½ ujian
ii) Kaedah Kuder-Richardson. Kebolehpercayaan ini ditentukan
dengan menggunakan formula yang dicadangkan oleh Kuder-
Richardson, iaitu KR20 dan KR21.
17
KR20 = k 1 – Σp(1 – p)
k – 1 s²
dengan k = bilangan item ujian
p = nisbah murid yang menjawab item dengan betul
(1 – p) = nisbah murid yang item menjawab dengan salah
s² = varian skor ujian
Σ = jumlah
KR21 = k 1 – m(k – m)
k – 1 ks²
dengan k = bilangan item ujian
m = min skor ujian
s² = varian skor ujian
Pekali Alfa (α). Formula ini sama dengan formula KR20, kecuali Σp
digantikan dengan Σs²i apabila s²i ialah varian bagi satu item.
α = k 1 – Σs²i
k – 1 s²x
Sementara GT adalah kesinambungan CTT yang mengakui wujudnya
kepelbagaian bentuk dan sumber ralat yang mungkin mempengaruhi
pengukuran (Brennan 1992). Kepelbagaian aspek yang mungkin
mempengaruhi skor dapatan seperti rater, bentuk ujian, atau tempoh ujian
yang boleh dikenal pasti secara terpisah dalam ralat secara rawak
18
mengikut GT. GT mampu untuk menilai dengan jelas sumber ralat dalam
skor dapatan secara signifikan. Sejauh mana sampel skor dapatan
diperolehi dengan baik bergantung kepada sesetengah keadaan yang
boleh disimpulkan kepada keadaan lain mengikut jumlah varian skor
dapatan yang relatif berdasarkan situasi pengukuran yang khusus.
GT mengandaikan bahawa setiap pemerhatian adalah secara rawak dan
sampel adalah bebas daripada pengukuran yang ingin dijalankan
(Cronvach, Gleser, Nanda & Rajaratnam, 1972). Berbeza dengan CTT,
model pengukuran skor dapatan adalah seperti berikut.
X = T + C+ e
Di mana:
X = skor dapatan
T = skor benar
C = keadaan yang mempengaruhi secara khusus
e = ralat dan sumber ralat yang lain.
Skor benar ialah sebuah konsep secara purata bagi skor individu yang
mungkin daripada pelbagai kombinasi keadaan dengan menggunakan
model skala yang dapat dilaksanakan. Misalnya, model pengukuran hanya
melibatkan penilai (C) yang berbeza mungkin disebabkan oleh perbezaan
rater. Skor benar ialah min skor dapatan yang diberikan oleh rater secara
19
tidak terbatas. Dalam hal ini, GT cuba menyimpulkan pengukuran
daripada sampel yang diperhatikan yang diperolehi daripada rater yang
berbeza.
Model pengukuran, X = T + C + e boleh ditulis semula secara linear
seperti di bawa.
Xpr = µ + µp + µr + µpr + e
di mana µ pengaruh populasi yang dikaji;
µp ialah pengaruh murid p(µp – µ);
µr ialah pengaruh rater r (µr – µ);
µpr ialah mungkin interaksi pengaruh rater r x murid p
(Xpr - µp - µr + µ);
e ialah ralat secara dari sumber ralat lain.
GT menghasilkan “generalizability coefficient” yang sama seperti
koeffesien kebolehpercayaan dalam CTT. Ia lebih memberikan penekanan
kepada magnitud pelbagai sumber ralat. Tambahan pula GT mengambil
kira dua aspek dalam sesuatu kajian, iaitu generalizability (G) studies
(kajian genelizabiliti) dan decision (D) studies (kajian membuat
keputusan). Kajian generalizabiliti dibentuk bagi mentafsir sejumlah
sumber ralat yang mungkin wujud sementara kajian membuat keputusan
cuba mengukur bagi tujuan membuat keputusan tertentu. Sebagai contoh,
20
Kajian generalizabiliti dibentuk bagi mengesahkan bahawa komponen
varian bagi individu, item, rater, dan hubungan secara berpasangan bagi
semua aspek berkenaan sebagai ralat tambahan secara rawak. Sedangkan
kajian membuat keputusan hanya memerlukan ukuran yang boleh
dipercayai bagi membuat sesuatu keputusan. Ia mungkin munasabah
menggunakan kajian membuat keputusan yang melibatkan hanya satu
rater. Maklumat daripada kajian generalizabiliti boleh digunakan bagi
merangka bentuk kajian membuat keputusan apabila mendapatkan tahap
kebolehpercayaan pengukuran yang diperlukan bagi tujuan membuat
keputusan.
GT adalah berkaitan dengan objek pengukuran (kebiasaannya individu)
dan ketepatan skor bagi membenarkan dibuat kesimpulan yang menyeluruh
terhadap tingkah laku pelajar dalam menjelaskan situasi yang sebenar.
Skor yang diperolehi mungkin boleh dipecahkan kepada beberapa kadar
varian dari setiap keadaan pengukuran atau facet. Dengan itu, penyelidik
dapat mengetahui sumber ralat seperti item ujian, tempoh ujian, atau rater
(guru sebagai pengukur) yang disebut sebagai facet. Setiap rater dinilai
bagi setiap respons yang diberikan bagi setiap item. Jika empat rater maka
akan mewakili empat facet rater dan lima item mewakili lima facet item
berkenaan. Biasanya facet dipengaruhi secara rawak kerana diandaikan
bahawa situasi pengujian yang mengambil sampel secara rawak bagi
setiap facet atau keadaan yang diwakili “telah bersilih ganti” dan menjadi
21
sebahagian daripada keadaan sebenar. Misalnya, empat rater sama ada
sampel secara rawak telah memungkinkan rater yang layak sebahagiannya
telah “bersilih ganti” daripada rater yang layak.
Umumnya facet dan objek pengukuran adalah faktor kepada reka bentuk
analisis faktorial. Dengan itu, semua faktor berkenaan adalah secara rawak.
GT pada dasarnya adalah komponen varian bagi menaksir masalah.
Tempoh ujian adalah facet yang tetap (dan masih boleh diubah suai).
Analisis statistik yang digunakan dalam GT ialah analisis varian
(ANOVA). Penggunaan ANOVA sebagai kaedah analisis membolehkan
penyelidik mendapat min kuasa dua (mean square) bagi setiap sumber
varian. Daripada maklumat berkenaan, penyelidik boleh mengenal pasti
sejauh mana varian dikira bagi setiap sumber. Keadaan ini menunjukkan
bahawa ralat pengukuran telah diminimumkan.
GT menghasilkan dua perbezaan koeffisien kebolehpercayaan. Koeffisien
G dalam GT menyamai koeffisien dalam CTT bagi rujukan norma atau
keputusan relatif. Dalam membuat keputusan relatif, kepelbagaian ralat
rawak adalah jumlah komponen varian bagi ralat dan semua komponen
berinteraksi dengan pelajar (person). Misalnya, skor ujian matematik boleh
disusun daripada skor terendah ke skor tertinggi. Skor berkenaan boleh
diinterpretasi berdasarkan pencapaian keseluhan pelajar dalam kumpulan
berkenaan. Ini disebut sebagai keputusan relatif (relative decision).
22
Nilai koeffisien phi adalah koeffisien kebolehpercayaan bagi rujukan
kriteria atau keputusan mutlak. Bagi keputusan mutlak yang dilakukan,
kepelbagaian ralat rawak adalah jumlah semua sumber ralat tetapi tidak
melibatkan komponen varian pelajar. Dalam erti kata yang lain,
pengukuran yang digunakan berdasarkan indeks yang mutlak tanpa
berdasarkan pencapaian pelajar lain. Misalnya ujian kederasan menaip
berdasarkan jumlah perkataan setiap minit yang tidak bergantung kepada
kederasan menaip pelajar lain. Jika penetapan telah dibuat menetapkan
skor yang mesti diperolehi pelajar ialah 80% bagi mewakili dalam sesuatu
tugas tertentu, maka jika pelajar berkenaan gagal memperolehi skor 80%,
dia tetap tidak akan terpilih walaupun skornya tertinggi dalam kumpulan
berkenaan. Dalam hal ini, keputusan yang diambil disebut sebagai
keputusan mutlak (absolute decisions).
Dalam GT skor benar ialah skor purata bagi objek pengukuran (individu)
dengan mengambil kira semua kombinasi. Skor benar ialah pengukuran
ideal yang tidak mungkin diperolehi (Shavelson & Webb, 1991).
Sebaliknya skor ujian masih boleh diperolehi. Skor ujian ialah purata
sampel rawak bagi keadaan setiap facet. Daripada skor ujian ini
dianggarkan skor benar. Apabila tingkah laku diperhati berdasarkan
tempoh masa (masa sebagai facet) andaian penting dalam GT ialah
perbezaan individu adalah tetap mengatasi masa.
23
Justeru, maklumat yang diperolehi dari kajian generalizabiliti
membolehkan penyelidik menjalankan kajian membuat keputusan. Kajian
membuat keputusan membenarkan setiap individu dimanipulasikan bagi
mengenal pasti cara yang lebih efektif dan efisien untuk menggunakan
instrumen berkenaan (Eason, 1989). Sebagai contoh, dengan memanipulasi
item, penyelidik boleh mengenal pasti jumlah item yang sesuai bagi
mendapatkan data yang lengkap. Sebagai alternatif, penyelidik juga boleh
mengenal pasti bilangan rater yang diperlukan untuk mendapatkan data
yang lengkap. GT banyak membantu penyelidik kerana dapat mengenal
pasti sumber ralat dengan khusus. Apabila dapat mengenal pasti sumber
ralat, maka sesuatu pengukuran itu dapat dikurangkan ralat pengukurannya
(Eason, 1989).
Secara ringkasnya kelebihan GT berbanding CTT ialah:
i. GT mempertimbangkan pelbagai sumber ralat secara serentak dan
menjadi model yang lebih tepat dalam situasi pengukuran
berbanding hanya kaedah satu model sumber ralat dalam CTT yang
hanya mempertimbangkan satu sumber ralat pengukuran bagi
membuat keputusan yang relatif.
ii. GT melengkapkan pendekatan secara bersepadu bagi menunjukkan
kepelbagaian sumber ralat. Kaedah yang sama boleh diaplikasikan
sama ada sumber ralat berkenaan adalah item, tempoh masa,
bentuk atau rater. Tambahan pula GT dapat mempertimbangkan
24
sebarang perbezaan sumber ralat dengan melibatkan kombinasi
mana-mana facet berkenaan.
iii. GT menghasilkan pendekatan yang lebih bersepadu bagi menaksir
kebolehpercayaan pengukuran yang dijalankan sama ada bagi
tujuan membuat keputusan yang relatif (ujian rujukan norma) atau
keputusan sebenar (ujian rujukan kriteria). Keputusan yang relatif
adalah berdasarkan kedudukan individu dalam kumpulan
berbanding keputusan sebenar. Keputusan sebenar adalah
berdasarkan skor benar tanpa sebarang perbandingan dengan skor
individu yang lain dalam kumpulan (Ary, Jacob & Razavieh, 1996).
iv. GT tidak membuat andaian tentang perbandingan sumber ralat
tetapi menganggar secara serentak kepelbagaian sumber ralat
termasuklah interaksi antara ralat-ralat berkenaan (Thomson 1992,
1991). CTT mengandaikan bahawa wujud sumber ralat secara
bertindihan dan tidak mempertimbangkan kemungkinan bahawa
ralat berkenaan menghasilkan ralat pengukuran yang lain atau ralat
tambahan.
Sebagai kesimpulannya, GT menghasilkan alternatif kepada CTT dalam
mendapatkan koefesien kebolehpercayaan dalam pelbagai situasi. GT turut
memiliki kelebihan yang jelas dalam mengenal pasti sumber ralat.
Misalnya, satu item boleh dinilai oleh dua rater. Rater adalah sumber ralat
dan kebolehpercayaan antara rater adalah sama ada dua atau lebih rater.
25
GT turut menghasilkan teori dan kaedah untuk membantu menghasilkan
kebolehpercayaan pengukuran bagi tujuan proses membuat keputusan.
Di samping itu, GT juga memperkembangkan model pengujian agar lebih
sensitif bagi membuktikan bahawa pelajar yang mempunyai kemahiran
bilingual mungkin amat berbeza merentasi bahasa (Bialystok, 1997;
Solano-Flores & Li, 2006; Valdes & Figueroa, 1994). Malah GT juga
membenarkan pemeriksaan sejumlah kepelbagaian skor kesan daripada
interaksi pelajar (objek pengukuran) dan facet (sumber ralat pengukuran)
seperti item, rater, tempoh ujian, dan bentuk arahan (Baxter, Shavelson,
Goldman & Pine, 1992); Ruiz-Primo & Shavelson, 1996; Webb,
Schlackman & Sugrue, 2000).
1.6.2 Teori Pemerolehan Bahasa Kedua
Pemerolehan bahasa kedua berbeza daripada pemerolehan bahasa pertama.
Ia diperolehi bukan daripada pemerolehan tetapi melalui pembelajaran
yang lebih formal dan memerlukan banyak melakukan latih tubi serta
pengulangan bagi menjadikan satu tabiat (Kamaruddin Haji Husin, 1998).
Moulton (1961) telah menyenaraikan beberapa prinsip dalam mengajar
bahasa kedua, iaitu (1) kemahiran lisan (2) penggunaaan ajukan dan
menghafal (3) melatih bentuk-bentuk bahasa agar menjadi satu tabiat,
dan (4) penggunaan bahan bantuan seperti peralatan makmal bahasa dan
mewujudkan rancangan pembelajaran kendiri.
26
Krashen (1987) menyenaraikan lima hipotesis utama berhubung
pemerolehan bahasa kedua, iaitu:
- Hipotesis pemerolehan-pembelajaran. Terdapat dua sistem bebas
dalam prestasi bahasa kedua, iaitu sistem perolehan dan sistem
pembelajaran. Sistem perolehan melibatkan proses yang tidak disedari
yang sering terjadi kepada kanak-kanak sedang membesar yang
memperolehi bahasa pertama melalui aktiviti berkomunikasi dengan
orang lain. Sistem pembelajaran pula adalah hasil daripada bentuk
pengajaran yang formal dan berlaku secara sedar. Misalnya
pengetahuan tentang tatabahasa yang diperolehi melalui pembelajaran.
Bagi Krashen (1987) pemerolehan lebih penting daripada
pembelajaran.
- Hipotesisis pengawasan. Hipotesis ini menerangkan hubungan antara
pemerolehan dan pembelajaran. Fungsi pengawasan dapat dilihat
melalui hasil pembelajaran tatabahasa yang diaplikasikan oleh individu
berkenaan. Menurut Krashen lagi, sistem pemerolehan bermula dengan
ujaran. Manakala sistem pembelajaran berfungsi sebagai peraturan
yang mengawal atau memperbetulkan. Tindakan pengawasan berlaku
dalam bentuk perancangan, mengedit dan membetulkan. Keadaan ini
menunjukkan bahawa pembelajaran secara sedar adalah terhad dalam
prestasi pembelajaran bahasa kedua. Krashen turut menegaskan bahawa
27
terdapat perbezaan individu di kalangan pelajar bahasa dalam
mengawas bahasa mereka.
- Hipotesis aturan natural. Hipotesis ini berdasarkan dapatan kajian
(Dulay & Burt, 1974; Fathman, 1975; Makino, 1980 seperti yang
dipetik dalam Krashen, 1987) yang mendapati bahawa pemerolehan
struktur tatabahasa adalah berdasarkan aturan yang natural atau
semulajadi. Bagi bahasa pertama, sesetangah struktur tatabahasa
cenderung diperolehi pada peringkat awal dan sesetengah yang lain
lebih lewat.
- Hipotesis input. Hipotesis ini cuba menjelaskan cara pelajar
memperolehi bahasa kedua. Hipotesis input hanya berkaitan dengan
“pemerolehan” bukan “pembelajaran”. Berdasarkan hipotesis ini
pelajar akan memperbaiki bahasa mereka sepanjang proses menerima
input bahasa kedua. Dalam hal ini, tidak semua pelajar akan berada
pada tahap penguasaan bahasa yang sama pada waktu yang sama.
- Hipotesis saringan efektif. Terdapat sejumlah pemboleh ubah yang
efektif yang berperanan mempengaruhi bahasa kedua, seperti motivasi,
keyakinan diri dan kebimbangan. Menurut Krashen, pelajar yang
mempunyai motivasi, berkeyakinan diri, imej yang baik, dan kurang
rasa kebimbangan adalah lebih bersedia untuk menguasai bahasa kedua
dengan baik. Dalam erti kata yang lain, pelajar yang memiliki sikap
yang positif akan lebih baik dalam menguasai bahasa kedua.
28
Dengan memahami proses pemerolehan bahasa akan membantu seseorang
guru dalam mengembangkan strategi pengajaran dan penilaian serta
membantu perkembangan bahasa pelajar dengan berterusan. Pengetahuan
tentang teori ini akan membantu guru secara langsung untuk menguasai
kandungan sesuatu mata pelajaran kepada pelajar yang menggunakan
bahasa Inggeris sebagai bahasa kedua. Ini penting kepada sekolah atau
daerah terpencil yang kekurangan bahan sokongan dalam membantu
pengajaran dan pembelajaran.
1.7 Kerangka Konseptual
Kerangka teori berfungsi sebagai landasan bagi penerangan dan
panduan dalam menyelesaikan sesuatu masalah kajian (Littlejohn, 1995).
Teori yang digunakan dalam kajian ini ialah GT yang menjelaskan sejauh
mana sumbangan setiap facet yang dikaji menyumbang kepada wujudnya
ralat dalam sesuatu pengukuran dan seterusnya menganggar dependability
skor pencapaian yang diperolehi oleh pelajar-pelajar. Sementara Teori
Pemerolehan Bahasa Kedua memberikan penekanan kepada kepentingan
aspek kemahiran bahasa dalam menguasai bidang ilmu lain.
Kajian-kajian lepas (Bassette, 2004;Bershinky, 1993; Ma & Kishor, 1997;
TIMMS 2003) juga menunjukkan bahawa terdapat beberapa sumber
menyumbang kepada pencapaian pelajar seperti faktor demografi dan
29
sikap menyumbang kepada pencapaian pelajar. Sementara kajian AAbbeeddii
((22000022)),, AAbbeeddii && LLeeoonn ((11999999)),, AAbbeeddii,, LLeeoonn && MMiirroocchhaa ((22000033)) AAbbeeddii &&
LLoorrdd ((22000011)) ddaann AAbbeeddii,, LLoorrdd,, HHooffsstteetttteerr && BBaakkeerr (( 22000000)) mmeennuunnjjuukkkkaann
bbaahhaawwaa aassppeekk llaattaarr bbeellaakkaanngg bbaahhaassaa mmeemmppuunnyyaaii ppeennggaarruuhh yyaanngg kkuuaatt
tteerrhhaaddaapp ppeennccaappaaiiaann mmaatteemmaattiikk..
Selain itu, Begle (1979) menyarankan beberapa kategori pemboleh ubah
yang boleh dikaitkan dengan pencapaian matematik seperti pemboleh ubah
kognitif, afektif dan non-intellective. Pemboleh ubah kognitif termasuklah
pencapaian matematik, kecerdasan IQ dan pemikiran logik. Manakala
pemboleh ubah afektif merujuk kepada sikap pelajar termasuklah dari segi
kebimbangan, perasaan dan kepercayaan. Pemboleh ubah non-intellective
pula berkaitan dengan jantina serta lokasi sekolah. Sikap terhadap mata
pelajaran penting bagi seseorang pelajar untuk mengambilnya sebagai satu
mata pelajaran dan ia amat memberikan kesan kepada skor pencapaian
(Bassette, 2004). Bershinky (1993) berpendapat sikap dan demografi
adalah sumber yang turut mempengaruhi pencapaian matematik pelajar.
Ma & Kishor (1997) dan Mc Leod (1992) berpendapat bahawa sikap amat
penting dalam menentukan pencapaian pelajar dalam mata pelajaran
matematik. Ini kerana murid yang mempunyai sikap yang positif terhadap
matematik akan berusaha dengan lebih berbanding dengan murid yang
bersikap negatif. (Ma & Kishor, 1997).
30
Daripada kerangka teori serta kajian lepas (Abedi, 2002; Abedi & Leon,
1999; Abedi, Leon & Mirocha, 2003; Abedi & Lord, 2001; Abedi, Lord,
Hofstetter & Baker, 2000; Bassette, 2004; Begle, 1979; Bershinky,1993;
dan Ma & Kishor, 1997) jelas menunjukkan bahawa aspek demografi
seperti jantina dan lokasi sekolah, latar belakang bahasa dan sikap terhadap
bahasa Inggeris dan sikap terhadap matematik boleh mempengaruhi
pencapaian matematik. Sehubungan itu, disimpulkan aspek berkenaan
sebagai kerangka konseptual kajian seperti rajah di sebelah.
Rajah 1.1 Kerangka Konseptual Kajian
Rajah 1.1 menggambarkan beberapa pemboleh ubah yang boleh
menyumbang kepada pencapaian skor ujian responden seperti item
SIKAP
- BI
- Matematik
LTR.BLKG BAHASA
- kemahiran BI
- gred BI UPSR
ITEM UJIAN
- asal
- ubah suai
DEMOGRAFI
- jantina
- lokasi sekolah
SKOR UJIAN
31
pengujian yang digunakan (item asal dan item yang diubah suai), sikap
pelajar (sikap terhadap matematik dan sikap terhadap Bahasa Inggeris),
latar belakang bahasa (kemahiran bahasa Inggeris responden dang red
Bahasa Inggeris dalam peperiksaan UPSR) serta aspek demografi pelajar
(jantina dan lokasi sekolah). Di samping kesan pemboleh ubah berkenaan
terhadap skor ujian, pengaruh aspek demografi dan sikap pelajar terhadap
mata pelajaran juga mungkin menyumbang kepada aspek latar belakang
bahasa responden.
1.8 Model Kajian
Satu model telah dicadangkan dalam memberikan penjelasan tentang
perhubungan antara pemboleh ubah – pemboleh ubah yang dikaji.
Model yang dicadangkan ini dirangka dan dibentuk dengan berasaskan
kerangka teori dan kerangka konsep yang telah dibincangkan. Model
berkenaan menggunakan rajah jalur (path diagram) yang memungkinkan
dapat menjelaskan pencapaian ujian matematik KBSM Tingkatan 2 dalam
bahasa Inggeris. Pemboleh ubah yang dikaji ialah:
- kemahiran bahasa
- gred bahasa
- sikap terhadap bahasa Inggeris
- sikap terhadap matematik
- skor ujian matematik
32
Kemahiran BI
AttBI
AttMat
SkorMat
Gred BI UPSR
Dalam model yang dicadangkan ini dianalisis memperlihatkan
perhubungan antara pemboleh ubah-pemboleh ubah berkenaan dalam
menjelaskan pencapaian ujian matematik menggunakan teknik analisis
SEM. Rajah 1.2 di sebelah memaparkan model yang dicadangkan.
Rajah 1.2 Model Cadangan
1.9 Justifikasi Kajian
Kajian ini menggunakan soalan berbentuk penyelesaian masalah
matematik kerana ia lebih banyak menggunakan aspek bahasa. Kajian
SEAMEO RECSAM (seperti yang dipetik dalam Ibrahim, 1997)
menunjukkan bahawa 71 peratus ralat wujud dalam soalan berbentuk
33
penyelesaian masalah. Keadaan ini menunjukkan bahawa pelajar-pelajar di
Malaysia menanggung kesukaran dalam memahami sesuatu masalah
berbanding dengan kemahiran mengira serta murid-murid mungkin terlalu
ditekankan kemahiran asas matematik berbanding bahasa matematik.
1.9.1 Justifikasi Pemboleh Ubah yang Dipilih dalam Model Kajian
Aspek yang dijangka dapat meramal pencapaian skor ujian matematik
KBSM Tingkatan 2 dalam kajian ini dipilih berdasarkan kombinasi cetusan
Krashen (1987) dan kajian TIMMS (2003) yang berkaitan dengan aspek
penilaian dalam bahasa kedua, iaitu dengan mengambil kira aspek
kemahiran bahasa dan sikap pelajar terhadap mata pelajaran.
Kemahiran bahasa adalah aspek penting bagi pelajar dalam menguasai
sesuatu ilmu. Seandainya kemahiran bahasa yang terhad akan
menyukarkan seseorang pelajar untuk memahami dan menguasai sesuatu
bidang ilmu. Apabila kemahiran bahasa dapat dikuasai dengan baik maka
pencapaian pelajar dalam bahasa berkenaan juga akan meningkat.
Keadaan ini disebabkan pengetahuan dan kemahiran yang baik dalam
bahasa kedua akan memudahkan pelajar dapat memahami kehendak soalan
dan menjawab dengan lebih baik (Adnan Khamis,1985; Benson, 1991;
Abu-Rabia, 1996).
34
Sikap terhadap bahasa pula penting dalam mempengaruhi pencapaian
akademik pelajar. Ini didasarkan kepada kajian Gardner (1959) yang
mendapati sikap pelajar terhadap bahasa kedua menjadi aspek penting
dalam bentuk penilaian yang dijalankan dalam bahasa berkenaan. Banyak
kajian (Bershinky, 1993; Mc Leod, 1992; Ma & Kishor, 1997;
Arsaythamby, 2005) menunjukkan bahawa sikap adalah pemboleh ubah
penting dalam menentukan pencapaian pelajar dalam sesuatu mata
pelajaran, khususnya mata pelajaran matematik.
1.10 Signifikan Kajian
Aspek penilaian merupakan aspek yang penting dalam dunia pendidikan
dengan memberikan maklumat kepada pelbagai pihak. Maklumat
terpenting yang merupakan salah satu petunjuk kejayaan usaha ke arah ini
ialah pencapaian akademik pelajar. Sistem peperiksaan yang diamalkan
dalam konteks negara Malaysia merupakan suatu mekanisme untuk
membekalkan maklum balas kepada pembuat dasar dalam menentukan
sistem penilaian yang diamalkan berada pada landasan yang betul atau
sebaliknya ke arah mencapai matlamat Falsafah Pendidikan Kebangsaan.
Di samping itu, perancangan yang menyeluruh dan lebih sistematik dengan
fakta yang ada daripada kajian yang dijalankan dapat menggalakkan
pelajar untuk mencapai kecemerlangan akademik. Penyesuaian mungkin
diperlukan dalam membina item penilaian agar lebih membantu pelajar
35
dalam memahami kehendak soalan dan seterusnya memberikan jawapan
kepada soalan yang ditanya.
Kajian ini penting bagi mengetahui akan sikap pelajar terhadap mata
pelajaran matematik sama ada dalam bahasa Melayu mahupun bahasa
Inggeris. Dengan itu pihak Kementerian Pelajaran dapat merancang serta
memberikan perhatian berdasarkan maklum balas yang diterima.
Dapatan kajian ini juga dapat membantu pihak Lembaga Peperiksaan
Malaysia untuk mengemaskinikan aspek penggubalan item penilaian bagi
semua peperiksaan umum yang dikendalikan pihak terbabit. Dengan itu,
pihak berkenaan dapat merancang pembentukan item agar memenuhi
kriteria penilaian dan memberikan maklumat yang tepat berhubung
pencapaian pelajar.
Akhir sekali kajian ini diharapkan dapat membekalkan maklumat tentang
isu-isu dan cadangan-cadangan dalam menyelesaikan masalah berkaitan
pelaksanaan penilaian dalam bagi mata pelajaran matematik. Dapatan
kajian ini juga diharapkan dapat menjadi asas kepada kajian-kajian
selanjutnya berhubung pembentukan item penilaian. Dengan itu, dapat
memastikan sistem peperiksaan kita sentiasa terkini dan membekalkan
maklumat yang benar dan berfaedah kepada semua pihak.
36
1.11 Skop dan Batasan
Kajian ini menumpukan kepada mendapatkan maklumat serta mengenal
pasti tentang komponen varian yang memberikan pengaruh yang besar
dalam ralat pengukuran serta hubungan sikap terhadap mata pelajaran dan
kebolehan bahasa, jantina serta lokasi sekolah terhadap pencapaian
akademik mereka. Responden yang terlibat dalam kajian ini hanya pelajar
tingkatan dua di sekolah menengah kebangsaan (SMK) di negeri Kedah
Darulaman. Sekolah yang dipilih dalam kajian ini adalah terdiri daripada
sekolah di bandar dan di luar bandar seperti yang telah dikategorikan oleh
Jabatan Pelajaran Kedah.
Dapatan kajian ini turut membataskan kepada penyelidikan bagi mata
pelajaran Matematik sahaja. Ini bermakna pencapaian pelajar dalam mata
pelajaran lain tidak diambil kira.
Kandungan ujian dalam kajian ini hanya terhad kepada topik awal dalam
Sukatan Pelajaran Matematik Tingkatan 2. Yakni menyentuh tiga aspek
utama (Nombor, Bentuk dan Ruang, Perkaitan) kandungan matematik
KBSM dengan meliputi hanya topik asas nombor, pecahan, ukuran asas,
nombor bulat, bulatan, algebra dan statistik. Tumpuan bentuk soalan
dalam kajian ini pula menjurus kepada masalah matematik yang berkaitan
dengan ayat matematik. Ini kerana soalan berbentuk demikian tidak boleh
37
terus diselesaikan tetapi memerlukan proses menukarkan terlebih dahulu
kepada soalan kira-kira. Kegagalan dalam menukarkan masalah matematik
kepada kira-kira akan menyebabkan kesilapan dalam memberikan jawapan
(Ibrahim Md Noh, 1997). Di samping itu, tumpuan diberikan kepada
masalah matematik kerana soalan dalam bentuk begini begitu ketara dalam
kurikulum pendidikan, yakni lebih 70% soalan soalan adalah jenis
penyelesaian masalah.
Model yang diterima dalam meramal pencapaian ujian matematik dalam
kajian ini adalah hasil analisis model yang dicadangkan. Pengubahsuaian
dijalankan menggunakan data sampel yang sama yang memungkinkan ia
adalah unik untuk data berkenaan sahaja. Namun, ia masih dapat diatasi
melalui melalui penggunaan sampel pelajar lokasi sekolah yang berlainan
di samping penggunaan analisis Bootsrapping bagi mengelakkan kesan
keunikkan data dalam model tersebut.
Model yang diterima dengan menggunakan indeks statistiks dalam kajian
ini tidak menafikan terdapatnya model alternatif lain yang boleh
dipertimbangkan bagi menjelaskan pencapaian dalam ujian matematik. Ini
kerana mungkin terdapat implikasi daripada model berkenaan yang boleh
sahaja betul tetapi tidak berguna (Arbuckle & Wothke, 1999).
38
1.12 Definisi Operasional
Bagi menjelaskan penyelidikan ini, beberapa istilah disenaraikan untuk
didefinisikan dalam bahagian definisi operasional ini.
Pengujian
Satu instrumen atau prosedur yang sistematik bagi melihat atau
menerangkan satu atau lebih ciri-ciri pelajar dengan menggunakan skala
nombor atau skema pengelasan (Nitko, 2000).
Penilaian
Satu proses membuat pengadilan atau pertimbangan tentang nilai daripada
perubahan tingkah laku pelajar serta memberikan gred. Penilaian berlaku
setelah maklumat dikumpul, dianalisis dan dipertimbangkan. Penilaian
menjadi asas kepada membuat sesuatu berhubung keputusan yang akan
diambil (Airasian, 2005).
Kebolehpercayaan
Kebolehpercayaan didefinisikan sebagai sejauh mana skor yang diperolehi
oleh pelajar atau murid dalam kajian ini tidak berubah sekiranya murid
berkenaan mengambil ujian yang sama beberapa kali dalam tempoh
tertentu. Kebolehpercayaan yang tinggi bermaksud komponen skor benar
adalah tinggi dari komponen skor ralat (Alias Baba, 1997).
39
Varian
Varian didefinisikan sebagai min (purata) kepada jumlah kuasa dua skor
sisihan daripada min (Iran Herman, 2004).
Varian Ralat
Varian ralat ialah kebolehubahan skor kerana kesilapan yang mungkin
berlaku dalam pengukuran (Alias Baba, 1997).
Ralat Pengukuran
Ralat pengukuran ialah perbezaan antara skor yang diperhati dengan skor
benar (Alias Baba, 1997).
Versi Item Ujian
Bentuk penggubalan item yang digunakan untuk menguji pelajar. Dalam
kajian ini, dua versi yang digunakan, iaitu versi A mengandungi soalan
asal matematik dalam bahasa Inggeris. Versi B ialah soalan asal yang
didiubah suai dengan menggunakan bahasa Inggeris.
Facet
Facet dalam Teori Generalizabiliti didefinisikan sebagai satu sumber
utama yang menyumbang kepada varian. Dalam konteks kajian ini facet
ialah item.
40
Dependability
Depandability merujuk kepada ketepatan dalam mengeneralisasikan skor
yang diperolehi pelajar dalam sesuatu ujian kepada skor purata yang
diperolehi oleh pelajar dalam pelbagai suasana (Shavelson & Webb,
1991). Dalam konteks kajian ini, dependability ialah indeks yang
diperolehi dalam analisis ujian berdasarkan perbezaan individu dan
bilangan item.
Bahasa Kedua
Bahasa kedua yang dipelajari oleh seseorang individu di samping bahasa
ibunda. Bahasa kedua lazimnya adalah bahasa asing yang dipelajari untuk
tujuan-tujuan tertentu (Kamaruddin Haji Husin, 1988). Dalam konteks
kajian ini bahasa kedua ialah bahasa Inggeris.
Pencapaian akademik
Merujuk kepada pencapaian pelajar dalam ujian matematik yang diduduki
oleh responden kajian ini. Skor yang diperolehi daripada ujian yang
ditadbir ini menghasilkan pencapaian akademik pelajar.
Sikap
Merujuk kepada perasaan, pendapat, kepercayaan, penghargaan individu
secara langsung atau tidak langsung yang ditunjukkan melalui tingkah
41
laku terhadap mata pelajaran matematik sama ada positif atau negatif
(Allport, 1967).
1.13 Kesimpulan
Bab ini telah membincangkan latar belakang dan permasalahan kajian
berhubung pelaksanaan penilaian matematik dalam bahasa Inggeris. Di
samping itu, bab ini juga telah menyentuh kerangka teori, kerangka
konseptual, objektif, kepentingan dan skop dan batasan kajian. yang
mendasari kajian ini serta objektif, skop dan batasan kajian.