Upload
ulfia-rahmi
View
396
Download
9
Embed Size (px)
Citation preview
BAB I
PENDAHULUAN
Tes pada hakikatnya untuk melihat keberhasilan siswa terhadap materi
yang diteskan. Tes merupakan sebagai alat untuk mengukur perbedaan individu
untuk mendiagnosa atau mengukur perbedaan individu tersebut. Hasil tes
menunjukkan level kemampuan yang dimiliki siswa. Tes sangat bermanfaat bagi
guru, selain mengukur kemampuan siswa juga sebagai perbaikan terhadap guu,
menentukan tempat atau posisi siswa dalam suatu kelas atau
kelompok, memberikan bimbingan kepada siswa dalam
pendidikan dan menentukan pilihan program-program khusus.
Meskipun tes sangat bermanfaat, tetapi ada yang kurang menjadi perhatian oleh
bagi pengguna tes itu sendiri. Menurut idealnya, tes yang diberikan kepada siswa
harus merupakan tes yang baik, yaitu yang memenuhi syarat seperti validitas,
reabilitas, tingkat kesukaran, daya beda dan daya pengecoh.
Tes biasanya dibuat oleh guru. Terutama tes yang digunakan untuk
Ulangan Harian (UH). Guru membuat soal sesuai kemampuan masing-masing dan
dengan caranya masing-masing. Akibatnya, tidak semua tes memenuhi
persyaratan dari sebuah tes yang baik. Hal ini juga berpengaruh terhadap hasil tes
siswa.
Oleh karena itu, perlu dianalisis tes buatan guru yang telah digunakan
untuk mengetahui tingkat keterpenuhi persyaratan suatu tes yang baik. Apakah tes
buatan guru sudah realibel, valid, memiliki tingkat kesukaran, daya beda dan daya
pengecoh yang diharapkan. Dalam analisis tes buatan guru ini diambil tes
Matematika dan tes IPS di sekolah dasar. Tes buatan guru tersebut dianalisis
secara kuantitatif dan kualitatif.
Analisis Tes Buatan Guru 1
BAB II
TES DAN PERSYARATAN TES YANG BAIK
A. Defenisi Soal Tes
Definisi tes banyak sekali dikemukan oleh para ahli, diantaranya:
1. Menurut Arikunto, 2009:53 mengemukakan Tes merupakan alat atau
prosedur yang digunakan untuk mengetahui atau mengukur sesuatu dalam
suasana dengan cara dan aturan-aturan yang sudah ditentukan. Dalam tes
ada istilah testing yang merupakan saat pada waktu tes itu dilaksanakan,
dengan kata lain merupakan saat pengambilan tes. Kemudian ada istilah
testee yang merupakan responde yang sedang mengerjakan tes sedangkan
tester adalah orang yang diserahi untuk melakukan pengambilan tes
terhadap para responden.
2. Menurut Riduwan ( 2006: 37) tes sebagai instrumen pengumpulan data
adalah serangkaian pertanyaan / latihan yang digunakan untuk mengukur
ketrampilan pengetahuan, intelegensi, kemampuan atau bakat yang dimiliki
individu / kelompok.
3. Menurut Allen Philips (1979: 1-2) A test is commonly difined as a tool or
instrument of measurement that is used to obtain data about a specific trait
or characteristic of an individual or group.( Test biasanya diartikan sebagai
alat atau instrumen dari pengukuran yang digunakan untuk memperoleh data
tentang suatu karakteristik atau ciri yang spesifik dari individu atau
kelompok.)
4. Menurut Rusli Lutan (2000:21) tes adalah sebuah instrument yang dipakai
untuk memperoleh informasi tentang seseorang atau obyek.
Sementara Tes pertama kali diperkenalkan oleh James Ms. Cattel pada
tahun 1890.
B. Teknik Tes
1. Tes Objektif
Tes objektif adalah tes yang keseluruhan informasi yang diperlukan
untuk menjawab tes telah tersedia. Oleh karena sifatnya yang demikian
Analisis Tes Buatan Guru 2
Popham (1981:235) menyebutnya dengan istilah tes pilihan jawaban (selected
response test). Butir soal telah mengandung kemungkinan jawaban yang
harus dipilih atau dikerjakan oleh peserta tes. Kemungkinan jawaban telah
dipasok oleh pengkonstruksi tes dan peserta hanya memilih jawaban dari
kemungkinan jawaban yang telah disediakan (Zainul dan Nasoetion, 1996).
Menurut Subino (1987:4) perbedaan yang khas bentuk soal objektif
dibanding dengan soal esai adalah tugas peserta tes (testee) dalam merespons
tes. Pada tes objektif, tugas testi adalah memanipulasikan data yang telah ada
dalam butir soal. Hal ini berbeda dengan soal esai dimana testi harus
menciptakan dan mencari sendiri unsur-unsur yang dibutuhkan untuk
menjawab soal.
Sebagaimana nama yang digunakannya, soal objektif adalah soal yang
tingkat kebenarannya objektif. Oleh karenanya, tes objektif adalah tes yang
dalam pemeriksaannya dapat dilakukan secara objektif (Arikunto, 1995:165).
Karena sifatnya yang objektif maka penskorannya dapat dilakukan dengan
bantuan mesin. Soal ini tidak memberi peluang untuk memberikan penilaian
yang bergradasi karena dia hanya mengenal benar dan salah. Apabila respons
siswa sesuai dengan jawaban yang dikehendaki maka respons tersebut benar
dan biasa diberi skor 1. Apabila kondisi yang terjadi sebaliknya, maka
respons siswa salah dan biasa diberi skor 0. Jawaban siswa bersifat mengarah
kepada satu jawaban yang benar (convergence).
Merujuk kepada berbagai pendapat tentang tes objektif dapat diambil
kesimpulan bahwa tes objektif adalah tes yang semua informasi yang
diperlukan peserta tes untuk memberikan respon telah disediakan oleh
penyusun tes, sehingga peserta tes tinggal memilihnya. Jawaban yang berupa
pilihan bersifat deterministik, sehingga hanya ada dua kemungkinan
kebenaran jawaban – benar atau salah.
Soal objektif sangat bervariasi bentuknya. Variasi yang bisa dibuat dari
soal objektif adalah benar-salah, pilihan ganda, menjodohkan, melengkapi dan
jawaban singkat. Berikut akan dijelaskan macam-macam tes evaluasi hasil
belajar
Analisis Tes Buatan Guru 3
Keunggulan tes objektif adalah:
1) Tes objektif dapat digunakan untuk mengukur berpikir rendah sampai
dengan sedang ( ingatan, pemahaman, dan penerapan)
2) Dengan menggunakan tes objektif maka semua atau sebagian besar materi
yang telah diajarkan dapat ditanyakan saat ujian
3) Dengan menggunakan tes objektif maka pemberian skor pada setiap siswa
dpat dilakukan dengan cepat, tepat dan konsisten karena jawaban yang
benar untuk setiap butir soal sudah jelas dan pasti
4) Dengan tes objektif khususnya pilihan ganda, akan memungkinkan untuk
dilakukan analisis butir soal
5) Tingkat kesukaran butir soal dapat dikendalikan
6) Informasi yang diperoleh dari tes objektif lebih kaya
Sementara kelemahan dari tes objektif adalah:
1) Walaupun tes objektif dapat digunakan untuk mengukur semua berpikir
sederhana (ingatan) sampai dengan jenjang berpikir tinggi (kreasi), tetapi
pada kenyataannya butir soal yang diujikan kepada siswa atau mahasiswa
kebanyakan hanya mengukur proses berpikir rendah
2) Membuat pertanyaan tes objektif yang baik lebih sukar daripada membuat
pertanyaan tes uraian
3) Kemampuan anak dapat terganggu oleh kemampuannya dalam membaca
dan menerka
4) Anak tidak dapat mengorganisasikan, menghubungkan, dan menyatakan
idenya sendiri karena semua alternatif jawaban untuk setiap pertanyaan
sudah diberikan oleh penulis soal.
Ada beberapa macam tes objektif, diantaranya:
a. Bentuk Tes Benar Salah (True-False Test)
Tes benar salah adalah bentuk tes yang mengajukan beberapa
pernyataan yang bernilai benar atau salah. Biasanya ada dua pilihan
jawaban yaitu huruf B yang berarti pernyataan tersebut benar dan S yang
berarti pernyataan tersebut salah. Tugas peserta tes adalah menentukan
Analisis Tes Buatan Guru 4
apakah pernyataan tersebut benar atau salah. Contoh salah satu tes bentuk
subjektif adalah :
B S : Ibukota Peru berjumlah lima buah.
B S : Manado adalah Ibukota propinsi Sulawesi Utara
Kelebihan Tes Benar Salah:
1) Dapat mencakup bahan yang luas dan tidak memakan tempat yang
banyak
2) Mudah dalam penyusunannya
3) Petunjuk mengerjakannya mudah dimengerti
4) Dapat digunakan berkali-kali
5) Objektif
6) Praktis
Kelemahan Tes Benar Salah:
1) Mudah ditebak
2) Banyak masalah yang tidak dapat dinyatakan hanya dengan
kemungkinan benar atau salah
3) Reliabilitasnya rendah.
4) Hanya dapat mengungkapkan daya ingat dan pengenalan kembali
Petunjuk Penyusunan:
1) Hindari kalimat negatif, yakni kalimat yang mengandung kata “tidak”
atau “bukan”.
2) Pernyataan harus disusun sedemikian rupa sehingga siswa yang
memiliki pengertian samar-samar dapat terkecoh dalam
menjawabnya.
3) Dalam menyusun keseluruhan tes, diharapkan item yang mengandung
“salah sedikit” cukup banyak.
b. Bentuk Pilihan Ganda (Multiple Choice Test)
Tes pilihan ganda merupakan tes yang menggunakan pengertian/
pernyataan yang belum lengkap dan untuk melengkapinya maka kita harus
memilih satu dari beberapa kemungkinan jawaban benar yang telah
disiapkan.
Analisis Tes Buatan Guru 5
Apabila dilihat konstruksinya maka tes pilihan ganda terdiri dari
dua hal pokok yaitu stem atau pokok soal dengan 4 atau 5 alternatif
jawaban. Satu di antara alternatif jawaban tersebut adalah kunci jawaban.
Alternatif jawaban selain kunci disebut dengan pengecoh (distractor).
Semakin banyak alternatif jawaban yang ada (misalnya 5) maka
probabilitas menebaknya akan semakin kecil. Ada lima ragam tes pilihan
ganda yang sering digunakan yaitu:
1) Pilihan ganda biasa (melengkapi pilihan)
Bentuk ini merupakan suatu kalimat pernyataan yang belum
lengkap dan diikuti empat atau lima kemungkinan jawaban yang tepat
dan melengkapi pernyataan tersebut.
2) Hubungan antar hal (Sebab akibat)
Bentuk tes ini terdiri dari dua kalimat : satu kalimat pernyataan dan
satu kalimat alasan. Ditanyakan apakah pernyataan memiliki hubungan
sebab akibat atau tidak dengan alasan.
3) Analisa Kasus
Bentuk tes analisa kasus ini menghadapkan peserta pada satu
masalah.
4) Membaca Diagram, atau tabel
Bentuk soal ini mirip dengan bentuk pilihan ganda biasa, hanya
saja disertai dengan tabel.
5) Asosiasi pilihan ganda
Bentuk soal ini sama dengan bentuk soal melengkapi pilihan, yakni
suatu pernyataan yang tidak lengkap yang diikuti dengan beberapa
kemungkinan, hanya perbedaan pada bentuk asosiasi pilihan ganda
kemungkinan jawaban bisa lebih dari satu, sedangkan melengkapi
pilihan hanya satu yang paling tepat.
Saran Pembuatan Soal Pilihan Ganda:
1) Pernyataan dan pilihan merupakan suatu rangkaian kalimat
2) Hindari pilihan yang tidak ada kaitannya satu sama lain
3) Buat pilihan yang mirip dengan jawaban kunci
Analisis Tes Buatan Guru 6
4) Letak kunci jawaban sebaiknya tidak selalu berada pada tempat (poin)
yang sama
5) Hindari kaitan antara satu soal dengan soal lainnya
Dalam evaluasi hasil belajar, tes pilihan ganda mempunyai beberapa
kelebihan yang secara ringkas :
1) Jumlah materi yang dapat ditanyakan relatif tak terbatas dibandingkan
dengan materi yang dapat dicakup soal bentuk lainnya. Jumlah soal
yang ditanyakan umumnya relatif banyak.
2) Dapat mengukur berbagai jenjang kognitif mulai dari ingatan sampai
evaluasi.
3) Penskorannya mudah, cepat, objektif, dan dapat mencakup ruang
lingkup bahan dan materi yang luas dalam satu tes untuk suatu kelas
atau jenjang.
4. Sangat tepat untuk ujian yang peserta banyak sedangkan hasilnya
harus segera seperti ujian akhir nasional maupun ujian sekolah.
4) Reliabilitas soal pilihan ganda relatif lebih tinggi dibandingkan
dengan soal uraian.
Segi-segi kelemahan tes objektif khususnya tes objektif bentuk pilihan
ganda antara lain adalah:
1) Kurang dapat digunakan untuk kemampuan verbal.
2) Peserta didik tidak mempunyai keleluasaan dalam
menulis,mengorganisasikan, dan mengekspresikan gagasan yang
mereka miliki yang dituangkan dalam kata atau kalimatnya sendiri.
3) Tidak dapat digunakan untuk mengukur kemampuan problem solving.
4) Penyusunan soal yang baik memerlukan waktu yang relatif lama
dibandingkan dengan bentuk soal lainnya.
5) Sangat sukar menentukan alternatif jawaban yang benar-benar
homogen, logis dan berfungsi.
c. Menjodohkan (Matching Test)
Menjodohkan terdiri atas satu sisi pertanyaan dan satu sisi
jawaban, setiap pertanyaan mempunyai jawaban pada sisi sebelahnya.
Analisis Tes Buatan Guru 7
Siswa ditugaskan untuk memasangkan atau mencocokkan, sehingga setiap
pertanyaan mempunyai jawaban yang benar.
Kelebihan:
1) Dipergunakan untuk menilai bermacam-macam hal, misalnya: problem
dan penyelesaiannya, sebab akibat, istilah dan definisinya, dsb.
2) Relatif mudah disusun.
3) Jika disusun dengan baik, maka faktor menerka-nerka dapat
dihilangkan.
4) Dapat dinilai dengan mudah, cepat dan objektif.
Kelemahan:
1) Sukar menyusun test jenis ini yang benar-benar baik.
2) Untuk menilai ingatan saja.
3) Pengarahan jawaban sering terjadi
4) Memakan banyak waktu dan tenaga untuk menyusunnya.
Saran Penulisan:
1) Banyaknya jawaban di sebelah kanan lebih dari jawaban di sebelah kiri
2) Lebihnya jawaban hendaknya menunjukkan jawaban yang salah
3) Materinya setiap sisi baiknya mengenai satu pokok bahasan saja
4) Pisahkan menjadi dua kolom, kolom pertama memuat jawaban, nomor
soal dan pertanyaan. Sedangkan kolom kedua memuat kode dan pilihan
jawaban.
d. Tes Isian (Complementary Test)
Tes isian terdiri dari kalimat yang dihilangkan (diberi titik-titik).
Bagian yang dihilangkan ini yang diisi oleh peserta tes merupakan
pengertian yang diminta agar pernyataan yang dibuat menjadi pernyataan
yang benar.
Contoh:
1) Yang merupakan nama asli dari Sultan Hamengkubuwono X adalah
…..
2) Para filsuf zaman modern menegaskan bahwa pengetahuan tidak
berasal dari kitab suci atau ajaran agama, tidak juga dari para
Analisis Tes Buatan Guru 8
penguasa, tetapi dari diri manusia sendiri. Namun tentang aspek
mana yang berperan ada beda pendapat. Aliran ………………..
beranggapan bahwa sumber pengetahuan adalah rasio: kebenaran
pasti berasal dari rasio (akal). Aliran ……………, sebaliknya,
meyakini pengalamanlah sumber pengetahuan itu, baik yang batin,
maupun yang inderawi
2. Tes Subjektif
Tes subjektif (essay) adalah suatu bentuk tes yang terdiri dari
pertanyaan atau suruhan yang menghendaki jawaban yang berupa uraian-
uraian yang relatif panjang Nurkancana dan Sumartana (1986: 42). Tes
dirancang untuk mengukur hasil belajar di mana unsur-unsur yang diperlukan
untuk menjawab soal dicari, diciptakan dan disusun sendiri oleh pengambil
tes. Peserta tes harus menyusun sendiri kata-kata dan kalimat-kalimat dalam
merumuskan jawabannya. Butir soal mengandung pertanyaan atau tugas yang
jawaban atau pengerjaan soal tersebut harus dilakukan dengan cara
mengekspresikan pikiran peserta tes (Zainul dan Nasoetion, 1996 : 33).
Soal subjektif (essay) berbeda dengan soal objektif dalam
kebenarannya yang bertingkat. Jawaban tidak dinilai mulai dari 100% benar
dan 100% salah. Kebenaran bertingkat tergantung tingkat kesesuaian jawaban
siswa dengan jawaban yang dikehendaki yang dituangkan dalam kunci.
Jawaban mungkin mengarah kepada jawaban yang tidak tunggal
(divergence). Kebenaran yang dicapai bisa 0%, 20%, 30%, 50%, 70%, atau
100% tergantung ketepatan jawabannya.
Mengenai tes esai, berdasarkan berbagai pendapat dapat disimpulkan
sebagai tes yang semua unsur yang diperlukan oleh peserta tes untuk
menjawabnya harus diciptakan, dicari dan disusun sendiri. Jawaban yang
berupa subjektif menyebabkan tingkat kebenarannya berderajad, sesuai
dengan tingkat kesesuaian jawaban dengan kunci jawabannya. Secara garis
besar tes subjektif dapat dikelompokkan menjadi dua yaitu:
a. Tes subjektif terbuka (Extended respons question)
Analisis Tes Buatan Guru 9
Tes subjektif terbuka tepat digunakan untuk mengukur kemampuan
siswa dalam: menghasilkan, mengorganisasi, mengekspresikan ide;
mengintegrasikan pelajaran dalam berbagai bidang; membuat desain
eksperimen; mengevaluasi manfaat suatu ide; dan sebagainya. Pada test
subjektif bentuk terbuka, jawaban yang dikehendaki muncul dari test
sepenuhnya diserahkan kepada teste itu sendiri. Artinya, teste mempunyai
kebebasan yang seluas-luasnya dalam merumuskan,mengorganisasikan dan
menyajikan jawabannya dalam bentuk subjektif.
Contoh : “Allah telah melimpahkan nikmatnya kepada kita yang amat
banyak, sehingga kita tak mampu untuk menghitungnya. Oleh karena itu
sudah sepatuhnya kita mensyukuri nikmat tersebut kepada Allah SWT”.
Jelaskan, bagaimana caranya kita mensyukuri nikmat Allsah itu sesuai
dengan ajaran Rasulullah!
b. Tes subjektif terbatas (Restricted respons question).
Tes subjektif terbatas tepat digunakan untuk mengukur kemampuan
siswa dalam: menjelaskan hubungan sebab akibat, menerapkan suatu prinsip
atau teori, memberikan alasan yang relevan, merumuskan hipotesis, membuat
kesimpulan yang tepat, menjelaskan suatu prosedur, dan sebagainya.
Contoh: Coba jelaskan tentang peringat Hari Ulang Tahun
Kemerdekaan RI yang diadakan di Kantor Kabupaten tanggal 17 Agustus
1998 yang lalu, ceritakan mengenai :
1) Pengaturan tempat
2) Pejabat dan undangan yang hadir
3) Acara peringatan
4) Atraksi yang disuguhkan
5) Hidangan yang diberikan
c. Kelebihan dan kelemahan Tes Subjektif
Kelebihan:
1) Kekuatan soal untuk mengukur hasil belajar yang kompleks dan
melibatkan level kognitif yang tinggi.
Analisis Tes Buatan Guru 10
2) Memberi kesempatan pada anak untuk menyusun jawaban sesuai
dengan jalan pikirannya sendiri.
3) Tepat digunakan untuk melatih siswa dalam mengemukakan dan
mengorganisasi gagasan atau ide, serta lebih cepat dan mudah
membuatnya.
Kelemahan
1) Terdapat subjektivitas dalam penilaiannya karena penilai yang berbeda
atau situasi yang berbeda.
2) Tes esai menghendaki jawaban yang panjang, sehingga tidak
memungkinkan ditulis butir tes dalam jumlah banyak (soal menjadi
tidak representatif).
3) Penggunaan soal esai membutuhkan waktu koreksi yang lama dalam
menentukan nilai.
C. Soal Tes yang Memehuni Syarat
Sebuah tes dikatakan baik apabila memenuhi beberapa syarat, secara
garis besar syarat tes yang baik ada dua yaitu:
a. Hanya mengukur satu dimensi ( Unidemensionalty). Suatu tes yang
mengukur suatu bidang studi tertentu, setiap butir soal pada perangkat tes
hanya mengukur satu bidang saja. Dengan dipenuhinya persyaratan ini,
maka tes disebut valid
b. Kehandalan ( reliabilitas). Kehandalan tes meliputi kecermatan (precion)
dan keajegan (consistency) dari hasil pengukuran.
Selain syarat valid dan reliabel masih ada beberapa syarat lagi yang
perlu juga diperhatikan dalam penyusunan soal, diantaranya daya pembeda,
keseimbangan tes, efisiensi atau daya guna, obyektivitas tes, kekhususan tes,
tingkat kesulitan tes, tingkat kepercayaan tes, keadilan tes dan alokasi waktu
tes.
Langkah-langkah penyusunan tes hasil belajar:
a. Penentuan tujuan tes
b. Penyusunan kisi-kisi tes
c. Penulisan soal
Analisis Tes Buatan Guru 11
d. Penelaahan soal
e. Uji coba soal
f. Perakitas soal menjasi perangkat tes
g. Penyajian tes
h. Scoring
i. Pelaporan hasil tes
j. Pemanfaatan hasil tes
Sementara tekini penyusunan Tes Hasil Belajar adalah:
a. Kisi-kisi adalah suatu format yang dapat berupa matriks yang memuat
informasi untuk dijadikan pedoman dalam menulis soal dan merakit soal
menjadi tes. kisi-kisi disusun berdasarkan tujuan penggunaan tes. Dalam
kisi-kisi tes berisikan indicator
b. Fungsi kisi-kisi tes adalah sebagai pedoman dalam penulisan soal dan
perakitan tes. Jika kisi-kisi soal dapat dibuat dengan baik, maka penulis
soal yang berbeda akan membuat soal yang relative sama baik dam
tingkat kedalaman atau cakupan materi yang dinyatakan
Syarat-syarat kisi-kisi yang baik adalah:
a. Mewakili isi kurikulum ayng akan diujikan
b. Komponen-komponen disusun secara rinci, jelas dan mudah dipahami
c. Soal-soal dibuat sesuai dengan indicator dan bentu soal yang ditetapkan
Setelah ditentukan kisi-kisi soal, pemiliha materi yang diujikan juga
sangat menentukan tes yang baik, kriteria pemilihan materi yang diujikan
antara lain:
a. Urgensi; materi atau kompetensi yang secara teoritis, mutlak harus
dikuasai siswa ( kompetensi minimal)
b. Kuntinuitas: kompetensi yang dipilih merupakan lanjutan yang
merupakan pendalaman dari satu atau lebih kompetensi yang sudah
dikuasai sebelumnya, baik dalam jenjang yang sama antar jenjang
c. Relevansi: kompetensi/ sub kompetensi yang terpilih merupakan
kompetensi dasar yang digunakan untuk memahami materi lain
Analisis Tes Buatan Guru 12
d. Keterpakaian: kompetensi/ sub kompetensi yang terpilih memiliki nilai
terapan tinggi dalam kehidupan sehari-hari.
Setelah tes hasil belajar (THB) di tulis sesuai dengan kaidah penulisan
butir THB yang baik dan kisi-kisi yang di rencanakan, maka THB tersebut secara
teoritik sudah baik. THB yang baik harus teruji dalam dua tahap pengujian, yaitu
secara teoritik dan empiric. Untuk menguji apakah THB baik secara empirik maka
harus di lakukan uji coba untuk membakukan THB sebagai THB yang baik.
Analisis di lakukan atas data hasil uji coba baik dalam butir maupun
perangkatnya.
THB merupakan instrumen atau alat ukur yang di gunakan untuk
mengumpulka data hasil delajar dengan cara mengukur atau mengujikan nya.
Sebagai sebuah alat ukur maka THB harus memenuhi parsyaratan yang di tuntut
untuk di miliki oleh sebuah alat ukur yang baik sebagaimana alat ukur yang di
gunakan untuk mengumpulkan data dalam ilmu alam .Alat ukur pengumpulan
data harus memenuhi dua syarat yaitu validitas dan reliabilitas.
Dalam pengujian validits dan reliabilitas, THB di uji kualitas nya sebagai
sebuah perangkat secara keseluruhan .pengujian kualitas perangkat dilakukan
setelah dilakukan pengujian atas kualitas butir-butirnya. Setelah dilakukan
pemilihan butir-butir THB yang baik dan membuang butir-butir yang jelek, butir-
butir yang baik di tata sebagai sebuah perangkat. Perangkat inilah yang kemudian
di uji dalam validitas dan reliabilitas .Oleh karena itu ,sebelum pengujian kualitas
perangkat di lakukan ,terlebih dulu di periksa mutu butir-butir nya dengan
melakukam analisis butir.
D. Analisis Butir Soal Tes Hasil Belajar
Analisis butir dapat di lakukan dengan salah satu dari dua cara tergantung
teori tes yang di gunakan .Teori tes itu dapat berupa teori tes klasik atau
modern .Dewasa ini karenaketerbatasan yang di miliki oleh teori tes klasik maka
di kembang kan teori tes modern .Namun begitu ,teori tes klasik masih lebih
sering di gunakan karena penggunaannya yang lebih mudah ,di saamping teori tes
Analisis Tes Buatan Guru 13
modern masih dalam proses pengembangan .Oleh karena itu ,pada bagian ini akan
di bahas analisis butir tes menggunakanteori tes klasik.
1. Analisis Kuantitatif
Analisis kuantitatif maksudnya adalah penelaahan butir soal didasarkan
pada data empirik dari butir soal yang bersangkutan. Data empirik ini diperoleh
dari soal yang telah diujikan. Analisis kuantitatif mencakup validitas butir soal,
indeks kesukaran , daya pembeda, reliabilitas tes dan daya pengecoh.
a. Analisis Kuantitatif Soal Pilihan Ganda
Analisis kuantitatif untuk soal pilihan ganda dapat dilakukan secara
manual dan menggunakan program Anates. Rumus yang digunakan, untuk
menentukan validitas butir soal, indeks kesukaran, daya pembeda, reliabilitas tes
dan daya pengecoh dapat dilihat pada penjelasan berikut ini.
1) Validitas Tes
Validitas berkenaan dengan ketetapan alat penilaian terhadap konsep
yang dinilai sehingga betul-betul menilai apa yang yang seharusnya dinilai.
Sebagai contoh menilai kemampuan siswa dalam matematika. Misalnya
diberikan soal dengan kalimat yang panjang dan berbelit-belit sehingga sukar
ditangkap maknanya. Akhirnya siswa tidak dapat menjawab karena tidak
memahami pertanyaannya. Contoh lain adalah menilai kemampuan berbicara,
tetapi ditanyakan mengenai tata bahasa atau kesusastraan seperti puisi atau
sajak. Penilaian tersebut tidak tepat (valid). Validitas tidak berlaku universal
sebab bergantung pada situasi dan tujuan penilaian. Alat penilaian yang telah
valid untuk suatu tujuan tertentu belum otomatis akan valid untuk tujuan yang
lain.
Contoh prestasi belajar dan motivasi belajar dapat dinilai oleh tes
ataupun oleh kuesioner. Caranya juga bisa berbeda, bisa dilaksanakan secara
tertulis atau bisa secara lisan. Ketentuan penting dalam evaluasi adalah bahwa
hasilnya harus sesuai dengan keadaan yang dievaluasi. Mengevaluasi dapat
diumpamakan sebagai pekerjaan memotret. Gambar potret atau foto
dikatakan baik apabila sesuai dengan aslinya. Gambar pemotretan hasil
Analisis Tes Buatan Guru 14
evaluasi tersebut di dalam kegiatan evaluasi dikenal dengan data evaluasi.
Data evaluasi yang baik sesuai dengan kenyataan disebut data valid. Agar
dapat dieroleh data yang valid, instrumen atau alat untuk mengevaluasinya
harus valid. Jika pernyataan tersebut dibalik, instrumen evaluasi dituntut
untuk valid karena diinginkan dapat diperoleh data yang valid. Dengan kata
lain, instrumen evaluasi dipersyaratkan valid agar hasil yang diperoleh dari
kegiatan evaluasi valid.
Di dalam buku Encyclopedia of Educational Evaliation yang ditulis
oleh Scarvia B. Anderson dan kawan-kawan disebutkan: A test is valid if it
measures what it purpose to measure. Atau jika diartikan lebih kurang
demikian: sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang
hendak diukur. Dalam bahasa Indonesia “valid” disebut dengan istilah
“sahih”.
Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu
sendiri tetapi pada hasil pengetesan atau skornya. Contoh: Skor yang
diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan
kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan
pengetahuan orang tersebut dalam hal yang berkaitan dengan mobil. Tes yang
mengukur pengetahuan tentang mobil bukanlah tes yang sahih untuk
mekanik.
Validitas sebuah tes dapat diketahui dari hasil pemikiran dan dari hasil
pengalaman. Hal yang pertama akan diperoleh validitas logis (logical
validity) dan hal yang kedua diperoleh validitas empiris (empirical validity).
Dua hal inilah yang dijadikan dasar pengelompokan validitas tes. Secara garis
besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.
a) Validitas Logis
Istilah “validitas logis” mengandung kata “logis” berasal dari kata
“logika” atau validitas logis sering juga disebut sebagai analisis kualitatif
yaitu berupa penalaran atau penelaahan. Dengan makna demikian maka
validitas logis untuk sebuah instrumen yang memenuhi persyaratan valid
berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi
Analisis Tes Buatan Guru 15
karena instrumen yang bersangkutan sudah dirancang secara baik,
mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas
lain misalnya membuat sebuah karangan, jika penulisan sudah mengikuti
aturan mengarang, tentu secara logis karangannya sudah baik.
Berdasarkan penjelasan tersebut maka instrumen yang sudah disusun
berdasarkan teori penyusunan instrumen, secara logis sudah valid. Dari
penjelasan tersebut dapat dipahami bahwa validitas logis dapat dicapai
apabila instrumen disusun mengikuti ketentuan yang ada. Dengan
demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji
kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai
disusun.
Ada dua macam validitas logis yang dapat dicapai oleh sebuah
instrumen, yaitu validitas isi dan validitas konstrak (construct validity).
Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah
instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi.
Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi
sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek
kejiwaan yang seharusnya dievaluasi.
Untuk menganalisis soal ditinjau dari segi teknis, isi, dan
editorial. Analisis secara teknis dimaksudkan sebagai penelaahan soal
berdasarkan prinsip-prinsip pengukuran dan format penulisan soal.
Analisis secara isi dimaksudkan sebagai penelaahan khusus yang
berkaitan dengan kelayakan pengetahuan yang ditanyakan. Analisis
secara editorial dimaksudkan sebagai penelaahan yang khususnya
berkaitan dengan keseluruhan format dan keajegan editorial dari soal
yang satu ke soal yang lainnya.
Analisis kualitatif lainnya dapat juga dikategorikan dari segi
materi, konstruksi, dan bahasa. Analisis materi dimaksudkan sebagai
penelaahan yang berkaitan dengan substansi keilmuan yang ditanyakan
dalam soal serta tingkat kemampuan yang sesuai dengan soal. Analisis
konstruksi dimaksudkan sebagai penelaahan yang umumnya berkaitan
Analisis Tes Buatan Guru 16
dengan teknik penulisan soal. Analisis bahasa dimaksudkan sebagai
penelaahan soal yang berkaitan dengan penggunaan bahasa Indonesia
yang baik dan benar menurut EYD. Melalui analisis kualitatif dapat
diketahui berfungsi tidaknya sebuah soal.
b) Validitas Empiris
Istilah “validitas empiris” memuat kata “empiris” yang artinya
“pengalaman”. Sebuah instrumen dapat dikatakan memiliki validitas
empiris apabila sudah diuji dari pengalaman. Analisis soal secara
kuantitatif menekankan pada analisis karakteristik internal tes melalui
data yang diperoleh secara empiris. Karakteristik internal secara
kuantitatif dimaksudkan meliputi parameter soal tingkat kesukaran, daya
pembeda dan reliabilitas. Khusus soal-soal pilihan ganda, dua tambahan
parameter yaitu dilihat dari peluang untuk menebak atau menjawab soal
benar dan berfungsi tidaknya pilihan jawaban, yaitu penyebaran semua
alternative jawaban dari subyek-subyek yang dites. Salah satu tujuan
dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu
apakah suatu soal dapat diterima karena telah didukung oleh data statistik
yang memadai, diperbaiki karena terbukti terdapat beberapa kelemahan
atau bahkan tidak digunakan sama sekali karena terbukti secara empiris
tidak berfungsi sama sekali.
Sebagai contoh sehari-hari, sesorang dapat diakui jujur oleh
masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut
memang jujur. Contoh lain, seseorang dapat dikatakan kreatif apabila
dari pengalaman dibuktikan bahwa orang tersebut sudah banyak
menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah
ada. Dari penjelasan dan contoh-contoh tersebut diketahui bahwa
validitas empiris tidak dapat diperoleh hanya dengan menyusun
instrumen berdasarkan ketentuan seperti halnya validitas logis, tetapi
harus dibuktikan melalui pengalaman.
Ada dua macam validitas empiris, yakni ada dua cara yang dapat
dilakukan untuk menguji bahwa sebuah instrumen memang valid.
Analisis Tes Buatan Guru 17
Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen
yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang
digunakan sebagai pembanding kondisi instrumen dimaksud ada dua cara,
yaitu yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu
yang akan datang. Bagi instrumen yang kondisinya sesuai dengan
kriterium yang sudah ada tersedia, yang sudah ada disebut memiliki
validitas “ada sekarang”, yang ada dalam istilah bahasa inggris disebut
memiliki concurrent validity. Selanjutnya instrumen yang kondisinya
sesuai dengan kriterium yang diramalkan akan terjadi, disebut memiliki
validitas ramalan atau validitas prediksi, yang dalam istilah bahasa inggris
disebut memiliki predictive validity.
Ada empat jenis validitas yang sering digunakan, yakni:
a) Validitas isi (content validity)
Sebuah tes dikatakan memilki validitas isi apabila mengukur tujuan
khusus tertentu yang sejajar dengan materi atau isis pelajaran yang
diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum
maka validitas isi ini sering juga disebut validitas kurikuler.
Validitas isi berkenaan dengan kesanggupan alat penilaian data
mengukur isi yang seharusnya. Artinya, tes tersebut mampu
mengungkapkan isi suatu konsep atau variabel yang hendak diukur.
Misalnya tes hasil belajar bidang studi IPS harus bisa mengungkapkan isi
bidang studi tersebut. Hal ini bisa dilakukan dengan cara menyusun tes
yang bersumber dari kurikulum bidang studi yang hendak diukur.
Disamping kurikulum dapat juga diperkaya dengan melihat atau mengkaji
buku sumber.
Tes hasil belajar tidak mungkin dapat mengungkapkan semua
materi yang ada dalam bidang studi tertentu sekalipun hanya untuk satu
semester. Oleh sebab itu, harus diambil sebagian dari materi dalam bentuk
sampel tes. Sampel harus dapat mencerminkan materi yang terkandung
dalam sseluruh materi bidang studi. Cara yang ditempuh dalam
menetapkan sampel tes adalah memilih konsep-konsep materi yang
Analisis Tes Buatan Guru 18
esensial. Misalnya menetapkan sejumlah konsep dari setiap pokok bahasan
yang ada. Dari setiap konsep dikembangkan beberapa pertanyaan tes.
Disinilah pentingnya peranan kisi-kisi sebagai alat untuk memenuhi
validitas isi. Dalam hal tertentu untuk tes yang telah disusun sesuai dengan
kurikulum (materi dan tujuannya) agar memenuhi validitas isi, dapat pula
dimintakan bantuan ahli bidang studi untuk menelaah apakah konsep
materi yang diajukan telah memadai atau tidak sebagai sampel tes. Dengan
demikian validitas isi tidak memerlukan uji coba dan analisis statistic atau
dinyatakan dalam bentuk angka-angka.
b) Validitas konstruksi (construct validity)
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-
butir soal yang membangun tes tersebut mengukur setiap aspek berfikir
seperti yang disebutkan dalam tujuan instruksional khusus. Dengan kata
lain jika butir-butir soal mengukur aspek berfikir tersebut sudah sesuai
dengan aspek berfikir yang menjadi tujuan instruksional.
Sebagai contoh jika rumusan Tujuan Instruksional Khusus (TIK).
“Siswa dapat membandingkan antara efek biologis dan efek psikologis”,
maka butir soal pada tes merupakan perintah agar siswa membedakan
anatar dua efek tersebut.
“Konstruksi” dalam pengertian ini bukanlah “susunan” seperti
yang sering dijumpai dalam teknik, tetapi merupakan rekaan psikologis
yaitu suatu rekaan yang dibuat oleh para ahli ilmu jiwa yang dengan suatu
cara tertentu “memerinci” isi jiwa atas beberapa aspek seperti ingatan
(pengetahuan), pemahaman, aplikasi dan seterusnya. Dalam hal ini,
mereka menganggap seolah-olah jiwa dapat dibagi-bagi. Tetapi
sebenarnya tidak demikian. Pembagian ini hanya merupakan tindakan
sementara untuk mempermudah mempelajari.
Seperti halnya validitas isi, validitas konstruksi dapat diketahui
dengan cara memerinci dan memasangkan setiap butir soal dengan setiap
aspek dalam TIK. Pengerjaannya dilakukan berdasarkan logika bukan
pengalaman.
Analisis Tes Buatan Guru 19
c) Validitas “ada sekarang” (concurrent validity)
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah
tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan
pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan.
Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman
selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut
sekarang sudah ada (ada sekarang, concurrent).
Dalam membandingkan hasil sebuah tes maka diperlukan suatu
kriterium atau alat banding. Maka hasil tes merupakan sesuatu yang
dibandingkan. Untuk jelasnya di bawah ini dikemukakan sebuah contoh.
Misalnya seorang guru ingin mengetahui apakah tes sumatif yang
disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium
masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan harian
atau nilai ulangan sumatif yang lalu.
d) Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dengan meramal selalu mengenai
hal yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan
memiliki validitas prediksi atau validitas ramalan apabila mempunyai
kemampuan untuk meramalkan apa yang akan terjadi pada masa yang
akan datang.
Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang
diperkirakan mampu meramalkan keberhasilan peserta tes dalam
mengikuti kuliah di masa yang akan datang. Calon yang tersaring
berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya
kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin
keberhasilannya kelak. Sebaliknya seorang calon dikatakan tidak lulus tes
karena memiliki nilai tes yang rendah jadi diperkirakan akan tidak mampu
menikuti perkuliahan yang akan datang.
Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang
diperoleh setelah peserta tes mengikuti pelajaran di Perguruan Tinggi. Jika
ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian
Analisis Tes Buatan Guru 20
semester 1 dibandingkan dengan yang dahulu nilai tesnya lebih rendah
maka tes masuk yang dimaksud tidak memiliki validitas prediksi.
Sekali lagi diulangi bahwa sebuah tes dikatakan memiliki validitas jika
hasilnya sesuai dengan kriterium, dalam arti memiliki kesejajaran antara hasil tes
tersebut dengan kriterium. Teknik yang digunakan untuk mengetahui kesejajaran
adalah teknik korelasi product moment yang dikemukakan oleh Pearson.
rxy =
keterangan :
r : koefisien validitas
N : banyaknya siswa
X: Skor item
Y: Skor Total
Kriteria yang digunakan untuk menentukan validitas butir soal terdapat
pada Tabel berikut.
Tabel 2. Kriteria Validitas Tes
Nilai r Interpretasi
0,80 – 1,00 Sangat tinggi
0,60 – 0,80 Tinggi
0,40 – 0,60 Cukup
0,20 – 0,40 Rendah
0,00 – 0,20 Sangat rendah
2) Indeks Kesukaran
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal
pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks.
Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi
yang besarnya berkisar 0,00 - 1,00 (Aiken (1994: 66). Semakin besar indeks
tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal
itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada siswa yang menjawab
Analisis Tes Buatan Guru 21
benar dan bila memiliki TK= 1,00 artinya bahwa siswa menjawab benar.
Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada
prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang
bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan
untuk soal obyektif. Rumusnya adalah seperti berikut ini (Nitko, 1996: 310).
Fungsi tingkat kesukaran butir soal biasanya dikaitkan dengan tujuan tes.
Misalnya untuk keperluan ujian semester digunakan butir soal yang memiliki
tingkat kesukaran sedang, untuk keperluan seleksi digunakan butir soal yang
memiliki tingkat kesukaran tinggi/sukar, dan untuk keperluan diagnostik biasanya
digunakan butir soal yang memiliki tingkat kesukaran rendah atau mudah.
3) Daya Pembeda
Daya pembeda soal adalah kemampuan suatu butir soal dapat
membedakan antara siswa yang telah menguasai materi yang ditanyakan dan
siswa yang tidak atau kurang atau belum menguasai materi yang ditanyakan.
Manfaat daya pembeda butir soal adalah seperti berikut ini. 1) Untuk
meningkatkan mutu setiap butir soal melalui data empiriknya. Berdasarkan indeks
daya pembeda, setiap butir soal dapat diketahui apakah butir soal itu baik, direvisi,
atau ditolak. 2) Untuk mengetahui seberapa jauh setiap butir soal dapat
mendeteksi/membedakan kemampuan siswa, yaitu siswa yang telah memahami
atau belum memahami materi yang diajarkan guru. Apabila suatu butir soal tidak
dapat membedakan kedua kemampuan siswa itu, maka butir soal itu dapat
dicurigai "kemungkinannya" seperti berikut ini.
a) Kunci jawaban butir soal itu tidak tepat.
b) Butir soal itu memiliki 2 atau lebih kunci jawaban yang benar
c) Kompetensi yang diukur tidak jelas
d) Pengecoh tidak berfungsi
Analisis Tes Buatan Guru 22
e) Materi yang ditanyakan terlalu sulit, schingga banyak siswa yang
menebak
f) Sebagian besar siswa yang memahami materi yang ditanyakan berpikir
ada yang salah informasi dalam butir soalnya
Indeks daya pembeda setiap butir soal biasanya juga dinyatakan dalam
bentuk proporsi. Semakin tinggi indeks daya pembeda soal berarti semakin
mampu soal yang bersangkutan membedakan siswa yang telah memahami materi
dengan peserta didik yang belum memahami materi. Indeks daya pembeda
berkisar antara -1,00 sampai dengan +1,00. Semakin tinggi daya pembeda suatu
soal, maka semakin kuat/baik soal itu. Jika daya pembeda negatif (<0) berarti
lebih banyak kelompok bawah (warga belajar/peserta didik yang tidak memahami
materi) menjawab benar soal dibanding dengan kelompok atas (warga
belajar/peserta didik yang memahami materi yang diajarkan guru).
Untuk mengetahui daya pembeda soal bentuk pilihan ganda adalah dengan
menggunakan rumus berikut ini.
Keterangan:
DP = Daya pembeda
BA = jumlah jawaban benar pada kelompok atas
BB = jumlah jawaban benar pada kelompok bawah
N = Banyak siswa
4) Reliabilitas
Sudah diterangkan dalam persyaratan tes, bahwa reliabilitas berhubungan
dengan masalah kepercayaan. Suatu tes dapat dikatakan mempunyai taraf
kepercayaan yang tinggi jika tes tersebut dapat memberikan hasil yang tetap.
Maka pengertian reliabilitas tes, berhubungan dengan masalah ketetapan hasil tes.
Atau seandainya hasilnya berubah-ubah, perubahan yang terjadi dapat dikatakan
tidak berarti.
Analisis Tes Buatan Guru 23
Konsep tentang reliabilitas ini tidak akan sulit dimengerti apabila pembaca
telah memahami konsep validitas. Tuntutan bahwa instrumen evaluasi harus valid
menyangkut harapan diperolehnya data yang valid, sesuai dengan kenyataan.
Dalam hal reliabilitas ini tuntutannya tidak jauh berbeda. Jika validitas terkait
dengan ketepatan objek yang tidak lain adalah tidak menyimpangnya data dari
kenyataan, artinya bahwa data tersebut benar, maka konsep reliabilitas terkait
dengan pemotretan berkali-kali. Instrumen yang baik adalah instrumen yang dapat
dengan ajeg memberikan data yang sesuai dengan kenyataan.
Yang sering ditangkap kurang tepat bagi pembaca adalah adanya pendaat
bahwa “ajeg” atau “tetap” diartikan sebagai “sama”. Dalam pembicaraan evaluasi
ini tidak demikian. Ajeg atau tetap tidak selalu harus sama, tetapi mengikuti
perubahan secara ajeg. Jika keadaan si A mula-mula berada lebih rendah
dibandingkan dengan B, maka jika diadakan pengukuran ulang, si A juga berada
lebih rendah dari B. Itulah yang dikatakan ajeg atau tetap, yaitu sama dalam
kedudukan siswa di antara anggota kelompok yang lain. Tentu saja tidak dituntut
semuanya tetap. Besarnya ketetapan itulah menunjukkan tingginya reliabilitas
instrumen.
Sehubungan dengan reliabilitas ini, Scarvia B. Anderson dan kawan-
kawan menyatakan bahwa persyaratan bagi tes, yaitu validitas dan reliabilitas ini
penting. Dalam hal ini validitas lebih penting, dan reliabilitas ini perlu, karena
menyokong terbentuknya validitas. Sebuah tes mungkin reliable tetapi tidak valid.
Sebalinya, sebuah tes yang valid biasanya reliable.
A reliable measure in one that provides consistent and stable indication of
the characteristic being investigated. Untuk dapat memperoleh gambaran yang
ajeg memang sulit karena unsur kejiwaan manusia itu sendiri tidak ajeg. Misalnya
kemampuan, kecakapan, sikap dan sebagainya berubah-ubah dari waktu ke waktu.
Beberapa hal yang sedikit banyak mempengaruhi hasil tes banyak sekali.
Namun secara garis besar dapat dikelompokkan menjadi 3 hal:
a) Hal yang berhubungan dengan tes itu sendiri, yaitu panjang tes dan kualitas
butir-butir soalnya. Tes yang terdiri dari banyak butir, tentu saja lebih valid
dibandingkan dengan tes yang hanya terdiri dari beberapa butir soal. Tinggi
Analisis Tes Buatan Guru 24
rendahnya validitas menunjukkan tinggi rendahnya reliabilitas tes. Dengan
demikian maka semakin panjang tes, maka reliabilitasnya semakin tinggi.
Dalam menghitung besarnya reliabilitas berhubung dengan penambahan
banyaknya butir soal dalam tes ini ada sebuah rumus yang diberikan oleh
Spearman dan Brown sehingga terkenal dengan rumus Spearman – Brown.
b) Hal yang berhubungan dengan tercoba (testee).
Suatu tes yang dicobakan kepada kelompok yang terdiri dari banyak siswa
akan mencerminkan keragaman hasil yang menggambarkan besar-kecilnya
reliabilitas tes. Tes yang dicobakan kepada bukan kelompok terpilih, akan
menunjukkan reliabilitas yang lebih besar daripada yang dicobakan pada
kelompok tertentu yang diambil secara dipilih.
c) Hal yang berhubungan dengan penyelenggaraan tes
Sudah disebutkan bahwa faktor penyelenggaraan tes yang bersifat
administrative sangat menentukan hasil tes.
Sekali lagi reliabilitas adalah ketetapan suatu tes apabila diteskan kepada
subjek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat
kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus
korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam
reliabilitas tes.
Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada di
luar tes (consistency eternal) dan pada tes itu sendiri (consistency internal).
1) Metode bentuk paralel (equivalent)
Tes paralel atau tes equivalent adalah dua buah tes yang mempunyai
kesamaan tujuan, tingkat kesukaran dan susunan, tetapi butir-butir soalnya
berbeda. Dalam istilah bahasa Inggris disebut alternative-form method (parallel
forms).
Dengan metode bentuk parallel ini, dua buah tes yang paralel misalnya tes
Matematika seri A yang akan dicari reliabilitasnya dan tes seri B diteskan kepada
sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien
korelasi dari kedua hasil tes inilah yang menunjukkan koefisien reliabilitasnya tes
Analisis Tes Buatan Guru 25
seri A. jika koefisiennya tinggi maka tes tersebut sudah reliable dan dapat
digunakan sebagai alat pengetes yang terandalkan.
Dalam menggunakan metode tes paralel ini pengetes harus menyiapkan
dua buah tes dan masing-masing dicobakan pada kelompok siswa yang sma. Oleh
karena itu, ada orang menyebutkan sebagai double test-double-trial method.
Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes
sehingga tidak ada faktor “masih ingat soalnya” yang dlam evaluasi disebut
adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh
pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat
karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama
untuk mencobakan dua kali tes.
2) Metode tes ulang (test-retest method)
Metode tes ulang dilakukan orang untuk menghindari penyusunan dua seri
tes. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu
seri tetapi dicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua
kali, maka metode ini dapat disebut dengan single-test-double-trial method.
Kemudian hasil dari kedua kali tes tersebut dihitung korelasinya.
Untuk tes yang banyak mengungkap pengetahuan (ingatan) dan
pemahaman, cara ini kurang mengena karena tercoba akan masih ingat akan butir-
butir soalnya. Ooleh karena itu, tenggang waktu antara pemberian tes pertama
dengan kedua menjadi permasalahan tersendiri. Jika tenggang waktu terlalu
sempit, siswa masih banyak ingat materi. Sebaliknya kalau tenggang waktu terlalu
lama, maka faktor-faktor atau kondisi tes sudah akan berbeda dan siswa sendiri
barangkali sudah mempelajari sesuatu. Tentu saja faktor-faktor ini akan
berpengaruh pula terhadap reliabilitas.
Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil
tes pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya
practice effect dan carry over effect. Yang penting adalah adanya kesejahteraan
hasil atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.
Tes Pertama Tes Kedua
Analisis Tes Buatan Guru 26
Siswa Skor Ranking Skor Ranking
ABCDE
152091812
31524
2025152318
31524
Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh
semua siswa. Metode ini juga disebut self-correlation method (korelasi diri
sendiri) karena mengkorelasikan hasil dari tes yang sama.
3) Metode belah dua atau split-half method
Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu-tes
dua kali percobaan diatasi dengan metode ketiga ini yaitu metode belah dua.
Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan
dicobakan satu kali. Oleh karena itu, disebut juga single-test-single-trial method.
Berbeda dengan metode pertama dan kedua yang setelah diketemukan
koefisien korelasi langsung ditafsirkan itulah koefisiensi reliabilita, maka dengan
ketiga metode ini tidak dapat demikian. Pada waktu membelah dua dan
mengkorelasikan dua belahan, baru diketahui reliabilitas separo tes. Untuk
mengetahui reliabilitas seluruh tes harus digunakan rumus Spearman-Brown
sebagai berikut:
Banyak pemakai metode ini salah membela hasil tes pada waktu,
menganalisis. Yang mereka lakukan adalah mengelompokkan hasil separo subjek
peserta tes dan separo yang lain kemudian hasil kedua kelompok ini
dikorelasikan. Yang benar adalah membelah item atau butir soal. Tidak akan
keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir soal
harus genap agar dapat dibelah.
Ada dua cara membelah butir soal ini, yaitu:
a)Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut
belahan ganjil-genap, dan
b)Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada
nomor-nomor awal dan separo pada nomor-nomor akhir yang selanjutnya
disebut belahan awal-akhir.
Analisis Tes Buatan Guru 27
Untuk menentukan koefisien reliabelitas digunakan rumus alpha yang
dinyatakan oleh Arinkunto (2012:122).
Keterangan :
= reliabilitas yang dicari
= jumlah variansi skor tiap-tiap item
= variansi total
= jumlah butir soal
Dengan kriteria sebagai berikut :
0.80 < < 1.00 reliabilitas tinggi sekali
0.60 < < 0.80 reliabilitas tiggi
0.40 < < 0.60 reliabilitas sedang
0.20 < < 0.40 reliabilitas rendah
0.0 < 0.20 sangat rendah
5) Daya Pengecoh ( Distraktor )
Pengecoh adalah suatu pola yang menggambarkan bagaimana peserta tes
menentukan pilihan jawabannya terhadap kemungkinan-kemungkinan jawaban
yang telah dipasangkan pada setiap butir soal. Pengecoh bertujuan untuk
mengecoh mereka yang kurang mampu ( tidak tahu ) untuk dibedakan dengan
yang mampu (lebih tahu). Pengecoh berfungsi dengan baik jika sudah dipilih oleh
lebih dari 5% pengikut tes ( p > 5%) dan jika kurang atau sama dengan 5%
berarti pengecoh tidak berfungsi dengan baik.
Tujuan utama dari pemasangan pengecoh pada setiap butir soal adalah
agar dari sekian banyak siswa yangmengikuti tes hasil belajar ada yang tertarik
atau terangsang untuk memilihnya, sebab mereka menyangka bahwa pengecoh
yang mereka pilih merupakan jawaban yang betul. Dengan kata lain, pengecoh
baru dapat dikatakan telah dapat menjalankan fungsinya dengan baik apabila
Analisis Tes Buatan Guru 28
pengecoh tersebut telah memiliki daya rangsang yang tinggi sehingga siswa
merasa bimbang dan ragu sehingga akhirnya mereka terkecoh untuk memilih
pengecoh untuk memilih jawaban yang betul, sebab mereka mengira yang mereka
pilih itu adalah kunci jawaban item, padahal bukan
b. Analisis Soal Essay
1) Validitas Butir Tes
Untuk menguiji validitas setiap butir soal maka skor-skor yang ada pada
butir yang dimaksud dikorelasikan dengan skor totalnya. Skor tiap butir soal
dinyatakan dengan X dan skot total dinyatakan sebagai skor Y, dengan
diperolehnya indeks validitas setiap butir soal, dapat diketahui butir-butir soal
manakah yang memenuhi syarat dilihat dari indeks validitasnya
(Arikunto,2012:87). Untuk menghitung koefisien korelasi tersebut digunakan
rumus Produk Momen Pearson, yaitu :
rxy =
keterangan :
r : koefisien validitas
N : banyaknya siswa
X: Skor item
Y: Skor Total
Kriteria yang digunakan untuk menentukan validitas butir
soal terdapat pada Tabel 2.
Tabel 2. Kriteria Validitas Tes
Nilai r Interpretasi0,80 – 1,00 Sangat tinggi0,60 – 0,80 Tinggi0,40 – 0,60 Cukup
Analisis Tes Buatan Guru 29
0,20 – 0,40 Rendah0,00 – 0,20 Sangat rendah
2) Indeks Kesukaran
Untuk menentukan indeks kesukaran ( ) soal essay dapat digunakan
rumus yang dinyatakan oleh Prewironegoro (1985:14) adalah sebagai berikut :
Keterangan : = Indeks kesukaran soal = Jumlah Skor dari kelompok tinggi = Jumlah skor dari kelompok rendah
= Skor setiap soal jika benar = Banyak peserta tes
= 27% x N
Dengan kriteria :
< 27% Soal sukarSoal sedang
> 73% Soal mudah
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi
guru dan kegunaan bagi pengujian dan pengajaran (Nitko, 1996: 310-313).
Kegunaannya bagi guru adalah: (1) sebagai pengenalan konsep terhadap
pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar
mereka, (2) memperoleh informasi tentang penekanan kurikulum atau mencurigai
terhadap butir soal yang bias. Adapun kegunaannya bagi pengujian dan
pengajaran adalah: (a) pengenalan konsep yang diperlukan untuk diajarkan ulang,
(b) tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah, (c)
memberi masukan kepada siswa, (d) tanda-tanda kemungkinan adanya butir soal
yang bias, (e) merakit tes yang memiliki ketepatan data soal. Di samping kedua
kegunaan di atas, dalam konstruksi tes, tingkat kesukaran butir soal sangat penting
karena tingkat kesukaran butir dapat: (1) mempengaruhi karakteristik distribusi
skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan
korelasi antarsoal), (2) berhubungan dengan reliabilitas. Menurut koefisien alfa
Analisis Tes Buatan Guru 30
clan KR-20, semakin tinggi korelasi antarsoal, semakin tinggi reliabilitas
(Nunnally, 1981: 270-271).
3) Daya Pembeda
Untuk menghitung daya pembeda soal essay, dengan cara sebagai berikut :
a) Data diurutkan dari nilai tertinggi sampai nilai terendah
b) Kemudian diambil 27 % dari kelompok yang mendapat nilai tertinggi dan
27% dari kelompok yang mendapat nilai rendah
c) Hitung degress of freedom (df) dengan rumus :
, dimana
Rumus daya pembeda soal adalah sebagai berikut.
Keterangan :
Indeks Pembeda soal
Rata-rata skor kelompok tinggi
Rata-rata kelompok rendah
Jumlah kuadrat deviasi kelompok tinggi
= Jumlah kuadrat deviasi skor kelompok rendah
N = Banyak peserta tes
Suatu soal mempunyai daya pembeda yang berarti (signifikan) jika
hitung tabel pada df yang telah ditentukan (Prawironegoro, 1985:11).
4) Reliabilitas Tes
Reliabilitas tes adalah ukuran apakah tes tersebut dapat dipercaya. Suatu
tes dikatakan reliable apabila beberapa kali pengujian menunjukan hasil yang
reliable sama. Untuk menentukan koefisien reliabelitas digunakan rumus alpha
yang dinyatakan oleh Arinkunto (2012:122)
Analisis Tes Buatan Guru 31
Keterangan :
= reliabilitas yang dicari
= jumlah variansi skor tiap-tiap item
= variansi total
= jumlah butir soal
Dengan kriteria sebagai berikut :
0.80 < < 1.00 reliabilitas tinggi sekali
0.60 < < 0.80 reliabilitas tiggi
0.40 < < 0.60 reliabilitas sedang
0.20 < < 0.40 reliabilitas rendah
1.0 < 0.20 sangat rendah
2. Analisis Kualitatif
Pada prinsipnya analisis butir soal secara kualitatif dilaksanakan
berdasarkan kaidah penulisan soal (tes tertulis, perbuatan, dan sikap). Penelaahan
ini biasanya dilakukan sebelum soal digunakan/diujikan.
Aspek yang diperhatikan di dalam penelaahan secara kualitatif ini adalah
setiap soal ditelaah dari segi materi, konstruksi, bahasa/budaya, dan kunci
jawaban/pedoman penskorannya. Dalam melakukan penelaahan setiap butir soal,
penelaah perlu mempersiapkan bahan-bahan penunjang seperti: (1) kisi-kisi
tes, (2) kurikulum yang digunakan, (3) buku sumber, dan (4) kamus bahasa
Indonesia.
a. Teknik Analisis Secara Kualitatif
Ada beberapa teknik yang dapat digunakan untuk menganalisis butir soal
secara kualitatif, diantaranya adalah teknik moderator dan teknik panel.Teknik
moderator merupakan teknik berdiskusi yang di dalamnya terdapat satu orang
sebagai penengah. Berdasarkan teknik ini, setiap butir soal didiskusikan secara
bersama-sama dengan beberapa ahli seperti guru yang mengajarkan materi, ahli
materi, penyusun/pengembang kurikulum, ahli penilaian, ahli bahasa, berlatar
belakang psikologi. Teknik ini sangat baik karena setiap butir soal dilihat secara
bersama-sama berdasarkan kaidah penulisannya. Di samping itu, para penelaah
Analisis Tes Buatan Guru 32
dipersilakan mengomentari/ memperbaiki berdasarkan ilmu yang dimilikinya.
Setiap komentar/masukan dari peserta diskusi dicatat oleh notulis. Setiap butir
soal dapat dituntaskan secara bersama-sama, perbaikannya seperti apa. Namun,
kelemahan teknik ini adalah memerlukan waktu lama untuk rnendiskusikan setiap
satu butir soal.
Teknik panel merupakan suatu teknik menelaah butir soal yang setiap
butir soalnya ditelaah berdasarkan kaidah penulisan butir soal, yaitu ditelaah dari
segi materi, konstruksi, bahasa/budaya, kebenaran kunci jawaban/pedoman
penskorannya yang dilakukan oleh beberapa penelaah. Caranya adalah beberapa
penelaah diberikan: butir-butir soal yang akan ditelaah, format penelaahan, dan
pedoman penilaian/ penelaahannya. Pada tahap awal para penelaah diberikan
pengarahan, kemudian tahap berikutnya para penelaah berkerja sendiri-sendiri
di tempat yang tidak sama. Para penelaah dipersilakan memperbaiki langsung
pada teks soal dan memberikan komentarnya serta memberikan nilai pada setiap
butir soalnya yang kriterianya adalah: baik, diperbaiki, atau diganti.
Secara ideal penelaah butir soal di samping memiliki latar belakang
materi yang diujikan, beberapa penelaah yang diminta untuk menelaah butir soal
memiliki keterampilan, seperti guru yang mengajarkan materi itu, ahli
materi, ahli pengembang kurikulum, ahli penilaian, psikolog, ahli bahasa, ahli
kebijakan pendidikan, atau lainnya.
Dalam menganalisis butir soal secara kualitatif, penggunaan format
penelaahan soal akan sangat membantu dan mempermudah prosedur
pelaksanaannya. Format penelaahan soal digunakan sebagai dasar untuk
menganalisis setiap butir soal. Agar penelaah dapat dengan mudah
menggunakan format penelaahan soal, maka para penelaah perlu
memperhatikan petunjuk pengisian formatnya. Petunjuknya adalah seperti
berikut ini.
1) Analisislah setiap butir soal berdasarkan semua kriteria yang tertera di
dalam format!
2) Berilah tanda cek (V) pada kolom "Ya" bila soal yang ditelaah sudah
sesuai dengan kriteria!
Analisis Tes Buatan Guru 33
3) Berilah tanda cek (V) pada kolom "Tidak" bila soal yang ditelaah tidak sesuai
dengan kriteria,kemudian tuliskan alasan pada ruang catatan atau pada
teks soal dan perbaikannya.
a. Format Penelaahan Butir Soal Bentuk Uraian
FORMAT PENELAAHAN BUTIR SOAL BENTUK URAIAN
Mata Pelajaran : .................................Kelas/semester : .................................Penelaah : .................................
No. Aspek yang ditelaah
Nomor Soal1 2 3 4 5 6 7 8 9 …
Analisis Tes Buatan Guru 34
A.
1
2
3
4
B
5
6
78
Materi
Soal sesuai dengan indikator (menuntut tes tertulis untuk bentuk Uraian)Batasan pertanyaan dan jawaban yang diharapkan sudahsesuaiMateri yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian sehari-hari tinggi)Isi materi yang ditanyakan sesuai dengan jenjang jenis sekolah atau tingkat kelasKonstruksi
Menggunakan kata tanya atau perintah yang menuntut jawaban uraianAda petunjuk yang jelas tentang cara mengerjakan soalAda pedoman penskorannyaTabel, gambar, grafik, peta, atau yang sejenisnya disajikan dengan jelas dan terbaca
C.9
1 01 1
1 21 3
Bahasa/BudayaRumusan kalimat coal komunikatifButir soal menggunakan bahasa Indonesia yang baku Tidak menggunakan kata/ungkapan yang menimbulkan penafsiran ganda atau salah pengertian
Keterangan: Berilah tanda (V) bila tidak sesuai dengan aspek yang ditelaah!
2. Format Penelaahan Soal Bentuk Pilihan GandaFORMAT PENELAAHAN SOAL BENTUK PILIHAN GANDA
Mata Pelajaran : .............................Kelas/semester : ............................
.....Penelaah : .................................
No.Nomor Soal
1 2 3 4 5 …
Analisis Tes Buatan Guru 35
A.1
2
3.
4.B.5.
6.
7.8
9.
10.
11.
12.
MateriSoal sesuai dengan indikator (menuntut tes tertulis untuk bentuk pilihan gandaMateri yang ditanyakan sesuai dengan kompetensi (urgensi, relevasi, kontinyuitas, keterpakaian sehari-hari tinggi)Pilihan jawaban homogen dan logisHanya ada satu kunci jawabanKonstruksiPokok soal dirumuskan dengan singkat, jelas, dan tegasRumusan pokok soal dan pilihan jawaban merupakan pernyataan yang diperlukan sajaPokok soal tidak memberi petunjuk kunci jawabanPokok soal bebas dan pernyataan yang bersifat negatif ganda Pilihan Jawaban homogen dan logis ditinjau dari segi materi Gambar, grafik, tabel, Diagram, atau sejenisnya jelas dan berfungsi Panjang pilihan jawaban relatif samaPilihan jawaban tidak menggunakan pernyataan "semua jawaban di atas salah/benar" dan sejenisnyaPilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan besar kecilnya angka atau kronologisnyaButir soal tidak bergantung pada jawaban soal sebelumnya
C.
15.
16.
17.
18.
Bahasa/Budaya
Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia
Menggunakan bahasa yang komunikatif
Tidak menggunakan bahasa yang berlaku setempat/tabu
Keterangan: Berilah t a n d a ( V ) bila tidak sesuai dengan aspek yang ditelaah!
Analisis Tes Buatan Guru 36
BAB IIIANALISIS TES BUATAN GURU
A. Analisis Tes Buatan Guru
Sebagai contoh untuk analisis tes buatan guru di ambil soal matematika
dan soal IPS kelas V salah satu Sekolah Dasar Islam terpadu yang ada di Padang.
Soal tes buatan guru ini akan dianalisis secara kuantitatif dan kualitatif.
1. Analisis Soal Matematika
Dari hasil penelusuran soal yang disusun oleh guru matematika diperoleh
informasi, bahwa guru dalam menyusun soal jarang sekali menggunakan teknik
penyusunan tes hasil belajar yang baik seperti ayng telah dijelaskan dalam BAB
sebelumnya.
Guru matematika sebenarnya ada melakukan analisis, tetapi analisis yang
dilakukan hanya secara umum, tanpa menggunakan analisis sesuai teori. Analisis
soal penting dilakukan, salah satu tujuannya adalah dapat dijadikan pedoman bagi
guru dalam menentukan metode atau strategi yang akan digunakan dalam
pembelajaran matematika selanjutnya. Soal yang disusun guru berupa soal
objektif dan soal essay. Soal objektif terdiri dari 25 butir soal dan 5 butir saol
essay. Analisis dilakukan secara kuantitatif dan kualitatif. Kuantitatif dapat dicari
secara manual, tetapi disini digunakan program Anatest.
Hasil analisis kuantitatif soal matematika dengan program Anatest
diuraikan sebagai berikut:
1) Validitas Tes
Berdasarkan hasil jawaban siswa yang telah dikoreksi, skor yang
diperoleh siswa kelas III SD IT dapat dilihat pada Lampiran . Dari data yang telah
diperoleh dapat ditentukan validitas butir soal tes yang telah disusun oleh guru
matematika Kelas III SD IT. Berdasarkan data pada Lampiran tersebut, diperoleh
hasil validitas butir soal dapat dilihat pada Tabel 3.1 berikut:
Analisis Tes Buatan Guru 37
Tabel 3.1 Validitas Butir Soal
Soal Hasil Kevalidan Soal Hasil Kevalidan 1 0.00 sangat rendah 16 0.000 sangat rendah2 0.00 sangat rendah 17 0.019 sangat rendah3 0.00 sangat rendah 18 0.000 sangat rendah4 0.454 Cukup 19 0.416 cukup5 0.331 Rendah 20 0,285 sangat rendah6 0.00 sangat rendah 21 0.189 sangat rendah7 0.136 sangat rendah 22 0.436 cukup8 0.286 Rendah 23 0.246 rendah9 0.605 Tinggi 24 0.419 cukup10 0.136 sangat rendah 25 0.641 tinggi11 0.333 Rendah12 0.076 sangat rendah13 0.005 sangat rendah14 0.411 Cukup15 0.78 Tinggi
Berdasarakan Tabel 3.1 dapat dilihat dari 25 soal, terdapat 13 soal yang
mempunyai validitas sangat rendah, 4 soal mempunyai validitas rendah, 4 soal
mempunyai validitas cukup dan 3 soal mempunyai validitas tinggi. Persentase
hasil tersebut dapat dilihat pada diagram 3.1 berikut.
Diagram 3.1. Validitas Butir Soal Kelas III SD IT
Berdasarkan diagram 3.1` dapat dilihat bahwa soal matematika yang
disusun oleh guru matematika Kelas III SD IT yang telah diberikan guru pada
siswa hanya 12 % soal yang memiliki validitas tinggi. Lebih rendah
dibandingkan dengan sekolah yang telah dibahas sebelumnya. 12 % soal yang
memang mengukur apa yang seharusnya di ukur oleh guru terhadap siswanya. 84
Analisis Tes Buatan Guru 38
% soal perlu dilakukan perbaikan sehingga soal memang dapat digunakan untuk
mengukur kemampuan siswa. Ini sangat disayangkan karena hanya sedikit sekali
sola yang bisa dijadikan alat ukur, sementara jumlah soalnya cukup banyak, tetapi
tidak dapat dijadikan alat ukur yang baik. Bahkan 52 % soal memiliki validitas
yang sangat rendah. 52% soal ini perlu diperbaiki dari semua aspek penyusunan
soal.
2) Daya Pembeda Soal
Dari Skor hasil belajar yang diperoleh dari lembar jawaban siswa pada
Lampiran dapat dihitung daya beda soal matematika Kelas III yang disusun oleh
guru SD IT seperti pada Tabel 3.2berikut:
Tabel 3.2 Daya Pembeda Soal Kelas III SD IT
Soal Hasil Kriteria Soal Hasil Kriteria1 0.00 Sangat tidakbaik 16 0.00 sangat tidak baik2 0.00 Sangat tidak baik 17 0.00 Sangat tidak baik3 0.00 Sangat tidak baik 18 0.00 sangat tidak baik4 0.57 Baik 19 0.28 Tidak baik5 0.28 Tidak baik 20 0.42 baik6 0.00 sangat tidak baik 21 0.52 Baik7 0.14 Tidak baik 22 0.63 Baik8 0.28 Tidak baik 23 0.74 Baik9 0.28 Tidak baik 24 0.81 Baik10 0.14 Tidak baik 25 0.63 Baik11 0.14 Tidak baik12 0.00 sangat tidak baik13 0.14 Tidak baik14 0.42 baik15 0.42 baik
Pada Tabel 3.2 dapat dilihat bahwa dari 25 soal terdapat 8 soal mempunyai
daya beda yang sangat tidak baik, 8 soal yang mempunyai daya beda tidak baik
dan 9 soal yang mempunyai daya beda baik. Artinya 16 soal yang perlu diperbaiki
sehingga memiliki kualitas yang baik dalam membedakan siswa berkemampuan
tinggi dengan siswa berkemampuan rendah.
3) Tingkat kesukaran
Analisis Tes Buatan Guru 39
Penghitungan tingkat kesukaran soal digunakan juga skor yang diperoleh
dari lembar jawaban siswa kelas III SD IT yang ada pada Lampiran 1. Dari
pengolahan data tersebut diperoleh indek tingkat kesukaran soal seeperti pada
Tabel 3.3 berikut:
Tabel 3.3 Tingkat Kesukaran Soal Kelas III SD IT
Soal Hasil Kriteria Soal Hasil Kriteria 1 1 Sangat mudah 16 1 Sangat mudah2 1 Sangat mudah 17 0.88 Sangat mudah3 1 Sangat mudah 18 1 Sangat mudah4 0.44 Sedang 19 0.88 Sangat mudah5 0.81 Mudah 20 0.81 Sangat mudah6 1 Sangat mudah 21 0.88 Sangat mudah7 0.96 Sangat mudah 22 0.48 Sedang8 0.77 Mudah 23 0.88 Sangat mudah9 0.92 Sangat mudah 24 0.96 Sangat mudah10 0.96 Sangat mudah 25 0.95 Sangat mudah11 0.92 Sangat mudah12 0.92 Sangat mudah13 0.74 Mudah14 0.74 Mudah15 0.55 Sedang
Pada Tabel 3.3 dapat dilihat bahwa dari 25 soal terdapat 18 soal yang
mempunyai tingkat kesukaran sangat mudah, 4 soal mempunyai tingkat kesukaran
mudah dan hanya 3 soal yang mempunyai tingkat kesukaran sedang.
4) Reliabilitas Tes
Berdasarkan hasil perhitungan reliabilitas tes yang dilakukan dengan
Program Anates, diperoleh reliabilitas tes US SD IT Budi Mulia adalah 0,28. Ini
berarti sesuai dengan kriteria reliabilitas, tes yang telah dilakukan memiliki
reliabilitas rendah.
Dari rangkaian analisis kuantitatif di atas dapat disimpulkan bahwa soal
matematika yang disusun oleh guru perlu diperbaiki karena memiliki validitas
yang rendah, daya pembeda dan tingkat kesukaran yang tidak bagus serta
reliabilitas yang rendah.
Analisis Tes Buatan Guru 40
Untuk analisis kualitatir aspek yang diperhatikan di dalam penelaahan
secara kualitatif ini adalah setiap soal ditelaah dari segi materi, konstruksi,
bahasa/budaya, dan kunci jawaban/pedoman penskorannya. Dalam melakukan
penelaahan setiap butir soal, penelaah perlu mempersiapkan bahan-bahan
penunjang seperti: (1) kisi-kisi tes, (2) kurikulum yang digunakan, (3) buku
sumber, dan (4) kamus bahasa Indonesia.
Format penelaahan soal digunakan sebagai dasar untuk menganalisis
setiap butir soal. Format penelaahan soal yang dimaksud adalah format
penelaahan butir soal: uraian, pilihan ganda, tes perbuatan dan instrumen non-tes.
Dalam penelitian ini soal yang akan di telaah adalah soal pilihan ganda.
Berdasarkan hasil telaah butir soal matematika kelas III yang disusun
oleh guru yang telah dilakukan diperoleh masih banyak guru dalam membuat soal
belum memenuhi kriteria soal yang baik. Dari segi materi, soal yang dibuat guru
pada umumnya sesuai dengan materi yang telah dipelajari. Dari segi kontruksi,
guru banyak keliru dalam membuat urutan pilihan jawaban-jawaban yang
berbentuk angka. Sesuai dengan petunjuk dalam pembuatan soal yang baik,
pilihan jawaban yang berbentuk angka dan waktu disusun berdasarkan besar
kecilnya angka atau kronologinya. Kriteria lainnya sudah sesuai dengan yang
diharapkan walaupun belum maksimal. Dari segi bahasa, ditemukan beberapa
sekolah yang banyak salah dalam penulisan soal atau soalnya tidak komunikatif.
Berdasarkan hasil yang diperoleh dapat disimpulkan bahwa masih terdapat
kekeliruan guru dalam membuat soal. Yang paling banyak mengalami kesalahan
adalah pada segi konstruksi soal. Jadi soal-soal yang ada perlu diperbaiki kembali
untuk menghasilkan hasil yang maksimal.
Berdasarkan analisis Kuantitatif dan Analisis Kualitatif dapat disimpulkan
bahwa kualitas soal matematika yang disusun oleh guru matematika SD IT masih
memiliki kualitas yang kurang. Hal ini berdasarkan validitas soal masih banyak
yang rendah, daya pembeda soal yang belum mampu membedakan siswa
berkemampuan tinggi dengan siswa berkemampuan rendah, tingkat kesukaran
soal yang masih belum memilikim proporsi yang merata untuk semua tingkat
kesukaran soal, reliabilitas soal yang masih rendah. Sebenarnya soal yang
Analisis Tes Buatan Guru 41
memiliki validitas rendah bahkan sangat rendah tidak dapat lagi dipakai, harus
diganti, dan tidak perlu lagi dicari reliabilitasnya.
Selanjutnya kualitas soal ini juga dilihat dari hasil analisis kualitatif
dengan menggunakan penelaahan soal. Seperti yang telah dikemukakan di atas
bahwa masih banyak soal yang belum memenuhi dari segi konstruk, bahasa, dan
masih banyak yang tidak komunikatif. Berdasarkan hasil tersebut soal masih
harus diperbaiki sehingga memiliki kualitas yang baik dan dapat digunakan
dengan efektif dan efisien serta mencapai tujuan yang diinginkan.
Hasil analisis kuantitatif soal IPS dengan program Anatest diuraikan
sebagai berikut:
1) Validitas Tes
Berdasarkan hasil jawaban siswa yang telah dikoreksi, skor yang
diperoleh siswa kelas III SD IT dapat dilihat pada Lampiran . Dari data yang telah
diperoleh dapat ditentukan validitas butir soal tes yang telah disusun oleh guru
matematika Kelas III SD IT. Berdasarkan data pada Lampiran tersebut, diperoleh
hasil validitas butir soal dapat dilihat pada Tabel 3. 5 berikut:
Tabel 3.5. Validitas butir soal IPS
Soal Hasil Kevalidan Soal Hasil Kevalidan 1 0.139 Sangat rendah 21 0.389 Rendah2 0.059 Sangat rendah 22 -0.114 Sangat Rendah3 0.000 Sangat rendah 23 0.590 cukup4 0.534 Cukup 24 0.288 Rendah5 0.102 Sangat rendah 25 0.000 Sangat Rendah6 0.487 Cukup 26 0.286 Rendah7 0.548 Cukup 27 0.000 Sangat Rendah8 0.244 Rendah 28 0.466 Cukup9 0.335 Rendah 29 0.657 tinggi10 0.358 Rendah 30 0.242 Rendah11 0.496 Cukup 31 0.000 Sangat Rendah12 0.710 Tinggi 32 0.371 Rendah13 0.279 Rendah 33 -0.116 Sangat Rendah14 0.303 Rendah 34 0.316 Rendah15 0.343 Rendah 35 0.365 Rendah16 0.151 Sangat rendah17 0.539 Cukup18 0.570 Cukup
Analisis Tes Buatan Guru 42
19 0.051 Sangat rendah20 0.389 Rendah
Dari tabel dapat dilihat bahwa terdapat 11 soal yang mempunyai validitas
sangat rendah, 14 soal mempunyai validitas rendah, 8 soal mempunyai validitas
cukup dan hanya 2 soal yang mempunyai validitas tinggi.
2) Daya Pembeda Soal
Dari Skor hasil belajar yang diperoleh dari lembar jawaban siswa pada
Lampiran dapat dihitung daya beda soal IPS Kelas III yang disusun oleh guru SD
IT seperti pada Tabel 3.6 berikut:
Tabel 3. 6 Daya Pembeda Soal IPS
Soal Hasil Kriteria Soal Hasil kriteria1 0.28 Tidak baik 21 0.28 Tidak baik2 0.00 Tidak baik 22 -0.14 Tidak baik3 0.00 Tidak baik 23 0.71 baik4 0.42 Baik 24 0.14 Tidak baik5 0.00 Tidak baik 25 0.00 Tidak baik6 0.28 Tidak baik 26 0.28 Tidak baik7 0.28 Tidak baik 27 0.00 Tidak baik8 0.28 Tidak baik 28 0.57 Baik9 0.42 Baik 29 0.57 baik10 0.42 Baik 30 0.28 Tidak baik11 0.57 Baik 31 0.00 Tidak baik12 0.57 Baik 32 0.14 Tidak baik13 0.28 Tidak baik 33 -0.14 Tidak baik14 0.28 Tidak baik 34 0.14 Tidak baik15 0.57 Baik 35 0.42 baik16 0.14 Tidak baik17 0.71 Baik18 0.71 Baik19 0.00 Tidak baik20 0.28 Tidak baik
Dari tabel dapat dilihat bahwa terdapat 24 soal yang mempunyai daya
pembeda tidak baik dan hanya 11 soal yang mempunyai daya pembeda baik.
3) Tingkat Kesukaran
Analisis Tes Buatan Guru 43
Penghitungan tingkat kesukaran soal digunakan juga skor yang diperoleh
dari lembar jawaban siswa kelas III SD IT yang ada pada Lampiran 1. Dari
pengolahan data tersebut diperoleh indek tingkat kesukaran soal IPS seeperti pada
Tabel 3.7 berikut:
Tabel 3.7. Tingkat kesukaran Soal IPS
Soal Hasil Kriteria Soal Hasil kriteria1 0.65 Sedang 21 0.92 Sangat mudah2 0.92 Sangat mudah 22 0.15 Sukar3 1 Sangat mudah 23 0.65 Sedang4 0.80 Mudah 24 0.53 Sedang5 0.15 Sukar 25 1 Sangat mudah6 0.88 Sangat mudah 26 0.80 mudah7 0.88 Sangat mudah 27 1 Sangat mudah8 0.30 Sangat mudah 28 0.84 mudah9 0.80 Mudah 29 0.80 mudah10 0.84 Mudah 30 0.88 mudah11 0.69 Sedang 31 1 Sangat mudah12 0.84 Mudah 32 0.96 Sangat mudah13 0.92 Sangat mudah 33 0.30 Sukar14 0.88 Sangat mudah 34 0.92 Sangat mudah15 0.61 Sedang 35 0.65 sedang16 0.26 Sukar17 0.69 Sedang18 0.65 Sedang19 0.70 Sedang20 0.92 Sangat mudah
Berdasarkan tabel diperoleh 14 soal mempunyai tingkat kesukaran sangat
mudah, 8 soal mempunyai kriteria mudah, 9 soal mempunyai kriteria sedang dan
terdapat 3 soal yang berkriteria sukar.
4) Reabilitas tesDari hasil analisis diperoleh reabilitas tes US IPS kelas V adalah 0.83. ini
berarti tesnya mempunyai reabilitas tinggi
5) Kualitas PengecohUntuk kualitas pengecoh dapat dilihat pada Tabel berikut.
Analisis Tes Buatan Guru 44
Soal A B C D
1 Kunci jawaban baik Sangat baik Baik2 Sangat buruk Kunci jawabab buruk buruk3 - - Kunci jawaban -4 Sangan baik Sangat baik baik Kunci jawaban5 Kunci jawaban Sangat baik Sangat baik Sangat baik6 buruk Kunci jawaban buruk Sangat baik
7 buruk Sangat baik Kunci jawaban buruk
8 Sangat baik Sangat baik Sangat baik Kunci jawaban
9 Kunci jawaban Sangat baik Sangat baik baik
10 baik Kunci jawaban baik baik
11 baik baik Kunci jawaban baik
12 baik baik baik Kunci jawaban
13 Kunci jawaban Sangat buruk buruk buruk
14 buruk Kunci jawaban buruk Sangat baik
15 Sangat baik Sangat baik Kunci jawaban baik16 Sangat baik baik Kurang baik Kunci jawaban17 Kunci jawaban baik Sangat baik Kurang baik18 Kurang baik Sangat baik baik baik19 buruk Sangat baik Kunci jawaban buruk20 Sangat buruk buruk buruk Kunci jawaban21 Kunci jawaban Sangat buruk buruk buruk22 Sangat baik Kunci jawaban Sangat baik Sangat baik23 Kurang baik baik Kunci jawaban baik24 baik baik buruk Kunci jawaban25 Kunci jawaban - - -26 buruk Kunci jawaban buruk Sangat baik27 - - Kunci jawaban -28 Sangat buruk baik buruk Kunci jawaban29 Buruk Kunci jawaban baik Baik30 Kunci Jawaban buruk Sangat baik Buruk31 - Kunci Jawaban - -32 Sangat buruk Buruk Kunci Jawaban Buruk33 baik Sangat baik Kurang baik kunci jawaban34 Kunci Jawaban Sangat buruk Buruk Buruk35 Kurang baik Kunci Jawaban Kurang baik Sangat baik
BAB IVKESIMPULAN
Analisis Tes Buatan Guru 45
Dari hasil analisis soal matematika dan soal IPS yang disusun oleh guru
yang diambil dari salah satu SD IT dapat disimpulkan bahwa guru jarang
melakukan prosedur penyusunan soal sesuai dengan langkah-langkah yang telah
ditentukan. Setelah itu guru jarang sekali melakukan analsis soal yang mereka
susun. Setelah dilakukan analisis disimpulkan juga bahwa soal yang disusun guru
tersebut juga belum dapat dikriteriakan sebagai soal yang baik, karena dari hasil
analisis masih banyak butir soal yang memiliki validates, tingkat kesukaran, daya
beda, dan reliabilitas yang belum baik
DAFTAR BACAAN
Analisis Tes Buatan Guru 46
Anas Sudijono. 1995. Pengantar Evaluasi Pendidikan. Jakarta: Raja Grafindo Persada
Eko Putro Widoyoko. 2011. Evaluasi Program Pembelajaran. Yogyakarta: Pustaka Pelajar
Rusyan, T. 1993. Evaluasi Dalam Proses Belajar Mengajar. Bandung: Bina Budaya
Suharsimi Arikunto. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara
Tabrani Rusyan. 1993. Evaluasi Dalam Proses Belajar Mengajar. Bandung: Refika Ofset
Phillips, Allen D. (1979). Measurement and Evaluation in physical education. Canada: John Whiley & Sons, Inc.
Prihastuti Ekawatiningsih. 2009 makalah Penyusunan Tes Hasil Belajar.Fakultas Teknik UNY
Panduan Analisis Soal. http://gurupembaharu.com. Diakses 9 september 2013PP no 32 tahun 2013 tentang Standar Nasional Pendidikan
http://mathsamah1989.blogspot.com/
Analisis Tes Buatan Guru 47