5
BAB II
KAJIAN PUSTAKA
2.1 Evaluasi Pendidikan
2.1.1 Pengertian Evaluasi
Evaluasi berasal dari bahasa Inggris evaluation, dalam bahasa Indonesia
berarti penilaian. Dengan demikian secara harfiah evaluasi pendidikan
(educational evaluation) dapat diartikan sebagai penilaian dalam (bidang)
pendidikan atau penilaian mengenai hal-hal yang berkaitan dengan kegiatan
pendidikan (Sudijono, 2011:1). Sedangkan dalam arti luas, evaluasi adalah suatu
proses merencanakan, memperoleh, dan menyediakan informasi yang sangat
diperlu kan untuk membuat alternatif - alternatif keputusan (Mehrens & Lehman
1978 dalam Purwanto, 2008 : 3).
Edwind wand dan Gerald W. Brown (dalam Sudijono, 2001:1)
menjelaskan: Evaluation refer to the act process to determining the value of
something. Menurut definisi ini, maka evaluasi adalah tindakan atau proses untuk
menentukan nilai dari sesuatu. Sesuai dengan pendapat tersebut maka evaluasi
pendidikan dapat diartikan sebagai suatu tindakan atau proses untuk menentukan
nilai dari sesuatu dalam dunia pendidikan atau segala sesuatu yang ada
hubungannnya dengan dunia pendidikan. Evaluasi pendidikan adalah kegiatan
atau proses penentuan nilai pendidikan, sehingga dapat diketahui mutu dan
hasilnya.
6
Arikunto (2002:13) mendefinisikan evaluasi dengan terlebih dahulu
menjelaskan tentang mengukur dan menilai. Mengukur adalah membandingkan
sesuatu dengan satu ukuran dan bersifat kuantitatif. Menilai adalah mengambil
sesuatu keputusan terhadap sesuatu dengan ukuran baik buruk dan bersifat
kualitatif. Sedangkan mengadakan evaluasi meliputi kedua langkah diatas, yaitu
mengukur dan menilai. Dengan demikian evaluasi adalah menilai (tetapi
dilakukan dengan mengukur terlebih dahulu).
Dalam konteks kalimat yang berbeda tetapi mengandung arti yang sama,
Wrigstone dkk 1956 (dalam Purwanto 2008 : 3) mengemukakan rumusan evaluasi
pendidikan sebagai berikut : “Educational evaluation is the estimation of the
growth and progress of pupils toward objectives or values in the curriculum.”
(Evaluasi pendidikan ialah penafsiran terhadap pertumbuhan dan kemajuan siswa
kearah tujuan-tujuan dan nilai-nilai yang telah ditetapkan di dalam kurikulum).
2.1.2 Dasar-Dasar Evaluasi Pendidikan
Dalam pelaksanaannya, evaluasi harus mempunyai dasar yang kuat. Dasar
yang dimaksud adalah prinsip ilmiah yang melandasi penyusunan dan
pelaksanaan evaluasi yang mencakup 7 konsep yaitu: filsafat, psikologi,
komunikasi, kurikulum, manajemen dan sosiologi-antropologi (Slameto, 2001:8).
Dasar filsafat dalam evaluasi pendidikan berhubungan dengan masalah
masalah yang merupakan dasar dalam pendekatan sistem yang menyangkut
pertanyaan-pertanyaan apakah evaluasi itu, mengapa evaluasi perlu diberikan dan
bagaimana cara memberikannya, yang dimaksud dengan dasar psikologi adalah
bahwa evaluasi itu dilaksanakan harus mempertimbangkan tingkat kesukaran
7
dengan tingkat perkembangan siswa, tingkat kemampuan yang dimiliki siswa, dan
teori-teori yang dianut dalam pendidikan. Dasar komunikasi dimaksudkan bahwa
evaluasi itu dapat dilaksanakan secara langsung maupun tidak langsung. Adapun
yang menjadi dasar evaluasi selanjutnya adalah kurikulum, maksudnya, isi
evaluasi harus sesuai dengan materi yang diajarkan seperti tercantum dalam
kurikulum yang telah ada dan dilaksanakan. Sedangkan dasar manajemen, artinya
bahwa evaluasi perlu diorganisasikan pelaksanaannya, apakah secara individual
atau kelompok dan bagaimana pengelolaannya. Disamping itu evaluasi harus
sesuai dan berguna dalam masyarakat untuk mencapai suatu kemajuan.
2.1.3 Tujuan dan Fungsi Evaluasi Pendidikan
Dalam konteks yang lebih luas lagi, Sax (1980 : 28) mengemukakan
tujuan evaluasi dan pengukuran adalah untuk “selection, placement, diagnosis
and remediation, feedback : norm-referenced and criterion-referenced
interpretation, motivation and guidance of learning, program and curriculum
improvement : formative and summative evaluations, and theory development”.
(seleksi, penempatan, diagnosis dan remediasi, umpan balik : penafsiran acuran-
norma dan acuan-patokan, motivasi dan bimbingan belajar, perbaikan program
dan kurikulum : evaluasi formatif dan sumatif, dan pengembangan teori).
Cronbach (1963 : 236) menjelaskan “evaluation used to improved the
course while it is still fluid contributes more to improvement of education than
evaluation used to appraise a product already on the market”. Cronbach
nampaknya lebih menekankan fungsi evaluasi untuk perbaikan, sedangkan
Scriven (1967) (dalam Purwanto, 2008) membedakan fungsi evaluasi menjadi dua
8
macam, yaitu fungsi formatif dan fungsi sumatif. Fungsi formatif dilaksanakan
apabila hasil yang diperoleh dari kegiatan evaluasi diarahkan untuk memperbaiki
bagian tertentu atau sebagian besar bagian kurikulum yang sedang dikembangkan.
Sedangkan fungsi sumatif dihubungkan dengan penyimpulan mengenai kebaikan
dari sistem secara keseluruhan. Fungsi ini baru dapat dilaksanakan jika
pengembangan program pembelajaran telah dianggap selesai.
Menurut Purwanto (2008:5) fungsi evaluasi sebagai berikut: a. Mengetahui tarap kesiapan siswa untuk menempuh suatu tujuan tertentu
(pendidikan tertentu). b. Mengetahui seberapa jauh hasil yang telah dicapai dalam proses pendidikan
yang telah dilaksanakan. c. Mengetahui apakah suatu mata pelajaran yang diajarkan dapat dilanjutkan
dengan bahan yang baru atau harus kembali ke bahan semula. d. Mendapatkan bahan-bahan informasi dalam memberikan bimbingan tentang
jenis pendidikan atau jenis jabatan untuk siswa tersebut e. Untuk mendapatkan bahan-bahan informasi untuk menentukan apakah
seorang anak dapat dinaikan kelasnya atau tidak f. Untuk membandingkan prestasi yang telah dicapai siswa sesuai dengan
kapasitasnya atau belum g. Untuk menafsirkan apakah seorang anak telah cukup matang untuk
dilepaskan ke masyarakat atau ke jenjang pendidikan yang lebih tinggi h. Untuk mengadakan seleksi untuk mengetahui taraf efesiensi/efektivitas
metode yang dipergunakan dalam pembelajaran
Bagi penyusun soal, fungsi evaluasi perlu diperhatikan secara sungguh-
sungguh agar evaluasi yang diberikan betul-betul mengenai sasaran yang
diharapkan. Berikut ini dikemukakan pendapat para ahli tentang tujuan dan fungsi
evaluasi. Nurgiyantoro (1987:14) (dalam Purwanto, 2008) menyebutkan 5 tujuan
dan fungsi evaluasi, yaitu:
a. untuk mengetahui seberapa jauh tujuan-tujuan pendidikan yang telah ditetapkan itu dapat dicapai dalam kegiatan belajar mengajar yang dilakukan,
b. untuk memberikan objektifitas pengamatan kita terhadap tingkah laku hasil belajar siswa,
9
c. untuk mengetahui kemampuan siswa dalam bidang-bidang atau topik-topik tertentu,
d. untuk menentukan layak tidaknya seorang siswa dinaikkan ketingkat diatasnya atau dinyatakan lulus dari tingkat pendidikan yang ditempuhnya,
e. untuk memberikan umpan balik bagi kegiatan belajar mengajar yang dilakukan. Menurut Arikunto (2001:10), tujuan atau fungsi penilaian ada beberapa hal,
yaitu: 1) penilaian berfungsi selektif, 2) penilain berfungsi diagnostik, 3) penilain
berfungsi sebagai penempatan dan 4) penilaian berfungsi sebagai pengukur
keberhasilan.
2.2 Tes
2.2.1 Pengertian Tes
Menurut Anne Anastasi (dalam Sudijono, 2001: 66), yang dimaksud
dengan tes adalah alat pengukur yang mempunyai standar yang objektif sehingga
dapat digunakan secara meluas, serta dapat betul-betul digunakan untuk mengukur
dan membandingkan keadaan psikis atau tingkah laku individu. Sedangkan
Sudijono (2001: 67) menyatakan bahwa tes adalah suatu tugas atau serangkaian
tugas yang diberikan kepada individu atau sekelompok individu, dengan maksud
untuk membandingkan kecakapan mereka, satu dengan yang lain.
Arikunto (2010: 53), tes merupakan alat atau prosedur yang digunakan
untuk mengetahui atau mengukur sesuatu dalam suasana, dengan cara dan aturan-
aturan yang sudah ditentukan. Sedangkan menurut Jacobs & Chase (1992) dalam
Alwasilah (1996), tes merupakan suatu alat penilaian dalam bentuk tulisan untuk
mencatat atau mengamati prestasi siswa yang sejalan dengan target penilaian.
Selanjutnya, tes didefinisikan sebagai pertanyaan atau tugas atau seperangkat
tugas yang direncanakan untuk memperoleh informasi tentang suatu atribut
10
pendidikan atau suatu atribut psikologis tertentu. Setiap butir pertanyaan atau
tugas tersebut mempunyai jawaban atau ketentuan yang dianggap benar
(Zainul dan Nasution, 2001).
Menurut Muljono (2008) ada beberapa istilah yang terkait dengan tes, yaitu:
1. Tes: alat atau prosedur yang digunakan dalam pelaksanaan tes.
2. Testing: saat pada waktu pelaksanaan tes.
3. Testee: responden atau individu yang sedang mengerjakan tes.
4. Tester: orang yang melaksanakan pengambilan tes terhadap para testee yang
bertugas untuk: (a) Mempersiapkan ruangan dan perlengkapan yang diperlukan
(b) Membagikan lembaran tes dan alat-alat lain untuk mengerjakan (c)
Menerangkan cara mengerjakan tes (d) Mengawasi testee mengerjakan tes (e)
Memberikan tanda-tanda waktu (f) Mengumpulkan pekerjaan testee (g)
Mengisi berita acara atau laporan yang diperlukan (jika ada).
2.2.2 Fungsi Tes
Beberapa fungsi tes dalam dunia pendidikan menurut Djaali (dalam
Muljono 2008) adalah:
1. Sebagai alat untuk mengukur prestasi belajar siswa.Tes dimaksudkan
untuk mengukur tingkat perkembangan atau kemajuan yang telah dicapai
siswa setelah menempuh proses belajar-mengajar dalam jangka waktu
tertentu.
2. Sebagai motivator dalam pembelajaran. Tes dianggap sebagai motivator
ekstrinsik, yaitu siswa akan belajar lebih giat dan berusaha lebih keras
untuk memperoleh nilai dan prestasi yang baik.
11
3. Sebagai upaya perbaikan kualitas pembelajaran. Dalam rangka perbaikan
kualitas pembelajaran, ada tiga jenis tes yang perlu dibahas yaitu; tes
penempatan, tes diagnostik, dan tes formatif.
4. Sebagai penentu berhasil atau tidaknya siswa sebagai syarat untuk
melanjutkan pendidikan ke jenjang yang lebih tinggi dengan
melaksanakan tes sumatif.
2.2.3 Jenis-Jenis Tes
Jenis – jenis tes menurut Muljono (2008) adalah:
1. Berdasarkan fungsinya sebagai alat pengukur perkembangan atau kemajuan
siswa, yaitu:
a. Tes seleksi (selection test).
Tes seleksi digunakan untuk memilih atau menyeleksi siswa yang terbaik
dari semua peserta tes, materinya berupa materi prasyarat untuk mengikuti
program pendidikan yang akan diikuti oleh calon siswa. Tes seleksi dapat
dilakukan secara lisan, secara tertulis, dengan tes perbuatan, dan dapat
juga ketiganya dikombinasikan secara serempak.
b. Tes awal (pre-test).
Tes awal merupakan tes yang dilaksanakan sebelum bahan pelajaran
diberikan kepada siswa dengan tujuan untuk mengetahui sejauh manakah
materi atau bahan pelajaran yang akan diajarkan telah dapat dikuasai oleh
siswa.
12
c. Tes akhir (post-test)
Tes akhir merupakan tes yang dilaksanakan dengan tujuan untuk
mengetahui apakah semua materi pelajaran yang tergolong penting sudah
dikuasai dengan sebaik-baiknya oleh siswa. Pada dasarnya materi pre-test
sama dengan materi post-test.
d. Tes diagnostik (diagnostic test)
Tes diagnostik merupakan tes yang dilaksanakan untuk menentukan tepat
jenis kesukaran yang dihadapi oleh para siswa dalam mata pelajaran
tertentu. Tes diagnostik dapat dilaksanakan dengan secara lisan, tertulis,
perbuatan atau kombinasi dari ketiganya.
e. Tes formatif (formative test)
Tes formatif merupakan tes hasil belajar yang bertujuan untuk mengetahui
sudah sejauh manakah siswa sudah memahami pelajaran setelah mereka
mengikuti proses pembelajaran dalam jangka waktu tertentu dan
memperbaiki kualitas pembelajaran. Tes formatif biasa dilaksanakan di
tengah-tengah perjalanan program pembelajaran, yaitu dilaksanakan pada
setiap kali satuan pelajaran atau sub pokok bahasan berakhir atau dapat
diselesaikan dan dikenal dengan istilah ulangan harian.
f. Tes sumatif (summative test)
Tes sumatif merupakan tes hasil belajar yang dilaksanakan setelah
sekumpulan materi pelajaran atau satuan program pengajaran selesai
diberikan. Tes sumatif dilaksanakan dengan tujuan untuk menentukan nilai
13
yang menjadi lambang keberhasilan siswa setelah mereka menempuh
proses pembelajaran dalam jangka waktu tertentu.
2. Berdasarkan aspek psikis yang ingin diungkapkan, yaitu:
a. Tes intelegensi (intellegency test)
Tes intelegensi merupakan tes yang dilaksanakan dengan tujuan untuk
mengungkapkan atau memprediksi kecerdasan seseorang.
b. Tes kemampuan (aptitude test)
Tes kemampuan merupakan tes yang dilaksanakan dengan tujuan untuk
mengungkap kemampuan dasar atau bakat khusus yang dimiliki oleh
testee.
c. Tes sikap (attitude test)
Tes sikap merupakan tes yang dilaksanakan dengan tujuan untuk
mengungkap predisposisi atau kecenderungan seseorang untukmelakukan
suatu respon tertentu terhadap dunia sekitarnya, baik berupa individu-
individu maupun objek-objek tertentu.
d. Tes kepribadian (personality test)
Tes kepribadian merupakan tes yang dilaksanakan dengan tujuan
mengungkapkan dengan ciri-ciri khas dari seseorang yang banyak
sedikitnya bersifat lahiriyah, seperti gaya bicara, cara berpakaian, nada
suara, hobi, bentuk tubuh, cara bergaul, cara mengatasi masalah,
kesenangan, dan lain sebagainya.
14
e. Tes hasil belajar (achievement test)
Tes hasil belajar merupakan tes yang dilaksanakan dengan tujuan untuk
mengungkap tingkat pencapaian terhadap tujuan pembelajaran atau
prestasi belajar, untuk melaksanakaan evaluasi mengajar seorang guru
pada tes belajar ini dapat menggunakan dua macam tes, yakni tes yang
telah distandarkan (standardized tes) dan tes buatan guru (teacher-made
test).
Menurut Purwanto (2008:34) adapun perbedaan tes standard an tes buatan
guru adalah sebagai berikut :
Standardized achievement tes
a) Didasarkan atas isi dan tujuan-tujuan umum bagi sekolah-sekolah (yang
sejenis) diseluruh negara atau daerah.
b) Berhubungan dari bagian-bagian yang luas dari pengetahuan,
kecakapan atau keterampilan, biasanya dengan hanya sejumlah item
yang diperlukan untuk mengukur suatu skill atau topic tertentu.
c) Dikembangkan dengan bantuan penulis-penulis professional, para ahli
me-review dan editor-editor soal tes.
d) Menggunakan item-item yang telah di-tryout-kan, dianalis, direvisi,
sebelum menjadi bagian dari tes itu.
e) Memiliki keadaan yang tinggi
f) Memiliki ukuran-ukuran untuk bermacam-macam kelompok yang
secara luas mewakili performance seluruh negara atau daerah.
15
Techaer – made test
a) Berdasarkan isi dan tujuan-tujuan khusus untuk kelas atau sekolah di
tempat guru itu mengajar.
b) Dapat menyangkut topik, kecakapan, atau keterampilan khusus dan
tertentu, tetapi dapat juga menyangkut bagian-bagian yang lebih luas
dari pengetahuan dan keterampilan.
c) Biasanya dikembangkan oleh seorang guru dengan sedikit atau tanpa
bantuan dari luar.
d) Menggunakan item-item yang jarang atau tidak pernah di-tryout-kan, di
analisis, atau direvisi sebelum menjadi bagaian dari tes tersebut.
e) Memiliki kendala yang sedang atau rendah.
f) Biasanya terbatas pada suatu kelas atau sekolah sebagai kelompok
pemakainya.
3. Berdasarkan dari banyaknya peserta yang mengikuti tes, yaitu:
a. Tes individual (individual test)
Tes individual merupakan tes dimana tester hanya berhadapan dengan satu
orang testee saja.
b. Tes kelompok (group test)
Tes kelompok merupakan tes dimana tester berhadapan dengan lebih dari
satu orang testee.
4. Berdasarkan waktu yang disediakan bagi testee untuk melaksanakan tes,yaitu:
16
a. Power test
Power test merupakan tes dimana waktu yang disediakan buat testee untuk
menyelesaikan tes tidak terbatas.
b. Speed test
Speed test merupakan tes dimana waktu yang disediakan buat testee untuk
menyelesaikan tes dibatasi.
5. Berdasarkan bentuk responnya, yaitu:
a. Tes verbal (verbal test)
Tes verbal merupakan tes yang menghendaki jawaban yang tertuang dalam
bentuk kata-kata atau kalimat, baik secara lisan maupun tertulis.
b. Tes non-verbal (non-verbal test)
Tes non-verbal merupakan tes yang menghendaki jawaban bukan berupa
ungkapan kata-kata atau kalimat, melainkan berupa tindakan atau tingkah
laku.
6. Berdasarkan cara mengajukan pertanyaan dan cara memberikan jawaban, yaitu:
a. Tes tertulis (pencil and paper test)
Tes tertulis merupakan tes dimana tester dalam mengajukan butir-butir
pertanyaan atau soalnya dilakukan secara tertulis dan testee memberikan
jawabannnya juga secara tertulis.
b. Tes lisan (non-pencil and paper test)
Tes lisan merupakan tes dimana tester dalam mengajukan butir-butir
pertanyaan atau soalnya dilakukan secara tidak tertulis (lisan) dan testee
memberikan jawabannya juga tidak tertulis.
17
7. Berdasarkan dari segi bentuk soal dan kemungkinan jawabannya, yaitu:
a. Tes Essay (Uraian)
Tes Essay adalah tes yang disusun dalam bentuk pertanyaan terstruktur
dan siswa menyusun, mengorganisasikan sendiri jawaban tiap pertanyaan
itu dengan bahasa sendiri. Tes essay ini sangat bermanfaat untuk
mengembangkan kemampuan dalam menjelaskan atau mengungkapkan
suatu pendapat dalam bahasa sendiri.
b. Tes Objektif
Tes objektif adalah tes yang disusun sedemikian rupa dan telah disediakan
alternatif jawabannya. Tes ini terdiri dari berbagai macam bentuk, antara
lain ;
a) Tes Betul-Salah (TrueFalse)
b) Tes Menjodohkan (Matching)
c) Tes Analisa Hubungan (Relationship Analysis)
d) Tes Pilihan Ganda (Multiple Choice)
2.2.4 Karakteristik Tes yang Baik
Arikunto (2010) menyatakan bahwa suatu tes dapat dikatakan sebagai alat
pengukur yang baik jika memenuhi karakteristik berikut ini yaitu:
1. Memiliki validitas
Tes dikatakan memiliki validitas jika tes tersebut dengan secara tepat,
secara benar, secara shahih, atau secara absah dapat mengukur apa yang
seharusnya diukur, yaitu mengukur hasil belajar yang telah dicapai oleh
siswa setelah mereka menempuh proses belajar mengajar dalam jangka
18
waktu tertentu. Untuk menganalisis validitas suatu tes dapat dianalisis secara
logika (logical analysis) dan secara empirik (empirical analysis).
2. Memiliki reliabilitas
Tes dikatakan memiliki reliabilitas jika hasil-hasil pengukuran yang
dilakukan dengan menggunakan tes tersebut secara berulang kali terhadap
subjek yang sama, senantiasa menunjukkan hasil yang tetap atau sifatnya
stabil. Dengan kata lain, tes memiliki reliabel jika nilai-nilai yang diperoleh
para testee adalah stabil kapan saja, dimana saja, dan oleh siapa saja ujian
itu dilaksanakan, diperiksa dan dinilai.
3. Memiliki objektivitas
Tes dikatakan memiliki objektivitas jika tes tersebut disusun dan
dilaksanakan menurut tujuan instruksional khusus yang telah ditentukan,
bukan atas kemauan dan kehendak dari tester, serta dalam pemberian skor
dan penentuan nilai harus terhindar dari unsur-unsur subjektivitas tester.
4. Memiliki praktikabilitas
Tes dikatakan memiliki praktikabilitas jika tes tersebut praktis
(mudah dilaksanakan, mudah pemeriksaannya, dan dilengkapi dengan
petunjuk-petunjuk yang jelas) dan mudah mudah pengadministrasiannya.
5. Memiliki nilai ekonomis
Tes dikatakan memiliki nilai ekonomis jika pelaksanaan tes tersebut
tidak membutuhkan ongkos/biaya yang mahal, tenaga banyak, dan waktu
yang lama.
19
2.2.5 Langkah-Langkah untuk Menyusun Tes
Purwanto (2008:30) menyatakan bahwa para ahli penyusunan tes maupun
para pengajar umumnya telah menyepakati langkah-langkah sebagai berikut:
1. Menetapkan tujuan tes
Sebelum tes dibuat, hendaknya tujuan pembuatan tes harus jelas seperti tes
yang bertujuan untuk mengadakan seleksi, mendiagnosis kesulitan belajar
siswa, dan lain sebagainya.
2. Analisis kurikulum
Analisis kurikulum bertujuan untuk menentukan bobot setiap pokok
bahasan yang akan dijadikan dasar dalam menentukan jumlah item atau
butir soal untuk setiap pokok bahasan soal objektif atau bobot soal untuk
bentuk uraian, dalam membuat kisi-kisi tes sesuai dengan kurikulum yang
berlaku.
3. Analisis buku pelajaran dan sumber dari materi belajar lainnya
Analisis buku pelajaran dan sumber dari materi belajar lainnya bertujuan
untuk menentukan bobot setiap pokok bahasan berdasarkan jumlah
halaman materi yang termuat dalam buku pelajaran atau sumber materi
belajar lainnya dengan harapan dapat mencakup seluruh construct atau
content yang diajarkan.
4. Membuat kisi-kisi
Kisi – kisi bermanfaat untuk menjamin sampel soal yang baik yaitu
mencakup semua pokok bahasan secara proporsional. Sebuah kisi-kisi
20
memuat jumlah butir yang harus dibuat untuk setiap bentuk soal dan setiap
pokok bahasan serta untuk setiap aspek kemampuan yang hendak diukur.
5. Penulisan Tujuan Instruksional Khusus (TIK)
Penulisan TIK harus sesuai dengan ketentuan yang telah ditetapkan yang
mencerminkan tingkah laku siswa.
6. Penulisan soal
Banyaknya butir soal yang harus dibuat untuk setiap bentuk soal dan untuk
setiap pokok bahasan, serta untuk setiap aspek kemampuan yang hendak
diukur harus disesuaikan dengan yang tercantum dalam kisi-kisi.
7. Reproduksi tes terbatas
Tes yang sudah dibuat diperbanyak dalam jumlah yang cukup menurut
jumlah sampel uji-coba atau peserta yang akan mengerjakan tes tersebut
dalam suatu kegiatan uji-coba tes.
8. Uji-coba tes
Tes yang sudah dibuat dan sudah direproduksi atau diperbanyak itu diuji
cobakan kepada sejumlah sampel yang telah ditentukan. Sampel uji-coba
harus mempunyai karakteristik yang kurag lebih sama dengan karakteristik
peserta tes sesungguhnya.
9. Analisis hasil uji-coba
Berdasarkan data hasil uji-coba dilakukan analisis, terutama analisis butir
soal yang meliputi validitas butir, tingkat kesukaran, dan fungsi pengecoh.
Soal-soal yang tidak valid akan didrop dan soal-soal yang valid akan
ditetapkan untuk dipakai atau dirakit menjadi suatu tes yang valid.
21
10. Revisi soal
Soal-soal yang valid berdasarkan kriteria validitas empiric dikonfirmasikan
dengan kisi-kisi. Apabila soal-soal tersebut sudah memenuhi syarat dan
telah mewakili semua materi yang akan diujikan, soal-soal tersebut
selanjutnya dirakit menjadi sebuah tes, tetapi apabila soal-soal yang valid
belum memenuhi syarat berdasarkan hasil konfirmasi dengan kisi-kisi maka
dapat dilakukan perbaikan terhadap beberapa soal yang diperlukan.
11. Merakit soal menjadi tes
Soal-soal yang valid dan telah mencerminkan semua pokok bahasan serta
aspek kemampuan yang hendak diukur dapat dirakit menjadi sebuah tes
yang valid. Urutan soal dalam suatu tes pada umumnya dilakukan menurut
kesukaran soal, yaitu dari soal mudah sampai soal yang sulit.
2.2.6 Tes Sebagai Hasil Belajar Kognitif
Dalam penyusunan tes perlu diperhatikan tipe hasil belajar atau tingkat
kemampuan berpikir mana saja yang akan diukur atau dinilai. Untuk menentukan
tipe hasil belajar atau tingkat kemampuan berpikir yang akan dinilai, penyusun tes
dapat berpedoman pada indikator pembelajaran atau tujuan evaluasi itu sendiri.
Sehingga pemilihan alat evaluasi dan penyusunan instrumen tes akan tepat sesuai
dengan tingkat kemampuan peserta didik ( Purwanto, 2008).
Bloom membagi tingkat kemampuan atau tipe hasil belajar yang termasuk
aspek kognitif menjadi enam yaitu pengetahuan hafalan, pemahaman atau
komprehensif, penerapan atau aplikasi, analisis dan sintesis, evaluasi serta
kreativitas. Berikut adalah penjelasannya yaitu:
22
1. Mengetahui (C1) atau knowledge ialah tingkat kemampuan yang hanya
meminta responden atau testee untuk mengenal atau mengetahui adanya
konsep, fakta, atau istilah-istilah tanpa harus mengerti atau dapat menilai
atau dapat menggunakannya. Dalam hal ini biasanya testee hanya dituntut
untuk menyebutkan kembali (recall) atau menghafal saja.
2. Memahami (C2) adalah tingkat kemampuan yang mengharapkan testee
mampu memahami arti atau konsep, situasi serta fakta yang diketahuinya.
Dalam hal ini testee tidak hanya hafal secara verbal akan tetapi juga
memahami konsep dari masalah atau fakta yang ditanyakan
3. Menerapkan (C3) adalah penggunaan abstraksi pada situasi konkret atau
situasi khusus. Testee dituntut kemampuannya untuk menerapkan atau
menggunakan apa yang telah diketahuinya dalam situasi baru baginya
(diabstrakkan). Abstraksi ini dapat berupa ide, teori, atau petunjuk praktis.
4. Menganalisis (C4) adalah kemampuan yang mengukur testee untuk
menganalisis atau menguraikan suatu integritas atau situasi tertentu ke
dalam komponen-komponen atau unsur-unsur pembentuknya. Diharapkan
siswa dapat memahami dan sekaligus mampu memilah-milahnya menjadi
bagian-bagian, termasuk juga menguraikan bagaimana proses terjadinya
sesuatu, cara bekerjanya sesuatu, atau mungkin juga sistematikanya.
Sedangkan kemampuan sintesis adalah penyatuan unsur-unsur atau bagian
bagian ke dalam suatu bentuk yang menyeluruh. Diharapkan testee mampu
menemukan hubungan kausal atau urutan tertentu atau menemukan
abstraksinya yang berupa integritas.
23
5. Mengevaluasi (C5) adalah kemampuan testee untuk membuat suatu
penilaian tentang suatu pernyataan, konsep, situasi, dan sebagainya
berdasarkan suatu kriteria tertentu. Kegiatan penilaian dapat dilihat dari segi
tujuannya, gagasannya, cara bekerjanya, cara pemecahannya, metodenya,
materinya atau lainnya.
6. Mengkreasi (C6) adalah tingkat kemampuan untuk merancang, membangun,
merencanakan, memproduksi, menemukan, membaharui, menyempurnakan,
memperkuat dan menggubah sesuatu menjadi baru (Ratumanan dan laurens,
2011).
2.2.7 Bentuk Soal Tes Pilihan Ganda
Soal pilihan ganda merupakan bentuk soal yang jawabannnya dapat
dipilih dari beberapa kemungkinan jawaban yang telah disediakan. Konstruksinya
terdiri dari pokok soal dan pilihan jawaban. Pilihan jawaban terdiri atas kunci dan
pengecoh. Kunci harus merupakan jawaban benar atau paling benar sedangkan
pengecoh merupakan jawaban tidak benar, namun daya jebak harus berfungsi,
artinya siswa memungkinkan memilihnya jika tidak menguasai materi
(Depdiknas, 2007).
Menurut Sudjana (2008:48) soal pilihan ganda adalah bentuk tes yang
mempunyai satu jawaban yang benar atau paling tepat. Dilihat dari strukturnya,
bentuk soal pilihan ganda terdiri atas: a) Stem – pertanyaan atau pernyataan yang
berisis permasalahan yang akan ditanyakan, b) Option – sejumlah pilihan atau
alternative jawaban, c) Kunci – jawaban yang benar atau yang paling tepat, d)
Distractor – jawaban-jawaban lain selain kunci jawaban.
24
Soal pilihan ganda dapat diskor dengan mudah, cepat dan memiliki
objektivitas yang tinggi, mengukur berbagai tingkatan kognitif, serta dapat
mencakup ruang lingkup materi yang luas dalam suatu tes. Bentuk ini sangat tepat
digunakan untuk ujian berskala besar dan hasilnya harus segera diumumkan,
seperti ujian nasional dan ujian akhir sekolah. Hanya saja, untuk menyusun soal
pilihan ganda bermutu perlu waktu lama dan biaya cukup besar, disamping itu,
penulis soal akan kesulitan membuat pengecoh yang homogen dan berfungsi,
terdapat peluang untuk menebak kunci jawaban, dan peserta mudah mencontek
kunci jawaban. Secara umum, setiap soal pilihan ganda terdiri dari pokok soal
(stem) dan pilihan jawaban (option). Pilihan jawaban terdiri atas kunci jawaban
dan pengecoh (distractor) (Depdiknas, 2007).
Menurut Sudjana (2008:49) bentuk soal tes pilihan ganda memiliki kebaikan dan kelemahan diantaranya sebgai berikut: Kebaikan bentuk soal tes pilihan ganda
(1) Materi yang diujikan dapat mencakup sebagian besar dari bahan pengajaran yang telah diberikan.
(2) Jawaban siswa dapat dikoreksi (dinilai) dengan mudah dan cepat dengan menggunakan kunci jawaban.
(3) Jawaban untuk setiap pertanyaan sudah pasti benar atau salah sehingga penilaiannya bersifat objektif.
Kelemahan bentuk soal tes pilihan ganda (1) Kemungkinan untuk melakukan tebakan jawaban masih cukup besar. (2) Proses berpikir siswa tidak dapat dilihat dengan nyata.
2.2.8 Bentuk Soal Tes Uraian
Menurut Ratumanan dan laurens (2008:67), tes uraian tepat digunakan
untuk mengukur kemampuan mengorganisasikan, menuangkan gagasan,
mengekspresikan gagasan, menganalisis, atau kemampuan tingkat tinggi lainnya
yang tidak dapat diukur menggunakan tes pilihan gada atau objektif lainnya.
Sedangkan menurut Sudjana (2008:35) tes uraian disebut juga essay, merupakan
25
alat penilaian yang hasil belajar yang paling tua. Secara umum tes uraian ini
adalah pertanyaan yang menuntut siswa menjawab dalam bentuk menguraikan,
menjelaskan, mendiskusikan, membandingkan, memberikan alasan, dan bentuk
lain yang sejenis sesuai dengan tuntutan pertanyaan dengan menggunakan kata-
kata dan bahasa sendiri, Dengan demikian, dalam tes ini dituntut kemampuan
siswa dalam mengekspresikan gagasannya melalui bahasa tulisan.
Menurut Sudjana (2008:36) bentuk soal tes uraian memiliki kebaikan dan kelemahan diantaranya sebgai berikut: Kebaikan bentuk soal tes uraian:
(1) Dapat mengukur proses mental yang tinggi atau aspek kognitif tingkat tinggi;
(2) Dapat meningkatkan kemampuan berbahasa, baik lisan maupun tulisan, dengan bail dan benar sesuai dengan kaidah-kaidah bahasa;
(3) Dapat melatih kemampuan berfikir teratur atau penalaran, yakni berfikir logis, analitis dan sistematis;
(4) Mengembangkan keterampilan pemecahan masalah (problem solving); (5) Adanya keuntungan teknis seperti mudah membuat soalnya sihingga tanpa
memakan waktu yang lama, guru dapat secara langsung melihat proses berfikir siswa.
Kekurangan bentuk soal tes uraian: (1)Sampel tes sangat terbatas sebab dengan tes ini tidak mungkin dapat
menguji semua bahan yang telah diberikan, tidak seperti pada tes objektif yang dapat menanyakan banyak hal melalui sejumlah pertanyaan.
(2)Sifatnya sangat subjektif, baik dalam menanyakan, dalam membuat pertanyaan, maupun dalam cara memeriksanya.
(3)Tes ini bisaanya kurang reliabel, mengungkap aspek yang terbatas, pemeriksaannya memerlukan waktu lama sehingga tidak praktis bagi kelas yang jumlah siswanya relatif besar.
2.3 Analisis Butir Soal
Analisis butir soal atau analisis item adalah pengkajian pertanyaan-
pertanyaan tes agar diperoleh perangkat tes yang memiliki kualitas yang memadai.
Ada dua jenis analisis butir soal, yakni analisis tingkat kesukaran soal dan analisis
daya pembeda disamping validitas dan reliabilitas. Menganalisis tingkat
kesukaran pada soal artinya mengkaji soal-soal tes dari segi kesulitannya sehingga
26
dapat diperoleh soal-soal mana yang termasuk mudah, sedang dan sukar.
Sedangkan menganalisis daya pembeda artinya mengkaji soal-soal tes dari segi
kesanggupan tes tersebut dalam membedakan siswa yang termasuk dalam kategori
lemah atau rendah dan kategori kuat atau tinggi prestasinya. Sedangkan validitas
dan reliabilitas mengkaji kesulitan pertanyaan tes (Sudjana, 2008:135).
Menurut Aiken (dalam Ratumanan dan laurens, 2008), analisis butir soal
bertujuan untuk membantu meningkatkan tes melalui revisi atau membuang soal
yang tidak efektif, serta untuk mengetahui informasi diagnostic pada peserta didik
apakah mereka sudah/ belum memahami materi yang telah diajarkan. Kualitas
butir soal dapat dilakukan dengan cara menganalisis butir soal melalui analisis
empiric atau validitas empiric meliputi tingkat kesukaran, daya beda, validitas,
reliabilitas dan kualitas pengecoh untuk soal pilihan ganda dan analisis teoritik
atau validitas logis yang meliputi isi, konstruksi dan bahasa.
2.3.1 Analisis empirik
2.3.1.1 Tingkat Kesukaran
Tingkat kesukaran adalah angka yang menunjukan proporsi siswa yang
menjawab betul suatu soal (Slameto, 2001). Jika semua atau bagian peserta didik
dapat menjawab atau menyelesaikan soal dengan benar, maka soal tersebut dapat
dikategorikan sebagai soal mudah. Sebaliknya jika semua atau sebagian besar
peserta didik tidak dapat menyelesaikan soal tersebut dengan benar, maka soal
tersebut dikategorikan sebagai soal sulit. Sedangkan menurut Taruh (2008) tingkat
kesukaran butir soal sangat dipengaruhi oleh tingkat kemampuan anggota
kelompok pada tes. Tingkat kesukaran berada pada interval 0,0 sampai 1.
27
Semakin tinggi tingkat kesukaran soal berarti semakin mudah soal tersebut dan
sebaliknya semakin rendah tingkat kesukaran soal berarti semakin sukar soal
tersebut .
2.3.1.2 Validitas
Validitas yaitu ketepatan mengukur yang dimiliki oleh sebutir item (yang
merupakan bagian tak terpisahkan dari tes sebagai suatu totalitas), dalam
mengukur apa yang seharusnya diukur lewat butir item tersebut (Sudijono, 2001).
Suatu alat penilaian dikatakan mempunyai validitas yang tinggi apabila
alat penilaian tersebut mampu mengukur apa yang seharusnya diukur (Purwanto,
2008). Arikunto (2001) menjelaskan adanya empat bentuk validitas yaitu:
validitas isi, validitas konstruksi, validitas yang ada sekarang, dan validitas
prediksi.
Sebuah tes disebut memiliki validitas isi apabila tes tersebut mengukur
tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang
diberikan. Alat tes yang dianggap layak dan dapat dipertanggungjawabkan
validitas isinya apabila dalam penyusunannya mendasarkan diri pada tabel kisi-
kisi. Nurgiyantoro (1987) (dalam Purwanto 2008) menjelaskan bahwa validitas isi
merujuk pada kesesuaian antara butir-butir soal dengan tujuan dan bahan
pengajaran. Karena tujuan dan bahan pengajaran tersebut tercantum pada tabel
kisi-kisi sehingga tidak salah apabila dikatakan bahwa penyusunan butir-butir soal
yang mendasar pada Tabel kisi-kisi dianggap layak dan dapat
dipertanggungjawabkan validitas isinya. Secara sederhana dapat dikatakan bahwa
28
tes yang disusun tidak boleh keluar dari isi mata pelajaran yang ada di dalam
kurikulum.
Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal
yang membangun tes tersebut mengukur setiap aspek berpikir (ingatan,
pemahaman dan aplikasi) seperti yang disebutkan dalam indikator dalam Tabel
kisi-kisi. Validitas isi dan validitas konstruksi ini digolongkan ke dalam validitas
logis atau validitas rasional (Arikunto, 2001). Untuk mengetahui tingkat validitas
rasional dapat dilakukan dengan mengadakan analisis rasional (Nurkancana,
1986) dalam Sudjana (2008), yaitu analisis berdasarkan pikiran-pikiran yang logis
bahan-bahan apa yang perlu dikemukakan dalam suatu tes. Jika penganalisaan
secara rasional itu menunjukan hasil yang membenarkan tentang telah
tercerminnya tujuan instruksional khusus itu di dalam tes hasil belajar yang telah
memiliki validitas isi maupun validitas konstruksi.
Menurut Sudijono (2001), upaya lain yang dapat ditempuh dalam rangka
mengetahui validitas isi dan validitas konstruksi sebuah tes hasil belajar adalah
dengan jalan menyelenggarakan diskusi panel. Dalam diskusi tersebut para pakar
yang dipandang memiliki keahlian yang ada hubungannya dengan mata pelajaran
yang diujikan, diminta pendapat dan rekomendasinya terhadap isi atau materi
yang terkandung dalam tes hasil belajar yang bersangkutan. Adapun sebuah tes
dikatakan memiliki validitas ada sekarang (concurent validity) jika hasilnya sesuai
dengan pengalaman. Nurkancana (1986) (dalam Sudjana, 2008) menjelaskan,
untuk menilai validitas ada sekarang dapat dilakukan dengan jalan
mengkorelasikan hasil-hasil yang dicapai dalam tes yang sejenis yang telah
29
diketahui mempunyai validitas yang tinggi. Sedangkan sebuah tes memiliki
validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang
akan terjadi pada masa yang akan datang. Cara pengujian dengan jalan mencari
korelasi antara nilai-nilai yang dicapai oleh anak-anak dalam tes tersebut dengan
nilai-nilai yang dicapai kemudian.
2.3.1.3 Reliabilitas
Menurut Gualford (1978) dalam Dewanto (1995), realibilitas adalah
proporsi dari varian dengan varian yang sesungguhnya. Reliabilitas suatu tes pada
hakekatnya menguji keajegan pertanyaan tes yang di dalamnya berupa
seperangkat butir soal apabila diberikan berulang kali pada objek yang sama.
Suatu tes dikatakan reliabel apabila beberapa kali pengujian menunjukan hasil
yang relatif sama (Sudjana, 2008).
Menurut (Sudjana, 2008:148), untuk melakukan analisis reliabilitas suatu
tes dapat digunakan beberapa metode yaitu:
1) Reliabilitas tes ulang
Tes ulang adalah penggunaaan alat penilaian terhadap subjek yang sama,
dilakukan dua kali dalam waktu yang berlainan.
2) Reliabilitas belah dua
Reliabilitas belah dua mirip dengan reliabilitas pecahan setara, terutama
dalam pelaksanaannya. Butir-butir soal dibagi menjadi dua bagian yang
sebanding, biasanya dengan membedakan soal nomor genap dengan soal
nomor ganjil.
30
3) Kesamaan rasional
Prosedur menghitung reliabilitas tanpa melakukan korelasi dari dua
pengukuran atau pecahan setara atau belah dua. Prosedur ini dilakukan
dengan menghubungkan setiap butir dalam satu tes dengan butir-butir
lainnya dalam tes itu sendiri secara keseluruhan.
Reliabilitas dapat tinggi dapat rendah. Ada faktor-faktor yang
mempengaruhi koefisien reliabilitas. Faktor-faktor tersebut adalah: panjang
pendeknya tes, kadar homogenitas tes, rentangan kemampuan siswa, luas dan
tidaknya sampel yang diambil, suasana dan kondisi waktu tes serta keakuratan
penskoran (Purwanto, 2008).
Dengan demikian, untuk memperoleh hasil penilaian yang sesuai dengan
tuntutan syarat-syarat penilaian (valid dan reliabel) maka pemilihan alat penilaian
menjadi sangat penting. Hal ini disebabkan karena kemampuan dari siswa yang
akan diungkapkan ditentukan oleh alat penilaian yang akan digunakan.
2.3.1.4 Daya Pembeda
Daya pembeda item adalah kemampuan suatu butir item tes hasil belajar
untuk dapat membedakan antara testee yang berkemampuan tinggi dengan testee
yang kemampuannya rendah demikian rupa sehingga sebagian besar testee yang
memiliki kemampuan yang tinggi untuk menjawab butir item tersebut lebih
banyak menjawab butir item tersebut lebih banyak yang menjawab betul,
sementara testee yang kemampuannya rendah untuk menjawab butir item tersebut
sebagian besar tidak dapat menjawab item dengan betul (Sudijono, 2001).
31
Menurut (Sudjana, 2008:141), daya pembeda mengkaji butir-butir soal
dengan tujuan untuk mengetahui kesanggupan soal dalam membedakan siswa
yang tergolong mampu (tinggi prestasinya) dengan siswa yang tergolong kurang
mampu atau lemah prestasinya. Artinya, bila soal tersebut diberikan kepada anak
yang mampu, hasilnya menunjukkan prestasi yang tinggi; dan bila diberikan pada
siswa yang lemah, hasilnya rendah.
2.3.1.5 Distraktor
Distraktor hanya untuk soal pilihan ganda, distractor yaitu suatu pola yang
dapat menggambarkan bagaimana testee menentukan pilihan jawabanannya
terhadap kemungkinan jawabn-jawaban yang telah dipasangkan pada butir item
(Sudijono, 2001). Suatu option dikatakan efektif jika memenuhi fungsi atau tujuan
disajikannya option tersebut. Hal ini berarti bahwa setiap option yang disajikan
memiliki kemungkinan yang sama untuk dipilih, jika testee menjawab soal
tersebut dengan cara menerka (spekulasi).
Kusaeri (2012: 107) mengemukakan bahwa: “Pengecoh adalah jawaban
yang tida benar atau kurang tepat, namun memungkinkan seseorang terkecoh
untuk memilihnya apabila ia tidak menguasai materi dengan baik”. Jawaban
pengecoh yang terdapat pada soal-soal obyektif atau pilihan ganda yang
digunakan untuk mengecoh siswa sebagai peserta tes. Oleh karena itu jawaban
pengecoh harus diformulasikan sedemikian rupa agar berfungsi dengan baik dan
tepat sasaran.
32
2.3.2 Analisis teoritik/ validitas logis
Ada beberapa teknik yang dapat dilakukan untuk menganalisis butir soal
secara kualitatif, diantaranya adalah teknik panel. Teknik panel merupakan teknik
menelaah butir soal berdasarkan kaidah penulisan butir soal yaitu ditelaah dari
segi materi, konstruksi dan bahasa yang dilakukan oleh beberapa penelaah.
Kriteria telaah dari segi materi, konstruksi, dan bahasa adalah sebagai berikut:
1) Materi
Dari segi materi yang harus diperhatikan adalah:
a. Kesesuaian soal dengan indikator, apabila soal didasarkan atas kisi-kisi yang
memuat indikator soal harus sesuai dengan kisi-kisi
b. Kesesuaian materi yang diukur dengan kompetensi relevansi, kontinuitas,
keterpakaian sehari-hari tinggi.
c. Pilihan jawaban homogen dan logis.
d. Hanya ada satu kunci jawaban.
2) Konstruksi
a. Pokok soal dirumuskan dengan singkat, jelas, dan tegas.
b. Rumusan pokok soal dan pilihan jawaban merupakan pernyataan yang
diperlukan saja.
c. Pokok soal tidak memberi petunjuk kunci jawaban.
d. Pokok soal bebas dari pernyataan yang bersifat negatif ganda.
e. Pilihan jawaban homogeny dan logis ditinjau dari segi materi.
f. Gambar, Grafik, Tabel, diagram, atau sejenisnya jelas dan berfungsi.
g. Panjang pilihan jawaban relatif sama.
33
h. Pilihan jawaban tidak menggunakan pernyataan “semua jawaban di atas
salah/benar” dan sejenisnya.
i. Pilihan jawaban yang berbentuk angka/waktu disusun berdasarkan urutan
besar kecilnya angka atau kronologisnya.
j. Butir soal tidak bergantung pada jawaban soal sebelumnya.
3) Bahasa
a. Menggunakan bahasa yang sesuai dengan kaidah bahasa Indonesia.
b. Menggunakan bahasa yang komunikatif.
c. Tidak menggunakan bahasa yang berlaku setempat/ tabu.
d. Pilihan jawaban tidak mengulang kata/kelompok kata yang sama,
e. kecuali merupakan satu kesatuan pengertian (Suke Silverius 1991 : 80-
81).