PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING DENGANPOLITOMUS RESPONSE PADA MATA PELAJARAN MATEMATIKA
SEKOLAH MENENGAH KEJURUAN
(Tesis)
PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKAFAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS LAMPUNGBANDAR LAMPUNG
2019
OlehAAN SULISTIAWAN
ABSTRAK
PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNINGDENGAN POLITOMUS RESPONSE PADA MATA PELAJARAN
MATEMATIKA SEKOLAH MENENGAH KEJURUAN
Oleh :
Aan Sulistiawan
Penelitian ini bertujuan untuk menghasilkan instrumen assessment for learningdengan politomus response pada Mata Pelajaran Matematika dan mengetahuikualitas instrumen berdasarkan parameter butir. Penelitian ini merupakanpenelitian pengembangan yang mengacu pada model pengembangan pendidikanumum dari Plomp. Produk awal divalidasi oleh dua ahli. Tahap uji coba instrumenmelibatkan 413 peserta didik kelas X di tiga SMK di Lampung timur. Hasil ujicoba instrummen berupa data politomus yang dianalisis dengan pendekatanPartial Credit Model 1-Parameter Logistic (1-PL) dengan bantuan programwinsteps. Indeks validitas butir dianalisis menggunakan formula indeks Gregorydan parameter butir dianalisis menggunakan pendekatan teori tes modern. Hasilpenelitian menunjukkan bahwa instrumen assessment for learning telah validsecara isi dan konstruk. Tingkat kesukaran instrumen assessment for learningberada pada kategori sedang, dan fungsi informasi yang diperoleh 22,36 dengankesalahan baku dalam pengukuran 0,211 sehingga instrumen assessment forlearning dinyatakan reliabel. Hasil pengukuran ditinjau dari kemampuan pesertadidik dalam menjawab setiap butir soal dinyatakan berada pada rentang -2 sampaidengan +2; jika ditinjau dari presentase penguasaan peserta didik dalammenjawab setiap butir soal dinyatakan dalam kategori sedang.
Kata Kunci: instrumen assessmen for learning, politomus response, itemrensponse theory
ABSTRACT
DEVELOPING ASSESSMENT FOR LEARNING INSTRUMENT WITHPOLITOMUS RESPONSE ON MATH SUBJEC TO VOCATIONAL SCHOOL
By :
AAN SULISTIAWAN
This study aims to produce assessment instruments for learning with politomus responsesin Mathematics Subjects and find the quality of instruments based on item parameters.This research is a development research that refers to the general education developmentmodel of Plomp. The research subjects were conducted at three schools, they are SMKPraja Utama Bandar Sribhawono, SMK Mitra Bhakti Bandar Sribhawono, and SMKMa'arif NU Penawaja. The total number of trial subjects was 423 students. The researchdata was collected using multiple choice tests with open reasons. The instrument consistsof two package questions with each package consisting of 40 items. But only one packageof questions was tested. The item validity index was analyzed using the Gregory indexformula and the grain parameters were analyzed using the Partial Credit Model 1-Parameter Logistic approach (1-PL) using the Winsteps program. The results of the studyindicate that the instrument valid. This is based on the calculation that the Gregory indexvalue is 1. In addition, the average reliability coefficient of 0.89 is obtained, so it is statedreliable to measure the ability of students. The measurement results in terms of the abilityof students to answer each item are stated in the range of logit -2 to +2; if it is viewedfrom the percentage of students mastery in answering each items of the questions arestated in the medium category.
Keywords: assessment for learning instrument, politomus responsese, item responsetheory
PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING
DENGANPOLITOMUS RESPONSE PADA MATA PELAJARAN
MATEMATIKA SEKOLAH MENENGAH KEJURUAN
Oleh
AAN SULISTIAWAN
Tesis
Sebagai Salah Satu Syarat untuk Mencapai Gelar
MAGISTER PENDIDIKAN MATEMATIKA
Pada
Program Studi Magister Pendidikan Matematika
Jurusan Pendidikan Matematika dan Ilmu Pengetahuan Alam
PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2019
RIWAYAT HIDUP
Penulis dilahirkan di Brawijaya, Lampung Timur, pada tanggal
29 Mei 1991. Penulis merupakan anak pertama dari pasangan
Bapak Suyitno dan Ibu Juminah.
Penulis menyelesaikan pendidikan dasar di SD Negeri
Brawijaya pada tahun 2002, pendidikan menengah pertama di SMP N1 Bandar
Sribhawono pada tahun 2005, dan pendidikan menengah atas di SMA N1 Bandar
Sribhawono pada tahun 2008. Penulis menyelesaikan sarjana program studi
Pendidikan Matematika di Universitas Muhammadiyah Metro pada tahun 2012.
Penulis menjadi pengajar di salah satu sekolah Sekolah Menengah Kejuruan
(SMK) swasta yang berada di Bandar Sribhawono tahun 2012 sampai dengan saat
ini. Penulis melanjutkan pendidikan pada program studi Magister Pendidikan
Matematika Universitas Lampung tahun 2015.
Persembahan
Dengan Mengucap Syukur Kepada Allah SWT
Kupersembahkan karya ini sebagai tanda cinta & kasih sayangku kepada:
Istriku tercinta Aflah Mufidatul Mahmudah yang selalu bersedia membantumemberikan solusi, dukungan, dan membersamaiku selama studi.
Anakku tersayang Aulia Afidatul Myesha yang selalu menjadi motivasi dalamsegala hal
Bapakku Suyitno dan Ibuku Juminah, yang telah membesarkan, mendidik,mencurahkan kasih sayang, dan selalu mendoakan kebahagiaan dan
keberhasilanku.
Bapak Mertuaku Sugiyanto dan Ibu Mertuaku Nursidah, yang tak hentimendukung, menyemangati, dan selalu mendoakan kelulusan dan keberhasilanku.
Adik-adikku yang sama-sama sedang berjuang menyelesaikan studi pada masing-masing jenjang, serta seluruh keluarga besar yang terus memberikan dukungan
dan doanya padaku.
Para pendidik yang telah mendidik dan membimbing dengan penuh kesabaran danketelatenan.
Sahabat-sahabat seangkatan selama menempuh pendidikan yang telahmemberikan warna setiap harinya.
Almamater Universitas Lampung tercinta
SANWACANA
Alhamdulillahi Robbil ‘Alamin, puji syukur kehadirat Allah SWT Yang Maha
Pengasih dan Maha Penyayang, atas rahmat dan karunia-Nya sehingga penulis
dapat menyelesaikan penyusunan tesis yang berjudul “Pengembangan instrument
assessment for learning dengan politomus response pada mata pelajaran
matematika jenjang Sekolah Menengah Kejuruan” sebagai syarat untuk mencapai
gelar Magister pendidikan pada Fakultas Keguruan dan Ilmu Pendidikan,
Universitas Lampung.
Penulis menyadari sepenuhnya bahwa terselesaikannya penyusunan tesis ini tidak
terlepas dari bantuan berbagai pihak. Oleh karena itu, penulis mengucapkan
terima kasih yang tulus ikhlas kepada:
1. Bapak Dr. Sugeng Sutiarso, M.Pd., selaku Dosen Pembimbing I dan Ketua
Program Studi Magister Pendidikan Matematika yang telah bersedia
meluangkan waktunya untuk membimbing, sumbangan pemikiran, kritik, dan
saran selama penyusunan tesis, sehingga tesis ini menjadi lebih baik.
2. Bapak Dr. Undang Rosidin, M.Pd., selaku Dosen Pembimbing II yang telah
bersedia meluangkan waktunya untuk konsultasi dan memberikan bimbingan,
memberikan perhatian, dan memotivasi selama penyusunan tesis sehingga
tesis ini menjadi lebih baik.
3. Ibu Dr. Een Yayah Haenilah, M.Pd., selaku dosen pembahas yang telah
memberikan masukan, kritik, dan saran kepada penulis.
4. Bapak Drs. Suharsono S, M.Sc., Ph.D., dan Ibu Dr. Rochmiyati, M.Pd selaku
validator dalam penelitian ini yang telah banyak memberikan saran dan
masukan untuk memperbaiki Instrumen Assessment for Learning ini agar
menjadi lebih baik.
5. Bapak Prof. Dr. Patuan Raja, M.Pd., selaku Dekan FKIP Universitas
Lampung, beserta staf dan jajarannya yang telah memberikan bantuan kepada
penulis dalam menyelesaikan tesis ini.
6. Bapak Prof. Drs. Mustofa, M.A., Ph.D. selaku Direktur Program Pascasarjana
Universitas Lampung, beserta staf dan jajarannya yang telah memberikan
perhatian dan arahan kepada penulis dalam menyelesaikan tesis.
7. Bapak dan Ibu dosen Magister Pendidikan Matematika di Fakultas Keguruan
dan Ilmu Pendidikan yang telah memberikan bekal ilmu pengetahuan kepada
penulis.
8. Bapak Restu Risntano, ST,M.Si, selaku Kepala SMK Mitra Bhakti Bandar
Sribhawono beserta Wakil, staff, dan karyawan yang telah memberikan
kemudahan selama penelitian.
9. Bapak Sugeng, M.Pd, selaku Kepala SMK Praja Utama Bandar Sribhawono
beserta Wakil, staff, dan karyawan yang telah memberikan kemudahan selama
penelitian.
10. Bapak Suprapto, S.Pd.,MM., selaku Kepala SMK Ma’arif 2 Penawaja
Sekampung Udik beserta Wakil, staff, dan karyawan yang telah memberikan
kemudahan selama penelitian.
11. Peserta didik kelas XI SMK Lampung Timur Tahun Pelajaran 2017/2018, atas
semangat dan kerjasamanya.
12. Almamater tercinta yang telah mendewasakanku.
Semoga dengan kebaikan, bantuan, dan dukungan yang telah diberikan pada
penulis, mendapat balasan pahala yang setimpal dari Allah SWT dan semoga tesis
ini dapat bermanfaat.
Bandar Lampung, Februari 2019
Penulis
Aan Sulistiawan
DAFTAR ISI
Halaman
DAFTAR TABEL ...................................................................................... xiv
DFTAR GAMBAR ..................................................................................... xv
DAFTAR LAMPIRAN .............................................................................. xvi
I. PENDAHULUAN
A. Latar Belakang Masalah ............................................................... 1
B. Rumusan Masalah ........................................................................ 9
C. Tujuan Penelitian .......................................................................... 9
D. Manfaat Penelitian ........................................................................ 10
II. TINJAUAN PUSTAKA
A. Pembelajaran Matematika ............................................................ 11
1. Teori Belajar Matematika ....................................................... 11
2. Tujuan Pendidikan Matematika .............................................. 13
B. Penilaian ....................................................................................... 17
C. Taksonomi Bloom ........................................................................ 18
D. Instrumen Penilaian ...................................................................... 20
E. Assessment for Learning Dalam Pembelajaran ............................ 23
F. Instrumen Pilihan Ganda Beralasan ............................................. 25
G. Item Response Theory ................................................................... 27
H. Validitas Tes ................................................................................. 38
I. Reliabilitas Tes ............................................................................. 43
J. Kerangka Berpikir ....................................................................... 44
III. METODE PENELITIAN
A. Jenis Penelitian ............................................................................ 47
B. Subjek Penelitian ......................................................................... 47
C. Prosedur Pengembangan .............................................................. 49
D. Teknik dan Instrumen Pengumpulan Data ................................... 55
E. Teknik Analisis Data ................................................................... 56
IV. HASIL PENELITIAN DAN PEMBAHASAN
A. Hasil Pengembangan Produk Awal .............................................. 62
1. Merumuskan materi matematika kelas X ............................... 63
2. Menyusun kisi-kisi tes ............................................................ 63
3. Menyusun spesifikasi butir soal ............................................. 64
4. Menulis butir soal ................................................................... 64
xiii
5. Menelaah butir soal ................................................................ 65
B. Hasil Uji Coba Produk ................................................................. 66
1. Hasil Uji Validasi Ahli dan Reliabilitas ................................. 67
2. Hasil Uji Asumsi Rasch .......................................................... 69
a. Uji Asumsi Unidimensi .................................................... 69
b. Uji Asumsi Independensi Lokal ....................................... 71
c. Kecocokan Butir (Item Fit)............................................... 72
d. Tingkat Kesukaran Butir (Item dificulty).......................... 74
e. Fungsi Informasi dan Kesalahan Pengukuran .................. 77
C. Revisi Produk ............................................................................... 79
D. Kajian Produk Akhir ..................................................................... 79
1. Konstruksi Instrumen ............................................................. 80
a. Validitas isi dan konstruk ................................................. 80
b. Reliabilitas ........................................................................ 82
2. Karakteristik Butir Instrumen ................................................. 83
a. Tingkat kesukaran............................................................. 83
b. Fungsi informasi dan kesalahan pengukuran ................... 83
E. Pebahasan Pengembangan Instrumen Assessment for Learning .. 84
1. Prosedur Pengembangan Instrumen Assessment for learning 84
2. Kualitas Instrumen Assessment for learning .......................... 85
3. Hasil Analisis Instrumen Assessment for learning ................. 86
4. Deskripsi Kemampuan Peserta Didik ..................................... 104
F. Keterbatasan Penelitian ................................................................ 108
V. KESIMPULAN DAN SARAN
A. Kesimpulan ................................................................................ 111
B. Saran .......................................................................................... 112
DAFTAR PUSTAKA
LAMPIRAN
DAFTAR TABEL
Tabel Halaman
2.1 Tabel Kontingensi untk Menghitung Indeks Gregory........................ 423.1 Kriteria Penskoran Jawaban ............................................................... 563.2 Kriteria Penilaian Butir Instrumen oleh Validator ............................. 573.3 Kriteria Cronbach’s Alpha ................................................................. 593.4 Kategori Tingkat Kesukaran............................................................... 603.5 Rentang Nilai IMS dan OMS ............................................................. 614.1 Kisi-kisi Instrumen Assessment for Learning Matematika................. 644.2 Subjek Uji Coba ................................................................................. 674.3 Index Gregory Butir Soal ................................................................... 684.4 Hasil Uji KMO dan Bartlet................................................................. 704.5 Total Variance Explained ................................................................... 704.6 Hasil Uji Asumsi Independensi Lokal................................................ 724.7 Kecocokan Butir Terhadap Model ..................................................... 734.8 Tingkat Kesukaran Butir .................................................................... 744.9 Skor Hasil Hasil Uji Coba .................................................................. 1024.10 Kategorisasi Kemampuan Peserta Didik ............................................ 105
DAFTAR GAMBAR
Gambar Halaman
2.1 Perubahan dari Kerangka Pikir Asli ke Revisi (Anderson danKrathwohl, 2001:268)......................................................................... 20
2.2 Mekanisme Pengembangan Instrumen Evaluasi ................................ 463.1 Langkah Pengembangan..................................................................... 544.1 Scree Plot Unidimensi ........................................................................ 714.2 Item Difficult Map .............................................................................. 764.3 Grafik Fungsi Informasi Dan Kesalahan Pengukuran........................ 774.4 Jawaban Peserta Didik Soal No. 1...................................................... 874.5 Jawaban Peserta Didik Soal No. 2...................................................... 884.6 Jawaban Peserta Didik Soal No. 3...................................................... 894.7 Jawaban Peserta Didik Soal No. 4...................................................... 904.8 Jawaban Peserta Didik Soal No. 5...................................................... 91
DAFTAR LAMPIRAN
Lampiran Halaman
1. Kisi-Kisi Instrumen Paket A ................................................................. 1162. Kisi-Kisi Instrumen Paket B ................................................................. 1323. Instrumen Tes Paralel Paket A.............................................................. 1484. Instrumen Tes Paralel Paket B .............................................................. 1625. Kunci Jawaban Instrumen Tes Paket A ................................................ 1736. Kunci Jawaban Instrumen Tes Paket B................................................. 1857. Lembar Validasi Para Ahli.................................................................... 1978. Hasil Analisis Indeks Gregory .............................................................. 2549. Hasil Analisis Uji Coba......................................................................... 25610. Hasil Analisis Faktor Menggunakan Program SPSS............................. 25811. Hasil Uji Asumsi Independendi Lokal.................................................. 26012. Hasil Analisis Kecocokan Butir Soal (Item Fit) ................................... 26213. Hasil Analisis Tingkat Kesukaran Butir (Item Difficulty)..................... 26314. Hasil Analisis Fungsi Informasi Tes dan Kesalahan Baku Pengukuran 26415. Kegiatan Uji Coba Penelitian................................................................ 269
I. PENDAHULUAN
A. Latar Belakang
Perbaikan pendidikan dengan mengubah kurikulum menjadi kurikulum 2013
dilakukan pemegang kekuasaan dalam bidang pendididikan dilakukan
dikarenakan dalam pembelajaran peserta didik kurang didukung untuk
mengembangkan kemampuan berpikir dan membangun pemahaman konsepnya.
Kurikulum merupakan rencana atau program yang menyangkut seluruh
pengalaman yang dihayati peserta didik dibawah pengarahan oleh sekolah. Sesuai
dengan Permendikbud No. 60 Th 2014, bahwa pengembangan kurikulum di
Indonesia saat ini yaitu Kurikulum 2013 diterapkan di seluruh jenjang pendidikan.
Implementasi Kurikulum 2013 mempunyai beberapa perubahan, salah satunya
dalam sistem penilaian belajar. Penilaian ditekankan pada hasil dan proses
pembelajaran peserta didik. Kurikulum 13 menuntut dimana proses pembelajaran
aktif meliputi mengamati, menanya, mengumpulkan data, mengasosiasi, dan
menyimpulkan. Dengan adanya pedoman baru dalam kurikulum 2013 tersebut,
proses pembelajaran di Indonesia harus mengikutsertakan siswa dalam
mengonstruk pengetahuan mereka sendiri secara aktif. Peserta didik berperan aktif
dalam proses pembelajaran bagi diri mereka sendiri. Mereka akan memilih
informasi dan menyusun maknanya sendiri dari informasi yang mereka pilih.
2
Proses pembelajaran kurikulum 2013 mengharuskan guru merancang kegiatan
yang menuntut peserta didik sampai pada suatu setting pembelajaran dengan
kesatuan mendasar, tujuan-tujuan mereka, pengalaman-pengalaman sebelumnya,
dan mereka akan menggunakan seluruh hal ini untuk memahami informasi yang
mereka peroleh. Proses pemahaman yang sangan konstruktif ini meliputi
pengaktifan pengetahuan terdahulu. Seperti halnya dengan proses-proses kogniti
yang bekerja pada pengetahuan ini.
Kegiatan pembelajaran yang terpusat pada siswa, meskipun setiap siswa mendapat
perlakuan yang sama, mereka dapat membentuk pengetahuan mereka sendiri yang
berbeda dengan harapan guru. Pengetahuan yang dikonstruksi tersebut bisa
menjadi salah karena adanya keterbatasan pada diri siswa tersebut atau dapat
bercampur dengan gagasan-gagasan lain. Hal ini disebabkan karena siswa belum
terbiasa mengonstruksi konsep dengan benar dan belum mempunyai kerangka
ilmiah yang dapat digunakan sebagai acuan.
Siswa yang telah memahami konsep dapat terukur dari hasil belajar yang baik.
Hasil belajar tersebut diberian oleh guru pada setiap kurun waktu tertentu. Hasi
belajar yang rendah mengindikasikan adanya kesulitan dalam proses belajar
siswa, sehingga mempengaruhi tingkat pemahaman siswa. Hasil belajar juga
dipengaruhi oleh gagasan awal siswa yang yang dibawa ke dalam proses
pembelajaran.
Pendidik dapat melaksanaan penilaian hasil belajar salah satu caranya dengan
memberikan tes dalam proses kegiatan belajar mengajar. Arikunto (2012: 67)
mengemukakan bahwa tes adalah alat atau prosedur yang digunakan untuk
3
mengetahui atau mengukur sesuatu dalam suasana, dengan cara aturan-aturan
yang sudah ditentukan. Tujuan dari melakukan tes adalah untuk mengetahui
pencapaian belajar atau kompetensi peserta didik, dan dapat memberikan
informasi tentang kemampuan kognitif atau keterampilan peserta didik.
Tes menjadi salah satu aspek yang sangat penting dalam pelaksanaan proses
belajar mengajar. Tes yang dikatakan baik apabila mampu mengukur apa yang
seharusnya diukur dan dapat memberikan hasil yang dapat dipercaya. Kegiatan
preses belajar mengajar saling berkaitan erat dengan sistem penilaian. Penilaian
dalam proses belajar mengajar dilakukan dalam tiga aspek yaitu aspek kognitif,
aspek afektif, dan aspek pesikomotorik.
Tes hasil belajar merupakan bentuk tes yang digunakan untuk menilai hasil
belajar siswa tentang materi pelajaran yang telah diberikan guru kepada murid-
muridnya dalam jangka waktu tertentu. Tes yang dilaksanakan pada akhir
semester disebut tes sumatif atau dikenal dengan sebutan ulangan umum.
Sedangkan tes yang dilaksanakan untuk memperbaiki proses pembelajaran yang
sedang atau yang sudah dilaksanakan disebut tes formatif atau ulangan harian.
Tes hasil belajar yang digunakan guru biasanya dibagi lagi menjadi tes subjektif
dan tes objektif. Tes subyektif untuk mengukur kemampuan siswa dalam hal
menganalisasi pikirannya, mengemukakan kata-kata atau kalimat siswa sendiri.
Sedangkan tes objektif pilihan ganda dapat mengukur kemampuan intelektual atau
kognitif, afektif dan psikomotor. Istilah lain untuk menyebut tes formatif dan
objektif yaitu Assessment for learning untuk tes formatif, dan Assessment of
learning untuk tes objektif.
4
Tes pilihan ganda merupakan salah satu bentuk tes selected response yang luas
penggunaannya untuk berbagai macam keperluan, misalnya: ulangan umum, ujian
akhir nasional, survey internasional seperti Trends in Mathematics and Science
Study (TIMSS) maupun Programme for International Student Assessment (PISA),
tes bahasa Inggris yang diselenggarakan oleh lembaga testing di luar negeri
seperti TOEFL, IELTS, TOEIC, GRE, dan bakat skolastik. Hal tersebut tidak
terlepas dari keunggulun tes pilihan ganda yang efektif untuk mengukur berbagai
jenis pengetahuan dan hasil belajar yang kompleks. Tes pilihan gandat sangat
tepat untuk ujian yang pesertanya banyak dan hasilnya harus segera diumumkan,
serta karena jumlah dapat banyak maka faktor reliabilitas bertambah. Namun
rupanya terdapat beberapa kelemahan, yaitu: siswa tidak mempunyai keleluasaan
dalam menulis, mengorganisasikan, dan mengekspresikan gagasan yang mereka
miliki yang dituangkan ke dalam kata atau kalimatnya sendiri; tidak dapat
digunakan untuk mengukur kemampuan problem solving; sangat sensitif terhadap
terkaan; penyusunan tes yang baik memerlukan waktu yang relatif lama
dibandingkan dengan bentuk tes yang lainnya; serta sangat sukar menentukan
alternatif jawaban (distraktor) yang benar-benar homogen, logis, dan berfungsi.
Sampai saat ini tes yang digunakan untuk mengukur kemampuan peserta didik
berupa soal bentuk tes pilihan ganda. Walaupun tes objektif pilihan ganda dapat
digunakan untuk mengukur semua proses berpikir dalam ranah kognitif mulai dari
berpikir sederhana (ingatan) sampai dengan jenjang berpikir tinggi (kreasi). Tetapi
pada kenyataannya butir soal yang diujikan kebanyakan hanya mengukur proses
berpikir rendah, sehingga sukar untuk mengetahui kemampuan pada ranah
berpikir tinggi.
5
Soal pilihan ganda memiliki pilihan jawaban yang disediakan menyebabkan
kemungkinan besar peserta didik hanya mengandalkan intuisi bahkan tebakan.
Selain itu peserta didik tidak dapat mengorganisasi, menghubungkan, dan
menyatakan idenya karena jawaban telah disediakan. Akibatnya pendidik tidak
dapat mengidentifikasi kesulitan dan tingkat pemahaman peserta didik terhadap
materi yang telah dipelajari.
Bentuk tes uraian atau essay merupukan alat alat penilaian hasil belajar yang
paling tua. Secara umum tes uraian adalah pertanyaan yang menuntut siswa
menjawabnya dalam bentuk menguraikan, menjelaskan, mendiskusikan,
membandingkan, memberikan alasan, dan bentuk lain yang sejenis sesuai dengan
tuntutan pertanyaan dengan menggunakan kata – kata dan bahasa sendiri. Dengan
demikian, dalam tes ini dituntut kemampuan siswa dalam hal mengekspresikan
gagasannya melalui bahasa tulisan.
Adapun kelebihan atau keunggulan tes uraian ini yaitu dapat terlatih kemampuan
berpikir teratur atau penalaran, yakni berfikir logis, analitis, dan sistematis. Serta
dapat mengembangkan keterampilan pemecahan masalah (problem solving) bagi
peserta didik. Namun dilain pihak kelemahan atau kekurangan yang terdapat
dalam tes ini, yaitu, pemeriksaannya memerlukan waktu lama sehingga tidak
praktis bagi kelas yang jumlah siswanya relatif besar serta tidak dapat
sembarangan orang melakukan pemerikasaan jawaban. Bahkan dalam tes ini
sifatnya bisa sangat subjektif, baik dalam menanyakan, dalam membuat
pertanyaan, maupun dalam cara memeriksanya.
6
Pakar pendidikan, Mardapi (2008: 5) mengungkapkan bahwa hasil penilaian yang
baik akan memberikan informasi penting yang akan mendorong pendidik untuk
merancang pembelajaran yang lebih baik. Selain itu hasil penilaian yang baik juga
akan memberikan motivasi kepada peserta didik. Penilaian yang sering dilakukan
oleh guru-guru di Indonesia adalah penilaian sumatif atau Assessment of Learning
yang digunakan untuk mendapat skor atau prestasi belajar siswa tanpa adanya
usaha perbaikan pembelajaran. Penilaian yang dapat digunakan untuk
memperbaiki kualitas pembelajaran adalah penilaian formatif atau Assessment for
Learning.
Fakta dilapangan menunjukkan guru mengalami kesulitan dalam penilaian belajar
terutama dalam penilaian hasil belajar terutama penilaian formatif/proses sehingga
pelaksanaannya belum optimal. Faktor penghambat pelaksanaan penilaian
formatif yaitu metode, pemanfaatan hasil dan peserta didik. Informasi dari guru
juga memberikan indikasi lemahnya kemampuan peserta didik. Kelemahan
tersebut dapat terlihat ketika peserta didik dihadapkan pada soal-soal kurang
mampu mengungkapkan gagasan. Dan selama ini, guru masih belum pernah
membuat tes yang difokuskan untuk mengukur kemampuan peserta didik. Pada
umumnya tes yang dilakukan oleh guru hanya bertujuan untuk memberikan
penilaian pada peserta didik tanpa memperhatikan penguasaan matematika.
Padahal apabila asesmen dilakukan secara tepat akan mampu meningkatkan
penguasaan matematika.
Pengembangan instrumen penilaian sebagai variasi bentuk tes sangat penting.
Selain variasi tes, kualitas butir tes juga menjadi pertimbangan dalam pelaksanaan
7
tes. Instrumen tes yang baik merupakan tes yang dapat mengukur apa yang
hendak akan diukur oleh pendidik, yaitu untuk mengetahui tingkat penguasaan
dan pemahaman peserta didik. Guru membutuhkan cara yang efisien untuk
mendiagnosa letak kesalahan konsep peserta didik. Identifikasi kesalahan konsep
dapat dilakukan dengan berbagai jenis tes. Alternatif tes yang dapat mengukur
kemampuan atau kompetensi peserta didik dalam hal ini mengukur tingkat
pemahamannya adalah dengan menggunakan tes pilihan ganda beralasan. Tes
tersebut berisi soal yang memuat alasan bagi peserta didik atas jawaban dari
pertanyaan yang diberikan.
Pada tes pilihan ganda beralasan ini, peserta didik di minta memilih jawaban yang
benar kemudian mengemukakan alasan yang mendasari jawabannya tersebut. Soal
pilihan ganda yang disertai dengan alasan sebagai penjelasan atas jawaban yang
dipilih, lebih efektif dalam mengidentifikasi masalah yang adal dalam
pembelajaran. Ada dua bentuk soal tes pilihan ganda beralasan. Soal tes bentuk
pertama, pilihan ganda beralasan tertutup dengan alasan jawaban sudah
disediakan pada soal. Soal bentuk ini lebih dikenal dengan soal pilihan ganda dua
tingkat. Soal tes betuk kedua, pilihan ganda beralasan terbuka yaitu soal yang
hanya membuat tingkat pilihan ganda yang alasan pilihan jawabnya dituliskan,
sehingga peserta didik menguraikan alasan secara langsung. Alasan dituliskan
oleh peserta didik agar tidak membatasi pemahaman yang diterima. Apabila
menjawab soal dengan benar dan disertai dengan alasan yang tepat, maka dapat
dikatakan bahwa peserta didik memiliki tingkat pemahaman yang baik. Dan
sebaliknya, apabila peserta didik menjawab soal dengan benar namun alasan yang
diberika kurang tepat, maka dapat dikatakan bahwa kompetensi atau tingkat
8
pemahaman peserta didik kurang baik. Hal ini disesuikan dengan indikator
pencapaian kompetensi yang telah dikembangkan sebelumnya.
Dengan menggunakan instrumen tes jawaban beralasan terbuka, guru dapat
mengetahui letak penguasaan materi pembelajaran yang sering terjadi kesalahan
konsep didalamnya. Selain itu, guru dapat mengetahui kategori pemahaman siswa
dari jawaban siswa dalam kategori ketidakpahaman konsep atau dari menebak.
Oleh karena itu dengan penggunaan tes jawaban beralasan terbuka ini diharapkan
dapat mengidentifikasi letak kesalahan pada konsep yang diujikan.
Merujuk pada fakta-fakta di atas memang tidak menggambarkan kondisi
pelaksanaan penilaian secara keseluruhan di Indonesia, tetapi hal ini menunjukkan
bahwa terdapat sedikit permasalahan terkait dengan pelaksanaan penilaian yang
perlu diselesaikan. Salah satu masalahnya yaitu belum adanya butir-butir tes yang
dapat mengukur kemampuan kompetensi peserta didik, dan tentang sejauh mana
tingkat pemahaman mereka terhadap materi yang telah diberikan. Pengembangan
instrumen penilaian dengan politomus response atau jawaban beralasan pada mata
pelajaran matematika menjadi sangat penting untuk dilakukan. Hal ini
dikarenakan bahwa butir-butir tes dengan politomus response memiliki bukti
validitas, reliabilitas, dan parameter-parameter butir yang baik untuk mengukur
kompetensi peserta didik.
Bentuk soal pilihan ganda dan essay masing-masing memiliki keunggulan dan
kelemahan, yakni bentuk soal pilihan ganda lebih objektif dan menghemat waktu
namun tidak bisa menggambarkan kemampuan siswa secara menyeluruh. Bentuk
soal essay dapat menggambarkan kemampuan siswa yang sebenarnya, namun
9
pemeriksaanya terkesan subjektif. Berdasarkan keunggulan dan kelemahan dari 2
bentuk soal tersebut, maka dalam penelitian akan dikembangkan Instrumen
assessment for learning dalam bentuk pilihan ganda beralasan dengan tujuan
untuk tetap mengakomodir kedua bentuk soal tersbut. Solusi tersebut kemudian
diterjemahkan dalam penelitian yang berjudul “Pengembangan Instrumen
Assessment for Learning dengan Politomus Response Pada Mata Pelajaran
Matematika Jenjang Sekolah Menengah Kejuruan”.
B. Rumusan Masalah
Berdasarkan identifikasi masalah, rumusan masalah dalam penelitian ini adalah
sebagai berikut.
1. Bagaimana proses dan hasil pengembangan instrumen assessment for learning
dengan politomus respons (jawaban beralasan) pada mata pelajaran
matematika jenjang Sekolah Menengah Kejuruan?
2. Apakah instrumen yang dikembangkan ini memiliki parameter butir instrumen
assessment for learning dengan politomus response yang berkualitas?
C. Tujuan Penelitian
Berdasarkan rumusan masalah yang diangkat, maka penelitian ini bertujuan yaitu.
1. Menghasilkan instrumen assessment for learning dengan politomus respons
(jawaban beralasan) pada mata pelajaran matematika jenjang Sekolah
Menengah Kejuruan yang dapat diterima peserta didik dan guru jenjang
SMK.
2. Mengetahui kualitas instrumen assessment for learning dengan politomur
response berdasarkan parameter butir.
10
D. Manfaat Penelitian
Pengembangan instrumen evaluasi ini diharapkan memberikan hasil yang dapat
dimanfaatkan secara teoritis dan praktis.
1. Manfaat teoritis
a. Mengembangkan khazanah keilmuan di bidang instrumen evaluasi untuk
mengukur keterampilan berpikir tingkat tinggi dengan indikator menganalisis,
mengevaluasi, dan menciptakan.
b. Sebagai sumbangsih pengembangan pendidikan dalam memberikan alternatif
penggunaan instrumen evaluasi pada materi bilangan riil.
2. Manfaat praktis
a. Alternatif untuk model penilaian yang digunakan dalam Ujian Sekolah
Berbasis Nasional
b. Peserta didik dapat mengukur kemampuan kognitif pada materi bilangan riil
yang telah dikuasai.
c. Guru dapat memanfaatkan hasil penelitian sebagai informasi dan wawasan
dalam mengembangkan instrumen evaluasi pembelajaran kedepannya.
d. Peneliti memperoleh pengalaman langsung dalam mengembangkan instrumen
evaluasi sebagai alat ukur kemampuan kognitif.
e. Sebagai bahan pertimbangan untuk penelitian lebih lanjut baik pada tema yang
sama maupun yang berbeda.
II. KAJIAN TEORI
A. Pembelajaran Matematika
1. Teori Belajar Matematika
Matematika merupakan salah satu disiplin ilmu yang dapat meningkatkan
kemampuan berpikir dan beragumentasi, memberikan kontribusi dalam
penyelesaian masalah sehari-hari dan dalam dunia kerja, serta memberikan
dukungan dalam pengembangan ilmu pengetahuan dan teknologi. Kebutuhan
akan aplikasi matematika saat ini dan masa depan tidak hanya untuk keperluan
sehari-hari, tetapi juga dalam dunia kerja, dan untuk mendukung perkembangan
ilmu pengetahuan. Berdasarkan Lampiran Permendikbud nomor 60 tahun 2014
matematika adalah ilmu universal yang berguna bagi kehidupan manusia,
mendasari perkembangan teknologi modern, berperan dalam berbagai ilmu, dan
memajukan daya pikir manusia. Sejalan dengan hal tersebut Ruseffendi (2006)
mengungkapkan bahwa matematika diajarkan di sekolah karena matematika
berguna dalam memecahkan persoalan kehidupan sehari-hari dan persoalan lain.
Saat guru memberikan soal cerita kepada siwa yang sederhana dan dirancang
sedemikan rupa, membuat siswa dapat mengembangkan strategi dalam
menyelesaikan masalah.
Reedal (2010:16) menyatakan bahwa teori tahapan perkembangan Jean Peaget
dapat diaplikasikan dalam tahapan pembelajaran matematika terdapat 4 tahapan.
12
Tahap yang pertama adalah tahap sensori motor yang dalam perkembangan
kognitif piaget peserta didik akan terbatas pada bagaimana mereka anak
membandingkan atau mengkomparasikan objek atau situasi. Dalam tahap
kemampuan matematikanya anak akan mampu mengkomparasikan sesuatu
misalnya membandingkan ukuran mainan. Tahap kedua adalah tahap pra-
oprasional, dimana tahap ini memungkinkan sedikit pemahaman lebih jauh
tentang bagaimana membandingkan lebih banyak objek ataupun situasi namun
masih dibatasi sesuatu yang konkrit. Tahap ini dapat dicontohkan dengan salah
satu studi Piaget dengan memberikan pada peserta didik untuk mengkonservasi
atau membandingkan kontainer dengan tinggi dan lebar yang sama. Tahap ketiga
adalah tahap oprasional dasar, dimana pada tahapan ini peserta didik dapat
membandingkan dua wadah berbeda secara akurat dan memahami bahwa jika
suatu zat cair jika dituangkan pada wadah yang berbeda tidak mengurangi isi dari
zat cair tersebut. Tahap terakhir adalah tahap oprasional formal, adapun ada tahap
ini peserta didik jauh lebih memahami bagaimana membandingkan situasi
matematika yang berbeda. Pada tahap ini peserta didik sudah lebih mengerti
tentang permasalahan yang bersifat konkrit, mereka juga sudah mampu
membandingkan pecahan, kemungkinan berbagai peristiwa atau masalah, dan
himpunan tak hingga.
Bruner (Karso, dkk 2009: 1.12), menekankan bahwa setiap individu pada waktu
tertentu mengalami atau mengenal peristiwa atau benda di dalam lingkungannya,
menemukan cara untuk menyatakan kembali peristiwa atau benda tersebut di
dalam pikirannya, yaitu suatu model mental tentang peristiwa atau benda yang
dialaminya atau dikenalnya. Lebih lanjut Bruner menjelaskan proses tersebut
13
sebagai proses belajar yang setiap tahapan prosesnya akan dijelaskan sebagai
berikut.
a. Tahap Enaktif atau Tahap Kegiatan (Enactive)
Tahap ini adalah tahap dimana seoarang anak akan mempelajari konsep yang
berhubungan dengan benda nyata atau peristiwa yang terjadi di dunia sekitarnya.
Tahap enaktif juga akan menjadikan anak mampu menyusun, mengutak-atik,
mensejajarkan, memanipulasi suatu bentuk gerakan atau gerak reflek.
b. Tahap Ikonik atau Tahap Gambar Bayangan (Iconic)
Tahap ikonik ditandai dengan kemampuan anak yang dapat memberikan
gambaran atau membayangkan kembali dalam pikirannya mengenai suatu
peristiwa atau benda yang dialami atau dikenalnya.
c. Tahap simbolik (Symbolic)
Tahap simbolik merupakan tahap dimana anak mampu memahami simbol-simbol
dan menjelaskan simbol tersebut dengan bahasnya sendiri.
Berdasarkan uraian diatas terdapat beberapa pendapat tentang teori belajar
matematika dari para ahli. Pendapat real tentang teori belajar matematika sejalan
dengan pendapat Piaget tentang perkembangan kognitif peserta didik yang
memiliki 4 tahapan yaitu tahap sensori motor, tahap pra-oprasional, tahap
oprasional, dan tahap oprasional formal (Makmun, 2002:104). Berdasarkan
pendapat ahli tersebut dapat disimpulkan bahwa pada pembelajaran matematika
terdapat tahapan proses belajar secara bertahap yang dimulai dari sesuatu yang
real atau konkrit menuju ke abstrak.
14
2. Tujuan Pendidikan Matematika
Pembelajaran matematika SMK berorentasi pada tercapainya tujuan pembelajaran
matematika yang telah ditetapkan dalam Kurikulum 2013. Tujuan yang dimaksud
bukan penguasaan materi saja, tetapi proses untuk mengubah tingkah laku siswa
sesuai dengan tujuan pembelajaran matematika yang akan dicapai. Chambers
(2008:11) memaparkan bahwa pembelajaran matematika dibagi menjadi 10 tujuan
yaitu:
a) Membaca dan memahami bagian-bagian matematika,
b) Mengomunikasikan secara jelas dan urut menggunakan media yang sesuai,
c) Bekerja secara jelas dan logis menggunakan notasi dan bahasa yang cocok,
d) Menggunakan metode yang sesuai untuk memanipulasi bilangan dan simbol-
simbol,
e) Mengoperasikan secara nyata dan imajiner,
f) Mengaplikasikan urutan mengerjakan, memeriksa, memprediksi, menguji,
menggeneralisasi dan membuktikan,
g) Mengkonstruksikan dan menguji mode matematika dari situasi nyata,
h) Menganalisis masalah dan memilih teknik untuk menyelesaikan yangsesuai,
i) Menggunakan keterampilan matematika dalam kehidupan sehari-hari,
j) Menggunakan alat-alat secara mekanik.
Menurut Mathematical Sciences Education Board-National Research Council
(Wijaya, 2012: 7), terdapat empat tujuan pendidikan matematika ditinjau dalam
lingkungan sosial, meliputi:
a) Tujuan Praktis
15
Tujuan praktis dari matematika ialah berkaitan pengembangan kemampuan siswa
dalam mengaplikasikan matematika untuk menyelesaikan masalah dalam
kehidupan sehari-hari.
b) Tujuan Kemasyarakatan
Tujuan pendidikan matematika ini yaitu mengupayakan pengembangan
kemampuan siswa untuk berpartisipasi secara aktif dan cerdas dalam hidup
bermasyarakat. Sudah saatnya pendidikan matematika tidak hanya
mengembangkan kemampuan kognitif siswa namun pendidikan matematika juga
harus dapat mengembangkan kemampunan sosial siswa.
c) Tujuan Profesional
Tujuan profesional dari pendidikan matematika berorientasi pada mempersiapkan
siswa untuk terjun di dunia kerja. Seperti kita ketahui seluruh jenis pekerjaan yang
ada sekarang baik langsung maupun tidak langsung menuntut kemampuan
matematika.
d) Tujuan Budaya
Pendidikan merupakan suatu bentuk budaya dan diharapkan pendidikan
matematika dapat dijadikan bagian dari suatu budaya manusia sehingga berperan
dalam mengembangkan kebudayaan.
Sementara itu berdasarkan Lampiran Permendikbud nomor 60 tahun 2014,
pembelajaran matematika memiliki tujuan sebagai berikut:
a) Dapat memahami konsep matematika, yaitu menjelaskan keterkaitan antar
konsep dan menggunakan konsep maupun algoritma, secara luwes, akurat,
efisien, dan tepat, dalam pemecahan masalah.
16
b) Menggunakan pola sebagai dugaan dalam penyelesaian masalah, dan mampu
membuat generalisasi berdasarkan fenomena atau data.
c) Menggunakan penalaran pada sifat, melakukan manipulasi matematika baik
dalam penyederhanaan, maupun menganalisa komponen yang ada dalam
pemecahan masalah.
d) Mengomunikasikan gagasan, penalaran serta mampu menyusun bukti
matematika dengan menggunakan kalimat lengkap, simbol, tabel, diagram,
atau media lain untuk memperjelas keadaan atau masalah.
e) Memiliki sikap menghargai kegunaan matematika dalam kehidupan, yaitu
memiliki rasa ingin tahu, perhatian, dan minat dalam mempelajari matematika,
sikap ulet dan percaya diri dalam pemecahan masalah.
f) Memiliki sikap dan perilaku yang sesuai dengan nilai-nilai dalam matematika
dan pembelajarannya, seperti taat azas, konsisten, menjunjung tinggi
kesepakatan, toleran, menghargai pendapat orang lain, santun, demokrasi, ulet,
tangguh, kreatif, menghargai kesemestaan (konteks, lingkungan), tanggung
jawab, adil, jujur, teliti, dan cermat.
g) Melakukan kegiatan motorik menggunakan pengetahuan matematika.
h) Menggunakan alat peraga sederhana maupun hasil teknologi untuk melakukan
kegiatan-kegiatan matematik (Kemendikbud, 2014: 328)
Berdasarkan tersebut di atas terdapat pendapat tentang tujuan pendidikan
matematika. Adapun ahli memaparkan bahwa tujuan pendidikan matematika
meliputi tujuan praktis, tujuan kemasyarakatan, tujuan buadaya, dan tujuan
profesional. Adapun penekanan pembelajaran matematika pada tujuan tersebut
terletak pada penataan nalar, pemecahan masalah, pembentukan sikap, dan
17
keterampilan dan penerapan mattematika. Merujuk pada penekanan-penekanan
tersebut, maka sangat deperlukan adanya pengembangan instrumen assessment
for learning untuk siswa SMK.
B. Penilaian
Penilaian merupakan sebuah istilah yang sering digunakan dalam dunia
pendidikan dari istilah asing assessment. Selain penilaian dalam pendidikan ada
yang dinamakan tes dan pengukuran. Banyak yang mengartikan penilaian, tes,
dan pengukuran memiliki makna yang sama. Padahal penilaian, tes, dan
pengukuran merupakan sebuah proses yang hierarki dalam kegiatan evaluasi.
Penilaian merupakan proses untuk menentukan nilai kepada objek berdasarkan
kriteria tertentu. Dalam Permendikbud No. 23 Tahun 2016 dijelaskan bahwa
penilaian adalah proses pengumpulan dan pengolahan informasi untuk mengukur
pencapaian hasil belajar peserta didik.
Pelaksanaan assessment menggunakan berbagai cara dan beragam alat penilaian
untuk memperoleh informasi tentang sejauh mana hasil belajar peserta didik atau
ketercapaian kompetensi (rangkaian kemampuan) peserta didik. Penilaian
menjawab pertanyaan tentang sebaik apa hasil atau prestasi belajar seorang
peserta didik. Hasil akhir penilaian dapat berupa nilai kualitatif (pernyataan naratif
dalam kata-kata) dan nilai kuantitatif (berupa angka). Penilaian hasil belajar pada
dasarnya adalah mempermasalahkan, bagaimana pengajar dapat mengetahui hasil
pembelajaran yang telah dilakukan.
Dalam kegiatan pembelajaran di sekolah, penilaian sangat penting untuk
dilakukan. Kegiatan penilaian ini dapat dilakukan sebelum pembelajaran, selama
18
pembelajaran, maupun setelah pembelajaran. Menurut Daryanto (2008 : 14-16)
jika ditinjau dari berbagai segi dalam sistem pendidikan, penilaian memiliki
empat tujuan yakni sebagai fungsi selektif artinya penilaian digunakan untuk
seleksi terhadap siswa, sebagai fungsi diagnostik artinya penilaian digunakan
untuk melihat kebaikan dan kelemahan siswa beserta penyebabnya, sebagai fungsi
penempatan artinya penilaian dapat digunakan untuk menempatkan siswa dalam
kelompok tertentu, dan sebagai fungsi pengukur keberhasilan artinya penilaian
dapat digunakan untuk mengetahui sejauh mana suatu program berhasil
diterapkan.
Dari berbagai macam pengertian mengenai penilaian dapat disimpulkan bahwa
penilaian merupakan suatu proses yang dilakukan melalui langkah-langkah
perencanaan, pengumpulan informasi melalui sejumlah bukti yang menunjukkan
pencapaian hasil belajar siswa, pelaporan, dan penggunaan informasi tentang hasil
belajar siswa.
C. Taksonomi Bloom
Taksonomi ialah klasifikasi atau pengelompokan benda menurut ciri-ciri tertentu.
Taksonomi dalam bidang pendidikan, digunakan untuk klasifikasi tujuan
instruksional; ada yang menamakannya tujuan pembelajaran, tujuan penampilan,
atau sasaran belajar, yang digolongkan dalam tiga klasifikasi umum atau ranah
(domain), yaitu: (1) ranah kognitif, berkaitan dengan tujuan belajar yang
berorientasi pada kemampuan berpikir; (2) ranah afektif berhubungan dengan
perasaan, emosi, sistem nilai, dan sikap hati); dan (3) ranah psikomotor
(berorientasi pada keterampilan motorik atau penggunaan otot kerangka).
19
Taksonomi Bloom ranah kognitif merupakan salah satu kerangka dasar untuk
pengkategorian tujuan-tujuan pendidikan, penyusunan tes, dan kurikulum di
seluruh dunia. Taksonomi pendidikan ini terkandung dalam buku The Taxonomy
of Educational Objectives The Classification of Educational Goals, Handbook I:
Cognitive Domain yang terbit pada tahun 1956 sebagai buah karya dari Benjamin
Samuel Bloom (editor), M.D. Engelhart, E.J. Furst, W.H. Hill, dan Krathwohl.
Kerangka pikir karya Benjamin Bloom dkk. berisikan enam kategori pokok
dengan urutan mulai dari jenjang yang rendah sampai dengan jenjang yang paling
tinggi, yakni: pengetahuan (knowledge); (2) pemahaman (comprehension); (3)
penerapan (application); (4) analisis (analysis); (5) sintesis (synthesis); dan (6)
evaluasi (evaluation).
Tingkatan-tingkatan dalam Taksonomi Bloom tersebut telah digunakan hampir
setengah abad sebagai dasar untuk penyusunan tujuan-tujuan pendidikan,
penyusunan tes, dan kurikulum di seluruh dunia. Kerangka pikir ini memudahkan
guru memahami, menata, dan mengimplementasikan tujuan-tujuan pendidikan.
Berdasarkan hal tersebut Taksonomi Bloom menjadi sesuatu yang penting dan
mempunyai pengaruh yang luas dalam waktu yang lama. Namun pada tahun 2001
terbit sebuah buku A Taxonomy for Learning, Teaching, and Assesing: A Revision
of Bloom’s Taxonomy of Educatioanl Objectives yang disusun oleh Lorin W.
Anderson dan David R. Krathwohl. Perubahan dari kerangka pikir asli ke
revisinya diilustrasikan pada Gambar 2.1.
20
Gambar 2.1. Perubahan dari Kerangka Pikir Asli ke Revisi (Anderson danKrathwohl, 2001:268)
D. Instrumen Penilaian
Dalam melakukan penilaian di dunia pendidikan, terdapat bermacam-macam alat
penilaian guna menilai proses dan hasil pendidikan yang telah dilakukan siswa.
Menurut Joni (1986; 6) penggunaan tes lebih banyak dijadikan sebagai alat ukur
penilaian dalam pendidikan dibandingkan alat penilaian yang lain. Daryanto
(2008; 35) mengungkapkan hal yang sama yakni tes lebih bersifat resmi dan
penuh dengan batasan-batasan. Tes terdiri atas sejumlah soal yang harus
dikerjakan siswa dan menghadapkan siswa pada suatu tugas untuk menanggapi
tugas atau soal tersebut. Ditinjau dari segi kegunaan untuk mengukur siswa,
Arikunto (2012; 33-41) membedakan atas tiga macam tes yaitu:
1. Tes diagnostik merupakan tes yang digunakan untuk mengetahui kesulitan-
kesulitan siswa sehingga berdasarkan hal tersebut dapat dilakukan penanganan
yang tepat. Tes ini dapat dilakukan di awal pembelajaran untuk mengetahui
pengetahuan awal siswa, di pertengahan proses pembelajaran untuk
menyelidiki bagian mana dari pembelajaran guru yang tidak dapat dipahami
21
oleh siswa dan bagian akhir untuk mengevaluasi tingkat penguasaan materi
terhadap bahan yang diberikan.
2. Tes formatif merupakan tes yang dilakukan di akhir program yang bertujuan
untuk mengetahui sejauh mana siswa telah mengikuti program tertentu. Tes
ini bisa disebut juga dengan tes diagnostik pada akhir pelajaran.
3. Tes sumatif merupakan tes yang dilaksanakan di akhir semester yang
bertujuan untuk menentukan nilai seseorang.
Tes sebagai alat ukur kemampuan siswa di bidang pendidikan memiliki perbedaan
yang fundamental dibandingkan alat ukur barang yang digunakan sehari-hari. Joni
(1986; 21-22) mengungkapkan bahwa alat ukur barang dapat digunakan secara
langsung atau setidaknya bisa diukur melalui variabel yang diketahui mempunyai
hubungan fungsional tertentu dengan variabel yang akan diukur, maka tidak
demikian halnya dengan alat ukur dalam pendidikan. Alat ukur dalam pendidikan,
salah satunya tes, tidak dapat langsung mengukur variabel yang akan diukur. Hal
ini dikarenakan respons siswa terhadap jawaban tes tidak selalu konsisten
mencerminkan kecakapan atau suasana batin seseorang oleh banyaknya faktor-
faktor yang juga mempengaruhi pencetusan tingkah yang nampak. Maka dari itu,
agar sebuah tes dapat mengukur apa yang hendak diukur, instrumen atau soal
yang diberikan pada sebuah tes perlu memenuhi komponen-komponen tolok ukur
(kriteria) tertentu. Makmun (2007; 196-198) menjelaskan syarat sebuah instrumen
tes yang layak sebagai berikut:
1. Memenuhi taraf ketepatan (validity) yang memadai. Artinya, instrumen tes
dapat mengukur apa yang hendak diukur. Hal ini dapat diidentifikasi dari
22
kesesuaian butir-butir soal dengan ruang lingkup dan jenjang materi atau
bahan ajar serta ruang lingkup aspek tertentu.
2. Memiliki taraf kemantapan sehingga hasil pengukuran dapat dipegang atau
dipercaya (reliability).
3. Memiliki kepraktisan untuk keperluan kemudahan administrasi. Artinya tidak
diperlukan fasilitas penunjang dan bebas kesulitan bahasa.
4. Memiliki kemampuan untuk membedakan siswa pandai (upper group) dan
lemah (lower group). Siswa pandai dapat menjawab butir soal-soal sukar dan
siswa lemah menjawab butir-butir soal mudah.
Pembuatan instrumen tes dalam pendidikan dapat dibuat oleh guru ataupun para
ahli penyusun tes. Namun Arikunto (2012: 146) berpendapat bahwa instrumen
yang baku dan standar, lazimnya dikembangkan oleh ahli. Menurut Nitko &
Brookhart, (2007; 198) para ahli penyusun tes membuat instrumen tes dengan
menggunakan populasi dan sampel yang diuji secara cermat dan teliti, sedangkan
guru menggunakan populasi dan sampel hanya terbatas di sekolah atau kelas.
Namun persamaan dari keduanya yakni diperlukan tahap pengembangan
instrumen tes yang bertujuan agar instrumen benar-benar layak dan akurat
digunakan.
Assessment memiliki tujuan yaitu untuk mengevaluasi dan mendiagnosa
kebutuhan yang harus diperbaiki sehingga pendidik dan peserta didik dapat
meneliti ulang, merencanakan, dan mengaplikasikan ulang. Tidak hanya untuk
mendapatkan evaluasi dari kegiatan belajar mengajar, assessment dilakukan untuk
dapat melakukan perbaikan sesegera mungkin (Purnomo, 2014).
23
Assessment tidak dapat dipisahkan dengan pembelajaran, maka tujuan assessment
dapat difokuskan pada tiga kategori, yaitu penilaian terhadap pembelajaran
(Assessment of Learning), penilaian untuk pembelajaran (Assessment for
Learning), dan penilaian sebagai pembelajaran (Assessment as Learning).
Assessment of learning merupakan penilaian yang dilaksanakan setelah proses
pembelajaran selesai. Proses pembelajaran selesai tidak selalu terjadi di akhir
tahun atau di akhir peserta didik menyelesaikan pendidikan pada jenjang tertentu.
Assessment for learning dilakukan selama proses pembelajaran berlangsung dan
biasanya digunakan sebagai dasar untuk melakukan perbaikan proses belajar
mengajar. Dengan assessment for learning pendidik dapat memberikan umpan
balik terhadap proses belajar peserta didik, memantau kemajuan, dan menentukan
kemajuan belajarnya. Assessment as learning mempunyai fungsi yang mirip
dengan assessment for learning, yaitu berfungsi sebagai formatif dan
dilaksanakan selama proses pembelajaran berlangsung. Perbedaannya, assessment
as learning melibatkan peserta didik secara aktif dalam kegiatan penilaian
tersebut. Peserta didik diberi pengalaman untuk belajar menjadi penilai bagi
dirinya sendiri.
E. Assessment for Learning Dalam Pembelajaran
Assessment for learning atau yang sering disebut sebagai penilaian formatif
merupakan kegiatan yang terintegrasi dalam pembelajaran. Di kelas, assessment
for learning sering dilakukan melalui kegiatan penilaian untuk mengetahui
kemajuan dan tingkat pemahaman peserta didik yang kemudian digunakan untuk
mengidentifikasi kebutuhan belajar dan merencanakan kegiatan pembelajaran
yang sesuai.
24
Definisi yang disampaikan oleh Cowie dan Bell (dalam Rasyid, 2013: 84)
mengatakan bahwa penilaian untuk belajar sebagai proses yang digunakan oleh
guru dan anak untuk mengakui dan merespon pembelajaran sehingga siswa
mempertinggi aktivitas atas tugas-tugas selama pembelajaran. Menurut Stiggins
mendefinisikan penilaian untuk belajar sebagai suatu alternatif penggunaan
berbagai metode penilaian yang berbeda secara terus-menerus untuk memperoleh
bukti penguasaan pengetahuan dan ketrampilan siswa terhadap standar. Pendapat
Stiggins (dalam Rasyid, 2013: 84) tersebut menekankan pada penggunaan
berbagai metode penilaian untuk memperoleh informasi tentang penguasaan
konsep pengetahuan dan ketrampilan yang telah diajarkan. Informasi tersebut
dapat digunakan sebagai dasar bagi guru,siswa, dan orang tua dalam membuat
keputusan yang berkaitan dengan perkembangan belajar peserta didik.
Cizek (2010: 4) menyatakan suatu tes atau instrumen dikatakan sebagai
assessment for learning jika memiliki dua kriteria. Kriteria pertama adalah
asesmen dilakukan selama proses pembelajaran. Yang kedua, harus memenuhi
satu atau lebih tujuan utama dari assessment for learning berikut: 1)
mengidentifikasi kekuatan dan kelemahan siswa, 2) menilai pendindik dalam
merencanakan pembelajaran, 3) memandu siswa agar dapat mengatur belajarnya
secara mandiri, memperbaiki kinerjanya, dan mendapat keterampilan
mengevaluasi diri, 4) serta membantu meningkatkan kesadaran tanggung jawab
untuk terus belajar.
Operasional pengertian AfL dalam kerangka tujuan, dinyatakan dalam CEA
(dalam Mansyur, 2011:76) yang mengatakan bahwa tujuan AfL untuk:
25
1. Memberi wawasan pembelajaran kepada guru dan peserta didik dalam upaya
meningktkan kesuksesan untuk semua.
2. Membantu proses penetapan tujuan.
3. Memungkinkan refleksi secara kontinu terhadap apa yang peserta didik
diketahui sekarang dan apa yang mereka butuhkn untuk diketahui berikutnya.
4. Mengukur apa yang dinilai.
5. Menetapkan intervensi secara cepat dan tepat sesuai dengan tujuan
pembelajaran.
6. Meningkatkan standar yang diperoleh peserta didik.
Berdasarkan pendapat di atas, assessment for learning merupakan proses
penilaian dalam pembelajaran untuk mengetahui kemajuan dan mengidentifikasi
kebutuhan belajar dan merencanakan kegiatan pembelajaran yang sesuai. Dalam
pelaksanaan assessment for learning akan diperoleh sebuah inforamasi dan terjadi
pemanfaat informasi. Informasi atau keterangan diperoleh melalui kerjasama
antara guru dengan peserta diidk dan informasi tersebut dimanfaatkan oleh
mereka (guru dan peserta didik) untuk perbaikan dan peningkatan kualitas
pembelajaran berikutnya.
F. Instrumen Pilihan Ganda Beralasan
Krishnan dan Howe 1994 (Suwarto, 2012; 136) mengembangkan soal pilihan
ganda disertai dengan alasan sebagai bentuk penjelasan atas jawaban yang
dipilihnya. Bentuk soal ini menurut Tamir (Treagust, 1988; 160) dikenal dengan
pilihan ganda beralasan. Soal pilihan ganda beralasan lebih menguntungkan
dibandingkan pilihan ganda biasa. Tüysüz (2009; 627) dalam penelitiannya
26
mengungkapkan keuntungan dari bentuk soal ini yakni dapat mengidentifikasi dua
aspek yang berbeda sekaligus dalam satu fenomena. Awal penggunaan tes pilihan
ganda beralasan dimulai sejak tahun 80an yang bertujuan untuk mengidentifikasi
miskonsepsi siswa.
Tes pilihan ganda beralasan terdiri dari dua macam yaitu tes pilihan ganda
beralasan terbuka dan tes pilihan ganda beralasan tertutup. Menurut Suwarto
(2012; 56) tes pilihan ganda beralasan terbuka adalah tes pilihan ganda yang
disertai alasan sehingga siswa harus menuliskan alasan terhadap jawaban yang
dipilihnya. Kelebihan tes pilihan ganda berlasan terbuka yaitu siswa dapat leluasa
mengungkapkan alasan atas jawaban yang dipilihnya. Kelemahannya yakni
dibutuhkan waktu untuk pemahaman jawaban siswa yang luas.
Sedangkan tes pilihan ganda tertutup adalah tes pilihan ganda yang disertai
pilihan alasan. Tes ini menurut Treagust (1988; 160) disebut juga tes pilihan
ganda dua tingkat (two tier multiple choice). Tingkat pertama merupakan soal
pilihan ganda dengan pilihan jawaban sedangkan tingkat kedua merupakan pilihan
ganda dengan pilihan alasan atas jawaban pada tingkat pertama. Chandrasegaran,
et al., (2007; 299) mengatakan bahwa alasan siswa pada bentuk pilihan ganda
beralasan tetutup telah disediakan sehingga siswa hanya memilih jawaban dari
opsi yang sudah tersedia. Jawaban benar jika siswa dengan tepat memilih opsi
pada tingkat pertama dan tingkat kedua. Penilaian dilakukan berdasarkan pilihan
jawaban dan alasan siswa pada kedua tingkat. Kelemahan instrumen ini menurut
Suwarto (2012; 57) yaitu siswa tidak leluasa mengungkapkan alasan pemilihan
jawaban. Kelebihan instrumen ini yakni mempermudah dalam proses penilaian.
27
Selain itu siswa memiliki peluang menebak jawaban lebih kecil dibandingkan
pilihan ganda satu tingkat.
Pada penelitian ini instrumen yang dikembangkan berupa soal pilihan ganda
beralasan terbuka. Hal ini bertujuan untuk mengetahui tingkap pemahaman dan
penalaran peserta didik dalam menyelesaikan soal yang diberikan.
G. Item Respons Theory
Dalam butir dikotomus respons jawaban hanya ada dua kemungkinan, seperti
benar atau salah, iya atau tidak, dengan nilai nol atau satu. Kadang-kadang
respons lebih dari dua kemungkinan tersebut, misalnya pada angket skala likert,
atau soal dengan jawaban bergradasi sesuai dengan tingkat kebenarannya. Butir
yang respons jawabannya lebih dari satu kemungkinan disebut butir politomus.
Model-model politomus pada teori respons butir menurut Linden & Hambleton
(dalam Retnawati, 2014: 32) antara lain nominal respons model (NRM), rating
scale model (RSM), partikel credit model (PCM), graded respons model (GRM)
dan generalized partisan credit model (GPCM).
Model respons butir politomus dapat dikategorikan menjadi model respons butir
nominal dan ordinal, tergantung pada asumsi karakteristik tentang data. Model
respons butir nominal dapat diterapkan pada butir yang mempunyai alternatif
kawanan yang tidak terurut (ordered) dan adanya berbagai tingkat kemampuan
yang diukur. Pada model respons ordinal terjadi pada butir yang dapat diskor ke
dalam banyaknya kategori tertentu yang tersusun dalam jawaban. Skala Likert
diskor berdasarkan pedoman penskoran kategori respons terurut, yang merupakan
penskoran ordinal. Butir-butir tes matematika dapat diskor menggunakan sistem
28
parsial kredit, langkah-langkah menuju jawaban benar dihargai sebagai penskoran
ordinal. Model pensekoran yang paling sering dipakai ahli yakni GRM, PCM, dan
GPCM.
1. Graded Respons Model (GRM)
Respons peserta terhadap butir j dengan model GRM dikategorikan menjadi m+1
skor kategori terurut, k = 0, 1, 2, ..., m dengan m merupakan banyaknya langkah
dalam menyelesaikan dengan benar butir j, dan indeks kesukaran dalam setiap
langkah juga terurut. Hubungan parameter butir dan kemampuan peserta dalam
GRM untuk kasus homogen (aj sama dalam setiap langkah) dapat dinyatakan oleh
Muraki & Block (1997; 7) sebagai berikut.( ) = ∗ ( ) − ∗ ( )( ) = −1 + −
Dengan ∗ ( )= 1 dan ∗ ( )= 0
aj : indeks daya beda butir jθ : kemampuan peserta,bjk : indeks kesukaran kategori k butir j( ) : probabilitas peserta berkemampuan θ yang memperoleh skor kategori k
pada butir j∗ ( ) : probabilitas peserta berkemampuan θ yang memperoleh skor kategori katau lebih pada butir j
D : faktor skala
2. Partial Credit Model (PCM)
PCM merupakan perluasan dari model Rasch, dengan asumsi setiap butir
mempunyai daya beda yang sama. PCM mempunyai kemiripan dengan GRM
pada butir yang skor dalam kategori berjenjang, namun indeks kesukaran dalam
29
setiap langkah tidak perlu terurut, suatu langkah dapat lebih sukar dibandingkan
langkah berikutnya. Bentuk umum PCM menurut Muraki & Block (1997; 16)
sebagai berikut.
( ) = ∑ −∑ ∑ −Dengan :( ) : probabilitas peserta berkemampuan θ memperoleh skor kategori k pada
butir jθ : kemampuan pesertam + 1 : banyaknya kategori butir jbjk : indeks kesukaran kategori k butir j
dan
− ≡ 0 dan − ≡ −Skor kategori pada PCM menunjukkan banyaknya langkah untuk menyelesaikan
dengan benar butir tersebut. Skor kategori yang lebih tinggi menunjukkan
kemampuan yang lebih besar daripada skor kategori yang lebih rendah.
Pada PCM, jika suatu butir memiliki dua kategori, maka PCM dapat diterapkan
pada butir dikotomus dan politomus.
3. Generalized Partial Credit Model (GPCM)
GPCM menurut Muraki (1997) merupakan bentuk umum dari PCM, yang
dinyatakan dalam bentuk matematis, yang disebut sebagai fungsi respons kategori
butir sebagai berikut.
( ) = ∑ ( )∑ ∑ ( ) untuk k = 0, 1, 2, ..., mj
( ) = − = − + , = 0
30
Keterangan :( ) : probabilitas peserta berkemampuan θ memperoleh skor kategori k padabutir j,
θ : indeks daya beda butir j,bjh : indeks kesukaran kategori h butir j,bj : indeks kesukaran lokasi butir j (parameter butir lokasi),dh : parameter kategori hmj + 1 : banyaknya kategori butir j, danD : faktor skala (D = 1,7)
Parameter bjh oleh Master dinamai dengan parameter tahap butir. Parameter ini
merupakan titik potong antara kurva Pjk(θ) dengan Pjk-1(θ). Kedua kurva hanya
berpotongan di satu titik pada skala θ.
Jika θ = bjk, maka Pjk (θ) = Pjk-1 (θ)
Jika θ > bjk, maka Pjk(θ) > Pjk-1 (θ)
Jika θ < bjk, maka Pjk(θ) < Pjk-1 (θ), K = 1, 2, 3, ..., mj
Menurut Hambleton, Swaminathan, & Rogers (1991; 9 – 12) ada tiga asumsi
dalam teori respons butir yaitu;
1) Unidimensi artinya hanya ada salah satu kemampuan yang diukur dengan satu
set butir dalam tes. Asumsi ini tidak dapat secara ketat terpenuhi karena
beberapa faktor kognitif, kepribadian, dan pelaksanaan tes yang selalu
mempengaruhi kinerja tes, setidaknya sampai batas tertentu. Faktor-faktor ini
mungkin termasuk motivasi, tingkat kecemasan, kemampuan untuk bekerja
dengan cepat, kecenderungan untuk menebak bila ragu dengan jawaban dan
keterampilan kognitif di samping satu dominan yang diukur dengan butir tes.
2) Independensi lokal (local Independence) artinya ketika kemampuan
mempengaruhi kinerja agar tetap konstan, maka respons peserta ujian untuk
setiap pasangan butir independen secara statistik satu sama lain. Dengan kata
31
lain, setelah uji kemampuan masuk ke dalam perhitungan ada hubungan antara
respons peserta ujian untuk butir yang berbeda.
3) Invariansi parameter kemampuan adalah landasan IRT dan perbedaan utama
dari teori tes klasik. Adapun yang menjadi ciri butir tidak bergantung pada
distribusi kemampuan peserta ujian dan parameter yang menjadi ciri khas
suatu ujian tidak tergantung pada set butir, model matematisnya mempunyai
makna bahwa probabilitas subjek untuk menjawab butir soal dengan benar
tergantung pada kemampuan subjek dan karakteristik butir. Ini berarti bahwa
peserta tes dengan kemampuan tinggi akan mempunyai probabilitas menjawab
benar lebih besar jika dibandingkan dengan peserta yang mempunyai
kemampuan rendah. Inilah satu-satunya faktor yang mempengaruhi peserta
ujian untuk menguji butir.
Terdapat hal penting yang perlu di perhatikan dalam teori respons butir yaitu
pemilihan model yang tepat. Model yang tepat akan mengungkap keadaan yang
sesungguhnya dari data tes sebagai hasil pengukuran. Ada 3 model hubungan
antara kemampuan dan parameter butir, yaitu
1) model 1 parameter (model Rasch), ditentukan oleh indeks tingkat kesukaran
butir (bi).
2) model 2 parameter, ditentukan oleh indeks tingkat kesukaran butir (bi) dan
indeks daya beda butir (ai).
3) model 3 parameter, ditentukan oleh indeks tingkat kesukaran butir (bi), indeks
daya beda butir (ai) dan tebakan semu (ci).
Berdasarkan macam-macam model penskoran dan model parameter, rumus yang
akan digunakan untuk analisis penelitian ini yaitu Partial Credit Model (PCM).
32
Model PCM cocok untuk menganalasis butir tes yang memerlukan beberapa
langkah penyelesaian, hal ini termasuk soal matematika yang membutuhkan tahap
identifikasi permasalahan hingga solusi akhir.
PCM merupakan pengembangan model 1-PL dan termasuk keluarga Model
Rasch. Model dikotomi dan PCM dapat dikatakan campuran dalam satu analisis
(Wu & Adams, 2007). PCM Merupakan pengembangan Model Rasch butir
dikotomi yang diterapkan pada butir politomi. Asumsi PCM yakni setiap butir
mempunyai daya beda yang sama. Bentuk umum PCM menuru Muraki & Bock
(Renawati, 2014: 37-38) dan Ostini & Nering (2006: 28) menjabarkan bentuk
PCM sesuai dengan persamaan 1 dan 2.
( ) = ∑ −∑ ∑ −Dengan :( ) : probabilitas peserta berkemampuan θ memperoleh skor kategori k pada
butir jθ : kemampuan pesertam + 1 : banyaknya kategori butir jbjk : indeks kesukaran kategori k butir j
Persamaan di atas dapat dijabarkan berdasarkan jumlah kategori di dalam butir.
Misalnya sebuah skala memiliki 4 kategori, yakni kategori dengan skor 1, 2, 3,
dan 4. Kita dapat kategori (g) sebanyak 4 buah persamaan probabilitas individu
pada tiap kategori. PCM mensyaratkan seperti pada persamaan beriktut.
− ≡ 0 dan − ≡ −
33
Skor kategori PCM menunjukkan banyaknya langkah untuk menyelesaikan
dengan benar setiap butir. Skor kategori yang lebih tinggi menunjukkan
kemampuan yang lebih besar dari pada skor kategori yang lebih rendah.
Parcial Credit Model (PCM) merupakan pengembangan dari Model Rasch butir
dikotomi yang diterapkan pada butir politomi. Jika i butir politomi dengan
kategori skor 0, 1, 2, ..., mi, maka probabilitas dari individu n skor x pada butir i
yang nantinya digambarkan dalam categori response function (CRF) diwujudkan
dalam persamaan 2 (Ostini & Nering, 2006: 28).
Persamaan di atas dapat dijabarkan berdasarkan jumlah kategori di dalam butir.
Misalnya sebuah skala memiliki 5 kategori dengan skor 0, 1, 2, 3, dan 4, maka
kita dapatkan kategori (g) sebanyak 4 buah persamaan yang probabilitas individu
pada setiap kategori. Parameter big juga diinterpretasikan sebagai titik pada skala
sifat laten dengan dua kategori yang berurutan kurva respos berpotongan sehingga
dinamakan persimpangan kategori (category response curves intersect).
Parameter big merupakan titik dimana dua katefori memiliki prababilitas yang
sama untuk dipilih oleh level trait yang terkait (Linacre, 2012). Disisi lain big tidak
menunjukkan tingkat kesukaran untuk sukses ditahap kedua atau untuk mencapai
skor 2, tetapi lebih menunjukkan tingkat kesulitan butir untuk tahap kedua yang
independen dengan tahap-tahap sebelumnya (Wu & Adams, 2007).
Kesalahan Baku Pengukuran (Standard Error of Measurement, SEM) dapat
digunakan untuk memahami kesalahan yang bersifat acar/random yang
mempengaruhi skor peserta tes dalam pelaksanaan tes. Kesalahan pengukuran
yang disimbolkan dengan , dapat dihitung dengan rumus pada persamaan yang
diturunkan dari rumus reliabilitas (Allen & Yen, 1979 : 73)
34
Ada beberapa karakteristik yang perlu diperhatikan dalam teori respons modern
yaitu;
1. Tingkat kesukaran
Dalam teori respons butir, tingkat kesukaran (bi), pada metrik sama dengan
kemahiran atau trait. Menurut Demars (2010 : 4-5) tingkat kesukaran butir
mengidentifikasi kemampuan dimana sekitar 50% dari peserta ujian (atau lebih
sedikit, tergantung pada model) diharapkan menjawab butir dengan benar. Secara
teori, nilai bi terletak di antaran -~ dan +~. Hembleton & Swaminathan (1985:
107) menyatakan bahwa suatu butir dikatakan baik jika nilai ini berkisar antara -2
dan +2 . Mendukung pernyataan tersebut, Retnawati (2014: 17) mengungkapkan
bahwa jika nilai bi mendekati -2, maka indeks kesukaran butir sangat rendah.
Sedangkan, jika nilai bi mendekati +2 maka indeks kesukaran butir sangat tinggi
untuk suatu kelompok peserta tes.
Kriteria butir soal yang baik yaitu tidak terlalu mudah dan tidak terlalu sulit.
Dengan tingkat kesulitan yang bervariasi maka dapat mengukur kemampuan
peserta tes secara keseluruhan. Sehingga semakin besar indeks kesukaran butir
soal maka semakin sukar soal butir soal tersebut untuk dikerjakan, sebaliknya
semakin kecil indeks kesukaran butir soal maka semakin mudah butir soal.
2. Daya Pembeda
Pada IRT indeks daya pembeda disimbolkan dengan (ai) yaitu mengukur dari daya
beda butir. Indeks biasanya disebut slope karena menunjukkan seberapa curam
kemungkinan perubahan respons yang benar seperti kemampuan atau perubahan
trait. Menurut Demars (2010: 5) daya pembeda yang lebih tinggi berarti bahwa
35
butir dapat membedakan (mendiskriminasikan) antara peserta ujian dengan
barbagai tingkat konstruk.
Menurut Hambleton & Swaminahan (1985: 36) indeks daya beda (ai) berada di
antara 0-2, ai merupakan daya pembeda yang dimiliki butir ke-i. Pada kurva
karakteristik, ai merupakan (slope) dari kurva di titik bi untuk skala kemampuan
tertentu, karena merupakan kemiringan, semakin besar kemiringannya maka
semakin besar daya pembeda butir tersebut. Secara teori, Retnawati (2014: 17)
menyatakan bahwa nilai nilai ai terletak antara -~ dan +~. Semakin banyak butir
yang memenuhi kriteria daya beda (ai) maka butir tes semakin baik dalam
membedakan kemampuan peserta tes.
3. Kecocokan Butir dengan Model Logistik (goognes of fit statistik)
Menurut Retnawati (2014: 24-25) kecocokan model dapat diketahui dengan
membandingkan khi-kuadrat ( ) tabel dengan derajat kebebasan tertentu. Butir
dikatakan cocok dengan suatu model jika nilai khi-kuadrat hitung tidak melebihi
nilai khi-kuadrat tabel. Kecocokan dapat diketahui pula dari nilai probabilitas
(signifikansi, sig). Jika nilai sig < , maka butir dikatakan tidak cocok dengan
model.
Kecocokan model juga dapat diketahui dengan melihat proporsi butir yang cocok
dengan model logistik. Proporsi butir cocok terbanyak diantara model 1PL, 2PL
dan 3PL dinyatakan sebagai model yang cocok pada pengujian butir tes. Cara lain
yang dapat dilakukan yakni dengan membuat plot kurva karakteristik. Plot dapat
digambarkan dengan bantuan program winsteps, dengan plot dapat diketahui
seberapa tepat distribusi data dibandingkan dengan modelnya.
36
4. Nilai Fungsi Informasi
Menurut Ratnawati (2014: 18) fungsi informasi butir (item information functions)
merupakan suatu model untuk menjelaskan kekuatu suatu butir pada perangkat
tes, pemilihan butir tes, dan perbandingan beberapa perangkat tes. Fungsi
informasi menyatakan kekuatan atau sumbangan butir tes dalam mengungkap
kemampuan laten yang diukur dengan tes tersebut. Dengan demikian melalui
fungsi informasi butir dapat diketahui butir mana yang cocok dengan model
sehingga dapat membantu dalam seleksi butir tes. Dalam Hambleton dan
Swaminathan (1985: 104) secara matematis fungsi informasi butir dapat
dituliskan dengan rumus sebagai berikut:
( ) = ( )( ) ( )Keterangan:
i = 1, 2, 3, ... , nIi ( ) = fungsi informasi butir ke-iPi ( ) = peluang peserta dengan kemampuan menjawab benar butir iP’i ( ) = turunan fungsi Pi ( ) terhadap Qi ( ) = peluang peserta dengan kemampuan menjawab benar butir i
Berdasarkan teori respons butir fungsi informasi dan kemampuan peserta didik
dapat diperoleh. Hambleton, Swaminathan & Rogers (1991: 94) menyatakan
bahwa fungsi informasi tes merupakan penjumlahan dari fungsi informasi butir
penyusun tes tersebut pada tingkat kemampuan . Berhubungan dengan hal ini,
fungsi informasi perangkat tes akan tinggi jika butir tes mempunyai fungsi
informasi yang tinggi pula. Menurut Naga (1991: 324) fungsi informasi tes akan
berubah-ubah menurut nilai . Pada nilai tertentu, nilai fungsi informasi
mencapai maksimum. Titik maksimum berarti bahwa jika butir itu dikerjakan oleh
37
peserta dengan tersebut, maka akan diperoleh informasi yang paling tinggi.
Dalam Hambleton, Swaminathan & Rogers (1991: 94) secara matematis fungsi
informasi dapat dituliskan sebagai berikut :
( ) = ( )Informasi yang diberikan tes pada kemampuan merupakan jumlah dari fungsi
informasi butir. Berdasarkan persamaan di atas jelas bahwa butir berkontribusi
secara independen untuk fungsi informasi tes. Fungsi informasi tes diperlukan
untuk menafsirkan hasil tes. Perangkat tes yang baik akan memiliki nilai fungsi
informasi yang lebih besar dibandingkan dengan kesalahan pengukuran. Jika
kesalahan pengukuran lebih tinggi dibandingkan informasi maka dapat
diperkirakan bahwa perangkat tes tidak sesuai kemampuan peserta yang diberikan
tes
5. Standard Error of Measurement (SEM)
Standard error , SE adalah standar deviasi asimtotik distribusi normal dari
estimasi kemungkinan maksimum untuk kemampuan yang diberikan pada nilai
kemampuan sebenarnya. Pada teori respons butir, kesalahan penaksiran standar
SEM (Standard Error of Measurement) berkaitan erat dengan fungsi informasi.
Menurut Hambleton, Swaminathan, & Rogers (1991: 94-95) fungsi informasi
dengan SEM mempunyai hubungan yang berbanding terbalik kuadratik, semakin
besar fungsi informasi maka SEM semakin kecil atau sebaliknya.
= ( )Besarnya standard error umumnya tergantung pada;
38
a) Jumlah butir tes. Banyaknya butir tes mempengaruhi kesalahan standar, dalam
hal ini berkaitan dengan waktu pengerjaan tes. Kesalahan standar yang lebih
kecil berhubungan dengan lama tes.
b) Kualitas butir tes. Pada umumnya, kesalahan standar yang lebih kecil
berhubungan dengan butir yang sangat diskriminatif dengan jawaban benar
tidak dapat diperoleh dengan menebak.
c) Perbandingan antara tingkat kesukaran butir dan kemampuan peserta ujian.
Kesalahan standar yang lebih kecil diasumsikan berada pada tes yang terdiri
dari butir dengan parameter tingkat kesukaran sama dengan parameter
kemampuan peserta ujian sebagai lawan tes yang relatif mudah atau relatif
sulit.
Embretson (dalam Irvine & Kyllonen, 2002: 225) mengungkapkan bahwa model
teori respons butir cocok dengan data penelitian yang akan dilakukan. Parameter
butir yang diperkirakan oleh kemungkinan maksimum marjinal, menggunakan
program winsteps. Keuntungan utama dari program winsteps adalah kemampuan
untuk secara bersamaan memperkirakan parameter butir dan kemampuan seluruh
kelompok yang diberikan pada bentuk tes yang berbeda. Berdasarkan beberapa
pendapat yang dikemukakan di atas dapat disimpulkan bahwa kesalahan
pengukuran diminimalkan dengan menyesuaikan perangkat tes dengan
kemampuan peserta tes.
H. Validitas Tes
Suatu instumen tes atau alat tes memiliki kriteria baik salah satunya adalah
memenuhi syarat valid. Menurut Purwanto (2013:137) validitas adalah kualitas
39
yang menunjukkan hubungan antara suatu pengukuran (diagnosis) dengan arti
atau tujuan kriteria belajar atau tingkah laku. Dan William (2008: 123)
menyatakan validitas menunjukkan kemampuan suatu tes untuk mengukur apa
yang hendak diukur. Menurut AERA, APA, & NCME (dalam Retnawati, 2016:
16) validitas merujuk pada derajat dari fakta dan teori yang mendukung
interpretasi skor tes, dan merupakan pertimbangan paling penting dalam
pengembangan tes. Sehingga validitas merupakan karakteristik paling penting
suatu tes.
Terdapat beberapa cara untuk mengukur validitas. Menurut Sudijono (2011: 163)
ada dua cara yang dapat dilakukan untuk pengujian validitas, yaitu penganalisisan
yang dilakukan dengan cara berpikir secara rasional atau penganalisisan yang
dilakukan dengan mendasarkan kepada kenyataan empiris. Secara umum Alen &
Yen (1979; 95) mengelompokkan validitas menjadi tiga (3) kategori, yaitu
validitas isi (content validity), validitas kriteria (criterion-related validity), dan
validitas konstruk (construct validity). Menurut Miller (2008: 11) validitas isi
merupakan tipe validitas yang menunjukkan keakuratan penilaian terhadap tujuan
pembelajaran. Sehingga dengan validasi isi suatu instrumen dapat menunjukkan
kualitas tes yang berkaitan dengan representasi keterwakilan isi materi
pembelajaran.
Validitas kriteria menunjukkan hubungan empiris suatu tes dengan variabel
kriteria yang relevan. Menurut Mardapi (2008: 23) variabel kriteria yang relevan
yaitu variabel eksternal yang bias berupa kriteria bahwa tes diharapkan
memprediksi, seperti hubungan dengan tes lain yang mengukur hal yang berbeda.
40
Kriteria lain seperti kriteria performans, sering digunakan untuk keperluan seleksi
atau penempatan karyawan atau pegawai.
Mardapi (2008: 23-24) dan Wiliam (2008: 126) membedakan validitas kriteria
menjadi dua jenis, yaitu validitas prediktif dan validitas konkruen. Dijelaskan
bahwa validitas prediktif diperoleh jika pengambilan skor tes kriteria tidak sama
dengan pengambilan skor tes. Setelah peserta tes dikenai tes yang akan dicari
validitas prediktifnya, lalu diberikan tenggang waktu tertentu sebelum skor
kriteria diambil dari perserta tes yang sama. Apabila skor tes dan skor kriteria
diperoleh dalam waktu yang relative sama maka validitas yang akan diperoleh
adalah validitas konkruen. Dengan demikian dapat dikatakan bahwa untuk
memperoleh koefisien validitas prediktif suatu tes membutuhkan waktu yang
cukup lama, sebaliknya koefisien validitas konkruen diperoleh dalam waktu yang
relatif singkat.
Validitas konstruk yaitu validitas yang menunjukkan hasil pengukuran dapat
ditafsirkan sesuai dengan definisi yang digunakan. Mardapi (2008: 21)
menyatakan bahwa definisi atau konsep yang diukur berasal dari teori yang
digunakan. Pendapat tersebut sesuai dengan yang dikemukakan oleh Messick
(1988: 33) validitas tes merupakan suatu integrasi pertimbangan evaluative secara
empiris yang mendasarkan pemikiran teoritis yang mendukung ketepatan dan
kesimpulan berdasarkan pada skor tes. Berdasarkan pendapat-pendapat tersebut,
maka proses validasi konstruk suatu tes diawali dengan pendefinisian variabel
yang hendak diukur berdasarkan teori yang mendasarinya. Berdasarkan teori ini
diambil suatu konsekuensi praktis mengenai hasil pengukuran yang akan diuji
41
pada kondisi tertentu. Suatu tes dianggap memiliki validitas konstruk yang baik
apabila hasil pengukuran menggunakan tes tersebut sesuai dengan yang
diharapkan.
Validitas dapat diketahui dari bukti validitas atau sumber validitas. Mardapi
(2008: 17) menjelaskan bahwa bukti validitas dapat dilihat dari bukti yang ada
berdasarkan isi tes, proses respons, struktur internal dan hubungannya dengan
variabel lain. Bukti validitas berdasarkan isi dapat dipenuhi menggunakan
penilaian para pakar pada bidang yang diukur dan pakar bidang pengukuran
melalui suatu diskusi panel. Penilaian para pakar sangan tergantung pada
subjektivitas individual pakar sesuai dengan latar belakang pengetahuannya.
Validitas isi tampak dari kisi-kisi tes atau spesifikasi domain isi tes yang dibuat
oleh pengembang. Spesifikasi domain ini menjelaskan isi secara rinci, sering
dengan cakupan isi dan tipe item tes.
Validitas isi juga berkaitan dengan pertanyaan, “apakah item tes mencakup
keseluruhan materi atau bahan yang ingin diikur?”. Bukti validitas tersebut
diperoleh dari analisis rasional terhadap isi tes, yang penilaiannya didasarkan atas
pertimbangan subjektif individual. Sehubungan dengan hal ini Mardapi (2008: 18)
mengungkapkan bahwa walaupun subjektif, namun yang terlibat dalam proses
validasi adalah beberapa pakar pada bidang yang diukur dalam suatu forum
diskusi sehingga hasilnya dapan dipertanggung jawabkan. Hasil panel pakar
merupakan bukti untuk menunjukkan bahwa isi tes sesuai dengan materi yang
ingin diujikan. Bukti validitas isi menjamin bahwa dari segi isi, tes itu valid untuk
tujuan pengukuran tertentu. Bila suatu tes ingin digunakan untuk tujuan yang
42
berbeda dari tujuan semula penyusunan tes, maka diperlukan evaluasi terhadap isi
untuk menentukan bahwa interpretasi skor tes dapat dilakukan atau tidak untuk
tujuan yang berbeda itu.
Validitas berdasar respons memberikan bukti kesesuaian konstruk dengan respons
peserta tes. Bukti berdasarkan proses respon dapat diperoleh dari analisis teori dan
empiris terhadap respons peserta tes.
Validitas isi secara kuantitatif dapat dilakukan dengan menggunakan formula
menggunakan Indeks Gregory karena instrumen hanya divalidasi oleh 2 ahli.
Hasil penilaian dari validator dibuat dalam tabel kontingensi pada dua ahli, untuk
ahli 1 dan ahli 2, pada relevansi lemah dan kuat. Indeks kesepakatan ahli untuk
validitas isi merupakan perbandingan banyaknya butir dari kedua ahli dengan
kategori relevansi kuat dengan keseluruhan butir. Contoh pertolongan untuk
menghitung indeks Gregory disajikan pada tabel berikut.
Tabel 2.1. Tabel Kontingensi untk Menghitung Indeks Gregory.
Rater 1Lemah Kuat
Rater 2Lemah A BKuat C D
Koefisien validitas isi =
Keterangan:V = ValiditasA = Penilai I dan II menyatakan lemahB = Penilai I menyatakan kuat, penilai II menyatakan lemahC = Penilai I lemah, penilai II menyatakan kuatD = Penilai I dan II menyatakan kuat
(Retnawati, 2016: 32-33)
43
Setelah dilakukan perhitungan dengan tabel kontingensi Indeks Gregory.
Selanjutnya hasil tersebut diinterpretasikan, jika indeks kesepakatan tersebut
kurang dari 0,4 maka dikatakan validitasnya rendah, diantara 0,4-0,8 dikatakan
validitasnya sedang (mediocare) dan jika lebih dari 0,8 dikatakan tinggi.
Validitas konstruk diperoleh berdasarkan analisis data empirik dari hasil uji coba
lapangan. Validitas tes berdasarkan data empirik akan ditinjau menggunakan
analisis faktor dan dianalisis menggunakan analisis faktor konfirmatori. Hasil
analisis tersebut merupakan bukti bahwa hasil pengukuran dapat ditafsirkan sesuai
definisi yang digunakan. Definisi atau konsep tersebut merupakan teori yang
mendasari penyusunan suatu instrumen. Hasil analisis validitas konstruk
menunjukkan kemampuan tes mengungkap suatu trait yang dimaksudkan untuk
diukur. Rosidin (2017: 135) menyatakan bahwa aspek pendekatan empiris
terhadap validitas konstruk terdiri dari dua hubungan, yaitu, a) hubungan internal,
yaitu hunungan antara item-item di dalam alat pengukur ada atau tidak
bertentangan; b) hubungan eksternal, yaitu hubungan antara skor yang diperoleh
dari alat pengukur tersebut dengan sekor dari alat pengukur lain harus konsisten
dengan konstruk.
I. Reliabilitas Tes
Reliabilitas adalah tingkat kepercayaan hasil suatu pengukuran, pengukuran yang
memiliki reliabilitas tinggi adalah pengukuran yang dapat menghasilkan data yang
reliabel. Pengukuran yang memiliki reliabilitas tinggi yaitu yang mampu
memberikan hasil ukur yang terpercaya, yang disebut reliabel. Reliabilitas suatu
alat dapat diketahui jika alat tersebut mampu menunjukkan sejauh mana
44
pengukurannya dapat memberikan hasil yang relatif sama bila dilakukan
pengukuran kembali pada objek yang sama (Azwar, 2009:4).
Reliabilitas dinyatakan dengan koefisien reliabilitas yang angkanya berada dalam
rentang 0 sampai dengan 1,00. Semakin tinggi koefisien reliabilitas mendekati
angka 1,00 berarti semakin tinggi reliabilitasnya. Sebaliknya koefisien yang
semakin mendekati angka 0 berarti semakin rendah reliabilitasnya. Untuk
mengetahui reliabilitas dari tiap alat ukur, maka penelitian ini menggunakan
rumus Alpha Cronbach dengan bantuan IBM SPSS 20. Penggunaan rumus ini
dikarenakan skor yang dihasilkan dari instrument penelitian merupakan rentangan
skala 1-4, bukan dengan hasil 1 dan 0.
J. Kerangka Pikir
Berdasarkan permasalahan yang telah dijabarkan dalam latar belakang masalah,
dapat kita lihat bahwa pelaksanaan asesmen pembelajaran di sekolah-sekolah saat
ini belum maksimal. Salah satu penyebabnya adalah kurangnya kemampuan guru
dalam membuat instrumen penilaian yang memenuhi kriteria syarat instrumen
evaluasi yang baik digunakan. Penilaian dilakukan guru untuk mengetahui faktor-
faktor yang mempengaruhi keberhasilan dan kegagalan dalam proses
pembelajaran. Selain itu, penilaian berguna untuk memperoleh informasi
mengenai seberapa jauh kemampuan peserta didik dalam menguasai materi
pembelajaran yang sudah dilaksanakan.
Dalam dunia pendidikan terdapat bermacam-macam alat penilaian guna menilai
proses dan hasil pendidikan yang telah dilakukan siswa, khususnya pengetahuan
menggunakan alat ukur berupa tes dan non-tes. Penilaian merupakan salah satu
45
cara untuk mengevaluasi hasil belajar peserta didik dengan pemberian tes kepada
peserta didik. Tes merupakan sejumlah pertanyaan yang diberikan kepada peserta
tes, yang memiliki jawaban benar atau salah. Kegiatan pengetesan digunakan para
guru untuk menaksir tingkat kemampuan peserta didik secara tidak langsung,
yaitu melalui respons peserta didik terhadap stimulus atau pertanyaan.
Penggunaan tes lebih banyak dijadikan sebagai alat ukur penilaian dalam
pendidikan dibandingkan alat penilaian yang lain. Instrumen penilaian merupakan
tahap akhir dari sebuah pembelajaran karena penilaian merupakan tahap dimana
guru melakukan penilaian terhadap hasil belajar siswa. Penilaian digunakan untuk
mengukur ketercapaian peserta didik terhadap proses pembelajaran. Dengan
penilaian maka guru mampu memberikan timbal balik terhadap hasil belajar
siswa.
Hasil pengetesan yang diberikan kepada peserta didik merupakan data yang diolah
menjadi informasi, selanjutnya digunakan sebagai pertimbangan dalam
menentukan kebijakan atau putusan. Guru memberikan tes kepada peserta didik
kemudian mengumpulkan butir-butir soal yang sesuai dengan kompetensi yang
diharapkan kepada peserta didik. Pemberian tes dikhawatirkan terjadi kesalahan
pengukuran yaitu berupa data yang tidak baik sesuai dalam mengukur pencapaian
kemampuan yang diharapkan. Data yang tidak baik, tidak bisa diolah menjadi
informasi yang baik. Oleh karena itu diperlukan perangkat tes yang berkualitas.
Teknik penyusunan tes terdapat beberapa langkah yang sebaiknya dilakukan oleh
masing-masing guru ketika hendak memberikan tes kepada peserta didik. Adapun
langkah-langkah yang harus dilakukan meliputi, analisis materi, menyusun dan
46
merumuskan instrumen (di dalamnya berupa menyusun kisi-kisi, menyusun
spesifikasi butir soal, dan menulis butir soal), instrumen penilaian dan jawaban
(membuat telaah butir soal dan jawabannya), melakukan uji coba, menganalisis
butir soal, memperbaiki soal, melaksanakan tes (penelitian), dan menafsirkan hasil
tes.
Prosedur penyusunan butir soal dilakukan dengan menentukan tujuan tes
berdasarkan kisi-kisi, menentukan bentuk soal yang diinginkan, menentukan
panjang tes. Tujuan tes meliputi untuk mengetahui tingkat kemampuan peserta
didik, mengukur pertumbuhan dan perkembangan peserta didik, mendiagnosis
kesulitan belajar, mengetahui hasil pembelajaran, mengetahui pencapaian
kurikulum dan mendorong guru untuk melaksanakan pembelajaran yang lebih
baik.
Daya BedaButir
Nilai fungsiinformasi
Kemahiran(Trait)
KecocokanButir
Menyusun Kisi-kisi Instrumen Assessmen forLearning
ValiditasAhli
Uji coba &Penelitian
Analisis
Analisis Materi berdasarkan KD, MerumuskanIndikator Pencapaian Kompetensi
Menyusun Spesifikasi Butir Soal BerdasarkanKisi-kisi
III. METODE PENELITIAN
A. Jenis Penelitian
Jenis penelitian ini adalah Research and Development (R & D) atau dapat
dikatakan sebagai penelitian pengembangan. Produk yang dikembangkan adalah
Instrumen Assessment for Learning dengan Politomus Response (Jawaban
Beralasan) Jenjang Sekolah Menengah Kejuruan (SMK) yang mengacu pada
model pengembangan pendidikan umum dari Plomp (Rochmad, 2012: 66).Model
pengembangan yang dikemukakan oleh Plomp terdiri dari lima tahap yaitu: tahap
investigasi awal, tahap desain, tahap realisasi/konstruksi, tahap tes, evaluasi dan
revisi, dan tahap implementasi.
B. Subjek Penelitian
Penelitian ini akan dilaksanakan di lingkungan Sekolah Menengah Kejuruan
(SMK) yang ada di Kabupaten Lampung Timur. Subjek dalam penelitian ini
dibagi dalam beberapa tahap berikut:
1. Subjek Studi Pendahuluan
Pada studi pendahuluan dilakukan beberapa langkah sebagai analisis kebutuhan,
yaitu observasi, wawancara, dan analisis tingkat kesulitan soal. Subjek pada pada
saat observasi adalah peserta didik SMK Mitra Bhakti Bandar Sribhawono.
Subjek pada saat wawancara adalah satu orang guru yang mengajar matematika di
48
SMK Praja Utama Bandar Sribhawono. Subjek pada saat analisis tingkat kesulitan
soal adalah peserta didik di SMK Mitra Bhakti Bandar Sribhawono.
2. Subjek Validasi Instrumen
Subjek validasi instrumen assessment for learning dengan politomus response
dalam penelitian ini adalah dua orang ahli yang terdiri atas satu ahli materi dan
satu ahli evaluasi.
3. Subjek Uji Coba Lapangan awal
Subjek pada tahap ini adalah peserta didik yang pernah menempuh materi yang
akan diujikan.
4. Subjek Uji Coba Lapangan
Subjek pada tahap ini adalah seluruh peserta didik pada lingkungan SMK se
Kabupaten Lampung Timur. Dalam hal ini akan diwakili oleh 3 sekolahan
berdasarkan kriteria status akreditasinya, yaitu :
a. SMK Praja Utama Bandar Sribhawonob. SMK Mitra Bhakti Bandar Sribhawonoc. SMK Ma’arif NU Penawaja
Pengambilan sampel uji coba dilakukan dengan teknik non probability sampling
yaitu accidental sampling. Dalam non probability sampling, setiap unsur tidak
memiliki kesempatan atau peluang yang sama untuk dipilih sabagai sample.
Pemilihan unit sampling didasarkan pada pertimbangan atau penilaian subjekti
dan tidak menggunakan teori probabilitas. Dalam teknik ini, sampel paling sedikit
harus empat atau lima kali dari jumlah item pertanyaan. Dalam penelitian ini
adalah 413 sampel, melebihi batas minimal yang seharusnya 200 sampel (40 butir
soal x 5).
49
Dalam penarikan jumlah ukuran sampel, apabila populasinya tidak diketahui
secara pasti jumlahnya (accidental sampling) maka digunakan teknik atau rumus
sesuai dengan teori Malhotra (2006; 291). Accidental sampling merupakan
prosedur sampling yang memilih sampel orang atau unit yang paling mudah
dijumpai atau diakses. Kelemahan dari metode ini sangat mungkin sampel yang
diperoleh tidak representatif dan bias, sehingga tidak mungkin menarik
kesimpulan yang bersifat generalisasi berdasarkan metode ini.
C. Prosedur Pengembangan
Perangkat pembelajaran yang akan dikembangkan ialah instrumen assessment for
learning dengan politomus response. Spesifikasi butir soal disusun berdasarkan
Kompetensi Inti, Kompetensi Dasar, dan Indikator yang dipilih berdasarkan
pertimbangan peserta didik telah mendapatkan materi yang akan diujikan.
Penjelasan tentang tahap-tahap pengembangan tersebut dijelaskan sebagai berikut.
1. Tahap investigasi
Kegiatan yang dilakukan pada tahap investigasi awal adalah menghimpun
informasi permasalahan evaluasi belajar matematika terdahulu, mengidentifikasi
dan mengkaji teori-teori yang melandasi penelitian. Dalam tahap ini juga
dilakukan kajian secara teoritis tentang kurikulum mata pelajaran matematika
SMK, meliputi analisis materi berdasarkan Kompetensi Dasar yang telah dipilih,
merumuskan indikator pencapaian kompetensi dan kisi-kisi butir soal.
2. Tahap desain
Berdasarkan tahap investigasi awal, dilakukan suatu upaya mengembangkan suatu
produk yakni instrumen assessment for learning dengan politomus response
50
(jawaban beralasan). Pada tahap ini dilakukan perancangan instrumen, yaitu
merumuskan tujuan tes, merumuskan materi matematika, dan menyusun kisi-kisi
butir soal.
a. Merumuskan materi
Perumusan materi dilakukan dengan memperhatikan beberapa bab dan sub bab
materi kelas yang termasuk dalam materi pembelajaran pada satu semester. Materi
sesuai pada Kompetensi Inti (KI) dan Kompetensi Dasar (KD) dalam
Permendikbud No. 70 Tahun 2013 tentang Kerangka Dasar dan Struktur
Kurikulum Sekolah Menengah Kejuruan/Madrasah Aliyah Kejuruan. Dan
disesuaikan dengan Keputusan Direktur Jendral Pendidikan Dasar dan Menengah
No. 130/D/KEP/KR/2017 tentang Struktur Kurikulum Pendidikan Menegah
Kejuruan. Materi tes yang digunakan terletak pada Kompetensi Dasar:
1. Menganalisis barisan dan deret aritmatika (3.5).2. Menganalisis barisan dan deret geometri (3.6).3. Menerapkan operasi matriks dalam menyelesaikan masalah yang berkaitan
dengan matriks (3.15)4. Menentukan nilai determinan, invers dan transpose pada ordo 2 x 2 dan nilai
determinan dan transpose pada ordo 3 x 3 (3.16)5. Menentukan nilai variabel pada persamaan dan fungsi kuadrat (3.19)6. Menyelesaikan masalah kontekstual yang berkaitan dengan barisan dan deret
aritmatika (4.5).7. Menyelesaikan masalah kontekstual yang berkaitan dengan barisan dan deret
geometri (4.6).8. Menyelesaikan masalah yang berkaitan dengan matriks (4.15)9. Menyelesaikan masalah yang berkaitan dengan determinan, invers dan
transpose pada ordo 2 x 2 serta nilai determinan dan (4.16)10. Menyelesaikan masalah yang berkaitan dengan persamaan dan fungsi kuadrat
(4.19)
b. Menyusun kisi-kisi penulisan soal
Penyusunan kisi-kisi tes berdasarkan pada materi yang telah dirumuskan
sebelumnya. Kisi-kisi penulisan soal berisi Kompetensi Inti, Kompetensi Dasar,
51
Indikator Pencapaian Kompetensi, Materi, Indikator Soal dan Nomor Soal.
Selanjutnya pada masing-masing indikator pencapaian kompetensi berisi minimal
satu butir soal. Indikator pencapaian kompetensi dikembangkan menjadi beberapa
indikator soal. Indikator soal berisi tujuan dan kriteria soal tes untuk digunakan
oleh peneliti sebagai panduan dalam menyusun spesifikasi butir soal. Kisi-kisi tes
diperlukan agar penulisan butir soal sesuai dengan standar kompetensi yang
diharapkan.
c. Menyusun spesifikasi butir soal
Kisi-kisi yang telah disusun kemudian digunakan sebagai panduan dalam
menyusun butir soal. Spesifikasi butir soal secara garis besar berisi Standar
Kompetensi Lulusan (SKL), indikator pencapaian kompetensi, ruang lingkup
materi dan contoh butir soal. Spesifikasi butir soal disusun untuk beberapa butir
soal dengan ketentuan tercakup dalam indikator SKL dan materi yang sama.
Selanjutnya spesifikasi butir soal digunakan oleh guru mata pelajaran yang
dikenakan sebagai penulis soal dalam penelitian. Penulisan soal dilakukan untuk
mengetahui kesesuaian antara spesifikasi dan butir soal yang dihasilkan.
3. Tahap realisasi/konstruksi
Pada tahap ini, solusi yang telah didesain direalisasikan untuk bisa menghasilkan
suatu prototipe awal. Prototipe yang dihasilkan masih berupa prototipe awal yang
berupa instrumen evaluasi. Konstruksi prototipe berawal dari penulisan butir
soalyang selanjutnya perlu dilakukan penelaahan butir soal.
52
a. Penulisan butir soal
Penulisan butir soal berpedoman pada spesifikasi butir soal yang telah disusun
agar butir soal yang dihasilkan sesuai dengan standar kompetensi yang
diharapkan. Jumlah butir soal yang kembangkan sebanyak 20 butir.
b. Menelaah butir soal
Penelaahan butir soal tidak terlepas dari kisi-kisi dan spesifikasi butir soal yang
telah dibuat. Contoh butir soal yang telah dihasilkan dari spesifikasi butir soal
selanjutnya dirakit menjadi lembar penilaian instrumen tes. Berdasarkan lembar
instrumen penilaian yang dihasilkan selanjutnya dilakukan telaah oleh guru mata
pelajaran dan dosen ahli. Validator diminta oleh peneliti untuk memberikan
penilaian kesesuaian antara indikator dengan butir soal. Telaah dimaksudkan
untuk memudahkan peneliti dalam memperoleh informasi terkait butir soal yang
telah memenuhi kriteria atau belum memenuhi kriteria aspek telaah. Dengan
demikian untuk mempertimbangkan keefektifan waktu peneliti maka penilaian
lembar instrumen dilakukan secara terpisah oleh masing-masing telaah. Hasil
telaah digunakan oleh peneliti untuk memperbaiki contoh butir soal. Lembar
penilaian dirancang tiap butir untuk memudahkan validator dalam mencermati
kedalaman isi butir soal terhadap indikator yang disajikan dan ketetapan pilihan
jawaban yang diberikan. Butir yang sesuai dengan indikator soal diberi nilai 1 dan
butir yang tidak sesuai diberi nilai 2. Jika validator memberi penilaian tidak sesuai
maka diberi tanda check list pada kolom “lemah” dan memberi saran perbaikan
pada butir soal. Jika validator memberi penilaian “sesuai” maka beri tanda check
list pada kolom “kuat”, selanjutnya dihitung menggunakan Indeks Gregory untuk
mengetahui validitas isi tes.
53
Berdasarkan hasil perhitungan validitas isi maka butir soal yang memiliki
interprestasi sebagai koefisien yang rendah, sedang atau tinggi. Azwar (2014:
113) menyatakan bahwa artinya butir tersebut memiliki validitas isi yang baik dan
mendukung validitas isi tes secara keseluruhan, sehingga dapat digunakan sebagai
contoh soal yang memiliki kriteria baik.
4. Tahap tes, evaluasi, dan revisi
Pada tahap ini instrumen evaluasi yang berhasil direalisasikan dilihat kualitasnya.
Hal-hal yang dilakukan adalah menguji validitas instrumen evaluasi yang masih
berupa prototipe 1 oleh validator. Berdasarkan hasil uji validasi ini kemudian
dilakukan revisi hingga diperoleh perangkat instrumen assessment dalam bentuk
prototipe i yang valid untuk kemudian dilakukan uji coba untuk mengetahui
validitas, reliabilitas, daya beda, dan tingkat kesukarannya.
Pada tahap ini tes dapat berupa uji coba penelitian, yakni butir soal yang telah
dirakit terlebih dahulu dilakukan uji coba. Uji coba diberikan kepada kelas yang
sudah mendapatkan materi. Sekolah sasaran ini di SMK se-Lampung Timur yang
dalam hal ini diwakili oleh salah satu sekolahan yang tidak termasuk dalam
sasaran uji penelitian. Setelah uji coba penelitian selanjutnya dilakukan
pengumpulan lembar jawaban peserta didik untuk dianalisis secara kuantitatif
menggunakan Winsteps.
5. Tahap implementasi
Tahap ini termasuk dalam uji penelitian, setelah dilakukan perbaikan butir soal
berdasarkan hasil analisis dari uji coba penelitian. Butir soal yang telah
dinyatakan baik digunakan pada uji coba penelitian. Uji penelitian diberikan
54
kepada kelas yang telah mendapatkan materi yang diujikan. Sekolah sasaran di
SMK se-Lampung Timur yang diwakili oleh tiga sekolahan sasaran penelitian.
Setelah dilakukan evaluasi dan diperoleh produk yang valid, dan dinyatakan
layak, maka produk dapat diimplementasikan pada situasi yang sesungguhnya dan
wilayah yang lebih luas. Plomp (1997:6) menyatakan:“Solutions have to be
introduced,in other words, have to be implemented”. Pemecahan (solusi) harus
dikenalkan, dengan perkataan lain, harus diimplementasikan. Implementasi ini
dapat dilakukan dengan melakukan penelitian lanjutan penggunaan produk
pengembangan pada wilayah yang lebih luas. Lebih jelasnya perhatikan gambar
3.1.
Implementation
Keterangan :
: Kegiatan pengembangan
Implementation
Prelimenary investigation
design
Realization/construction
Test, evaluation and revision
Gambar 3.1. Langkah Pengembangan.
55
: Alur kegiatan tahap pengembangan
: Alur kegiatan timbal balik antara tahapan pengembangan dan
implementasi yang dilakukan
: Arah kegiatan balik ketahapan pengembangan selanjutnya
D. Teknik dan Instrumen Pengumpulan Data
1. Teknik pengumpulan data
Teknik pengumpulan data merupakan faktor penting demi keberhasilan penelitian.
Dalam penelitian ini, peneliti menggunakan teknik pengumpulan data yaitu
dokumentasi. Menurut Sukmadinata (2012: 221) “Teknik dokumentasi merupakan
suatu teknik pengumpulan data dengan menghimpun dan menganalisis dokumen-
dokumen, baik dokumen tertulis, gambar maupun elektronik”. Teknik
dokumentasi yang digunakan untuk mendapatkan data berupa : (a) lembar Soal
Evaluasi, (b) lembar kunci jawaban soal, dan (c) lembar jawaban peserta didik.
Butir soal yang telah disusun akan dianalisis secara kualitatif dan diujikan kepada
peserta didik. Selanjutnya dilakukan tahap analisis secara kuantitatif. Berdasarkan
hasil analisis tersebut diperoleh butir baik sehingga produk akhir yang dihasilkan
berupa instrumen assessment for learning untuk mata pelajaran matematika.
2. Instrumen pengumpulan data
Instrumen pengumpulan data berupa beberapa instrumen yang digunakan pada
penelitian meliputi 1) kisi-kisi instrumen assessmen for learning. Kisi-kisi
instrumen yang digunakan sebagai acuan peneliti untuk menyusun spesifikasi
butir soal, 2) instrumen assessment for learning berbentuk pilihan ganda beralasan
untuk mengukur kemampuan peserta didik, 3) lembar penilaian instrumen tes
56
untuk mengetahui validitas isi instrumen. Lembar telaah berisi kriteria yang perlu
dinilai terdiri dari kompetensi dasar, indikator, dan soal mengacu pada spesifikasi
butir soal, 4) lembar telaah tes secara teoritis berdasarkan aspek isi, aspek
konstruksi, dan aspek bahasa untuk mengetahui butir yang telah memenuhi
kriteria aspek telaah, dan 5) lembar jawaban peserta didik yang digunakan oleh
peneliti untuk memperoleh informasi terkait respons peserta didik.
Untuk dapat digunakan suatu tes tersebut perlu dilengkapi dengan pedoman
penskoran. Pedoman penskoran dibentuk untuk menjaga objektivitas penilaian
dan kepastian yang diperoleh peserta didik. Penskoran ini dirancang dalam skala
politomus 1 sampai 4 dengan kriteria skor sebagai berikut:
Tabel 3.1. Kriteria Penskoran Jawaban
Kriteria Jawaban Alasam Skor1. Jika peserta didik salah dalam menjawab pertanyaan soal
(S) dan salah dalam memberikan alasan (S).S S 1
2. Jika peserta didik salah dalam menjawab pertanyaan soal(S) namun benar dalam memberikan alasan (B).
S B 2
3. Jika peserta didik benar dalam menjawab pertanyaan soal(B) namun salah dalam memberikan alasan (S).
B S 3
4. Jika peserta didik benar dalam menjawab pertanyaan soal(B) dan benar dalam memberikan alasan (B).
B B 4
Penskoran tersebut mengacu pada penentuan skor politomus model Partial Credit
Model dimana jawaban dan opsi memiliki keterkaitan (Retnawati, 2016: 149).
E. Teknik Analisis Data
Teknik analisis data yang digunakan dalam penelitian pengembangan ini meliputi:
1. Validitas isi
Validitas isi ditentukan menggunakan kesepakatan ahli (expert). Kesepakata ahli
bidang studi atau sering disebut domain yang diukur menentukan tingkatan
57
validitas isi. Hal ini dikarenakan instrumen pengukuran dibuktikan valid jika ahli
meyakini bahwa instrumen tersebut mengukur penguasaan kemampuan yang
didefinisikan dalam domain ataupun konstruk psikologi yang diukur (Retnawati,
2014: 7). Peneliti meminta kepada ahli untuk memeriksa ketepatan antara
kesesuaian butir soal dengan indikator-indikatornya, redaksi penulisan soal, dan
kesesuaian pilihan jawaban (pengecoh) pada pilihan ganda. Apabila masih ada
kekeliruan dalam pembuatan instrumen, maka instrumen tersebut direvisi
kembali.
Setelah dilakukan pemeriksaan oleh ahli, dalam hal ini sebagai validator,
selanjutnya ahli memberikan penilaian terhadap instrumen. Penilaian tersebut
terdiri dari 4 kriteria sebagai berikut
Tabel 3.2. Kriteria Penilaian Butir Instrumen oleh Validator
Nilai Keterangan1 Tidak relevan2 Cukup relevan3 Relevan4 Sangat Relevan
Setelah diberikan penilaian oleh ahli, selanjutnya peneliti menghitung hasil
penilaian menggunakan indeks validitas, diantaranya dengan indeks yang
diusulkan oleh Gregory sebagai berikut.
Koefisien validitas isi =
Keterangan:V = ValiditasA = Penilai I dan II menyatakan lemahB = Penilai I menyatakan kuat, penilai II menyatakan lemahC = Penilai I lemah, penilai II menyatakan kuatD = Penilai I dan II menyatakan kuat
(Retnawati, 2016: 32-33)
58
Rentang angka V yang mungkin diperoleh adalah antara 0 sampai dengan 1.
Semakin tinggi angka V (mendekati 1 atau sama dengan 1) maka nilai kevalidan
sebuah item/butir soal juga semakin tinggi, dan semakin rendah angka V
(mengekati 0 atau sama dengan 0) maka nilai kevalidan sebuah item/butir soal
juga semakin rendah.
2. Validitas konstruk
Untuk membuktikan validitas konstruk dapat dilakukan dengan dua cara, yakni
analisis faktor eksplanatori dan analisis faktor konfirmatori. Dalam penelitian ini,
pembuktian validitas konstruk menggunakan analisis faktor eksplanatori. Sebelum
melakukan analisis faktor eksplanatori terlebih dahulu dilakukan uji kecukupan
sampel dengan melihat nilai Kaiser Mayer Olkin (KMO). Nilai KMO diperoleh
melalui analisis dengan bantuan software IBM SPSS 22. Jika nilai KMO lebih
dari 0,5 maka variabel dan sampel yang digunakan memungkinkan untuk
dilakukan analisis lebih lanjut (Retnawati, 2016:47).
Tahap selanjutnya adalah melihat nilai eigen dan screplot dari hasil analisis faktor
eksplanatori, Untuk melihat faktor-faktor yang terbentuk maka yang diperhatikan
adalah nilai eigen yang lebih besar dari 1. Dari faktor yang terbentuk maka dapat
diketahui persentase variansi yang dapat dijelaskan. Jika persentase varians yang
terjelaskan lebih besar dari 20% atau perbandingan nilai eigen pertama dengan
kedua sebesar 5 atau 4 maka instrument yang diukur memuat dimensi tunggal atau
bersifat unidimensi (wells & Purwono, 2008).
Adapun langkah-langkah untuk mencari nilai KMO dengan SPSS IBM 20 adalah
sebagai berikut:
a. Input data,
59
b. Klik Analyze,
c. Pilih Dimension Reduction, lalu pilih Factor,
d. Masukkan semua butir soal ke kolom items, lalu pilih Descriptives dan
beri tanda centang pada KMO and Barlett’s test of sphecirity, dan
e. Klik OK
3. Estimasi reliabilitas instrumen
Teknik analisis data untuk estimasi reliabilitas instrumen ini menggunakan teknik
estimasi konsistensi internal dengan formula Chronbach-alpha yang dibantu
aplikasi SPSS IBM. Jika nilai Chronbach’s Alpha 0,60 dan kurang dari 1, maka
nilai instrumen tersebut memiliki korelasi tinggi atau reliabel, sedangkan jika nilai
Cronbach’s Alpha di bawah 0,50 ke bawah, maka instrumen tersebut berkorelasi
rendh atau tidak reliabel (Basuki dan Hariyanto, 2014: 105). Hal ini juga
didukung oleh Surapranata (2009: 114), bahwa koefisien reliabilitas sebesar 0,5
dapat digunakan untuk tujuan penelitian.
Adapun langkah-langkah untuk mencari nilai Cronbach’s Alpha dengan SPSS
IBM adalah sebagai berikut:
a. Input data,
b. Klik Analyze,
c. Pilih Scale, lalu pilih Reliability Analysis,
d. Masukkan semua butir soal ke kolom items, dan
e. Klik OK.
Tabel 3.3. Kriteria Cronbach’s Alpha
Nilai Cronbach’s Alpha Tingkat Keandalan0.0 - 0.20 Kurang Andal>0.20 – 0.40 Agak Andal
60
Nilai Cronbach’s Alpha Tingkat Keandalan>0.40 – 0.60 Cukup Andal>0.60 – 0.80 Andal>0.80 – 1.00 Sangat Andal
Dalam penelitian ini didapatkan nilai reliabilitasnya sebesar 0,71, maka dapat
dikatakan instrument tersebut berkorelasi tinggi atau reliabel. Derikut reliabilitas
yang diperoleh, dapat dilihat juga dari kolom Summary of Statistics dengan
program Winstep (Lampiran Hasil Output winstep reliabilitas).
4. Tingkat Kesukaran Butir Soal
Teknik analisis data tingkat kesukaran butir soal berupa pilihan ganda beralasan
dapat dihitung menggunakan rumus (Nitko, 2011:30):
= ℎ ℎSetelah dilakukan perhitungan maka butir soal dapat dikategorikan menjadi butir
soal yang sangat mudah, sedang, sukar, dan sangat sukar mengacu pada Baker
(2011:11). Berikut adalah table tingkat kesukaran.
Tabe 3.4. Kategori Tingkat Kesukaran
Sangat mudah Mudah Sedang Sukar Sangat sukar– 2,0 – 0,5 0 +0,5 2,0
5. Analaisis Karakteristik Butir Tes Uji Coba
Analisis data dimulai dengan mendeskripsikan kelayakan karakteristik tes objektif
pilihan ganda tingkat SMK menggunakan item respon teori dengan bantuan
Program Winstep. Program Winstep digunakan karena memiliki beberapa
keunggulan (Subali & Suyata, 2011:2) yaitu: 1). Dapat menganalisis data berupa
61
dikotomus dan politomus, 2). Tersedianya hasil analisis teori modern didasarkan
pada model maksimum likelihood menggunakan model logistik satu parameter.
Analisis menggunakan IRT dapat dilakukan dengan menguji asumsi unidimensi
melalui analisis kesesuaian (fit) atau analisis faktor eksplanatori. Butir tes
dilakukan unidimensi jika butir tersebut mengukur satu kemampuan. Jika asumsi
unidimensi telah terpenuhi, maka secara otomatis asumsi independiensi local juga
telah terpenuhi. Indikasi bahwa butir tes bersifat unidimensi adalah data
cocok/sesuai (fit) dengan model. Untuk mengetahui apakah model yang
digunakan sesuai butir maka dapat digunakan statistic Infit mean-Squere (IMS)
dan Outfit Mean-Square (OMS). Statistic IMS dan OMS merupakan tingkat
kesesuaian antara data observasi dan nilai prediksi oleh model. Butir tes dikatakan
fit model jika memiliki nilai IMS dan OMS berkisar dari 0,5 sampai 1,5 (Linacre,
2002).
Tabel 3.5. Rentang Nilai IMS dan OMS
Nilai Implikasi bagi pengukuran>2,0 Merusak sistem pengukuran1,5 – 2,0 Tidak mempunyai makna bagi pengukuran0,5 – 1,5 Bermanfaat bagi pengukuran< 0,5 Tidak bermanfaat bagi pengukuran, tetapi tidak merusak
V. KESIMPULAN DAN SARAN
A. Kesimpulan
Berdasarkan tujuan penelitian pengembangan yang telah dilakukan, dapat ditarik
kesimpulan sebagai berikut:
1. a. Semua butir assessment for learning dengan politomus respons yang telah
dikembangkan cocok dengan Partial Credit Model (PCM).
b. Keseluruhan butir soal assessment for learning dengan politomus respons
yang telah dikembangkan memiliki tingkat kesulitan dengan kategori
sedang.
2. a. Instrumen assessment for learning dengan politomus respons yang telah
dikembangkan berdasarkan hasil validitas konstruk terdiri dari 40 butir
soal.
b. Instrumen assessment for learning dengan politomus respons yang telah
dikembangkan memiliki indeks validitas isi sebesar 1 atau dengan kategori
sangat tinggi.
c. Instrumen assessment for learning dengan politomus respons yang telah
dikembangkan memiliki koefisien reliabilitas sebesar 0,89 atau kategori
sangat tinggi.
d. Instrumen assessment for learning dengan politomus respons yang telah
dikembangkan telah memenuhi parameter unidimensi dengan nilai
komulatif eigen sebesar 20,22% dan scree plot grafik landai pada faktor
110
kedua.
e. Instrumen assessment for learning dengan politomus respons yang telah
dikembangkan telah memenuhi parameter independensi lokal dengan nilai
kovaria antar kelompok mendekati nol.
f. Instrumen assessment for learning dengan politomus respons yang telah
dikembangkan telah memenuhi parameter kecocokan butir (item fit)
dengan nilai Output MNSQ sebesar 0,5 sampai dengan 1,5 dan Pt-Measure
Corr bernilai positif.
g. Instrumen assessment for learning dengan politomus respons yang telah
dikembangkan berdasarkan nilai fungsi informasi dan kesalahan
pengukuran, instrumen cocok untuk peserta didik dengan kemampuan
sedang
B. Saran
Berdasarkan simpulan dapat diberikan saran pemanfaatan produk sebagai berikut:
1. Adanya instrumen assessment for learning dengan politomus respons yang
digunakan sebagai alat evaluasi diimbangi dengan kegiatan belajar mengajar
yang melatih dan mampu mengembangkan pemahaman peserta didik dan
kemampuan berpikir peserta didik secara berkesinambungan.
2. Instrumen assessment for learning dengan politomus respons dapat digunakan
oleh guru untuk proses evaluasi dan diharapkan untuk dapat dijadikan
pedoman untuk menyusun instrumen serupa pada materi matematika yang
lainnya
111
3. Bagi guru-guru yang akan melihat kemampuan peguasaan dan pemahaman
peserta didik dalam mata pelajaran matematika dapat menggunakan instrumen
dalam penelitian ini, karena sudah teruji karakteristiknya. Khsususnya pada
kompetensi dasar :
a. Menganalisis barisan dan deret aritmatika (3.5).b. Menganalisis barisan dan deret geometri (3.6).c. Menerapkan operasi matriks dalam menyelesaikan masalah yang berkaitan
dengan matriks (3.15)d. Menentukan nilai determinan, invers dan transpose pada ordo 2 x 2 dan
nilai determinan dan transpose pada ordo 3 x 3 (3.16)e. Menentukan nilai variabel pada persamaan dan fungsi kuadrat (3.19)f. Menyelesaikan masalah kontekstual yang berkaitan dengan barisan dan
deret aritmatika (4.5).g. Menyelesaikan masalah kontekstual yang berkaitan dengan barisan dan
deret geometri (4.6).h. Menyelesaikan masalah yang berkaitan dengan matriks (4.15)i. Menyelesaikan masalah yang berkaitan dengan determinan, invers dan
transpose pada ordo 2 x 2 serta nilai determinan dan (4.16)j. Menyelesaikan masalah yang berkaitan dengan persamaan dan fungsi
kuadrat (4.19)
4. Bagi guru yang ingin mengembangkan mencoba mengembangkan sediri
instrumen assessment for learning dengna politomus respons agar mengikuti
langkah-langkah pengembangan instrumen yang digunakan dalam penelitian
ini agar memperoleh instrumen yang valid.
DAFTAR PUSTAKA
Allen, M.j., & Yen, W.M. 1979. Introduction to measurement theory. Monterey,Mexico : Broocks/Cole Publishing Company.
Anderson, L.W., & Krathwohl, D.R. 2001. A Taxonomy for Learning, Teaching,and Assesing: A Revision of Bloom’s Taxonomy of EducatioanlObjectives. New York: Addison Wesley Longman, Inc.
Arikunto, S. 2012. Dasar-Dasar Evaluasi Pendidikan Edisi Revisi. Jakarta: BumiAksara
Azwar, S. 2009. Reliabilitas dan Validitas, edisi ke-3. Yogyakarta: PustakaPelajar.
Baker, F.B. 2001. The basics of item response theory. United States of America:ERIC
Basuki, I. & Hariyanto. 2014. Asesmen pembelajaran. Bandaung : PT. RemajaRosdakarya.
Bloom, B.S., Engelhart, M.D., Furst, E.J., Hill, W.H., & Krathwohl, D.R. 1956.The Taxonomy of Educational Objectives The Classification ofEducational Goals, Handbook I: Cognitive Domain. New York: DavidMcKay.
Chandrasegaran, A.L, Treagust, D, & Mocerino, M. 2007. The Development of ATwo-Tier Multiple-Choice Diagnostic Instrument forEvaluatingSecondary School Students’ Ability to Describe And ExplainChemical Reactions Using Multiple Levels Of Representation. ChemistryEducation Research and Practice 8(3). 293-307.
Cizek, G. & Andrade, H. 2010. Handbook of Formative Assessment. New York:Roudledge.
Daryanto. 2008. Evaluasi Pendidikan. Jakarta: Rineka Cipta
Demars, C.E. 2010. Item Response Theory. New York: Oxford University Press.
Hambleton, R.K., & Swaminathan, H. 1985. Item Response Theory: Principlesand Applications. Boston: Kluwer.
Hambleton, R.K., Swaminahan, H., & Rogers, H.J. 1991. Fundamental of ItemResponse Theory. Newbury, CA: Sage Publication Inc.
Irvine & Kyllonen. 2002. Item Generation for Test Development. Mahwah, NJ:Lawrence Erlbaum Associates, Publishers.
Joni, T. R. 1986. Pengukuran Dan Penilaian Pendidikan. Surabaya: Karya Anda.
Linacre, J. M. 2012. Winstep : Rasch-Model Computer Programs. Chicago:Winsteps.com
Karso, dkk. 2009. Pendidikan Matematika I. Jakarta: Universitas Terbuka.
Makmun, A.S. 2007. Psikologi Kependidikan Perangkat sistem PengajaranModul. Bandung: Rosdakarya
Malhotra, Naresh K. 2006. Riset Pemasaran. Jakarta: Eirlangga.
Mardapi, D. 2008. Teknik penyusunan instrumen tes dan non tes. Yogyakarta :Mitra Cendika
Masters, G.N. 1999. Partial credit model. In: Masters, G.N. & Keeves, J.P.(1999). Advances in measurement in educational research andassessment. Amasterdam: Pergamon, An imprint of Elsevier Science.
Messick, S. 1988. The once and feature issues of validity. Dalam H. Wainer & H.L. Braun (Eds.). Test validyty. (pp. 33-40). Hilladale, NJ: LawrenceErlbaum Associates, Publisher.
Miller, P.W. 2008. Measurement and teaching. Munster, Indiana: Patric W. Miller& Association.
Muraki,E., & Bock, R.D. 1997. Parscale 3: IRT based test scoring and itemanalysis for graded items and rating scales. Chicago: Scintific SoftwareInc.
Nitko, A.J., & Brookhart, S.M. 2007. Educational Assessment of Student. NewJersey: Pearson Education
Ostini, R. & Nering, M. L. 2006. Polytomus Item Response Theory Models.Thousand Oaks, CA: Sage Publications, Inc.
Permendikbud No. 22 Tahun 2016. Tentang Standar Isi untuk Satuan PendidikanDasar dan Menengah.
Permendikbud No. 23 Tahun 2016. Tentang Standar Penilaian Pendidikan.
Permendikbud No. 60 Tahun 2014. Tentang Kurikulum 2013 Sekolah MenengahKejuruan/Madrasah Aliyah Kejuruan.
Plomp, Tj. 1997. Educational Design: Introduction. Form Tjeerd Plomp (eds).Educational & Training System Design:Introduction. Design ofEducation and Training (in Dutch). Utrecht (The Netherlands): Lemma.Netherland. Faculty of Educational Science and Technology, Universityof Twente. Enschede the Netherlands.
Purnomo, Y.W. 2014. Assessment Based Learning: Sebuah Tinjauan untukMeningkatkan Motivasi Belajar dan Pemahaman Matematis. SigmaJourna, ISSN: 1411-5166 No.01, Vol. VI.
Reedal, Kristin E. 2010. Journay Jean Piaget’s Cognitive DevelopmentTheory in Mathematics Education. Dalam Jurnal InternasionalCognitive Development and Learning Mathematics.http://ripon.edu/macs/summation.
Retnawati, H. 2014. Teori Respons Butir dan Penerapannya untuk Peneliti,Praktisi Pengukuran dan Pengujian, Mahasiswa Pascasarjana.Yogyakarta: Nuha Medika.
__________. 2016. Validitas, Reliabilitas & Karakteristik Butir Panduan untukPeneliti, Mahasiswa, dan Psikometrian. Yogyakarta: Nuha Medika.
Rochmad. 2012. “Desain Model Pengembangan Perangkat PembelajaranMatematika”. Jurnal Kreano. Volume 3 No. 1. Hal 59-72.
Rosidin, Undang. 2017. Evaluasi dan Asesmen Pembelajaran. Media Akademi:Yogyakarta.
Ruseffendi, E.T. 2006. Pengantar kepada Membantu Guru MengembangkanKompetensinya dalam Pengajaran Matematika untuk MeningkatkanCBSA. Bandung: Tarsito.
Sukmadinata, Nana Syaodih. 2012. Metode Penelitian Pendidikan. Bandung:Remaja Rosdakarya.
Surapranata, S. 2009. Analisis, validitas, reliabilitas, dan interpretasi hasil tesimplementasi kurikulum 2004. Bandung : PT. Remaja Rosdakarya.
Suwarto. 2012. Pengembangan Tes Diagnostik dalam Pembelajaran. Jogjakarta:Graha Ilmu
Syah, Muhibbin. 2010. Psikologi Pendidikan dengan Pendekatab Baru. Bandung: Remaja Rosdakarya.
Treagust, D. 1988. Development and Use of Diagnostic Tests to EvaluateStudent’s Misconceptions in Science. International Journal of ScienceEducation 10(2). 159-169
Tüysüz, 2009. Development of Two-Tier Diagnostic Instrument and AssessStudents’ Understanding In Chemistry. Academic Journal. 4(6). 626-631
Wu, M. & Adam, R. 2007. Applying The Rasch Model To PsychosocialMeasurement: A Practical Approach. Melbourne: EducationalMeasurement Solution.