Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING
BERBASIS HOTS DENGAN POLITOMUS RESPONSE PADA
MATA PELAJARAN MATEMATIKA JENJANG
SEKOLAH MENENGAH KEJURUAN
(Tesis)
Oleh
AGUNG ALRIZKY ANDREAWAN
PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2019
ABSTRAK
PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING
BERBASIS HOTS DENGAN POLITOMUS RESPONSE PADA
MATA PELAJARAN MATEMATIKA JENJANG
SEKOLAH MENENGAH KEJURUAN
Oleh
AGUNG ALRIZKY ANDREAWAN
Penelitian ini bertujuan untuk menghasilkan instrumen assessment for learning
berbasis HOTS dengan politomus response (jawaban beralasan). Penelitian ini
merupakan penelitian pengembangan yang mengacu pada model pengembangan
pendidikan umum dari Plomp yang dimulai dari tahap investigasi awal, tahap
desain, tahap realisasi/konstruksi, tes, evaluasi, dan revisi, dan tahap
implementasi. Subjek uji coba lapangan dilakukan pada tiga sekolah, yaitu SMK
Praja Utama Bandar Sribhawono, SMK Mitra Bhakti Bandar Sribhawono, dan
SMK Mandiri Bandar Sribhawono. Jumlah keseluruhan subjek uji coba lapangan
sebanyak 402 peserta didik. Data penelitian dikumpulkan dengan menggunakan
tes pilihan ganda dengan alasan terbuka yang terdiri dari 10 butir soal. Validitas
butir dianalisis menggunakan formula indeks Gregory dan parameter butir
dianalisis menggunakan pendekatan Partial Credit Model 1- Parameter Logistic
(1- PL) dengan bantuan program winsteps. Hasil penelitian menunjukan bahwa
semua instrumen valid. Hal ini berdasarkan perhitungan indeks Gregory sebesar
1. Selain itu diperoleh koefisien reliabilitas rata-rata sebesar 0,577, sehingga
instrumen dinyatakan reliabel untuk mengukur kemampuan peserta didik. Hasil
pengukuran menunjukkan Outfit MNSQ antara 0,5 sampai dengan 1,5 serta Pt-
Measure Corr bernilai positif yang berarti semua soal cocok atau fit. Tingkat
kesukaran butir soal yang telah dijawab siswa dalam kategori sedang.
Kata Kunci : instrumen assesment for learning, HOTS, politomus respons,
pilihan ganda beralasan terbuka.
ABSTRACT
DEVELOPMENT OF INSTRUMENT ASSESSMENT FOR LEARNING
HOTS BASED WITH POLITOMUS RESPONSE IN VOCATIONAL
SUBJECTS OF HIGH SCHOOL LEVEL
By
AGUNG ALRIZKY ANDREAWAN
The research aims to produce a HOTS-based assessment for learning instrument
with a politomus response. This research is a development research that refers to
the model of general education development from Plomp which starts from the
initial investigation stage, design stage, realization/construction stage, test,
evaluation, and revision, and implementation stage. The subject of field trials was
conducted in three schools, namely SMK Praja Utama Bandar Sribhawono, SMK
Mitra Bhakti Bandar Sribhawono, and SMK Mandiri Bandar Sribhawono. The
total number of field trial subjects was 402 learners. The research Data is
collected using a multiple choice test with an open reason consisting of 10 items.
The validity of grain is analyzed using the Gregory index formula and the item
parameters analyzed using the Partial Credit Model 1-Parameter Logistic (1-PL)
approach with the help of the Winsteps program. The results show that all
instruments are valid. It is based on the calculation of the Gregory index of 1. In
addition it gained an average coefficient of reliability of 0.577, so the instrument
is considered reliable to measure the ability of learners. The measurement results
show Outfit MNSQ between 0.5 to 1.5 and Pt-Measure Corr is positive value
which means all the problems are fit. The difficulty level of the problem that
students have answered in a medium category.
Key Word : Assessment instruments for learning, HOTS, Response Politomus,
open-ended double choice.
PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING
BERBASIS HOTS DENGAN POLITOMUS RESPONSE PADA
MATA PELAJARAN MATEMATIKA JENJANG
SEKOLAH MENENGAH KEJURUAN
Oleh
AGUNG ALRIZKY ANDREAWAN
Tesis
Sebagai Salah Satu Syarat untuk Mencapai Gelar
MAGISTER PENDIDIKAN
pada
Program Studi Magister Pendidikan Matematika
Jurusan Pendidikan Matematika dan Ilmu Pengetahuan Alam
PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKA
FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN
UNIVERSITAS LAMPUNG
BANDAR LAMPUNG
2019
RIWAYAT HIDUP
Penulis dilahirkan di Bandar Agung pada tanggal 01 Maret
1993. Penulis merupakan anak pertama dari dua bersaudara
pasangan Bapak Jumadi, S.Pd. dan Ibu Siti Asiyah, M.Pd.
Penulis menyelesaikan pendidikan Taman Kanak-kanak di
TK PGRI 1 Bandar Agung pada tahun 2000, pendidikan
dasar di SD Negeri 2 Bandar Agung pada tahun 2005, pendidikan sekolah
menengah di SMP Negeri 1 Bandar Sribhawono pada tahun 2008, pendidikan
menengah atas di SMA Negeri 1 Bandar Sribhawono pada tahun 2011 dan
Sarjana Program Studi Pendidikan Matematika di Institut Agama Islam Negeri
Lampung pada tahun 2015. Kemudian penulis melanjutkan pendidikan pada
Program Studi Pasca Sarjana Pendidikan Matematika di Universitas Lampung
pada tahun 2015.
MOTO
“Jadilah seperti karang di lautan yang kuat dihantam
ombak dan kerjakanlah hal yang bermanfaat untuk diri
sendiri dan orang lain, karena hidup hanyalah sekali.
Ingatlah hanya pada Allah apapun dan dimanapun kita
berada kepada Dia-lah tempat meminta dan
memohon.”
PERSEMBAHAN
Dengan mengucap syukur kehadirat Allah SWT kupersembahkan karya ini
dengan kesungguhan hati sebagai tanda bakti dan cinta kasihku kepada:
Ayahanda Jumadi dan Ibunda tercinta Siti Asiyah yang telah memberikan doa,
kasih sayang, motivasi, dan bekal kehidupan yang tak henti-hentinya, yang selalu
ada di sampingku serta selalu memberikanku yang terbaik untuk menjadikanku
sesuatu yang terbaik dalam kehidupan ini.
Adikku tersayang Diva Djayanti dan Okvita Dwi Ningrum
serta seluruh keluarga baik dari ibunda maupun ayahanda,
atas kebersamaannya selama ini, atas semua doa dan dukungan
yang telah diberikan kepadaku.
Para pendidik yang telah mendidikku yang menjadikanku semakin berwawasan.
Sahabat-sahabat seangkatan selama menempuh pendidikan yang telah
memberikan warna setiap harinya.
Semua sahabat yang begitu tulus menyayangiku dengan segala kekuranganku,
dari kalian aku belajar memahami arti ukhuwah.
Almamater Universitas Lampung Tercinta.
i
SANWACANA
Puji syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan karunia-
Nya sehingga penulis dapat menyelesaikan penyusunan tesis yang berjudul
“Pengembangan Instrumen Assessment for Learning Berbasis HOTS dengan
Politomus Response Pada Mata Pelajaran Matematika Jenjang Sekolah Menengah
Kejuruan” sebagai syarat untuk mencapai gelar Magister Pendidikan pada
Fakultas Keguruan dan Ilmu Pendidikan Universitas Lampung.
Penulis menyadari sepenuhnya bahwa terselesaikannya penyusunan tesis ini tidak
terlepas dari bantuan berbagai pihak. Oleh karena itu, penulis mengucapkan
terima kasih kepada:
1. Bapak Dr. Sugeng Sutiarso, M.Pd., selaku Dosen Pembimbing Pertama
sekaligus Ketua Program Studi Magister Pendidikan Matematika yang telah
bersedia menyumbangkan banyak ilmu, memberikan perhatian, motivasi, dan
semangat kepada penulis demi terselesaikannya tesis ini.
2. Bapak Dr. Undang Rosidin, M.Pd., selaku Dosen Pembimbing Kedua yang
telah membimbing dengan baik, memberikan motivasi, masukan dan
sumbangan pemikiran kepada penulis dalam penyusunan tesis ini.
3. Bapak Dr. Haninda Bharata, M.Pd., selaku Dosen Pembahas Pertama yang
telah memberikan masukan dan saran kepada penulis.
4. Bapak Prof. Dr. Patuan Raja, M.Pd selaku Dekan FKIP Universitas Lampung.
ii
5. Bapak Prof. Drs. Mustofa, M.A., Ph.D., selaku Direktur Program
Pascasarjana.
6. Bapak/Ibu Dosen Magister Pendidikan Matematika di Fakultas Keguruan dan
Ilmu Pendidikan yang telah memberikan bekal ilmu pengetahuan kepada
penulis.
7. Bapak Drs. Sugeng M,Si., selaku Kepala SMK Praja Utama Sribhawono
sekaligus MKKS SMK Lampung Timur yang telah memberikan izin dan
bantuan selama penelitian.
8. Ibu Mujiati, S.Pd. selaku guru mata pelajaran matematika SMK Praja Utama
Sribhawono yang telah membantu penulis selama melakukan penelitian.
9. Peserta didik SMK yang dijadikan sampel penelitian atas perhatian dan
kerjasama yang telah terjalin.
10. Teman-teman seperjuangan seluruh angkatan 2015 Magister Pendidikan
Matematika, atas kebersamaannya selama ini dan semua bantuan yang telah
diberikan. Semoga kebersamaan kita selalu menjadi kenangan yang terindah
untuk kita semua.
11. Almamater tercinta yang telah mendewasakanku.
12. Semua pihak yang telah membantu dalam penyusunan tesis ini.
Semoga dengan kebaikan, bantuan dan dukungan yang telah diberikan pada
penulis mendapat balasan pahala yang setimpal dari Allah SWT dan semoga tesis
ini bermanfaat bagi kita semua.
Bandar Lampung, 12 Oktober 2019
Penulis
Agung Alrizky Andreawan
iii
DAFTAR ISI
Halaman
DAFTAR TABEL .......................................................................................... v
DAFTAR GAMBAR ...................................................................................... vi
DAFTAR LAMPIRAN .................................................................................. vii
I. PENDAHULUAN
A. Latar Belakang dan Masalah ............................................................ 1
B. Rumusan Masalah ............................................................................ 7
C. Tujuan Penelitian ............................................................................. 8
D. Manfaat Penelitian ........................................................................... 8
II. TINJAUAN PUSTAKA
A. Instrumen Penilaian ......................................................................... 9
B. Instrumen Pilihan Ganda Beralasan .................................................. 12
C. Assesment for Learning .................................................................... 13
D. Higher Order Thinking Skills ........................................................... 15
E. Item Response Theory ....................................................................... 17
F. Definisi Operasional ........................................................................ 21
G. Kerangka Pikir ................................................................................. 22
III. METODE PENELITIAN
A. Jenis Penelitian ................................................................................. 25
B. Tempat, Waktu dan Subjek Penelitian .............................................. 25
C. Prosedur Pengembangan ................................................................... 27
D. Teknik dan Instrumen Pengumpulan Data ........................................ 31
E. Teknik Analisis Data ......................................................................... 33
IV. HASIL PENELITIAN DAN PEMBAHASAN
A. Hasil Penelitian
1. Hasil Pengembangan Produk
a. Tahap Investigasi ................................................................... 41
b. Tahap Desain .......................................................................... 41
c. Tahap Realisasi/Konstruksi .................................................... 42
d. Tahap Tes, Evaluasi dan Revisi ............................................. 43
iv
B. Pembahasan
1. Pengembangan Produk
a. Tahap Investigasi .................................................................. 54
b. Tahap Desain .......................................................................... 55
c. Tahap Realisasi/Konstruk ...................................................... 55
d. Tahap Tes, Evaluasi dan Revisi ............................................. 56
2. Instrumen AfL Berbasis HOTS .................................................... 59
3. Keterbatasan Penelitian ............................................................... 61
V. KESIMPULAN DAN SARAN
A. Kesimpulan ...................................................................................... 63
B. Saran ................................................................................................ 64
DAFTAR PUSTAKA ..................................................................................... 65
LAMPIRAN .................................................................................................... 69
v
DAFTAR TABEL
Tabel Halaman
2.1 Indikator HOTS ................................................................................. 16
3.1 Subjek Uji Coba Penelitian ............................................................... 26
3.2 Kriteria Penskoran Jawaban ............................................................. 33
3.3 Kriteria Penilaian Butir Instrumen Oleh Ahli/Expert ........................ 34
3.4 Kontingensi untuk Menghitung Indeks Gregory .............................. 34
3.5 Kategori Tingkat Kesukaran (p) ....................................................... 36
3.6 Rentang Nilai IMS dan OMS ........................................................... 37
3.7 Kategori HOTS Peserta Didik ............................................................ 37
3.8 Rentang Nilai IMS dan OMS ............................................................ 39
3.9 Kategori HOTS Peserta Didik ............................................................ 39
3.10 Jumalah Siswa dalam Pencapaian HOTS pada AFL .......................... 40
4.1 Analisis Validitas Isi .......................................................................... 43
4.2 Subjek Uji Coba Produk .................................................................... 43
4.3 Nilai Kaiser Mayer Olkin (KMO) ..................................................... 45
4.4 Total Variance Explained .................................................................. 45
4.5 Uji Reliabilitas Instrumen .................................................................. 46
4.6 Tingkat Kesukaran Butir Soal ........................................................... 48
4.7 Jumlah Siswa dalam Pencapaian HOTS pada AfL ............................. 52
vi
DAFTAR GAMBAR
Gambar Halaman
2.1 Mekanisme pengembangan instrument evaluasi ................................. 25
3.1 Presentase Pecapaian HOTS pada AfL ................................................. 40
4.1 Scree Plot UnidimensiInstrumen AfL .................................................. 46
4.2 Outfit & Pt-Measure ............................................................................ 47
4.3 Hasil Uji Tingkat Kesukaran Butir Soal dengan program Winsteps .... 48
4.4 OutputMap Item Winsteps .................................................................... 49
4.5 Grafik fungsi informasi ........................................................................ 50
4.6 Presentase Pecapaian HOTS pada AfL ................................................. 51
4.7 Pola Jawaban Scalogram of Responses Jawaban Peserta Didik ......... 52
4.8 Output Test Person Diagnostic ............................................................ 53
vii
DAFTAR LAMPIRAN
Lampiran Halaman
1. Kisi-Kisi Instrumen ................................................................................. 70
2. Instrumen Tes .......................................................................................... 78
3. Kunci Jawaban Instrumen ........................................................................ 83
4. Lembar Validasi Para Ahli ....................................................................... 90
5. Hasil Analisis Index Gregory ................................................................... 102
6. Hasil Analisis Validitas Menggunakan Program SPSS ............................ 103
7. Hasil Analisis Reliabilitas Menggunakan Program SPSS ........................ 104
8. Hasil Analisis Kecocokan Butir Soal (Item Fit) ...................................... 105
9. Hasil Analisis Tingkat Kesukaran Butir (Item Difficulty)........................ 106
10. Hasil Analisis Fungsi Informasi Tes ........................................................ 108
11. Hasil Analisis Skor Peserta Didik ............................................................ 109
12. Hasil Analisis Scalogram of Response ..................................................... 119
13. Hasil Analisis Test Person Diagnostic ..................................................... 125
14. Hasil Wawancara Instrumen AFL ............................................................ 156
15. Kegiatan Uji Coba Penelitian ................................................................... 159
I. PENDAHULUAN
A. Latar Belakang dan Masalah
Pendidikan memiliki peranan penting dalam proses pembangunan suatu bangsa,
karena sasaran pendidikan adalah peningkatan kualitas sumber daya manusia.
Keberhasilan suatu bangsa dalam menghadapi persaingan global sangat
ditentukan oleh kualitas pendidikan. Menghadapi tantangan tersebut, sistem
pendidikan harus direformasi guna menjawab tuntutan yang ada. Salah satu upaya
yang dilakukan yaitu melalui pengembangan kurikulum. Triwiyono(2017:28)
menyatakan bahwa kurikulum merupakan rencana atau program menyangkut
semua pengalaman yang dihayati peserta didik dibawah pengarahan sekolah.
Permendikbud No. 60 (2014) tentang kurikulum, pengembangan kurikulum di
indonesia saat ini adalah kurikulum 2013 yang diterapkan diseluruh jenjang
pendidikan. Abdullah (2013:12) menyatakan Implementasi kurikulum 2013
mempunyai beberapa perubahan, salah satunya dalam sistem penilaian hasil
belajar, penilaian ditekankan pada hasil dan proses pembelajaran peserta didik.
Penilaian hasil belajar berfungsi memantau proses, kemajuan belajar, dan
perbaikan hasil belajar secara kesinambungan untuk mengetahui capaian
pembelajaran (learning outcomes) peserta didik yang diwujudkan dalam penilaian
formatif dan sumatif (Permendikbud No 104 Tahun 2014). Penerapan penilaian
dilakukan melalui penilaian autentik sebagai bentuk reformasi pendidikan pada
2
level operasional, yaitu penilaian (Rojewski, 2009:31). Reformasi ini bukan hanya
sebagai penunjang kesuksesan pelaksanaan kurikulum 2013, akan tetapi untuk
menghadapi tantangan global yang ada. Paradigma reformasi pendidikan yang
menitik beratkan pada studen center learning menuntut adanya self asessment
dalam proses penilaian sebagai bentuk pembelajaran individual (Cheng, 2005:5).
Penilaian dalam pembelajaran matematika merupakan bagian tidak terpisahkan
dari proses pendidikan matematika. Upaya peningkatan kualitas pendidikan
matematika dapat ditempuh melalui peningkatan kualitas pembelajaran dan
kualitas sistem penilaiannya. Salah satu bentuk penilaian yang diharapkan untuk
hal tersebut adalah penilaian formatif. Earl (Sudiyanto dkk, 2015), penilaian
formatif merupakan penilaian untuk memperbaiki proses pembelajaran. Namun
fakta dilapangan menunjukan guru mengalami kesulitan dalam penilaian hasil
belajar terutama penilaian formatif/proses sehingga pelaksanaannya belum
optimal (Triwiyono, 2017:29). Faktor penghambat pelaksanaan penilaian formatif
yaitu metode, pemanfaatan hasil, dan peserta didik (Mansyur, 2009:35).
Berdasarkan hasil wawancara yang dilakukan ditiga SMK, yaitu SMK Praja
Utama Bandar Sribhawono, SMK Mitra Bhakti Sribhawono, dan SMK Mandiri
Bandar Sribhawono, diperoleh kesimpulan bahwa: (1) sebagian besar guru
memahami asesmen untuk mengukur hasil belajar, (2) semua guru menggunakan
tes untuk mengukur hasil belajar, (3) hampir semua guru tidak menggunakan hasil
asesmen untuk perbaikan proses pembelajaran karena guru belum memiliki
kebiasan untuk melakukan analisis diagnosis kesulitan belajar peserta didik, (4)
hampir semua guru tidak melibatkan peserta didik dalam setiap tahapan proses
3
asesmen, baik dalam menentukan tujuan belajar dan kriteria sukses, penentuan
tugas pembelajaran, pemantauan hasil, dan umpan balik untuk perbaikan
pembelajaran.
Akibat dari belum berfungsinya penilaian formatif pada level kelas, maka kualitas
pembelajaran matematika masih belum tercapai. Setidaknya hal tersebut terlihat
dari hasil UN SMK, menunjukkan di Indonesia nilai rata-rata UN SMK tahun
2015 ke tahun 2016 mengalami penurunan. Rata-rata nilai UN SMK pada tahun
2015 rata-rata nilainya mencapai 62,11 dan pada tahun 2016 nilai rata-ratanya
turun hingga angka 57,66 atau menurun 4,45 poin.
Mengatasi kelemahan praktik penilaian formatif yang telah dikemukakan di atas
dan untuk peningkatkan kualitas kemampuan matematika, maka perlu dilakukan
inovasi model penilaian yang terintegrasi dengan pembelajaran, yaitu asessment
for learning (AfL). Sudiyanto (2015) AfL adalah asesmen yang dirancang untuk
memberikan informasi kepada guru untuk memodifikasi kegiatan
pembelajarannya, membedakan dan memahami cara peserta didik melakukan
pendekatan belajar. AfL yang menekankan pada penggunaan asesmen sebagai
proses mengembangkan dan mendukung metaognisi peserta didik, dalam
pengertian peserta didik diberikan kesempatan dan dibimbing untuk melakukan
pemantauan dan menggunakan hasil pemantauan untuk memperbaiki belajarnya.
Rendahnya nilai rata-rata matematika pada UN SMK di Indonesia selain
dikarenakan penilaian yang belum dirancang dengan baik oleh guru, disebabkan
juga karena permasalahan yang terjadi di sekolah. Soal-soal yang dikerjakan
peserta didik cenderung lebih banyak menguji aspek ingatan yang kurang melatih
4
keterampilan berpikir tingkat tinggi peserta didik. Hasil survei TIMSS diperoleh
bahwa kemampuan berpikir anak Indonesia secara ilmiah dianggap masih rendah.
Salah satu faktor penyebabnya antara lain karena peserta didik di Indonesia
kurang terlatih dalam menyelesaikan soal-soal yang mengukur Higher Order
Thinking Skills (HOTS). Hal ini didukung oleh hasil penelitian oleh Arifin dan
Retnawati (2017), bahwa guru jarang sekali memberikan soal-soal yang memiliki
level tinggi.
Selain itu, masalah yang dihadapi oleh guru adalah kemampuan dalam
mengembangkan instrumen asesmen HOTS masih kurang. Ketersediaan
instrumen yang didesain khusus untuk melatih HOTS juga belum banyak. Padahal
pada UN pemerintah sudah mencantumkan soal-soal yang muat HOTS. Khusunya
pada soal UN matematika pada jenjang SMK, sudah memuat soal HOTS berupa
soal olimpiade internasioanal sebanyak 2 soal dari 40 soal atau sebesar 5%.
Diperkirakan untuk pelaksanaan UN tahun berikutnya, soal-soal olimpiade
internasional akan lebih banyak (Arifin dan Retnawati, 2017).
Hal ini merupakan salah satu mendasari guru untuk dapat membuat atau
mengembangkan instrumen berbasis HOTS, yaitu instrumen yang mengukur
beberapa aspek HOTS peserta didik. Tujuannya adalah mengidentifikasi kekuatan
relatif peserta didik dan kelemahan berpikir tingkat tinggi peserta didik.
Disamping itu juga, guru dapat mengetahui kesiapan mereka untuk mengikuti UN.
Jika guru tidak melakukan hal tersebut, dikhawatirkan potensi HOTS yang ada
pada diri peserta didik tidak diketahui dan tidak berkembang.
5
Berdasarkan uraian di atas, maka perlu adanya pengembangan instrumen
assessment for learning berbasis HOTS bagi peserta didik karena salah satu
indikasi keberhasilan peningkatan sumber daya manusia dalam bidang pendidikan
adalah peserta didik memiliki kemampuan berpikir tingkat tinggi yang baik,
karena tujuan utama pembelajaran pada abad ke 21 ini adalah untuk
mengembangkan dan meningkatkan HOTS peserta didik (Arifin dan Retnawati,
2017).
Penelitian pengembangan ini menggunakan soal tes berbentuk tes pilihan ganda.
Namun, soal pilihan ganda memiliki pilihan jawaban yang disediakan
menyebabkan kemungkinan besar peserta didik hanya mengandalkan intuisi
bahkan tebakan. Selain itu peserta didik tidak dapat mengorganisasi,
menghubungkan, dan menyatakan idenya karena jawaban telah disediakan.
Akibatnya pendidik tidak dapat mengidentifikasi kesulitan dan tingkat
pemahaman peserta didik terhadap materi yang telah dipelajari. Mardapi (2008:5)
mengungkapkan bahwa hasil penilaian yang baik akan memberikan informasi
penting yang akan mendorong pendidik untuk merancang pembelajaran yang
lebih baik. Selain itu hasil penilaian yang baik juga akan memberikan motivasi
kepada peserta didik.
Pengembangan instrumen penilaian sebagai variasi bentuk tes sangat penting.
Selain variasi tes, kualitas butir tes juga menjadi pertimbangan dalam pelaksanaan
tes. Instrumen tes yang baik merupakan tes yang dapat mengukur apa yang
hendak akan diukur oleh pendidik, yaitu untuk mengetahui tingkat penguasaan
dan pemahaman peserta didik. Guru membutuhkan cara yang efisien untuk
6
mendiagnosa letak kesalahan konsep peserta didik. Identifikasi kesalahan konsep
dapat dilakukan dengan berbagai jenis tes. Alternatif tes yang dapat mengukur
kemampuan atau kompetensi peserta didik dalam hal ini mengukur tingkat
pemahamannya adalah dengan menggunakan tes pilihan ganda beralasan. Tes
tersebut berisi soal yang memuat alasan bagi peserta didik atas jawaban dari
pertanyaan yang diberikan.
Pada tes pilihan ganda beralasan ini, peserta didik diminta memilih jawaban yang
benar kemudian mengemukakan alasan yang mendasari jawabannya tersebut. Soal
pilihan ganda yang disertai dengan alasan sebagai penjelasan atas jawaban yang
dipilih, lebih efektif dalam mengidentifikasi masalah dalam pembelajaran. Ada
dua bentuk soal tes pilihan ganda beralasan. Soal tes bentuk pertama, pilihan
ganda beralasan tertutup dengan alasan jawaban sudah disediakan pada soal. Soal
bentuk ini lebih dikenal dengan soal pilihan ganda dua tingkat. Soal tes bentuk
kedua, pilihan ganda beralasan terbuka yaitu soal yang hanya membuat tingkat
pilihan ganda yang alasan pilihan jawabnya dituliskan, sehingga peserta didik
menguraikan alasan secara langsung.
Alasan dituliskan oleh peserta didik agar tidak membatasi pemahaman yang
diterima. Apabila menjawab soal dengan benar dan disertai dengan alasan yang
tepat, maka dapat dikatakan bahwa peserta didik memiliki tingkat pemahaman
yang baik. Sebaliknya, apabila peserta didik menjawab soal dengan benar namun
alasan yang diberikan kurang tepat, maka dapat dikatakan bahwa kompetensi atau
tingkat pemahaman peserta didik kurang baik. Hal ini disesuikan dengan indikator
pencapaian kompetensi yang telah dikembangkan sebelumnya.
7
Menggunakan instrumen tes jawaban beralasan terbuka, guru dapat mengetahui
letak penguasaan materi pembelajaran yang sering terjadi kesalahan konsep
didalamnya. Selain itu, guru dapat mengetahui kategori pemahaman siswa dari
jawaban siswa dalam kategori ketidakpahaman konsep atau dari menebak. Oleh
karena itu dengan penggunaan tes jawaban beralasan terbuka ini diharapkan dapat
mengidentifikasi letak kesalahan pada konsep yang diujikan.
Berdasarkan pada fakta-fakta yang ada memang tidak menggambarkan kondisi
pelaksanaan penilaian secara keseluruhan di Indonesia, tetapi hal ini menunjukkan
bahwa terdapat sedikit permasalahan terkait dengan pelaksanaan penilaian yang
perlu diselesaikan. Salah satu masalahnya yaitu belum adanya butir-butir tes yang
dapat mengukur kemampuan kompetensi peserta didik, dan tentang sejauh mana
tingkat pemahaman mereka terhadap materi yang telah diberikan. Pengembangan
instrumen penilaian dengan politomus response atau jawaban beralasan pada mata
pelajaran matematika menjadi sangat penting untuk dilakukan. Hal ini
dikarenakan bahwa butir-butir tes dengan politomus response memiliki bukti
validitas, reliabilitas, dan parameter-parameter butir yang baik untuk mengukur
kompetensi peserta didik.
B. Rumusan Masalah
Berdasarkan latar belakang masalah di atas, maka rumusan masalah dalam
penelitian pengembangan ini adalah bagaimana hasil pengembangan instrumen
assessment for learning berbasis HOTS dengan politomus response (jawaban
beralasan) pada mata pelajaran matematika jenjang Sekolah Menengah Kejuruan?
8
C. Tujuan Penelitian
Tujuan yang ingin dicapai dalam penelitian ini adalah untuk menghasilkan
instrumen Assessment for Learning berbasis HOTS dengan politomus response
(jawaban beralasan) pada mata pelajaran matematika jenjang Sekolah Menengah
Kejuruan yang layak bagi peserta didik dan guru jenjang SMK.
D. Manfaat Penelitian
Manfaat yang ingin dicapai dalam penelitian ini, antara lain:
1. Manfaat teoritis
a. Mengembangkan khazanah keilmuan di bidang instrumen evaluasi untuk
mengukur keterampilan berpikir tingkat tinggi dengan indikator menganalisis,
mengevaluasi, dan menciptakan.
b. Sebagai sumbangsih pengembangan pendidikan dalam memberikan alternatif
penggunaan instrumen evaluasi.
2. Manfaat praktis
a. Alternatif untuk model penilaian yang digunakan dalam Ujian Sekolah
Berbasis Nasional (USBN)
b. Peserta didik dapat meningkatkan berfikir tingkat tinggi
c. Membantu guru dalam menguji soal ulangan harian berbasis HOTS.
d. Peneliti memperoleh pengalaman langsung dalam mengembangkan instrumen
evaluasi sebagai alat ukur kemampuan kognitif.
e. Sebagai bahan pertimbangan untuk penelitian lebih lanjut.
II. TINJAUAN PUSTAKA
A. Instrumen Penilaian
Instrumen merupakan suatu alat yang memenuhi persyaratan akademis sehingga
dapat dipergunakan sebagai alat untuk mengukur suatu objek ukur atau
mengumpulkan data mengenai suatu variabel. Menurut Sappaile (2007:379), suatu
instrumen dikatakan baik bila valid dan reliabel, baik validitas isi, validitas
konstruk, validitas empirik, reliabilitas konsistensi tanggapan maupun reliabilitas
konsistensi gabungan butir. Tahap pengumpulan data, instrumen sangat penting
dalam penelitian, karena instrumen merupakan alat ukur dan akan memberikan
informasi tentang apa yang kita teliti. Menurut Djajali (dalam Sappaile, 2007)
secara umum yang dimaksud dengan instrumen adalah suatu alat yang karena
memenuhi persyaratan akademis maka dapat dipergunakan sebagai alat untuk
mengukur suatu objek ukur atau mengumpulkan data mengenai suatu variabel.
Instrumen dapat dibagi menjadi dua macam, yakni tes dan non tes. Yang termasuk
tes misalnya tes prestasi belajar,tes inteligensi, tes bakat. Sedangkan yang
termasuk non tes misalnya pedoman wawancara, angket atau koesioner, lembar
observasi, daftar cocok (check list), skala sikap, skala penilaian, dan sebagainya.
Pada penelitian dan pengembangan ini produk yang dikembangkan adalah
instrumen penilaian tes. Saat melakukan penilaian di dunia pendidikan, terdapat
10
bermacam-macam alat penilaian guna menilai proses dan hasil pendidikan yang
telah dilakukan peserta didik.
Daryanto (2008:35) mengungkapkan hal yang sama yakni tes lebih bersifat resmi
dan penuh dengan batasan-batasan. Tes terdiri atas sejumlah soal yang harus
dikerjakan peserta didik dan menghadapkan peserta didik pada suatu tugas untuk
menanggapi tugas atau soal tersebut. Ditinjau dari segi kegunaan untuk mengukur
peserta didik, Arikunto (2012:33-41) membedakan atas tiga macam tes yaitu:
1. Tes diagnostik merupakan tes yang digunakan untuk mengetahui kesulitan-
kesulitan peserta didik sehingga berdasarkan hal tersebut dapat dilakukan
penanganan yang tepat. Tes ini dapat dilakukan di awal pembelajaran untuk
mengetahui pengetahuan awal peserta didik, di pertengahan proses
pembelajaran untuk menyelidiki bagian mana dari pembelajaran guru yang
tidak dapat dipahami oleh peserta didik dan bagian akhir untuk mengevaluasi
tingkat penguasaan materi terhadap bahan yang diberikan.
2. Tes formatif merupakan tes yang dilakukan di akhir program yang bertujuan
untuk mengetahui sejauh mana peserta didik telah mengikuti program tertentu.
Tes ini bisa disebut juga dengan tes diagnostik pada akhir pelajaran.
3. Tes sumatif merupakan tes yang dilaksanakan di akhir semester yang
bertujuan untuk menentukan nilai seseorang.
Tes sebagai alat ukur kemampuan peserta didik di bidang pendidikan memiliki
perbedaan yang fundamental dibandingkan alat ukur barang yang digunakan
sehari-hari. Alat ukur dalam pendidikan salah satunya tes, tidak dapat langsung
mengukur variabel yang akan diukur. Hal ini dikarenakan respons peserta didik
11
terhadap jawaban tes tidak selalu konsisten mencerminkan kecakapan atau
suasana batin seseorang oleh banyaknya faktor-faktor yang juga mempengaruhi
pencetusan tingkah yang nampak. Maka dari itu, agar sebuah tes dapat mengukur
apa yang hendak diukur, instrumen atau soal yang diberikan pada sebuah tes perlu
memenuhi komponen-komponen tolok ukur (kriteria) tertentu. Makmun
(2007:196-198) menjelaskan syarat sebuah instrumen tes yang layak sebagai
berikut:
1. Memenuhi taraf ketepatan (validity) yang memadai. Artinya, instrumen tes
dapat mengukur apa yang hendak diukur. Hal ini dapat diidentifikasi dari
kesesuaian butir-butir soal dengan ruang lingkup dan jenjang materi atau
bahan ajar serta ruang lingkup aspek tertentu.
2. Memiliki taraf kemantapan sehingga hasil pengukuran dapat dipegang atau
dipercaya (reliability).
3. Memiliki kepraktisan untuk keperluan kemudahan administrasi. Artinya tidak
diperlukan fasilitas penunjang dan bebas kesulitan bahasa.
4. Memiliki kemampuan untuk membedakan peserta didik pandai (upper group)
dan lemah (lower group). Peserta didik pandai dapat menjawab butir soal-soal
sukar dan peserta didik lemah menjawab butir-butir soal mudah.
Arikunto (2012:146) berpendapat bahwa instrumen yang baku dan standar,
lazimnya dikembangkan oleh ahli. Rosidin (2017: 135) menyatakan bahwa aspek
pendekatan empiris terhadap validitas konstruk terdiri dari dua hubungan, yaitu, a)
hubungan internal, yaitu hubungan antara item-item di dalam alat pengukur ada
atau tidak bertentangan; b) hubungan eksternal, yaitu hubungan antara skor yang
diperoleh dari alat pengukur tersebut dengan sekor dari alat pengukur lain harus
12
konsisten dengan konstruk. Namun persamaan dari keduanya yakni diperlukan
tahap pengembangan instrumen tes yang bertujuan agar instrumen benar-benar
layak dan akurat digunakan.
B. Instrumen Pilihan Ganda Beralasan
Krishnan dan Howe (dalam Suwarto, 2012:136) mengembangkan soal pilihan
ganda disertai dengan alasan sebagai bentuk penjelasan atas jawaban yang
dipilihnya. Soal pilihan ganda beralasan lebih menguntungkan dibandingkan
pilihan ganda biasa. Tuysuz (2009:627) dalam penelitiannya mengungkapkan
keuntungan dari bentuk soal ini yakni dapat mengidentifikasi dua aspek yang
berbeda sekaligus dalam satu fenomena. Awal penggunaan tes pilihan ganda
beralasan dimulai sejak tahun 80an yang bertujuan untuk mengidentifikasi
miskonsepsi peserta didik.
Tes pilihan ganda beralasan terdiri dari dua macam yaitu tes pilihan ganda
beralasan terbuka dan tes pilihan ganda beralasan tertutup. Menurut Suwarto
(2012:56) tes pilihan ganda beralasan terbuka adalah tes pilihan ganda yang
disertai alasan sehingga peserta didik harus menuliskan alasan terhadap jawaban
yang dipilihnya. Kelebihan tes pilihan ganda berlasan terbuka yaitu peserta didik
dapat leluasa mengungkapkan alasan atas jawaban yang dipilihnya.
Kelemahannya yakni dibutuhkan waktu untuk pemahaman jawaban peserta didik
yang luas.Sedangkan tes pilihan ganda tertutup adalah tes pilihan ganda yang
disertai pilihan alasan.
Chandrasegaran, dkk (2007:299) mengatakan bahwa alasan peserta didik pada
bentuk pilihan ganda beralasan tetutup telah disediakan sehingga peserta
13
didikhanya memilih jawaban dari opsi yang sudah tersedia. Jawaban benar jika
peserta didik dengan tepat memilih opsi pada tingkat pertama dan tingkat kedua.
Penilaian dilakukan berdasarkan pilihan jawaban dan alasan peserta didik pada
kedua tingkat. Kelemahan instrumen ini menurut Suwarto (2012:57) yaitu peserta
didik tidak leluasa mengungkapkan alasan pemilihan jawaban. Kelebihan
instrumen ini yakni mempermudah dalam proses penilaian. Selain itu peserta
didik memiliki peluang menebak jawaban lebih kecil dibandingkan pilihan ganda
satu tingkat.Pada penelitian ini instrumen yang dikembangkan berupa soal pilihan
ganda beralasan terbuka. Hal ini bertujuan untuk mengetahui tingkap pemahaman
dan penalaran peserta didik dalam menyelesaikan soal yang diberikan.
C. Assessment for Learning
Asesmen kadang diartikan berbeda tergantung konteks dan siapa yang
mengartikannya. Young (2005) mengatakan bahwa asesmen digunakan untuk
meningkatkan hasil belajar. Asesmen digunakan sebagai wahana untuk
memberikan balikan kepada peserta didik terhadap kesalahan yang dilakukan
selama pembelajaran. Sutanto, 2013 menyatakan assessment adalah proses untuk
mendapatkan informasi dalam bentuk apapun yang dapat digunakan untuk dasar
pengambilan keputusan tentang peserta didik, baik yang menyangkut kurikulum,
program pembelajaran, iklim sekolah maupun kebijakan-kebijakan sekolah.
Asesmen yang seperti ini dikenal sebagai Assessment for Learning (AfL).
AfL atau yang sering disebut sebagai asesmen formatif merupakan kegiatan yang
terintegratif dalam pembelajaran. Sudiyanto, dkk (2015) AfL adalah asesmen yang
dirancang untuk memberikan informasi kepada guru untuk memodifikasi kegiatan
14
pembelajarannya, membedakan dan memahami cara peserta didik melakukan
pendekatan belajar. AfL merupakan salah satu cara penilaian atau evaluasi
pembelajaran. Prinsip utama dalam pelaksanaan AfL adalah evaluasi secara
menyeluruh mulai dari perencanaan, proses hingga akhir pembelajaran.
Berdasarkan pendapat di atas, AfL adalah proses perolehan informasi dan
pemanfaatan informasi. Informasi atau keterangan diperoleh melalui kerjasama
antara guru dengan peserta diidk dan informasi tersebut dimanfaatkan oleh
mereka (guru dan peserta didik) untuk perbaikan dan peningkatan kualitas
pembelajaran berikutnya. Bagi guru, informasi digunakan untuk perbaikan dan
penyempurnaan strategi pengajaran sesuai dengan kebutuhan nyata para peserta
didiknya. Sementara bagi peserta didik, dapat digunakan sebagai dasar dalam
strategi belajar yang lebih baik.
Menurut Mansyur (2011:76), menyatakan bahwa tujuan AfL untuk:
1. Memberi wawasan pembelajaran kepada guru dan peserta didik dalam upaya
meningkatkan kesuksesan untuk semua.
2. Membantu proses penetapan tujuan.
3. Memungkinkan refleksi secara kontinu terhadap apa yang peserta didik
diketahui sekarang dan apa yang mereka butuhkan untuk diketahui
berikutnya.
4. Mengukur apa yang dinilai.
5. Menetapkan intervensi secara cepat dan tepat sesuai dengan tujuan
pembelajaran.
6. Meningkatkan standar yang diperoleh peserta didik.
15
D. Higher Order Thinking Skills
Higher Order Thinking Skills (HOTS) merupakan suatu proses berpikir peserta
didik dalam level kognitif yang lebih tinggi yang dikembangkan dari berbagai
konsep dan metode kognitif dan taksonomi pembelajaran seperti metode problem
solving, taksonomi pembelajaran, pengajaran, dan penilaian (Saputra, 2016:91).
Menurut Hidayati (2017:146) menyatakan bahwa berpikir tingkat tinggi terjadi
ketika seseorang memperoleh informasi baru dan disimpan dalam memori dan
saling berkaitan atau menata ulang atau memperluas informasi tersebut untuk
mencapai tujuan atau menemukan kemungkinan jawaban dalam kondisi yang
membingungkan.
Menurut Laily dan Wisudawati (2015:28) menyatakan bahwa HOTS adalah
proses berpikir yang mengaharuskan peserta didik untuk memanipulasi informasi
yang ada dan ide-ide dengan cara tertentu yang memberikan mereka pengertian
dan implikasi baru. Misalnya, ketika peserta didik menggabungkan fakta dan ide
dalam proses mensintesis, melakukan generalisasi, menjelaskan, melakukan
hipotesis dan analisis, hingga peserta didik sampai pada suatu kesimpulan.
Berdasarkan beberapa pendapat di atas, maka HOTS merupakan proses
keterampilan berpikir secara mendalam dan meluas yang melibatkan pengolahan
informasi secara kritis dan kreatif dalam menghadapi dan menyelesaikan masalah
yang bersifat kompleks dan melibatkan keterampilan menganalisis, mengevaluasi,
dan mencipta.
16
Menurut Uno (2012:56), soal HOTS memiliki empat indikator, yaitu:
1. Probelm solving atau proses dalam menemukan masalah serta cara
memecahkan masalah berdasarkan informasi yang nyata, sehingga dapat
ditarik kesimpulan.
2. Keterampilan pengambilan keputusan, yaitu keterampilan seseorang dalam
memecahkan masalah melalui pengumpulan informasi untuk kemudian
memilih keputusan terbaik dalam memecahkan masalah.
3. Keterampilan berpikir kritis adalah usaha untuk mencari informasi yang
akurat yang digunakan sebagaimana mesrinya pada suatu masalah.
4. Keterampilan berpikir kreatif, artinya menghasilkan banyak ide sehingga
mengahasilkan inovasi baru untuk memecahkan masalah.
Menurut Noma, dkk (2016:63) indikator HOTS mencakup aspek: (1) menganalisis
(C4), mengevaluasi (C5), dan mencipta (C6). Hidayati (2017:148), indikator
HOTS dan klasifikasi tentang kata kerja operasional yang dapat digunakan maka
dapat dibuat suatu indikator HOTS sebagaimana ditunjukan pada Tabel 2.1.
Tabel 2.1 Indikator HOTS
Aspek Indikator Alternatif KKO yang Mewakili
Berpikir Kritis
Menganalisis Memilih
Membandingkan
Mengevaluasi Memeriksa
Menilai
Berpikir Kreatif Mencipta Membuat
Menyimpulkan
Menurut Krathwohl (2002), menyatakan bahwa indikator untuk mengukur
kemampuan berpikit tingkat tinggi meliputi menganalisis (C4) yaitu kemampuan
memisahkan konsep ke dalam beberapa konsep secara utuh, mengevaluasi (C5)
yaitu kemampuan menetapkan derajat sesuatu berdasarkan norma, kriteria atau
17
patokan tertentu, dan mencipta (C6) yaitu kemampuan memadukan unsur-unsur
menjadi sesuatu yang baru yang utuh dan luas atu membuat sesuatu yang orosinil.
Berdasarkan beberapa pendapat di atas, dalam penelitian ini indikator untuk
mengukur kemapuan berpikir tingkat tinggi yang digunakan, yaitu: menganalisis
(C4), mengevaluasi (C5), dan menciptakan (C6).
E. Item Response Theory
Tes merupakan salah satu alat bantu yang sering digunakan pendidik untuk
mengukur ketercapaian kompetensi peserta didik. Terdapat beberapa model
pengukuran yang biasanya dipakai dalam melakukan analisis butir tes, baik
menggunakan teori klasik maupun item response theory (IRT). IRT atau teori
respon butir merupakan teori tentang bagaimana variabel orang dan variabel butir
menentukan data respon ketika seseorang menjawab butir tersebut (Huriaty,
2015:191). Anisa (2013:97), IRT merupakan teori pengukuran modern yang
digunakan dalam menganalisis item. IRT bertujuan untuk melihat bagaimana
respon dari peserta tes terhadap tiap butir soal yang ada dalam perangkat tes. Pada
dasarnya IRT ingin memperbaiki kelemahan yang terdapat pada teori klasik,
yakni ketergantungan ukuran ciri peserta kepada kelompok butir tes (Naga,
1992:160). Kelebihan IRT, yaitu statistik butir tidak tergantung pada kelompok,
skor tes yang diperoleh menggambarkan kemampuan individu, tidak memerlukan
tes yang pararel untuk menghitung koefisien reliabilitas dan dapat menyediakan
ukuran yang tepat untuk setiap skor kemampuan (Huriaty, 2015:191).
18
Pemilihan model yang tepat akan mengungkap keadaan yang sebenarnya dari data
tes sebagai hasil pengukuran. Salah satu bentuk tes yang familiar digunakan oleh
pendidik pada level sekolah adalah tes berbentuk pilihan berganda dengan
penskoran dikotomi. Bentuk penskoran dikotomi memiliki skor yang ekstrim
dimana jawaban yang benar diberi skor 1 dan jawaban yang salah diberi skor 0
(Demars, 2010). Kelebihan penskoran dikotomi ini adalah memberi kemudahan
bagi pendidik dalam pemeriksaan dan penskoran tes, namun kurang memberi
kesempatan bagi pendidik untuk mendiagnosis kesalahan konsep yang dilakukan
oleh peserta didik (Isgiyanto, 2011). Kelemahan ini dapat diminimalisir dengan
mengembangkan penskoran politomus. Penskoran politomus pada tes berarti
bahwa skor jawaban dikembangkan menjadi lebih dari dua kategori, bukan hanya
benar atau salah (Demars, 2010).
Model analisis IRT yang biasanya digunakan untuk menganalisis butir data
berbentuk politomus diantaranya (Retnawati, 2014:32): Nominal Respons Model
(NRM), Rating Scale Model (RSM), Partikel Credit Model (PCM), Graded
Respons Model (GRM) dan Generalized Partisan Credit Model (GPCM). Model
respon butir politomus dapat dikategorikan menjadi model respons butir nominal
dan ordinal, tergantung pada asumsi karakteristik tentang data. Model respons
butir nominal dapat diterapkan pada butir yang mempunyai alternatif jawaban
yang tidak terurut (ordered) dan adanya berbagai tingkat kemampuan yang
diukur. Pada model respons ordinal terjadi pada butir yang dapat diskor ke dalam
banyaknya kategori tertentu yang tersusun dalam jawaban. Skala likert diskor
berdasarkan pedoman penskoran kategori respons terurut, yang merupakan
penskoran ordinal. Butir-butir tes matematika dapat diskor menggunakan sistem
19
parsial kredit, langkah-langkah menuju jawaban benar dihargai sebagai penskoran
ordinal. Model penskoran yang paling sering dipakai ahli yakni GRM, PCM, dan
GPCM (Retnawati, 2014:32).
Analisis item menggunakan IRT haruslah memenuhi asumsi yang disyaratkan,
asumsi yang umum digunakan secara luas oleh model-model IRT adalah asumsi
unidimensi, local independent, dan ivarian parameter (Hambleton dkk, 1991:9).
1. Unidimensi artinya hanya ada salah satu kemampuan yang diukur dengan
satu set butir dalam tes. Asumsi ini tidak dapat secara ketat terpenuhi karena
beberapa faktor kognitif, kepribadian, dan pelaksanaan tes yang selalu
mempengaruhi kinerja tes, setidaknya sampai batas tertentu. Faktor-faktor ini
mungkin termasuk motivasi, tingkat kecemasan, kemampuan untuk bekerja
dengan cepat, kecenderungan untuk menebak bila ragu dengan jawaban dan
keterampilan kognitif di samping satu dominan yang diukur dengan butir tes.
2. Independensi lokal (local Independence) artinya ketika kemampuan
mempengaruhi kinerja agar tetap konstan, maka respons peserta ujian untuk
setiap pasangan butir independen secara statistik satu sama lain. Dengan kata
lain, setelah uji kemampuan masuk ke dalam perhitungan ada hubungan
antara respons peserta ujian untuk butir yang berbeda.
3. Invariansi parameter kemampuan adalahkarakteristik butir soal yang tidak
tergantung pada distribusi parameter kemampuan peserta tes dan parameter
ciri peserta tidak tergantung pada ciri butir soal. Hal ini berarti bahwa
kemampuan seseorang tidak akan berubah hanya karena mengerjakan tes
yang berbeda tingkat kesulitannya dan parameter butir tidak akan berubah
20
hanya karena diujikan pada kelompok peserta tes yang berbeda tingkat
kemampuannya.
Teori respon butir membangun suatu model yang menghubungkan karakteristik
butir dengan karakteristik peserta. Dengan sejumlah syarat tertentu, model
hubungan ini dibuat agar berlaku secara bebas bagi kelompok butir dan kelompok
peserta mana saja yang memenuhi syarat itu. Karakteristik butir dan karakteristik
peserta dihubungkan oleh model yang berbentuk fungsi atau lengkungan grafik.
Sejumlah syarat yang dimaksud dinyatakan dengan sejumlah parameter. Ada 3
model hubungan antara kemampuan dan parameter butir (Muraki & Bock dalam
Retnawati: 2014:40), yaitu:
1. Model 1 parameter (model Rasch), ditentukan oleh indeks tingkat kesukaran
butir (bi).
2. Model 2 parameter, ditentukan oleh indeks tingkat kesukaran butir (bi) dan
indeks daya beda butir (ai).
3. Model 3 parameter, ditentukan oleh indeks tingkat kesukaran butir (bi), indeks
daya beda butir (ai) dan tebakan semu (ci).
Berdasarkan macam-macam model penskoran dan model parameter, rumus yang
akan digunakan untuk analisis penelitian ini, yaitu model PCM. Model PCM
cocok untuk menganalisis butir tes yang memerlukan beberapa langkah
penyelesaian, hal ini termasuk soal matematika yang membutuhkan tahap
identifikasi permasalahan hingga solusi akhir. PCM merupakan model penskoran
politomus dengan pengembangan model 1-PL yang merupakan peluasan dari
model Rasch. Asumsi PCM yakni setiap butir mempunyai daya beda yang sama.
21
PCM mempunyai kemiripan dengan GRM pada butir yang diskor dalam kategori
berjenjang, namun indeks kesukaran dalam setiap langkah tidak perlu terurut,
suatu langkah dapat lebih sukar dibandingkan langkah berikutnya.
Bentuk umum PCM menurut Muraki & Bock (Retnawati:2014:37), sebagai
berikut:
��� ��� = � ∑ �� − ��������∑ � ∑ �� − ������������
Dengan :
��� ��� : probabilitas peserta berkemampuan θ memperoleh skor kategori k pada
butir j
θ : kemampuan peserta
m + 1 : banyaknya kategori butir j
bjk : indeks kesukaran kategori k butir jdan
��� − �����
���≡ 0 dan ��� − ����
�
���≡ ��� − ����
�
���
Skor kategori pada PCM menunjukkan banyaknya langkah untuk menyelesaikan
dengan benar butir tersebut. Skor kategori yang lebih tinggi menunjukkan
kemampuan yang lebih besar daripada skor kategori yang lebih rendah. Pada
PCM, jika suatu butir memiliki dua kategori, maka PCM dapat diterapkan pada
butir dikotomus dan politomus.
F. Definisi Operasional
Berikut merupakan beberapa istilah yang perlu didefinisikan secara operasional
dengan maksud agar tidak terjadi kesalahan penafsiran :
1. Instrumen perangkat untuk mengukur hasil belajar peserta didik yang
mencakup hasi belajar dalam ranah kognitif, afektif dan psikomotorik.
22
2. Assessment for Learning (AfL) adalah proses perolehan informasi dan
pemanfaatan informasi. Informasi atau keterangan diperoleh melalui
kerjasama antara guru dengan peserta didik dan informasi tersebut
dimanfaatkan oleh mereka (guru dan peserta didik) untuk perbaikan dan
peningkatan kualitas pembelajaran berikutnya. Bagi guru, informasi
digunakan untuk perbaikan dan penyempurnaan strategi pengajaran sesuai
dengan kebutuhan nyata para peserta didiknya. Sementara bagi peserta didik,
dapat digunakan sebagai dasar dalam strategi belajar yang lebih baik.
3. Higher Order Thinking Skills (HOTS) merupakan kemampuan berpikir yang
mengujikan pada tingkat yang lebih tinggi, dalam artian tidak hanya
mengujikan pada aspek ingatan atau hapalan saja, namun menguji sampai
pada aspek menganalisis (C4), mengevaluasi (C5) dan mencipta (C6).
4. Politomus Response
Politomus response adalah model respons butir yang mempunyai
kemungkinan jawaban lebih dari dua kategori jawaban (benar dan salah),
dimana biasanya ada 5 tingkatan jawaban (likert).
G. Kerangka Pikir
Kemampuan guru dalam melakukan evaluasi sekolah cenderung belum maksimal,
instrument yang digunakan belum terukur apalagi untuk intrumen butir soal
dengan tingkat HOTS sangat jarang sekali digunakan. Hal ini terjadi karena
beberapa faktor penghambat guru dalam mengembangkan soal, misalnya tidak
ada tuntutan guru harus mengembangkan soal, kopetensi guru kurang, kurang
responsifnya guru dalam mengevaluasi peserta didik dll. Padahal sangat
pentingnya instrumen tersebut dalam mengembangkan kemampuan peserta didik.
23
Prosedur dalam pengembangan instrumen AfLHOTS diawali dengan analisis
materi, dikembangkan KD dalam materi. KD yang sudah ditentukan dibuat IPK
(indikator pencapaian kompetensi), kemudian membuat kisi-kisi instrumen AfL
HOTS, menyusun dan menulis butir soal AfL HOTS (kriteria penilaian, kunci
jawaban dan telaah butir soal oleh validator) berdasarkan kisi-kisi yang akan
divalidasi ahli, melakukan uji coba, analisis instrumen, memperbaiki,
melaksanakan penelitian (melakukan tes intrumen), dan menginterpretasi hasil tes.
Butir soal kemudian dianalisis menurut validitas isi, validitas konstruk,
reliabilitas, tingkat kesukaran, karakteristik butir tes uji coba dan kemampuan
HOTS matematika. Butir soal yang memenuhi keenam kriteria tersebut disebut
dengan soal dengan kriteria baik. Butir soal yang hanya memenuhi beberapa
kriteria disebut soal kurang baik dan butir soal yang tidak memenuhi kriteria
disebut soal yang tidak baik maka harus digantikan dengan soal yang baru. Butir
soal yang sudah terukur baik inilah yang siap digunakan untuk evaluasi.
Prosedur dalam pembuatan instrumen AfL HOTS ini bertujuan mengukur
pencapaian peserta didik dalam suatu set materi dan ketercapaian dalam
kemampuan yang terukur. Berikut mekanisme pengembangan instrument AfL
HOTS sesuai Gambar 2.1.
24
Gambar 2.1. Mekanisme Pengembangan Instrumen AfL
HOTS
Daya Beda
Butir
Nilai fungsi
informasi
Kemahiran
(Trait)
Kecocokan
Butir
Menyusun Kisi-kisi Menyusun Kisi-kisi Instrumen
AfL HOTS
Validitas
Ahli
Uji coba &
Penelitian
Analisis
Analisis Materi berdasarkan KD, Merumuskan
Indikator Pencapaian Kompetensi
Soal kriteria baik
masuk bank soal
Soal tidak baik diganti
dengan yang baru Soal kurang baik direvisi
Menyusun Spesifikasi Butir Soal Berdasarkan Kisi-
kisi
III. METODE PENELITIAN
A. Jenis Penelitian
Jenis penelitian ini adalah penelitian dan pengembangan (Research and
Development) yang mengacu pada prosedur pengembangan pendidikan umum
dari Plomp (1997), yang terdiri dari lima tahap yaitu: 1) tahap investigasi awal, 2)
tahap desain, 3) tahap realisasi/konstruksi, 4) tahap tes, evaluasi dan revisi, dan 5)
tahap implementasi. Penelitian dan pengembangan ini produk yang dikembangkan
adalah Instrumen Assessment for Learning berbasis HOTS dengan Politomus
Response Jenjang Sekolah Menengah Kejuruan (SMK).
B. Tempat, Waktu dan Subjek Penelitian
Penelitian ini akan dilaksanakan di tiga Sekolah Menengah Kejuruan yang ada di
Kecamatan Bandar Sribhawono Kabupaten Lampung Timur, diantaranya SMK
Praja Utama Bandar Sribhawono, SMK Mitra Bhakti Bandar Sribhawono dan
SMK Mandiri Bandar Sribhawono pada Semester Genap Tahun Ajaran
2018/2019. Subjek dalam penelitian ini dibagi dalam beberapa tahap berikut:
1. Subjek Investigasi Awal
Pada investigasi awal dilakukan beberapa langkah sebagai analisis kebutuhan,
yaitu observasi, dan wawancara. Subjek pada observasi adalah peserta didik kelas
XI dari SMK Praja Utama Bandar Sribhawono, SMK Mitra Bhakti Bandar
Sribhawono, dan SMK Mandiri Bandar Sribhawono. Subjek saat wawancara
26
adalah satu orang guru yang mengajar matematika di SMK Praja Utama Bandar
Sribhawono, SMK Mitra Bhakti Bandar Sribhawono, dan SMK Mandiri Bandar
Sribhawono.
2. Subjek Uji Coba Produk
Subjek pada tahap ini adalah peserta didik kelas XI yang sudah pernah
mendapatkan materi yang akan diujikan yang berjumlah 252 peerta didik, yaitu
peserta didik dari SMK Kosgoro Bandar Sribhawono, SMK Budi Utomo Bandar
Sribhawono, dan SMK Taruna Bandar Sribhawono.
3. Subjek Uji Coba Lapangan
Subjek uji instrumen ini dilakukan di kelas XI pada tiga Sekolah Menengah
Kejuruan, yaitu SMK Praja Utama Bandar Sribhawono, SMK Mitra Bhakti
Bandar Sribhawono, dan SMK Mandiri Bandar Sribhawono dengan total 402
peserta didik dengan populasi peserta didik SMK Se-Lampung Timur. Data
selengkapnya dapat dilihat pada Tabel 3.1.
Tabel 3.1. Subjek Uji Coba Penelitian Sekolah Kelas Sampel Penelitian
SMK Mitra Bhakti
XI AK 13
XI P1 23
XI P2 29
SMK Praja Utama
XI TKR1 40
XI TKR2 39
XI AK1 43
XI AK2 38
XI P1 41
XI P2 40
XI AP 40
SMK Mandiri XI TKJ 31
XI AK 32
Jumlah 402
Pengambilan sampel uji coba dilakukan dengan teknik non probability sampling
yaitu accidental sampling. Non probability sampling setiap unsur tidak memiliki
27
kesempatan atau peluang yang sama untuk dipilih sabagai sampel. Pemilihan unit
sampling didasarkan pada pertimbangan atau penilaian subjektif dan tidak
menggunakan teori probabilitas. Teknik ini, sampel paling sedikit harus empat
atau lima kali dari jumlah item pertanyaan.
Penarikan jumlah ukuran sampel, apabila populasinya tidak diketahui secara pasti
jumlahnya (accidental sampling) maka digunakan teknik atau rumus sesuai
dengan teori Malhotra (2006:291). Accidental sampling merupakan prosedur
sampling yang memilih sampel orang atau unit yang paling mudah dijumpai atau
diakses.
C. Prosedur Pengembangan
Ada lima tahapan dari model pengembangan yang dikemukakan oleh Plomp
(1997), langkah-langkah pengembangan produk dijelaskan sebagai berikut:
1. Tahap Investigasi Awal
Kegiatan yang dilakukan pada tahap investigasi awal adalah menghimpun
informasi permasalahan evaluasi belajar matematika terdahulu, mengidentifikasi
dan mengkaji teori-teori yang melandasi penelitian. Tahap ini juga dilakukan
kajian secara teoritis tentang kurikulum mata pelajaran matematika SMK,
meliputi analisis materi berdasarkan Kompetensi Dasar yang telah dipilih,
merumuskan indikator pencapaian kompetensi dan kisi-kisi butir soal.
2. Tahap Design
Berdasarkan investigasi awal, dilakukan suatu upaya mengembangkan suatu
produk yakni instrumen Assessment for Learning berbasis HOTS dengan
politomus response. Pada tahap ini dilakukan perancangan instrumen, yaitu
28
merumuskan tujuan tes, merumuskan materi matematika, dan menyusun kisi-kisi
butir soal.
a. Merumuskan Materi
Perumusan materi dilakukan dengan memperhatikan beberapa bab dan sub bab
materi kelas yang termasuk dalam materi pembelajaran pada satu semester. Materi
sesuai pada Kompetensi Inti (KI) dan Kompetensi Dasar (KD) dalam
Permendikbud No. 70 Tahun 2013 tentang Kerangka Dasar dan Struktur
Kurikulum Sekolah Menengah Kejuruan/Madrasah Aliyah Kejuruan dan
disesuaikan dengan Keputusan Direktur Jendral Pendidikan Dasar dan Menengah
No. 130/D/KEP/KR/2017 tentang Struktur Kurikulum Pendidikan Menegah
Kejuruan. Materi tes yang digunakan terletak pada Kompetensi Dasar:
1. Menyelesaikan masalah yang berkaitan dengan perbandingan trigonometri
pada segitiga siku-siku (4.8)
2. Menyelesaikan masalah yang berkaitan dengan aturan sinus dan kosinus.
(4.12)
3. Menyelesaikan nilai nilai sudut dengan rumus jumlah dan selisih dua sudut
(4.14)
4. Menyajikan penyelesaian masalah kontekstual berkaitan dengan kaidah
pencacahan, permutasi dan kombinasi (4.25)
5. Menyelesaikan masalah yang berkaitan dengan peluang kejadian (4.26)
b. Menyusun Kisi-kisi Penulisan Soal
Penyusunan kisi-kisi tes berdasarkan pada materi yang telah dirumuskan
sebelumnya. Kisi-kisi penulisan soal berisi Kompetensi Inti, Kompetensi Dasar,
Indikator Pencapaian Kompetensi, Materi, Indikator Soal dan Nomor Soal.
Selanjutnya pada masing-masing indikator pencapaian kompetensi berisi minimal
satu butir soal. Indikator pencapaian kompetensi dikembangkan menjadi beberapa
indikator soal. Indikator soal berisi tujuan dan kriteria soal tes untuk digunakan
oleh peneliti sebagai panduan dalam menyusun spesifikasi butir soal. Kisi-kisi tes
29
diperlukan agar penulisan butir soal sesuai dengan kompetensi dasar yang
diharapkan.
c. Menyusun Spesifikasi Butir Soal
Kisi-kisi yang telah disusun kemudian digunakan sebagai panduan dalam
menyusun butir soal. Spesifikasi butir soal secara garis besar berisi Standar
Kompetensi Lulusan (SKL), indikator pencapaian kompetensi, ruang lingkup
materi dan contoh butir soal. Spesifikasi butir soal disusun untuk beberapa butir
soal dengan ketentuan tercakup dalam indikator SKL dan materi yang sama.
Selanjutnya spesifikasi butir soal digunakan oleh guru mata pelajaran yang
dikenakan sebagai penulis soal dalam penelitian. Penulisan soal dilakukan untuk
mengetahui kesesuaian antara spesifikasi dan butir soal yang dihasilkan.
3. Tahap realisasi/konstruksi
Pada tahap ini, solusi yang telah didesain direalisasikan untuk bisa menghasilkan
suatu prototipe awal. Prototipe yang dihasilkan masih berupa prototipe awal yang
berupa instrumen evaluasi. Konstruksi prototipe berawal dari penulisan butir soal
yang selanjutnya perlu dilakukan penelaahan butir soal.
a. Penulisan butir soal
Penulisan butir soal berpedoman pada spesifikasi butir soal yang telah disusun
agar butir soal yang dihasilkan sesuai dengan kompetensi dasar yang diharapkan.
Jumlah butir soal yang kembangkan sebanyak 10 butir.
b. Menelaah butir soal
Penelaahan butir soal tidak terlepas dari kisi-kisi dan spesifikasi butir soal yang
telah dibuat. Contoh butir soal yang telah dihasilkan dari spesifikasi butir soal
selanjutnya dirakit menjadi lembar penilaian instrumen tes. Berdasarkan lembar
30
instrumen penilaian yang dihasilkan selanjutnya dilakukan telaah oleh guru mata
pelajaran dan dosen ahli. Validator diminta untuk memberikan penilaian
kesesuaian antara indikator dengan butir soal. Telaah dimaksudkan untuk
memudahkan dalam memperoleh informasi terkait butir soal yang telah memenuhi
kriteria atau belum memenuhi kriteria aspek telaah. Mempertimbangkan
keefektifan waktu maka penilaian lembar instrumen dilakukan secara terpisah
oleh masing-masing telaah. Hasil telaah digunakan untuk memperbaiki contoh
butir soal.
Lembar penilaian dirancang tiap butir untuk memudahkan validator dalam
mencermati kedalaman isi butir soal terhadap indikator yang disajikan dan
ketetapan pilihan jawaban yang diberikan. Butir yang sesuai dengan indikator soal
diberi nilai 1 dan butir yang tidak sesuai diberi nilai 2. Jika validator memberi
penilaian tidak sesuai maka diberi tanda check list pada kolom “lemah” dan
memberi saran perbaikan pada butir soal. Jika validator memberi penilaian
“sesuai” maka beri tanda check list pada kolom “kuat”, selanjutnya dihitung
menggunakan Indeks Gregoryuntuk mengetahui validitas isi tes.
4. Tahap tes, evaluasi, dan revisi
Pada tahap ini instrumen AfL berbasis HOTS yang berhasil direalisasikan dilihat
kualitasnya. Hal-hal yang dilakukan adalah menguji validitas instrumen yang
masih berupa prototipe 1 oleh validator. Validasi dilakukan oleh dua orang, yaitu
ahli materi dan ahli media. Berdasarkan hasil uji validasi ini kemudian dilakukan
revisi hingga diperoleh perangkat instrumen AfL berbasis HOTS dalam bentuk
31
prototipe i yang valid untuk kemudian dilakukan uji coba produk untuk
mengetahui validitas konstruks, reliabilitas, dan tingkat kesukarannya.
Pada tahap ini tes dapat berupa uji coba produk, yakni butir soal yang telah dirakit
terlebih dahulu dilakukan uji coba. Uji coba diberikan kepada kelas yang sudah
mendapatkan materi. Sekolah sasaran ini di SMK se-Lampung Timur yang dalam
hal ini diwakili oleh salah satu sekolahan yang tidak termasuk dalam sasaran uji
penelitian. Setelah uji coba penelitian selanjutnya dilakukan pengumpulan lembar
jawaban peserta didik untuk dianalisis secara kuantitatif menggunakan Winsteps.
5. Tahap implementasi
Setelah dilakukan evaluasi dan diperoleh produk yang valid dan dinyatakan
layak, maka produk dapat diimplementasikan pada situasi yang sesungguhnya.
Tahap ini termasuk dalam uji coba lapangan, setelah dilakukan perbaikan butir
soal berdasarkan hasil analisis dari uji coba produk. Uji coba lapangan ini
dilakukan untuk mengukur kemampuan HOTS matematka peserta didik dengan
instrumen AfL berbasis HOTS dengan Politomus Response yang telah
dikembangkan. Setelah uji coba lapangan selesai selanjutnya dilakukan
pengumpulan lembar jawaban peserta didik untuk dianalisis secara kuantitatif
menggunakan Winsteps.
D. Teknik dan Instrumen Pengumpulan Data
1. Teknik pengumpulan data
Teknik pengumpulan data yang digunakan dalam penelitian pengembangan ini
adalah teknik dokumentasi. Menurut Sukmadinata (2012: 221) “Teknik
dokumentasi merupakan suatu teknik pengumpulan data dengan menghimpun dan
32
menganalisis dokumen-dokumen, baik dokumen tertulis, gambar maupun
elektronik”. Teknik dokumentasi yang digunakan untuk mendapatkan data berupa:
lembar Soal Evaluasi, (b) lembar kunci jawaban soal, dan (c) lembar jawaban
siswa. Butir soal yang telah disusun akan dianalisis secara kualitatif dan diujikan
kepada peserta didik. Selanjutnya dilakukan tahap analisis secara kuantitatif.
Berdasarkan hasil analisis tersebut diperoleh butir baik sehingga produk akhir
yang dihasilkan berupa instrumen Assessment for Learning berbasis HOTS untuk
mata pelajaran matematika.
2. Instrumen pengumpulan data
Instrumen pengumpulan data yang digunakan pada penelitian pengembangan ini
meliputi:
a. Kisi-kisi instrumen assessmen for learning berbasis HOTS.
Kisi-kisi instrumen yang digunakan sebagai acuan peneliti untuk menyusun
spesifikasi butir soal.
b. Instrumen assessment for learning berbasis HOTS berbentuk pilihan ganda
beralasan untuk mengukur kemampuan peserta didik.
c. Lembar penilaian instrumen tes untuk mengetahui validitas isi instrumen.
Lembar telaah berisi kriteria yang perlu dinilai terdiri dari kompetensi dasar,
indikator, dan soal mengacu pada spesifikasi butir soal.
d. Lembar telaah tes secara teoritis berdasarkan aspek isi, aspek konstruksi, dan
aspek bahasa untuk mengetahui butir yang telah memenuhi kriteria aspek
telaah.
e. Lembar jawaban peserta didik yang digunakan untuk memperoleh informasi
terkait respons peserta didik.
33
Untuk dapat digunakan suatu tes tersebut perlu dilengkapi dengan pedoman
penskoran. Pedoman penskoran dibentuk untuk menjaga objektivitas penilaian
dan kepastian yang diperoleh peserta didik. Penskoran ini dirancang dalam skala
politomus 1 sampai 4 dengan kriteria skor pada Tabel 3.2.
Tabel 3.2. Kriteria Penskoran Jawaban
Kriteria Jawaban Alasan Skor
1. Jika peserta didik salah dalam menjawab pertanyaan soal
(S) dan salah dalam memberikan alasan (S). S S 1
2. Jika peserta didik salah dalam menjawab pertanyaan soal
(S) namun benar dalam memberikan alasan (B). S B 2
3. Jika peserta didik benar dalam menjawab pertanyaan soal
(B) namun salah dalam memberikan alasan (S). B S 3
4. Jika peserta didik benar dalam menjawab pertanyaan soal
(B) dan benar dalam memberikan alasan (B). B B 4
Penskoran tersebut mengacu pada penentuan skor politomus model Partial Credit
Model dimana jawaban dan opsi memiliki keterkaitan (Retnawati, 2014: 149).
E. Teknik Analisis Data
Teknik analisis data yang digunakan dalam penelitian pengembangan ini adalah
validitas isi, validitas konstruk, reliabilitas, tingkat kesukaran, karakteristik butir
tes uji coba dan kemampuan HOTS matematika.
1. Validitas Isi
Validitas isi ditentukan menggunakan kesepakatan ahli (expert). Kesepakatan ahli
bidang studi atau sering disebut domain yang diukur menentukan tingkatan
validitas isi. Hal ini dikarenakan instrumen pengukuran dibuktikan valid jika ahli
meyakini bahwa instrumen tersebut mengukur penguasaan kemampuan yang
didefinisikan dalam domain ataupun konstruk psikologi yang diukur (Retnawati,
2014: 7). Validator diminta untuk memeriksa ketepatan dan memberikan penilaian
antara kesesuaian butir soal dengan indikator-indikatornya, redaksi penulisan soal,
34
dan kesesuaian pilihan jawaban (pengecoh) pada pilihan ganda. Apabila masih
ada kekeliruan dalam pembuatan instrumen, maka instrumen tersebut direvisi
kembali. Setelah dilakukan pemeriksaan oleh ahli, dalam hal ini sebagai validator,
selanjutnya ahli memberikan penilaian terhadap instrumen. Penilaian tersebut
dapat dilihat pada Tabel 3.3.
Tabel 3.3 Kriteria Penilaian Butir Instrumen Oleh Ahli/Expert
Nilai Keterangan
1 Tidak relevan
2 Cukup relevan
3 Relevan
4 Sangat Relevan
(Arifin dan Retnawati, 2017:101)
Setelah diberikan penilaian oleh ahli, selanjutnya menghitung hasil penilaian
menggunakan indeks validitas. Diantaranya dengan indeks yang diusulkan oleh
Gregory (Retnawati, 2014: 32-33), sebagai berikut:
Tabel 3.4. Tabel Kontingensi untuk Menghitung Indeks Gregory
Rater 1
Lemah Kuat
Rater 2 Lemah A B
Kuat C D
Koefisien validitas isi = �
�������
Keterangan:
V = Validitas
A = Penilai I dan II menyatakan lemah
B = Penilai I menyatakan kuat, penilai II menyatakan lemah
C = Penilai I lemah, penilai II menyatakan kuat
D = Penilai I dan II menyatakan kuat
Rentang angka V yang mungkin diperoleh adalah antara 0 sampai dengan 1.
Semakin tinggi angka V (mendekati 1 atau sama dengan 1) maka nilai valid
sebuah item/butir soal juga semakin tinggi, dan semakin rendah angka V
(mengekati 0 atau sama dengan 0) maka nilai kevalidan sebuah item/butir soal
juga semakin rendah. Berdasarkan hasil perhitungan diperoleh rata-rata index
35
Gregory menunjukkan angka 1 yang berarti bahwa instrumen terukur valid
berdasarkan validator. Hasil perhitungan dapat dilihat pada Lampiran 5 Halaman
102.
2. Validitas Konstruk
Untuk membuktikan validitas konstruk dapat dilakukan dengan dua cara, yakni
analisis faktor eksplanatori dan analisis faktor konfirmatori. Pembuktian validitas
konstruk yang digunakan menggunakan analisis faktor eksplanatori. Sebelum
melakukan analisis faktor eksplanatori terlebih dahulu dilakukan uji kecukupan
sampel dengan melihat nilai Kaiser Mayer Olkin (KMO). Nilai KMO diperoleh
melalui analisis dengan bantuan software IBM SPSS 20. Jika nilai KMO lebih dari
0,5 maka variabel dan sampel yang digunakan memungkinkan untuk dilakukan
analisis lebih lanjut (Retnawati, 2014:47). Berdasarkan hasil perhitungan
diperoleh nilai KMO menunjukkan nilai 0,904 > 0,5 ini dapat diartikan bahwa
butir soal sangat baik untuk digunakan. Hasil perhitungan KMO dapat dilihat pada
Lampiran 6 Halaman 103.
Tahap selanjutnya adalah melihat nilai eigen dan screplot dari hasil analisis faktor
eksplanatori, Untuk melihat faktor-faktor yang terbentuk maka yang diperhatikan
adalah nilai eigen yang lebih besar dari 1. Dari faktor yang terbentuk maka dapat
diketahui persentase variansi yang dapat dijelaskan. Jika persentase varians
comulative lebih besar dari 20% atau perbandingan nilai eigen pertama dengan
kedua sebesar 5 atau 4 maka instrumen yang diukur memuat dimensi tunggal atau
bersifat unidimensi (Wells dkk, 2008). Berdasarkan hasil perhitungan diperoleh
nilai eigen yang disajikan pada Tabel 3.5.
36
Tabel 3.5 Total Variance Explained
Total Variance Explained
Component Initial Eigenvalues
Total % of
Variance
Cumulative
%
1 2,127 21,272 21,272
2 1,118 11,181 32,452
3 1,072 10,722 43,174
4 1,009 10,086 53,260
5 ,963 9,631 62,891
6 ,885 8,849 71,740
7 ,859 8,587 80,327
8 ,707 7,066 87,392
9 ,662 6,619 94,011
10 ,599 5,989 100,000
Extraction Method: Principal Component Analysis.
Berdasarkan Tabel 3.5 semua presentase Comulative nilai Eigen > 20 % artinya
instrumen AfL dalam penelitian ini mengukur pada satu faktor atau dimensi. Hasil
perhitungan dapat dilihat pada Lampiran 6 Halaman 103.
3. Estimasi Reliabilitas Instrumen
Teknik analisis data untuk estimasi reliabilitas instrumen ini menggunakan teknik
estimasi konsistensi internal dengan formula Chronbach-alpha yang dibantu
aplikasi IBMSPSS. Jika nilai Chronbach’s Alpha 0,60 dan kurang dari 1, maka
nilai instrumen tersebut memiliki korelasi tinggi atau reliabel, sedangkan jika nilai
Cronbach’s Alpha di bawah 0,50 ke bawah, maka instrumen tersebut berkorelasi
rendah atau tidak reliabel (Basuki dan Hariyanto, 2014:105). Hal ini juga
didukung oleh Surapranata (2009:114), bahwa koefisien reliabilitas sebesar 0,5
dapat digunakan untuk tujuan penelitian. Dalam penelitian ini nilai Chronbach’s
Alpha yang diharapkan adalah 0,60 dan kurang dari 1 yang dibantu dengan
program Winstep. Berdasarkan hasil perhitungan diperoleh bahwa Cronbach’s
Alpha menunjikkan 0,577 > 0,5 ini berarti bahwa instrumen memiliki korelasi
37
tinggi atau reliabel. Hasil perhitungan reliabilitas dapat dilihat pada Lampiran 7
Halaman 104.
4. Tingkat Kesukaran Butir Soal
Tingkat kesukaran digunakan untuk mengetahui kesulitan butir soal dilihat dari
nilai logit tiap butir soal yang dapat dilihat pada kolom measure. Nilai logit yang
tinggi menunjukan tingkat kesulitan soal yang paling tinggi. Pengkategorian
tersebut menggunakan kriteria sebagaimana diberikan pada Tabel 3.5.
Tabel 3.6. Kategori Tingkat Kesukaran
Measure Kategori
>1 Sangat sulit
0 - 1 Sulit
-1 - 0 Mudah
<-1 Sangat mudah
(Sumintono, 2015:70)
Kriteria soal yang digunakan dalam penelitian ini adalah soal yang memiliki nilai
tingkat kesukaran ≥ −1 atau kategori mudah, sulit dan sangat sulit. Berdasarkan
hasil perhitungan diperoleh tingkat kesukaran uji coba instrumen yang disajikan
pada Tabel. 3.7.
Tabel 3.7 Tingkat Kesukaran Butir Soal
Butir Soal Total Skor Tingkat Kesulitan Ketrangan
9 552 0,30 Item Sulit
4 578 0,08 Item Sulit
7 582 0,04 Item Sulit
10 583 0,04 Item Sulit
1 586 0,01 Item Sulit
3 586 0,01 Item Sulit
2 597 -0,08 Item Mudah
6 597 -0,08 Item Mudah
5 600 -0,01 Item Mudah
8 613 -0,21 Item Mudah
Dengan melihat hasil perhitungan tingkat kesukaran butir soal yang diperoleh
maka instrumen AfL berbasis HOTS telah memenuhi kriteria tingkat kesukaran
38
soal yang diharapkan. Hasil perhitungan tingkat kesukaran soal dapat dilihat pada
Lampiran 9 Halaman 106.
5. Analisis Karakteristik Butir Tes Uji Coba
Analisis data dimulai dengan mendeskripsikan kelayakan karakteristik tes objektif
pilihan ganda tingkat SMK menggunakan item respon teori dengan bantuan
Program Winsteps. Program Winsteps digunakan karena memiliki beberapa
keunggulan (Bambang dan Pujiyati, 2011:2), yaitu:
a. Dapat menganalisis data berupa dikotomus dan politomus.
b. Tersedianya hasil analisis teori modern didasarkan pada model maksimum
likelihood menggunakan model logistik satu parameter.
Analisis menggunakan IRT dapat dilakukan dengan menguji asumsi unidimensi
melalui analisis kesesuaian (fit) atau analisis faktor eksplanatori. Butir tes
dilakukan unidimensi jika butir tersebut mengukur satu kemampuan. Jika asumsi
unidimensi telah terpenuhi, maka secara otomatis asumsi independiensi lokal juga
telah terpenuhi. Indikasi bahwa butir tes bersifat unidimensi adalah data
cocok/sesuai (fit) dengan model. Untuk mengetahui apakah model yang
digunakan sesuai butir maka dapat digunakan statistic Infit mean-Squere (IMS)
dan Outfit Mean-Square (OMS).
Statistic IMS dan OMS merupakan tingkat kesesuaian antara data observasi dan
nilai prediksi oleh model. Butir tes dikatakan fit model jika memiliki nilai IMS
dan OMS berkisar dari 0,5 sampai 1,5 (Linacre, 2002). Rentang nilai tersebut
sesuai dengan Tabel 3.8.
39
Tabel 3.8 Rentang Nilai IMS dan OMS
Nilai Implikasi bagi pengukuran
>2,0 Merusak sistem pengukuran
1,5 – 2,0 Tidak mempunyai makna bagi pengukuran
0,5 – 1,5 Bermanfaat bagi pengukuran
< 0,5 Tidak bermanfaat bagi pengukuran, tetapi tidak merusak
Analisis IRT juga menghasilkan informasi mengenai hasil pengukuran. Fungsi
informasi digunakan untuk mengukur seberapa besar kemampuan butir
memberikan informasi kepada responden. Informasi pengukuran ini berdasar pada
hubungan antara tes dengan individu (Sumintono & Widhiarso, 2015).
Berdasarkan hasil perhitungan diperoleh nilai maksimum fungsi informasi dari
butir soal adalah 4, 875 ini berarti butir soal mempunyai fungsi informasi yang
cukup untuk instrumen penilaian. Hasil perhitungan dapat dilihat pada Lampiran
10 Halaman 108.
6. Kemampuan HOTS Matematika Peserta Didik
Setelah diperoleh hasil soal tes yang valid dan reliabel, maka soal tes tersebut
akan diujikan kepada subjek penelitian. Skor total tiap peserta didik diperleh
dengan cara yaitu menjumlah skor setiap nomor soal peserta didik. Persentase
pencapaian hasil belajar peserta didik diperoleh dengan rumus (Wulan,dkk, 2017):
Nilai = ∑ �� � ���� ����� ���
�� � ��������× 100
Adapun kategori hasil belajar ranah kognitif peserta didik dapat disajikan pada
Tabel 3.9.
Tabel 3.9. Kategori HOTS Peserta didik
Nilai Kategori
81 – 100 Sangat Baik
61 - 80 Baik
41 – 60 Cukup
21 - 40 Kurang
0 - 20 Sangat Kurang
40
Hasil perihitungan presentase pencapean hasil belajar disajikan pada Tabel 3.10,
Gambar 3.1 dan peritungan lengkapnya bisa dilihat pada Lampiran 11 Halaman
109.
Tabel 3.10 Jumlah Siswa dalam Pencapaian HOTS pada AfL
Kategori Jumlah Siswa
Sangat Baik 3
Baik 153
Cukup 241
Kurang 5
Sangat Kurang 0
Jumlah 402
Gambar 3.1. Presentase Pecapaian HOTS pada AfL
SANGAT
BAIK
1%
BAIK
38%
CUKUP
60%
KURANG
1%
V. KESIMPULAN DAN SARAN
A. Kesimpulan
Berdasarkan pembahasan dan tujuan penelitian pengembangan yang dilakukan
dapat disimpulkan bahwa :
1. Keseluruhan butir soal assessment for learning berbasis HOTS dengan
politomus response yang telah dikembangkan memenuhi asumsi dari model
PCM, yaitu unidimensi, indenpendensi local dan inverensi parameter
kemampuan.
2. Keseluruhan butir soal assessment for learning berbasis HOTS dengan
politomus response yang telah dikembangkan valid berdasarkan validasi isi
dan konstruk.
3. Keseluruhan butir soal assessment for learning berbasis HOTS dengan
politomus response yang telah dikembangkan reliabel atau handal
4. Keseluruhan butir soal assessment for learning berbasis HOTS dengan
politomus response yang telah dikembangkan memiliki rata-rata tingkat
kesukaran sedang
5. Instrumen butir soal assessment for learning berbasis HOTS dengan
politomus response pada mata pelajaran matematika jenjang SMK memiliki
kemampuan informasi yang cukup.
64
6. Instrumen butir soal assessment for learning berbasis HOTS dengan
politomus response pada mata pelajaran matematika jenjang SMK memiliki
kemampuan untuk mengukur pencapaian HOTS peserta didik.
7. Instrumen butir soal assessment for learning berbasis HOTS dengan
politomus response pada mata pelajaran matematika jenjang SMK memiliki
kemampuan untuk menganalis respon jawaban peserta didik dengan baik.
B. Saran
Berdasarkan kesimpulan dikemukakan saran sebagai berikut:
1. Bagi guru yang akan mengukur kemampuan HOTS peserta didik dalam mata
pelajaran matematika khususnya pada kompetensi dasar yang digunakan pada
penelitian ini dapat menggunakan instrumen yang dikembangkan ini karena
sudah teruji karakteristiknya.
2. Bagi peneliti lain yang akan mengembangkan lebih luas agar memperdalam
kembali pemanfaatan dari pengembangan instrumen yang dikembangkan ini.
DAFTAR PUSTAKA
Abdullah, L.H. 2013. Sistem Penilaian dalam Kurikulum 2013.
(http://www.academic.edu/5253890/sistem_penilaian_dalam_kurikulum_
2013_kajian_dokumen).
Anisa. 2013. Perbandingan Penskoran Dikotomi dan Politomi dalam Teori
Respon Butir untuk Pengembangan Bank Soal Mata Kuliah Matematika
Dasar. Jurnal Matematika, Statistika dan Komputasi. Vol. 9 No. 2 Hal:
95-113.
Arifin, Zainal dan Retnawati, Heri. 2017. Pengembangan Instrumen Pengukur
Higher Order Thinking Skills Matematika Siswa SMA Kelas X. Jurnal
Pendidikan Matematika. Vol. 12. No. 1. Hal:98-108.
Arikunto, S. 2012.Dasar-Dasar Evaluasi Pendidikan Edisi Revisi. Jakarta: Bumi
Aksara.
Bambang, Subali dan Pujiyati, Suyata. 2011. Panduan Analisis Data Pengukuran
Pendidikan untuk Memperoleh Bukti Empirik Kesahihan menggunakan
Program Quest. Yogyakarta: Lembaga Penelitian dan pengabdian pada
Masyarakat Universitas Negeri Yogyakarta.
Basuki, I. & Hariyanto. 2014. Asesmen pembelajaran. Bandung : PT. Remaja
Rosdakarya.
Chandrasegaran, A.L, Treagust, D, dan Mocerino, M. 2007. The Development of
A Two-Tier Multiple-Choice Diagnostic Instrument for
EvaluatingSecondary School Students’ Ability to Describe And Explain
Chemical Reactions Using Multiple Levels Of Representation.[Online].
Chemistry Education Research and PracticeVol. 8 No. 3 Hal: 293-307.
Cheng, Y. C. 2005. New Paradigma for Re-engineering Education, Globalization,
Localization and Induvidualization. Netherland: Spinger.
Daryanto. 2008. Evaluasi Pendidikan. Jakarta: Rineka Cipta.
Demars, C.E. 2010. Item Response Theory. New York: Oxford University Press.
66
Hambleton, R.K., Swaminahan, H., dan Rogers, H.J. 1991. Fundamental of Item
Response Theory. Newbury, CA: Sage Publication Inc.
Hidayati, Arini Ulfah. 2017. Melatih Keterampilan Tingkat Tinggi dalam
Pembelajaran Matematika pada Siswa Sekolah Dasar. [Online]. Jurnal
Pendidikan dan Pembelajaran Dasar. Vol 4 No. 2 Hal:143-156.
Huriaty, Dina. 2015. Metode Kalibrasi dan Desain Tes Berdasarka Teori Respons
Butir (IRT). Jurnal Pendidikan Matematika. Vol. 1. No. 3. Hal: 191-199.
Isgiyanto, Awal. 2011. Diagnosis kesalahan Siswa Berbasis Penskoran Politimus
Model Partial Credit pada Matematika. [Online]. Jurnal Penelitian dan
Evaluasi Pendidikan. Vol. 2. No. 2. Hal: 308-325.
Kemendikbud. 2013. Permendikbud Nomor 70 Tahun 2013 TentangKerangka
Dasar dan Struktur Kurikulum Sekolah Menengah Kejuruan/Madrasah
Aliyah Kejuruan. Jakarta: Kementrian Pendidikan dan Kebudayaan RI.
. 2014. Permendikbud Nomor 60 Tahun 2014 Tentang Kurikulum
2013 Sekolah Menegah Kejuruan/Madrasah Aliyah Kejuruan. Jakarta:
Kementrian Pendidikan dan Kebudayaan RI.
. 2014. Permendikbud Nomor 104 Tahun 2014 Tentang Pendidik
Pada Pendidikan Dasar dan Pendidikan Menengah. Jakarta: Kementrian
Pendidikan dan Kebudayaan RI.
Krathwohl, D.R. 2002. A Revision of Bloom’s Taxonomy: An Overview. Theory
Into Practice. Vol. 41. No. 2. Hal: 212-218.
Laily, Nur Rochman dan Wisudawatim Widi Asih. 2015. Analisis Soal Tipe
Higher Order Thinking Skill (HOTS) dalam Soal UN Kimia SMA Rayon
B Tahun 2012/2013. [Online]. Kaunia. Vol XI. No,1. Hal: 27-39.
Linacre, J. M. 2012. Winstep : Rasch-Model Computer Programs. Chicago:
Winsteps.com
Makmun, A.S. 2007. Psikologi Kependidikan Perangkat sistem Pengajaran
Modul. Bandung: Rosdakarya.
Malhotra, Naresh K. 2006. Riset Pemasaran. Jakarta: Eirlangga.
Mansyur. 2011. Pengembangan Model Assessment for Learning pada
Pembelajaran Matematika di SMP. Jurnal Penelitian dan Evaluasi
Pendidikan. Vol. 1. No. 1. Hal:71-91.
Mardapi, D. 2008. Teknik Penyusunan Instrumen Tes dan Non Tes. Yogyakarta:
Mitra Cendika.
67
Naga. D.S. 1992. Pengantar Teori Sekor pada Pengukuran Pendidikan. Jakarta:
Gunadarma.
Nitko, A.J dan Brookhart, S.M. 2007. Educational Assessment of Student. New
Jersey: Pearson Education.
Noma, Dwi Luciana, Prayitno, Adi Baskoro dan Suwarno. 2016. PBL untuk
Meningkatkan Kemampuan Berpikir Tingkat Tinggi Siswa Kelas X
SMA. Bioedukasi. Vol 9. No. 2. Hal:62-66
Paryanto dan Sudiyatno, 2011. Implementasi Model Assesment for Learning
(AfL) pada pembelajaran Proses Pemesinan di Jurusan Pendidikan
Teknik Mesin FT UNY. JPTK. Vol. 20. No. 1. Hal: 43-66.
Plomp, Tj. 1997. Educational Design: Introduction. Form Tjeerd Plomp (eds).
Educational & Training System Design:Introduction. Design of
Education and Training (in Dutch). Utrecht (The Netherlands): Lemma.
Netherland. Faculty of Educational Science and Technology, University
of Twente. Enschede the Netherlands.
Retnawati, H. 2014. Teori Respons Butir dan Penerapannya untuk Peneliti,
Praktisi Pengukuran dan Pengujian, Mahasiswa Pascasarjana.
Yogyakarta: Nuha Medika.
Rojewski, J.W. 2009. A Conceptual Framework for Tecnical and Vocational
Education and Training. International Handbook of Education for the
Changing World of Work, Bridging Academic and Vocational learning.
Germany: Springer.
Rosidin, Undang. 2017. Evaluasi dan Asesmen Pembelajaran. Media Akademi:
Yogyakarta.
Sappaile, Intang Baso. 2007. Konsep Instrumen Penelitian Pendidikan. Jurnal
Pendidikan dan Kebudayaan. Vol. 6. No.066 Hal:379-391.
Saputra, Hatta. 2016. Pengembangan Mutu Pendidikan Menuju Era Global:
Penguatan Mutu Pembelajaran dengan Penerapan HOTS (High Order
Thinking Skills). Bandung: SMILE’s Publishing.
Sudiyanto, Kartowagiran, Bandrun, dan Mulyadi. 2015. Pengembangan Model
Assessment as Learning Pembelajaran Akutansi di SMK. Jurnal
Pendidikan dan Evaluasi Pendidikan. Vol 19. No. 2. Hal:189-201.
Sukmadinata, Nana Syaodih. 2012. Metode Penelitian Pendidikan. Bandung:
Remaja Rosdakarya.
Sumintono. B., dan Widhiarso, W. 2014.Aplikasi Model Rasch Untuk Penelitian
Ilmu-Ilmu Sosial. Cimahi: Trimkomunikata.
68
Surapranata, S. 2009. Analisis, validitas, reliabilitas, dan interpretasi hasil tes
implementasi kurikulum 2004. Bandung : PT. Remaja Rosdakarya.
Sutanto, A. 2013. Teori Belajar dan Pembelajaran di Sekolah Dasar. Jakarta:
Kencana Prenada Media Group.
Suwarto. 2012. Pengembangan Tes Diagnostik dalam Pembelajaran. Jogjakarta:
Graha Ilmu.
Triwiyono, Endri. 2017. Pengembangan Asessment for Learning (Afl) melalui
Lesson Study pada Praktik Pemesinan SMK Sesuai Kurikulum 2013.
Jurnal Dinamika Vokasional Teknik Mesin. Vol. 2 No. 1 Hal: 28-36.
Tuysuz. 2009. Development of Two-Tier Diagnostic Instrument and Assess
Students’ Understanding In Chemistry. Academic Journal. Vol 4. No 6.
Hal:626-631.
Uno, Hamzah. 2012. Assesment Pembelajaran. Jakarta: Bumi Aksara.
Welss, C, S, Hambleton, R.K, dan Urip Purwono. 2008. Polytomus Response IRT
Model and Applications. Makalah disajikan dalam pelatihan asesmen
pendidikan da psikolog (psikometri), di PPs Universitas Negeri
Yogyakarta.
Wulan, D.A., Susanti., E., dan Asiyah, N.2017. Meningkatkan Kemampuan
Tingkat Tinggi Siswa Menggunakan Problem Promthing. JES MAT.
3(2): Hal.205-216.
Young, E. 2005. Assessment for Learning: Embedding and Extending.
(http://www.itscotland.org.uk/assess/for/index.asp.).