PENGEMBANGAN INSTRUMEN ASSESSMENT FOR ...digilib.unila.ac.id/59597/3/TESIS TANPA BAB PEMBAHASAN.pdfTK PGRI 1 Bandar Agung pada tahun 2000, pendidikan dasar di SD Negeri 2 Bandar Agung

PENGEMBANGAN INSTRUMEN ASSESSMENT FOR LEARNING

BERBASIS HOTS DENGAN POLITOMUS RESPONSE PADA

MATA PELAJARAN MATEMATIKA JENJANG

SEKOLAH MENENGAH KEJURUAN

(Tesis)

Oleh

AGUNG ALRIZKY ANDREAWAN

PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKA

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS LAMPUNG

BANDAR LAMPUNG

2019

ABSTRAK





Oleh


Penelitian ini bertujuan untuk menghasilkan instrumen assessment for learning

berbasis HOTS dengan politomus response (jawaban beralasan). Penelitian ini

merupakan penelitian pengembangan yang mengacu pada model pengembangan

pendidikan umum dari Plomp yang dimulai dari tahap investigasi awal, tahap

desain, tahap realisasi/konstruksi, tes, evaluasi, dan revisi, dan tahap

implementasi. Subjek uji coba lapangan dilakukan pada tiga sekolah, yaitu SMK

Praja Utama Bandar Sribhawono, SMK Mitra Bhakti Bandar Sribhawono, dan

SMK Mandiri Bandar Sribhawono. Jumlah keseluruhan subjek uji coba lapangan

sebanyak 402 peserta didik. Data penelitian dikumpulkan dengan menggunakan

tes pilihan ganda dengan alasan terbuka yang terdiri dari 10 butir soal. Validitas

butir dianalisis menggunakan formula indeks Gregory dan parameter butir

dianalisis menggunakan pendekatan Partial Credit Model 1- Parameter Logistic

(1- PL) dengan bantuan program winsteps. Hasil penelitian menunjukan bahwa

semua instrumen valid. Hal ini berdasarkan perhitungan indeks Gregory sebesar

1. Selain itu diperoleh koefisien reliabilitas rata-rata sebesar 0,577, sehingga

instrumen dinyatakan reliabel untuk mengukur kemampuan peserta didik. Hasil

pengukuran menunjukkan Outfit MNSQ antara 0,5 sampai dengan 1,5 serta Pt-

Measure Corr bernilai positif yang berarti semua soal cocok atau fit. Tingkat

kesukaran butir soal yang telah dijawab siswa dalam kategori sedang.

Kata Kunci : instrumen assesment for learning, HOTS, politomus respons,

pilihan ganda beralasan terbuka.

ABSTRACT

DEVELOPMENT OF INSTRUMENT ASSESSMENT FOR LEARNING

HOTS BASED WITH POLITOMUS RESPONSE IN VOCATIONAL

SUBJECTS OF HIGH SCHOOL LEVEL

By


The research aims to produce a HOTS-based assessment for learning instrument

with a politomus response. This research is a development research that refers to

the model of general education development from Plomp which starts from the

initial investigation stage, design stage, realization/construction stage, test,

evaluation, and revision, and implementation stage. The subject of field trials was

conducted in three schools, namely SMK Praja Utama Bandar Sribhawono, SMK

Mitra Bhakti Bandar Sribhawono, and SMK Mandiri Bandar Sribhawono. The

total number of field trial subjects was 402 learners. The research Data is

collected using a multiple choice test with an open reason consisting of 10 items.

The validity of grain is analyzed using the Gregory index formula and the item

parameters analyzed using the Partial Credit Model 1-Parameter Logistic (1-PL)

approach with the help of the Winsteps program. The results show that all

instruments are valid. It is based on the calculation of the Gregory index of 1. In

addition it gained an average coefficient of reliability of 0.577, so the instrument

is considered reliable to measure the ability of learners. The measurement results

show Outfit MNSQ between 0.5 to 1.5 and Pt-Measure Corr is positive value

which means all the problems are fit. The difficulty level of the problem that

students have answered in a medium category.

Key Word : Assessment instruments for learning, HOTS, Response Politomus,

open-ended double choice.





Oleh


Tesis

Sebagai Salah Satu Syarat untuk Mencapai Gelar

MAGISTER PENDIDIKAN

pada

Program Studi Magister Pendidikan Matematika

Jurusan Pendidikan Matematika dan Ilmu Pengetahuan Alam

PROGRAM STUDI MAGISTER PENDIDIKAN MATEMATIKA

FAKULTAS KEGURUAN DAN ILMU PENDIDIKAN

UNIVERSITAS LAMPUNG

BANDAR LAMPUNG

2019

RIWAYAT HIDUP

Penulis dilahirkan di Bandar Agung pada tanggal 01 Maret

1993. Penulis merupakan anak pertama dari dua bersaudara

pasangan Bapak Jumadi, S.Pd. dan Ibu Siti Asiyah, M.Pd.

Penulis menyelesaikan pendidikan Taman Kanak-kanak di

TK PGRI 1 Bandar Agung pada tahun 2000, pendidikan

dasar di SD Negeri 2 Bandar Agung pada tahun 2005, pendidikan sekolah

menengah di SMP Negeri 1 Bandar Sribhawono pada tahun 2008, pendidikan

menengah atas di SMA Negeri 1 Bandar Sribhawono pada tahun 2011 dan

Sarjana Program Studi Pendidikan Matematika di Institut Agama Islam Negeri

Lampung pada tahun 2015. Kemudian penulis melanjutkan pendidikan pada

Program Studi Pasca Sarjana Pendidikan Matematika di Universitas Lampung

pada tahun 2015.

MOTO

“Jadilah seperti karang di lautan yang kuat dihantam

ombak dan kerjakanlah hal yang bermanfaat untuk diri

sendiri dan orang lain, karena hidup hanyalah sekali.

Ingatlah hanya pada Allah apapun dan dimanapun kita

berada kepada Dia-lah tempat meminta dan

memohon.”

PERSEMBAHAN

Dengan mengucap syukur kehadirat Allah SWT kupersembahkan karya ini

dengan kesungguhan hati sebagai tanda bakti dan cinta kasihku kepada:

Ayahanda Jumadi dan Ibunda tercinta Siti Asiyah yang telah memberikan doa,

kasih sayang, motivasi, dan bekal kehidupan yang tak henti-hentinya, yang selalu

ada di sampingku serta selalu memberikanku yang terbaik untuk menjadikanku

sesuatu yang terbaik dalam kehidupan ini.

Adikku tersayang Diva Djayanti dan Okvita Dwi Ningrum

serta seluruh keluarga baik dari ibunda maupun ayahanda,

atas kebersamaannya selama ini, atas semua doa dan dukungan

yang telah diberikan kepadaku.

Para pendidik yang telah mendidikku yang menjadikanku semakin berwawasan.

Sahabat-sahabat seangkatan selama menempuh pendidikan yang telah

memberikan warna setiap harinya.

Semua sahabat yang begitu tulus menyayangiku dengan segala kekuranganku,

dari kalian aku belajar memahami arti ukhuwah.

Almamater Universitas Lampung Tercinta.

i

SANWACANA

Puji syukur kehadirat Allah SWT yang telah melimpahkan rahmat dan karunia-

Nya sehingga penulis dapat menyelesaikan penyusunan tesis yang berjudul

“Pengembangan Instrumen Assessment for Learning Berbasis HOTS dengan

Politomus Response Pada Mata Pelajaran Matematika Jenjang Sekolah Menengah

Kejuruan” sebagai syarat untuk mencapai gelar Magister Pendidikan pada

Fakultas Keguruan dan Ilmu Pendidikan Universitas Lampung.

Penulis menyadari sepenuhnya bahwa terselesaikannya penyusunan tesis ini tidak

terlepas dari bantuan berbagai pihak. Oleh karena itu, penulis mengucapkan

terima kasih kepada:

1. Bapak Dr. Sugeng Sutiarso, M.Pd., selaku Dosen Pembimbing Pertama

sekaligus Ketua Program Studi Magister Pendidikan Matematika yang telah

bersedia menyumbangkan banyak ilmu, memberikan perhatian, motivasi, dan

semangat kepada penulis demi terselesaikannya tesis ini.

2. Bapak Dr. Undang Rosidin, M.Pd., selaku Dosen Pembimbing Kedua yang

telah membimbing dengan baik, memberikan motivasi, masukan dan

sumbangan pemikiran kepada penulis dalam penyusunan tesis ini.

3. Bapak Dr. Haninda Bharata, M.Pd., selaku Dosen Pembahas Pertama yang

telah memberikan masukan dan saran kepada penulis.

4. Bapak Prof. Dr. Patuan Raja, M.Pd selaku Dekan FKIP Universitas Lampung.

ii

5. Bapak Prof. Drs. Mustofa, M.A., Ph.D., selaku Direktur Program

Pascasarjana.

6. Bapak/Ibu Dosen Magister Pendidikan Matematika di Fakultas Keguruan dan

Ilmu Pendidikan yang telah memberikan bekal ilmu pengetahuan kepada

penulis.

7. Bapak Drs. Sugeng M,Si., selaku Kepala SMK Praja Utama Sribhawono

sekaligus MKKS SMK Lampung Timur yang telah memberikan izin dan

bantuan selama penelitian.

8. Ibu Mujiati, S.Pd. selaku guru mata pelajaran matematika SMK Praja Utama

Sribhawono yang telah membantu penulis selama melakukan penelitian.

9. Peserta didik SMK yang dijadikan sampel penelitian atas perhatian dan

kerjasama yang telah terjalin.

10. Teman-teman seperjuangan seluruh angkatan 2015 Magister Pendidikan

Matematika, atas kebersamaannya selama ini dan semua bantuan yang telah

diberikan. Semoga kebersamaan kita selalu menjadi kenangan yang terindah

untuk kita semua.

11. Almamater tercinta yang telah mendewasakanku.

12. Semua pihak yang telah membantu dalam penyusunan tesis ini.

Semoga dengan kebaikan, bantuan dan dukungan yang telah diberikan pada

penulis mendapat balasan pahala yang setimpal dari Allah SWT dan semoga tesis

ini bermanfaat bagi kita semua.

Bandar Lampung, 12 Oktober 2019

Penulis

Agung Alrizky Andreawan

iii

DAFTAR ISI

Halaman

DAFTAR TABEL .......................................................................................... v

DAFTAR GAMBAR ...................................................................................... vi

DAFTAR LAMPIRAN .................................................................................. vii

I. PENDAHULUAN

A. Latar Belakang dan Masalah ............................................................ 1

B. Rumusan Masalah ............................................................................ 7

C. Tujuan Penelitian ............................................................................. 8

D. Manfaat Penelitian ........................................................................... 8

II. TINJAUAN PUSTAKA

A. Instrumen Penilaian ......................................................................... 9

B. Instrumen Pilihan Ganda Beralasan .................................................. 12

C. Assesment for Learning .................................................................... 13

D. Higher Order Thinking Skills ........................................................... 15

E. Item Response Theory ....................................................................... 17

F. Definisi Operasional ........................................................................ 21

G. Kerangka Pikir ................................................................................. 22

III. METODE PENELITIAN

A. Jenis Penelitian ................................................................................. 25

B. Tempat, Waktu dan Subjek Penelitian .............................................. 25

C. Prosedur Pengembangan ................................................................... 27

D. Teknik dan Instrumen Pengumpulan Data ........................................ 31

E. Teknik Analisis Data ......................................................................... 33

IV. HASIL PENELITIAN DAN PEMBAHASAN

A. Hasil Penelitian

1. Hasil Pengembangan Produk

a. Tahap Investigasi ................................................................... 41

b. Tahap Desain .......................................................................... 41

c. Tahap Realisasi/Konstruksi .................................................... 42

d. Tahap Tes, Evaluasi dan Revisi ............................................. 43

iv

B. Pembahasan

1. Pengembangan Produk

a. Tahap Investigasi .................................................................. 54

b. Tahap Desain .......................................................................... 55

c. Tahap Realisasi/Konstruk ...................................................... 55

d. Tahap Tes, Evaluasi dan Revisi ............................................. 56

2. Instrumen AfL Berbasis HOTS .................................................... 59

3. Keterbatasan Penelitian ............................................................... 61

V. KESIMPULAN DAN SARAN

A. Kesimpulan ...................................................................................... 63

B. Saran ................................................................................................ 64

DAFTAR PUSTAKA ..................................................................................... 65

LAMPIRAN .................................................................................................... 69

v

DAFTAR TABEL

Tabel Halaman

2.1 Indikator HOTS ................................................................................. 16

3.1 Subjek Uji Coba Penelitian ............................................................... 26

3.2 Kriteria Penskoran Jawaban ............................................................. 33

3.3 Kriteria Penilaian Butir Instrumen Oleh Ahli/Expert ........................ 34

3.4 Kontingensi untuk Menghitung Indeks Gregory .............................. 34

3.5 Kategori Tingkat Kesukaran (p) ....................................................... 36

3.6 Rentang Nilai IMS dan OMS ........................................................... 37

3.7 Kategori HOTS Peserta Didik ............................................................ 37

3.8 Rentang Nilai IMS dan OMS ............................................................ 39

3.9 Kategori HOTS Peserta Didik ............................................................ 39

3.10 Jumalah Siswa dalam Pencapaian HOTS pada AFL .......................... 40

4.1 Analisis Validitas Isi .......................................................................... 43

4.2 Subjek Uji Coba Produk .................................................................... 43

4.3 Nilai Kaiser Mayer Olkin (KMO) ..................................................... 45

4.4 Total Variance Explained .................................................................. 45

4.5 Uji Reliabilitas Instrumen .................................................................. 46

4.6 Tingkat Kesukaran Butir Soal ........................................................... 48

4.7 Jumlah Siswa dalam Pencapaian HOTS pada AfL ............................. 52

vi

DAFTAR GAMBAR

Gambar Halaman

2.1 Mekanisme pengembangan instrument evaluasi ................................. 25

3.1 Presentase Pecapaian HOTS pada AfL ................................................. 40

4.1 Scree Plot UnidimensiInstrumen AfL .................................................. 46

4.2 Outfit & Pt-Measure ............................................................................ 47

4.3 Hasil Uji Tingkat Kesukaran Butir Soal dengan program Winsteps .... 48

4.4 OutputMap Item Winsteps .................................................................... 49

4.5 Grafik fungsi informasi ........................................................................ 50

4.6 Presentase Pecapaian HOTS pada AfL ................................................. 51

4.7 Pola Jawaban Scalogram of Responses Jawaban Peserta Didik ......... 52

4.8 Output Test Person Diagnostic ............................................................ 53

vii

DAFTAR LAMPIRAN

Lampiran Halaman

1. Kisi-Kisi Instrumen ................................................................................. 70

2. Instrumen Tes .......................................................................................... 78

3. Kunci Jawaban Instrumen ........................................................................ 83

4. Lembar Validasi Para Ahli ....................................................................... 90

5. Hasil Analisis Index Gregory ................................................................... 102

6. Hasil Analisis Validitas Menggunakan Program SPSS ............................ 103

7. Hasil Analisis Reliabilitas Menggunakan Program SPSS ........................ 104

8. Hasil Analisis Kecocokan Butir Soal (Item Fit) ...................................... 105

9. Hasil Analisis Tingkat Kesukaran Butir (Item Difficulty)........................ 106

10. Hasil Analisis Fungsi Informasi Tes ........................................................ 108

11. Hasil Analisis Skor Peserta Didik ............................................................ 109

12. Hasil Analisis Scalogram of Response ..................................................... 119

13. Hasil Analisis Test Person Diagnostic ..................................................... 125

14. Hasil Wawancara Instrumen AFL ............................................................ 156

15. Kegiatan Uji Coba Penelitian ................................................................... 159

I. PENDAHULUAN

A. Latar Belakang dan Masalah

Pendidikan memiliki peranan penting dalam proses pembangunan suatu bangsa,

karena sasaran pendidikan adalah peningkatan kualitas sumber daya manusia.

Keberhasilan suatu bangsa dalam menghadapi persaingan global sangat

ditentukan oleh kualitas pendidikan. Menghadapi tantangan tersebut, sistem

pendidikan harus direformasi guna menjawab tuntutan yang ada. Salah satu upaya

yang dilakukan yaitu melalui pengembangan kurikulum. Triwiyono(2017:28)

menyatakan bahwa kurikulum merupakan rencana atau program menyangkut

semua pengalaman yang dihayati peserta didik dibawah pengarahan sekolah.

Permendikbud No. 60 (2014) tentang kurikulum, pengembangan kurikulum di

indonesia saat ini adalah kurikulum 2013 yang diterapkan diseluruh jenjang

pendidikan. Abdullah (2013:12) menyatakan Implementasi kurikulum 2013

mempunyai beberapa perubahan, salah satunya dalam sistem penilaian hasil

belajar, penilaian ditekankan pada hasil dan proses pembelajaran peserta didik.

Penilaian hasil belajar berfungsi memantau proses, kemajuan belajar, dan

perbaikan hasil belajar secara kesinambungan untuk mengetahui capaian

pembelajaran (learning outcomes) peserta didik yang diwujudkan dalam penilaian

formatif dan sumatif (Permendikbud No 104 Tahun 2014). Penerapan penilaian

dilakukan melalui penilaian autentik sebagai bentuk reformasi pendidikan pada

2

level operasional, yaitu penilaian (Rojewski, 2009:31). Reformasi ini bukan hanya

sebagai penunjang kesuksesan pelaksanaan kurikulum 2013, akan tetapi untuk

menghadapi tantangan global yang ada. Paradigma reformasi pendidikan yang

menitik beratkan pada studen center learning menuntut adanya self asessment

dalam proses penilaian sebagai bentuk pembelajaran individual (Cheng, 2005:5).

Penilaian dalam pembelajaran matematika merupakan bagian tidak terpisahkan

dari proses pendidikan matematika. Upaya peningkatan kualitas pendidikan

matematika dapat ditempuh melalui peningkatan kualitas pembelajaran dan

kualitas sistem penilaiannya. Salah satu bentuk penilaian yang diharapkan untuk

hal tersebut adalah penilaian formatif. Earl (Sudiyanto dkk, 2015), penilaian

formatif merupakan penilaian untuk memperbaiki proses pembelajaran. Namun

fakta dilapangan menunjukan guru mengalami kesulitan dalam penilaian hasil

belajar terutama penilaian formatif/proses sehingga pelaksanaannya belum

optimal (Triwiyono, 2017:29). Faktor penghambat pelaksanaan penilaian formatif

yaitu metode, pemanfaatan hasil, dan peserta didik (Mansyur, 2009:35).

Berdasarkan hasil wawancara yang dilakukan ditiga SMK, yaitu SMK Praja

Utama Bandar Sribhawono, SMK Mitra Bhakti Sribhawono, dan SMK Mandiri

Bandar Sribhawono, diperoleh kesimpulan bahwa: (1) sebagian besar guru

memahami asesmen untuk mengukur hasil belajar, (2) semua guru menggunakan

tes untuk mengukur hasil belajar, (3) hampir semua guru tidak menggunakan hasil

asesmen untuk perbaikan proses pembelajaran karena guru belum memiliki

kebiasan untuk melakukan analisis diagnosis kesulitan belajar peserta didik, (4)

hampir semua guru tidak melibatkan peserta didik dalam setiap tahapan proses

3

asesmen, baik dalam menentukan tujuan belajar dan kriteria sukses, penentuan

tugas pembelajaran, pemantauan hasil, dan umpan balik untuk perbaikan

pembelajaran.

Akibat dari belum berfungsinya penilaian formatif pada level kelas, maka kualitas

pembelajaran matematika masih belum tercapai. Setidaknya hal tersebut terlihat

dari hasil UN SMK, menunjukkan di Indonesia nilai rata-rata UN SMK tahun

2015 ke tahun 2016 mengalami penurunan. Rata-rata nilai UN SMK pada tahun

2015 rata-rata nilainya mencapai 62,11 dan pada tahun 2016 nilai rata-ratanya

turun hingga angka 57,66 atau menurun 4,45 poin.

Mengatasi kelemahan praktik penilaian formatif yang telah dikemukakan di atas

dan untuk peningkatkan kualitas kemampuan matematika, maka perlu dilakukan

inovasi model penilaian yang terintegrasi dengan pembelajaran, yaitu asessment

for learning (AfL). Sudiyanto (2015) AfL adalah asesmen yang dirancang untuk

memberikan informasi kepada guru untuk memodifikasi kegiatan

pembelajarannya, membedakan dan memahami cara peserta didik melakukan

pendekatan belajar. AfL yang menekankan pada penggunaan asesmen sebagai

proses mengembangkan dan mendukung metaognisi peserta didik, dalam

pengertian peserta didik diberikan kesempatan dan dibimbing untuk melakukan

pemantauan dan menggunakan hasil pemantauan untuk memperbaiki belajarnya.

Rendahnya nilai rata-rata matematika pada UN SMK di Indonesia selain

dikarenakan penilaian yang belum dirancang dengan baik oleh guru, disebabkan

juga karena permasalahan yang terjadi di sekolah. Soal-soal yang dikerjakan

peserta didik cenderung lebih banyak menguji aspek ingatan yang kurang melatih

4

keterampilan berpikir tingkat tinggi peserta didik. Hasil survei TIMSS diperoleh

bahwa kemampuan berpikir anak Indonesia secara ilmiah dianggap masih rendah.

Salah satu faktor penyebabnya antara lain karena peserta didik di Indonesia

kurang terlatih dalam menyelesaikan soal-soal yang mengukur Higher Order

Thinking Skills (HOTS). Hal ini didukung oleh hasil penelitian oleh Arifin dan

Retnawati (2017), bahwa guru jarang sekali memberikan soal-soal yang memiliki

level tinggi.

Selain itu, masalah yang dihadapi oleh guru adalah kemampuan dalam

mengembangkan instrumen asesmen HOTS masih kurang. Ketersediaan

instrumen yang didesain khusus untuk melatih HOTS juga belum banyak. Padahal

pada UN pemerintah sudah mencantumkan soal-soal yang muat HOTS. Khusunya

pada soal UN matematika pada jenjang SMK, sudah memuat soal HOTS berupa

soal olimpiade internasioanal sebanyak 2 soal dari 40 soal atau sebesar 5%.

Diperkirakan untuk pelaksanaan UN tahun berikutnya, soal-soal olimpiade

internasional akan lebih banyak (Arifin dan Retnawati, 2017).

Hal ini merupakan salah satu mendasari guru untuk dapat membuat atau

mengembangkan instrumen berbasis HOTS, yaitu instrumen yang mengukur

beberapa aspek HOTS peserta didik. Tujuannya adalah mengidentifikasi kekuatan

relatif peserta didik dan kelemahan berpikir tingkat tinggi peserta didik.

Disamping itu juga, guru dapat mengetahui kesiapan mereka untuk mengikuti UN.

Jika guru tidak melakukan hal tersebut, dikhawatirkan potensi HOTS yang ada

pada diri peserta didik tidak diketahui dan tidak berkembang.

5

Berdasarkan uraian di atas, maka perlu adanya pengembangan instrumen

assessment for learning berbasis HOTS bagi peserta didik karena salah satu

indikasi keberhasilan peningkatan sumber daya manusia dalam bidang pendidikan

adalah peserta didik memiliki kemampuan berpikir tingkat tinggi yang baik,

karena tujuan utama pembelajaran pada abad ke 21 ini adalah untuk

mengembangkan dan meningkatkan HOTS peserta didik (Arifin dan Retnawati,

2017).

Penelitian pengembangan ini menggunakan soal tes berbentuk tes pilihan ganda.

Namun, soal pilihan ganda memiliki pilihan jawaban yang disediakan

menyebabkan kemungkinan besar peserta didik hanya mengandalkan intuisi

bahkan tebakan. Selain itu peserta didik tidak dapat mengorganisasi,

menghubungkan, dan menyatakan idenya karena jawaban telah disediakan.

Akibatnya pendidik tidak dapat mengidentifikasi kesulitan dan tingkat

pemahaman peserta didik terhadap materi yang telah dipelajari. Mardapi (2008:5)

mengungkapkan bahwa hasil penilaian yang baik akan memberikan informasi

penting yang akan mendorong pendidik untuk merancang pembelajaran yang

lebih baik. Selain itu hasil penilaian yang baik juga akan memberikan motivasi

kepada peserta didik.

Pengembangan instrumen penilaian sebagai variasi bentuk tes sangat penting.

Selain variasi tes, kualitas butir tes juga menjadi pertimbangan dalam pelaksanaan

tes. Instrumen tes yang baik merupakan tes yang dapat mengukur apa yang

hendak akan diukur oleh pendidik, yaitu untuk mengetahui tingkat penguasaan

dan pemahaman peserta didik. Guru membutuhkan cara yang efisien untuk

6

mendiagnosa letak kesalahan konsep peserta didik. Identifikasi kesalahan konsep

dapat dilakukan dengan berbagai jenis tes. Alternatif tes yang dapat mengukur

kemampuan atau kompetensi peserta didik dalam hal ini mengukur tingkat

pemahamannya adalah dengan menggunakan tes pilihan ganda beralasan. Tes

tersebut berisi soal yang memuat alasan bagi peserta didik atas jawaban dari

pertanyaan yang diberikan.

Pada tes pilihan ganda beralasan ini, peserta didik diminta memilih jawaban yang

benar kemudian mengemukakan alasan yang mendasari jawabannya tersebut. Soal

pilihan ganda yang disertai dengan alasan sebagai penjelasan atas jawaban yang

dipilih, lebih efektif dalam mengidentifikasi masalah dalam pembelajaran. Ada

dua bentuk soal tes pilihan ganda beralasan. Soal tes bentuk pertama, pilihan

ganda beralasan tertutup dengan alasan jawaban sudah disediakan pada soal. Soal

bentuk ini lebih dikenal dengan soal pilihan ganda dua tingkat. Soal tes bentuk

kedua, pilihan ganda beralasan terbuka yaitu soal yang hanya membuat tingkat

pilihan ganda yang alasan pilihan jawabnya dituliskan, sehingga peserta didik

menguraikan alasan secara langsung.

Alasan dituliskan oleh peserta didik agar tidak membatasi pemahaman yang

diterima. Apabila menjawab soal dengan benar dan disertai dengan alasan yang

tepat, maka dapat dikatakan bahwa peserta didik memiliki tingkat pemahaman

yang baik. Sebaliknya, apabila peserta didik menjawab soal dengan benar namun

alasan yang diberikan kurang tepat, maka dapat dikatakan bahwa kompetensi atau

tingkat pemahaman peserta didik kurang baik. Hal ini disesuikan dengan indikator

pencapaian kompetensi yang telah dikembangkan sebelumnya.

7

Menggunakan instrumen tes jawaban beralasan terbuka, guru dapat mengetahui

letak penguasaan materi pembelajaran yang sering terjadi kesalahan konsep

didalamnya. Selain itu, guru dapat mengetahui kategori pemahaman siswa dari

jawaban siswa dalam kategori ketidakpahaman konsep atau dari menebak. Oleh

karena itu dengan penggunaan tes jawaban beralasan terbuka ini diharapkan dapat

mengidentifikasi letak kesalahan pada konsep yang diujikan.

Berdasarkan pada fakta-fakta yang ada memang tidak menggambarkan kondisi

pelaksanaan penilaian secara keseluruhan di Indonesia, tetapi hal ini menunjukkan

bahwa terdapat sedikit permasalahan terkait dengan pelaksanaan penilaian yang

perlu diselesaikan. Salah satu masalahnya yaitu belum adanya butir-butir tes yang

dapat mengukur kemampuan kompetensi peserta didik, dan tentang sejauh mana

tingkat pemahaman mereka terhadap materi yang telah diberikan. Pengembangan

instrumen penilaian dengan politomus response atau jawaban beralasan pada mata

pelajaran matematika menjadi sangat penting untuk dilakukan. Hal ini

dikarenakan bahwa butir-butir tes dengan politomus response memiliki bukti

validitas, reliabilitas, dan parameter-parameter butir yang baik untuk mengukur

kompetensi peserta didik.

B. Rumusan Masalah

Berdasarkan latar belakang masalah di atas, maka rumusan masalah dalam

penelitian pengembangan ini adalah bagaimana hasil pengembangan instrumen

assessment for learning berbasis HOTS dengan politomus response (jawaban

beralasan) pada mata pelajaran matematika jenjang Sekolah Menengah Kejuruan?

8

C. Tujuan Penelitian

Tujuan yang ingin dicapai dalam penelitian ini adalah untuk menghasilkan

instrumen Assessment for Learning berbasis HOTS dengan politomus response

(jawaban beralasan) pada mata pelajaran matematika jenjang Sekolah Menengah

Kejuruan yang layak bagi peserta didik dan guru jenjang SMK.

D. Manfaat Penelitian

Manfaat yang ingin dicapai dalam penelitian ini, antara lain:

1. Manfaat teoritis

a. Mengembangkan khazanah keilmuan di bidang instrumen evaluasi untuk

mengukur keterampilan berpikir tingkat tinggi dengan indikator menganalisis,

mengevaluasi, dan menciptakan.

b. Sebagai sumbangsih pengembangan pendidikan dalam memberikan alternatif

penggunaan instrumen evaluasi.

2. Manfaat praktis

a. Alternatif untuk model penilaian yang digunakan dalam Ujian Sekolah

Berbasis Nasional (USBN)

b. Peserta didik dapat meningkatkan berfikir tingkat tinggi

c. Membantu guru dalam menguji soal ulangan harian berbasis HOTS.

d. Peneliti memperoleh pengalaman langsung dalam mengembangkan instrumen

evaluasi sebagai alat ukur kemampuan kognitif.

e. Sebagai bahan pertimbangan untuk penelitian lebih lanjut.

II. TINJAUAN PUSTAKA

A. Instrumen Penilaian

Instrumen merupakan suatu alat yang memenuhi persyaratan akademis sehingga

dapat dipergunakan sebagai alat untuk mengukur suatu objek ukur atau

mengumpulkan data mengenai suatu variabel. Menurut Sappaile (2007:379), suatu

instrumen dikatakan baik bila valid dan reliabel, baik validitas isi, validitas

konstruk, validitas empirik, reliabilitas konsistensi tanggapan maupun reliabilitas

konsistensi gabungan butir. Tahap pengumpulan data, instrumen sangat penting

dalam penelitian, karena instrumen merupakan alat ukur dan akan memberikan

informasi tentang apa yang kita teliti. Menurut Djajali (dalam Sappaile, 2007)

secara umum yang dimaksud dengan instrumen adalah suatu alat yang karena

memenuhi persyaratan akademis maka dapat dipergunakan sebagai alat untuk

mengukur suatu objek ukur atau mengumpulkan data mengenai suatu variabel.

Instrumen dapat dibagi menjadi dua macam, yakni tes dan non tes. Yang termasuk

tes misalnya tes prestasi belajar,tes inteligensi, tes bakat. Sedangkan yang

termasuk non tes misalnya pedoman wawancara, angket atau koesioner, lembar

observasi, daftar cocok (check list), skala sikap, skala penilaian, dan sebagainya.

Pada penelitian dan pengembangan ini produk yang dikembangkan adalah

instrumen penilaian tes. Saat melakukan penilaian di dunia pendidikan, terdapat

10

bermacam-macam alat penilaian guna menilai proses dan hasil pendidikan yang

telah dilakukan peserta didik.

Daryanto (2008:35) mengungkapkan hal yang sama yakni tes lebih bersifat resmi

dan penuh dengan batasan-batasan. Tes terdiri atas sejumlah soal yang harus

dikerjakan peserta didik dan menghadapkan peserta didik pada suatu tugas untuk

menanggapi tugas atau soal tersebut. Ditinjau dari segi kegunaan untuk mengukur

peserta didik, Arikunto (2012:33-41) membedakan atas tiga macam tes yaitu:

1. Tes diagnostik merupakan tes yang digunakan untuk mengetahui kesulitan-

kesulitan peserta didik sehingga berdasarkan hal tersebut dapat dilakukan

penanganan yang tepat. Tes ini dapat dilakukan di awal pembelajaran untuk

mengetahui pengetahuan awal peserta didik, di pertengahan proses

pembelajaran untuk menyelidiki bagian mana dari pembelajaran guru yang

tidak dapat dipahami oleh peserta didik dan bagian akhir untuk mengevaluasi

tingkat penguasaan materi terhadap bahan yang diberikan.

2. Tes formatif merupakan tes yang dilakukan di akhir program yang bertujuan

untuk mengetahui sejauh mana peserta didik telah mengikuti program tertentu.

Tes ini bisa disebut juga dengan tes diagnostik pada akhir pelajaran.

3. Tes sumatif merupakan tes yang dilaksanakan di akhir semester yang

bertujuan untuk menentukan nilai seseorang.

Tes sebagai alat ukur kemampuan peserta didik di bidang pendidikan memiliki

perbedaan yang fundamental dibandingkan alat ukur barang yang digunakan

sehari-hari. Alat ukur dalam pendidikan salah satunya tes, tidak dapat langsung

mengukur variabel yang akan diukur. Hal ini dikarenakan respons peserta didik

11

terhadap jawaban tes tidak selalu konsisten mencerminkan kecakapan atau

suasana batin seseorang oleh banyaknya faktor-faktor yang juga mempengaruhi

pencetusan tingkah yang nampak. Maka dari itu, agar sebuah tes dapat mengukur

apa yang hendak diukur, instrumen atau soal yang diberikan pada sebuah tes perlu

memenuhi komponen-komponen tolok ukur (kriteria) tertentu. Makmun

(2007:196-198) menjelaskan syarat sebuah instrumen tes yang layak sebagai

berikut:

1. Memenuhi taraf ketepatan (validity) yang memadai. Artinya, instrumen tes

dapat mengukur apa yang hendak diukur. Hal ini dapat diidentifikasi dari

kesesuaian butir-butir soal dengan ruang lingkup dan jenjang materi atau

bahan ajar serta ruang lingkup aspek tertentu.

2. Memiliki taraf kemantapan sehingga hasil pengukuran dapat dipegang atau

dipercaya (reliability).

3. Memiliki kepraktisan untuk keperluan kemudahan administrasi. Artinya tidak

diperlukan fasilitas penunjang dan bebas kesulitan bahasa.

4. Memiliki kemampuan untuk membedakan peserta didik pandai (upper group)

dan lemah (lower group). Peserta didik pandai dapat menjawab butir soal-soal

sukar dan peserta didik lemah menjawab butir-butir soal mudah.

Arikunto (2012:146) berpendapat bahwa instrumen yang baku dan standar,

lazimnya dikembangkan oleh ahli. Rosidin (2017: 135) menyatakan bahwa aspek

pendekatan empiris terhadap validitas konstruk terdiri dari dua hubungan, yaitu, a)

hubungan internal, yaitu hubungan antara item-item di dalam alat pengukur ada

atau tidak bertentangan; b) hubungan eksternal, yaitu hubungan antara skor yang

diperoleh dari alat pengukur tersebut dengan sekor dari alat pengukur lain harus

12

konsisten dengan konstruk. Namun persamaan dari keduanya yakni diperlukan

tahap pengembangan instrumen tes yang bertujuan agar instrumen benar-benar

layak dan akurat digunakan.

B. Instrumen Pilihan Ganda Beralasan

Krishnan dan Howe (dalam Suwarto, 2012:136) mengembangkan soal pilihan

ganda disertai dengan alasan sebagai bentuk penjelasan atas jawaban yang

dipilihnya. Soal pilihan ganda beralasan lebih menguntungkan dibandingkan

pilihan ganda biasa. Tuysuz (2009:627) dalam penelitiannya mengungkapkan

keuntungan dari bentuk soal ini yakni dapat mengidentifikasi dua aspek yang

berbeda sekaligus dalam satu fenomena. Awal penggunaan tes pilihan ganda

beralasan dimulai sejak tahun 80an yang bertujuan untuk mengidentifikasi

miskonsepsi peserta didik.

Tes pilihan ganda beralasan terdiri dari dua macam yaitu tes pilihan ganda

beralasan terbuka dan tes pilihan ganda beralasan tertutup. Menurut Suwarto

(2012:56) tes pilihan ganda beralasan terbuka adalah tes pilihan ganda yang

disertai alasan sehingga peserta didik harus menuliskan alasan terhadap jawaban

yang dipilihnya. Kelebihan tes pilihan ganda berlasan terbuka yaitu peserta didik

dapat leluasa mengungkapkan alasan atas jawaban yang dipilihnya.

Kelemahannya yakni dibutuhkan waktu untuk pemahaman jawaban peserta didik

yang luas.Sedangkan tes pilihan ganda tertutup adalah tes pilihan ganda yang

disertai pilihan alasan.

Chandrasegaran, dkk (2007:299) mengatakan bahwa alasan peserta didik pada

bentuk pilihan ganda beralasan tetutup telah disediakan sehingga peserta

13

didikhanya memilih jawaban dari opsi yang sudah tersedia. Jawaban benar jika

peserta didik dengan tepat memilih opsi pada tingkat pertama dan tingkat kedua.

Penilaian dilakukan berdasarkan pilihan jawaban dan alasan peserta didik pada

kedua tingkat. Kelemahan instrumen ini menurut Suwarto (2012:57) yaitu peserta

didik tidak leluasa mengungkapkan alasan pemilihan jawaban. Kelebihan

instrumen ini yakni mempermudah dalam proses penilaian. Selain itu peserta

didik memiliki peluang menebak jawaban lebih kecil dibandingkan pilihan ganda

satu tingkat.Pada penelitian ini instrumen yang dikembangkan berupa soal pilihan

ganda beralasan terbuka. Hal ini bertujuan untuk mengetahui tingkap pemahaman

dan penalaran peserta didik dalam menyelesaikan soal yang diberikan.

C. Assessment for Learning

Asesmen kadang diartikan berbeda tergantung konteks dan siapa yang

mengartikannya. Young (2005) mengatakan bahwa asesmen digunakan untuk

meningkatkan hasil belajar. Asesmen digunakan sebagai wahana untuk

memberikan balikan kepada peserta didik terhadap kesalahan yang dilakukan

selama pembelajaran. Sutanto, 2013 menyatakan assessment adalah proses untuk

mendapatkan informasi dalam bentuk apapun yang dapat digunakan untuk dasar

pengambilan keputusan tentang peserta didik, baik yang menyangkut kurikulum,

program pembelajaran, iklim sekolah maupun kebijakan-kebijakan sekolah.

Asesmen yang seperti ini dikenal sebagai Assessment for Learning (AfL).

AfL atau yang sering disebut sebagai asesmen formatif merupakan kegiatan yang

terintegratif dalam pembelajaran. Sudiyanto, dkk (2015) AfL adalah asesmen yang

dirancang untuk memberikan informasi kepada guru untuk memodifikasi kegiatan

14

pembelajarannya, membedakan dan memahami cara peserta didik melakukan

pendekatan belajar. AfL merupakan salah satu cara penilaian atau evaluasi

pembelajaran. Prinsip utama dalam pelaksanaan AfL adalah evaluasi secara

menyeluruh mulai dari perencanaan, proses hingga akhir pembelajaran.

Berdasarkan pendapat di atas, AfL adalah proses perolehan informasi dan

pemanfaatan informasi. Informasi atau keterangan diperoleh melalui kerjasama

antara guru dengan peserta diidk dan informasi tersebut dimanfaatkan oleh

mereka (guru dan peserta didik) untuk perbaikan dan peningkatan kualitas

pembelajaran berikutnya. Bagi guru, informasi digunakan untuk perbaikan dan

penyempurnaan strategi pengajaran sesuai dengan kebutuhan nyata para peserta

didiknya. Sementara bagi peserta didik, dapat digunakan sebagai dasar dalam

strategi belajar yang lebih baik.

Menurut Mansyur (2011:76), menyatakan bahwa tujuan AfL untuk:

1. Memberi wawasan pembelajaran kepada guru dan peserta didik dalam upaya

meningkatkan kesuksesan untuk semua.

2. Membantu proses penetapan tujuan.

3. Memungkinkan refleksi secara kontinu terhadap apa yang peserta didik

diketahui sekarang dan apa yang mereka butuhkan untuk diketahui

berikutnya.

4. Mengukur apa yang dinilai.

5. Menetapkan intervensi secara cepat dan tepat sesuai dengan tujuan

pembelajaran.

6. Meningkatkan standar yang diperoleh peserta didik.

15

D. Higher Order Thinking Skills

Higher Order Thinking Skills (HOTS) merupakan suatu proses berpikir peserta

didik dalam level kognitif yang lebih tinggi yang dikembangkan dari berbagai

konsep dan metode kognitif dan taksonomi pembelajaran seperti metode problem

solving, taksonomi pembelajaran, pengajaran, dan penilaian (Saputra, 2016:91).

Menurut Hidayati (2017:146) menyatakan bahwa berpikir tingkat tinggi terjadi

ketika seseorang memperoleh informasi baru dan disimpan dalam memori dan

saling berkaitan atau menata ulang atau memperluas informasi tersebut untuk

mencapai tujuan atau menemukan kemungkinan jawaban dalam kondisi yang

membingungkan.

Menurut Laily dan Wisudawati (2015:28) menyatakan bahwa HOTS adalah

proses berpikir yang mengaharuskan peserta didik untuk memanipulasi informasi

yang ada dan ide-ide dengan cara tertentu yang memberikan mereka pengertian

dan implikasi baru. Misalnya, ketika peserta didik menggabungkan fakta dan ide

dalam proses mensintesis, melakukan generalisasi, menjelaskan, melakukan

hipotesis dan analisis, hingga peserta didik sampai pada suatu kesimpulan.

Berdasarkan beberapa pendapat di atas, maka HOTS merupakan proses

keterampilan berpikir secara mendalam dan meluas yang melibatkan pengolahan

informasi secara kritis dan kreatif dalam menghadapi dan menyelesaikan masalah

yang bersifat kompleks dan melibatkan keterampilan menganalisis, mengevaluasi,

dan mencipta.

16

Menurut Uno (2012:56), soal HOTS memiliki empat indikator, yaitu:

1. Probelm solving atau proses dalam menemukan masalah serta cara

memecahkan masalah berdasarkan informasi yang nyata, sehingga dapat

ditarik kesimpulan.

2. Keterampilan pengambilan keputusan, yaitu keterampilan seseorang dalam

memecahkan masalah melalui pengumpulan informasi untuk kemudian

memilih keputusan terbaik dalam memecahkan masalah.

3. Keterampilan berpikir kritis adalah usaha untuk mencari informasi yang

akurat yang digunakan sebagaimana mesrinya pada suatu masalah.

4. Keterampilan berpikir kreatif, artinya menghasilkan banyak ide sehingga

mengahasilkan inovasi baru untuk memecahkan masalah.

Menurut Noma, dkk (2016:63) indikator HOTS mencakup aspek: (1) menganalisis

(C4), mengevaluasi (C5), dan mencipta (C6). Hidayati (2017:148), indikator

HOTS dan klasifikasi tentang kata kerja operasional yang dapat digunakan maka

dapat dibuat suatu indikator HOTS sebagaimana ditunjukan pada Tabel 2.1.

Tabel 2.1 Indikator HOTS

Aspek Indikator Alternatif KKO yang Mewakili

Berpikir Kritis

Menganalisis Memilih

Membandingkan

Mengevaluasi Memeriksa

Menilai

Berpikir Kreatif Mencipta Membuat

Menyimpulkan

Menurut Krathwohl (2002), menyatakan bahwa indikator untuk mengukur

kemampuan berpikit tingkat tinggi meliputi menganalisis (C4) yaitu kemampuan

memisahkan konsep ke dalam beberapa konsep secara utuh, mengevaluasi (C5)

yaitu kemampuan menetapkan derajat sesuatu berdasarkan norma, kriteria atau

17

patokan tertentu, dan mencipta (C6) yaitu kemampuan memadukan unsur-unsur

menjadi sesuatu yang baru yang utuh dan luas atu membuat sesuatu yang orosinil.

Berdasarkan beberapa pendapat di atas, dalam penelitian ini indikator untuk

mengukur kemapuan berpikir tingkat tinggi yang digunakan, yaitu: menganalisis

(C4), mengevaluasi (C5), dan menciptakan (C6).

E. Item Response Theory

Tes merupakan salah satu alat bantu yang sering digunakan pendidik untuk

mengukur ketercapaian kompetensi peserta didik. Terdapat beberapa model

pengukuran yang biasanya dipakai dalam melakukan analisis butir tes, baik

menggunakan teori klasik maupun item response theory (IRT). IRT atau teori

respon butir merupakan teori tentang bagaimana variabel orang dan variabel butir

menentukan data respon ketika seseorang menjawab butir tersebut (Huriaty,

2015:191). Anisa (2013:97), IRT merupakan teori pengukuran modern yang

digunakan dalam menganalisis item. IRT bertujuan untuk melihat bagaimana

respon dari peserta tes terhadap tiap butir soal yang ada dalam perangkat tes. Pada

dasarnya IRT ingin memperbaiki kelemahan yang terdapat pada teori klasik,

yakni ketergantungan ukuran ciri peserta kepada kelompok butir tes (Naga,

1992:160). Kelebihan IRT, yaitu statistik butir tidak tergantung pada kelompok,

skor tes yang diperoleh menggambarkan kemampuan individu, tidak memerlukan

tes yang pararel untuk menghitung koefisien reliabilitas dan dapat menyediakan

ukuran yang tepat untuk setiap skor kemampuan (Huriaty, 2015:191).

18

Pemilihan model yang tepat akan mengungkap keadaan yang sebenarnya dari data

tes sebagai hasil pengukuran. Salah satu bentuk tes yang familiar digunakan oleh

pendidik pada level sekolah adalah tes berbentuk pilihan berganda dengan

penskoran dikotomi. Bentuk penskoran dikotomi memiliki skor yang ekstrim

dimana jawaban yang benar diberi skor 1 dan jawaban yang salah diberi skor 0

(Demars, 2010). Kelebihan penskoran dikotomi ini adalah memberi kemudahan

bagi pendidik dalam pemeriksaan dan penskoran tes, namun kurang memberi

kesempatan bagi pendidik untuk mendiagnosis kesalahan konsep yang dilakukan

oleh peserta didik (Isgiyanto, 2011). Kelemahan ini dapat diminimalisir dengan

mengembangkan penskoran politomus. Penskoran politomus pada tes berarti

bahwa skor jawaban dikembangkan menjadi lebih dari dua kategori, bukan hanya

benar atau salah (Demars, 2010).

Model analisis IRT yang biasanya digunakan untuk menganalisis butir data

berbentuk politomus diantaranya (Retnawati, 2014:32): Nominal Respons Model

(NRM), Rating Scale Model (RSM), Partikel Credit Model (PCM), Graded

Respons Model (GRM) dan Generalized Partisan Credit Model (GPCM). Model

respon butir politomus dapat dikategorikan menjadi model respons butir nominal

dan ordinal, tergantung pada asumsi karakteristik tentang data. Model respons

butir nominal dapat diterapkan pada butir yang mempunyai alternatif jawaban

yang tidak terurut (ordered) dan adanya berbagai tingkat kemampuan yang

diukur. Pada model respons ordinal terjadi pada butir yang dapat diskor ke dalam

banyaknya kategori tertentu yang tersusun dalam jawaban. Skala likert diskor

berdasarkan pedoman penskoran kategori respons terurut, yang merupakan

penskoran ordinal. Butir-butir tes matematika dapat diskor menggunakan sistem

19

parsial kredit, langkah-langkah menuju jawaban benar dihargai sebagai penskoran

ordinal. Model penskoran yang paling sering dipakai ahli yakni GRM, PCM, dan

GPCM (Retnawati, 2014:32).

Analisis item menggunakan IRT haruslah memenuhi asumsi yang disyaratkan,

asumsi yang umum digunakan secara luas oleh model-model IRT adalah asumsi

unidimensi, local independent, dan ivarian parameter (Hambleton dkk, 1991:9).

1. Unidimensi artinya hanya ada salah satu kemampuan yang diukur dengan

satu set butir dalam tes. Asumsi ini tidak dapat secara ketat terpenuhi karena

beberapa faktor kognitif, kepribadian, dan pelaksanaan tes yang selalu

mempengaruhi kinerja tes, setidaknya sampai batas tertentu. Faktor-faktor ini

mungkin termasuk motivasi, tingkat kecemasan, kemampuan untuk bekerja

dengan cepat, kecenderungan untuk menebak bila ragu dengan jawaban dan

keterampilan kognitif di samping satu dominan yang diukur dengan butir tes.

2. Independensi lokal (local Independence) artinya ketika kemampuan

mempengaruhi kinerja agar tetap konstan, maka respons peserta ujian untuk

setiap pasangan butir independen secara statistik satu sama lain. Dengan kata

lain, setelah uji kemampuan masuk ke dalam perhitungan ada hubungan

antara respons peserta ujian untuk butir yang berbeda.

3. Invariansi parameter kemampuan adalahkarakteristik butir soal yang tidak

tergantung pada distribusi parameter kemampuan peserta tes dan parameter

ciri peserta tidak tergantung pada ciri butir soal. Hal ini berarti bahwa

kemampuan seseorang tidak akan berubah hanya karena mengerjakan tes

yang berbeda tingkat kesulitannya dan parameter butir tidak akan berubah

20

hanya karena diujikan pada kelompok peserta tes yang berbeda tingkat

kemampuannya.

Teori respon butir membangun suatu model yang menghubungkan karakteristik

butir dengan karakteristik peserta. Dengan sejumlah syarat tertentu, model

hubungan ini dibuat agar berlaku secara bebas bagi kelompok butir dan kelompok

peserta mana saja yang memenuhi syarat itu. Karakteristik butir dan karakteristik

peserta dihubungkan oleh model yang berbentuk fungsi atau lengkungan grafik.

Sejumlah syarat yang dimaksud dinyatakan dengan sejumlah parameter. Ada 3

model hubungan antara kemampuan dan parameter butir (Muraki & Bock dalam

Retnawati: 2014:40), yaitu:

1. Model 1 parameter (model Rasch), ditentukan oleh indeks tingkat kesukaran

butir (bi).

2. Model 2 parameter, ditentukan oleh indeks tingkat kesukaran butir (bi) dan

indeks daya beda butir (ai).

3. Model 3 parameter, ditentukan oleh indeks tingkat kesukaran butir (bi), indeks

daya beda butir (ai) dan tebakan semu (ci).

Berdasarkan macam-macam model penskoran dan model parameter, rumus yang

akan digunakan untuk analisis penelitian ini, yaitu model PCM. Model PCM

cocok untuk menganalisis butir tes yang memerlukan beberapa langkah

penyelesaian, hal ini termasuk soal matematika yang membutuhkan tahap

identifikasi permasalahan hingga solusi akhir. PCM merupakan model penskoran

politomus dengan pengembangan model 1-PL yang merupakan peluasan dari

model Rasch. Asumsi PCM yakni setiap butir mempunyai daya beda yang sama.

21

PCM mempunyai kemiripan dengan GRM pada butir yang diskor dalam kategori

berjenjang, namun indeks kesukaran dalam setiap langkah tidak perlu terurut,

suatu langkah dapat lebih sukar dibandingkan langkah berikutnya.

Bentuk umum PCM menurut Muraki & Bock (Retnawati:2014:37), sebagai

berikut:

�� = � ∑ �� − ��∑ � ∑ �� − ��

Dengan :

�� : probabilitas peserta berkemampuan θ memperoleh skor kategori k pada

butir j

θ : kemampuan peserta

m + 1 : banyaknya kategori butir j

bjk : indeks kesukaran kategori k butir jdan

�� − ��

��≡ 0 dan �� − ��

�

��≡ �� − ��

�

��

Skor kategori pada PCM menunjukkan banyaknya langkah untuk menyelesaikan

dengan benar butir tersebut. Skor kategori yang lebih tinggi menunjukkan

kemampuan yang lebih besar daripada skor kategori yang lebih rendah. Pada

PCM, jika suatu butir memiliki dua kategori, maka PCM dapat diterapkan pada

butir dikotomus dan politomus.

F. Definisi Operasional

Berikut merupakan beberapa istilah yang perlu didefinisikan secara operasional

dengan maksud agar tidak terjadi kesalahan penafsiran :

1. Instrumen perangkat untuk mengukur hasil belajar peserta didik yang

mencakup hasi belajar dalam ranah kognitif, afektif dan psikomotorik.

22

2. Assessment for Learning (AfL) adalah proses perolehan informasi dan

pemanfaatan informasi. Informasi atau keterangan diperoleh melalui

kerjasama antara guru dengan peserta didik dan informasi tersebut

dimanfaatkan oleh mereka (guru dan peserta didik) untuk perbaikan dan

peningkatan kualitas pembelajaran berikutnya. Bagi guru, informasi

digunakan untuk perbaikan dan penyempurnaan strategi pengajaran sesuai

dengan kebutuhan nyata para peserta didiknya. Sementara bagi peserta didik,

dapat digunakan sebagai dasar dalam strategi belajar yang lebih baik.

3. Higher Order Thinking Skills (HOTS) merupakan kemampuan berpikir yang

mengujikan pada tingkat yang lebih tinggi, dalam artian tidak hanya

mengujikan pada aspek ingatan atau hapalan saja, namun menguji sampai

pada aspek menganalisis (C4), mengevaluasi (C5) dan mencipta (C6).

4. Politomus Response

Politomus response adalah model respons butir yang mempunyai

kemungkinan jawaban lebih dari dua kategori jawaban (benar dan salah),

dimana biasanya ada 5 tingkatan jawaban (likert).

G. Kerangka Pikir

Kemampuan guru dalam melakukan evaluasi sekolah cenderung belum maksimal,

instrument yang digunakan belum terukur apalagi untuk intrumen butir soal

dengan tingkat HOTS sangat jarang sekali digunakan. Hal ini terjadi karena

beberapa faktor penghambat guru dalam mengembangkan soal, misalnya tidak

ada tuntutan guru harus mengembangkan soal, kopetensi guru kurang, kurang

responsifnya guru dalam mengevaluasi peserta didik dll. Padahal sangat

pentingnya instrumen tersebut dalam mengembangkan kemampuan peserta didik.

23

Prosedur dalam pengembangan instrumen AfLHOTS diawali dengan analisis

materi, dikembangkan KD dalam materi. KD yang sudah ditentukan dibuat IPK

(indikator pencapaian kompetensi), kemudian membuat kisi-kisi instrumen AfL

HOTS, menyusun dan menulis butir soal AfL HOTS (kriteria penilaian, kunci

jawaban dan telaah butir soal oleh validator) berdasarkan kisi-kisi yang akan

divalidasi ahli, melakukan uji coba, analisis instrumen, memperbaiki,

melaksanakan penelitian (melakukan tes intrumen), dan menginterpretasi hasil tes.

Butir soal kemudian dianalisis menurut validitas isi, validitas konstruk,

reliabilitas, tingkat kesukaran, karakteristik butir tes uji coba dan kemampuan

HOTS matematika. Butir soal yang memenuhi keenam kriteria tersebut disebut

dengan soal dengan kriteria baik. Butir soal yang hanya memenuhi beberapa

kriteria disebut soal kurang baik dan butir soal yang tidak memenuhi kriteria

disebut soal yang tidak baik maka harus digantikan dengan soal yang baru. Butir

soal yang sudah terukur baik inilah yang siap digunakan untuk evaluasi.

Prosedur dalam pembuatan instrumen AfL HOTS ini bertujuan mengukur

pencapaian peserta didik dalam suatu set materi dan ketercapaian dalam

kemampuan yang terukur. Berikut mekanisme pengembangan instrument AfL

HOTS sesuai Gambar 2.1.

24

Gambar 2.1. Mekanisme Pengembangan Instrumen AfL

HOTS

Daya Beda

Butir

Nilai fungsi

informasi

Kemahiran

(Trait)

Kecocokan

Butir

Menyusun Kisi-kisi Menyusun Kisi-kisi Instrumen

AfL HOTS

Validitas

Ahli

Uji coba &

Penelitian

Analisis

Analisis Materi berdasarkan KD, Merumuskan

Indikator Pencapaian Kompetensi

Soal kriteria baik

masuk bank soal

Soal tidak baik diganti

dengan yang baru Soal kurang baik direvisi

Menyusun Spesifikasi Butir Soal Berdasarkan Kisi-

kisi

III. METODE PENELITIAN

A. Jenis Penelitian

Jenis penelitian ini adalah penelitian dan pengembangan (Research and

Development) yang mengacu pada prosedur pengembangan pendidikan umum

dari Plomp (1997), yang terdiri dari lima tahap yaitu: 1) tahap investigasi awal, 2)

tahap desain, 3) tahap realisasi/konstruksi, 4) tahap tes, evaluasi dan revisi, dan 5)

tahap implementasi. Penelitian dan pengembangan ini produk yang dikembangkan

adalah Instrumen Assessment for Learning berbasis HOTS dengan Politomus

Response Jenjang Sekolah Menengah Kejuruan (SMK).

B. Tempat, Waktu dan Subjek Penelitian

Penelitian ini akan dilaksanakan di tiga Sekolah Menengah Kejuruan yang ada di

Kecamatan Bandar Sribhawono Kabupaten Lampung Timur, diantaranya SMK

Praja Utama Bandar Sribhawono, SMK Mitra Bhakti Bandar Sribhawono dan

SMK Mandiri Bandar Sribhawono pada Semester Genap Tahun Ajaran

2018/2019. Subjek dalam penelitian ini dibagi dalam beberapa tahap berikut:

1. Subjek Investigasi Awal

Pada investigasi awal dilakukan beberapa langkah sebagai analisis kebutuhan,

yaitu observasi, dan wawancara. Subjek pada observasi adalah peserta didik kelas

XI dari SMK Praja Utama Bandar Sribhawono, SMK Mitra Bhakti Bandar

Sribhawono, dan SMK Mandiri Bandar Sribhawono. Subjek saat wawancara

26

adalah satu orang guru yang mengajar matematika di SMK Praja Utama Bandar

Sribhawono, SMK Mitra Bhakti Bandar Sribhawono, dan SMK Mandiri Bandar

Sribhawono.

2. Subjek Uji Coba Produk

Subjek pada tahap ini adalah peserta didik kelas XI yang sudah pernah

mendapatkan materi yang akan diujikan yang berjumlah 252 peerta didik, yaitu

peserta didik dari SMK Kosgoro Bandar Sribhawono, SMK Budi Utomo Bandar

Sribhawono, dan SMK Taruna Bandar Sribhawono.

3. Subjek Uji Coba Lapangan

Subjek uji instrumen ini dilakukan di kelas XI pada tiga Sekolah Menengah

Kejuruan, yaitu SMK Praja Utama Bandar Sribhawono, SMK Mitra Bhakti

Bandar Sribhawono, dan SMK Mandiri Bandar Sribhawono dengan total 402

peserta didik dengan populasi peserta didik SMK Se-Lampung Timur. Data

selengkapnya dapat dilihat pada Tabel 3.1.

Tabel 3.1. Subjek Uji Coba Penelitian Sekolah Kelas Sampel Penelitian

SMK Mitra Bhakti

XI AK 13

XI P1 23

XI P2 29

SMK Praja Utama

XI TKR1 40

XI TKR2 39

XI AK1 43

XI AK2 38

XI P1 41

XI P2 40

XI AP 40

SMK Mandiri XI TKJ 31

XI AK 32

Jumlah 402

Pengambilan sampel uji coba dilakukan dengan teknik non probability sampling

yaitu accidental sampling. Non probability sampling setiap unsur tidak memiliki

27

kesempatan atau peluang yang sama untuk dipilih sabagai sampel. Pemilihan unit

sampling didasarkan pada pertimbangan atau penilaian subjektif dan tidak

menggunakan teori probabilitas. Teknik ini, sampel paling sedikit harus empat

atau lima kali dari jumlah item pertanyaan.

Penarikan jumlah ukuran sampel, apabila populasinya tidak diketahui secara pasti

jumlahnya (accidental sampling) maka digunakan teknik atau rumus sesuai

dengan teori Malhotra (2006:291). Accidental sampling merupakan prosedur

sampling yang memilih sampel orang atau unit yang paling mudah dijumpai atau

diakses.

C. Prosedur Pengembangan

Ada lima tahapan dari model pengembangan yang dikemukakan oleh Plomp

(1997), langkah-langkah pengembangan produk dijelaskan sebagai berikut:

1. Tahap Investigasi Awal

Kegiatan yang dilakukan pada tahap investigasi awal adalah menghimpun

informasi permasalahan evaluasi belajar matematika terdahulu, mengidentifikasi

dan mengkaji teori-teori yang melandasi penelitian. Tahap ini juga dilakukan

kajian secara teoritis tentang kurikulum mata pelajaran matematika SMK,

meliputi analisis materi berdasarkan Kompetensi Dasar yang telah dipilih,

merumuskan indikator pencapaian kompetensi dan kisi-kisi butir soal.

2. Tahap Design

Berdasarkan investigasi awal, dilakukan suatu upaya mengembangkan suatu

produk yakni instrumen Assessment for Learning berbasis HOTS dengan

politomus response. Pada tahap ini dilakukan perancangan instrumen, yaitu

28

merumuskan tujuan tes, merumuskan materi matematika, dan menyusun kisi-kisi

butir soal.

a. Merumuskan Materi

Perumusan materi dilakukan dengan memperhatikan beberapa bab dan sub bab

materi kelas yang termasuk dalam materi pembelajaran pada satu semester. Materi

sesuai pada Kompetensi Inti (KI) dan Kompetensi Dasar (KD) dalam

Permendikbud No. 70 Tahun 2013 tentang Kerangka Dasar dan Struktur

Kurikulum Sekolah Menengah Kejuruan/Madrasah Aliyah Kejuruan dan

disesuaikan dengan Keputusan Direktur Jendral Pendidikan Dasar dan Menengah

No. 130/D/KEP/KR/2017 tentang Struktur Kurikulum Pendidikan Menegah

Kejuruan. Materi tes yang digunakan terletak pada Kompetensi Dasar:

1. Menyelesaikan masalah yang berkaitan dengan perbandingan trigonometri

pada segitiga siku-siku (4.8)

2. Menyelesaikan masalah yang berkaitan dengan aturan sinus dan kosinus.

(4.12)

3. Menyelesaikan nilai nilai sudut dengan rumus jumlah dan selisih dua sudut

(4.14)

4. Menyajikan penyelesaian masalah kontekstual berkaitan dengan kaidah

pencacahan, permutasi dan kombinasi (4.25)

5. Menyelesaikan masalah yang berkaitan dengan peluang kejadian (4.26)

b. Menyusun Kisi-kisi Penulisan Soal

Penyusunan kisi-kisi tes berdasarkan pada materi yang telah dirumuskan

sebelumnya. Kisi-kisi penulisan soal berisi Kompetensi Inti, Kompetensi Dasar,

Indikator Pencapaian Kompetensi, Materi, Indikator Soal dan Nomor Soal.

Selanjutnya pada masing-masing indikator pencapaian kompetensi berisi minimal

satu butir soal. Indikator pencapaian kompetensi dikembangkan menjadi beberapa

indikator soal. Indikator soal berisi tujuan dan kriteria soal tes untuk digunakan

oleh peneliti sebagai panduan dalam menyusun spesifikasi butir soal. Kisi-kisi tes

29

diperlukan agar penulisan butir soal sesuai dengan kompetensi dasar yang

diharapkan.

c. Menyusun Spesifikasi Butir Soal

Kisi-kisi yang telah disusun kemudian digunakan sebagai panduan dalam

menyusun butir soal. Spesifikasi butir soal secara garis besar berisi Standar

Kompetensi Lulusan (SKL), indikator pencapaian kompetensi, ruang lingkup

materi dan contoh butir soal. Spesifikasi butir soal disusun untuk beberapa butir

soal dengan ketentuan tercakup dalam indikator SKL dan materi yang sama.

Selanjutnya spesifikasi butir soal digunakan oleh guru mata pelajaran yang

dikenakan sebagai penulis soal dalam penelitian. Penulisan soal dilakukan untuk

mengetahui kesesuaian antara spesifikasi dan butir soal yang dihasilkan.

3. Tahap realisasi/konstruksi

Pada tahap ini, solusi yang telah didesain direalisasikan untuk bisa menghasilkan

suatu prototipe awal. Prototipe yang dihasilkan masih berupa prototipe awal yang

berupa instrumen evaluasi. Konstruksi prototipe berawal dari penulisan butir soal

yang selanjutnya perlu dilakukan penelaahan butir soal.

a. Penulisan butir soal

Penulisan butir soal berpedoman pada spesifikasi butir soal yang telah disusun

agar butir soal yang dihasilkan sesuai dengan kompetensi dasar yang diharapkan.

Jumlah butir soal yang kembangkan sebanyak 10 butir.

b. Menelaah butir soal

Penelaahan butir soal tidak terlepas dari kisi-kisi dan spesifikasi butir soal yang

telah dibuat. Contoh butir soal yang telah dihasilkan dari spesifikasi butir soal

selanjutnya dirakit menjadi lembar penilaian instrumen tes. Berdasarkan lembar

30

instrumen penilaian yang dihasilkan selanjutnya dilakukan telaah oleh guru mata

pelajaran dan dosen ahli. Validator diminta untuk memberikan penilaian

kesesuaian antara indikator dengan butir soal. Telaah dimaksudkan untuk

memudahkan dalam memperoleh informasi terkait butir soal yang telah memenuhi

kriteria atau belum memenuhi kriteria aspek telaah. Mempertimbangkan

keefektifan waktu maka penilaian lembar instrumen dilakukan secara terpisah

oleh masing-masing telaah. Hasil telaah digunakan untuk memperbaiki contoh

butir soal.

Lembar penilaian dirancang tiap butir untuk memudahkan validator dalam

mencermati kedalaman isi butir soal terhadap indikator yang disajikan dan

ketetapan pilihan jawaban yang diberikan. Butir yang sesuai dengan indikator soal

diberi nilai 1 dan butir yang tidak sesuai diberi nilai 2. Jika validator memberi

penilaian tidak sesuai maka diberi tanda check list pada kolom “lemah” dan

memberi saran perbaikan pada butir soal. Jika validator memberi penilaian

“sesuai” maka beri tanda check list pada kolom “kuat”, selanjutnya dihitung

menggunakan Indeks Gregoryuntuk mengetahui validitas isi tes.

4. Tahap tes, evaluasi, dan revisi

Pada tahap ini instrumen AfL berbasis HOTS yang berhasil direalisasikan dilihat

kualitasnya. Hal-hal yang dilakukan adalah menguji validitas instrumen yang

masih berupa prototipe 1 oleh validator. Validasi dilakukan oleh dua orang, yaitu

ahli materi dan ahli media. Berdasarkan hasil uji validasi ini kemudian dilakukan

revisi hingga diperoleh perangkat instrumen AfL berbasis HOTS dalam bentuk

31

prototipe i yang valid untuk kemudian dilakukan uji coba produk untuk

mengetahui validitas konstruks, reliabilitas, dan tingkat kesukarannya.

Pada tahap ini tes dapat berupa uji coba produk, yakni butir soal yang telah dirakit

terlebih dahulu dilakukan uji coba. Uji coba diberikan kepada kelas yang sudah

mendapatkan materi. Sekolah sasaran ini di SMK se-Lampung Timur yang dalam

hal ini diwakili oleh salah satu sekolahan yang tidak termasuk dalam sasaran uji

penelitian. Setelah uji coba penelitian selanjutnya dilakukan pengumpulan lembar

jawaban peserta didik untuk dianalisis secara kuantitatif menggunakan Winsteps.

5. Tahap implementasi

Setelah dilakukan evaluasi dan diperoleh produk yang valid dan dinyatakan

layak, maka produk dapat diimplementasikan pada situasi yang sesungguhnya.

Tahap ini termasuk dalam uji coba lapangan, setelah dilakukan perbaikan butir

soal berdasarkan hasil analisis dari uji coba produk. Uji coba lapangan ini

dilakukan untuk mengukur kemampuan HOTS matematka peserta didik dengan

instrumen AfL berbasis HOTS dengan Politomus Response yang telah

dikembangkan. Setelah uji coba lapangan selesai selanjutnya dilakukan

pengumpulan lembar jawaban peserta didik untuk dianalisis secara kuantitatif

menggunakan Winsteps.

D. Teknik dan Instrumen Pengumpulan Data

1. Teknik pengumpulan data

Teknik pengumpulan data yang digunakan dalam penelitian pengembangan ini

adalah teknik dokumentasi. Menurut Sukmadinata (2012: 221) “Teknik

dokumentasi merupakan suatu teknik pengumpulan data dengan menghimpun dan

32

menganalisis dokumen-dokumen, baik dokumen tertulis, gambar maupun

elektronik”. Teknik dokumentasi yang digunakan untuk mendapatkan data berupa:

lembar Soal Evaluasi, (b) lembar kunci jawaban soal, dan (c) lembar jawaban

siswa. Butir soal yang telah disusun akan dianalisis secara kualitatif dan diujikan

kepada peserta didik. Selanjutnya dilakukan tahap analisis secara kuantitatif.

Berdasarkan hasil analisis tersebut diperoleh butir baik sehingga produk akhir

yang dihasilkan berupa instrumen Assessment for Learning berbasis HOTS untuk

mata pelajaran matematika.

2. Instrumen pengumpulan data

Instrumen pengumpulan data yang digunakan pada penelitian pengembangan ini

meliputi:

a. Kisi-kisi instrumen assessmen for learning berbasis HOTS.

Kisi-kisi instrumen yang digunakan sebagai acuan peneliti untuk menyusun

spesifikasi butir soal.

b. Instrumen assessment for learning berbasis HOTS berbentuk pilihan ganda

beralasan untuk mengukur kemampuan peserta didik.

c. Lembar penilaian instrumen tes untuk mengetahui validitas isi instrumen.

Lembar telaah berisi kriteria yang perlu dinilai terdiri dari kompetensi dasar,

indikator, dan soal mengacu pada spesifikasi butir soal.

d. Lembar telaah tes secara teoritis berdasarkan aspek isi, aspek konstruksi, dan

aspek bahasa untuk mengetahui butir yang telah memenuhi kriteria aspek

telaah.

e. Lembar jawaban peserta didik yang digunakan untuk memperoleh informasi

terkait respons peserta didik.

33

Untuk dapat digunakan suatu tes tersebut perlu dilengkapi dengan pedoman

penskoran. Pedoman penskoran dibentuk untuk menjaga objektivitas penilaian

dan kepastian yang diperoleh peserta didik. Penskoran ini dirancang dalam skala

politomus 1 sampai 4 dengan kriteria skor pada Tabel 3.2.

Tabel 3.2. Kriteria Penskoran Jawaban

Kriteria Jawaban Alasan Skor

1. Jika peserta didik salah dalam menjawab pertanyaan soal

(S) dan salah dalam memberikan alasan (S). S S 1

2. Jika peserta didik salah dalam menjawab pertanyaan soal

(S) namun benar dalam memberikan alasan (B). S B 2

3. Jika peserta didik benar dalam menjawab pertanyaan soal

(B) namun salah dalam memberikan alasan (S). B S 3

4. Jika peserta didik benar dalam menjawab pertanyaan soal

(B) dan benar dalam memberikan alasan (B). B B 4

Penskoran tersebut mengacu pada penentuan skor politomus model Partial Credit

Model dimana jawaban dan opsi memiliki keterkaitan (Retnawati, 2014: 149).

E. Teknik Analisis Data

Teknik analisis data yang digunakan dalam penelitian pengembangan ini adalah

validitas isi, validitas konstruk, reliabilitas, tingkat kesukaran, karakteristik butir

tes uji coba dan kemampuan HOTS matematika.

1. Validitas Isi

Validitas isi ditentukan menggunakan kesepakatan ahli (expert). Kesepakatan ahli

bidang studi atau sering disebut domain yang diukur menentukan tingkatan

validitas isi. Hal ini dikarenakan instrumen pengukuran dibuktikan valid jika ahli

meyakini bahwa instrumen tersebut mengukur penguasaan kemampuan yang

didefinisikan dalam domain ataupun konstruk psikologi yang diukur (Retnawati,

2014: 7). Validator diminta untuk memeriksa ketepatan dan memberikan penilaian

antara kesesuaian butir soal dengan indikator-indikatornya, redaksi penulisan soal,

34

dan kesesuaian pilihan jawaban (pengecoh) pada pilihan ganda. Apabila masih

ada kekeliruan dalam pembuatan instrumen, maka instrumen tersebut direvisi

kembali. Setelah dilakukan pemeriksaan oleh ahli, dalam hal ini sebagai validator,

selanjutnya ahli memberikan penilaian terhadap instrumen. Penilaian tersebut

dapat dilihat pada Tabel 3.3.

Tabel 3.3 Kriteria Penilaian Butir Instrumen Oleh Ahli/Expert

Nilai Keterangan

1 Tidak relevan

2 Cukup relevan

3 Relevan

4 Sangat Relevan

(Arifin dan Retnawati, 2017:101)

Setelah diberikan penilaian oleh ahli, selanjutnya menghitung hasil penilaian

menggunakan indeks validitas. Diantaranya dengan indeks yang diusulkan oleh

Gregory (Retnawati, 2014: 32-33), sebagai berikut:

Tabel 3.4. Tabel Kontingensi untuk Menghitung Indeks Gregory

Rater 1

Lemah Kuat

Rater 2 Lemah A B

Kuat C D

Koefisien validitas isi = �

��

Keterangan:

V = Validitas

A = Penilai I dan II menyatakan lemah

B = Penilai I menyatakan kuat, penilai II menyatakan lemah

C = Penilai I lemah, penilai II menyatakan kuat

D = Penilai I dan II menyatakan kuat

Rentang angka V yang mungkin diperoleh adalah antara 0 sampai dengan 1.

Semakin tinggi angka V (mendekati 1 atau sama dengan 1) maka nilai valid

sebuah item/butir soal juga semakin tinggi, dan semakin rendah angka V

(mengekati 0 atau sama dengan 0) maka nilai kevalidan sebuah item/butir soal

juga semakin rendah. Berdasarkan hasil perhitungan diperoleh rata-rata index

35

Gregory menunjukkan angka 1 yang berarti bahwa instrumen terukur valid

berdasarkan validator. Hasil perhitungan dapat dilihat pada Lampiran 5 Halaman

102.

2. Validitas Konstruk

Untuk membuktikan validitas konstruk dapat dilakukan dengan dua cara, yakni

analisis faktor eksplanatori dan analisis faktor konfirmatori. Pembuktian validitas

konstruk yang digunakan menggunakan analisis faktor eksplanatori. Sebelum

melakukan analisis faktor eksplanatori terlebih dahulu dilakukan uji kecukupan

sampel dengan melihat nilai Kaiser Mayer Olkin (KMO). Nilai KMO diperoleh

melalui analisis dengan bantuan software IBM SPSS 20. Jika nilai KMO lebih dari

0,5 maka variabel dan sampel yang digunakan memungkinkan untuk dilakukan

analisis lebih lanjut (Retnawati, 2014:47). Berdasarkan hasil perhitungan

diperoleh nilai KMO menunjukkan nilai 0,904 > 0,5 ini dapat diartikan bahwa

butir soal sangat baik untuk digunakan. Hasil perhitungan KMO dapat dilihat pada

Lampiran 6 Halaman 103.

Tahap selanjutnya adalah melihat nilai eigen dan screplot dari hasil analisis faktor

eksplanatori, Untuk melihat faktor-faktor yang terbentuk maka yang diperhatikan

adalah nilai eigen yang lebih besar dari 1. Dari faktor yang terbentuk maka dapat

diketahui persentase variansi yang dapat dijelaskan. Jika persentase varians

comulative lebih besar dari 20% atau perbandingan nilai eigen pertama dengan

kedua sebesar 5 atau 4 maka instrumen yang diukur memuat dimensi tunggal atau

bersifat unidimensi (Wells dkk, 2008). Berdasarkan hasil perhitungan diperoleh

nilai eigen yang disajikan pada Tabel 3.5.

36

Tabel 3.5 Total Variance Explained

Total Variance Explained

Component Initial Eigenvalues

Total % of

Variance

Cumulative

%

1 2,127 21,272 21,272

2 1,118 11,181 32,452

3 1,072 10,722 43,174

4 1,009 10,086 53,260

5 ,963 9,631 62,891

6 ,885 8,849 71,740

7 ,859 8,587 80,327

8 ,707 7,066 87,392

9 ,662 6,619 94,011

10 ,599 5,989 100,000

Extraction Method: Principal Component Analysis.

Berdasarkan Tabel 3.5 semua presentase Comulative nilai Eigen > 20 % artinya

instrumen AfL dalam penelitian ini mengukur pada satu faktor atau dimensi. Hasil

perhitungan dapat dilihat pada Lampiran 6 Halaman 103.

3. Estimasi Reliabilitas Instrumen

Teknik analisis data untuk estimasi reliabilitas instrumen ini menggunakan teknik

estimasi konsistensi internal dengan formula Chronbach-alpha yang dibantu

aplikasi IBMSPSS. Jika nilai Chronbach’s Alpha 0,60 dan kurang dari 1, maka

nilai instrumen tersebut memiliki korelasi tinggi atau reliabel, sedangkan jika nilai

Cronbach’s Alpha di bawah 0,50 ke bawah, maka instrumen tersebut berkorelasi

rendah atau tidak reliabel (Basuki dan Hariyanto, 2014:105). Hal ini juga

didukung oleh Surapranata (2009:114), bahwa koefisien reliabilitas sebesar 0,5

dapat digunakan untuk tujuan penelitian. Dalam penelitian ini nilai Chronbach’s

Alpha yang diharapkan adalah 0,60 dan kurang dari 1 yang dibantu dengan

program Winstep. Berdasarkan hasil perhitungan diperoleh bahwa Cronbach’s

Alpha menunjikkan 0,577 > 0,5 ini berarti bahwa instrumen memiliki korelasi

37

tinggi atau reliabel. Hasil perhitungan reliabilitas dapat dilihat pada Lampiran 7

Halaman 104.

4. Tingkat Kesukaran Butir Soal

Tingkat kesukaran digunakan untuk mengetahui kesulitan butir soal dilihat dari

nilai logit tiap butir soal yang dapat dilihat pada kolom measure. Nilai logit yang

tinggi menunjukan tingkat kesulitan soal yang paling tinggi. Pengkategorian

tersebut menggunakan kriteria sebagaimana diberikan pada Tabel 3.5.

Tabel 3.6. Kategori Tingkat Kesukaran

Measure Kategori

>1 Sangat sulit

0 - 1 Sulit

-1 - 0 Mudah

<-1 Sangat mudah

(Sumintono, 2015:70)

Kriteria soal yang digunakan dalam penelitian ini adalah soal yang memiliki nilai

tingkat kesukaran ≥ −1 atau kategori mudah, sulit dan sangat sulit. Berdasarkan

hasil perhitungan diperoleh tingkat kesukaran uji coba instrumen yang disajikan

pada Tabel. 3.7.

Tabel 3.7 Tingkat Kesukaran Butir Soal

Butir Soal Total Skor Tingkat Kesulitan Ketrangan

9 552 0,30 Item Sulit






2 597 -0,08 Item Mudah




Dengan melihat hasil perhitungan tingkat kesukaran butir soal yang diperoleh

maka instrumen AfL berbasis HOTS telah memenuhi kriteria tingkat kesukaran

38

soal yang diharapkan. Hasil perhitungan tingkat kesukaran soal dapat dilihat pada

Lampiran 9 Halaman 106.

5. Analisis Karakteristik Butir Tes Uji Coba

Analisis data dimulai dengan mendeskripsikan kelayakan karakteristik tes objektif

pilihan ganda tingkat SMK menggunakan item respon teori dengan bantuan

Program Winsteps. Program Winsteps digunakan karena memiliki beberapa

keunggulan (Bambang dan Pujiyati, 2011:2), yaitu:

a. Dapat menganalisis data berupa dikotomus dan politomus.

b. Tersedianya hasil analisis teori modern didasarkan pada model maksimum

likelihood menggunakan model logistik satu parameter.

Analisis menggunakan IRT dapat dilakukan dengan menguji asumsi unidimensi

melalui analisis kesesuaian (fit) atau analisis faktor eksplanatori. Butir tes

dilakukan unidimensi jika butir tersebut mengukur satu kemampuan. Jika asumsi

unidimensi telah terpenuhi, maka secara otomatis asumsi independiensi lokal juga

telah terpenuhi. Indikasi bahwa butir tes bersifat unidimensi adalah data

cocok/sesuai (fit) dengan model. Untuk mengetahui apakah model yang

digunakan sesuai butir maka dapat digunakan statistic Infit mean-Squere (IMS)

dan Outfit Mean-Square (OMS).

Statistic IMS dan OMS merupakan tingkat kesesuaian antara data observasi dan

nilai prediksi oleh model. Butir tes dikatakan fit model jika memiliki nilai IMS

dan OMS berkisar dari 0,5 sampai 1,5 (Linacre, 2002). Rentang nilai tersebut

sesuai dengan Tabel 3.8.

39

Tabel 3.8 Rentang Nilai IMS dan OMS

Nilai Implikasi bagi pengukuran

>2,0 Merusak sistem pengukuran

1,5 – 2,0 Tidak mempunyai makna bagi pengukuran

0,5 – 1,5 Bermanfaat bagi pengukuran

< 0,5 Tidak bermanfaat bagi pengukuran, tetapi tidak merusak

Analisis IRT juga menghasilkan informasi mengenai hasil pengukuran. Fungsi

informasi digunakan untuk mengukur seberapa besar kemampuan butir

memberikan informasi kepada responden. Informasi pengukuran ini berdasar pada

hubungan antara tes dengan individu (Sumintono & Widhiarso, 2015).

Berdasarkan hasil perhitungan diperoleh nilai maksimum fungsi informasi dari

butir soal adalah 4, 875 ini berarti butir soal mempunyai fungsi informasi yang

cukup untuk instrumen penilaian. Hasil perhitungan dapat dilihat pada Lampiran

10 Halaman 108.

6. Kemampuan HOTS Matematika Peserta Didik

Setelah diperoleh hasil soal tes yang valid dan reliabel, maka soal tes tersebut

akan diujikan kepada subjek penelitian. Skor total tiap peserta didik diperleh

dengan cara yaitu menjumlah skor setiap nomor soal peserta didik. Persentase

pencapaian hasil belajar peserta didik diperoleh dengan rumus (Wulan,dkk, 2017):

Nilai = ∑ ��

�� × 100

Adapun kategori hasil belajar ranah kognitif peserta didik dapat disajikan pada

Tabel 3.9.

Tabel 3.9. Kategori HOTS Peserta didik

Nilai Kategori

81 – 100 Sangat Baik

61 - 80 Baik

41 – 60 Cukup

21 - 40 Kurang

0 - 20 Sangat Kurang

40

Hasil perihitungan presentase pencapean hasil belajar disajikan pada Tabel 3.10,

Gambar 3.1 dan peritungan lengkapnya bisa dilihat pada Lampiran 11 Halaman

109.

Tabel 3.10 Jumlah Siswa dalam Pencapaian HOTS pada AfL

Kategori Jumlah Siswa

Sangat Baik 3

Baik 153

Cukup 241

Kurang 5

Sangat Kurang 0

Jumlah 402

Gambar 3.1. Presentase Pecapaian HOTS pada AfL

SANGAT

BAIK

1%

BAIK

38%

CUKUP

60%

KURANG

1%

V. KESIMPULAN DAN SARAN

A. Kesimpulan

Berdasarkan pembahasan dan tujuan penelitian pengembangan yang dilakukan

dapat disimpulkan bahwa :

1. Keseluruhan butir soal assessment for learning berbasis HOTS dengan

politomus response yang telah dikembangkan memenuhi asumsi dari model

PCM, yaitu unidimensi, indenpendensi local dan inverensi parameter

kemampuan.


politomus response yang telah dikembangkan valid berdasarkan validasi isi

dan konstruk.


politomus response yang telah dikembangkan reliabel atau handal


politomus response yang telah dikembangkan memiliki rata-rata tingkat

kesukaran sedang

5. Instrumen butir soal assessment for learning berbasis HOTS dengan

politomus response pada mata pelajaran matematika jenjang SMK memiliki

kemampuan informasi yang cukup.

64



kemampuan untuk mengukur pencapaian HOTS peserta didik.



kemampuan untuk menganalis respon jawaban peserta didik dengan baik.

B. Saran

Berdasarkan kesimpulan dikemukakan saran sebagai berikut:

1. Bagi guru yang akan mengukur kemampuan HOTS peserta didik dalam mata

pelajaran matematika khususnya pada kompetensi dasar yang digunakan pada

penelitian ini dapat menggunakan instrumen yang dikembangkan ini karena

sudah teruji karakteristiknya.

2. Bagi peneliti lain yang akan mengembangkan lebih luas agar memperdalam

kembali pemanfaatan dari pengembangan instrumen yang dikembangkan ini.

DAFTAR PUSTAKA

Abdullah, L.H. 2013. Sistem Penilaian dalam Kurikulum 2013.

(http://www.academic.edu/5253890/sistem_penilaian_dalam_kurikulum_

2013_kajian_dokumen).

Anisa. 2013. Perbandingan Penskoran Dikotomi dan Politomi dalam Teori

Respon Butir untuk Pengembangan Bank Soal Mata Kuliah Matematika

Dasar. Jurnal Matematika, Statistika dan Komputasi. Vol. 9 No. 2 Hal:

95-113.

Arifin, Zainal dan Retnawati, Heri. 2017. Pengembangan Instrumen Pengukur

Higher Order Thinking Skills Matematika Siswa SMA Kelas X. Jurnal

Pendidikan Matematika. Vol. 12. No. 1. Hal:98-108.

Arikunto, S. 2012.Dasar-Dasar Evaluasi Pendidikan Edisi Revisi. Jakarta: Bumi

Aksara.

Bambang, Subali dan Pujiyati, Suyata. 2011. Panduan Analisis Data Pengukuran

Pendidikan untuk Memperoleh Bukti Empirik Kesahihan menggunakan

Program Quest. Yogyakarta: Lembaga Penelitian dan pengabdian pada

Masyarakat Universitas Negeri Yogyakarta.

Basuki, I. & Hariyanto. 2014. Asesmen pembelajaran. Bandung : PT. Remaja

Rosdakarya.

Chandrasegaran, A.L, Treagust, D, dan Mocerino, M. 2007. The Development of

A Two-Tier Multiple-Choice Diagnostic Instrument for

EvaluatingSecondary School Students’ Ability to Describe And Explain

Chemical Reactions Using Multiple Levels Of Representation.[Online].

Chemistry Education Research and PracticeVol. 8 No. 3 Hal: 293-307.

Cheng, Y. C. 2005. New Paradigma for Re-engineering Education, Globalization,

Localization and Induvidualization. Netherland: Spinger.

Daryanto. 2008. Evaluasi Pendidikan. Jakarta: Rineka Cipta.

Demars, C.E. 2010. Item Response Theory. New York: Oxford University Press.

66

Hambleton, R.K., Swaminahan, H., dan Rogers, H.J. 1991. Fundamental of Item

Response Theory. Newbury, CA: Sage Publication Inc.

Hidayati, Arini Ulfah. 2017. Melatih Keterampilan Tingkat Tinggi dalam

Pembelajaran Matematika pada Siswa Sekolah Dasar. [Online]. Jurnal

Pendidikan dan Pembelajaran Dasar. Vol 4 No. 2 Hal:143-156.

Huriaty, Dina. 2015. Metode Kalibrasi dan Desain Tes Berdasarka Teori Respons

Butir (IRT). Jurnal Pendidikan Matematika. Vol. 1. No. 3. Hal: 191-199.

Isgiyanto, Awal. 2011. Diagnosis kesalahan Siswa Berbasis Penskoran Politimus

Model Partial Credit pada Matematika. [Online]. Jurnal Penelitian dan

Evaluasi Pendidikan. Vol. 2. No. 2. Hal: 308-325.

Kemendikbud. 2013. Permendikbud Nomor 70 Tahun 2013 TentangKerangka

Dasar dan Struktur Kurikulum Sekolah Menengah Kejuruan/Madrasah

Aliyah Kejuruan. Jakarta: Kementrian Pendidikan dan Kebudayaan RI.

. 2014. Permendikbud Nomor 60 Tahun 2014 Tentang Kurikulum

2013 Sekolah Menegah Kejuruan/Madrasah Aliyah Kejuruan. Jakarta:

Kementrian Pendidikan dan Kebudayaan RI.

. 2014. Permendikbud Nomor 104 Tahun 2014 Tentang Pendidik

Pada Pendidikan Dasar dan Pendidikan Menengah. Jakarta: Kementrian

Pendidikan dan Kebudayaan RI.

Krathwohl, D.R. 2002. A Revision of Bloom’s Taxonomy: An Overview. Theory

Into Practice. Vol. 41. No. 2. Hal: 212-218.

Laily, Nur Rochman dan Wisudawatim Widi Asih. 2015. Analisis Soal Tipe

Higher Order Thinking Skill (HOTS) dalam Soal UN Kimia SMA Rayon

B Tahun 2012/2013. [Online]. Kaunia. Vol XI. No,1. Hal: 27-39.

Linacre, J. M. 2012. Winstep : Rasch-Model Computer Programs. Chicago:

Winsteps.com

Makmun, A.S. 2007. Psikologi Kependidikan Perangkat sistem Pengajaran

Modul. Bandung: Rosdakarya.

Malhotra, Naresh K. 2006. Riset Pemasaran. Jakarta: Eirlangga.

Mansyur. 2011. Pengembangan Model Assessment for Learning pada

Pembelajaran Matematika di SMP. Jurnal Penelitian dan Evaluasi

Pendidikan. Vol. 1. No. 1. Hal:71-91.

Mardapi, D. 2008. Teknik Penyusunan Instrumen Tes dan Non Tes. Yogyakarta:

Mitra Cendika.

67

Naga. D.S. 1992. Pengantar Teori Sekor pada Pengukuran Pendidikan. Jakarta:

Gunadarma.

Nitko, A.J dan Brookhart, S.M. 2007. Educational Assessment of Student. New

Jersey: Pearson Education.

Noma, Dwi Luciana, Prayitno, Adi Baskoro dan Suwarno. 2016. PBL untuk

Meningkatkan Kemampuan Berpikir Tingkat Tinggi Siswa Kelas X

SMA. Bioedukasi. Vol 9. No. 2. Hal:62-66

Paryanto dan Sudiyatno, 2011. Implementasi Model Assesment for Learning

(AfL) pada pembelajaran Proses Pemesinan di Jurusan Pendidikan

Teknik Mesin FT UNY. JPTK. Vol. 20. No. 1. Hal: 43-66.

Plomp, Tj. 1997. Educational Design: Introduction. Form Tjeerd Plomp (eds).

Educational & Training System Design:Introduction. Design of

Education and Training (in Dutch). Utrecht (The Netherlands): Lemma.

Netherland. Faculty of Educational Science and Technology, University

of Twente. Enschede the Netherlands.

Retnawati, H. 2014. Teori Respons Butir dan Penerapannya untuk Peneliti,

Praktisi Pengukuran dan Pengujian, Mahasiswa Pascasarjana.

Yogyakarta: Nuha Medika.

Rojewski, J.W. 2009. A Conceptual Framework for Tecnical and Vocational

Education and Training. International Handbook of Education for the

Changing World of Work, Bridging Academic and Vocational learning.

Germany: Springer.

Rosidin, Undang. 2017. Evaluasi dan Asesmen Pembelajaran. Media Akademi:

Yogyakarta.

Sappaile, Intang Baso. 2007. Konsep Instrumen Penelitian Pendidikan. Jurnal

Pendidikan dan Kebudayaan. Vol. 6. No.066 Hal:379-391.

Saputra, Hatta. 2016. Pengembangan Mutu Pendidikan Menuju Era Global:

Penguatan Mutu Pembelajaran dengan Penerapan HOTS (High Order

Thinking Skills). Bandung: SMILE’s Publishing.

Sudiyanto, Kartowagiran, Bandrun, dan Mulyadi. 2015. Pengembangan Model

Assessment as Learning Pembelajaran Akutansi di SMK. Jurnal

Pendidikan dan Evaluasi Pendidikan. Vol 19. No. 2. Hal:189-201.

Sukmadinata, Nana Syaodih. 2012. Metode Penelitian Pendidikan. Bandung:

Remaja Rosdakarya.

Sumintono. B., dan Widhiarso, W. 2014.Aplikasi Model Rasch Untuk Penelitian

Ilmu-Ilmu Sosial. Cimahi: Trimkomunikata.

68

Surapranata, S. 2009. Analisis, validitas, reliabilitas, dan interpretasi hasil tes

implementasi kurikulum 2004. Bandung : PT. Remaja Rosdakarya.

Sutanto, A. 2013. Teori Belajar dan Pembelajaran di Sekolah Dasar. Jakarta:

Kencana Prenada Media Group.

Suwarto. 2012. Pengembangan Tes Diagnostik dalam Pembelajaran. Jogjakarta:

Graha Ilmu.

Triwiyono, Endri. 2017. Pengembangan Asessment for Learning (Afl) melalui

Lesson Study pada Praktik Pemesinan SMK Sesuai Kurikulum 2013.

Jurnal Dinamika Vokasional Teknik Mesin. Vol. 2 No. 1 Hal: 28-36.

Tuysuz. 2009. Development of Two-Tier Diagnostic Instrument and Assess

Students’ Understanding In Chemistry. Academic Journal. Vol 4. No 6.

Hal:626-631.

Uno, Hamzah. 2012. Assesment Pembelajaran. Jakarta: Bumi Aksara.

Welss, C, S, Hambleton, R.K, dan Urip Purwono. 2008. Polytomus Response IRT

Model and Applications. Makalah disajikan dalam pelatihan asesmen

pendidikan da psikolog (psikometri), di PPs Universitas Negeri

Yogyakarta.

Wulan, D.A., Susanti., E., dan Asiyah, N.2017. Meningkatkan Kemampuan

Tingkat Tinggi Siswa Menggunakan Problem Promthing. JES MAT.

3(2): Hal.205-216.

Young, E. 2005. Assessment for Learning: Embedding and Extending.

(http://www.itscotland.org.uk/assess/for/index.asp.).

Documents

PENGEMBANGAN INSTRUMEN ASSESSMENT FOR ...digilib.unila.ac.id/59597/3/TESIS TANPA BAB PEMBAHASAN.pdfTK PGRI 1 Bandar Agung pada tahun 2000, pendidikan dasar di SD Negeri 2 Bandar Agung