View
228
Download
0
Category
Preview:
Citation preview
Prosiding Seminar Nasional 9 Mei 2015
[ 384 ] P a g e
BAGIAN 3. PENILAIAN PEMBELAJARAN
SOFTWARE ANBUSO SEBAGAI ALAT ANALISIS BUTIR SOAL
YANG PRAKTIS DAN APLIKATIF
Ali Muhson, Barkah Lestari, Supriyanto & Kiromim BarorohFakultas Ekonomi, Universitas Negeri Yogyakarta
alimuchson@yahoo.com
AbstrakPenelitian ini bertujuan untuk mengembangkan, menguji kelayakan softwareAnBuso, dan mengidentifikasi kendala penggunaannya. Penelitian danpengembangan ini menggunakan dokumentasi, kuesioner dan wawancara untukmengumpulkan data. Data yang terkumpul dianalisis secara deskriptif. Penelitianini menghasilkan software AnBuso dan buku panduan yang dapat dimanfaatkanguru dalam melakukan analisis butir soal secara praktis dan aplikatif. Softwaretersebut dinilai sangat layak oleh guru dilihat dari aspek kepraktisan dankemudahan, kebermanfaatan, substansi isi, dan tampilan. Kendala yang dihadapiguru dalam menggunakan software ini terkait dengan lemahnya penguasaanguru terhadap program Microsoft Excel, kurang terbiasanya melakukan analisisbutir soal, pemahaman konsep analisis butir soal yang terbatas, dan kendalateknis yang terdapat dalam software.
Kata Kunci: AnBuso, kelayakan, analisis butir soal
PENDAHULUAN
Pendidikan merupakan kunci utama kemajuan bangsa sehingga upaya
peningkatan kualitas pendidikan harus terus dilakukan agar Indonesia mampu bersaing
di kancah dunia global. Potret kualitas pendidikan di Indonesia masih memprihatinkan.
UNESCO pada tahun 2011 melaporkan bahwa indeks Education Development Index (EDI)
Indonesia belum beranjak dari kategori sedang (medium) dan berada di peringkat ke-57
dari 115 (UNESCO, 2011). Sementara itu The United Nations Development Programme
(UNDP) tanggal 24 Juli 2014 melaporkan Human Development Index (HDI) Indonesia
menempati peringkat 108 dari 187 negara, sementara Singapura di posisi 9, Malaysia
(62), Thailand (89) (UNDP, 2014). Hal ini menunjukkan bahwa kondisi kualitas
pendidikan di Indonesia masih perlu ditingkatkan agar tidak ketinggalan dengan negara
lain.
Proses pembelajaran menjadi bagian yang penting dalam menentukan kualitas
pendidikan secara keseluruhan. Hal ini mengindikasikan bahwa pendidik memiliki peran
yang sangat sentral dalam meningkatkan kualitas pendidikan. Peran pendidik tersebut
tidak hanya dalam merancang dan melaksanakan pembelajaran saja melainkan juga
dalam melakukan asesmen proses dan hasil belajar. Asesmen merupakan komponen
yang penting dalam pembelajaran (Russel & Airasian, 2012: 2), karena memiliki
pengaruh yang kuat dalam meningkatkan proses pembelajaran (Raymond, et.al., 2012;
Bers, 2008: 32) bahkan penggunaan prosedur asesmen yang benar dapat memberikan
kontribusi langsung kepada peningkatan belajar peserta didik (Miller, Linn & Gronlund,
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
P a g e [ 385 ]
2009: 34). Oleh karena itu, guru harus mampu mengembangkan alat asesmen yang baik
yang mampu memotret secara tepat kompetensi yang telah dicapai peserta didik.
Guna mengukur tingkat ketercapaian tujuan pendidikan perlu dikembangkan alat
asesmen yang mampu mengungkap seluruh komponen yang ingin dicapai dalam
pembelajaran. Asesmen merupakan kegiatan pengumpulan bukti-bukti tentang
pembelajaran siswa sebagai informasi untuk pengambilan keputusan dalam
pembelajaran (Stiggins & Chappius, 2012: 3). Oleh karena itu agar keputusan yang
diambil tepat, asesmen harus memperhatikan keseluruhan aspek yang akan diukur agar
mampu menggambarkan dengan tepat sasaran yang dituju.
Pemberlakuan kurikulum 2013 dalam implementasinya masih banyak mengalami
masalah (Republika, 2014), misalnya timbul masalah sulitnya mengubah mindset guru
(Metronews, 2014; Tempo, 2013). Hasil kajian juga menunjukkan bahwa sebanyak 87
persen guru masih kesulitan dalam memahami cara asesmen autentik (Susilowati, 2013).
Satu hal yang membuat guru repot adalah sistem asesmen yang memiliki terlalu banyak
aspek (Tempo, 2014). Hal ini mengindikasikan bahwa kemampuan guru untuk
melakukan asesmen secara baik masih perlu ditingkatkan.
Asesmen adalah upaya sistematis dalam mengumpulkan, mengkaji, dan
menggunakan informasi tentang program-program pendidikan yang dilakukan untuk
tujuan meningkatkan dan mengembangkan pembelajaran (Banta, Palomba, & Kinzie,
2014: 2). Dengan demikian dalam asesmen terdapat proses pengumpulan informasi,
pengkajian dan penggunaan informasi tersebut untuk membuat keputusan pembelajaran
agar dapat meningkatkan proses pembelajaran.
Agar asesmen menghasilkan informasi yang tepat maka perlu dilakukan dengan
baik dengan cara mengumpulkan bukti akurat terkait pencapaian hasil belajar siswa dan
menjadikan proses asesmen kelas dan hasilnya bermanfaat bagi siswa, yaitu mampu
meningkatkan motivasi dan prestasi belajarnya (Stiggins & Chappuis, 2012: 3). Dengan
demikian, asesmen harus dapat menilai kemajuan belajar siswa. Informasi tersebut dapat
digunakan sebagai dasar untuk mengambil suatu keputusan tentang status siswa dalam
kelompoknya dan menentukan langkah-langkah selanjutnya. Oleh karena itu dalam
melakukan asesmen hasil pembelajaran perlu dirancang langkah-langkahnya secara rinci
agar mampu memotret kompetensi siswa secara tepat.
Asesmen membantu guru dalam memperjelas tujuan pembelajaran dan
pencapaiannya, menciptakan pengalaman yang menerapkan pengetahuan dalam konteks
kehidupan nyata, dan memberikan berbagai cara bagi siswa untuk menunjukkan
kemampuan dan keterampilan mereka (Darling-Hammond, 2014: 54). Prosedur asesmen
yang digunakan dengan benar dapat memberikan kontribusi langsung kepada
peningkatan belajar siswa, yakni (1) mengklarifikasi sifat hasil belajar yang dimaksud,
(2) menyiapkan tujuan jangka pendek agar terarah, (3) memberikan umpan balik
terhadap kemajuan belajar, (4) memberikan informasi dalam mengatasi kesulitan belajar
dan untuk memilih pengalaman belajar masa depan, dan (5) mengidentifikasi tujuan
Prosiding Seminar Nasional 9 Mei 2015
[ 386 ] P a g e
pembelajaran berikutnya (Miller, Linn & Gronlund, 2009: 34). Prosedur tersebut
merupakan langkah yang saling berkaitan dan menentukan langkah berikutnya.
Asesmen juga bertujuan menjaga keseimbangan kelas, merencanakan dan
melaksanakan pembelajaran, menempatkan siswa, memberikan umpan balik dan
penghargaan, mendiagnosis masalah siswa, dan menilai tingkat kemajuan akademik
(Russell & Airasian, 2012: 5-8). Hal ini mengindikasikan bahwa melalui asesmen dapat
ditentukan rancangan pembelajaran berikutnya dengan cara mendiagnosis masalah yang
dihadapi siswa agar prestasi akademik siswa dapat berkembang secara optimal.
Pendapat lain juga menyatakan bahwa ada tiga tujuan utama dilakukannya
asesmen. Pertama, untuk memantau kemajuan pendidikan atau perbaikan. Pendidik,
pembuat kebijakan, orang tua dan masyarakat ingin tahu berapa banyak siswa mencapai
standar kinerja yang ditentukan. Tujuan ini, sering disebut asesmen sumatif. Tujuan
kedua adalah untuk memberikan umpan balik kepada guru dan siswa. Para guru dapat
menggunakan umpan balik untuk memperbaiki proses pembelajaran, dan siswa dapat
menggunakan umpan balik untuk memantau pembelajaran mereka sendiri. Tujuan ini,
sering disebut asesmen formatif. Tujuan ketiga asesmen adalah untuk mendorong
perubahan dalam praktek dan kebijakan untuk mencapai perubahan yang diinginkan.
Tujuan ini, disebut asesmen akuntabilitas (National Research Council, 1999, 1-2). Dengan
demikian asesmen dapat berfungsi untuk memantau kemajuan pembelajaran,
memberikan informasi sebagai dasar pemberian umpan balik, dan melakukan perbaikan
pembelajaran.
Dalam melakukan asesmen kelas tidak dapat dilakukan dengan mudah namun
harus mendasarkan pada beberapa kriteria. Beberapa kriteria yang harus dipenuhi dalam
melakukan asesmen kelas adalah validitas, reliabilitas, terfokus pada kompetensi,
komprehensif, objektivitas, dan mendidik (Puskur, 2008). Pendapat lain juga menyatakan
bahwa agar hasil asesmen dapat memberikan informasi yang tepat maka harus
memenuhi validitas, reliabilitas, dan objektivitas (Anderson, 2003: 10; Kubiszyn &
Borich, 2013: 326). Dengan demikian, validitas dan reliabilitas menjadi bagian yang
penting dalam kegiatan asesmen agar informasi yang dihasilkan sesuai dengan yang
diharapkan.
Item analyses play a somewhat more important role in construct and predictive
validation (Nunnally & Bernstein, 1994: 304). Hal ini berarti analisis butir menjadi bagian
yang penting dalam menjamin validitas butir soal. Tiga hal yang diperhatikan dalam
melakukan analisis butir soal adalah tingkat kesukaran, daya beda dan distraktor.
Tingkat kesukaran suatu butir soal merupakan salah satu parameter butir soal yang
sangat berguna dalam penganalisian suatu tes. Hal ini disebabkan karena dengan melihat
parameter butir ini, akan diketahui seberapa baiknya kualitas suatu butir soal. Jika
tingkat kesukaran mendekati 0, maka soal tersebut terlalu sukar, sedangkan jika tingkat
kesukaran mendekati 1, maka soal tersebut terlalu mudah. Soal yang terlalu sukar dan
terlalu mudah perlu dibuang karena butir tersebut tidak dapat membedakan kemampuan
seorang siswa dengan siswa lainnya. Indeks kesukaran suatu butir yang baik terletak
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
P a g e [ 387 ]
dalam kategori sedang yakni pada interval 0,30 – 0,70 (Allen & Yen, 1979: 121; Kaplan &
Saccuzzo, 2005: 170; Sudjana, 2011: 137). Pada interval ini, informasi tentang
kemampuan siswa akan diperoleh secara maksimal.
Kriteria kedua yang perlu diperhatikan adalah daya beda butir soal. Daya beda
butir merujuk pada kemampuan butir soal untuk membedakan peserta tes yang
berkemampuan tinggi dan berkemampuan rendah. Untuk menentukan daya pembeda
dapat menggunakan indeks diskriminasi, indeks korelasi biserial, indeks korelasi point
biserial, dan indeks keselarasan. Indeks daya pembeda suatu butir yang kecil nilainya
akan menyebabkan butir tersebut tidak dapat membedakan siswa yang kemampuannya
tinggi dan siswa yang kemampuannya rendah. Jika nilai daya beda rendah menunjukkan
adanya kemencengan distribusi skor dari populasi sehingga mengakibatkan validitas tes
menjadi rendah. Indeks daya beda dikatakan baik jika lebih besar atau sama dengan 0,3
(Nunnally & Bernstein, 2009: 304; Kaplan & Saccuzzo, 2005: 176; Azwar, 2003: 153).
Sementara itu koefisien antara 0,20 – 0,29 dianggap cukup baik (Alagumalai & Curtis,
2005: 8) dan koefisien di bawah 0,2 dianggap tidak baik sehingga perlu dibuang (Ebel &
Frisbie, 1991: 232; Crocker & Algina, 2006: 315).
Khusus untuk tes objektif bentuk multiple choice perlu dilengkapi dengan
beberapa alternatif jawaban, atau yang sering dikenal dengan istilah option. Option atau
alternatif itu jumlahnya berkisar antara 3 sampai dengan 5 buah, dan dari kemungkinan-
kemungkinan jawaban yang terpasang pada setiap butir item itu, salah satu di antaranya
adalah merupakan jawaban betul (kunci jawaban) sedangkan yang lainnya salah.
Alternatif jawaban salah itulah yang biasa dikenal dengan istilah distractor (pengecoh).
Pada kenyataannya bisa terjadi alternatif yang diberikan pada butir tertentu sama sekali
tidak dipilih oleh peserta tes. Hal ini berarti alternatif tersebut tidak mampu berfungsi
sebagai pengecoh yang baik. Pengecoh dinyatakan telah dapat menjalankan fungsinya
dengan baik apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5 % dari
seluruh peserta tes.
Asesmen akan menjadi bermakna dalam proses pembelajaran manakala hasil
asesmen tersebut dimanfaatkan dan ditindaklanjuti. Umpan balik asesmen merupakan
bagian yang tidak terpisahkan dari sebuah proses pembelajaran dan asesmen itu sendiri.
Umpan balik bukanlah hal yang asing dalam dunia pendidikan dan asesmen (Irons, 2008:
1). Umpan balik akan sangat bermakna jika dilakukan secara tepat (Brookhart, 2008: 2)
karena dapat meningkatkan proses pembelajaran (Irons, 2008: 7). Hasil penelitian juga
menunjukkan bahwa umpan balik berdampak positif terhadap hasil belajar (James &
Folorunso, 2012; Delacruz, 2012). Artinya diperlukan kemampuan dan strategi khusus
dalam memberikan asesmen yang baik serta feedback (umpan balik) yang tepat agar
mampu meningkatkan kualitas pembelajaran. Oleh karena itu sudah selayaknya jika guru
memiliki kompetensi yang memadai dalam melakukan asesmen dan umpan balik.
Umpan balik merupakan bukti yang menegaskan atas kebenaran suatu tindakan
(Wiggins, 1993: 185). Umpan balik dikonseptualisasikan sebagai informasi yang
diberikan oleh perantara (misalnya, guru, teman sebaya, buku, orang tua, diri,
Prosiding Seminar Nasional 9 Mei 2015
[ 388 ] P a g e
pengalaman) mengenai aspek kinerja atau pemahaman seseorang (Hattie & Timperley
2007). Umpan balik formatif adalah setiap informasi, proses atau kegiatan yang memberi
atau mempercepat belajar siswa berdasarkan komentar yang berkaitan dengan asesmen
formatif dan kegiatan asesmen sumatif (Irons, 2008: 7). Umpan balik formatif biasanya
disajikan sebagai informasi kepada peserta didik dalam menanggapi beberapa tindakan
peserta didik. Bentuknya dapat berupa berbagai jenis (misalnya, verifikasi akurasi
respon, penjelasan jawaban yang benar, petunjuk, pemberian contoh) (Shute 2007: i).
Pengertian tersebut menunjukkan bahwa umpan balik merupakan sesuatu yang
diberikan untuk dapat mengkaji apa yang telah dilakukan. Umpan balik itu sendiri adalah
salah satu upaya untuk mengobservasi siswa berkaitan dengan bagaimana mereka
melakukan aktivitas serta apa yang harus dilakukan guru untuk meningkatkan
kemampuan siswa.
Tujuan utama dari umpan balik formatif adalah untuk meningkatkan
pengetahuan, keterampilan, dan pemahaman peserta didik (misalnya, pemecahan
masalah) (Shute, 2007: 6) karena itu umpan balik harus bersifat interaktif, meningkatkan
motivasi dan berupaya memecahkan masalah (Langer, 2011). Peterson & Irving (2008)
dalam penelitiannya menjelaskan bahwa ternyata siswa berpandangan umpan balik
dapat memberikan informasi dan balikan yang baik kepada mereka. Komentar yang
diberikan dalam umpan balik formatif hanya dapat efektif jika siswa membaca dan
memanfaatkannya (Higgins & Hartley, 2002). Umpan balik dapat digunakan untuk
meningkatkan efektivitas pembelajaran di kelas (Hattie & Timperley, 2007). Umpan balik
yang diberikan kepada peserta didik jika diberikan secara tepat akan membantu mereka
meningkatkan kinerjanya, memberikan ide tentang bagaimana mereka berkembang,
meningkatkan motivasi dan memberdayakan mereka sebagai peserta didik (Harvey,
2011: 20). Dengan demikian dapat dikatakan bahwa umpan balik memiliki peran yang
penting dalam proses pembelajaran, artinya melalui umpan balik dapat mengarahkan
proses pembelajaran sesuai dengan tujuan yang ingin dicapai.
Kajian di atas menunjukkan bahwa asesmen pembelajaran merupakan kegiatan
yang penting dilakukan. Asesmen harus mampu mengukur secara tepat kompetensi
peserta didik sehingga instrumen yang digunakan haruslah valid. Analisis butir soal
memiliki peran penting untuk mengidentifikasi butir soal yang baik. Hasil asesmen juga
memberikan informasi yang akurat tentang kemampuan peserta didik sehingga dapat
diidentifikasi materi mana yang dianggap sulit, bahkan hasil analisis juga memberikan
informasi tentang materi mana yang belum dikuasai oleh masing-masing peserta didik
sehingga dapat dilakukan upaya perbaikan melalui kegiatan remedial. Guna memenuhi
hal tersebut perlu dikembangkan sebuah software analisis soal yang praktis dan aplikatif
sehingga dapat memotivasi guru senantiasa melakukan analisis butir soal.
Berbagai software analisis butir soal memang sudah banyak dikembangkan oleh
para ahli namun belum dimanfaatkan secara optimal oleh guru. Hal itu terjadi karena
sebagian besar software berbahasa asing sehingga sulit untuk memahami cara
penggunaannya. Software tersebut juga cukup rumit untuk digunakan dan kurang praktis
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
P a g e [ 389 ]
dan aplikatif. Informasi yang diberikan dalam software tersebut juga ditampilkan dalam
format yang sangat beragam sehingga mempersulit guru untuk menguasainya. Oleh
karena itu perlu dikembangkan software analisis butir soal yang praktis dan aplikatif
sesuai dengan kebutuhan guru di lapangan.
Guna memenuhi tuntutan tersebut, Muhson, dkk (2013) telah berhasil
mengembangkan software yang diberi nama AnBuso (Analisis Butir Soal). Dalam
software AnBuso tersebut dapat diketahui baik tidaknya soal yang dibuat guru, baik dari
sisi daya beda, tingkat kesulitan, maupun efektivitas distraktornya. Di samping itu dalam
software tersebut juga memberikan informasi tentang kemampuan seluruh siswa dan
tingkat ketercapaian KKM (Kriteria Ketuntasan Minimal). Software ini juga dirancang
untuk mampu mengidentifikasi dan mengelompokkan siswa yang masuk dalam program
remedial berdasarkan materi yang belum dikuasai sehingga akan mempermudah guru
dalam pelaksanaan program remedial. Semua hasil analisis tersebut sudah ditampilkan
dan dapat dicetak dalam format laporan yang sangat mudah untuk dibaca dan ditafsirkan.
Hasil ujicoba terbatas ditemukan bahwa keberadaan software AnBuso disambut
positif oleh guru sebagai alternatif untuk melakukan analisis butir soal. Bahkan beberapa
guru yang telah menggunakan AnBuso merasa bahwa software ini lebih mudah
digunakan, praktis, dan aplikatif sehingga mereka mengaku selalu menggunakan
software AnBuso dibandingkan dengan software lain (Muhson, dkk, 2013).
Hasil temuan di atas menunjukkan bahwa software AnBuso yang dikembangkan
pada tahap awal ini telah direspon positif oleh guru serta sangat bermanfaat dan siap
untuk digunakan. Sebagai produk awal, perlu lebih dikembangkan dan disempurnakan
lagi agar kelemahan dan kekurangan yang ada di software tersebut dapat diatasi. Oleh
karena itu software tersebut perlu dikaji dan diujicoba lagi dengan melibatkan guru dan
pengawas yang lebih banyak agar diperoleh masukan yang lebih kompehensif. Penelitian
ini dimaksudkan untuk mengetahui kelayakan dan mengidentifikasi kendala yang
dihadapi dalam menggunakan software AnBuso. Tujuan akhirnya adalah menghasilkan
produk berupa software AnBuso yang siap untuk dipublish kepada khalayak sasaran.
METODE
Penelitian ini menggunakan model Research and Development (R & D). Prosedur
pengembangan dilakukan dengan langkah perancangan dan pengembangan produk,
validasi produk, uji coba produk, dan diseminasi produk. Kegiatan perancangan dan
pengembangan produk sudah dilakukan sampai pada tahap ujicoba produk tetapi masih
pada ujicoba terbatas. Penelitian ini berusaha untuk melanjutkan pengembangan produk
dengan melakukan ujicoba produk pada khalayak yang lebih luas agar diperoleh
informasi dan masukan yang lebih komprehensif untuk kepentingan penyempurnaan
produk.
Penelitian ini melibatkan guru-guru dan pengawas sekolah di DIY. Responden
yang dilibatkan 65 orang yang berasal dari lima kabupaten/kota di provinsi DIY.
Penentuan responden dilakukan secara purposive sampling dengan mempertimbangkan
Prosiding Seminar Nasional 9 Mei 2015
[ 390 ] P a g e
kemampuan guru dalam penguasaan komputer, khususnya program aplikasi Microsoft
Excel.
Teknik pengumpulan data yang digunakan dalam penelitian ini meliputi observasi,
dokumentasi, angket, dan wawancara. Observasi digunakan untuk memperoleh data atau
informasi tentang kemampuan guru dalam menggunakan program aplikasi yang telah
dikembangkan. Hal ini diperlukan untuk diperoleh data tentang kemampuan guru dalam
penggunaan software yang telah dikembangkan.
Teknik dokumentasi dalam penelitian ini digunakan untuk memperoleh data
tentang dokumen tes yang digunakan guru dalam mengukur kemampuan peserta didik,
baik tes formatif maupun tes sumatif. Dokumen tersebut dapat berupa soal-soal ujian dan
ulangan harian, program remedial, dan hasil analisis butir soal yang selama ini digunakan
guru.
Angket digunakan untuk mengungkap masukan-masukan yang diperlukan dari
guru, pengawas, pejabat dinas pendidikan dan para pakar. Angket ini juga sekaligus
digunakan untuk mengukur tingkat kelayakan dari software yang telah dikembangkan.
Angket yang dikembangkan meliputi angket kelayakan software baik yang terkait dari
sisi tampilan, substansi materi/isi, aspek kebermanfaatan, dan aspek kepraktisan dan
kemudahan. Teknik terakhir yang digunakan adalah wawancara yang dilakukan kepada
guru, pengawas, pejabat Dinas Pendidikan dan para pakar. Teknik ini digunakan untuk
mengungkap berbagai kelebihan dan kelemahan dari software yang dikembangkan agar
dapat dijadikan sebagai masukan untuk penyempurnaan.
Analisis data yang digunakan meliputi analisis deskriptif. Analisis yang dilakukan
meliputi analisis kelayakan software baik dilihat dari sisi tampilan, substansi materi/isi,
maupun kepraktisan dan kemudahan. Dalam melakukan analisis ini digunakan lima
kategori seperti terlihat pada Tabel 1.
Tabel 1. Kategorisasi Penilaian Kelayakan Software
No Skor Kategori
1 Lebih dari M + 1,8 SD Sangat layak2 M + 0,6 SD s.d. M + 1,8 SD Layak3 M – 0,6 SD s.d. M + 0,6 SD Cukup4 M – 1,8 SD s.d. M – 0,6 SD Tidak layak5 Kurang dari M – 1,8 SD Sangat tidak layak
HASIL DAN PEMBAHASAN
Untuk memperoleh gambaran tentang hasil pengembangan software dilakukan
ujicoba luas yang melibatkan para user seperti guru, pengawas, dan pelaku pendidikan
sebanyak 65 orang. Sebagian besar (72%) mereka mengajar di tingkat SLTA baik SMA,
SMK maupun MA. Sebagian besar mereka 68% berasal dari sekolah negeri dan
responden yang sudah PNS sebanyak 57%. Agar penelitian ini mampu memperoleh
gambaran yang memadai maka guru-guru yang dilibatkan juga berasal dari berbagai
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
P a g e [ 391 ]
bidang studi, di antaranya Ekonomi, Akuntansi, Matematika, IPS, Bahasa Inggris, Bahasa
Indonesia, Teknologi Informasi, Kimia, Fisika, Biologi, Geografi, Bahasa Arab, dan
sebagainya.
Jika dilihat dari kemauan guru dalam melakukan analisis butir soal tampaknya
masih memprihatinkan. Sebagian besar guru 57% memang sudah melakukan analisis
butir soal namun masih bersifat kadang-kadang. Hanya 11% saja yang selalu melakukan
analisis butir soal sedangkan yang tidak pernah melakukan analisis butir soal sebanyak
12%. Hal ini tentu menjadi penting untuk dikaji mengapa guru sebagai pelaku pendidikan
memiliki kemauan yang rendah dalam melakukan analisis butir soal.
Pada umumnya guru hanya melakukan analisis butir soal jika memang dituntut
oleh pengawas. Artinya kesadaran guru untuk melakukan analisis butir soal terhadap
semua soal yang sudah diujikan kepada siswa masih kurang. Hal ini terjadi karena
umumnya guru kurang menguasai software analisis butir soal yang sudah ada. Kalaupun
menguasai tampaknya tidak mampu membangkitkan minat dan kemauan guru dalam
melakukan analisis butir soal secara terus menerus. Tentu saja hal ini akan berdampak
pada rendahnya kualitas butir soal yang dikembangkan guru karena tidak selalu
dilakukan analisis.
Penelitian ini berhasil mengembangkan software AnBuso dan buku panduannya
yang sudah diperbaiki sesuai masukan responden. Buku panduan dikembangkan untuk
memudahkan pengguna dalam memanfaatkan software ini. Buku panduan ini sekaligus
memberikan informasi tentang langkah-langkah dan cara menggunakan software ini
sehingga memudahkan user untuk memanfaatkan software dalam melakukan analisis
butir soal. Panduan ini berisi tentang pendahuluan, kerangka isi, data input, dan data
laporan.
Beberapa perubahan yang penting yang dihasilkan adalah penyesuaian software
ini dengan diberlakukannya kurikulum 2013 terutama yang terkait dengan masalah
penilaian. Karena itu pada penelitian ini dilakukan revisi perbaikan yang meliputi
perubahan tampilan, sheet Input01, sheet Laporan Peserta, sheet Peserta Remedial,
dan perubahan formula.
Sebelum Perubahan Sesudah Perubahan
Gambar 1. Tampilan Sheet Input01 Sebelum dan Sesudah Perubahan
Prosiding Seminar Nasional 9 Mei 2015
[ 392 ] P a g e
Perubahan tampilan perlu dilakukan karena dianggap terlalu banyak variasi
warna sehingga terlihat kurang menarik. Oleh karena itu dilakukan perubahan-
perubahan sesuai masukan. Perubahan tampilan tidak hanya dilakukan pada sheet input
(Gambar 1) tetapi juga dilakukan perubahan tampilan pada sheet laporan (Gambar 2).
Sebelum Perubahan Sesudah Perubahan
Gambar 2. Tampilan Sheet Laporan Butir Sebelum dan Sesudah Perubahan
Akibat diberlakukannya kurikulum 2013, software AnBuso juga dilakukan
penyesuaian agar software ini mampu mengakomodasikan kepentingan guru dalam
membuat penilaian sesuai dengan kurikulum 2013. Beberapa perubahan yang dilakukan
mencakup dalam hal penentuan skala penilaian. Pada software sebelumnya skala
penilaian yang disediakan hanya 1-10 dan 1-100, sementara itu kurikulum 2013
menggunakan skala penilaian 1-4, karena itu dalam software ini dilakukan penyesuaian
dengan menyediakan skala penilaian 1-4 (Gambar 3).
Gambar 3. Perubahan Skala Penilaian
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
P a g e [ 393 ]
Berdasarkan hasil ujicoba luas juga ditemukan beberapa kendala dalam
menentukan bobot penilaian antara soal objektif dan soal essay. Karena itu software
ini juga dilakukan perubahan dalam penentuan bobot tersebut dengan menyediakan
kolom tersendiri untuk bobot soal objektif dan soal essay (perubahannya dapat
dilihat pada Gambar 4). Dengan cara tersebut diharapkan guru atau user akan
semakin praktis dalam menentukan bobot penilaiannya. Bahkan software ini juga
memungkinkan untuk digunakan hanya untuk soal objektif saja atau untuk soal essay
saja.
Gambar 4. Penambahan Bobot Penilaian
Penyesuaian dengan kurikulum 2013 juga berdampak pada perubahan pada Sheet
Laporan Peserta. Pada bagian ini dimunculkan hasil penilaian peserta tes menurut
kurikulum 2013 lengkap dengan predikatnya (hasil perbaikannya dapat dilihat pada
Gambar 5). Predikat penilaian dilakukan penyesuaian berdasarkan Permendikbud
Nomor 52. Sementara itu pada bagian yang lain tidak mengalami perubahan karena
sudah sesuai dengan yang diharapkan guru.
Pada dasarnya tujuan guru melakukan analisis butir soal di samping untuk
mengetahui kualitas butir soal yang telah dibuat juga informasi hasil penilaian
pesertanya dapat dimanfaatkan untuk melakukan rencana tindak lanjut baik untuk
keperluan remedial maupun pengayaan. Oleh karena itu hasil laporan peserta haruslah
mampu memberikan gambaran siapa saja peserta yang masuk pada kelompok pengayaan
dan remedial. Pada pengembangan software ini sudah mampu mengantisipasi hal
tersebut namun demikian pada versi sebelumnya hanya sebatas pengelompokan peserta
remedial saja dan belum disediakan kolom untuk melakukan tindak lanjut.
Prosiding Seminar Nasional 9 Mei 2015
[ 394 ] P a g e
Gambar 5. Perbaikan Sheet Laporan Peserta
Guna memenuhi hal tersebut pada sheet Peserta Remedial dilakukan perbaikan
yakni tidak hanya menemukan kelompok peserta remedial menurut kemampuan yang
diukur melainkan disediakan kolom untuk pengisian jadwal kegiatan remedialnya. Hal itu
diperlukan agar mampu meengkamodasikan kebutuhan guru dalam membuat jadwal
remedial yang lebih praktis. Perbaikan pada sheet Laporan Peserta Remedial tersebut
dapat dilihat pada Gambar 6.
Gambar 6. Perbaikan Sheet Laporan Peserta
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
P a g e [ 395 ]
Hasil uji kelayakan memperlihatkan bahwa software AnBuso yang dikembangkan
dalam penelitian ini terbukti dinilai sangat layak. 51% responden menyatakan layak dan
46% menyatakan sangat layak sementara yang lainnya menyatakan cukup layak. Hal ini
menunjukkan bahwa software yang dikembangkan ini memiliki kebermanfaatan yang
tinggi dalam membantu guru untuk melakukan analisis butir soal.
Aspek kelayakan yang dinilai paling tinggi adalah aspek kepraktisan dan
kemudahan, dan aspek kebermanfaatan. Sementara aspek yang dinilai paling rendah
adalah aspek tampilan (Gambar 7). Dilihat dari jenis kelamin guru juga tampak tidak
menunjukkan adanya perbedaan yang signifikan terkait dengan penilaian mereka
terhadap kelayakan software. Software AnBuso dianggap praktis dan mudah untuk
digunakan serta bermanfaat dalam membantu melakukan analisis butir soal. AnBuso
dikembangkan dengan Microsoft Excel sehingga mempermudah guru dalam
menggunakannya. Hasil analisis yang dihasilkan juga memberikan informasi yang
lengkap. AnBuso tidak hanya mampu menganalisis butir soal objektif saja melainkan juga
soal essay. Hasil analisis juga sudah dibuat dalam format laporan sehingga
mempermudah guru dalam menafsirkan hasilnya.
Gambar 7. Hasil Uji Kelayakan Software
Aspek tampilan tampaknya dinilai paling rendah dibandingkan dengan yang lain.
Hal ini terjadi karena adanya keterbatasan dalam mengatur tampilan karena program ini
bukanlah program yang berdiri sendiri melainkan melekat dengan program Microsoft
Excel. Akibatnya tampilan yang dihasilkan juga menyesuaikan dengan fitur yang tersedia
dalam Mcrosoft Excel. Komponen yang dinilai rendah adalah kesesuaian pemilihan
warna, tata letak dan topografi (pemilihan jenis font). Hal ini mengindikasikan bahwa
software ini perlu perbaikan dari sisi tampilan. Variasi warna dan pemilihan font perlu
dilakukan perubahan agar tampilannya menjadi lebih menarik. Bahkan bila perlu
menggunakan program desain grafis dalam merancang tampilan.
Prosiding Seminar Nasional 9 Mei 2015
[ 396 ] P a g e
Aspek substansi isi dari software dianggap sangat baik karena sesuai dengan
kebutuhan guru. Sofware dinilai praktis untuk digunakan, menarik, inovatif, kreatif,
interaktif dan unik. Informasi yang dihasilkan dari software ini sangat lengkap, tidak
hanya menampilkan hasil analisis butir doal objektif dan essay melainkan juga
menampilkan hasil pencapaian nilai dan KKM peserta didik. Bahkan dalam software ini
dapat ditemukan materi-materi tertentu yang belum dikuasai oleh masing-masing
peserta didik sehingga dapat memberikan informasi kepada guru dalam merancang
program remedial dan pengayaan.
Dilihat dari aspek kepraktisan dan kemudahan dari software dianggap sangat
baik. Software dinilai mudah digunakan, dipahami, dipelajari, dibaca dan ditafsirkan
hasilnya. Untuk memanfaatkan software ini tidak perlu belajar program baru namun
cukup menggunakan pengetahuan dan keterampilan dalam menggunakan Microsoft
Excel. Oleh karena program ini umumnya sudah dikuasai guru maka software ini menjadi
mudah untuk dimanfaatkan dan diaplikasikan.
Software juga dinilai memiliki manfaat yang tinggi oleh guru. Software yang
dihasilkan dinilai sangat bermanfaat, aplikatif dan sesuai dengan kebutuhan guru. Hal ini
menunjukkan bahwa keberadaan software ini memiliki kebermanfaatan yang tinggi
dalam membantu guru untuk melakukan analisis butir soal. Hasil analisis yang
ditampilkan dari software ini sangat sesuai dengan kebutuhan guru karena dapat
dimanfaatkan untuk melakukan evaluasi terhadap instrumen dan soal yang dibuat guru
dalam mengukur kompetensi peserta didik. Oleh karena tampilan hasil analisis sudah
dibuat dalam format laporan maka hasil analisis ini juga dapat dipergunakan untuk
keperluan membuat laporan administrasi guru.
Walaupun software AnBuso ini dinilai layak namun dalam kenyataannya ada
beberapa kendala yang dihadapi guru dalam menggunakan software ini. Dari sisi manfaat
yang dihasilkan dari software ini memang sangat baik namun masih ada beberapa guru
yang kurang mahir dalam penguasaan komputer, khususnya program Microsoft Excel.
Umumnya pengetahuan guru terhadap program ini sangatlah terbatas. Masih banyak
menu dan fasilitas yang disediakan Microsoft Excel namun belum dimanfaatkan secara
optimal. Oleh karena software ini terintegrasi dengan program Excel maka akibatnya
guru kurang lancar dalam memanfaatkan software ini.
Kesediaan dan kebiasaan guru dalam melakukan analisis butir soal juga masih
dalam kategori jarang. Hanya sedikit guru yang selalu melakukan analisis butir soal baik
terhadap soal harian yang dibuatnya, soal semeseteran maupun soal ujian akhir. Karena
kebiasaan mereka tersebut akibatnya guru kurang lancar dalam melakukan analisis butir
soal karena memang belum terbiasa.
Pengetahuan dan penguasaan guru tentang konsep analisis butir soal juga masih
terbatas. Sementara pengembangan software ini juga didasarkan pada konsep analisis
butir soal terutama analisis klasik, akibatnya pemahaman guru terhadap angka-angka
yang dihasilkan dari software masih kurang. Walaupun hasil analisis sudah dikemas
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
P a g e [ 397 ]
dalam bentuk laporan yang siap ditandatangani, namun masih perlu dijelaskan tentang
arti dan makna dari hasil analisis tersebut.
SIMPULAN
Penelitian ini berhasil mengembangkan software AnBuso yang dapat
dimanfaatkan guru dalam melakukan analisis butir soal secara praktis dan aplikatif.
Software ini dibuat dengan program Microsoft Excel yang di dalamnya terdapat sheet
untuk input data, sheet data processing, sheet laporan hasil analisis dalam bentuk tabel
dan gambar.
Software yang dihasilkan terbukti sangat layak oleh guru dilihat dari aspek
kepraktisan dan kemudahan, aspek kebermanfaatan dan aspek substansi isi serta aspek
tampilan. Walaupun demikian, ada beberapa kendala yang dihadapi guru dalam
menggunakan software ini seperti lemahnya penguasaan guru terhadap program
Microsoft Excel, kurang terbiasanya melakukan analisis butir soal, pemahaman konsep
analisis butir soal yang terbatas, dan kendala teknis yang terdapat dalam software.
Software ini terbukti sangat layak dan sangat bermanfaat bagi guru karena itu
perlu sosialisasi yang lebih luas tentang penggunaan software ini agar lebih dikenal oleh
guru sehingga mampu meningkatkan kinerja guru dalam melakukan analisis butir soal.
Pengembangan software ini masih perlu terus dilakukan agar mampu memenuhi
kebutuhan guru dalam melakukan analisis butir soal.
DAFTAR PUSTAKA
Alagumalai, S. & Curtis, D.D. 2005. Classical Test Theory. In Alagumalai, S., et.al. (Eds.).Applied Rasch Measurement: A Book of Exemplars. Norwell, MA: Springer.
Allen, M. J. & Yen, W. M. 1979. Introduction to measurement theory. Monterey, CA:Brooks/Cole Publishing Company.
Anderson, L.W. 2003. Classroom assessment: enhancing the quality of teacher decisionmaking. New Jersey: Lawrence Erlbaum Associates, Inc.
Azwar, S. 2003. Sikap Manusia: Teori dan Pengukurannya, Edisi ke-2. Yogyakarta: PustakaPelajar.
Banta, T.W., Palomba, C.A., & Kinzie, J. 2014. Assessment essentials: Planning,implementing, and improving assessment in higher education. San Fransisco:Jossey-Bass.
Bers, T.H. 2008. The role of institutional assessment in assessing student learningoutcomes. New Directions for Higher Education, 141: 31-39.
Brookhart, S.M. 2008. How to give effective feedback to your students. Virginia: Associationfor Supervision and Curriculum Development.
Crocker, L & Algina, J. 2008. Introduction to classical and modern test theory. Ohio:Cengage Learning.
Darling-Hammond, L. 2014. Next generation assessment: Moving beyond the bubble test tosupport 21st century learning. San Fransisco: Jossey-Bass.
Prosiding Seminar Nasional 9 Mei 2015
[ 398 ] P a g e
Ebel, R.L. & Frisbie, D.A. 1991. Essentials of educational measurement. Englewood Cliffs,NJ: Prentice-Hall, Inc.
Harvey, L. 2011. The nexus of feedback and improvement. Dalam Nair, C.S. & Mertova, P.(eds.). Student Feedback: The cornerstone to an effective quality assurance system inhigher education. New Delhi: Oxford Cambridge.
Hattie J. & Timperley, H. 2007. The power of feedback. Review of Educational Research.77(1): 81-112.
Higgins, R., & Hartley, P. 2002. The conscientious consumer: reconsidering the role ofassessment feedback in student learning. Studies in Higher Education, 27(1): 53-64.
Irons, A. (2008). Enhancing learning through formative assessment and feedback. NewYork: Routledge.
James, A.O. & Folorunso, A.M. 2012. Effect of feedback and remediation on students’achievement in junior secondary school mathematics. International EducationStudies, 5(5): 153-162.
Kaplan, R.M. & Saccuzzo, D.P. 2005. Psychological Testing: Principles, Applications, andIssues, 6th edition. Belmont, CA: Thomson Wadsworth.
Kubiszyn, T., & Borich, G.D. 2013. Educational testing and measurement: classroomapplication and practice. 10th edition. Hoboken, NJ: John Wiley & Sons, Inc.
Langer, P. 2011. The use of feedback in education: a complex instructional strategyPsychological Reports, 109(3): 775-784.
Metronews. 2014. Ini delapan masalah dalam implementasi kurikulum 2013. (Online)(News.metronews.com), diakses 19 Oktober 2014.
Miller, M.D., Linn, R.L., & Gronlund, N.E. 2009. Measurement and assessment in teaching(tenth edition). New Jersey: Pearson Education Inc.
Muhson, A., Lestari, B., Supriyanto, & Baroroh, K. 2013. Pengembangan Software AnBusoSebagai Solusi Alternatif Bagi Guru dalam Melakukan Analisis Butir Soal SecaraPraktis dan Aplikatif. Laporan Penelitian tidak dipublikasikan. Yogyakarta: LPPMUNY.
National Research Council 1999. The assessment of science meets the science of assessment.Board on Testing and Assessment Commission on Behavioral and Social Sciences andEducation, National Research Council. Washington, DC: National Academy Press.
Nunnally, J.C. & Bernstein, I.H. 1994. Psychometric Theory (Third Edition). New York:McGraw-Hill, Inc.
Peterson, E.R., & Irving, S.E. 2008. Secondary school students’ conceptions of assessmentand feedback. Learning and Instruction, 18: 238-250.
Puskur 2008. Model Penilaian Kelas Kurikulum Berbasis Kompetensi. Jakarta: BalitbangDepdiknas.
Raymond, J.E., Homer, C.S.E., Smith, R. & Gray, J.E. 2012. Learning through authenticassessment: An evaluation of a new development in the undergraduate midwiferycurriculum. Nurse Education in Practice, 30: 1-6.
Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)
P a g e [ 399 ]
Republika. 2014. Implementasi kurikulum 2013 masih dibayangi banyak masalah. (Online)(www.republika.co.id), diakses 18 November 2014.
Russell, M.K. & Airasian, P.W. 2012. Classroom assessment: concepts and applications (7th
edition). New York: McGraw-Hill.
Shute, V.J. 2007. Focus on formative feedback. Research Report. Princeton, NJ: EducationalTesting Service (ETS).
Stiggins, R.J. & Chappuis, J. 2012. An introduction to student involved assessment forlearning. Sixth edition. Boston: Pearson assessment training institute.
Sudjana, N. 2011. Penilaian Hasil Proses Belajar Mengajar. Bandung: Remaja Rosdakarya.
Susilowati. 2013. Kurikulum 2013, 87 persen guru kesulitan cara penilaian. (Online)(http://unnes.ac.id), diakses 18 November 2014.
Tempo. 2013. Problematika implementasi kurikulum 2013, (Online) (www.tempo.co),diakses 10 Juli 2013.
Tempo. 2014. Kurikulum 2013, Apa Saja Kendalanya?, (Online) (www.tempo.co), diakses16 Agustus 2014.
UNDP. 2014. 2014 human development report. (Online) (http://www.undp.org/content/undp/en/home/librarypage/hdr/2014-human-development-report.html), diakses 5 Maret 2015.
UNESCO. 2011. Education For All Global Monitoring Report. (Online)(http://www.unesco.org/ new/en/education/themes/leading-the-international-agenda/efareport/statistics/efa-development-index/), diakses 5 Maret 2015.
Wiggins, G. P. 1993. Assessing student performance: exploring the purpose and limits oftesting. San Francisco: Jossey-Bass Publishers.
Prosiding Seminar Nasional 9 Mei 2015
[ 400 ] P a g e
ESTIMASI KESALAHAN PENGUKURAN PERANGKAT SOAL UJI COBA
UJIAN NASIONAL MATA PELAJARAN EKONOMI SMA
DI KABUPATEN BANJARNEGARA
Khotimah MarjiastutiProgram Pascasarjana Universitas Negeri Yogyakarta
khotimahmarjiastuti@ymail.com
AbstrakPenelitian ini bertujuan untuk mengestimasi kesalahan pengukuran perangkatsoal uji coba UN mata pelajaran ekonomi SMA Tahun Ajaran 2014/2015 diKabupaten Banjarnegara berdasarkan teori respon butir. Analisis data dilakukanberdasarkan respon peserta didik terhadap perangkat soal uji coba UN matapelajaran ekonomi SMA tahun ajaran 2014/2015 sebanyak 809 lembar yangdiperoleh dari 13 SMA negeri dan swasta. Metode yang digunakan yaitu TeoriRespon Butir (Item Respond Theory). Hasil analisis menunjukkan perangkat soalcocok dengan model Teori Respon Butir 1 Parameter Logistik. Berdasarkanmetode tersebut, nilai estimasi kesalahan pengukuran terkecil pada soal paket 1terjadi pada siswa dengan θ=0 dengan nilai sebesar 0,1990 sedangkan nilai estimasi terbesar terjadi pada siswa dengan θ=+3 dengan nilai sebesar 1,0320. Nilai estimasi kesalahan pengukuran terkecil pada soal paket 2 terjadi padasiswa dengan θ=0 dengan nilai sebesar 0,2005, sedangkan nilai estimasi terbesar terjadi pada siswa dengan θ=+3 dengan nilai sebesar 1,0073. Hal ini menandakan bahwa perangkat soal yang disusun oleh MGMP ekonomi lebihcocok diberikan kepada siswa dengan kemampuan sedang.
Kata kunci: perangkat soal, kesalahan pengukuran, teori respon butir.
PENDAHULUAN
Lebih dari satu dekade lalu, para pemimpin ASEAN sepakat untuk membentuk
sebuah pasar tunggal di kawasan Asia Tenggara pada akhir 2015 mendatang.
Kesepakatan tersebut dilakukan agar daya saing ASEAN meningkat serta bisa menyaingi
Tiongkok dan India untuk menarik investasi asing. Penanaman modal asing di wilayah
ASEAN sangat dibutuhkan untuk meningkatkan lapangan pekerjaan serta meningkatkan
kesejahteraan. Pembentukan pasar tunggal yang diberi nama Masyarakat Ekonomi
ASEAN (MEA) memungkinkan suatu negara akan dengan mudahnya melakukan jual-beli
barang dan jasa dengan negara lain di Asia Tenggara, sehingga secara otomatis
persaingan akan semakin ketat.
Masyarakat Ekonomi ASEAN tidak hanya membuka arus perdagangan barang atau
jasa, tetapi juga tenaga kerja profesional, seperti dokter, pengacara, akuntan, guru dan
lain sebagainya. Dengan demikian, dengan adanya MEA maka akan semakin membuka
peluang tenaga kerja asing untuk mengisi berbagai profesi di Indonesia. Sudah siapkah
tenaga kerja Indonesia bersaing dengan negara lain di Asia Tenggara?
Salah satu tenaga profesional yang akan bersaing di era MEA adalah guru. Guru-
guru di Indonesia diharapkan siap untuk bersaing dengan guru-guru asing. Oleh karena
itu, tentu harus diikuti dengan kesiapan guru untuk meningkatkan kualitas, kemampuan
Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)
P a g e [ 401 ]
serta keterampilan di bidang pendidikan. Mengacu pada UU Nomor 14 Tahun 2005
menyatakan bahwa ada empat kompetensi yang harus dimiliki oleh guru, yaitu
kompetensi pedagogik, kepribadian, profesional dan sosial. Keempat kompetensi
tersebut memang idealnya dimiliki oleh guru di Indonesia. Salah satu di antara empat
kompetensi yang ada yaitu kompetensi pedagogik. Kompetensi pedagogik menuntut guru
untuk dapat memahami peserta didik dengan memanfaatkan prinsip-prinsip
perkembangan kognitif dan kepribadian, perancangan pembelajaran, pelaksanaan
pembelajaran yang kondusif, merancang dan melaksanakan evaluasi hasil belajar secara
berkesinambungan dengan berbagai metode untuk kemudian sebagai acuan untuk
menentukan tingkat ketuntasan belajar (mastery learning) dan memanfaatkan hasil
evaluasi tersebut untuk perbaikan kualitas pembelajaran secara umum.
Salah satu kompetensi yang harus dimiliki guru adalah melakukan evaluasi hasil
belajar secara berkesinambungan, namun kegiatan evaluasi dalam pendidikan tidak akan
terlaksana tanpa adanya kegiatan pengukuran dan penilaian. Menurut Allen dan Yen
(1979: 2), measurement is the assigning of numbers to individuals in a systematic way as
means of representing properties of the individuals. Definisi tersebut dapat diartikan
sebagai penetapan angka dengan cara yang sistematik untuk menyatakan keadaan
individu. Pengukuran dilaksanakan dengan tujuan memberikan atribut berupa angka
pada individu. Kegiatan pengukuran dilaksanakan dengan menggunakan instrumen tes
dan/atau nontes. Penggunaan instrumen tes atau nontes disesuaikan dengan ranah yang
hendak diukur. Allen dan Yen menyatakan bahwa a test is a device for obtaining a sample
of an individual’s behavior (Allen & Yen, 1979: 1). Kegiatan selanjutnya yaitu penilaian,
yang merupakan pemberian label terhadap seseorang. Pemberian label dilakukan dengan
memberikan kriteria atas nilai yang diperoleh. Nilai yang diperoleh dapat dikategorikan
menjadi baik, cukup baik atau bahkan kurang baik.
Kegiatan pengukuran yang cermat akan dapat memberikan informasi yang tepat
untuk bahan evaluasi. Akan tetapi, dalam kegiatan pengukuran tidak terpisahkan dari
kesalahan baku pengukuran (Standard Error of Measurement/SEM). Kesalahan
pengukuran yang dimaksud yaitu nilai/skor hasil pengukuran lebih rendah daripada
nilai/skor yang sebenarnya atau bahkan nilai/skor hasil pengukuran lebih tinggi dari
nilai/skor yang sebenarnya. Tighe, dkk (2010) menyatakan bahwa sering orang
mengandalkan kualitas soal hanya pada reliabilitasnya, namun di sisi lain bila diketahui,
reliabilitas suatu tes tergantung pada tingkat kesalahan baku pengukuran (SEM).
Kesalahan baku pengukuran erat kaitannya dengan koefisien reliabilitas suatu alat ukur.
Miller (2008:93) mengemukakan, SEM is a quantitative expression of the magnitude of
error in a test score based on the test reliability. Selanjutnya, the reliability of the test scores
decreases, the SEM increases. The greater the reliability of the test score, the smaller the
SEM and the more confidence we have in the precision of the test score (Reynolds,
Livingston, dan Willson, 2010: 114). Pernyataan tersebut menjelaskan bahwa bila
reliabilitas skor tes menurun maka kesalahan pengukuran yang terjadi justru akan
meningkat. Reliabilitas yang tinggi akan menghasilkan kesalahan pengukuran yang
Prosiding Seminar Nasional 9 Mei 2015
[ 402 ] P a g e
rendah. Dengan menganalisis tingkat SEM, maka dapat diketahui kemungkinan skor
murni (true score) peserta tes, serta mengetahui tingkat kemampuan peserta tersebut
berada pada kemampuan tinggi, sedang, atau rendah. Jadi, kualitas perangkat soal tidak
hanya tergantung pada reliabilitas soalnya saja.
Kesalahan pengukuran dalam bidang pendidikan tidak dapat dihindari karena
subjek dan objek yang terlibat yaitu manusia. Ada dua macam kesalahan pengukuran,
yaitu kesalahan acak dan kesalahan sistematis (Mardapi, 2008: 3). Kesalahan acak
disebabkan oleh kondisi fisik dan mental yang diukur dan yang mengukur bervariasi.
Kesalahan sistematis terjadi karena alat ukur yang digunakan. Ada pendidik yang
memberikan soal terlalu mudah sehingga siswa mendapat skor yang tinggi. Sebaliknya,
bila pendidik memberi soal yang sulit, maka siswa akan mendapat skor yang rendah.
Apabila hal ini sampai terjadi, maka dapat merancukan evaluasi yang dihasilkan. Oleh
karena itu, alat ukur (tes) memiliki peran yang sangat penting dalam dunia pendidikan
sehingga soal tes perlu dipersiapkan sebaik mungkin dan seminimal mungkin kesalahan
yang dihasilkan agar lebih representatif mencerminkan kemampuan peserta didik.
Deteksi kesalahan baku pengukuran dapat dilakukan salah satunya dengan Teori
Respon Butir. Hadirnya Teori Respons Butir (IRT) untuk menyempurnakan teori
sebelumnya, yaitu Teori Tes Klasik (CTT). Kelemahan teori tes klasik salah satunya
adalah tergantung pada karakteristik peserta tes (Mardapi, 2012: 189). Maksud dari
pernyataan tersebut adalah bila sampel yang diberi soal kebetulan yang memiliki
kemampuan tinggi, maka soal akan menjadi memiliki tingkat kesukaran yang rendah
(indeks kesukaran tinggi). Sebaliknya bila soal diberikan kepada siswa dengan
kemampuan rendah, maka soal akan menjadi memiliki tingkat kesukaran yang tinggi
(indeks kesukaran rendah).
Model teori respon butir berdasarkan jumlah parameter butir ada tiga, yaitu 1-P,
2-P dan 3-P. Peluang menjawab benar suatu butir soal sebagai berikut (Mardapi, 2012:
203).
Keterangan:
a: daya pembeda
b: tingkat kesukaran
c: pseudo guessing
e: eksponen
θ: kemampuan
Parameter lain yang perlu diketahui dari teori respons butir yaitu fungsi informasi
perangkat tes yang terdiri dari beberapa butir soal. Fungsi informasi dapat dihitung
Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)
P a g e [ 403 ]
dengan formula yang sesuai dengan model logistik perangkat tes yang akan dihitung nilai
fungsi informasinya. Perhitungan nilai informasi perangkat tes untuk model logistik satu
parameter sebagai berikut. (Hambleton, 1985: 91)
Perhitungan nilai informasi perangkat tes untuk model logistik dua parameter
sebagai berikut
Perhitungan nilai informasi perangkat tes untuk model logistik tiga parameter
sebagai berikut
Keterangan:
I (θ) : fungsi informasi suatu perangkat tes.
bj : parameter indeks kesukaran butir ke-j
aj : parameter daya beda butir ke-j
cj : parameter guessing pada butir ke-j
e : bilangan transeden yang besarnya mendekati 2,718
D : nilai distribusi logistic besarnya 1,7
Setelah memperoleh fungsi informasi selanjutnya dapat dilakukan perhitungan
SEM dengan Formula umum teori respons butir yang dibangun sebagai berikut.
Keterangan:
SEM : kesalahan baku pengukuran
: teta/tingkat kecerdasan peserta tes
: fungsi informasi pada nilai teta/tingkat kemampuan tertentu
Penilaian yang dilakukan oleh pendidik terdiri atas berbagai jenis, seperti kuis,
pertanyaan lisan, tugas individu, tugas kelompok, Ulangan Harian (UH), Ulangan Tengah
Semester (UTS), dan Ulangan Akhir Semester (UAS) dan lain-lain. Semua itu dilakukan
agar guru dapat mengetahui kemampuan dan kemajuan peserta didik, bahkan bila perlu
dilakukan perbaikan atau pengayaan maka hal itu pun akan dilakukan. Hal tersebut
dikarenakan pendidik memiliki tanggung jawab atas peserta yang dididik agar menjadi
orang yang pandai, berakhlak mulia, tangkas dan terampil. Penilaian terhadap peserta
didik tidak hanya dilakukan oleh guru, tetapi juga oleh pihak independen yaitu Badan
Standar Nasional Pendidikan (BSNP) yang bekerja sama dengan instansi terkait di
lingkungan Pemerintah, Pemerintah Provinsi, Pemerintah Kabupaten/Kota, dan satuan
pendidikan. Penilaian tersebut dikenal dengan nama Ujian Nasional (UN).
Pada tahun 2015 UN tidak lagi menjadi penentu kelulusan yang utama bagi siswa,
sejak Menteri Pendidikan dan Kebudayaan, Anies Baswedan, mengeluarkan keputusan
untuk merevisi PP nomor 32 tahun 2013. Tujuan UN sepenuhnya untuk menilai
Prosiding Seminar Nasional 9 Mei 2015
[ 404 ] P a g e
pencapaian standar kompetensi lulusan pada mata pelajaran tertentu secara nasional,
kemudian hasilnya digunakan untuk pemetaan mutu, dasar seleksi masuk jenjang
pendidikan selanjutnya, dan untuk pembinaan. Melihat adanya tujuan yang besar dari
penyelenggaraan UN walaupun sudah tidak lagi menjadi penentu kelulusan yang utama
bagi siswa, tetapi sekolah tetap melaksanakan uji coba UN seperti tahun-tahun
sebelumnya. Uji coba UN bertujuan untuk mempersiapkan siswa menghadapi UN
sehingga diharapkan uji coba UN dapat memberikan gambaran terkait materi, jenis,
bentuk serta cara pengerjaan UN kelak. Intensitas serta waktu pelaksanaan uji coba UN
masing-masing sekolah berbeda-beda tergantung pada kebijakan Kepala Sekolah yang
bersangkutan.
Berdasarkan hasil observasi beberapa SMA di Kabupaten Banjarnegara, umumnya
sekolah mengadakan dua kali uji coba UN dengan soal buatan guru sekolah yang
bersangkutan dan satu kali uji coba UN dengan soal buatan MGMP yang diterapkan di
seluruh SMA baik sekolah negeri maupun swasta di Kabupaten Banjarnegara. Kenyataan
menunjukkan bahwa untuk pelaksanaan uji coba UN, guru masih menggunakan soal-soal
uji coba tahun lalu atau mengambil dari buku latihan untuk dijadikan soal try out di tahun
berikutnya. Permasalahannya pada soal-soal tersebut belum pernah dilakukan analisis
butir soal untuk menguji validitas dan reliabilitas. Pertanyaannya adalah apakah soal-soal
tersebut sudah sesuai dengan kisi-kisi yang diberikan BSNP, mampu mengukur
kemampuan siswa dan dapat merepresentasikan UN yang kelak akan dihadapi siswa?
Oleh karena itu, penelitian ini dipandang perlu dilakukan agar guru-guru mata
pelajaran ekonomi SMA di Kabupaten Banjarnegara pada khususnya dapat mengetahui
kualitas soal uji coba UN yang telah dibuat dalam rangka persiapan menghadapi UN para
peserta didiknya. Persiapan dengan sebaik-baiknya menjelang UN merupakan salah satu
bukti kesiapan guru untuk menghasilkan lulusan yang baik. Di samping itu, untuk
melakukan analisis estimasi kesalahan pengukuran guru harus memiliki kemampuan dan
keterampilan mengoperasikan program komputer. Kemampuan dan keterampilan ini
dapat menjadi bekal bagi guru dalam menghadapi persaingan di era MEA. Alasan
pendukung lainnya, penelitian mengenai estimasi kesalahan pengukuran perangkat soal
uji coba UN terutama untuk mata pelajaran ekonomi SMA di Kabupaten Banjarnegara
belum pernah dilakukan sebelum ini.
METODE
Penelitian ini termasuk jenis penelitian deskriptif eksploratif. Objek penelitian
adalah seluruh lembar jawab komputer (LJK) siswa peserta uji coba Ujian Nasional mata
pelajaran Ekonomi SMA yang dirancang oleh MGMP Ekonomi tahun ajaran 2014/2015
dari 13 sekolah baik Negeri maupun Swasta atau sebanyak 809 LJK. Teknik yang
digunakan dalam penelitian ini adalah dokumentasi. Estimasi kesalahan pengukuran
berdasarkan Teori Respon Butir dilakukan dengan bantuan Program Komputer Bilog_MG.
Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)
P a g e [ 405 ]
Tabel 1. Objek Penelitian Estimasi Kesalahan Pengukuran Perangkat Soal Uji Coba UjianNasional Mata Pelajaran Ekonomi SMA di Kabupaten Banjarnegara
No Nama Sekolah Jumlah PesertaUN TA.2014/2015
1 SMAN 1 Banjarnegara 722 SMAN 1 Bawang 1103 SMAN 1 Purwareja Klampok 814 SMA Muhammadiyah 4 Kalibening 285 SMAN 1 Sigaluh 586 SMA PGRI Purwareja Klampok 197 SMAN 1 Purwanegara 848 SMAN 1 Karangkobar 1399 SMAN 1 Wanadadi 11410 SMA Muhammadiyah 1 Banjarnegara 4611 SMA Cokroaminoto Banjarnegara 2012 SMAN 1 Batur 2813 SMA Ma’arif Mandiraja 10
Total Peserta UN 809
HASIL DAN PEMBAHASAN
Langkah-langkah yang dilakukan untuk menganalisis SEM berdasarkan teori respon
butir meliputi uji kecocokan model (1 PL, 2 PL atau 3 PL) dengan bantuan perangkat
komputer BILOG MG, yang perlu dicermati adalah pada hasil perhitungan fase dua.
Tentukan butir mana saja yang memenuhi semua kriteria. Setelah itu baru dapat
dilanjutkan dengan mengestimasi kesalahan pengukuran perangkat soal uji coba UN
mata pelajaran ekonomi SMA di Kabupaten Banjarnegara.
Uji Kecocokan Model
Untuk mengetahui perangkat soal tes uji coba UN cocok dengan model 1 PL, 2 PL
atau 3 PL perlu dilakukan perhitungan dengan menggunakan BILOG MG. Ada tiga fase
yang dihasilkan oleh software tersebut, fase satu menjelaskan informasi butir
berdasarkan teori tes klasik, fase dua menjelaskan kualitas butir soal berdasarkan teori
respon butir, sedangkan fase tiga memberikan informasi kemampuan (ability) masing-
masing siswa dalam menjawab soal yang diberikan. Berikut ini rangkuman dari fase dua.
Tabel 2. Uji Kecocokan Model Perangkat Soal (Paket 1)
Model Butir yang Cocok dengan ModelJumlah Butir yang Cocok
dengan Model1 PL 1, 2, 5, 7, 9, 12, 13, 16, 17, 18, 20, 22, 23, 24, 25,
28, 29, 30, 32, 33, 35, 36, 28, 39, 4025
2 PL 3, 6, 8, 9, 11, 14, 25, 26, 27, 28, 29, 31, 33, 34, 35 153 PL 3, 6, 7, 11, 14, 20, 26, 32, 33, 34, 35 11
Prosiding Seminar Nasional 9 Mei 2015
[ 406 ] P a g e
Berdasarkan tabel di atas, maka dapat disimpulkan bahwa perangkat soal uji coba
UN ekonomi paket 1 cocok dianalisis menggunakan teori respon butir 1 PL, karena
jumlah butir yang cocok paling banyak dibandingkan model 2 PL dan 3 PL. Selanjutnya
perlu diuji untuk soal paket 2 cocok dengan model logistik 1 PL, 2 PL atau 3 PL. Berikut
ini rangkuman uji kecocokan model untuk soal paket 2.
Tabel 3. Uji Kecocokan Model Perangkat Soal (Paket 2)
Model Butir yang Cocok dengan ModelJumlah Butir yang Cocok
dengan Model1 PL 4, 5, 6, 7, 8, 9, 11, 13, 16, 17, 18, 19, 21, 22, 24,
26, 28, 32, 35, 36, 38, 4022
2 PL 1, 3, 5, 9, 13, 17, 19, 25, 29, 30, 32, 33, 37, 38 143 PL 2, 3, 5, 9, 17, 19, 21, 24, 25, 26, 29, 32, 33, 35,
38, 4016
Mencermati banyak butir yang cocok dengan model logistik 1PL, maka dapat
disimpulkan bahwa perangkat soal uji coba UN mata pelajaran ekonomi SMA paket 2
cocok dengan model 1 PL menurut teori respon butir.
Estimasi Kesalahan Pengukuran
Setelah diketahui model yang cocok yaitu model IRT 1 PL, selanjutnya adalah
mencari fungsi informasi butir dengan menggunakan formula 3 dan 4 dengan
menghitung mulai dari tetha -3 s.d +3 selisih antar tetha 0,1. Setelah diketahui fungsi
informasi selanjutnya dapat dilakukan perhitungan SEM dengan formula 7. Setelah itu
dapat diketahui bahwa SEM untuk perangkat soal pertama berkisar antara 0,1990
sampai 1,0320. SEM terkecil berada pada siswa dengan kemampuan θ = 0 dan SEM
tertinggi berada pada siswa dengan kemampuan θ = +3. Sedangkan SEM untuk perangkat
soal kedua berkisar antara 0,2005–1,0073 (SEM terendah sampai SEM tertinggi). SEM
terkecil berada pada siswa dengan kemampuan θ = 0 dan SEM tertinggi berada pada
siswa dengan kemampuan θ = +3.
SIMPULAN
Berdasarkan uji kecocokan model, kedua perangkat soal uji coba UN mata
pelajaran ekonomi SMA di Kabupaten Banjarnegara cocok dengan model IRT 1
parameter logistik. Besarnya estimasi kesalahan pengukuran (SEM) untuk soal paket satu
berdasarkan teori respon butir sebesar 0,1990-1,0320 sedangkan untuk paket dua
0,2005-1,0073. Kedua perangkat soal memiliki kesamaan yaitu SEM terendah terjadi
pada siswa dengan kemampuan θ=0 dan SEM tertinggi terjadi pada siswa dengan θ=+3.
Hal ini menandakan bahwa perangkat soal yang disusun oleh MGMP ekonomi lebih cocok
diberikan kepada siswa dengan kemampuan sedang.
Saran yang dapat peneliti berikan sebagai berikut:
Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)
P a g e [ 407 ]
1. Untuk pelaksanaan tes yang dibuat secara tim seperti Ujian Kenaikan Kelas dan uji
coba UN hendaknya guru menggunakan soal yang telah valid dan reliabel, untuk
meminimalisasi tingkat kesalahan pengukuran.
2. Hendaknya guru baik secara tim atau individu melakukan analisis estimasi kesalahan
pengukuran secara berkelanjutan sebagai salah satu bentuk evaluasi hasil kerja. Jadi,
evaluasi tidak hanya dengan melihat nilai atau rata-rata nilai yang dicapai siswa dari
waktu ke waktu tapi perlu juga mengevaluasi soal yang telah dibuat.
3. Dinas pendidikan setempat hendaknya memfasilitasi guru-guru dengan memberikan
pelatihan penyusunan soal yang baik dengan mengundang ahli.
DAFTAR PUSTAKA
Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. Monterey:Wadsworth
Hambleton, R.K. & Swaminathan H. (1985). Item Response Theory Principles andApplications. New York: Springer.
Mardapi, Djemari. (2008). Teknik penyusunan instrumen tes & non tes. Yogyakarta: MitraCendikia.
Mardapi, Djemari. (2012). Pengukuran Penilaian & Evaluasi Pendidikan. Yogyakarta: NuhaLitera.
Miller, P. W. (2008). Measurement and teaching. Muster: Partric W. Miller & Association.
Tighe, J., McManus, I. C., Dewhurst, N. G., Chis, L., & Mucklow, J. (2010) The Standard Errorof Measurement is a more Appropiate Measure of Quality for Postgraduate MedicalAssessments Than is Reliability: An Analysis of MRCP (UK) Examinations. BMCMedical Education, 10:40.
Prosiding Seminar Nasional 9 Mei 2015
[ 408 ] P a g e
EVALUASI PENERAPAN PENILAIAN OTENTIK
DALAM KAITANNYA DENGAN KESIAPAN SDM MENGHADAPI MEA
Alita Arifiana AnisaPenelitian dan Evaluasi Pendidikan, Universitas Negeri Yogyakarta
alita.arifiana.anisa@gmail.com
AbstrakPenelitian ini merupakan penelitian evaluasi. Penelitian ini berfokus untukmengevaluasi penerapan penilaian otentik dalam kaitannya dengan upaya untukmempersiapkan SDM Indonesia dalam menghadapi Masyarakat Ekonomi ASEAN(MEA) di SMK N 1 Wonosari, sekolah pilot project kurikulum 2013 di DaerahIstimewa Yogyakarta (DIY). Penelitian ini dilakukan dengan telaah dokumenguru, wawancara dan kuesioner. Hasil telaah dokumen dan kuesioner dianalisistingkat kecenderungannya dan diklasifikasikan menjadi 4 kategori sedangkandata yang diperoleh melalui wawancara dianalisis secara kualitatif untukmendukung data yang terkumpul melalui dokumen dan kuesioner. Berdasarkananalisis yang dilakukan, penerapan penilaian otentik di SMK N 1 Wonosaritermasuk dalam kategori sangat sesuai dengan perolehan skor mencapai 2,62didukung dengan capaian skor persepsi siswa sebesar 3,09 yang termasuk dalamkategori sesuai. Kendala yang dihadapi guru berkaitan dengan perumusanrancangan penilaian sikap spiritual mulai dari perumusan indikator pencapaian,penyusunan rubrik, pemilihan teknik penilaian hingga penyusunan instrumentyang tepat.
Kata Kunci: Penilaian Otentik, Masyarakat Ekonomi ASEAN
PENDAHULUAN
Pada tahun 2013 lalu, pemerintah merilis gebrakan baru dalam dunia pendidikan.
Gebrakan tersebut adalah kurikulum baru yang diberi nama kurikulum 2013, pemerintah
melalui peraturan menteri pendidikan dan kebudayaan mengemukakan bahwa
perubahan tersebut merupakan misi untuk menyempurnakan upaya Indonesia untuk
mempersiapkan diri menghadapi tantangan internal maupun external. Salah satu
tantangan yang menjadi PR besar bagi bangsa Indonesia adalah Masyarakat Ekonomi
ASEAN (MEA).
MEA merupakan komitmen untuk mewujudkan integrasi ekonomi negara-negara
ASEAN yang bertujuan untuk meminimalisir kesenjangan antar negara. Dengan adanya
MEA akan banyak peluang sekaligus risiko yang dihadapi Indonesia, yaitu competition
risk, exploitation risk dan employment risk (Baskoro, 2014). Competition risk di mana
tidak akan ada lagi hambatan dalam melakukan perdagangan, ekspor akan melimpah,
begitu juga dengan impor. Barang-barang impor dengan harga murah dan kualitas tinggi
akan mengancam industri lokal meskipun industri lokal akan mendapatkan peluang yang
sama untuk mengekspansi pasar ASEAN. Exploitation risk, investasi akan terbuka lebar
dan menstimulus pertumbuhan ekonomi, namun di sisi lain peluang asing untuk
mengeksploitasi sumber daya Indonesia kian terbuka, didukung dengan potensi sumber
daya alam Indonesia yang lebih banyak jika dibandingkan dengan negara lain.
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
P a g e [ 409 ]
Employment risk berkaitan dengan persaingan tenaga kerja. Akan terdapat peluang besar
bagi pencari kerja dengan berbagai keahlian, akses untuk bekerja di luar negeri pun akan
semakin mudah, namun jika sumber daya Indonesia tidak memiliki kompetensi dan
keterampilan yang memadahi, maka bangsa Indonesia akan kesulitan untuk bersaing
dengan sumber daya manusia dari negara lain mengingat dilihat dari segi pendidikan dan
produktivitasnya tenaga kerja Indonesia masih berada di bawah Singapura, Malaysia dan
Thailand. Hingga Februari 2013, tercatat pengangguran di Indonesia mencapai 7.170.523
orang dari berbagai tingkat pendidikan.
Tabel 1 Jumlah pengangguran Indonesia Per-Februari 2013
Tingkat Pendidikan Terakhir Jumlah
Belum/tidak tamat SD 513,534.00
SD 1,421,653.00
SLTP 1,822,395.00
SLTA Umum 1,841,545.00
SLTA Kejuruan 847,052.00
Diploma I,II,III/Akademi 192,762.00
Universitas 421,717.00
Total 7,170,523.00
Sumber: Data.go.id
Dalam kaitannya dengan dunia pendidikan dan tenaga kerja di Indonesia, SMK
menjadi bagian dari sistem pendidikan yang memiliki tanggungjawab lebih mengingat
tujuan besar yang diusung SMK, yaitu mempersiapkan Sumber Daya Manusia (SDM) yang
berkompetensi, handal dan siap kerja. Tujuan tersebut ditegaskan dalam Undang-undang
Sistem Pendidikan Nasional (UUSPN) No. 20 tahun 2003 pasal 15 menyatakan bahwa
pendidikan kejuruan adalah pendidikan menengah yang mempersiapkan peserta didik
terutama untuk bekerja dalam bidang tertentu. Dengan adanya MEA tentu saja tugas SMK
menjadi semakin berat karena saingan yang akan dihadapi lulusan-lulusan SMK bukan
lagi hanya sesama bangsa Indonesia, tetapi juga lulusan-lulusan dari Negara lain.
Lulusan-lulusan dari berbagai Negara akan bersaing untuk membuka peluang karier
lintas Negara, termasuk di pasar Indonesia. Sepanjang 2014 saja sudah terdapat 68.762
tenaga asing yang menyerbu Indonesia versi Kementerian Ketenagakerjaan yang dirilis
oleh Harian Terbit. Dengan adanya tantangan eksternal tersebut, Indonesia harus terus
berupaya meningkatkan kualitas pendidikannya agar mampu menghasilkan SDM yang
unggul. Mardapi (2008:5) mengemukakan bahwa upaya untuk meningkatkan kualitas
pendidikan dapat ditempuh melalui peningkatan kualitas sistem pembelajaran dan
penilaian, di mana keduanya saling berkaitan satu sama lain. Pernyataan tersebut
didukung oleh Kunandar (2014:13) yang mengemukakan bahwa Kurikulum 2013
merupakan pengembangan dari kurikulum yang sebelumnya dengan penguatan pada
proses pembelajaran dan penilaian.
Prosiding Seminar Nasional 9 Mei 2015
[ 410 ] P a g e
Penguatan yang dimaksud adalah Kurikulum 2013 adalah proses pembelajaran
dengan pendekatan saintifik dan sistem penilaian otentik. Proses pembelajaran dengan
pendekatan saintifik merupakan pembelajaran yang menekankan pada proses bertanya
dan menjawab pertanyaan dengan prosedur yang spesifik sesuai dengan tahap
penyelidikan ilmiah, yaitu mengamati, menanya, mengumpulkan informasi, mengasosiasi
dan mengkomunikasikan. Prosedur ilmiah tersebut kemudian dikenal dengan istilah 5M.
Melalui pengalaman pada setiap tahapan 5M diharapkan proses belajar yang dialami
siswa akan semakin bermakna. Kompetensi siswa sebagai hasil dari proses pembelajaran
yang bermakna tersebut kemudian direkam secara sistematis dan prosedural melalui
sistem penilaian otentik. Penilaian otentik dapat didefinisikan sebagai sistem penilaian
yang menuntut siswa untuk mengkombinasikan kompetensi yang dimilikinya untuk
memecahkan masalah dalam kehidupan nyata maupun kehidupan profesionalnya kelak
(Gulikers,2004:67). Senada dengan Gulikers, Lund (1997,25) juga mengungkapkan
bahwa penilaian otentik merupakan seperangkat tugas atau tes yang mampu
membangun koneksi antara apa yang ada pada kehidupan sehari-hari siswa dengan ide-
ide yang dikembangkan di sekolah. Demi mewujudkan misi besar penilaian otentik
pemerintah melalui Peraturan Menteri Pendidikan dan Kebudayaan (Permendikbud)
nomor 66 tahun 2013 tentang standar penilaian mengatur pelaksanaan penilaian otentik
di sekolah. Kurikulum 2013 sebagaimana yang diatur dalam permendikbud menuntut
guru untuk mampu melaksanakan penilaian hasil belajar siswa yang berdasarkan pada
(1) objektivitas penilaian, (2) keterpaduan kompetensi sikap, pengetahuan dan
keterampilan, (3) nilai ekonomis penyelenggaraan penilaian, (4) transparansi proses
penilaian, (5) akuntabilitas penilaian, serta (6) nilai-nilai pendidikan yang ada dalam
pelaksanaan penilaian (edukatif). Selain itu Penilaian Acuan Kriteria (PAK) wajib menjadi
landasan setiap penilaian yang dilakukan guru. PAK berarti menilai performa seseorang
berdasarkan apa yang dapat dilakukan dan tidak dapat dilakukan oleh seseorang
dibandingkan dengan standard atau acuan yang telah ditentukan sebelumnya bukan
terhadap performa orang lain dalam melakukan dal yang sama (Reynolds, 2010:79).
Berikut ini merupakan teknik dan instrument penilaian otentik yang dapat digunakan
guru untuk menyelenggarakan penilaian hasil belajar yang berdasarkan pada prinsip-
prinsip di atas:
1. Guru dapat melakukan penilaian kompetensi sikap dengan menggunakan empat
teknik, yaitu observasi, penilaian diri, penilaian teman sejawat dan jurnal. Instrumen
yang dapat digunakan guru antara lain daftar cek, skala penilaian yang disertai rubric
serta catatan pendidik.
2. Guru dapat melakukan penilaian kompetensi pengetahuan dengan menggunakan tes
baik tes pilihan ganda, tes uraian, tes lisan maupun penugasan. Penilaian otentik juga
dituntut untuk mengarahkan siswa untuk mengelola kemampuan high order
thinking-nya yang meliputi kemampuan untuk menganalisis, mensintesis, dan
mengevaluasi (Lund, 1997:25).
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
P a g e [ 411 ]
3. Guru dapat melakukan penilaian keterampilan siswa dengan menggunakan tes
praktik, proyek dan penilaian portofolio. Lund (1997:25) mengungkapkan bahwa
tugas yang diberikan guru harus mampu mewakili kinerja siswa pada bidang tertentu.
Untuk mendapatkan nilai yang akuntabel dan sesuai dengan keadaan yang
sebenarnya, guru juga disarankan untuk menggunakan teknik penilaian yang bervariasi
atau triangulasi teknik.
Berdasarkan uraian di atas dapat rumuskan bahwa Kurikulum 2013 dirancang
untuk meningkatkan kualitas pendidikan melalui penguatan pada proses pembelajaran
dan sistem penilaian. Pendidikan berkualitas tinggi diharapkan mampu menghasilkan
SDM yang berkualitas, unggul dan memiliki daya saing, khususnya untuk menghadapi
MEA. Penilaian otentik yang menjadi salah satu fokus penguatan pada kurikulum 2013
menjadi penting karena dengan terselenggaranya penilaian yang otentik, dalam artian
penilaian yang mampu memfasilitasi siswa untuk menggunakan kompetensi-kompetensi
yang dimilikinya untuk memecahkan masalah kehidupan profesionalnya, SDM yang
dihasilkan akan terbiasa dengan kasus-kasus yang akan mereka hadapi di dunia kerja
sehingga menjadi SDM yang berkompetensi, solutif dan siap kerja. SDM yang memiliki
karakteristik unggul tersebut akan mampu bertahan dan berjaya dalam persaingan
global.
Namun, bukan tanpa tantangan penerapan penilaian otentik mengalami cukup
banyak kendala. Kurikulum 2013 yang sebelumnya diujicobakan pada 3 SMK di Daerah
Istimewa Yogyakarta pada tahun pelajaran 2013/2014 dan dimasukkan pada tahun
ajaran 2014/2015 nyatanya kembali diperuntukkan untuk SMK pilot project, yaitu SMK
N 1 Wonosari, SMK N 1 Bantul dan SMK N 1 Pengasih. Bukan tanpa alasan, kembalinya
peruntukan Kurikulum 2013 untuk sekolah pilot project didasari banyaknya kendala
yang dihadapi di lapangan. Dalam kaitannya dengan penerapan penilaian otentik di SMK,
kendala yang dihadapi antara lain kompetensi guru untuk menyiapkan perangkat
penilaian dan instrument yang sesuai dengan tuntutan sistem penilaian otentik dinilai
masih minim. Hal tersebut didukung oleh data yang dirilis oleh Surabaya news, diketahui
bahwa rata-rata penguasaan guru terhadap materi penilaian otentik selama pelatihan
kurikulum 2013 hanya mencapai 58,52% di mana lebih dari 100 ribu guru mendapatkan
nilai kurang dari 40. Bagi guru-guru mata pelajaran produktif SMK, Kurikulum 2013
dirasa semakin sulit karena belum adanya pelatihan untuk guru-guru mata pelajaran
produktif, padahal mata pelajaran produktif menjadi andalan untuk menyiapkan lulusan-
lulusan yang memiliki kompetensi professional. Selain itu, keluhan lain berkaitan dengan
sistem penyelenggaraan administrasi penilaian yang dinilai rumit, memakan waktu dan
memecah konsentrasi guru dalam mengajar.
Mengacu pada urgensi penerapan penilaian otentik bagi pendidikan di Indonesia
khususnya SMK serta kendala-kendala yang dihadapi guru dalam penerapannya, proses
evaluasi perlu dilakukan untuk mengidentifikasi seberapa baik penerapan penilaian
otentik di SMK, apa yang sebenarnya menjadi kendala serta solusi seperti apa yang
sebaiknya dilakukan. Evaluasi ini dinilai penting untuk dilakukan demi perbaikan
Prosiding Seminar Nasional 9 Mei 2015
[ 412 ] P a g e
penerapan penilaian otentik yang lebih baik di kemudian hari dan terwujudnya SDM yang
berorientasi professional.
METODE
Penelitian ini merupakan penelitian evaluasi dengan menggunakan model
evaluasi discrepancy yang dikembangkan oleh Provus (Fitzpatrick, 2011: 155). Penelitian
evaluasi ini dilaksanakan di salah satu SMK pilot project di DIY, yaitu SMK N 1 Wonosari.
Penelitian ini dibatasi pada penerapan penilaian otentik pada mata pelajaran produktif
kelas XI program keahlian keuangan yang terdiri dari 4 mata pelajaran, yaitu Akuntansi
Perusahaan Dagang, Akuntansi Keuangan, Administrasi Pajak dan Komputer Akuntansi
Penelitian ini dilakukan dengan pendekatan campuran antara pendekatan
kuantitatif dan kualitatif. Pendekatan kuantitatif dimaksudkan untuk memperoleh
informasi melalui teknik dokumentasi dengan lembar telah dokumen dan kuesioner
dengan lembar kuesioner, sedangkan pendekatan kualitatif diperuntukkan untuk
menggali informasi melalui wawancara.
Teknik dokumentasi dilakukan untuk menelaah tiga dokumen buatan guru mata
pelajaran produktif, yaitu Rancangan Pelaksanaan Pembelajaran (RPP), Instrumen
Penilaian Pengetahuan, dan Instrumen Penilaian Keterampilan. Lembar telaah dokumen
digunakan untuk mengumpulkan informasi tentang kelengkapan RPP, kesesuaian
kompetensi yang diukur, penggunaan teknik penilaian, penggunaan perangkat penilaian,
serta kesesuaian dengan prinsip umum dan khusus penilaian otentik. Lembar telaah
dokumen akan diisi oleh 3 orang ahli di bidang pendidikan akuntansi dengan skala antara
0 sampai dengan 3 sesuai dengan banyaknya deskriptor yang tampak pada tiga dokumen
tersebut. Hasil telaah tersebut kemudian dihitung tingkat kecenderungannya dengan
tabel 2.
Tabel 2 Kriteria Evaluasi
No Skor Kategori1. Sangat Sesuai
2. Sesuai
3. Tidak Sesuai
4. Sangat Tidak Sesuai
Teknik pengumpulan data dengan kuesioner diperuntukkan untuk merekam
persepsi siswa tentang penerapan penilaian otentik yang dilaksanakan guru sesuai
dengan kapasitasnya. Dari 127 siswa kelas XI SMK N 1 Wonosari, 96 di antaranya
dijadikan sampel dalam penelitian ini. Sama halnya dengan data yang diperoleh melalui
lembar telaah dokumen, skor yang diperoleh dari lebar kuesioner juga akan dihitung
tingkat kecenderungannya dengan tabel 2. Alternatif jawaban yang dapat dipilih siswa
dalam kuesioner memiliki rentang skor antara 1 sampai dengan 4.
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
P a g e [ 413 ]
Teknik pengumpulan data melalui wawancara dilakukan untuk mendapatkan
tambahan informasi sekaligus data yang dapat ditriangulasikan dengan dua teknik
sebelumnya. Wawancara dilakukan pada 4 guru mata pelajaran produktif terkait cara
guru melakukan penilaian dan kendala yang dihadapi guru. Data yang terkumpul melalui
wawancara kemudian direduksi, data yang relevan dengan penerapan penilaian otentik
kemudian digunakan sebagai data pendukung atau penjelas.
Penerapan penilaian otentik di SMK N 1 Wonosari dinilai sesuai jika data
keseluruhan baik yang berasal dari lembar telaah dokumen dan kuesioner masuk dalam
kategori sesuai.
Gambar 1 Variabel, Dimensi dan Indikator Penelitian
Prosiding Seminar Nasional 9 Mei 2015
[ 414 ] P a g e
HASIL DAN PEMBAHASAN
Berdasarkan hasil analisis yang dilakukan diketahui bahwa baik secara
administrasi maupun persepsi siswa SMK N 1 Wonosari program keahlian keuangan
telah sesuai dalam menerapkan penilaian otentik. Berdasarkan hasil telaah dokumen
skor total yang diperoleh mencapai 2,62 dari maksimal skor 3. Terdapat kesenjangan
sebesar 0,38 berkaitan dengan beberapa deskriptor yang tidak tampak. Hal tersebut
didukung oleh persepsi siswa yang menyatakan bahwa guru telah sesuai dalam
menerapkan penilaian otentik dengan skor total sebesar 3,09 dari maksimal skor 4.
Gambar 2 Grafik Skor tiap Indikator
Indikator perencanaan penilaian otentik yang pertama mengumpulkan informasi
tentang kelengkapan serta kejelasan RPP, khususnya rancangan penilaian yang dibuat
guru. Indikator ini mencapai skor sempurna, yaitu 3, artinya keseluruhan RPP yang
dibuat oleh guru mata pelajaran produktif telah lengkap, rinci dan jelas berkaitan dengan
kelengkapan 4 kompetensi inti (KI 1, KI 2, KI 3, KI 4), kompetensi dasar yang mencakup
ranah sikap, pengetahuan, dan keterampilan, indikator pencapaian, teknik penilaian,
instrument penilaian dan sistem penilaian dengan menggunakan PAK.
Berbeda dengan indikator sebelumnya, indikator kedua tentang kesesuaian
kompetensi yang diukur hanya mampu mencapai skor 2,58, meskipun demikian
indikator ini masih termasuk dalam kategori sangat sesuai. Kekurangan yang berkaitan
dengan indikator ini dapat dilihat dari deskriptor yang paling sering tidak tampak, yaitu
deskriptor kedua, kesesuaian indikator pencapaian kompetensi sikap spiritual dengan
kompetensi dasar. Setengah dari 4 RPP yang dianalisis tidak mencakup adanya
kesesuaian indikator pencapaian kompetensi sikap spiritual dengan kompetensi dasar.
Hal tersebut didukung dengan hasil analisis untuk indikator ketiga yang berkaitan
dengan teknik penilaian yang digunakan guru. Sama halnya dengan indikator kedua,
meskipun indikator ketiga termasuk dalam kategori sangat sesuai, skor yang diperoleh
hanya mencapai 2,33 dari skor maksimal 3. Kesenjangan dengan skor maksimal
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
P a g e [ 415 ]
dikarenakan seringnya deskriptor pertama tidak muncul. Deskriptor pertama
merepresentasikan penilaian sikap spiritual dengan menggunakan teknik observasi,
penilaian diri, penilaian teman sejawat, dan jurnal. Meskipun dalam rancangan penilaian
sikap spiritual yang dibuat guru dalam RPP kerap tidak muncul, namun persepsi siswa
menunjukkan hasil berbeda, menurut siswa, guru telah sesuai dalam melakukan
penilaian sikap spiritual dengan capaian skor 2,71, meskipun skor tersebut merupakan
skor terendah jika dibandingkan dengan kompetensi inti lainnya. Siswa menilai bahwa
guru memberikan nilai tambah dan nilai minus berkaitan dengan sikap spiritual siswa
dalam berdoa dan menjawab salam. Hal tersebut berarti, meskipun guru tidak
menuliskan rancangan penilaian sikap spiritual secara administrative melalui RPP,
namun guru tetap menunjukkan perhatiannya pada sikap spiritual siswa dengan
memberikan poin penilaian melalui observasi. Hal tersebut didukung oleh hasil
wawancara oleh guru yang mengungkapkan kebiasaannya mencatat dan menegur siswa
yang tidak berdoa dengan sungguh-sungguh sebelum memulai atau mengakhiri
pembelajaran. Berikut ini grafik persepsi siswa tentang teknik penilaian yang dilakukan
guru mata pelajaran produktif:
Gambar 3 Grafik Skor Persepsi Siswa tentang Teknik Penilaian Guru
Tidak adanya teknik penilaian sikap spiritual yang jelas yang terjadi pada
indikator ketiga menyebabkan ketidakjelasan instrument penilaian sikap spiritual,
sehingga indikator keempat tentang instrument penilaian yang digunakan guru hanya
memperoleh skor 2,25 meskipun masih termasuk dalam kategori sangat sesuai.
Fenomena kekurangsempurnaan sistem penilaian sikap spiritual dijelaskan oleh guru
mata pelajaran komputer akuntansi melalui proses wawancara sebagai fenomena
kebingungan guru tentang bagaimana menilai sikap spiritual siswa. Guru mengaku
kesulitan merumuskan indikator pencapaian kompetensi sikap spiritual karena kurang
memahami bagaimana membuat rubrik penilaian sikap spiritual. Kebingungan tersebut
Prosiding Seminar Nasional 9 Mei 2015
[ 416 ] P a g e
berkaitan dengan fenomena ketika diinstruksikan untuk berdoa apakah siswa yang
menundukkan kepala pasti berdoa? Apakah siswa yang tidak menundukkan kepala tidak
berdoa? Atau ketika kompetensi inti menyatakan rasa syukur, bagaimana guru bisa
memastikan seorang siswa mensyukuri apa yang ia miliki? Pada kondisi apa rasa syukur
yang ditunjukkan siswa dapat diberi poin 4, 3, 2 atau 1?
Kompetensi sikap spiritual menjadi penting untuk dipertimbangkan dalam
kaitannya dengan pendidikan, penilaian hasil belajar dan upaya untuk menghasilkan SDM
yang profesional. Kualitas sikap spiritual seharusnya menjadi poin plus bagi SDM
Indonesia, mengingat Indonesia dikenal dengan religiusitas dan fanatismenya terhadap
kepercayaan tertentu serta semangat pendidikan karakter yang sedang marak
dikembangkan di berbagai tingkatan pendidikan. Kekhasan ini seharusnya dipelihara
serta dikembangkan agar dapat menjadi ujung tombak pembeda SDM Indonesia dengan
SDM dari negara lain. Karena profesionalisme seseorang bukan hanya ditentukan oleh
bagaimana keahliannya dalam melakukan sesuatu tetapi juga etika dan kesantunannya
dalam bekerja.
Berkaitan dengan prinsip umum penilaian otentik, yaitu objektif, terpadu,
transparan, edukatif dan akuntabel, indikator keempat termasuk dalam kategori sangat
sesuai dengan perolehan skor 2,91. Kesenjangan 0,09 berhubungan dengan prinsip
edukatif, yaitu tentang bagaimana penilaian yang dirancang guru merangsang siswa
untuk belajar, berprestasi dan mengelola kemampuan High Order Thinking-nya.
Peningkatan kemampuan guru untuk merancang dan mengkonstruksi instrument yang
mampu merangsang keinginan siswa untuk terus belajar dan berprestasi serta mengelola
kemampuan HOT-nya penting dilakukan karena untuk bertahan dalam persaingan
dengan SDM dari Negara lain, generasi Indonesia harus terbiasa terus belajar dan
beradaptasi dengan perkembangan teknologi dan pasar.
Sama halnya dengan prinsip umum penilaian otentik, prinsip khusus penilaian
otentik yang mencakup penilaian berbasis kinerja, pengalaman belajar, kehidupan nyata
dunia kerja dan keterpaduan ranah sikap, pengetahuan dan keterampilan belum berhasil
memperoleh skor maksimal walaupun tergolong dalam kategori sangat sesuai dengan
perolehan skor 2,62. Kesulitan ditemukan pada bagaimana menyusun perangkat
penilaian yang mempertimbangkan ranah sikap, pengetahuan dan keterampilan secara
terpadu.
Informasi tentang prinsip khusus penilaian otentik kemudian dicari tau lebih
lanjut dengan menelaah instrument penilaian pengetahuan dan keterampilan yang dibuat
guru untuk mengetahui persentase butir soal yang telah memenuhi kriteria kesesuaian
dengan kehidupan nyata, keterpaduan, kesinambungan, orientasi kinerja dan motivasi
untuk mengelola kemampuan High Order Thinking (HOT). Berdasarkan analisis yang
dilakukan, secara keseluruhan instrument penilaian pengetahuan yang dibuat guru telah
sesuai dengan penilaian otentik, meskipun perolehan skor hanya 1,78, sedangkan
instrumen penilaian ketrampilan memperoleh skor 2,15 dari maksimal skor 3. Berikut ini
merupakan grafik rincian hasil telaah instrument pengetahuan dan keterampilan:
Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)
P a g e [ 417 ]
Gambar 4. Hasil Analisis Telaah Instrumen
Grafik tersebut memperlihatkan bahwa meskipun secara keseluruhan instrument
penilaian keterampilan lebih sesuai dengan prinsip penilaian otentik, namun ternyata
untuk indikator kesesuaian dengan konteks nyata instrument pengetahuan lebih sesuai.
Dalam rangka memfasilitasi peserta didik dengan simulasi yang semirip mungkin
dengan kasus yang akan mereka hadapi di kehidupan profesionalnya dibutuhkan
instrument penilaian yang berbasis kinerja yang kompleks. Berbasis kinerja artinya
benar-benar mampu untuk mengukur seberapa baik kinerja yang dilakukan peserta didik
dalam rangka menyelesaikan suatu permasalahan. Kompleks artinya dalam
menyelesaikan permasalahan, peserta didik harus mampu memadukan seluruh
kompetensi yang dimilikinya sehingga tidak menimbulkan masalah baru. Oleh karena itu
kemampuan guru untuk mengkonstruksi instrument penilaian yang baik menjadi penting
dalam kaitannya untuk menyiapkan SDM Indonesia dalam menghadapi MEA.
SIMPULAN
Dari hasil analisis dan pembahasan di atas dapat disimpulkan bahwa penerapan
penilaian otentik di SMK N 1 Wonosari program keahlian keuangan tergolong sesuai
dengan perolehan skor mencapai 2,62 dari maksimal skor 3. Kesenjangan sebesar 0,38
berasal dari ketidaksesuaian rancangan penilaian sikap spiritual yang dilakukan guru.
Hal tersebut terbukti dengan tidak adanya indikator pencapaian, teknik dan instrument
kompetensi sikap spiritual. Selain itu, persentase butir yang terpadu dan berbasis kinerja
juga minim. Berdasarkan simpulan tersebut, rekomendasi yang dapat menjadi
pertimbangan bagi pihak-pihak yang berkecimpung di dunia pendidikan adalah:
1. Perlu dilakukan penyamaan persepsi antarpraktisi pendidikan tentang bagaimana
mengukur kompetensi sikap spiritual siswa, khususnya yang berkaitan dengan rubrik
penilaian.
Prosiding Seminar Nasional 9 Mei 2015
[ 418 ] P a g e
2. Perlu dilakukan pelatihan penyusunan instrument penilaian pengetahuan dan
ketrampilan yang kontekstual, terpadu, berkesinambungan, berbasis kinerja dan
memotivasi siswa untuk mengelola kemampuan High Order Thinking (HOT)-nya.
3. Perlu dilakukan identifikasi kekhasan dan kekuatan SDM Indonesia yang mungkin
dikembangkan.
DAFTAR PUSTAKA
Baskoro, Arya. (2014). Peluang, Tantangan, dan Resiko Bagi Indonesia dengan AdanyaMasyarakat Ekonomi ASEAN. Diakses dari http://crmsindonesia.org/node/624.pada tanggal 25 April 2015
Fitzpatrick, J.L., Sanders, J.R., & Worthen, B.R., (2011). Program Evaluation AlternativeApproaches and Practical Guidelines (4th ed.). New Jersey: Pearson.
Gulikers, Judith T.M, Bastiens, Theo J, Kirschner, Paul A. (2004) A Five-DimensionalFramework for Authentic Assessment. Journal of Educational Technology,Research and Development, 52, 67-86.
Kunandar. (2014). Penilaian Otentik (Penilaian Hasil Belajar Peserta Didik BerdasarkanKurikulum 2013) (Ed.Rev). Jakarta: Rajawali Press.
Lund, Jacalyn. (1997). Authentic Assessment: It’s Development and Applications. Journalof Physical Education, Recreation & Dance. 68, 25-40.
Mardapi, D (2008). Teknik Penyusunan Instrumen Tes dan Nontes. Yogyakarta: MitraCendikia Press.
Reynolds, C.R, Liwingston, R.B, Willson, V., (2009). Measurement and Assessment inEducation (2nd ed.). New Jersey: Pearson.
Recommended