35
Prosiding Seminar Nasional 9 Mei 2015 [ 384 ] Page BAGIAN 3. PENILAIAN PEMBELAJARAN SOFTWARE ANBUSO SEBAGAI ALAT ANALISIS BUTIR SOAL YANG PRAKTIS DAN APLIKATIF Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh Fakultas Ekonomi, Universitas Negeri Yogyakarta [email protected] Abstrak Penelitian ini bertujuan untuk mengembangkan, menguji kelayakan software AnBuso, dan mengidentifikasi kendala penggunaannya. Penelitian dan pengembangan ini menggunakan dokumentasi, kuesioner dan wawancara untuk mengumpulkan data. Data yang terkumpul dianalisis secara deskriptif. Penelitian ini menghasilkan software AnBuso dan buku panduan yang dapat dimanfaatkan guru dalam melakukan analisis butir soal secara praktis dan aplikatif. Software tersebut dinilai sangat layak oleh guru dilihat dari aspek kepraktisan dan kemudahan, kebermanfaatan, substansi isi, dan tampilan. Kendala yang dihadapi guru dalam menggunakan software ini terkait dengan lemahnya penguasaan guru terhadap program Microsoft Excel, kurang terbiasanya melakukan analisis butir soal, pemahaman konsep analisis butir soal yang terbatas, dan kendala teknis yang terdapat dalam software. Kata Kunci: AnBuso, kelayakan, analisis butir soal PENDAHULUAN Pendidikan merupakan kunci utama kemajuan bangsa sehingga upaya peningkatan kualitas pendidikan harus terus dilakukan agar Indonesia mampu bersaing di kancah dunia global. Potret kualitas pendidikan di Indonesia masih memprihatinkan. UNESCO pada tahun 2011 melaporkan bahwa indeks Education Development Index (EDI) Indonesia belum beranjak dari kategori sedang (medium) dan berada di peringkat ke-57 dari 115 (UNESCO, 2011). Sementara itu The United Nations Development Programme (UNDP) tanggal 24 Juli 2014 melaporkan Human Development Index (HDI) Indonesia menempati peringkat 108 dari 187 negara, sementara Singapura di posisi 9, Malaysia (62), Thailand (89) (UNDP, 2014). Hal ini menunjukkan bahwa kondisi kualitas pendidikan di Indonesia masih perlu ditingkatkan agar tidak ketinggalan dengan negara lain. Proses pembelajaran menjadi bagian yang penting dalam menentukan kualitas pendidikan secara keseluruhan. Hal ini mengindikasikan bahwa pendidik memiliki peran yang sangat sentral dalam meningkatkan kualitas pendidikan. Peran pendidik tersebut tidak hanya dalam merancang dan melaksanakan pembelajaran saja melainkan juga dalam melakukan asesmen proses dan hasil belajar. Asesmen merupakan komponen yang penting dalam pembelajaran (Russel & Airasian, 2012: 2), karena memiliki pengaruh yang kuat dalam meningkatkan proses pembelajaran (Raymond, et.al., 2012; Bers, 2008: 32) bahkan penggunaan prosedur asesmen yang benar dapat memberikan kontribusi langsung kepada peningkatan belajar peserta didik (Miller, Linn & Gronlund,

BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Embed Size (px)

Citation preview

Page 1: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 384 ] P a g e

BAGIAN 3. PENILAIAN PEMBELAJARAN

SOFTWARE ANBUSO SEBAGAI ALAT ANALISIS BUTIR SOAL

YANG PRAKTIS DAN APLIKATIF

Ali Muhson, Barkah Lestari, Supriyanto & Kiromim BarorohFakultas Ekonomi, Universitas Negeri Yogyakarta

[email protected]

AbstrakPenelitian ini bertujuan untuk mengembangkan, menguji kelayakan softwareAnBuso, dan mengidentifikasi kendala penggunaannya. Penelitian danpengembangan ini menggunakan dokumentasi, kuesioner dan wawancara untukmengumpulkan data. Data yang terkumpul dianalisis secara deskriptif. Penelitianini menghasilkan software AnBuso dan buku panduan yang dapat dimanfaatkanguru dalam melakukan analisis butir soal secara praktis dan aplikatif. Softwaretersebut dinilai sangat layak oleh guru dilihat dari aspek kepraktisan dankemudahan, kebermanfaatan, substansi isi, dan tampilan. Kendala yang dihadapiguru dalam menggunakan software ini terkait dengan lemahnya penguasaanguru terhadap program Microsoft Excel, kurang terbiasanya melakukan analisisbutir soal, pemahaman konsep analisis butir soal yang terbatas, dan kendalateknis yang terdapat dalam software.

Kata Kunci: AnBuso, kelayakan, analisis butir soal

PENDAHULUAN

Pendidikan merupakan kunci utama kemajuan bangsa sehingga upaya

peningkatan kualitas pendidikan harus terus dilakukan agar Indonesia mampu bersaing

di kancah dunia global. Potret kualitas pendidikan di Indonesia masih memprihatinkan.

UNESCO pada tahun 2011 melaporkan bahwa indeks Education Development Index (EDI)

Indonesia belum beranjak dari kategori sedang (medium) dan berada di peringkat ke-57

dari 115 (UNESCO, 2011). Sementara itu The United Nations Development Programme

(UNDP) tanggal 24 Juli 2014 melaporkan Human Development Index (HDI) Indonesia

menempati peringkat 108 dari 187 negara, sementara Singapura di posisi 9, Malaysia

(62), Thailand (89) (UNDP, 2014). Hal ini menunjukkan bahwa kondisi kualitas

pendidikan di Indonesia masih perlu ditingkatkan agar tidak ketinggalan dengan negara

lain.

Proses pembelajaran menjadi bagian yang penting dalam menentukan kualitas

pendidikan secara keseluruhan. Hal ini mengindikasikan bahwa pendidik memiliki peran

yang sangat sentral dalam meningkatkan kualitas pendidikan. Peran pendidik tersebut

tidak hanya dalam merancang dan melaksanakan pembelajaran saja melainkan juga

dalam melakukan asesmen proses dan hasil belajar. Asesmen merupakan komponen

yang penting dalam pembelajaran (Russel & Airasian, 2012: 2), karena memiliki

pengaruh yang kuat dalam meningkatkan proses pembelajaran (Raymond, et.al., 2012;

Bers, 2008: 32) bahkan penggunaan prosedur asesmen yang benar dapat memberikan

kontribusi langsung kepada peningkatan belajar peserta didik (Miller, Linn & Gronlund,

Page 2: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)

P a g e [ 385 ]

2009: 34). Oleh karena itu, guru harus mampu mengembangkan alat asesmen yang baik

yang mampu memotret secara tepat kompetensi yang telah dicapai peserta didik.

Guna mengukur tingkat ketercapaian tujuan pendidikan perlu dikembangkan alat

asesmen yang mampu mengungkap seluruh komponen yang ingin dicapai dalam

pembelajaran. Asesmen merupakan kegiatan pengumpulan bukti-bukti tentang

pembelajaran siswa sebagai informasi untuk pengambilan keputusan dalam

pembelajaran (Stiggins & Chappius, 2012: 3). Oleh karena itu agar keputusan yang

diambil tepat, asesmen harus memperhatikan keseluruhan aspek yang akan diukur agar

mampu menggambarkan dengan tepat sasaran yang dituju.

Pemberlakuan kurikulum 2013 dalam implementasinya masih banyak mengalami

masalah (Republika, 2014), misalnya timbul masalah sulitnya mengubah mindset guru

(Metronews, 2014; Tempo, 2013). Hasil kajian juga menunjukkan bahwa sebanyak 87

persen guru masih kesulitan dalam memahami cara asesmen autentik (Susilowati, 2013).

Satu hal yang membuat guru repot adalah sistem asesmen yang memiliki terlalu banyak

aspek (Tempo, 2014). Hal ini mengindikasikan bahwa kemampuan guru untuk

melakukan asesmen secara baik masih perlu ditingkatkan.

Asesmen adalah upaya sistematis dalam mengumpulkan, mengkaji, dan

menggunakan informasi tentang program-program pendidikan yang dilakukan untuk

tujuan meningkatkan dan mengembangkan pembelajaran (Banta, Palomba, & Kinzie,

2014: 2). Dengan demikian dalam asesmen terdapat proses pengumpulan informasi,

pengkajian dan penggunaan informasi tersebut untuk membuat keputusan pembelajaran

agar dapat meningkatkan proses pembelajaran.

Agar asesmen menghasilkan informasi yang tepat maka perlu dilakukan dengan

baik dengan cara mengumpulkan bukti akurat terkait pencapaian hasil belajar siswa dan

menjadikan proses asesmen kelas dan hasilnya bermanfaat bagi siswa, yaitu mampu

meningkatkan motivasi dan prestasi belajarnya (Stiggins & Chappuis, 2012: 3). Dengan

demikian, asesmen harus dapat menilai kemajuan belajar siswa. Informasi tersebut dapat

digunakan sebagai dasar untuk mengambil suatu keputusan tentang status siswa dalam

kelompoknya dan menentukan langkah-langkah selanjutnya. Oleh karena itu dalam

melakukan asesmen hasil pembelajaran perlu dirancang langkah-langkahnya secara rinci

agar mampu memotret kompetensi siswa secara tepat.

Asesmen membantu guru dalam memperjelas tujuan pembelajaran dan

pencapaiannya, menciptakan pengalaman yang menerapkan pengetahuan dalam konteks

kehidupan nyata, dan memberikan berbagai cara bagi siswa untuk menunjukkan

kemampuan dan keterampilan mereka (Darling-Hammond, 2014: 54). Prosedur asesmen

yang digunakan dengan benar dapat memberikan kontribusi langsung kepada

peningkatan belajar siswa, yakni (1) mengklarifikasi sifat hasil belajar yang dimaksud,

(2) menyiapkan tujuan jangka pendek agar terarah, (3) memberikan umpan balik

terhadap kemajuan belajar, (4) memberikan informasi dalam mengatasi kesulitan belajar

dan untuk memilih pengalaman belajar masa depan, dan (5) mengidentifikasi tujuan

Page 3: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 386 ] P a g e

pembelajaran berikutnya (Miller, Linn & Gronlund, 2009: 34). Prosedur tersebut

merupakan langkah yang saling berkaitan dan menentukan langkah berikutnya.

Asesmen juga bertujuan menjaga keseimbangan kelas, merencanakan dan

melaksanakan pembelajaran, menempatkan siswa, memberikan umpan balik dan

penghargaan, mendiagnosis masalah siswa, dan menilai tingkat kemajuan akademik

(Russell & Airasian, 2012: 5-8). Hal ini mengindikasikan bahwa melalui asesmen dapat

ditentukan rancangan pembelajaran berikutnya dengan cara mendiagnosis masalah yang

dihadapi siswa agar prestasi akademik siswa dapat berkembang secara optimal.

Pendapat lain juga menyatakan bahwa ada tiga tujuan utama dilakukannya

asesmen. Pertama, untuk memantau kemajuan pendidikan atau perbaikan. Pendidik,

pembuat kebijakan, orang tua dan masyarakat ingin tahu berapa banyak siswa mencapai

standar kinerja yang ditentukan. Tujuan ini, sering disebut asesmen sumatif. Tujuan

kedua adalah untuk memberikan umpan balik kepada guru dan siswa. Para guru dapat

menggunakan umpan balik untuk memperbaiki proses pembelajaran, dan siswa dapat

menggunakan umpan balik untuk memantau pembelajaran mereka sendiri. Tujuan ini,

sering disebut asesmen formatif. Tujuan ketiga asesmen adalah untuk mendorong

perubahan dalam praktek dan kebijakan untuk mencapai perubahan yang diinginkan.

Tujuan ini, disebut asesmen akuntabilitas (National Research Council, 1999, 1-2). Dengan

demikian asesmen dapat berfungsi untuk memantau kemajuan pembelajaran,

memberikan informasi sebagai dasar pemberian umpan balik, dan melakukan perbaikan

pembelajaran.

Dalam melakukan asesmen kelas tidak dapat dilakukan dengan mudah namun

harus mendasarkan pada beberapa kriteria. Beberapa kriteria yang harus dipenuhi dalam

melakukan asesmen kelas adalah validitas, reliabilitas, terfokus pada kompetensi,

komprehensif, objektivitas, dan mendidik (Puskur, 2008). Pendapat lain juga menyatakan

bahwa agar hasil asesmen dapat memberikan informasi yang tepat maka harus

memenuhi validitas, reliabilitas, dan objektivitas (Anderson, 2003: 10; Kubiszyn &

Borich, 2013: 326). Dengan demikian, validitas dan reliabilitas menjadi bagian yang

penting dalam kegiatan asesmen agar informasi yang dihasilkan sesuai dengan yang

diharapkan.

Item analyses play a somewhat more important role in construct and predictive

validation (Nunnally & Bernstein, 1994: 304). Hal ini berarti analisis butir menjadi bagian

yang penting dalam menjamin validitas butir soal. Tiga hal yang diperhatikan dalam

melakukan analisis butir soal adalah tingkat kesukaran, daya beda dan distraktor.

Tingkat kesukaran suatu butir soal merupakan salah satu parameter butir soal yang

sangat berguna dalam penganalisian suatu tes. Hal ini disebabkan karena dengan melihat

parameter butir ini, akan diketahui seberapa baiknya kualitas suatu butir soal. Jika

tingkat kesukaran mendekati 0, maka soal tersebut terlalu sukar, sedangkan jika tingkat

kesukaran mendekati 1, maka soal tersebut terlalu mudah. Soal yang terlalu sukar dan

terlalu mudah perlu dibuang karena butir tersebut tidak dapat membedakan kemampuan

seorang siswa dengan siswa lainnya. Indeks kesukaran suatu butir yang baik terletak

Page 4: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)

P a g e [ 387 ]

dalam kategori sedang yakni pada interval 0,30 – 0,70 (Allen & Yen, 1979: 121; Kaplan &

Saccuzzo, 2005: 170; Sudjana, 2011: 137). Pada interval ini, informasi tentang

kemampuan siswa akan diperoleh secara maksimal.

Kriteria kedua yang perlu diperhatikan adalah daya beda butir soal. Daya beda

butir merujuk pada kemampuan butir soal untuk membedakan peserta tes yang

berkemampuan tinggi dan berkemampuan rendah. Untuk menentukan daya pembeda

dapat menggunakan indeks diskriminasi, indeks korelasi biserial, indeks korelasi point

biserial, dan indeks keselarasan. Indeks daya pembeda suatu butir yang kecil nilainya

akan menyebabkan butir tersebut tidak dapat membedakan siswa yang kemampuannya

tinggi dan siswa yang kemampuannya rendah. Jika nilai daya beda rendah menunjukkan

adanya kemencengan distribusi skor dari populasi sehingga mengakibatkan validitas tes

menjadi rendah. Indeks daya beda dikatakan baik jika lebih besar atau sama dengan 0,3

(Nunnally & Bernstein, 2009: 304; Kaplan & Saccuzzo, 2005: 176; Azwar, 2003: 153).

Sementara itu koefisien antara 0,20 – 0,29 dianggap cukup baik (Alagumalai & Curtis,

2005: 8) dan koefisien di bawah 0,2 dianggap tidak baik sehingga perlu dibuang (Ebel &

Frisbie, 1991: 232; Crocker & Algina, 2006: 315).

Khusus untuk tes objektif bentuk multiple choice perlu dilengkapi dengan

beberapa alternatif jawaban, atau yang sering dikenal dengan istilah option. Option atau

alternatif itu jumlahnya berkisar antara 3 sampai dengan 5 buah, dan dari kemungkinan-

kemungkinan jawaban yang terpasang pada setiap butir item itu, salah satu di antaranya

adalah merupakan jawaban betul (kunci jawaban) sedangkan yang lainnya salah.

Alternatif jawaban salah itulah yang biasa dikenal dengan istilah distractor (pengecoh).

Pada kenyataannya bisa terjadi alternatif yang diberikan pada butir tertentu sama sekali

tidak dipilih oleh peserta tes. Hal ini berarti alternatif tersebut tidak mampu berfungsi

sebagai pengecoh yang baik. Pengecoh dinyatakan telah dapat menjalankan fungsinya

dengan baik apabila distraktor tersebut sekurang-kurangnya sudah dipilih oleh 5 % dari

seluruh peserta tes.

Asesmen akan menjadi bermakna dalam proses pembelajaran manakala hasil

asesmen tersebut dimanfaatkan dan ditindaklanjuti. Umpan balik asesmen merupakan

bagian yang tidak terpisahkan dari sebuah proses pembelajaran dan asesmen itu sendiri.

Umpan balik bukanlah hal yang asing dalam dunia pendidikan dan asesmen (Irons, 2008:

1). Umpan balik akan sangat bermakna jika dilakukan secara tepat (Brookhart, 2008: 2)

karena dapat meningkatkan proses pembelajaran (Irons, 2008: 7). Hasil penelitian juga

menunjukkan bahwa umpan balik berdampak positif terhadap hasil belajar (James &

Folorunso, 2012; Delacruz, 2012). Artinya diperlukan kemampuan dan strategi khusus

dalam memberikan asesmen yang baik serta feedback (umpan balik) yang tepat agar

mampu meningkatkan kualitas pembelajaran. Oleh karena itu sudah selayaknya jika guru

memiliki kompetensi yang memadai dalam melakukan asesmen dan umpan balik.

Umpan balik merupakan bukti yang menegaskan atas kebenaran suatu tindakan

(Wiggins, 1993: 185). Umpan balik dikonseptualisasikan sebagai informasi yang

diberikan oleh perantara (misalnya, guru, teman sebaya, buku, orang tua, diri,

Page 5: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 388 ] P a g e

pengalaman) mengenai aspek kinerja atau pemahaman seseorang (Hattie & Timperley

2007). Umpan balik formatif adalah setiap informasi, proses atau kegiatan yang memberi

atau mempercepat belajar siswa berdasarkan komentar yang berkaitan dengan asesmen

formatif dan kegiatan asesmen sumatif (Irons, 2008: 7). Umpan balik formatif biasanya

disajikan sebagai informasi kepada peserta didik dalam menanggapi beberapa tindakan

peserta didik. Bentuknya dapat berupa berbagai jenis (misalnya, verifikasi akurasi

respon, penjelasan jawaban yang benar, petunjuk, pemberian contoh) (Shute 2007: i).

Pengertian tersebut menunjukkan bahwa umpan balik merupakan sesuatu yang

diberikan untuk dapat mengkaji apa yang telah dilakukan. Umpan balik itu sendiri adalah

salah satu upaya untuk mengobservasi siswa berkaitan dengan bagaimana mereka

melakukan aktivitas serta apa yang harus dilakukan guru untuk meningkatkan

kemampuan siswa.

Tujuan utama dari umpan balik formatif adalah untuk meningkatkan

pengetahuan, keterampilan, dan pemahaman peserta didik (misalnya, pemecahan

masalah) (Shute, 2007: 6) karena itu umpan balik harus bersifat interaktif, meningkatkan

motivasi dan berupaya memecahkan masalah (Langer, 2011). Peterson & Irving (2008)

dalam penelitiannya menjelaskan bahwa ternyata siswa berpandangan umpan balik

dapat memberikan informasi dan balikan yang baik kepada mereka. Komentar yang

diberikan dalam umpan balik formatif hanya dapat efektif jika siswa membaca dan

memanfaatkannya (Higgins & Hartley, 2002). Umpan balik dapat digunakan untuk

meningkatkan efektivitas pembelajaran di kelas (Hattie & Timperley, 2007). Umpan balik

yang diberikan kepada peserta didik jika diberikan secara tepat akan membantu mereka

meningkatkan kinerjanya, memberikan ide tentang bagaimana mereka berkembang,

meningkatkan motivasi dan memberdayakan mereka sebagai peserta didik (Harvey,

2011: 20). Dengan demikian dapat dikatakan bahwa umpan balik memiliki peran yang

penting dalam proses pembelajaran, artinya melalui umpan balik dapat mengarahkan

proses pembelajaran sesuai dengan tujuan yang ingin dicapai.

Kajian di atas menunjukkan bahwa asesmen pembelajaran merupakan kegiatan

yang penting dilakukan. Asesmen harus mampu mengukur secara tepat kompetensi

peserta didik sehingga instrumen yang digunakan haruslah valid. Analisis butir soal

memiliki peran penting untuk mengidentifikasi butir soal yang baik. Hasil asesmen juga

memberikan informasi yang akurat tentang kemampuan peserta didik sehingga dapat

diidentifikasi materi mana yang dianggap sulit, bahkan hasil analisis juga memberikan

informasi tentang materi mana yang belum dikuasai oleh masing-masing peserta didik

sehingga dapat dilakukan upaya perbaikan melalui kegiatan remedial. Guna memenuhi

hal tersebut perlu dikembangkan sebuah software analisis soal yang praktis dan aplikatif

sehingga dapat memotivasi guru senantiasa melakukan analisis butir soal.

Berbagai software analisis butir soal memang sudah banyak dikembangkan oleh

para ahli namun belum dimanfaatkan secara optimal oleh guru. Hal itu terjadi karena

sebagian besar software berbahasa asing sehingga sulit untuk memahami cara

penggunaannya. Software tersebut juga cukup rumit untuk digunakan dan kurang praktis

Page 6: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)

P a g e [ 389 ]

dan aplikatif. Informasi yang diberikan dalam software tersebut juga ditampilkan dalam

format yang sangat beragam sehingga mempersulit guru untuk menguasainya. Oleh

karena itu perlu dikembangkan software analisis butir soal yang praktis dan aplikatif

sesuai dengan kebutuhan guru di lapangan.

Guna memenuhi tuntutan tersebut, Muhson, dkk (2013) telah berhasil

mengembangkan software yang diberi nama AnBuso (Analisis Butir Soal). Dalam

software AnBuso tersebut dapat diketahui baik tidaknya soal yang dibuat guru, baik dari

sisi daya beda, tingkat kesulitan, maupun efektivitas distraktornya. Di samping itu dalam

software tersebut juga memberikan informasi tentang kemampuan seluruh siswa dan

tingkat ketercapaian KKM (Kriteria Ketuntasan Minimal). Software ini juga dirancang

untuk mampu mengidentifikasi dan mengelompokkan siswa yang masuk dalam program

remedial berdasarkan materi yang belum dikuasai sehingga akan mempermudah guru

dalam pelaksanaan program remedial. Semua hasil analisis tersebut sudah ditampilkan

dan dapat dicetak dalam format laporan yang sangat mudah untuk dibaca dan ditafsirkan.

Hasil ujicoba terbatas ditemukan bahwa keberadaan software AnBuso disambut

positif oleh guru sebagai alternatif untuk melakukan analisis butir soal. Bahkan beberapa

guru yang telah menggunakan AnBuso merasa bahwa software ini lebih mudah

digunakan, praktis, dan aplikatif sehingga mereka mengaku selalu menggunakan

software AnBuso dibandingkan dengan software lain (Muhson, dkk, 2013).

Hasil temuan di atas menunjukkan bahwa software AnBuso yang dikembangkan

pada tahap awal ini telah direspon positif oleh guru serta sangat bermanfaat dan siap

untuk digunakan. Sebagai produk awal, perlu lebih dikembangkan dan disempurnakan

lagi agar kelemahan dan kekurangan yang ada di software tersebut dapat diatasi. Oleh

karena itu software tersebut perlu dikaji dan diujicoba lagi dengan melibatkan guru dan

pengawas yang lebih banyak agar diperoleh masukan yang lebih kompehensif. Penelitian

ini dimaksudkan untuk mengetahui kelayakan dan mengidentifikasi kendala yang

dihadapi dalam menggunakan software AnBuso. Tujuan akhirnya adalah menghasilkan

produk berupa software AnBuso yang siap untuk dipublish kepada khalayak sasaran.

METODE

Penelitian ini menggunakan model Research and Development (R & D). Prosedur

pengembangan dilakukan dengan langkah perancangan dan pengembangan produk,

validasi produk, uji coba produk, dan diseminasi produk. Kegiatan perancangan dan

pengembangan produk sudah dilakukan sampai pada tahap ujicoba produk tetapi masih

pada ujicoba terbatas. Penelitian ini berusaha untuk melanjutkan pengembangan produk

dengan melakukan ujicoba produk pada khalayak yang lebih luas agar diperoleh

informasi dan masukan yang lebih komprehensif untuk kepentingan penyempurnaan

produk.

Penelitian ini melibatkan guru-guru dan pengawas sekolah di DIY. Responden

yang dilibatkan 65 orang yang berasal dari lima kabupaten/kota di provinsi DIY.

Penentuan responden dilakukan secara purposive sampling dengan mempertimbangkan

Page 7: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 390 ] P a g e

kemampuan guru dalam penguasaan komputer, khususnya program aplikasi Microsoft

Excel.

Teknik pengumpulan data yang digunakan dalam penelitian ini meliputi observasi,

dokumentasi, angket, dan wawancara. Observasi digunakan untuk memperoleh data atau

informasi tentang kemampuan guru dalam menggunakan program aplikasi yang telah

dikembangkan. Hal ini diperlukan untuk diperoleh data tentang kemampuan guru dalam

penggunaan software yang telah dikembangkan.

Teknik dokumentasi dalam penelitian ini digunakan untuk memperoleh data

tentang dokumen tes yang digunakan guru dalam mengukur kemampuan peserta didik,

baik tes formatif maupun tes sumatif. Dokumen tersebut dapat berupa soal-soal ujian dan

ulangan harian, program remedial, dan hasil analisis butir soal yang selama ini digunakan

guru.

Angket digunakan untuk mengungkap masukan-masukan yang diperlukan dari

guru, pengawas, pejabat dinas pendidikan dan para pakar. Angket ini juga sekaligus

digunakan untuk mengukur tingkat kelayakan dari software yang telah dikembangkan.

Angket yang dikembangkan meliputi angket kelayakan software baik yang terkait dari

sisi tampilan, substansi materi/isi, aspek kebermanfaatan, dan aspek kepraktisan dan

kemudahan. Teknik terakhir yang digunakan adalah wawancara yang dilakukan kepada

guru, pengawas, pejabat Dinas Pendidikan dan para pakar. Teknik ini digunakan untuk

mengungkap berbagai kelebihan dan kelemahan dari software yang dikembangkan agar

dapat dijadikan sebagai masukan untuk penyempurnaan.

Analisis data yang digunakan meliputi analisis deskriptif. Analisis yang dilakukan

meliputi analisis kelayakan software baik dilihat dari sisi tampilan, substansi materi/isi,

maupun kepraktisan dan kemudahan. Dalam melakukan analisis ini digunakan lima

kategori seperti terlihat pada Tabel 1.

Tabel 1. Kategorisasi Penilaian Kelayakan Software

No Skor Kategori

1 Lebih dari M + 1,8 SD Sangat layak2 M + 0,6 SD s.d. M + 1,8 SD Layak3 M – 0,6 SD s.d. M + 0,6 SD Cukup4 M – 1,8 SD s.d. M – 0,6 SD Tidak layak5 Kurang dari M – 1,8 SD Sangat tidak layak

HASIL DAN PEMBAHASAN

Untuk memperoleh gambaran tentang hasil pengembangan software dilakukan

ujicoba luas yang melibatkan para user seperti guru, pengawas, dan pelaku pendidikan

sebanyak 65 orang. Sebagian besar (72%) mereka mengajar di tingkat SLTA baik SMA,

SMK maupun MA. Sebagian besar mereka 68% berasal dari sekolah negeri dan

responden yang sudah PNS sebanyak 57%. Agar penelitian ini mampu memperoleh

gambaran yang memadai maka guru-guru yang dilibatkan juga berasal dari berbagai

Page 8: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)

P a g e [ 391 ]

bidang studi, di antaranya Ekonomi, Akuntansi, Matematika, IPS, Bahasa Inggris, Bahasa

Indonesia, Teknologi Informasi, Kimia, Fisika, Biologi, Geografi, Bahasa Arab, dan

sebagainya.

Jika dilihat dari kemauan guru dalam melakukan analisis butir soal tampaknya

masih memprihatinkan. Sebagian besar guru 57% memang sudah melakukan analisis

butir soal namun masih bersifat kadang-kadang. Hanya 11% saja yang selalu melakukan

analisis butir soal sedangkan yang tidak pernah melakukan analisis butir soal sebanyak

12%. Hal ini tentu menjadi penting untuk dikaji mengapa guru sebagai pelaku pendidikan

memiliki kemauan yang rendah dalam melakukan analisis butir soal.

Pada umumnya guru hanya melakukan analisis butir soal jika memang dituntut

oleh pengawas. Artinya kesadaran guru untuk melakukan analisis butir soal terhadap

semua soal yang sudah diujikan kepada siswa masih kurang. Hal ini terjadi karena

umumnya guru kurang menguasai software analisis butir soal yang sudah ada. Kalaupun

menguasai tampaknya tidak mampu membangkitkan minat dan kemauan guru dalam

melakukan analisis butir soal secara terus menerus. Tentu saja hal ini akan berdampak

pada rendahnya kualitas butir soal yang dikembangkan guru karena tidak selalu

dilakukan analisis.

Penelitian ini berhasil mengembangkan software AnBuso dan buku panduannya

yang sudah diperbaiki sesuai masukan responden. Buku panduan dikembangkan untuk

memudahkan pengguna dalam memanfaatkan software ini. Buku panduan ini sekaligus

memberikan informasi tentang langkah-langkah dan cara menggunakan software ini

sehingga memudahkan user untuk memanfaatkan software dalam melakukan analisis

butir soal. Panduan ini berisi tentang pendahuluan, kerangka isi, data input, dan data

laporan.

Beberapa perubahan yang penting yang dihasilkan adalah penyesuaian software

ini dengan diberlakukannya kurikulum 2013 terutama yang terkait dengan masalah

penilaian. Karena itu pada penelitian ini dilakukan revisi perbaikan yang meliputi

perubahan tampilan, sheet Input01, sheet Laporan Peserta, sheet Peserta Remedial,

dan perubahan formula.

Sebelum Perubahan Sesudah Perubahan

Gambar 1. Tampilan Sheet Input01 Sebelum dan Sesudah Perubahan

Page 9: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 392 ] P a g e

Perubahan tampilan perlu dilakukan karena dianggap terlalu banyak variasi

warna sehingga terlihat kurang menarik. Oleh karena itu dilakukan perubahan-

perubahan sesuai masukan. Perubahan tampilan tidak hanya dilakukan pada sheet input

(Gambar 1) tetapi juga dilakukan perubahan tampilan pada sheet laporan (Gambar 2).

Sebelum Perubahan Sesudah Perubahan

Gambar 2. Tampilan Sheet Laporan Butir Sebelum dan Sesudah Perubahan

Akibat diberlakukannya kurikulum 2013, software AnBuso juga dilakukan

penyesuaian agar software ini mampu mengakomodasikan kepentingan guru dalam

membuat penilaian sesuai dengan kurikulum 2013. Beberapa perubahan yang dilakukan

mencakup dalam hal penentuan skala penilaian. Pada software sebelumnya skala

penilaian yang disediakan hanya 1-10 dan 1-100, sementara itu kurikulum 2013

menggunakan skala penilaian 1-4, karena itu dalam software ini dilakukan penyesuaian

dengan menyediakan skala penilaian 1-4 (Gambar 3).

Gambar 3. Perubahan Skala Penilaian

Page 10: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)

P a g e [ 393 ]

Berdasarkan hasil ujicoba luas juga ditemukan beberapa kendala dalam

menentukan bobot penilaian antara soal objektif dan soal essay. Karena itu software

ini juga dilakukan perubahan dalam penentuan bobot tersebut dengan menyediakan

kolom tersendiri untuk bobot soal objektif dan soal essay (perubahannya dapat

dilihat pada Gambar 4). Dengan cara tersebut diharapkan guru atau user akan

semakin praktis dalam menentukan bobot penilaiannya. Bahkan software ini juga

memungkinkan untuk digunakan hanya untuk soal objektif saja atau untuk soal essay

saja.

Gambar 4. Penambahan Bobot Penilaian

Penyesuaian dengan kurikulum 2013 juga berdampak pada perubahan pada Sheet

Laporan Peserta. Pada bagian ini dimunculkan hasil penilaian peserta tes menurut

kurikulum 2013 lengkap dengan predikatnya (hasil perbaikannya dapat dilihat pada

Gambar 5). Predikat penilaian dilakukan penyesuaian berdasarkan Permendikbud

Nomor 52. Sementara itu pada bagian yang lain tidak mengalami perubahan karena

sudah sesuai dengan yang diharapkan guru.

Pada dasarnya tujuan guru melakukan analisis butir soal di samping untuk

mengetahui kualitas butir soal yang telah dibuat juga informasi hasil penilaian

pesertanya dapat dimanfaatkan untuk melakukan rencana tindak lanjut baik untuk

keperluan remedial maupun pengayaan. Oleh karena itu hasil laporan peserta haruslah

mampu memberikan gambaran siapa saja peserta yang masuk pada kelompok pengayaan

dan remedial. Pada pengembangan software ini sudah mampu mengantisipasi hal

tersebut namun demikian pada versi sebelumnya hanya sebatas pengelompokan peserta

remedial saja dan belum disediakan kolom untuk melakukan tindak lanjut.

Page 11: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 394 ] P a g e

Gambar 5. Perbaikan Sheet Laporan Peserta

Guna memenuhi hal tersebut pada sheet Peserta Remedial dilakukan perbaikan

yakni tidak hanya menemukan kelompok peserta remedial menurut kemampuan yang

diukur melainkan disediakan kolom untuk pengisian jadwal kegiatan remedialnya. Hal itu

diperlukan agar mampu meengkamodasikan kebutuhan guru dalam membuat jadwal

remedial yang lebih praktis. Perbaikan pada sheet Laporan Peserta Remedial tersebut

dapat dilihat pada Gambar 6.

Gambar 6. Perbaikan Sheet Laporan Peserta

Page 12: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)

P a g e [ 395 ]

Hasil uji kelayakan memperlihatkan bahwa software AnBuso yang dikembangkan

dalam penelitian ini terbukti dinilai sangat layak. 51% responden menyatakan layak dan

46% menyatakan sangat layak sementara yang lainnya menyatakan cukup layak. Hal ini

menunjukkan bahwa software yang dikembangkan ini memiliki kebermanfaatan yang

tinggi dalam membantu guru untuk melakukan analisis butir soal.

Aspek kelayakan yang dinilai paling tinggi adalah aspek kepraktisan dan

kemudahan, dan aspek kebermanfaatan. Sementara aspek yang dinilai paling rendah

adalah aspek tampilan (Gambar 7). Dilihat dari jenis kelamin guru juga tampak tidak

menunjukkan adanya perbedaan yang signifikan terkait dengan penilaian mereka

terhadap kelayakan software. Software AnBuso dianggap praktis dan mudah untuk

digunakan serta bermanfaat dalam membantu melakukan analisis butir soal. AnBuso

dikembangkan dengan Microsoft Excel sehingga mempermudah guru dalam

menggunakannya. Hasil analisis yang dihasilkan juga memberikan informasi yang

lengkap. AnBuso tidak hanya mampu menganalisis butir soal objektif saja melainkan juga

soal essay. Hasil analisis juga sudah dibuat dalam format laporan sehingga

mempermudah guru dalam menafsirkan hasilnya.

Gambar 7. Hasil Uji Kelayakan Software

Aspek tampilan tampaknya dinilai paling rendah dibandingkan dengan yang lain.

Hal ini terjadi karena adanya keterbatasan dalam mengatur tampilan karena program ini

bukanlah program yang berdiri sendiri melainkan melekat dengan program Microsoft

Excel. Akibatnya tampilan yang dihasilkan juga menyesuaikan dengan fitur yang tersedia

dalam Mcrosoft Excel. Komponen yang dinilai rendah adalah kesesuaian pemilihan

warna, tata letak dan topografi (pemilihan jenis font). Hal ini mengindikasikan bahwa

software ini perlu perbaikan dari sisi tampilan. Variasi warna dan pemilihan font perlu

dilakukan perubahan agar tampilannya menjadi lebih menarik. Bahkan bila perlu

menggunakan program desain grafis dalam merancang tampilan.

Page 13: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 396 ] P a g e

Aspek substansi isi dari software dianggap sangat baik karena sesuai dengan

kebutuhan guru. Sofware dinilai praktis untuk digunakan, menarik, inovatif, kreatif,

interaktif dan unik. Informasi yang dihasilkan dari software ini sangat lengkap, tidak

hanya menampilkan hasil analisis butir doal objektif dan essay melainkan juga

menampilkan hasil pencapaian nilai dan KKM peserta didik. Bahkan dalam software ini

dapat ditemukan materi-materi tertentu yang belum dikuasai oleh masing-masing

peserta didik sehingga dapat memberikan informasi kepada guru dalam merancang

program remedial dan pengayaan.

Dilihat dari aspek kepraktisan dan kemudahan dari software dianggap sangat

baik. Software dinilai mudah digunakan, dipahami, dipelajari, dibaca dan ditafsirkan

hasilnya. Untuk memanfaatkan software ini tidak perlu belajar program baru namun

cukup menggunakan pengetahuan dan keterampilan dalam menggunakan Microsoft

Excel. Oleh karena program ini umumnya sudah dikuasai guru maka software ini menjadi

mudah untuk dimanfaatkan dan diaplikasikan.

Software juga dinilai memiliki manfaat yang tinggi oleh guru. Software yang

dihasilkan dinilai sangat bermanfaat, aplikatif dan sesuai dengan kebutuhan guru. Hal ini

menunjukkan bahwa keberadaan software ini memiliki kebermanfaatan yang tinggi

dalam membantu guru untuk melakukan analisis butir soal. Hasil analisis yang

ditampilkan dari software ini sangat sesuai dengan kebutuhan guru karena dapat

dimanfaatkan untuk melakukan evaluasi terhadap instrumen dan soal yang dibuat guru

dalam mengukur kompetensi peserta didik. Oleh karena tampilan hasil analisis sudah

dibuat dalam format laporan maka hasil analisis ini juga dapat dipergunakan untuk

keperluan membuat laporan administrasi guru.

Walaupun software AnBuso ini dinilai layak namun dalam kenyataannya ada

beberapa kendala yang dihadapi guru dalam menggunakan software ini. Dari sisi manfaat

yang dihasilkan dari software ini memang sangat baik namun masih ada beberapa guru

yang kurang mahir dalam penguasaan komputer, khususnya program Microsoft Excel.

Umumnya pengetahuan guru terhadap program ini sangatlah terbatas. Masih banyak

menu dan fasilitas yang disediakan Microsoft Excel namun belum dimanfaatkan secara

optimal. Oleh karena software ini terintegrasi dengan program Excel maka akibatnya

guru kurang lancar dalam memanfaatkan software ini.

Kesediaan dan kebiasaan guru dalam melakukan analisis butir soal juga masih

dalam kategori jarang. Hanya sedikit guru yang selalu melakukan analisis butir soal baik

terhadap soal harian yang dibuatnya, soal semeseteran maupun soal ujian akhir. Karena

kebiasaan mereka tersebut akibatnya guru kurang lancar dalam melakukan analisis butir

soal karena memang belum terbiasa.

Pengetahuan dan penguasaan guru tentang konsep analisis butir soal juga masih

terbatas. Sementara pengembangan software ini juga didasarkan pada konsep analisis

butir soal terutama analisis klasik, akibatnya pemahaman guru terhadap angka-angka

yang dihasilkan dari software masih kurang. Walaupun hasil analisis sudah dikemas

Page 14: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)

P a g e [ 397 ]

dalam bentuk laporan yang siap ditandatangani, namun masih perlu dijelaskan tentang

arti dan makna dari hasil analisis tersebut.

SIMPULAN

Penelitian ini berhasil mengembangkan software AnBuso yang dapat

dimanfaatkan guru dalam melakukan analisis butir soal secara praktis dan aplikatif.

Software ini dibuat dengan program Microsoft Excel yang di dalamnya terdapat sheet

untuk input data, sheet data processing, sheet laporan hasil analisis dalam bentuk tabel

dan gambar.

Software yang dihasilkan terbukti sangat layak oleh guru dilihat dari aspek

kepraktisan dan kemudahan, aspek kebermanfaatan dan aspek substansi isi serta aspek

tampilan. Walaupun demikian, ada beberapa kendala yang dihadapi guru dalam

menggunakan software ini seperti lemahnya penguasaan guru terhadap program

Microsoft Excel, kurang terbiasanya melakukan analisis butir soal, pemahaman konsep

analisis butir soal yang terbatas, dan kendala teknis yang terdapat dalam software.

Software ini terbukti sangat layak dan sangat bermanfaat bagi guru karena itu

perlu sosialisasi yang lebih luas tentang penggunaan software ini agar lebih dikenal oleh

guru sehingga mampu meningkatkan kinerja guru dalam melakukan analisis butir soal.

Pengembangan software ini masih perlu terus dilakukan agar mampu memenuhi

kebutuhan guru dalam melakukan analisis butir soal.

DAFTAR PUSTAKA

Alagumalai, S. & Curtis, D.D. 2005. Classical Test Theory. In Alagumalai, S., et.al. (Eds.).Applied Rasch Measurement: A Book of Exemplars. Norwell, MA: Springer.

Allen, M. J. & Yen, W. M. 1979. Introduction to measurement theory. Monterey, CA:Brooks/Cole Publishing Company.

Anderson, L.W. 2003. Classroom assessment: enhancing the quality of teacher decisionmaking. New Jersey: Lawrence Erlbaum Associates, Inc.

Azwar, S. 2003. Sikap Manusia: Teori dan Pengukurannya, Edisi ke-2. Yogyakarta: PustakaPelajar.

Banta, T.W., Palomba, C.A., & Kinzie, J. 2014. Assessment essentials: Planning,implementing, and improving assessment in higher education. San Fransisco:Jossey-Bass.

Bers, T.H. 2008. The role of institutional assessment in assessing student learningoutcomes. New Directions for Higher Education, 141: 31-39.

Brookhart, S.M. 2008. How to give effective feedback to your students. Virginia: Associationfor Supervision and Curriculum Development.

Crocker, L & Algina, J. 2008. Introduction to classical and modern test theory. Ohio:Cengage Learning.

Darling-Hammond, L. 2014. Next generation assessment: Moving beyond the bubble test tosupport 21st century learning. San Fransisco: Jossey-Bass.

Page 15: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 398 ] P a g e

Ebel, R.L. & Frisbie, D.A. 1991. Essentials of educational measurement. Englewood Cliffs,NJ: Prentice-Hall, Inc.

Harvey, L. 2011. The nexus of feedback and improvement. Dalam Nair, C.S. & Mertova, P.(eds.). Student Feedback: The cornerstone to an effective quality assurance system inhigher education. New Delhi: Oxford Cambridge.

Hattie J. & Timperley, H. 2007. The power of feedback. Review of Educational Research.77(1): 81-112.

Higgins, R., & Hartley, P. 2002. The conscientious consumer: reconsidering the role ofassessment feedback in student learning. Studies in Higher Education, 27(1): 53-64.

Irons, A. (2008). Enhancing learning through formative assessment and feedback. NewYork: Routledge.

James, A.O. & Folorunso, A.M. 2012. Effect of feedback and remediation on students’achievement in junior secondary school mathematics. International EducationStudies, 5(5): 153-162.

Kaplan, R.M. & Saccuzzo, D.P. 2005. Psychological Testing: Principles, Applications, andIssues, 6th edition. Belmont, CA: Thomson Wadsworth.

Kubiszyn, T., & Borich, G.D. 2013. Educational testing and measurement: classroomapplication and practice. 10th edition. Hoboken, NJ: John Wiley & Sons, Inc.

Langer, P. 2011. The use of feedback in education: a complex instructional strategyPsychological Reports, 109(3): 775-784.

Metronews. 2014. Ini delapan masalah dalam implementasi kurikulum 2013. (Online)(News.metronews.com), diakses 19 Oktober 2014.

Miller, M.D., Linn, R.L., & Gronlund, N.E. 2009. Measurement and assessment in teaching(tenth edition). New Jersey: Pearson Education Inc.

Muhson, A., Lestari, B., Supriyanto, & Baroroh, K. 2013. Pengembangan Software AnBusoSebagai Solusi Alternatif Bagi Guru dalam Melakukan Analisis Butir Soal SecaraPraktis dan Aplikatif. Laporan Penelitian tidak dipublikasikan. Yogyakarta: LPPMUNY.

National Research Council 1999. The assessment of science meets the science of assessment.Board on Testing and Assessment Commission on Behavioral and Social Sciences andEducation, National Research Council. Washington, DC: National Academy Press.

Nunnally, J.C. & Bernstein, I.H. 1994. Psychometric Theory (Third Edition). New York:McGraw-Hill, Inc.

Peterson, E.R., & Irving, S.E. 2008. Secondary school students’ conceptions of assessmentand feedback. Learning and Instruction, 18: 238-250.

Puskur 2008. Model Penilaian Kelas Kurikulum Berbasis Kompetensi. Jakarta: BalitbangDepdiknas.

Raymond, J.E., Homer, C.S.E., Smith, R. & Gray, J.E. 2012. Learning through authenticassessment: An evaluation of a new development in the undergraduate midwiferycurriculum. Nurse Education in Practice, 30: 1-6.

Page 16: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Software AnBuso Sebagai… (Ali Muhson, Barkah Lestari, Supriyanto & Kiromim Baroroh)

P a g e [ 399 ]

Republika. 2014. Implementasi kurikulum 2013 masih dibayangi banyak masalah. (Online)(www.republika.co.id), diakses 18 November 2014.

Russell, M.K. & Airasian, P.W. 2012. Classroom assessment: concepts and applications (7th

edition). New York: McGraw-Hill.

Shute, V.J. 2007. Focus on formative feedback. Research Report. Princeton, NJ: EducationalTesting Service (ETS).

Stiggins, R.J. & Chappuis, J. 2012. An introduction to student involved assessment forlearning. Sixth edition. Boston: Pearson assessment training institute.

Sudjana, N. 2011. Penilaian Hasil Proses Belajar Mengajar. Bandung: Remaja Rosdakarya.

Susilowati. 2013. Kurikulum 2013, 87 persen guru kesulitan cara penilaian. (Online)(http://unnes.ac.id), diakses 18 November 2014.

Tempo. 2013. Problematika implementasi kurikulum 2013, (Online) (www.tempo.co),diakses 10 Juli 2013.

Tempo. 2014. Kurikulum 2013, Apa Saja Kendalanya?, (Online) (www.tempo.co), diakses16 Agustus 2014.

UNDP. 2014. 2014 human development report. (Online) (http://www.undp.org/content/undp/en/home/librarypage/hdr/2014-human-development-report.html), diakses 5 Maret 2015.

UNESCO. 2011. Education For All Global Monitoring Report. (Online)(http://www.unesco.org/ new/en/education/themes/leading-the-international-agenda/efareport/statistics/efa-development-index/), diakses 5 Maret 2015.

Wiggins, G. P. 1993. Assessing student performance: exploring the purpose and limits oftesting. San Francisco: Jossey-Bass Publishers.

Page 17: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 400 ] P a g e

ESTIMASI KESALAHAN PENGUKURAN PERANGKAT SOAL UJI COBA

UJIAN NASIONAL MATA PELAJARAN EKONOMI SMA

DI KABUPATEN BANJARNEGARA

Khotimah MarjiastutiProgram Pascasarjana Universitas Negeri Yogyakarta

[email protected]

AbstrakPenelitian ini bertujuan untuk mengestimasi kesalahan pengukuran perangkatsoal uji coba UN mata pelajaran ekonomi SMA Tahun Ajaran 2014/2015 diKabupaten Banjarnegara berdasarkan teori respon butir. Analisis data dilakukanberdasarkan respon peserta didik terhadap perangkat soal uji coba UN matapelajaran ekonomi SMA tahun ajaran 2014/2015 sebanyak 809 lembar yangdiperoleh dari 13 SMA negeri dan swasta. Metode yang digunakan yaitu TeoriRespon Butir (Item Respond Theory). Hasil analisis menunjukkan perangkat soalcocok dengan model Teori Respon Butir 1 Parameter Logistik. Berdasarkanmetode tersebut, nilai estimasi kesalahan pengukuran terkecil pada soal paket 1terjadi pada siswa dengan θ=0 dengan nilai sebesar 0,1990 sedangkan nilai estimasi terbesar terjadi pada siswa dengan θ=+3 dengan nilai sebesar 1,0320. Nilai estimasi kesalahan pengukuran terkecil pada soal paket 2 terjadi padasiswa dengan θ=0 dengan nilai sebesar 0,2005, sedangkan nilai estimasi terbesar terjadi pada siswa dengan θ=+3 dengan nilai sebesar 1,0073. Hal ini menandakan bahwa perangkat soal yang disusun oleh MGMP ekonomi lebihcocok diberikan kepada siswa dengan kemampuan sedang.

Kata kunci: perangkat soal, kesalahan pengukuran, teori respon butir.

PENDAHULUAN

Lebih dari satu dekade lalu, para pemimpin ASEAN sepakat untuk membentuk

sebuah pasar tunggal di kawasan Asia Tenggara pada akhir 2015 mendatang.

Kesepakatan tersebut dilakukan agar daya saing ASEAN meningkat serta bisa menyaingi

Tiongkok dan India untuk menarik investasi asing. Penanaman modal asing di wilayah

ASEAN sangat dibutuhkan untuk meningkatkan lapangan pekerjaan serta meningkatkan

kesejahteraan. Pembentukan pasar tunggal yang diberi nama Masyarakat Ekonomi

ASEAN (MEA) memungkinkan suatu negara akan dengan mudahnya melakukan jual-beli

barang dan jasa dengan negara lain di Asia Tenggara, sehingga secara otomatis

persaingan akan semakin ketat.

Masyarakat Ekonomi ASEAN tidak hanya membuka arus perdagangan barang atau

jasa, tetapi juga tenaga kerja profesional, seperti dokter, pengacara, akuntan, guru dan

lain sebagainya. Dengan demikian, dengan adanya MEA maka akan semakin membuka

peluang tenaga kerja asing untuk mengisi berbagai profesi di Indonesia. Sudah siapkah

tenaga kerja Indonesia bersaing dengan negara lain di Asia Tenggara?

Salah satu tenaga profesional yang akan bersaing di era MEA adalah guru. Guru-

guru di Indonesia diharapkan siap untuk bersaing dengan guru-guru asing. Oleh karena

itu, tentu harus diikuti dengan kesiapan guru untuk meningkatkan kualitas, kemampuan

Page 18: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)

P a g e [ 401 ]

serta keterampilan di bidang pendidikan. Mengacu pada UU Nomor 14 Tahun 2005

menyatakan bahwa ada empat kompetensi yang harus dimiliki oleh guru, yaitu

kompetensi pedagogik, kepribadian, profesional dan sosial. Keempat kompetensi

tersebut memang idealnya dimiliki oleh guru di Indonesia. Salah satu di antara empat

kompetensi yang ada yaitu kompetensi pedagogik. Kompetensi pedagogik menuntut guru

untuk dapat memahami peserta didik dengan memanfaatkan prinsip-prinsip

perkembangan kognitif dan kepribadian, perancangan pembelajaran, pelaksanaan

pembelajaran yang kondusif, merancang dan melaksanakan evaluasi hasil belajar secara

berkesinambungan dengan berbagai metode untuk kemudian sebagai acuan untuk

menentukan tingkat ketuntasan belajar (mastery learning) dan memanfaatkan hasil

evaluasi tersebut untuk perbaikan kualitas pembelajaran secara umum.

Salah satu kompetensi yang harus dimiliki guru adalah melakukan evaluasi hasil

belajar secara berkesinambungan, namun kegiatan evaluasi dalam pendidikan tidak akan

terlaksana tanpa adanya kegiatan pengukuran dan penilaian. Menurut Allen dan Yen

(1979: 2), measurement is the assigning of numbers to individuals in a systematic way as

means of representing properties of the individuals. Definisi tersebut dapat diartikan

sebagai penetapan angka dengan cara yang sistematik untuk menyatakan keadaan

individu. Pengukuran dilaksanakan dengan tujuan memberikan atribut berupa angka

pada individu. Kegiatan pengukuran dilaksanakan dengan menggunakan instrumen tes

dan/atau nontes. Penggunaan instrumen tes atau nontes disesuaikan dengan ranah yang

hendak diukur. Allen dan Yen menyatakan bahwa a test is a device for obtaining a sample

of an individual’s behavior (Allen & Yen, 1979: 1). Kegiatan selanjutnya yaitu penilaian,

yang merupakan pemberian label terhadap seseorang. Pemberian label dilakukan dengan

memberikan kriteria atas nilai yang diperoleh. Nilai yang diperoleh dapat dikategorikan

menjadi baik, cukup baik atau bahkan kurang baik.

Kegiatan pengukuran yang cermat akan dapat memberikan informasi yang tepat

untuk bahan evaluasi. Akan tetapi, dalam kegiatan pengukuran tidak terpisahkan dari

kesalahan baku pengukuran (Standard Error of Measurement/SEM). Kesalahan

pengukuran yang dimaksud yaitu nilai/skor hasil pengukuran lebih rendah daripada

nilai/skor yang sebenarnya atau bahkan nilai/skor hasil pengukuran lebih tinggi dari

nilai/skor yang sebenarnya. Tighe, dkk (2010) menyatakan bahwa sering orang

mengandalkan kualitas soal hanya pada reliabilitasnya, namun di sisi lain bila diketahui,

reliabilitas suatu tes tergantung pada tingkat kesalahan baku pengukuran (SEM).

Kesalahan baku pengukuran erat kaitannya dengan koefisien reliabilitas suatu alat ukur.

Miller (2008:93) mengemukakan, SEM is a quantitative expression of the magnitude of

error in a test score based on the test reliability. Selanjutnya, the reliability of the test scores

decreases, the SEM increases. The greater the reliability of the test score, the smaller the

SEM and the more confidence we have in the precision of the test score (Reynolds,

Livingston, dan Willson, 2010: 114). Pernyataan tersebut menjelaskan bahwa bila

reliabilitas skor tes menurun maka kesalahan pengukuran yang terjadi justru akan

meningkat. Reliabilitas yang tinggi akan menghasilkan kesalahan pengukuran yang

Page 19: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 402 ] P a g e

rendah. Dengan menganalisis tingkat SEM, maka dapat diketahui kemungkinan skor

murni (true score) peserta tes, serta mengetahui tingkat kemampuan peserta tersebut

berada pada kemampuan tinggi, sedang, atau rendah. Jadi, kualitas perangkat soal tidak

hanya tergantung pada reliabilitas soalnya saja.

Kesalahan pengukuran dalam bidang pendidikan tidak dapat dihindari karena

subjek dan objek yang terlibat yaitu manusia. Ada dua macam kesalahan pengukuran,

yaitu kesalahan acak dan kesalahan sistematis (Mardapi, 2008: 3). Kesalahan acak

disebabkan oleh kondisi fisik dan mental yang diukur dan yang mengukur bervariasi.

Kesalahan sistematis terjadi karena alat ukur yang digunakan. Ada pendidik yang

memberikan soal terlalu mudah sehingga siswa mendapat skor yang tinggi. Sebaliknya,

bila pendidik memberi soal yang sulit, maka siswa akan mendapat skor yang rendah.

Apabila hal ini sampai terjadi, maka dapat merancukan evaluasi yang dihasilkan. Oleh

karena itu, alat ukur (tes) memiliki peran yang sangat penting dalam dunia pendidikan

sehingga soal tes perlu dipersiapkan sebaik mungkin dan seminimal mungkin kesalahan

yang dihasilkan agar lebih representatif mencerminkan kemampuan peserta didik.

Deteksi kesalahan baku pengukuran dapat dilakukan salah satunya dengan Teori

Respon Butir. Hadirnya Teori Respons Butir (IRT) untuk menyempurnakan teori

sebelumnya, yaitu Teori Tes Klasik (CTT). Kelemahan teori tes klasik salah satunya

adalah tergantung pada karakteristik peserta tes (Mardapi, 2012: 189). Maksud dari

pernyataan tersebut adalah bila sampel yang diberi soal kebetulan yang memiliki

kemampuan tinggi, maka soal akan menjadi memiliki tingkat kesukaran yang rendah

(indeks kesukaran tinggi). Sebaliknya bila soal diberikan kepada siswa dengan

kemampuan rendah, maka soal akan menjadi memiliki tingkat kesukaran yang tinggi

(indeks kesukaran rendah).

Model teori respon butir berdasarkan jumlah parameter butir ada tiga, yaitu 1-P,

2-P dan 3-P. Peluang menjawab benar suatu butir soal sebagai berikut (Mardapi, 2012:

203).

Keterangan:

a: daya pembeda

b: tingkat kesukaran

c: pseudo guessing

e: eksponen

θ: kemampuan

Parameter lain yang perlu diketahui dari teori respons butir yaitu fungsi informasi

perangkat tes yang terdiri dari beberapa butir soal. Fungsi informasi dapat dihitung

Page 20: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)

P a g e [ 403 ]

dengan formula yang sesuai dengan model logistik perangkat tes yang akan dihitung nilai

fungsi informasinya. Perhitungan nilai informasi perangkat tes untuk model logistik satu

parameter sebagai berikut. (Hambleton, 1985: 91)

Perhitungan nilai informasi perangkat tes untuk model logistik dua parameter

sebagai berikut

Perhitungan nilai informasi perangkat tes untuk model logistik tiga parameter

sebagai berikut

Keterangan:

I (θ) : fungsi informasi suatu perangkat tes.

bj : parameter indeks kesukaran butir ke-j

aj : parameter daya beda butir ke-j

cj : parameter guessing pada butir ke-j

e : bilangan transeden yang besarnya mendekati 2,718

D : nilai distribusi logistic besarnya 1,7

Setelah memperoleh fungsi informasi selanjutnya dapat dilakukan perhitungan

SEM dengan Formula umum teori respons butir yang dibangun sebagai berikut.

Keterangan:

SEM : kesalahan baku pengukuran

: teta/tingkat kecerdasan peserta tes

: fungsi informasi pada nilai teta/tingkat kemampuan tertentu

Penilaian yang dilakukan oleh pendidik terdiri atas berbagai jenis, seperti kuis,

pertanyaan lisan, tugas individu, tugas kelompok, Ulangan Harian (UH), Ulangan Tengah

Semester (UTS), dan Ulangan Akhir Semester (UAS) dan lain-lain. Semua itu dilakukan

agar guru dapat mengetahui kemampuan dan kemajuan peserta didik, bahkan bila perlu

dilakukan perbaikan atau pengayaan maka hal itu pun akan dilakukan. Hal tersebut

dikarenakan pendidik memiliki tanggung jawab atas peserta yang dididik agar menjadi

orang yang pandai, berakhlak mulia, tangkas dan terampil. Penilaian terhadap peserta

didik tidak hanya dilakukan oleh guru, tetapi juga oleh pihak independen yaitu Badan

Standar Nasional Pendidikan (BSNP) yang bekerja sama dengan instansi terkait di

lingkungan Pemerintah, Pemerintah Provinsi, Pemerintah Kabupaten/Kota, dan satuan

pendidikan. Penilaian tersebut dikenal dengan nama Ujian Nasional (UN).

Pada tahun 2015 UN tidak lagi menjadi penentu kelulusan yang utama bagi siswa,

sejak Menteri Pendidikan dan Kebudayaan, Anies Baswedan, mengeluarkan keputusan

untuk merevisi PP nomor 32 tahun 2013. Tujuan UN sepenuhnya untuk menilai

Page 21: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 404 ] P a g e

pencapaian standar kompetensi lulusan pada mata pelajaran tertentu secara nasional,

kemudian hasilnya digunakan untuk pemetaan mutu, dasar seleksi masuk jenjang

pendidikan selanjutnya, dan untuk pembinaan. Melihat adanya tujuan yang besar dari

penyelenggaraan UN walaupun sudah tidak lagi menjadi penentu kelulusan yang utama

bagi siswa, tetapi sekolah tetap melaksanakan uji coba UN seperti tahun-tahun

sebelumnya. Uji coba UN bertujuan untuk mempersiapkan siswa menghadapi UN

sehingga diharapkan uji coba UN dapat memberikan gambaran terkait materi, jenis,

bentuk serta cara pengerjaan UN kelak. Intensitas serta waktu pelaksanaan uji coba UN

masing-masing sekolah berbeda-beda tergantung pada kebijakan Kepala Sekolah yang

bersangkutan.

Berdasarkan hasil observasi beberapa SMA di Kabupaten Banjarnegara, umumnya

sekolah mengadakan dua kali uji coba UN dengan soal buatan guru sekolah yang

bersangkutan dan satu kali uji coba UN dengan soal buatan MGMP yang diterapkan di

seluruh SMA baik sekolah negeri maupun swasta di Kabupaten Banjarnegara. Kenyataan

menunjukkan bahwa untuk pelaksanaan uji coba UN, guru masih menggunakan soal-soal

uji coba tahun lalu atau mengambil dari buku latihan untuk dijadikan soal try out di tahun

berikutnya. Permasalahannya pada soal-soal tersebut belum pernah dilakukan analisis

butir soal untuk menguji validitas dan reliabilitas. Pertanyaannya adalah apakah soal-soal

tersebut sudah sesuai dengan kisi-kisi yang diberikan BSNP, mampu mengukur

kemampuan siswa dan dapat merepresentasikan UN yang kelak akan dihadapi siswa?

Oleh karena itu, penelitian ini dipandang perlu dilakukan agar guru-guru mata

pelajaran ekonomi SMA di Kabupaten Banjarnegara pada khususnya dapat mengetahui

kualitas soal uji coba UN yang telah dibuat dalam rangka persiapan menghadapi UN para

peserta didiknya. Persiapan dengan sebaik-baiknya menjelang UN merupakan salah satu

bukti kesiapan guru untuk menghasilkan lulusan yang baik. Di samping itu, untuk

melakukan analisis estimasi kesalahan pengukuran guru harus memiliki kemampuan dan

keterampilan mengoperasikan program komputer. Kemampuan dan keterampilan ini

dapat menjadi bekal bagi guru dalam menghadapi persaingan di era MEA. Alasan

pendukung lainnya, penelitian mengenai estimasi kesalahan pengukuran perangkat soal

uji coba UN terutama untuk mata pelajaran ekonomi SMA di Kabupaten Banjarnegara

belum pernah dilakukan sebelum ini.

METODE

Penelitian ini termasuk jenis penelitian deskriptif eksploratif. Objek penelitian

adalah seluruh lembar jawab komputer (LJK) siswa peserta uji coba Ujian Nasional mata

pelajaran Ekonomi SMA yang dirancang oleh MGMP Ekonomi tahun ajaran 2014/2015

dari 13 sekolah baik Negeri maupun Swasta atau sebanyak 809 LJK. Teknik yang

digunakan dalam penelitian ini adalah dokumentasi. Estimasi kesalahan pengukuran

berdasarkan Teori Respon Butir dilakukan dengan bantuan Program Komputer Bilog_MG.

Page 22: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)

P a g e [ 405 ]

Tabel 1. Objek Penelitian Estimasi Kesalahan Pengukuran Perangkat Soal Uji Coba UjianNasional Mata Pelajaran Ekonomi SMA di Kabupaten Banjarnegara

No Nama Sekolah Jumlah PesertaUN TA.2014/2015

1 SMAN 1 Banjarnegara 722 SMAN 1 Bawang 1103 SMAN 1 Purwareja Klampok 814 SMA Muhammadiyah 4 Kalibening 285 SMAN 1 Sigaluh 586 SMA PGRI Purwareja Klampok 197 SMAN 1 Purwanegara 848 SMAN 1 Karangkobar 1399 SMAN 1 Wanadadi 11410 SMA Muhammadiyah 1 Banjarnegara 4611 SMA Cokroaminoto Banjarnegara 2012 SMAN 1 Batur 2813 SMA Ma’arif Mandiraja 10

Total Peserta UN 809

HASIL DAN PEMBAHASAN

Langkah-langkah yang dilakukan untuk menganalisis SEM berdasarkan teori respon

butir meliputi uji kecocokan model (1 PL, 2 PL atau 3 PL) dengan bantuan perangkat

komputer BILOG MG, yang perlu dicermati adalah pada hasil perhitungan fase dua.

Tentukan butir mana saja yang memenuhi semua kriteria. Setelah itu baru dapat

dilanjutkan dengan mengestimasi kesalahan pengukuran perangkat soal uji coba UN

mata pelajaran ekonomi SMA di Kabupaten Banjarnegara.

Uji Kecocokan Model

Untuk mengetahui perangkat soal tes uji coba UN cocok dengan model 1 PL, 2 PL

atau 3 PL perlu dilakukan perhitungan dengan menggunakan BILOG MG. Ada tiga fase

yang dihasilkan oleh software tersebut, fase satu menjelaskan informasi butir

berdasarkan teori tes klasik, fase dua menjelaskan kualitas butir soal berdasarkan teori

respon butir, sedangkan fase tiga memberikan informasi kemampuan (ability) masing-

masing siswa dalam menjawab soal yang diberikan. Berikut ini rangkuman dari fase dua.

Tabel 2. Uji Kecocokan Model Perangkat Soal (Paket 1)

Model Butir yang Cocok dengan ModelJumlah Butir yang Cocok

dengan Model1 PL 1, 2, 5, 7, 9, 12, 13, 16, 17, 18, 20, 22, 23, 24, 25,

28, 29, 30, 32, 33, 35, 36, 28, 39, 4025

2 PL 3, 6, 8, 9, 11, 14, 25, 26, 27, 28, 29, 31, 33, 34, 35 153 PL 3, 6, 7, 11, 14, 20, 26, 32, 33, 34, 35 11

Page 23: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 406 ] P a g e

Berdasarkan tabel di atas, maka dapat disimpulkan bahwa perangkat soal uji coba

UN ekonomi paket 1 cocok dianalisis menggunakan teori respon butir 1 PL, karena

jumlah butir yang cocok paling banyak dibandingkan model 2 PL dan 3 PL. Selanjutnya

perlu diuji untuk soal paket 2 cocok dengan model logistik 1 PL, 2 PL atau 3 PL. Berikut

ini rangkuman uji kecocokan model untuk soal paket 2.

Tabel 3. Uji Kecocokan Model Perangkat Soal (Paket 2)

Model Butir yang Cocok dengan ModelJumlah Butir yang Cocok

dengan Model1 PL 4, 5, 6, 7, 8, 9, 11, 13, 16, 17, 18, 19, 21, 22, 24,

26, 28, 32, 35, 36, 38, 4022

2 PL 1, 3, 5, 9, 13, 17, 19, 25, 29, 30, 32, 33, 37, 38 143 PL 2, 3, 5, 9, 17, 19, 21, 24, 25, 26, 29, 32, 33, 35,

38, 4016

Mencermati banyak butir yang cocok dengan model logistik 1PL, maka dapat

disimpulkan bahwa perangkat soal uji coba UN mata pelajaran ekonomi SMA paket 2

cocok dengan model 1 PL menurut teori respon butir.

Estimasi Kesalahan Pengukuran

Setelah diketahui model yang cocok yaitu model IRT 1 PL, selanjutnya adalah

mencari fungsi informasi butir dengan menggunakan formula 3 dan 4 dengan

menghitung mulai dari tetha -3 s.d +3 selisih antar tetha 0,1. Setelah diketahui fungsi

informasi selanjutnya dapat dilakukan perhitungan SEM dengan formula 7. Setelah itu

dapat diketahui bahwa SEM untuk perangkat soal pertama berkisar antara 0,1990

sampai 1,0320. SEM terkecil berada pada siswa dengan kemampuan θ = 0 dan SEM

tertinggi berada pada siswa dengan kemampuan θ = +3. Sedangkan SEM untuk perangkat

soal kedua berkisar antara 0,2005–1,0073 (SEM terendah sampai SEM tertinggi). SEM

terkecil berada pada siswa dengan kemampuan θ = 0 dan SEM tertinggi berada pada

siswa dengan kemampuan θ = +3.

SIMPULAN

Berdasarkan uji kecocokan model, kedua perangkat soal uji coba UN mata

pelajaran ekonomi SMA di Kabupaten Banjarnegara cocok dengan model IRT 1

parameter logistik. Besarnya estimasi kesalahan pengukuran (SEM) untuk soal paket satu

berdasarkan teori respon butir sebesar 0,1990-1,0320 sedangkan untuk paket dua

0,2005-1,0073. Kedua perangkat soal memiliki kesamaan yaitu SEM terendah terjadi

pada siswa dengan kemampuan θ=0 dan SEM tertinggi terjadi pada siswa dengan θ=+3.

Hal ini menandakan bahwa perangkat soal yang disusun oleh MGMP ekonomi lebih cocok

diberikan kepada siswa dengan kemampuan sedang.

Saran yang dapat peneliti berikan sebagai berikut:

Page 24: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Estimasi Kesalahan Pengukuran… (Khotimah Marjiastuti)

P a g e [ 407 ]

1. Untuk pelaksanaan tes yang dibuat secara tim seperti Ujian Kenaikan Kelas dan uji

coba UN hendaknya guru menggunakan soal yang telah valid dan reliabel, untuk

meminimalisasi tingkat kesalahan pengukuran.

2. Hendaknya guru baik secara tim atau individu melakukan analisis estimasi kesalahan

pengukuran secara berkelanjutan sebagai salah satu bentuk evaluasi hasil kerja. Jadi,

evaluasi tidak hanya dengan melihat nilai atau rata-rata nilai yang dicapai siswa dari

waktu ke waktu tapi perlu juga mengevaluasi soal yang telah dibuat.

3. Dinas pendidikan setempat hendaknya memfasilitasi guru-guru dengan memberikan

pelatihan penyusunan soal yang baik dengan mengundang ahli.

DAFTAR PUSTAKA

Allen, M. J., & Yen, W. M. (1979). Introduction to measurement theory. Monterey:Wadsworth

Hambleton, R.K. & Swaminathan H. (1985). Item Response Theory Principles andApplications. New York: Springer.

Mardapi, Djemari. (2008). Teknik penyusunan instrumen tes & non tes. Yogyakarta: MitraCendikia.

Mardapi, Djemari. (2012). Pengukuran Penilaian & Evaluasi Pendidikan. Yogyakarta: NuhaLitera.

Miller, P. W. (2008). Measurement and teaching. Muster: Partric W. Miller & Association.

Tighe, J., McManus, I. C., Dewhurst, N. G., Chis, L., & Mucklow, J. (2010) The Standard Errorof Measurement is a more Appropiate Measure of Quality for Postgraduate MedicalAssessments Than is Reliability: An Analysis of MRCP (UK) Examinations. BMCMedical Education, 10:40.

Page 25: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 408 ] P a g e

EVALUASI PENERAPAN PENILAIAN OTENTIK

DALAM KAITANNYA DENGAN KESIAPAN SDM MENGHADAPI MEA

Alita Arifiana AnisaPenelitian dan Evaluasi Pendidikan, Universitas Negeri Yogyakarta

[email protected]

AbstrakPenelitian ini merupakan penelitian evaluasi. Penelitian ini berfokus untukmengevaluasi penerapan penilaian otentik dalam kaitannya dengan upaya untukmempersiapkan SDM Indonesia dalam menghadapi Masyarakat Ekonomi ASEAN(MEA) di SMK N 1 Wonosari, sekolah pilot project kurikulum 2013 di DaerahIstimewa Yogyakarta (DIY). Penelitian ini dilakukan dengan telaah dokumenguru, wawancara dan kuesioner. Hasil telaah dokumen dan kuesioner dianalisistingkat kecenderungannya dan diklasifikasikan menjadi 4 kategori sedangkandata yang diperoleh melalui wawancara dianalisis secara kualitatif untukmendukung data yang terkumpul melalui dokumen dan kuesioner. Berdasarkananalisis yang dilakukan, penerapan penilaian otentik di SMK N 1 Wonosaritermasuk dalam kategori sangat sesuai dengan perolehan skor mencapai 2,62didukung dengan capaian skor persepsi siswa sebesar 3,09 yang termasuk dalamkategori sesuai. Kendala yang dihadapi guru berkaitan dengan perumusanrancangan penilaian sikap spiritual mulai dari perumusan indikator pencapaian,penyusunan rubrik, pemilihan teknik penilaian hingga penyusunan instrumentyang tepat.

Kata Kunci: Penilaian Otentik, Masyarakat Ekonomi ASEAN

PENDAHULUAN

Pada tahun 2013 lalu, pemerintah merilis gebrakan baru dalam dunia pendidikan.

Gebrakan tersebut adalah kurikulum baru yang diberi nama kurikulum 2013, pemerintah

melalui peraturan menteri pendidikan dan kebudayaan mengemukakan bahwa

perubahan tersebut merupakan misi untuk menyempurnakan upaya Indonesia untuk

mempersiapkan diri menghadapi tantangan internal maupun external. Salah satu

tantangan yang menjadi PR besar bagi bangsa Indonesia adalah Masyarakat Ekonomi

ASEAN (MEA).

MEA merupakan komitmen untuk mewujudkan integrasi ekonomi negara-negara

ASEAN yang bertujuan untuk meminimalisir kesenjangan antar negara. Dengan adanya

MEA akan banyak peluang sekaligus risiko yang dihadapi Indonesia, yaitu competition

risk, exploitation risk dan employment risk (Baskoro, 2014). Competition risk di mana

tidak akan ada lagi hambatan dalam melakukan perdagangan, ekspor akan melimpah,

begitu juga dengan impor. Barang-barang impor dengan harga murah dan kualitas tinggi

akan mengancam industri lokal meskipun industri lokal akan mendapatkan peluang yang

sama untuk mengekspansi pasar ASEAN. Exploitation risk, investasi akan terbuka lebar

dan menstimulus pertumbuhan ekonomi, namun di sisi lain peluang asing untuk

mengeksploitasi sumber daya Indonesia kian terbuka, didukung dengan potensi sumber

daya alam Indonesia yang lebih banyak jika dibandingkan dengan negara lain.

Page 26: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)

P a g e [ 409 ]

Employment risk berkaitan dengan persaingan tenaga kerja. Akan terdapat peluang besar

bagi pencari kerja dengan berbagai keahlian, akses untuk bekerja di luar negeri pun akan

semakin mudah, namun jika sumber daya Indonesia tidak memiliki kompetensi dan

keterampilan yang memadahi, maka bangsa Indonesia akan kesulitan untuk bersaing

dengan sumber daya manusia dari negara lain mengingat dilihat dari segi pendidikan dan

produktivitasnya tenaga kerja Indonesia masih berada di bawah Singapura, Malaysia dan

Thailand. Hingga Februari 2013, tercatat pengangguran di Indonesia mencapai 7.170.523

orang dari berbagai tingkat pendidikan.

Tabel 1 Jumlah pengangguran Indonesia Per-Februari 2013

Tingkat Pendidikan Terakhir Jumlah

Belum/tidak tamat SD 513,534.00

SD 1,421,653.00

SLTP 1,822,395.00

SLTA Umum 1,841,545.00

SLTA Kejuruan 847,052.00

Diploma I,II,III/Akademi 192,762.00

Universitas 421,717.00

Total 7,170,523.00

Sumber: Data.go.id

Dalam kaitannya dengan dunia pendidikan dan tenaga kerja di Indonesia, SMK

menjadi bagian dari sistem pendidikan yang memiliki tanggungjawab lebih mengingat

tujuan besar yang diusung SMK, yaitu mempersiapkan Sumber Daya Manusia (SDM) yang

berkompetensi, handal dan siap kerja. Tujuan tersebut ditegaskan dalam Undang-undang

Sistem Pendidikan Nasional (UUSPN) No. 20 tahun 2003 pasal 15 menyatakan bahwa

pendidikan kejuruan adalah pendidikan menengah yang mempersiapkan peserta didik

terutama untuk bekerja dalam bidang tertentu. Dengan adanya MEA tentu saja tugas SMK

menjadi semakin berat karena saingan yang akan dihadapi lulusan-lulusan SMK bukan

lagi hanya sesama bangsa Indonesia, tetapi juga lulusan-lulusan dari Negara lain.

Lulusan-lulusan dari berbagai Negara akan bersaing untuk membuka peluang karier

lintas Negara, termasuk di pasar Indonesia. Sepanjang 2014 saja sudah terdapat 68.762

tenaga asing yang menyerbu Indonesia versi Kementerian Ketenagakerjaan yang dirilis

oleh Harian Terbit. Dengan adanya tantangan eksternal tersebut, Indonesia harus terus

berupaya meningkatkan kualitas pendidikannya agar mampu menghasilkan SDM yang

unggul. Mardapi (2008:5) mengemukakan bahwa upaya untuk meningkatkan kualitas

pendidikan dapat ditempuh melalui peningkatan kualitas sistem pembelajaran dan

penilaian, di mana keduanya saling berkaitan satu sama lain. Pernyataan tersebut

didukung oleh Kunandar (2014:13) yang mengemukakan bahwa Kurikulum 2013

merupakan pengembangan dari kurikulum yang sebelumnya dengan penguatan pada

proses pembelajaran dan penilaian.

Page 27: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 410 ] P a g e

Penguatan yang dimaksud adalah Kurikulum 2013 adalah proses pembelajaran

dengan pendekatan saintifik dan sistem penilaian otentik. Proses pembelajaran dengan

pendekatan saintifik merupakan pembelajaran yang menekankan pada proses bertanya

dan menjawab pertanyaan dengan prosedur yang spesifik sesuai dengan tahap

penyelidikan ilmiah, yaitu mengamati, menanya, mengumpulkan informasi, mengasosiasi

dan mengkomunikasikan. Prosedur ilmiah tersebut kemudian dikenal dengan istilah 5M.

Melalui pengalaman pada setiap tahapan 5M diharapkan proses belajar yang dialami

siswa akan semakin bermakna. Kompetensi siswa sebagai hasil dari proses pembelajaran

yang bermakna tersebut kemudian direkam secara sistematis dan prosedural melalui

sistem penilaian otentik. Penilaian otentik dapat didefinisikan sebagai sistem penilaian

yang menuntut siswa untuk mengkombinasikan kompetensi yang dimilikinya untuk

memecahkan masalah dalam kehidupan nyata maupun kehidupan profesionalnya kelak

(Gulikers,2004:67). Senada dengan Gulikers, Lund (1997,25) juga mengungkapkan

bahwa penilaian otentik merupakan seperangkat tugas atau tes yang mampu

membangun koneksi antara apa yang ada pada kehidupan sehari-hari siswa dengan ide-

ide yang dikembangkan di sekolah. Demi mewujudkan misi besar penilaian otentik

pemerintah melalui Peraturan Menteri Pendidikan dan Kebudayaan (Permendikbud)

nomor 66 tahun 2013 tentang standar penilaian mengatur pelaksanaan penilaian otentik

di sekolah. Kurikulum 2013 sebagaimana yang diatur dalam permendikbud menuntut

guru untuk mampu melaksanakan penilaian hasil belajar siswa yang berdasarkan pada

(1) objektivitas penilaian, (2) keterpaduan kompetensi sikap, pengetahuan dan

keterampilan, (3) nilai ekonomis penyelenggaraan penilaian, (4) transparansi proses

penilaian, (5) akuntabilitas penilaian, serta (6) nilai-nilai pendidikan yang ada dalam

pelaksanaan penilaian (edukatif). Selain itu Penilaian Acuan Kriteria (PAK) wajib menjadi

landasan setiap penilaian yang dilakukan guru. PAK berarti menilai performa seseorang

berdasarkan apa yang dapat dilakukan dan tidak dapat dilakukan oleh seseorang

dibandingkan dengan standard atau acuan yang telah ditentukan sebelumnya bukan

terhadap performa orang lain dalam melakukan dal yang sama (Reynolds, 2010:79).

Berikut ini merupakan teknik dan instrument penilaian otentik yang dapat digunakan

guru untuk menyelenggarakan penilaian hasil belajar yang berdasarkan pada prinsip-

prinsip di atas:

1. Guru dapat melakukan penilaian kompetensi sikap dengan menggunakan empat

teknik, yaitu observasi, penilaian diri, penilaian teman sejawat dan jurnal. Instrumen

yang dapat digunakan guru antara lain daftar cek, skala penilaian yang disertai rubric

serta catatan pendidik.

2. Guru dapat melakukan penilaian kompetensi pengetahuan dengan menggunakan tes

baik tes pilihan ganda, tes uraian, tes lisan maupun penugasan. Penilaian otentik juga

dituntut untuk mengarahkan siswa untuk mengelola kemampuan high order

thinking-nya yang meliputi kemampuan untuk menganalisis, mensintesis, dan

mengevaluasi (Lund, 1997:25).

Page 28: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)

P a g e [ 411 ]

3. Guru dapat melakukan penilaian keterampilan siswa dengan menggunakan tes

praktik, proyek dan penilaian portofolio. Lund (1997:25) mengungkapkan bahwa

tugas yang diberikan guru harus mampu mewakili kinerja siswa pada bidang tertentu.

Untuk mendapatkan nilai yang akuntabel dan sesuai dengan keadaan yang

sebenarnya, guru juga disarankan untuk menggunakan teknik penilaian yang bervariasi

atau triangulasi teknik.

Berdasarkan uraian di atas dapat rumuskan bahwa Kurikulum 2013 dirancang

untuk meningkatkan kualitas pendidikan melalui penguatan pada proses pembelajaran

dan sistem penilaian. Pendidikan berkualitas tinggi diharapkan mampu menghasilkan

SDM yang berkualitas, unggul dan memiliki daya saing, khususnya untuk menghadapi

MEA. Penilaian otentik yang menjadi salah satu fokus penguatan pada kurikulum 2013

menjadi penting karena dengan terselenggaranya penilaian yang otentik, dalam artian

penilaian yang mampu memfasilitasi siswa untuk menggunakan kompetensi-kompetensi

yang dimilikinya untuk memecahkan masalah kehidupan profesionalnya, SDM yang

dihasilkan akan terbiasa dengan kasus-kasus yang akan mereka hadapi di dunia kerja

sehingga menjadi SDM yang berkompetensi, solutif dan siap kerja. SDM yang memiliki

karakteristik unggul tersebut akan mampu bertahan dan berjaya dalam persaingan

global.

Namun, bukan tanpa tantangan penerapan penilaian otentik mengalami cukup

banyak kendala. Kurikulum 2013 yang sebelumnya diujicobakan pada 3 SMK di Daerah

Istimewa Yogyakarta pada tahun pelajaran 2013/2014 dan dimasukkan pada tahun

ajaran 2014/2015 nyatanya kembali diperuntukkan untuk SMK pilot project, yaitu SMK

N 1 Wonosari, SMK N 1 Bantul dan SMK N 1 Pengasih. Bukan tanpa alasan, kembalinya

peruntukan Kurikulum 2013 untuk sekolah pilot project didasari banyaknya kendala

yang dihadapi di lapangan. Dalam kaitannya dengan penerapan penilaian otentik di SMK,

kendala yang dihadapi antara lain kompetensi guru untuk menyiapkan perangkat

penilaian dan instrument yang sesuai dengan tuntutan sistem penilaian otentik dinilai

masih minim. Hal tersebut didukung oleh data yang dirilis oleh Surabaya news, diketahui

bahwa rata-rata penguasaan guru terhadap materi penilaian otentik selama pelatihan

kurikulum 2013 hanya mencapai 58,52% di mana lebih dari 100 ribu guru mendapatkan

nilai kurang dari 40. Bagi guru-guru mata pelajaran produktif SMK, Kurikulum 2013

dirasa semakin sulit karena belum adanya pelatihan untuk guru-guru mata pelajaran

produktif, padahal mata pelajaran produktif menjadi andalan untuk menyiapkan lulusan-

lulusan yang memiliki kompetensi professional. Selain itu, keluhan lain berkaitan dengan

sistem penyelenggaraan administrasi penilaian yang dinilai rumit, memakan waktu dan

memecah konsentrasi guru dalam mengajar.

Mengacu pada urgensi penerapan penilaian otentik bagi pendidikan di Indonesia

khususnya SMK serta kendala-kendala yang dihadapi guru dalam penerapannya, proses

evaluasi perlu dilakukan untuk mengidentifikasi seberapa baik penerapan penilaian

otentik di SMK, apa yang sebenarnya menjadi kendala serta solusi seperti apa yang

sebaiknya dilakukan. Evaluasi ini dinilai penting untuk dilakukan demi perbaikan

Page 29: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 412 ] P a g e

penerapan penilaian otentik yang lebih baik di kemudian hari dan terwujudnya SDM yang

berorientasi professional.

METODE

Penelitian ini merupakan penelitian evaluasi dengan menggunakan model

evaluasi discrepancy yang dikembangkan oleh Provus (Fitzpatrick, 2011: 155). Penelitian

evaluasi ini dilaksanakan di salah satu SMK pilot project di DIY, yaitu SMK N 1 Wonosari.

Penelitian ini dibatasi pada penerapan penilaian otentik pada mata pelajaran produktif

kelas XI program keahlian keuangan yang terdiri dari 4 mata pelajaran, yaitu Akuntansi

Perusahaan Dagang, Akuntansi Keuangan, Administrasi Pajak dan Komputer Akuntansi

Penelitian ini dilakukan dengan pendekatan campuran antara pendekatan

kuantitatif dan kualitatif. Pendekatan kuantitatif dimaksudkan untuk memperoleh

informasi melalui teknik dokumentasi dengan lembar telah dokumen dan kuesioner

dengan lembar kuesioner, sedangkan pendekatan kualitatif diperuntukkan untuk

menggali informasi melalui wawancara.

Teknik dokumentasi dilakukan untuk menelaah tiga dokumen buatan guru mata

pelajaran produktif, yaitu Rancangan Pelaksanaan Pembelajaran (RPP), Instrumen

Penilaian Pengetahuan, dan Instrumen Penilaian Keterampilan. Lembar telaah dokumen

digunakan untuk mengumpulkan informasi tentang kelengkapan RPP, kesesuaian

kompetensi yang diukur, penggunaan teknik penilaian, penggunaan perangkat penilaian,

serta kesesuaian dengan prinsip umum dan khusus penilaian otentik. Lembar telaah

dokumen akan diisi oleh 3 orang ahli di bidang pendidikan akuntansi dengan skala antara

0 sampai dengan 3 sesuai dengan banyaknya deskriptor yang tampak pada tiga dokumen

tersebut. Hasil telaah tersebut kemudian dihitung tingkat kecenderungannya dengan

tabel 2.

Tabel 2 Kriteria Evaluasi

No Skor Kategori1. Sangat Sesuai

2. Sesuai

3. Tidak Sesuai

4. Sangat Tidak Sesuai

Teknik pengumpulan data dengan kuesioner diperuntukkan untuk merekam

persepsi siswa tentang penerapan penilaian otentik yang dilaksanakan guru sesuai

dengan kapasitasnya. Dari 127 siswa kelas XI SMK N 1 Wonosari, 96 di antaranya

dijadikan sampel dalam penelitian ini. Sama halnya dengan data yang diperoleh melalui

lembar telaah dokumen, skor yang diperoleh dari lebar kuesioner juga akan dihitung

tingkat kecenderungannya dengan tabel 2. Alternatif jawaban yang dapat dipilih siswa

dalam kuesioner memiliki rentang skor antara 1 sampai dengan 4.

Page 30: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)

P a g e [ 413 ]

Teknik pengumpulan data melalui wawancara dilakukan untuk mendapatkan

tambahan informasi sekaligus data yang dapat ditriangulasikan dengan dua teknik

sebelumnya. Wawancara dilakukan pada 4 guru mata pelajaran produktif terkait cara

guru melakukan penilaian dan kendala yang dihadapi guru. Data yang terkumpul melalui

wawancara kemudian direduksi, data yang relevan dengan penerapan penilaian otentik

kemudian digunakan sebagai data pendukung atau penjelas.

Penerapan penilaian otentik di SMK N 1 Wonosari dinilai sesuai jika data

keseluruhan baik yang berasal dari lembar telaah dokumen dan kuesioner masuk dalam

kategori sesuai.

Gambar 1 Variabel, Dimensi dan Indikator Penelitian

Page 31: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 414 ] P a g e

HASIL DAN PEMBAHASAN

Berdasarkan hasil analisis yang dilakukan diketahui bahwa baik secara

administrasi maupun persepsi siswa SMK N 1 Wonosari program keahlian keuangan

telah sesuai dalam menerapkan penilaian otentik. Berdasarkan hasil telaah dokumen

skor total yang diperoleh mencapai 2,62 dari maksimal skor 3. Terdapat kesenjangan

sebesar 0,38 berkaitan dengan beberapa deskriptor yang tidak tampak. Hal tersebut

didukung oleh persepsi siswa yang menyatakan bahwa guru telah sesuai dalam

menerapkan penilaian otentik dengan skor total sebesar 3,09 dari maksimal skor 4.

Gambar 2 Grafik Skor tiap Indikator

Indikator perencanaan penilaian otentik yang pertama mengumpulkan informasi

tentang kelengkapan serta kejelasan RPP, khususnya rancangan penilaian yang dibuat

guru. Indikator ini mencapai skor sempurna, yaitu 3, artinya keseluruhan RPP yang

dibuat oleh guru mata pelajaran produktif telah lengkap, rinci dan jelas berkaitan dengan

kelengkapan 4 kompetensi inti (KI 1, KI 2, KI 3, KI 4), kompetensi dasar yang mencakup

ranah sikap, pengetahuan, dan keterampilan, indikator pencapaian, teknik penilaian,

instrument penilaian dan sistem penilaian dengan menggunakan PAK.

Berbeda dengan indikator sebelumnya, indikator kedua tentang kesesuaian

kompetensi yang diukur hanya mampu mencapai skor 2,58, meskipun demikian

indikator ini masih termasuk dalam kategori sangat sesuai. Kekurangan yang berkaitan

dengan indikator ini dapat dilihat dari deskriptor yang paling sering tidak tampak, yaitu

deskriptor kedua, kesesuaian indikator pencapaian kompetensi sikap spiritual dengan

kompetensi dasar. Setengah dari 4 RPP yang dianalisis tidak mencakup adanya

kesesuaian indikator pencapaian kompetensi sikap spiritual dengan kompetensi dasar.

Hal tersebut didukung dengan hasil analisis untuk indikator ketiga yang berkaitan

dengan teknik penilaian yang digunakan guru. Sama halnya dengan indikator kedua,

meskipun indikator ketiga termasuk dalam kategori sangat sesuai, skor yang diperoleh

hanya mencapai 2,33 dari skor maksimal 3. Kesenjangan dengan skor maksimal

Page 32: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)

P a g e [ 415 ]

dikarenakan seringnya deskriptor pertama tidak muncul. Deskriptor pertama

merepresentasikan penilaian sikap spiritual dengan menggunakan teknik observasi,

penilaian diri, penilaian teman sejawat, dan jurnal. Meskipun dalam rancangan penilaian

sikap spiritual yang dibuat guru dalam RPP kerap tidak muncul, namun persepsi siswa

menunjukkan hasil berbeda, menurut siswa, guru telah sesuai dalam melakukan

penilaian sikap spiritual dengan capaian skor 2,71, meskipun skor tersebut merupakan

skor terendah jika dibandingkan dengan kompetensi inti lainnya. Siswa menilai bahwa

guru memberikan nilai tambah dan nilai minus berkaitan dengan sikap spiritual siswa

dalam berdoa dan menjawab salam. Hal tersebut berarti, meskipun guru tidak

menuliskan rancangan penilaian sikap spiritual secara administrative melalui RPP,

namun guru tetap menunjukkan perhatiannya pada sikap spiritual siswa dengan

memberikan poin penilaian melalui observasi. Hal tersebut didukung oleh hasil

wawancara oleh guru yang mengungkapkan kebiasaannya mencatat dan menegur siswa

yang tidak berdoa dengan sungguh-sungguh sebelum memulai atau mengakhiri

pembelajaran. Berikut ini grafik persepsi siswa tentang teknik penilaian yang dilakukan

guru mata pelajaran produktif:

Gambar 3 Grafik Skor Persepsi Siswa tentang Teknik Penilaian Guru

Tidak adanya teknik penilaian sikap spiritual yang jelas yang terjadi pada

indikator ketiga menyebabkan ketidakjelasan instrument penilaian sikap spiritual,

sehingga indikator keempat tentang instrument penilaian yang digunakan guru hanya

memperoleh skor 2,25 meskipun masih termasuk dalam kategori sangat sesuai.

Fenomena kekurangsempurnaan sistem penilaian sikap spiritual dijelaskan oleh guru

mata pelajaran komputer akuntansi melalui proses wawancara sebagai fenomena

kebingungan guru tentang bagaimana menilai sikap spiritual siswa. Guru mengaku

kesulitan merumuskan indikator pencapaian kompetensi sikap spiritual karena kurang

memahami bagaimana membuat rubrik penilaian sikap spiritual. Kebingungan tersebut

Page 33: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 416 ] P a g e

berkaitan dengan fenomena ketika diinstruksikan untuk berdoa apakah siswa yang

menundukkan kepala pasti berdoa? Apakah siswa yang tidak menundukkan kepala tidak

berdoa? Atau ketika kompetensi inti menyatakan rasa syukur, bagaimana guru bisa

memastikan seorang siswa mensyukuri apa yang ia miliki? Pada kondisi apa rasa syukur

yang ditunjukkan siswa dapat diberi poin 4, 3, 2 atau 1?

Kompetensi sikap spiritual menjadi penting untuk dipertimbangkan dalam

kaitannya dengan pendidikan, penilaian hasil belajar dan upaya untuk menghasilkan SDM

yang profesional. Kualitas sikap spiritual seharusnya menjadi poin plus bagi SDM

Indonesia, mengingat Indonesia dikenal dengan religiusitas dan fanatismenya terhadap

kepercayaan tertentu serta semangat pendidikan karakter yang sedang marak

dikembangkan di berbagai tingkatan pendidikan. Kekhasan ini seharusnya dipelihara

serta dikembangkan agar dapat menjadi ujung tombak pembeda SDM Indonesia dengan

SDM dari negara lain. Karena profesionalisme seseorang bukan hanya ditentukan oleh

bagaimana keahliannya dalam melakukan sesuatu tetapi juga etika dan kesantunannya

dalam bekerja.

Berkaitan dengan prinsip umum penilaian otentik, yaitu objektif, terpadu,

transparan, edukatif dan akuntabel, indikator keempat termasuk dalam kategori sangat

sesuai dengan perolehan skor 2,91. Kesenjangan 0,09 berhubungan dengan prinsip

edukatif, yaitu tentang bagaimana penilaian yang dirancang guru merangsang siswa

untuk belajar, berprestasi dan mengelola kemampuan High Order Thinking-nya.

Peningkatan kemampuan guru untuk merancang dan mengkonstruksi instrument yang

mampu merangsang keinginan siswa untuk terus belajar dan berprestasi serta mengelola

kemampuan HOT-nya penting dilakukan karena untuk bertahan dalam persaingan

dengan SDM dari Negara lain, generasi Indonesia harus terbiasa terus belajar dan

beradaptasi dengan perkembangan teknologi dan pasar.

Sama halnya dengan prinsip umum penilaian otentik, prinsip khusus penilaian

otentik yang mencakup penilaian berbasis kinerja, pengalaman belajar, kehidupan nyata

dunia kerja dan keterpaduan ranah sikap, pengetahuan dan keterampilan belum berhasil

memperoleh skor maksimal walaupun tergolong dalam kategori sangat sesuai dengan

perolehan skor 2,62. Kesulitan ditemukan pada bagaimana menyusun perangkat

penilaian yang mempertimbangkan ranah sikap, pengetahuan dan keterampilan secara

terpadu.

Informasi tentang prinsip khusus penilaian otentik kemudian dicari tau lebih

lanjut dengan menelaah instrument penilaian pengetahuan dan keterampilan yang dibuat

guru untuk mengetahui persentase butir soal yang telah memenuhi kriteria kesesuaian

dengan kehidupan nyata, keterpaduan, kesinambungan, orientasi kinerja dan motivasi

untuk mengelola kemampuan High Order Thinking (HOT). Berdasarkan analisis yang

dilakukan, secara keseluruhan instrument penilaian pengetahuan yang dibuat guru telah

sesuai dengan penilaian otentik, meskipun perolehan skor hanya 1,78, sedangkan

instrumen penilaian ketrampilan memperoleh skor 2,15 dari maksimal skor 3. Berikut ini

merupakan grafik rincian hasil telaah instrument pengetahuan dan keterampilan:

Page 34: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Evaluasi Penerapan Penilaian… (Alita Arifiana Anisa)

P a g e [ 417 ]

Gambar 4. Hasil Analisis Telaah Instrumen

Grafik tersebut memperlihatkan bahwa meskipun secara keseluruhan instrument

penilaian keterampilan lebih sesuai dengan prinsip penilaian otentik, namun ternyata

untuk indikator kesesuaian dengan konteks nyata instrument pengetahuan lebih sesuai.

Dalam rangka memfasilitasi peserta didik dengan simulasi yang semirip mungkin

dengan kasus yang akan mereka hadapi di kehidupan profesionalnya dibutuhkan

instrument penilaian yang berbasis kinerja yang kompleks. Berbasis kinerja artinya

benar-benar mampu untuk mengukur seberapa baik kinerja yang dilakukan peserta didik

dalam rangka menyelesaikan suatu permasalahan. Kompleks artinya dalam

menyelesaikan permasalahan, peserta didik harus mampu memadukan seluruh

kompetensi yang dimilikinya sehingga tidak menimbulkan masalah baru. Oleh karena itu

kemampuan guru untuk mengkonstruksi instrument penilaian yang baik menjadi penting

dalam kaitannya untuk menyiapkan SDM Indonesia dalam menghadapi MEA.

SIMPULAN

Dari hasil analisis dan pembahasan di atas dapat disimpulkan bahwa penerapan

penilaian otentik di SMK N 1 Wonosari program keahlian keuangan tergolong sesuai

dengan perolehan skor mencapai 2,62 dari maksimal skor 3. Kesenjangan sebesar 0,38

berasal dari ketidaksesuaian rancangan penilaian sikap spiritual yang dilakukan guru.

Hal tersebut terbukti dengan tidak adanya indikator pencapaian, teknik dan instrument

kompetensi sikap spiritual. Selain itu, persentase butir yang terpadu dan berbasis kinerja

juga minim. Berdasarkan simpulan tersebut, rekomendasi yang dapat menjadi

pertimbangan bagi pihak-pihak yang berkecimpung di dunia pendidikan adalah:

1. Perlu dilakukan penyamaan persepsi antarpraktisi pendidikan tentang bagaimana

mengukur kompetensi sikap spiritual siswa, khususnya yang berkaitan dengan rubrik

penilaian.

Page 35: BAGIAN 3. PENILAIAN PEMBELAJARAN - seminar.uny.ac.idseminar.uny.ac.id/semnasfe2015/sites/seminar.uny.ac.id.semnasfe2015... · sangat berguna dalam penganalisian suatu tes. Hal ini

Prosiding Seminar Nasional 9 Mei 2015

[ 418 ] P a g e

2. Perlu dilakukan pelatihan penyusunan instrument penilaian pengetahuan dan

ketrampilan yang kontekstual, terpadu, berkesinambungan, berbasis kinerja dan

memotivasi siswa untuk mengelola kemampuan High Order Thinking (HOT)-nya.

3. Perlu dilakukan identifikasi kekhasan dan kekuatan SDM Indonesia yang mungkin

dikembangkan.

DAFTAR PUSTAKA

Baskoro, Arya. (2014). Peluang, Tantangan, dan Resiko Bagi Indonesia dengan AdanyaMasyarakat Ekonomi ASEAN. Diakses dari http://crmsindonesia.org/node/624.pada tanggal 25 April 2015

Fitzpatrick, J.L., Sanders, J.R., & Worthen, B.R., (2011). Program Evaluation AlternativeApproaches and Practical Guidelines (4th ed.). New Jersey: Pearson.

Gulikers, Judith T.M, Bastiens, Theo J, Kirschner, Paul A. (2004) A Five-DimensionalFramework for Authentic Assessment. Journal of Educational Technology,Research and Development, 52, 67-86.

Kunandar. (2014). Penilaian Otentik (Penilaian Hasil Belajar Peserta Didik BerdasarkanKurikulum 2013) (Ed.Rev). Jakarta: Rajawali Press.

Lund, Jacalyn. (1997). Authentic Assessment: It’s Development and Applications. Journalof Physical Education, Recreation & Dance. 68, 25-40.

Mardapi, D (2008). Teknik Penyusunan Instrumen Tes dan Nontes. Yogyakarta: MitraCendikia Press.

Reynolds, C.R, Liwingston, R.B, Willson, V., (2009). Measurement and Assessment inEducation (2nd ed.). New Jersey: Pearson.