25
ANALISIS BUTIR SOAL Analisis butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes,baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut (arifin.2012:311). Manfaat dari analisi butir soal: 1. Untuk mengetahui apakah butir-butir soal yang disusun sudah berfungsi sesuai dengan apa yang dikehendaki oleh penyusun soal. 2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi. 3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan- kesulitan yang dialami siswa dalam memahami materi. 4. Sebagai acuan untuk merevisi atau memperbaiki soal 5. Untuk memperbaiki kemampuan guru dalam menulis soal (nasoetion,2007:5.18-5.19). Hal-Hal yang perlu dianalisis yaitu: 1. VALIDITAS Validitas suatu tes erat kaitannya dengan tujuan penggunaan tes tersebut. Namun demikian, tidak ada validitas yang berlaku secara umum. Artinya, jika suatu tes dapat memberikan informasi yang sesuai dan dapat digunakan untuk mencapai tujuan tertentu, maka tes itu valid untuk tujuan tersebut. Ada dua unsur penting dalam validitas yaitu:

ANALISIS BUTIR SOAL

Embed Size (px)

DESCRIPTION

Evaluasi hasil belajar Fisika

Citation preview

ANALISIS BUTIR SOAL

Analisis butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes,baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut (arifin.2012:311).Manfaat dari analisi butir soal:1. Untuk mengetahui apakah butir-butir soal yang disusun sudah berfungsi sesuai dengan apa yang dikehendaki oleh penyusun soal.2. Sebagai umpan balik bagi siswa untuk mengetahui kemampuan mereka dalam menguasai suatu materi.3. Sebagai umpan balik bagi guru untuk mengetahui kesulitan-kesulitan yang dialami siswa dalam memahami materi.4. Sebagai acuan untuk merevisi atau memperbaiki soal5. Untuk memperbaiki kemampuan guru dalam menulis soal (nasoetion,2007:5.18-5.19).Hal-Hal yang perlu dianalisis yaitu:1. VALIDITASValiditas suatu tes erat kaitannya dengan tujuan penggunaan tes tersebut. Namun demikian, tidak ada validitas yang berlaku secara umum. Artinya, jika suatu tes dapat memberikan informasi yang sesuai dan dapat digunakan untuk mencapai tujuan tertentu, maka tes itu valid untuk tujuan tersebut.Ada dua unsur penting dalam validitas yaitu: 1. Validitas menunjukkan suatu derajat, ada yang sempurna, ada yang sedang, dan ada pula yang rendah., 2. Validitas selalu dihubungkan dengan suatu putusan atau tujuan yang spesifikTerdapat tiga faktor yang mempengaruhi validitas hasil tes:

1. Faktor instrumen evaluasiBerkaitan dengan prosedur penyusunan instrumen, seperti silabus, kisi-kisi soal, petunjuk mengerjakan soal dan pengisian lembar jawaban, kunci jawaban, penggunaan kalimat efektif, bentuk alternatif jawaban, tingkat kesukaran, daya pembeda, dan sebagainya.2. Faktor administrasi evaluasi dan penskoranBerkaitan dengan alokasi waktu untuk pengerjaan soal yang tidak proporsional, memberikan bantuan kepada peserta didik dengan berbagai cara, peserta didik saling menyontek ketika ujian, kesalahan penskoran, termasuk kondisi fisik dan psikis peserta didik yang kurang menguntungkan.3. Faktor jawaban dari peserta didikFaktor ini meliputi kecenderungan peserta didik untuk menjawab secara cepat tetapi tidak tepat, keinginan melakukan coba-coba, dan penggunaan gaya bahasa tertentu dalam menjawab soal bentuk uraian.Macam-Macam Validitas secara umum:1. Validitas permukaan Validitas ini menggunakan kriteria yang sangat sederhana, karena hanya melihat dari sisi muka atau tampang dari instrumen itu sendiri. Artinya, jika suatu tes secara sepintas telah dianggap baik untuk mengungkap fenomena yang akan diukur, maka tes tersebut sudah dapat dikatakan memenuhi syarat validitas permukaan, sehingga tidak perlu lagi adanya judgement yang mendalam.2. Validitas isi /kurikulerValiditas isi mengacu pada seberapa banyak materi tes tersebut dapat mengukur keseluruhan bahan atau materi yang telah diajarkan.Validitas isi sering digunakan dalam pengukuran hasil belajar. Tujuan utamanya adalah untuk mengetahui hingga mana peserta didik menguasai rnateri pelajaran yang telah disampaikan, dan perubahan-perubahan psikologis apa yang timbul pada diri peserta didik tersebut setelah mengalami proses pembelajaran tertentu.Validitas kurikuler berkenaan dengan pertanyaan apakah materi tes relevan dengan kurikulum yang sudah ditentukan.Validitas kurikuler ini dapat dilakukan dengan beberapa cara, antara lain: mencocokkan materi tes dengan silabus dan kisi-kisi, melakukan diskusi dengan sesama pendidik, atau mencermati kembali substansi dari konsep yang akan diukur (arifin.2012:314-315).Tinggi rendahnya validitas isi suatu tes dapat dilihat dari kisi-kisi atau perencanaan tes yang dibuat.suatu tes dikatakan memiliki validitas isi tinggi jika dalam kisi-kisi yang dibuat termuat sampel materi yang mewakili seluruh pokok bahasan atau sub-pokok bahasan yang telah diajarkan.semakin banyak sampel materi yang akan diukur sehingga mewakil seluruh materi yang telah diajarkan,maka semakin tinggi pula validitas isi tes tersebut (nasoetion dkk,2007:5.7).3. Validitas empiris/validitas yang dihubungkan dengan kriteria (criterion-related validity)Validitas ini biasanya menggunakan teknik statistik, yaitu analisis korelasi. Hal ini disebabkan validitas empiris mencari hubungan antara skor tes dengan suatu kriteria tertentu yang merupakan suatu tolok ukur di luar tes yang bersangkutan. Namun, kriteria itu harus relevan dengan apa yang akan diukur. Ada tiga macam validitas empiris, yaitu: a. Validitas prediktif (predictive validity) bermaksud melihat hinggamana suatu tes dapat memprakirakan perilaku peserta didik pada masa yang akan datang.b. Validitas kongkuren (concurrent validity) jika kriteria standarnya berlainan c. Validitas sejenis (congruent validity) jika kriteria standarnya sejenis (arifin.2012:314-315).4. Validitas konstrukValiditas konstruk berkenaan dengan pertanyaan hinggamana suatu tes betul-betul dapat mengobservasi dan mengukur fungsi psikologis yang merupakan deskripsi perilaku peserta didik yang akan diukur oleh tes tersebut.Validitas konstruk banyak dikenal dan digunakan dalam tes-tes psikologis untuk mengukur gejala perilaku yang abstrak, seperti kesetiakawanan, kematangan emosi, sikap, motivasi, minat, dan sebagainyaAnalisis statistika yang digunakan dalam validitas konstruk antara lain dengan analisis faktor (factor analysis), sehingga dapat diketahui : a. Aspek-aspek apa saja yang diukur oleh setiap butir soal. b. Berapa besar suatu butir soal berisi faktor-faktor tertentu. c. Faktor-faktor apa yang diukur oleh suatu butir soal. Produk analisis faktor ini dapat menganalisis dan mempertimbangkan apakah suatu tes betul-betul dapat mengukur fungsi psikologis yang merupakan deskripsi perilaku peserta didik yang hendak diukur oleh tes yang bersangkutan (arifin.2012: 325).5. Validitas factorkriteria yang digunakan dalam validitas faktor ini dapat diketahui dengan menghitung homoginitas skor setiap faktor dengan total skor, dan antara skor dari faktor yang satu dengan skor dari faktor yang lain(arifin.2012: 326).

Koeifisien validitasUntuk menentukkan indeks validitas suatu alat evaluasi kita menghitung korelasi antara skor yang diperoleh melalui alat evaluasi tersebut dengan skor yang diperoleh melalui alat ukur lain yang telah dibakukan (memiliki validitas tinggi).semakin tinggi koeifisien korelasinya semakin tinggi pula validitas alat evaluasi tersebut .Perhitungan koeifisien validitas dapat dihitung dengan:a. Korelasi Product momen dengan simpanganrxy =keterangan:rxy=koeifisien korelasi anatara variable X dan Y dua variable yang dikorelasikanx=X-X rata-ratay=Y-Y rata-ratab.Korelasi product moment dengan angka kasarrxy=keterangan :N=banyaknya subjekc.korelasi metode ranking(rank method correlation)rxy =keterangan: d=selisish ranking X dan ranking Y (laurens,2003:22-28)d.Teknik diagram pencar(scatter Diagram)Teknik ini digunakan apabila kedua variabrl berbentuk nominalr =Dalam statistika koeifisien korelasi tidak akan lebih kecil atau sama denga-1,00 atau tidak lebih besar atau sma dengan +1,00.hal ini dapat dinyatakan dengan r= +1,00 artinya korelasi sempurna positifr= -1,00 artinya korelasi sempurna negativKriteria-kriteria:Koeifisien validitasPenafsiran

0,81 1,000,61 0.800,41 - 0,600,21 - 0,400,00 0,20Sangat tinggiTinggiCukupRendahSangat rendah

(arifin,2009:256-257)Koeifisien validitasPenafsiran

Tidak validValiditas sangat rendah Validitas rendahValiditas sedangValiditas tinggiValiditas sangat tinggi

(laurens,2003:28)2. RELIABILITASPengertian reliabillitas mengacu pada ketepatan hasil pengukuran maka pengertian relibilitas mengacu pada ketepatan hasil yang diperoleh dari suatu pengukuran(nasoetion dkk,2003:5.9).Reabilitas adalah tingkat atau derajat konsistensi dari suatu instrument. Suatu tes dikatakan reliable jika selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda.Tes yang reliable adalah apabila koefisien reliablitasnya tinggi dan kesalahan baku pengukurannya(standard error of measurement) rendah (arifin,2009:258-259).Pengukuran reliabilitas dibagi menjadi beberapa macam berdasarkan jenis tesnya diantaranya:

1. Realibiltas Intrumen Tes obyektifTerdapat dua teknik untuk menentukan reliabilitas instrument tes obyektif yakni : teknik belah dua(split half technique) dan teknik non belah dua (non split half technique)a. Teknik Belah Dua(Split half technique)Persyaratan dalam penggunaan teknik ini adalah jumlah soal dalam alat evaluasi tersebut haruslah genap.Teknik ini dapat dilakukan dengan dua cara yaitu: (a).pembelahan menurut nomor soal ganjil dan nomor soal genap biasanya disebut metode ganjil-genap dan (b) metode awal akhir.Untuk menentukan koeifisien realibilitas dapat menggunakan:1.formula Spearman-BrownRealibilitas bagian (setengah) alat evaluasi:r0.5 0.5=keterangan:n:banyaknya subyekX1: kelompok data belahan pertamaX2: kelompok data belahan kedu2. Formula RulonFormula rulon didasarkan atas konsep pebedaan antara skor subyek pada belahan pertanma dan kedua,yang dapat dipandang sebagai galat(error) dari proses evaluasi.formula rulon adalah sebagai berikut:r11= dengan S2=Keterangan:Sd2= varians selisih skor subyek pada kedua belahanSd2= Varians skor total3.Formula FlanaganFlanagan mendasarkan reliabilitas atas varians masing-masing belahan dan varians totalnya.Formula Flanagan adlah sebagai berikutr11=keterangan:S12= varians skor belahan pertamaS22= varians skor belahan keduaSt2= varians skor totalb. Teknik Non-Belah DuaUntuk menentukan realibiltas dengan teknik ini menggunakan rumus KR-20 dan KR-21.1.Rumus KR-20r11=keterangan:n : banyaknya butir soalPi: proporsi banyaknya subyek yang menjawab benar pada soal ke-iqi:Proporsi banyaknya subyek yang menjawab salah pada soal ke-i

2. Rumus KR-21r11=dengan n: banyak butir soalXt rata-rata : rerata skor total2.Reliabelitas instrument tes UraianUntuk mencari koeifisien reliabilitas tes uraian kita menggunakan formula atau rumus alpha() yaitu:=r11=Keterangan:n: banyaknya butir/itemSt2:jumlah varians skor setiap itemSt2: varians skor total3.Reliabilitas instrument AfektifPenghitungan reliabilitas instrument afektif dilakukan dengan 3 cara yaitu:a.Pendekatan tes ulang,Skor yang diperoleh dua kali pengukuran selanjutnya dikorelasikan ,koeifisien korelasi ini merupakan estimasi dari reliabilitas instrument.b.Pendekatan tes sejajar,Digunakan jika tersedia dua instrument afektif memenuhi ciri-ciri parallel yaitu mengukur aspek afektif yang sama,mengukur obyek yang sama,komponen-komponen obyeknya sama,menggunakan skala yang sama,dikembangkan berdasarkan pola rancangan yang sama dan spesifikasinya sama.c. pendekatan konsistensi internalDalam pendekatan ini instrumen afektif dibelah menjadi beberapa bagian.untuk menentukkan reliabilitasnya digunakan bebrbagai formula seperti:formula spearman-Brown,formula Rulon. Dan formula alpha.(Laurens,2003:28-37).Kriteria-Kriteria:Besarnya angka koeifisien korelasi(koeifisien reliabilitas) bergerak antara -1 sampai dengan + 1.Besarnya angka koeifisien tersebut menunjukkan semakin baik reliabilitas tes tersebut.suatu perangkat tes dikatakan cukup reliable jika koeifisien reliabilitasnya lebih dari 0,5(r0,5) (nasoetion dkk,2007:5.10).Koeifisien ReliabilitasPenafsiran

0,80r0,40 r 0,80r 0,40Derajat reliabilitas tinggiDerajat reliabilitas sedangDerajat reliabilitas rendah

(Laurents,2003:39)3. TINGKAT KESUKARANSuatu instrument tes yang baik memiliki butir-butir soal dengan tingkat kesukaran yang proporsional.Instrumen tes yang baik memiliki perbandingan tingkat kesukaran mudah:sedang:sukar yang proporsional misalnya 1:2:1, 3:5:2 atau 2:5:3 (laurens,2003:69).Tingkat kesukaran dinyatakan dengan indeks kesukaran yang merupakan bilangan riel pada interval 0,00-1,00.indeks kesukaran dapat dihitung dengan:1. P= Keterangan :P: indeks kesukaranPh:proporsi siswa kelompok atas yang menjawab benar butir tesPl: proporsi siswa kelompok bawah yang menjawab benar butir tes (Laurents,2003:69)2. P= Keterangan:P: indeks ingkat kesulitan butir soalB:jumlah siswa yang menjawab benarN:jumlah siswa yang menjawab salah (nasoetion dkk,2007:5.20)3.TK=Keterangan:WL : Jumlah peserta didik yang menjawab salah dari kelompok bawahWH : Jumlah peserta didik yang menjawab benar dari kelompok atasnL:jumlah kelompok bawahnH :jumlah kelompok atas (arifin,2009:266)Kriteria-Kriteria:Indeks kesukarankategori

P 0,250,25 P 0,750,75 PSukarSedangMudah

(laurens,2003:69)Indeks kesukaran kategori

P 0,760,25 P 0,75P 0,24MudahSedang Sulit

(nasoetion dkk,2007:5.21)Indeks kesukarankategori

P70 %30 % P 70 %P 30%Mudah SedangSukar

(arifin,2009:272)4.DAYA PEMBEDADaya pembeda adalah indeks yang menunjukkan tingkat kemampuan butir soal membedakan kelompok yang berprestasi tinggi dengan kelompok yang berprestasi rendah.Daya pembeda akan menunjukkan angka -1 sampai +1, tanda negatif menunjukkan bahwa peserta tes yang berkemampuan rendah rata-rata mampu menjawab soal tersebut (nasoetion dkk,2007:7.57).Daya beda butir soal dapat dihitung dengan:1.D=PA-PBKeterangan:D :indeks daya beda butir soalPA : Proporsi kelompok atas yang menjawab benarPB : Proporsi kelompok atas yang menjawab benar (nasoetion dkk,2007:5.21).2. D=PH-PLKeterangan:D : indeks daya pembedaPH : proporsi Siswa kelompok atas yang menjawab benar butir tesPL: proporsi Siswa kelompok bawah yang menjawab benar butir tes (laurens,2003:71).3.DP = Keterangan:DP : daya pembedaWL : Jumlah peserta didik yang gagal dari kelompok bawahWH :jumlah peserta yang gagal dari kelompok atasn: 27 % NN:jumlah peserta didik (arifin,2009:273).Kriteria-Kriteria:Daya pembedaKriteria

D 0,400,30D 0,390,20 D 0,29D 0,19Sangat baikBaikSedangTidak baik

(nasoetion dkk,2007:5.22)

Daya PembedaKriteria

D 0,400,30 D 0,390,20 D 0,29D 0,20Butir sangat baikButir baikButir cukupButir jelek

(laurens,2003:71)

Index of discriminationItem evaluation

0,40 and up to0,30 0,390,20 0,29Below 0,29Very good itemReasonably good,but possibly subject to improvementMarginal item,usually needing and being to improvementPoor item,to be reject or improved by revision

(arifin,2009:274)5. ANALISI PENGECOHButir soal yang baik,pengeconya akan dipilih secara merata oleh peserta didik yang menjawab soal dan sebaliknya butir soal yang kurang baik ,pengecohnya akan dipilih secara tidak merata.Pengecoh dianggap baik apabila jumlah peserta didik yang memilih pengecoh tersebut sama atau mendekati jumlah ideal.Indeks pengecoh dapat dihitung dengan:IP = Keterangan :IP : Indeks pengecohP : jumlah peserta didik yang memilih pengecohN: jumlah peserta tesB : jumlah peserta didik yang menjawab benar pada setiap soaln : jumlah alternative jawaban1 : bilangan tetap (arifin,2009:279)Kriteria:Indeks pengecohKriteria

76%-125 %51%-75 % atau 126 % - 150 %26% - 50 % atau 151 % - 175 %0% - 25 % atau 176 % - 200 %Lebih dari 200 %Sangat baikBaikKurang baikJelekSangat jelak

(arifin,2009:280)6. ANALISIS HOMOGENITAS SOAL Homogin tidaknya butir soal diketahui dengan menghitung koefisien korelasi antara skor tiap butir soal dengan skor total. Perhitungan dilakukan sebanyak butir soal dalam tes bersangkutan.Salah satu teknik korelasi yang dapat digunakan adalah korelasi product-moment atau korelasi point biserial. Butir soal dikatakan homogin, apabila koefisien korelasinya sama atau di atas batas signifikansi (harga kritik korelasi). Sebaliknya, butir soal dikatakan tidak homogin, jika koefisien korelasinya negatif atau lebih kecil dari batas signifikansi. Butir soal yang tidak homogin kemungkinan besar mengukur aspek lain di luar materi/ bahan yang diajarkan, karena tidak sesuai dengan kompetensi yang telah ditetapkan. Butir soal yang demikian sebaiknya direvisi atau di buang (arifin,2012:359)

KISI-KISI

Kisi-kisi merupakan format yang memuat informasi mengenai ruang lingkup dan isi/kompetensi yang akan dinilai/diujikan. Kisi-kisi disusun berdasarkan tujuan penilaian dan digunakan sebagai pedoman untuk mengembangkan soal. Kisi-kisi harus mengacu pada SK-KD dan komponen-komponennya harus rinci, jelas, dan bermakna.Syarat-Syarat Kisi-Kisi yang baik diantaranya:1. Kisi-kisi harus dapat mewakili isi silabus/kurikulum atau materi yang telah diajarkan dengan tepat dan proporsional2. Kompon-komponenya diuraikan secara jelas dan mudah dipahami3. Materi/bahan yang hendak dinyatakan,dapat di buat soalnya (laurens,2003:59)Berikut contoh-contoh dari kisi-kisi:1. Kisi-kisi soal ujianSatuan pendidikan :Jumlah soal:Mata pelajaran:Bentuk soal:Kelas/semester:Penyusun:Alokasi waktu:NoUrutTujuanPembelajaran(kompetensi)Kelas/semesterPB/SPB(tema)MateriIndikatorNoSoalBobotSoal

(1)(2)(3)(4)(5)(6)(7)(8)

Keterangan:1. No.urut,jelas2. Tujuan Pembelajaran diisi dengan tujuan pembelajaran umum3. Bahan kelas/semester diisi dengan tingkat kelas/semester yang materinya diuji4. PB/SPB /tema diisi dengan pokok bahasan/sub pokok bahasan yang akan diujikan5. Materi diisi dengan uraian materi yang diuji6. Indikator diisi dengan tujusn pembelajaran khusus 7. Nomor soal diisi dengan nomor yang akan ditempati oleh soal yang dibuat8. Bobo soal khusu diisi untuk soal uraianSyarat yang perlu diperhatikan dalam menulis Indikator:a) Menggunakan kata kerja operasional(perilaku khusus) yang tepatb) Menggunakan satu kata kerja operasional untuk soal obyektif,dan untuk soal uraian boleh lebih dari satu kata kerja operasional c) Dapat dibuatkan soal atau pengecohan(untuk soal obyektif) Terdapat dua cara dalam menulis indicator:a) Menempatkan kondisi awal kalimat,ini digunakan untuk soal yang disertai dengan dasar pernyataanb) Menempatkan obyek perilaku yang harus ditampilkan di awal kalimat,ini digunakan untuk soal yang tidak disertai dengan dasar pernyataan (stimulus) (laurens,2003:59-60)2. Kisi-Kisi Tes ObyektifProgram studi :Mata Kuliah:Semester/tahun:Lama/waktu tes:Tipe tes:Jumlah Butir tes:NoKompetensi Dasar dan IndikatorJenjang Kemampuan

C1C2C3C4,5,6Jumlah%

Jumlah

(tim pekerti,2007:14)

Kisi-Kisi Tes UraianProgram studi :Mata Kuliah:Semester/tahun:Lama/waktu tes:Tipe tes:Jumlah Butir tes:NoKompetensi dasar dan indikatorJenis soalJenjangkemampuanjumlah%

terbukatertutup

(tim pekerti,2007:15)3.Kisi-Kisi Soal Nama Sekolah:Bidang Studi:Kelas:Semester:Penulis:Jumlah Soal:Waktu Ujian:

Pokok Bahasan danSub poko bahasanProses Berpikir

C1C2C3C4C5C6

MudahsedangsukarMudahsedangsukarMudahsedangsukarMudahsedangsukarMudahsedangsukarMudahsedangsukar

(nasoetion,2007:2.39-2.30)4.Kisi-Kisi TesMata Pelajaran :Kelas:Waktu ujian:Penulis:Jumlah Butir Soal:Sekolah:NoPokok Bahasan /Subpokok bahasanJenjang Kemampuan dan Tingkat Kesukaranjumlah

C1C2C3C4,5,6

MDSDSKMDSDSKMDSDSKMDSDSK

Keterangan:MD:MudahSD:SedangSK:Sukar(nasoetion,2007:3.49)

DAFTAR PUSTAKA

Arifin,Zainal.2009.Evaluasi Pembelajaran.Bandung:PT Remaja RosdakaryaArifin,Zainal.2012.Evaluasi Pembelajaran.Jakarta: Direktorat Jenderal Pendidikan Islam, Kementerian Agama RILaurens,Theresia.2003.Evaluasi Hasil Belajar.Surabaya:Unesa University PressNasoetion,Noehi.2007.Evaluasi Pembelajaran Fisika.Jakarta:Universitas TerbukaTim Pekerti.2007.Panduan Evaluasi Pembelajaran.Surakarta:Universitas Sebelas Maret