PENGUKURAN
TES PSIKOLOGI :
TEKNIK DAN
METODOLOGI
RELIABILITAS DAN
VALIDITAS
Kuliah 4 - 5
Tugas
1. Cari dan jelaskan reliabilitas dan validitas masing-
masing tes psikologi berikut:
a. Wechsler-Bellevue Intelligence Scale
b. Edward’s Personal Preference Schedule
c. RMIB
d. Forer Sentence Completion Test
2. Jelaskan perbedaan kuesioner tes kepribadian dan
kuesioner Asperger Syndrome dengan kuesioner no 2
3. Cari dan jelaskan perbedaannya dengan tes-tes
psikologi dan kuesioner yang diberikan
Pengantar
• Seperti diketahui, tes-tes psikologi sangat
banyak
• Pembuatan tes psikologi ???
• Apa benar bisa mengukur apa yg ingin diukur
krn kaitannya dengan mental sso??
• Sejauh mana derajat kepercayaan tes tsb?
RELIABILITAS : KONSEP DASAR
• Definisi : merujuk pada kekonsistenan nilai yang
diperoleh oleh orang yang sama ketika diberikan tes
yang sama namun pada waktu yang berbeda.
• Konsep yg mendasari reliabilitas ialah:
penghitungan eror pd st nilai ttt
• Eror yang dimaksud disini adalah : perbedaan antara
kemampuan yg sebenarnya yg dimiliki oleh sso
dengan skor yg diperoleh melalui pengukuran yg
mengukur kemamp tsb
• Pada tes psikologi, eror yg dimaksud bukan
merupakan kesalahan test taker atau kesalahan yg
disengaja ketika proses pengerjaan tes,
• Namun merupakan ketidaktepatan dalam proses
pembuatan alat tes, seperti faktor2 X yg tdk terukur
atau tdk tdeteksi pd pembentukan tes yg mengukur st
pl.
• OKI, setelah membuat tes, kita harus mengukur
erornya dan cari cara untuk meminimalkan eror tsb
• Bahasa statistiknya, bila mlkk reliabilitas tes maka
akan didapatkan perkiraan total variance atau variasi
total dari nilai tes, yg disebut error variance
• Dengan memiliki tes yg minim eror maka tes tsb
semakin reliabel.
• Bila tesnya memiliki banyak eror maka tes tsb tidak
relibel.
• Misal : kita ingin mengukur fluktuasi mood.
Maka bila nilai skor tesnya turun naik =
relibilitas = baik/buruk????
• Krn day-by-day changes in scores on a test
would be relevant to the purpose of the test =
mengukur mood, krn mood tdk sll sama setiap
harinya.
• Jadi, kondisi apapun yg tdk relevan dgn tujuan
tes dibuat dpt menyebabkan error variance
• Sehingga, stp tester hrs mengusahakan kondisi
tes yg seragam = lingkungannya, instruksi,
time limit, rapport, atau faktor lainnya.
The Correlational Coefficient
• Ialah : derajat kekonsistenan dari dua nilai yg independent
• Simbol : r = relationship atau korelasi
• Korelasi ada 3 :
- Korelasi positif = kenaikan nilai di var X diikuti kenaikan var Y
- Korelasi negatif = reversal scores from one var to the other.
- Korelasi nol = bila tidak ada hub dari dua variabel yang ada
Pengukuran Korelasi
• Pearson Product-Moment Correlational Coefficient (PPMCC)
• Hasil dari PPMCC adl :
1. Posisi indv dlm kelomp (SS = standarad score)
2. Jumlah penyimpangan indiv = apk diatas mean or dibawah mean kelp
• Bila nilai indv jatuh di atas rata2 kelp maka kor + sdgk di bwh rata2 kelp maka kor -
• Statistical Significance
• Korelasi yg dihasilkan signifikan atau tidak?
• Untuk melihat itu digunakan level signifikansi
= yi resiko kesalahan yang akan digunakan u/
menarik kesimpulan dari data yg ada
• Ada bbrp level signifikasi = .01, .05, .09
• Bila kita menyebutkan bhw korelasi signifikan
di level .05 maksudnya adl probabilitas
kesalahannya adl 5 dari 100, begitu seterusnya
• Dalam pengukuran tes, maka level signifikansi
yg digunakan kebanyakan .01 dan .05
How reliable is reliable???
• Seberapa tinggi koefisien reliabilitas dikatakan
memiliki reliabilitas yang tinggi?
• Tergantung tes, namun biasanya bila koefisien
mencapai .70 atau .80 maka tes tersebut dapat
dikatakan reliabel
BERBAGAI TIPE RELIABILITAS
1. Metode Tes-retest
• Ialah : metode yg digunakan u/ m’cari reliabilitas dgn cara mengulang tes yg sama pada dua kesempatan yg berbeda
• Rtt yg diperoleh merupakan korelasi dari nilai tes individu yang diperoleh di waktu pengetesan yg berbeda
• Error variance yg diperoleh berasal dr fluktuasi
performance indiv di sesi 1 dan 2
• Variasi ini krn situasi pengetesan yg tdk dpt
dikontrol, spt suasana, cuaca, sudden noises,
broken pencil, dll.
• Selain itu eror dpt disebabkan keadaan indv ketika melakukan tes, spt sakit, cemas, khawatir, dll
• Evaluasi test-retest
- Kelebihan : simpel dan straightforward
- Kekurangan : interval pendek = recall their former responses, shg korelasinya akan tinggi. Hal ini menjadikan nature of the test itself may also change with repetition.
BERBAGAI TIPE RELIABILITAS
2. Alternate-Form Reliability
• Salah satu metode mendapatkan reliabilitas
tes dgn memberikan tes yg bentuknya setara
pada kesempatan yg berbeda namun pada
indv yang sama
• Jadi harus diperhitungkan juga interval
pemberian tesnya.
3. Split-Half Reliability
• Internal consistency : apakah belahan 1 dan
belahan 2 itemnya konsisten = content
sampling
• Yang dilihat adalah item-itemnya konsisten
apa tdk
• Antara belahan 1 dan 2 dikorelasikan, bila
kor nya tinggi maka tes tsb reliable
4. Kuder-Richardson Reliability dan Coefficient
Alpha
• Single administration of single form
• Yang ditekankan adalah inter item consistency = yi
konsistensi jawaban terhadap item
• Eror variance nya didpt dari :
1. Content sampling
2. Heterogeneity dari contoh tingkah laku
Sumber error dalam metode asesmen
reliabilitas
Sumber eror Contoh Metode How assessed
Time sampling Tes yg sama
diberikan pada 2
wkt yg berbeda
Tes-retest Korelasi ant 2 skor
yg didapat pada 2
kesempatan tsb.
Item sampling Item-item yg
berbeda yg
digunakan untuk
mengukur 1 pl
Alternate forms or
parallel forms
Korelasi antara
bentuk tes yg mirip
yg memiliki item2
yg berbeda
Internal
consistency
Item2 yg konsisten
pada tes yg sama
Split half, KR20,
dan alpha cronbach
Observer
differences
Catatan yg berbeda
dari msg2 observer
Kappa statistic
VALIDITAS : KONSEP DASAR
• Ialah : apakah tes mengukur apa yang ingin diukur dan seberapa jauh dpt mengukur apa yg ingin diukur tsb
• Jd jangan tll percaya dengan judul dari tes, biasanya hiperbola
• So, kl ingin buat alat tes yang baik jg harus memberikan nama yg baik shg bila sso melihat nama tes tsb, lgs mengetahui apa yg diukur o/ tes tsb
• Lebih lanjut lagi, validitas tes tdk dpt dilaporkan sbg “tinggi” atau “rendah” tp apk isi tes tsb mengukur apa yg ingin diukur
• Misal : tes informal “ingin mengetahui kemampuan berhitung anak usia 5 thn”. Isi tes = kebanyakan soal2 yg kaitannya dgn geometrik = TES TDK VALID
• Tes yg valid bila isinya : contoh : sebutkan urutan angka 1 – 50, dll
• Fundamentally, all procedures for determining
test validity are concerned with relationship
between performance on the test and other
independently observable facts about the
behavior characteristics under consideration.
METODE MENDAPATKAN
VALIDITAS TES
1. Content-Description Procedures
• Melibatkan pemeriksaan sistematis terhadap isi tes u/ melihat apk tes tsb m’cover contoh perilaku yg akan diukur
• Caranya :
- Menggunakan subject-matter expert
- Item2 yg didapat dr expert dispesifikkan = topiknya, tujuan instruksional tes
- Stlh itu ditentukan brp item yg dibutuhkan untuk mengukur hal2 yg sdh dispesifikkan sblmnya.
• Content-validity jangan disamakan dgn face
validity
• Krn face validity bukan fokus pd cara2
pengukuran tes tapi lebih pada apa2 saja yg
muncul dipermukaan (superficially)
2. Construct-Identification Procedures
• Construct-validity berfokus pd peran teori2
psikologi. Hal ini dilakukan untuk menyusun
definisi operasional tingkah laku yg akan
diukur dlm tes
• Contoh konstrak adl aptitude, scholastic,
verbal fluency, mechanical comprehension,
dll
3. Criterion-Prediction Procedures
• Prosedur ini mengindikasikan keefektifan tes
dalam memprediksi kinerja individu di masa
yad
• Jd sering disebut : predictive validity
• Item2nya tsb dpt memprediksi kinerja indv di
masa yad
• Misal : tes bakat = apk tes tersebut dpt
meramalkan performance kita di masa yad.
• Contoh lain : tes yg diberikan u/ job
applicants, students = selecting students for
admission to professional school, dll.