Download pdf - PENGUKURAN TES PSIKOLOGI - ocw.upj.ac.id · Jelaskan perbedaan kuesioner tes kepribadian dan kuesioner Asperger Syndrome dengan kuesioner no 2 3. ... • Pada tes psikologi, eror

PENGUKURAN

TES PSIKOLOGI :

TEKNIK DAN

METODOLOGI

RELIABILITAS DAN

VALIDITAS

Kuliah 4 - 5

Tugas

1. Cari dan jelaskan reliabilitas dan validitas masing-

masing tes psikologi berikut:

a. Wechsler-Bellevue Intelligence Scale

b. Edward’s Personal Preference Schedule

c. RMIB

d. Forer Sentence Completion Test

2. Jelaskan perbedaan kuesioner tes kepribadian dan

kuesioner Asperger Syndrome dengan kuesioner no 2

3. Cari dan jelaskan perbedaannya dengan tes-tes

psikologi dan kuesioner yang diberikan

Pengantar

• Seperti diketahui, tes-tes psikologi sangat

banyak

• Pembuatan tes psikologi ???

• Apa benar bisa mengukur apa yg ingin diukur

krn kaitannya dengan mental sso??

• Sejauh mana derajat kepercayaan tes tsb?

RELIABILITAS : KONSEP DASAR

• Definisi : merujuk pada kekonsistenan nilai yang

diperoleh oleh orang yang sama ketika diberikan tes

yang sama namun pada waktu yang berbeda.

• Konsep yg mendasari reliabilitas ialah:

penghitungan eror pd st nilai ttt

• Eror yang dimaksud disini adalah : perbedaan antara

kemampuan yg sebenarnya yg dimiliki oleh sso

dengan skor yg diperoleh melalui pengukuran yg

mengukur kemamp tsb

• Pada tes psikologi, eror yg dimaksud bukan

merupakan kesalahan test taker atau kesalahan yg

disengaja ketika proses pengerjaan tes,

• Namun merupakan ketidaktepatan dalam proses

pembuatan alat tes, seperti faktor2 X yg tdk terukur

atau tdk tdeteksi pd pembentukan tes yg mengukur st

pl.

• OKI, setelah membuat tes, kita harus mengukur

erornya dan cari cara untuk meminimalkan eror tsb

• Bahasa statistiknya, bila mlkk reliabilitas tes maka

akan didapatkan perkiraan total variance atau variasi

total dari nilai tes, yg disebut error variance

• Dengan memiliki tes yg minim eror maka tes tsb

semakin reliabel.

• Bila tesnya memiliki banyak eror maka tes tsb tidak

relibel.

• Misal : kita ingin mengukur fluktuasi mood.

Maka bila nilai skor tesnya turun naik =

relibilitas = baik/buruk????

• Krn day-by-day changes in scores on a test

would be relevant to the purpose of the test =

mengukur mood, krn mood tdk sll sama setiap

harinya.

• Jadi, kondisi apapun yg tdk relevan dgn tujuan

tes dibuat dpt menyebabkan error variance

• Sehingga, stp tester hrs mengusahakan kondisi

tes yg seragam = lingkungannya, instruksi,

time limit, rapport, atau faktor lainnya.

The Correlational Coefficient

• Ialah : derajat kekonsistenan dari dua nilai yg independent

• Simbol : r = relationship atau korelasi

• Korelasi ada 3 :

- Korelasi positif = kenaikan nilai di var X diikuti kenaikan var Y

- Korelasi negatif = reversal scores from one var to the other.

- Korelasi nol = bila tidak ada hub dari dua variabel yang ada

Pengukuran Korelasi

• Pearson Product-Moment Correlational Coefficient (PPMCC)

• Hasil dari PPMCC adl :

1. Posisi indv dlm kelomp (SS = standarad score)

2. Jumlah penyimpangan indiv = apk diatas mean or dibawah mean kelp

• Bila nilai indv jatuh di atas rata2 kelp maka kor + sdgk di bwh rata2 kelp maka kor -

• Statistical Significance

• Korelasi yg dihasilkan signifikan atau tidak?

• Untuk melihat itu digunakan level signifikansi

= yi resiko kesalahan yang akan digunakan u/

menarik kesimpulan dari data yg ada

• Ada bbrp level signifikasi = .01, .05, .09

• Bila kita menyebutkan bhw korelasi signifikan

di level .05 maksudnya adl probabilitas

kesalahannya adl 5 dari 100, begitu seterusnya

• Dalam pengukuran tes, maka level signifikansi

yg digunakan kebanyakan .01 dan .05

How reliable is reliable???

• Seberapa tinggi koefisien reliabilitas dikatakan

memiliki reliabilitas yang tinggi?

• Tergantung tes, namun biasanya bila koefisien

mencapai .70 atau .80 maka tes tersebut dapat

dikatakan reliabel

BERBAGAI TIPE RELIABILITAS

1. Metode Tes-retest

• Ialah : metode yg digunakan u/ m’cari reliabilitas dgn cara mengulang tes yg sama pada dua kesempatan yg berbeda

• Rtt yg diperoleh merupakan korelasi dari nilai tes individu yang diperoleh di waktu pengetesan yg berbeda

• Error variance yg diperoleh berasal dr fluktuasi

performance indiv di sesi 1 dan 2

• Variasi ini krn situasi pengetesan yg tdk dpt

dikontrol, spt suasana, cuaca, sudden noises,

broken pencil, dll.

• Selain itu eror dpt disebabkan keadaan indv ketika melakukan tes, spt sakit, cemas, khawatir, dll

• Evaluasi test-retest

- Kelebihan : simpel dan straightforward

- Kekurangan : interval pendek = recall their former responses, shg korelasinya akan tinggi. Hal ini menjadikan nature of the test itself may also change with repetition.

BERBAGAI TIPE RELIABILITAS

2. Alternate-Form Reliability

• Salah satu metode mendapatkan reliabilitas

tes dgn memberikan tes yg bentuknya setara

pada kesempatan yg berbeda namun pada

indv yang sama

• Jadi harus diperhitungkan juga interval

pemberian tesnya.

3. Split-Half Reliability

• Internal consistency : apakah belahan 1 dan

belahan 2 itemnya konsisten = content

sampling

• Yang dilihat adalah item-itemnya konsisten

apa tdk

• Antara belahan 1 dan 2 dikorelasikan, bila

kor nya tinggi maka tes tsb reliable

4. Kuder-Richardson Reliability dan Coefficient

Alpha

• Single administration of single form

• Yang ditekankan adalah inter item consistency = yi

konsistensi jawaban terhadap item

• Eror variance nya didpt dari :

1. Content sampling

2. Heterogeneity dari contoh tingkah laku

Sumber error dalam metode asesmen

reliabilitas

Sumber eror Contoh Metode How assessed

Time sampling Tes yg sama

diberikan pada 2

wkt yg berbeda

Tes-retest Korelasi ant 2 skor

yg didapat pada 2

kesempatan tsb.

Item sampling Item-item yg

berbeda yg

digunakan untuk

mengukur 1 pl

Alternate forms or

parallel forms

Korelasi antara

bentuk tes yg mirip

yg memiliki item2

yg berbeda

Internal

consistency

Item2 yg konsisten

pada tes yg sama

Split half, KR20,

dan alpha cronbach

Observer

differences

Catatan yg berbeda

dari msg2 observer

Kappa statistic

VALIDITAS : KONSEP DASAR

• Ialah : apakah tes mengukur apa yang ingin diukur dan seberapa jauh dpt mengukur apa yg ingin diukur tsb

• Jd jangan tll percaya dengan judul dari tes, biasanya hiperbola

• So, kl ingin buat alat tes yang baik jg harus memberikan nama yg baik shg bila sso melihat nama tes tsb, lgs mengetahui apa yg diukur o/ tes tsb

• Lebih lanjut lagi, validitas tes tdk dpt dilaporkan sbg “tinggi” atau “rendah” tp apk isi tes tsb mengukur apa yg ingin diukur

• Misal : tes informal “ingin mengetahui kemampuan berhitung anak usia 5 thn”. Isi tes = kebanyakan soal2 yg kaitannya dgn geometrik = TES TDK VALID

• Tes yg valid bila isinya : contoh : sebutkan urutan angka 1 – 50, dll

• Fundamentally, all procedures for determining

test validity are concerned with relationship

between performance on the test and other

independently observable facts about the

behavior characteristics under consideration.

METODE MENDAPATKAN

VALIDITAS TES

1. Content-Description Procedures

• Melibatkan pemeriksaan sistematis terhadap isi tes u/ melihat apk tes tsb m’cover contoh perilaku yg akan diukur

• Caranya :

- Menggunakan subject-matter expert

- Item2 yg didapat dr expert dispesifikkan = topiknya, tujuan instruksional tes

- Stlh itu ditentukan brp item yg dibutuhkan untuk mengukur hal2 yg sdh dispesifikkan sblmnya.

• Content-validity jangan disamakan dgn face

validity

• Krn face validity bukan fokus pd cara2

pengukuran tes tapi lebih pada apa2 saja yg

muncul dipermukaan (superficially)

2. Construct-Identification Procedures

• Construct-validity berfokus pd peran teori2

psikologi. Hal ini dilakukan untuk menyusun

definisi operasional tingkah laku yg akan

diukur dlm tes

• Contoh konstrak adl aptitude, scholastic,

verbal fluency, mechanical comprehension,

dll

3. Criterion-Prediction Procedures

• Prosedur ini mengindikasikan keefektifan tes

dalam memprediksi kinerja individu di masa

yad

• Jd sering disebut : predictive validity

• Item2nya tsb dpt memprediksi kinerja indv di

masa yad

• Misal : tes bakat = apk tes tersebut dpt

meramalkan performance kita di masa yad.

• Contoh lain : tes yg diberikan u/ job

applicants, students = selecting students for

admission to professional school, dll.