18
STATISTICAL METHODS FOR SAMPLE SIZE DETERMINATION THE TWO SAMPLE PROBLEM Kelompok 3 : Desri Maulina Sari Ikes Dwiastuti Lhuri Dwianti Rahmartani Siti Novy R

Proporsi 2 Populasi Dengan Dan Tanpa Hipotesis_ Kelompok III

Embed Size (px)

DESCRIPTION

Rumus menentukan besar sampel proporsi 2 populasi.Rumus ini berdasarkan rumus Lemeshow

Citation preview

  • STATISTICAL METHODS FOR SAMPLE SIZE DETERMINATIONTHE TWO SAMPLE PROBLEMKelompok 3 : Desri Maulina Sari Ikes DwiastutiLhuri Dwianti Rahmartani Siti Novy R

  • Estimasi perbedaan antara dua proporsi Perbedaan antara dua populasi proporsi menggambarkan parameter baru, P1-P2.Estimasi untuk parameter ini adalah perbedaan proporsi dalam sampel, yakni P1-P2. Rata-rata distribusi sampel P1-P2k adalah :E (p1-p2) = P1-P2Varians dari distribusi ini adalah :Var (p1 p2) = Var(p1)-Var(p2) = P1(1-P1)/n1 + P2(1-P2)/n2Nilai P1 dan P2 tidak diketahui, maka nilai-nilai tsb diganti dengan nilai p1 dan p2 yang akan memberikan estimasi varians yang bisa dipergunakan untuk membuat interval kepercayaan dari resiko, P1 - P2 . Batas atas dan bawah dari interval kepercayaan itu salah satunya oleh persamaan : (p1 p2) Z 1- /2[p1(1-p1)/n1 + p2(1-p2)/n2]

    THE TWO SAMPLE PROBLEM

  • Diduga ada dua jenis obat yang bisa digunakan untuk pengobatan untuk infeksi sejenis parasit usus. 100 pasien yang datang di suatu klinik untuk pengobatan penyakit ini dialokasikan kedalam dua kelompok secara acak, 50 orang mendapat obat A dan 50 orang mendapat obat B. dari mereka yang menerima obat A, 64% melaporkan telah sembuh dan dari yang menerima obat B, 82% melaporkan sembuh. Lakukan estimasi perbedaan proporsi kesembuhan antara kedua jenis obat dengan interval kepercayaan 95%Penyelesaian :Batas atas dan bawah interval kepercayaan 95% untuk perbedaan dua proporsi adalah :(p1 p2) Z 1- /2[p1(1-p1)/n1 + p2(1-p2)/n2](0,64-0,82) 1,96[0,64(0,36)/50 + (0,82)(0,18)/50]-0,18 1,96 (0,0869) = -0,18 0,17Hasilnya dengan interval kepercayaan 95% untuk P1 - P2 adalah :-0,35 P1-P2 -0,01Kenyataan bahwa angka nol tidak jatuh dalam interval ini menunjukan kedua jenis obat tidak sama efektifitasnya dalam mengobati pasien dengan infeksi parasit usus.

    Contoh I.2.1

  • Misalnya sebuah penelitian sedang direncanakan dan diinginkan untuk menghasilkan confidence interval yang dapat mengestimasi perbedaan resiko dengan presisi tertentu. Sebagai contoh, kita mungkin menginginkan estimasi perbedaan resiko dengan confidence interval 95% dengan presisi sebesar 2% dari perbedaan resiko yang sesungguhnya. Atau kita mungkin menginginkan estimasi perbedaan resiko dengan presisi 10% dari resiko yang sesungguhnya.Var (p1 p2) = Var(p1)-Var(p2) = P1(1-P1)/n1 + P2(1-P2)/n2Jika n1 = n2 = n sehinggaVar (p1 p2) = (1/n){ P1(1-P1)+ P2(1-P2)}Kecuali kita mempunyai estimasi dari P 1 dan P2 (baik itu dari literature atau sampel pendahuluan), kita akan mengambil nilai estimasi yang paling aman yaitu 0,5 untuk P 1 dan P2, sehinggaVar (p1 p2) = (1/n){( 0,5)(1-0,5)+ 0,5(0,5)} = (1/n)(0,5) = 1/2 nSekarang dengan menggunakan logika yang sama digunakan pada estimasi proporsi dengan single populasi, nilai d menyatakan jarak pada kedua arah, dari perbedaan resiko populasi dan dapat dinyatakan sebagai :d = Z 1- /2 [(1/n){ P1(1-P1)+ P2(1-P2)}]

  • untuk mencari n yaitu dengan rumus 5 :

    Ketika bermaksud bahwa nilai n2 menjadi proporsional dengan nilai n1 (mis : n2=kn1) maka rumus 5 bertransformasi menjadi :

    Tabel membantu untuk menentukan besar sampel sesuai dengan rumus 5 dalam 2 tahap, yaitu :Tahap 1: tabel 5a digunakan untuk menentukan nilai dari V (bila P1 dan P2 tidak diketahui maka, P1=P2=0,5, nilai V=0,5Tahap 2 : setelah nilai V ditentukan dari tabel 5a, kemudian tentukan besar sampel menggunakan tabel 5b, 5c atau 5d (= 0,01; 0,05; dan 0,1) melihat titik potong antara V dan d%.Ketika nilai presisi tidak berada dalam tabel, estimasi dapat diperoleh dengan interpolasi (penyisipan)

  • Jika ingin mengestimasi perbedaan risiko pada pajanan lingkungan dalam 2 kelompok industri, berapa banyak sampel yang harus diambil untuk setiap kelompok perusahaan, agar estimasi jatuh antara 5% dari perbedaan sebenarnya dengan 95% CI, jika tidak ada estimasi resiko pemaparan yang tersedia untuk kedua kelompok.SolusiJika, d=0.05, sehingga dengan menggunakan rumus 5

    Jadi diperlukan 769 subjek dalam tiap kelompok. Nilai yang sama dapat ditemukan pada tabel dilihat dari V pada tabel 5a, (P1=P2=0,5 jadi V=0,5) dan kemudian menuju ke tabel 5c pada kolom yang sesuai dengan nilai d% = 5 , dan baris yang sesuai untuk V=0.5.

    Contoh I.2.2

    V12345100,013850,02193

    0,50769

  • Misalnya sebuah studi dirancang untuk menguji Ho: P1-P2 dibandingkan Ha:P1>P2. Hal ini berarti bahwa rata-rata distribusi dari p1-p2 dibawah Ho adalah 0 dan variansnya adalah:Var(p1-p2) = Var(p1) + Var(p2) = P1(1-P1/n1)+P2(1-P2/n2)Jika kita mempunyai hipotesis utama nilai P1 dan P2 dapat dinyatakan dengan P maka :

    Dan jika n1=n2=n, maka

    Jelas terlihat variansi ini melibatkan parameter populasi P yang kita tidak mempunyai cara untuk memngetahuinya. Parameter ini bisa diduga sebagai nilai rata-rata dari kedua proporsi sampel dari penelitian pendahuluan. Oleh karena itu : P = p=(p1+p2)/2

    Pengujian Hipotesis untuk Dua Proporsi Populasi

  • Figure 4. Menampilkan representasi grafik dari pengujian hipotesis dua sampel untuk dua proporsi.

  • Berdasarkan data dari contoh I.2.1 seratus pasien datang ke klinik untuk mendapatkan treatment dari suatu parasit dan berpartisipasi dalam sebuah dalam percobaan RCT mengenai 2 jenis obat; 50 orang menerima obat A yang merupakan treatment standar dan 50 orang menerima obat baru yaitu obat B. Obat baru ini akan digunakan jika terbukti pada, = 0,05, dimana obat ini lebih efektif daripada treatment standar. Dari pasien yang menerima obat , 64% melaporkan sembuh; 82% dari pasien yang menerima obat B melaporkan sembuh. Apakah obat B secara signifikan lebih efektif daripada obat A?SolusiDengan menggunakan = 0,05, aturan pengambilan keputusannya adalah, ditolak Ho jika lebih besar dari 0+1,642(0,73)(0,27)/50=0,146. nilai 0,73 merupakan nilai rata-rata proporsi kesembuhan dari setiap kelompok( sebelumnya dinyatakan sebagai ). Dengan memisahkan p1 dan p2 berturut-turut sebagai proporsi dari pasien yang sembuh dengan obat A dan obat B, maka p1 - p2 = 0,82-0,64= 0,18. oleh karena itu nilai ini jatuh pada daerah penolakan maka Ho ditolak dan mendukung hipotesis alternative yang berarti obat B lebih efektif dari obat A.Contoh I.2.4

  • Seperti yang terdapat pada gambar 4, dibawah titik c diartikan sebagai

    Dimana . Dibawah Ha Dan, mengasumsikan n1 = n2 = n, menyamakan persamaan ini dan memecahkan n, kita peroleh : (6)

    tabel 6a-6i, tersedia untuk nilai dan , ukuran sampel dari rumus (6)

  • Contoh I.2.5Misalnya diperkirakan bahwa angka carries pada anak sekolah suatu wilayah 800 per 1000 dan di suatu wilayah lainadalah 600 per 1000 diwilayah lainnya. Berapa banyak sampel anak dari setiap wilayah yang dibutuhkan untuk mentukan apakah perbedaan ini bermakna pada tingkat kemaknaan 10% jika kita menginginkan untuk mendapatkan 80% kemungkinan untuk mengetahui perbedaan nyata pada = 0,1 dan =0,8?Solusi :dengan menggunakan rumus 6 = (0,80+0,60)/2= 0,70n = {1,282[2(0,70)(0,30)]+0,842[(0,80)(0,20)+(0,60)(0,40)]}/(0,80-0,60) = 46,47jadi, dibutuhkan sampel sebanyak 47 anak dari tiap wilayah. Dari tabel tabel 6h, dengan melihattitik potong antara kolom 0,60 dan baris berkepala 0,80 diperoleh n=47

    P2P10,050,100,800,850,102500,15394

    0,60470,6542

  • Pendekatan yang sama digunakan pada hipotesis alternatif 2-side. yaituMisalnya kita ingin menguji Ho : P1-P2 = 0 versus Ha : P1-P2 0Fig 5. menyajikan distribusi sampling untuk Ha two tailed

  • Catat bahwa Ho ditolak jika p1-p2 >c2 atau p1-p2 >c1 atau jika Ho salah dan jika P1-P2 > 0 maka hal ini akan sangat jarang untuk p1-p2 >c1 Dengan mengingat hal itu, perhatikan bahwa c2 bisa dirumuskan sehingga berlaku bagi kedua distribusi. Untuk distribusi yang berpusat di 0.

    Dan Untuk distribusi sampling berpusat pada P1-P2 yaitu distribusi akan berlaku jika Ha benar):

    Lalu, menggabungkan 2 rumus tsb untuk menentukan besar n, sbb :

    (7)

    tabel 7a-7i tersedia untuk nilai dan , berdasarkan formula (7).Ket : besar sampel yang diperlukan diperoleh pada titik potong antara kolom yang sesuai dengan nilai yang lebih kecil antara P1 dan P2 dan jika tidak satupun dari keduanya lebih kecil dari 0,5 maka yang lebih kecil diantara 1-P1 dan 1-P2 dipergunakan untuk menetukan kolom yang dipergunakan. Baris yang dipergunakan adalah yang sesuai dengan nilai absolut dari selisih antara P1 dan P2 yaitu |P1-P2|

  • Dalam sebuah survey pendahuluan Seorang epidemiologis membandingkan, suatu sampel yang terdiri dari 50 orang dewasa menderita suatu penyakit saraf sebagai kasus dan suatu sampel yang terdiri dari 50 kontrol yang bebas penyakit. 30 dari dari kasus (60%) dan 25 dari kontrol (50%) bekerja pada industri yang menggunakan bahan kimia spesifik. Diasumsikan proporsi mereka yang bekerja pada industri tersebut terhadap seluruh populasi adalah sama dengan yang diamati dalam survei pendahuluan. Berapa banyak subjek yang perlu ditambahkan pada setiap kelompok untuk memperoleh 90% CI dan untuk mengetahui perbedaan yang sesungguhnya diantara kedua kelompok jika hipotesis diuji pada 5%?SolusiDengan menggunakan rumus 7, dengan menganggap P1= 0,60, P2=0,50 =0,05, =0,10 n= {1,960[2(0,55)(0,45)]+1,282[0,6(0,4)+0,5(0,5)]}/(0,6-0,5)= 518,19jadi masing-masing pada kedua kelompok membutuhkan sampel sebanyak 519. Karena 50 telah diambil pada survei pendahuluan maka 469 sampel tambahan dibutuhkan pada setiap kelompok. Hasil ini dapat diperoleh menggunakan tabel 7d, dimana dapat dilihat dari pertemuan kolom atas 0,40 dan baris samping 0,10 yaitu n=519

    Contoh I.2.4

  • Using table 7d. Sample size for two-sample test of proportion(level significance:5%; power: 90%; alternative hypothesis: 2-sided

    |P2-P1|The Smalllest P1, (1-P1), P2 dan (1-P2)0,050,100,400,01109240,02

    0,10519

    0,4026

  • Pada situasi dimana suatu kejadian sangat jarang (misalnya pada penyakit seperti kanker memiliki probabilitas kejadian 50 per 100,000 atau 0.0005), perhitungan diatas tidak dapat digunakan . lemeshow, hosmer dan stewart mengemukakan bahwa untuk penyakit yang kejadiannya jarang, formula arcsin yang digunakan.

    (8)

    ukuran sampel berdasarkan formula (8) tersedia pada tabel 8a-8i untuk nilai ,,P1,P2

  • Dua komunitas akan diidentifikasi untuk berpartisipasi dalam sebuah study untuk mengevaluasi penggunaan secara luas dari suatu program screening baru untuk identifikasi awal dari sebuah jenis penyakit kanker. pada komunitas 1, program screening dengan usia >35, sementara pada komunitas 2 program screening tidak akan digunakan sama sekali. Pada komunitas yang tidak di screening Incidence rate tahunan dari jenis kanker ini adalah 50/100,000= 0.0005 . penurunan rate penyakit menjadi 20/100,000= 0.0002 akan menjadi alasan bagi penggunaan program jika digunakan secara luas. berapa banyak orang dewasa yang harus diteliti masing-masing pada dua komunitas jika 80% probabilitas untuk mendeteksi penurunan insiden sebesar itu jika uji hipotesis akan dilakukan pada tingkat kemaknaan =5%?Solusi :Dengan menggunakan rumus 8 akan didapat :N=(1.645+0.84)/{2(arcsin0.0005-arcsin0.0002)}= (1.645+0.84)/{2(0.0223625432-0.014142607)}=45770.39Jadi, dalam tiap komunitas harus di teliti sebanyak 45771 orang dewasa . Contoh I.2.4

  • Cara lainnya dengan melihat tabel 8e, dari pertemuan kolom P1=0.0002 dan baris P2= 0.0005 diperoleh sampel sebesar 45771.

    Using table 8e. Sample size for two-sample test of small proportion(level significance:5%; power: 80%; alternative hypothesis: 1-sided

    P2P10,00010,00020,00030,0001-0,0002180223

    0,000545770