25
Bab 2 Data Deskripsi dan Inference sederhana untuk Continuous Data : rentang hidup Tikus dan Abad Perkawinan di AS 2.1 Deskripsi Data Dalam bab ini , kita mempertimbangkan dua set data. Yang pertama , ditunjukkan pada Tabel 2.1 , melibatkan umur dua kelompok tikus , satu kelompok diberi pembatasan diet dan diet lainnya ad libitum ( yaitu, " makan gratis " ) . Bunga terletak dalam menilai apakah umur dipengaruhi oleh diet . Kedua kumpulan data , yang ditunjukkan pada Tabel 2.2 , memberikan usia saat menikah untuk sampel 100 pasangan yang mengajukan izin menikah di Cumberland County, PA , pada tahun 1993 . Beberapa pertanyaan yang menarik tentang data ini adalah sebagai berikut : Bagaimana usia kawin didistribusikan ? Apakah ada perbedaan usia rata-rata pernikahan laki-laki dan perempuan ? Bagaimana usia pada perkawinan suami istri berhubungan ? Tabel 2.1 rentang hidup Tikus (dalam Hari) Mengingat Dua Diet a) Diet Dibatasi ( n = 105 ) 105 193 211 236 302 363 389 390 391 403 530 604 60,5 630 716 718 727 731 749 769 770 789 804 810 811 833 868 871 848 893 897 901 906 907 919 923 931 940 957 958 961 962 974 979 982 1101 1008 1010 1011 1012 1014 1017 1032 1039 1045 1046 1047 1057 1063 1070 1073 1076 1085 1090 1094 1099 1107 1119 1120 1128 1129 1131 1133 1136 1138 1144 1149 1160 1166 1170 1173 1181 1183 1188 1190 1203 1206 1209 1218 1220 1221 1228 1230 1231 1233 1239 1244 1258 1268 1294 1316 1327 1328 1369 1393 1435 b ) Ad libitum diet ( n = 89 ) 89 104 387 465 479 494 496 514 532 536 545 547 548 582 606 609 619 620 621 630 635 639 648 652 653 654 660 665 667 668 670 675 677 678 678 681 684 688 694 695 697 698 702 704 710 711 712 715 716 717 720 721 730 731 732 733 735 736 738 739 741 743 746 749 751 753 764 765 768 770 773 777 779 780 788 791 794 796 799 801 806 807 815 836 838 850 859 894 963

Bab 2 data deskripsi dan inferensial

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Bab 2 data deskripsi dan inferensial

Bab 2 Data Deskripsi danInference sederhana untukContinuous Data : rentang hidup Tikus dan Abad Perkawinan di AS 2.1 Deskripsi DataDalam bab ini , kita mempertimbangkan dua set data. Yang pertama , ditunjukkan pada Tabel 2.1 , melibatkan umur dua kelompok tikus , satu kelompok diberi pembatasan diet dan diet lainnya ad libitum ( yaitu, " makan gratis " ) . Bunga terletak dalam menilai apakah umur dipengaruhi oleh diet .Kedua kumpulan data , yang ditunjukkan pada Tabel 2.2 , memberikan usia saat menikah untuk sampel 100 pasangan yang mengajukan izin menikah di Cumberland County, PA , pada tahun 1993 . Beberapa pertanyaan yang menarik tentang data ini adalah sebagai berikut : Bagaimana usia kawin didistribusikan ? Apakah ada perbedaan usia rata-rata pernikahan laki-laki dan perempuan ? Bagaimana usia pada perkawinan suami istri berhubungan ?Tabel 2.1 rentang hidup Tikus (dalam Hari) Mengingat Dua Diet a) Diet Dibatasi ( n = 105 )105 193 211 236 302 363 389 390 391 403 530 604 60,5 630 716718 727 731 749 769 770 789 804 810 811 833 868 871 848 893897 901 906 907 919 923 931 940 957 958 961 962 974 979 9821101 1008 1010 1011 1012 1014 1017 1032 1039 1045 1046 1047 1057 1063 10701073 1076 1085 1090 1094 1099 1107 1119 1120 1128 1129 1131 1133 1136 11381144 1149 1160 1166 1170 1173 1181 1183 1188 1190 1203 1206 1209 1218 12201221 1228 1230 1231 1233 1239 1244 1258 1268 1294 1316 1327 1328 1369 13931435b ) Ad libitum diet ( n = 89 )89 104 387 465 479 494 496 514 532 536 545 547 548 582 606 609 619 620 621 630 635 639 648 652 653 654 660 665 667 668670 675 677 678 678 681 684 688 694 695 697 698 702 704 710711 712 715 716 717 720 721 730 731 732 733 735 736 738 739741 743 746 749 751 753 764 765 768 770 773 777 779 780 788 791 794 796 799 801 806 807 815 836 838 850 859 894 963 Sumber : Berger , Boss , dan Guess , 1988. Dengan izin dari Masyarakat Biometrics .2.2 Metode AnalisisAnalisis data umumnya dimulai dengan perhitungan sejumlah ringkasan statistik seperti mean , median , standar deviasi, dll, dan dengan menciptakan tampilan grafis informatif dari data seperti histogram , plot kotak , dan plot batang - dan - daun . Tujuan pada tahap ini adalah untuk menggambarkan sifat distribusi umum dari data, untuk mengidentifikasi setiap pengamatan yang tidak biasa ( outlier ) atau pola yang tidak biasa dari pengamatan yang dapat menyebabkan masalah untuk analisis kemudian dilakukan pada data . ( Deskripsi dari semua istilah yang dicetak miring dapat ditemukan di Altman , 1991 . )Setelah eksplorasi awal data , uji statistik dapat diterapkan untuk menjawab pertanyaan tertentu atau untuk menguji hipotesis khusus tentang data . Untuk data tikus , misalnya, kita akan menggunakan sampel independen t -test dan alternatif nonparametrik , yang Mann - Whitney U -test untuk menilai apakah tahan rata-rata untuk tikus pada dua diet berbeda . Untuk data kedua set kita akan menerapkan sampel uji-t berpasangan (dan Wilcoxon signed ranks test ) untuk menjawab pertanyaan tentang apakah pria dan wanita memiliki usia rata-rata yang berbeda pada pernikahan . ( Lihat Kotak 2.1 dan 2.2 untuk penjelasan singkat tentang metode yang disebutkan . )

Page 2: Bab 2 data deskripsi dan inferensial

Akhirnya , kita akan menguji hubungan antara usia suami dan istri-istri mereka dengan membangun sebuah sebar , menghitung jumlah koefisien korelasi , dan fitting model regresi linier sederhana ( lihat Kotak 2.3 ) .Tabel 2.2 Usia ( dalam tahun) dari Suami dan Istri di PernikahanSuami Istri Suami Istri Suami Istri Suami Istri Suami Istri22 21 40 46 23 22 31 33 24 2538 42 26 25 51 47 23 21 25 2431 35 29 27 38 33 25 25 46 3742 24 32 39 30 27 27 25 24 2323 21 36 35 36 27 24 24 18 2055 53 68 52 50 55 62 60 26 2724 23 19 16 24 21 35 22 25 2241 40 52 39 27 34 26 27 29 2426 24 24 22 22 20 24 23 34 3924 23 22 23 29 28 37 36 26 1819 19 29 30 36 34 22 20 51 5042 38 54 44 22 26 24 27 21 2034 32 35 36 32 32 27 21 23 2331 36 22 21 51 39 23 22 26 2445 38 44 44 28 24 31 30 20 2233 27 33 37 66 53 32 37 25 3254 47 21 20 20 21 23 21 32 3120 18 31 23 29 26 41 34 48 4343 39 21 22 25 20 71 73 54 4724 23 35 42 54 51 26 33 60 45Sumber : Rossman , 1996. Dengan izin dari Springer -Verlag .Kotak 2.1 Student t - Tes( 1 ) Independent sampel t -test Independen sampel uji t digunakan untuk menguji hipotesis nol bahwa sarana dua populasi adalah sama , H0 : Q1 = Q2 , ketika sampel pengamatan dari setiap populasi yang tersedia . Pengamatan dilakukan pada anggota sampel semua harus independen satu sama lain . Jadi , misalnya, individu dari satu populasi harus tidak secara individual cocok dengan mereka yang berasal dari populasi yang lain , atau harus individu dalam setiap grup akan saling berkaitan . Variabel untuk dibandingkan diasumsikan memiliki distribusi normal dengan deviasi standar yang sama pada kedua populasi . Tes -statistik adalaht !di mana y - 1 dan y - 2 merupakan sarana dalam kelompok 1 dan 2 , n1 dan n2 adalah ukuran sampel , dan s adalah gabungan simpangan baku dihitung sebagain1 n2 1 s12 1 s2 2 s !n1 n2 2mana s1 dan s2 adalah standar deviasi dalam dua kelompok .Berdasarkan hipotesis nol , t-statistic memiliki siswa t - distribusi dengan n1 + n2 - 2 derajat kebebasan .Interval kepercayaan sesuai dengan pengujian di Etingkat signifikansi , misalnya, jika E = 0,05 , interval kepercayaan 95 % dibangun sebagaiTES y1 y2 sketika tE adalah nilai kritis untuk uji dua sisi , dengan n1 + n2 - 2 derajat kebebasan .Sampel ( 2 ) Paired t-testSebuah uji-t berpasangan digunakan untuk membandingkan cara dua populasi ketika sampel dari

Page 3: Bab 2 data deskripsi dan inferensial

populasi yang tersedia, di mana setiap individu dalam satu sampel dipasangkan dengan individu dalam sampel lainnya . Contoh yang mungkin adalah gadis anoreksia dan saudari mereka yang sehat , atau pasien yang sama sebelum dan setelah pengobatan .Jika nilai-nilai variabel y bunga bagi anggotapasangan engan dalam kelompok 1 dan 2 dilambangkan sebagai y1i dan y2i , maka perbedaan di = y1i - y2i diasumsikan memiliki distribusi normal . Kotak 2.2 Nonparametrik Tes( 1 ) Mann- Whitney U -test Hipotesis nol yang akan diuji adalah bahwa dua populasi yang dibandingkan memiliki distribusi yang identik . (Untuk dua populasi terdistribusi normal dengan varians umum , ini akan setara dengan hipotesis bahwa cara dua populasi adalah sama . ) Hipotesis alternatif adalah bahwa distribusi populasi berbeda dalam lokasi ( median ) . Sampel pengamatan yang tersedia dari masing-masing dua populasi yang dibandingkan. Tes ini didasarkan pada peringkat gabungan dari pengamatan dari dua sampel ( seolah-olah mereka dari sampel tunggal ) . Jika ada dasi, pengamatan terikat diberikan rata-rata dari peringkat yang pengamatan bersaing . Pengujian statistik adalah jumlah dari jajaran satu sampel ( lebih rendah dari dua peringkat jumlah umumnya digunakan ) .Untuk sampel kecil , nilai p untuk uji -statistik dapat ditemukan dari tabel yang cocok (lihat Hollander dan Wolfe , 1999 ) . Sebuah pendekatan sampel besar tersedia yang cocok ketika dua sampel ukuran n1 dan n2 keduanya lebih besar dari 15 , dan tidak ada ikatan . Uji -statistik z diberikan olehS n1n1 n2 1/2z !n1n2n1 n2 1/12dimana S adalah uji -statistik berdasarkan sampel dengan pengamatan n1 . Berdasarkan hipotesis nol , z memiliki sekitar distribusi normal standar. Sebuah dimodifikasi z -statistik yang tersedia ketika ada hubungan (lihat Hollander dan Wolfe , 1999) .( 2 ) Wilcoxon signed ranks testAsumsikan , kita memiliki dua pengamatan , yi1 dan yi2 pada masing-masing n subyek dalam sampel kami , misalnya , sebelum dan setelah pengobatan . Pertama-tama kita menghitung perbedaan zi = yi1 - yi2 , antara setiap pasangan pengamatan .Untuk menghitung Wilcoxon signed-rank statistik T + , membentuk nilai absolut dari perbedaan zi dan kemudian memesan mereka dari setidaknya untuk terbesar .Jika ada hubungan antara perbedaan dihitung , menetapkan masing-masing pengamatan dalam kelompok terikat rata-rata dari peringkat integer yang berhubungan dengan kelompok terikat .Sekarang menetapkan tanda positif atau negatif terhadap jajaran perbedaan menurut apakah sesuai perbedaan positif atau negatif . (Zero nilai dibuang , dan ukuran sampel n diubah sesuai. )Statistik T + adalah jumlah tingkat positif. Meja tersedia untuk menetapkan nilai-p ( lihat Tabel A.4 di Hollander dan Wolfe , 1999 ) .Sebuah pendekatan sampel besar melibatkan pengujian statistik zsebagai standar normal :T nn 1/4 z !nn 1 2n 1/24 Kotak 2.3 Regresi Linear SederhanaRegresi linier sederhana digunakan untuk memodelkan hubungan antara variabel tunggal respon , y , dan variabel penjelas tunggal, x; model iniyi ! F0 F1xi Ii

Page 4: Bab 2 data deskripsi dan inferensial

mana ( xi , yi ) , i = 1 , ... , n adalah nilai sampel dari respon dan variabel eksplorasi dan Ii adalah istilah gangguan acak diasumsikan terdistribusi secara normal dengan mean nol dan varians W2 .Mencegat parameter , Fo , adalah nilai prediksi untuk variabel respon ketika variabel penjelas mengambil nilai nol .Parameter kemiringan , F1 , adalah perubahan dalam variabel respon diprediksi kapan variabel penjelas meningkat sebesar satu unit .Parameter , juga dikenal sebagai koefisien regresi , dapat diperkirakan dengan kuadrat (lihat Rawlings , Pantula , dan Dickey ,1998) .2.3 Analisis Menggunakan SPSS2.3.1 rentang hidup TikusData umur dari Tabel 2.1 dapat diketik langsung ke data SPSS Lihat seperti yang ditunjukkan dalam Tampilan 2.1 . SPSS mengasumsikan bahwa baris spreadsheet menentukan unit pengukuran yang diambil . Jadi tikus harus sesuai dengan baris dan nilai-nilai hidup harus dimasukkan dalam satu kolom panjang . Untuk identifikasi kemudian, angka ini juga ditugaskan untuk masing-masing tikus .Jenis diet yang diberikan kepada masing-masing tikus harus ditunjuk sebagai faktor,yaitu, variabel kategori dengan , dalam kasus ini , dua tingkat , "diet terbatas" dan " Ad libitum diet . " Seperti yang dijelaskan sebelumnya ( lihat Bab 1 ) , kadar faktor perlu diberi kode buatan dan label yang melekat pada kode tingkat yang lebih daripada teks diketik langsung ke data View spreadsheet . Oleh karena itu kita menggunakan kode " 1 " dan " 2 " di Data View spreadsheet (Display 2.1 ) dan menggunakan Nilai kolom Variable View spreadsheet untuk melampirkan label "diet terbatas" dan " Ad libitum diet" dengan kode (lihat Tampilan 1,4 ) . Analisis hampir setiap kumpulan data harus dimulai dengan pemeriksaan ringkasan statistik yang relevan , dan berbagai tampilan grafis . SPSS memasok ukuran ringkasan standar lokasi dan penyebaran distribusi variabel kontinu bersama dengan berbagai tampilan grafis yang berguna .Cara termudah untuk mendapatkan ringkasan data untuk memilih perintahAnalisa - Statistik Deskriptif - Jelajahidari menu bar dan mengisi kotak dialog yang dihasilkan seperti yang ditunjukkan dalamTampilan 2.2 . Dalam kotak ini , Daftar Dependent menyatakan variabel kontinu membutuhkan statistik deskriptif , dan dalam Daftar Faktor kita tentukan kategori di mana ringkasan terpisah akan dihitung - dalam contoh ini , masing-masing kelompok makanan . Pelabelan pengamatan dengan nomor ID tikus akan memungkinkan pengamatan terpencil mungkin untuk diidentifikasi .Untuk tampilan grafis dari data yang kita lagi membutuhkan Jelajahi kotak dialog , bahkan, dengan memeriksa Baik dalam kotak ini , kita bisa mendapatkan statistik deskriptif dan plot yang kita butuhkan. Di sini kita pilih Boxplots dan Histogram untuk menampilkan distribusi rentang hidup tikus , dan plot probabilitas (lihat Everitt dan Wykes , 1999 ) untuk menilai lebih langsung asumsi normalitas dalam setiap kelompok makanan .Tampilan 2.3 menunjukkan statistik deskriptif disediakan secara default ( statistik lebih lanjut dapat diminta dari Jelajahi melalui Statistik sub-kotak dialog ) . Kita melihat , misalnya , bahwa rata-rata umur yang lebih pendek untuk tikus pada diet ad libitum ( 710 hari dibandingkan dengan 1035,5 hari untuk tikus pada diet terbatas ) . Sebuah kesimpulan serupa tercapai ketika baik rata-rata atau 5 % dipangkas berarti (lihat Everitt dan Wykes , 1999) digunakan sebagai ukuran lokasi . "Spread " dari rentang hidup yang diukur dengan kisaran interkuartil ( IQR ) (lihat Everitt dan Wykes , 1999 ) tampaknya bervariasi dengan diet , dengan rentang hidup dalam kelompok diet terbatas menjadi variabel lainnya ( IQR pada kelompok diet terbatas adalah 311,5 hari , tetapi hanya 121 hari dalam perbandingandescriptivesDiet Statistik Std . kesalahan

Page 5: Bab 2 data deskripsi dan inferensial

umur dalam hari diet Dibatasi BerartiKeyakinan 95 %Interval untuk Berarti5 % pakai Berartirata-rataperbedaanStd . deviasiminimummaksimumjarakRentang interkuartilkecuranganKurtosis rendah BoundAtas Bound 968,75913,941.023,55988,311.035,5080985.696284,580 10514351330 311.50 -1,1611,021 27,6410,2350,465Diet ad libitum BerartiKeyakinan 95 %Interval untuk Berarti5 % pakai Berartirata-rataperbedaanStd . deviasiminimummaksimumjarakRentang interkuartilkecuranganKurtosis rendah BoundAtas Bound 684,01655,77712,26695,05710.0017978.579134,08489963874121.00 -2,0107,027 14,213.255

Page 6: Bab 2 data deskripsi dan inferensial

0,506 Tampilan 2.3 Descriptives keluaran untuk data tikus .kelompok) . Langkah-langkah lain penyebaran , seperti standar deviasi dan berbagai sampel , mengkonfirmasi peningkatan variabilitas dalam kelompok diet terbatas .Akhirnya , SPSS menyediakan ukuran dua aspek dari " bentuk " dari distribusi umur dalam setiap kelompok makanan , yaitu , kemiringan dan kurtosis (lihat Everitt dan Wykes , 1999) . Indeks kemiringan mengambil nilai nol untuk distribusi simetris . Sebuah nilai negatif menunjukkan distribusi negatif miring , nilai positif distribusi positif miring - Gambar 2.1 menunjukkan contoh dari setiap jenis . Indeks kurtosis mengukur sejauh mana puncak dari distribusi frekuensi unimodal berangkat dari bentuk distribusi normal . Sebuah nilai nol sesuai dengan distribusi normal , nilai-nilai positif mengindikasikan distribusi yang lebih runcing dari distribusi normal dan nilai negatif yang datar distribusi - Gambar 2.2 menunjukkan contoh dari setiap jenis . Untuk data kami menemukan bahwa kedua bentuk indeks menunjukkan beberapa derajat kemiringan negatif  dan distribusi yang lebih runcing dari distribusi normal . Temuan tersebut memiliki implikasi yang mungkin untuk analisis kemudian dapat dilakukan pada data .Kita sekarang dapat melanjutkan untuk memeriksa tampilan grafis yang telah kami pilih . Plot kotak ditunjukkan dalam Tampilan 2.4 . ( Kami telah mengedit kelompok makanan Tampilan 2,4 Box plot untuk rentang hidup tikus yang dihasilkan oleh perintah di Layar 2.2 .grafik asli agak menggunakan Editor Bagan untuk memperbaiki penampilan . ) Jenis plot ( juga dikenal sebagai kotak - dan - kumis plot) memberikan " gambaran " dari ringkasan lima titik pengamatan sampel dalam setiap kelompok . Ujung bawah kotak merupakan kuartil bawah dan ujung atas kuartil atas , sehingga lebar kotak adalah IQR dan mencakup tengah 50 % dari data . Garis horizontal dalam kotak ditempatkan di median sampel . Bagian bawah " kumis " meluas ke titik minimum data dalam sampel , kecuali jika titik ini dianggap outlier dengan SPSS . ( SPSS menyebut titik yang " outlier " jika titik lebih dari 1,5 v IQR jauh dari kotak dan menganggapnya sebagai " nilai ekstrem " ketika itu lebih dari 3 v IQR pergi . ) Dalam kasus terakhir , kumis meluas ke kasus terendah kedua, kecuali jika hal ini ditemukan outlier dan sebagainya. Bagian atas kumis meluas ke nilai maksimum dalam sampel , sekali lagi memberikan nilai ini tidak outlier .Plot kotak di Layar 2.4 mengarah pada kesimpulan yang sama dengan ringkasan deskriptif . Rentang hidup dalam kelompok diet terbatas tampaknya lebih " rata-rata " tetapi juga lebih bervariasi . Sejumlah tikus telah menunjukkan mungkin outlier dan untuk diet ad libitum , beberapa bahkan ditandai sebagai pengamatan ekstrim. Karena kita telah mempekerjakan label kasus , kita dapat mengidentifikasi tikus dengan umur manusia sangat pendek . Berikut tikus dengan umur terpendek ( 89 hari ) adalah tikus nomor 107 . ( Rentang hidup yang pendek terhadap sebagian besar data dapat timbul sebagai akibat dari kemiringan negatif dari distribusi - pengamatan berlabel " outlier " oleh SPSS tidaka) Kelompok 1 b ) Kelompok 2Dibatasi diet libitum diet IklanUmur dalam hari Hidup di hari Tampilan 2.5 Histogram untuk rentang hidup tikus yang dihasilkan oleh perintah di Layar 2.2 .perlu harus dihapus sebelum analisis lebih lanjut , meskipun mereka membutuhkan pertimbangan hati-hati. Di sini kita tidak akan menghapus salah satu pengamatan tersangka sebelum analisis lebih lanjut . )Bukti dari kedua ringkasan statistik untuk pengamatan di masing-masing kelompok makanan dan box

Page 7: Bab 2 data deskripsi dan inferensial

plot adalah bahwa distribusi dari rentang hidup dalam populasi yang mendasarinya tidak simetris dan bahwa varian dari rentang hidup bervariasi antara kelompok diet . Informasi tersebut sangat penting dalam menentukan uji statistik yang paling tepat untuk menguji hipotesis yang menarik tentang data , seperti yang akan kita lihat nanti .Sebuah alternatif ke kotak plot untuk menampilkan distribusi sampel adalah histogram . Tampilan 2.5 menunjukkan histogram untuk rentang hidup di bawah setiap diet . Setiap histogram menampilkan frekuensi dimana rentang tertentu ( atau " sampah " ) dari rentang hidup terjadi dalam sampel . SPSS memilih lebar bin otomatis , tetapi di sini kita memilih kedua lebar bin kita sendiri ( 100 hari ) dan kisaran sumbu x ( 100 hari sampai 1500 hari ) sehingga histogram dalam dua kelompok adalah sebanding . Untuk mengubah pengaturan standar untuk mencerminkan pilihan kita , kita pergi melalui langkah-langkah berikut : Buka Editor Grafik dengan mengklik ganda pada grafik di Output Viewer . Double klik pada label sumbu x . Periksa Bea dan pilih Tentukan ... dalam kotak Axis Interval yang dihasilkan (Display 2.6 ) . Mengubah Axis Interval : Define Custom In ... box sub - dialog seperti yang ditunjukkan dalam Tampilan 2.6 dan klik Lanjutkan . Pilih Label ... dalam kotak Axis Interval . Mengubah pengaturan dari Axis Interval : Label box sub - dialog seperti yang ditunjukkan dalam Tampilan 2.6 dan akhirnya klik Continue diikuti oleh OK . Tampilan 2.5 .Sebagaimana mungkin kita harapkan histogram menunjukkan distribusi frekuensi negatif miring dengan ekor kiri menjadi lebih jelas pada kelompok diet terbatas .Akhirnya , normalitas dapat dinilai lebih formal dengan bantuan kemungkinan merencanakan kuantil - kuantil ( QQ plot) , ini melibatkan plot quantiles diharapkan dari distribusi normal standar terhadap quantiles diamati ( untuk lebih jelasnya lihat Everitt , 2001b ) . Seperti plot untuk pengamatan di masing-masing kelompok ditunjukkan dalam Tampilan 2.7 . Sebuah grafik di mana titik terletak kira-kira pada garis referensi menunjukkan normalitas . Poin di atas garis menunjukkan bahwa quantiles diamati lebih rendah dari yang diharapkan dan sebaliknya . Untuk data umur tikus kita menemukan bahwa quantiles sangat kecil dan sangat besar lebih kecil dari yang diharapkan - dengan yang paling menonjol untuk terendah tiga quantiles dalam kelompok ad libitum . Seperti gambar adalah karakteristik dari distribusi dengan ekor kiri berat, sehingga lagi kami mendeteksi beberapa derajat kemiringan negatif .Setelah menyelesaikan pemeriksaan awal dari data umur , sekarang kita lanjutkan untuk menilai lebih formal apakah umur rata-rata adalah sama di bawah setiap rezim diet. Kita bisa melakukan ini dengan signifikansi yang tepata) Kelompok 1 b ) Kelompok 2Nilai yang diamati nilai Teramati Tampilan 2,7 plot QQ untuk rentang hidup tikus yang dihasilkan oleh perintah di Layar 2.2 .menguji dan dengan membangun interval kepercayaan yang relevan . Untuk memulai , kita akan menerapkan sampel Mahasiswa independen ttest ( lihat Kotak 2.1 ) , mudah mengabaikan untuk saat ini indikasi yang diberikan oleh pemeriksaan awal kami dari data bahwa dua dari asumsi tes, normalitas dan homogenitas varians , mungkin tidak ketat berlaku .Sampel independent t-test menilai hipotesis nol bahwa populasi berarti dari umur dalam masing-masing dua kelompok diet adalah sama ( lihat Kotak 2.1 ) . Tes ini dapat diakses di SPSS dengan memilih perintahAnalisa - Bandingkan Means - Independent - Samples T Testdari menu bar untuk memberikan kotak dialog yang ditunjukkan pada Layar 2.8 . Variable ( s ) Daftar Uji berisi variabel yang akan dibandingkan antara dua tingkat dari Variabel Pengelompokan . Di sini variabel umur yang akan dibandingkan antara tingkat " 1 " dan " 2 " dari diet pengelompokan variabel

Page 8: Bab 2 data deskripsi dan inferensial

. Tentukan Grup ... box sub - dialog yang digunakan untuk menentukan tingkat bunga. Dalam contoh ini , variabel pengelompokan hanya memiliki dua tingkat , tetapi perbandingan kelompok berpasangan juga memungkinkan untuk variabel dengan lebih dari dua tingkat kelompok .Tampilan 2.9 menunjukkan output SPSS dihasilkan . Ini dimulai dengan sejumlah statistik deskriptif untuk setiap kelompok . ( Perhatikan bahwa dalam kontras dengan output dalam Tampilan 2.3 kesalahan standar sarana yang diberikan, yaitu , standar deviasi dari umur dibagi dengan akar kuadrat dari ukuran sampel kelompok . ) Bagian berikutnya dari layar memberikan hasil penerapan dua versi dari sampel independen t -test , yang pertama adalah bentuk biasa , berdasarkan asumsi varians yang sama pada kedua kelompok (yaitu , homogenitas varians ) , Statistik GrupDiet N Berarti Std . Deviasi Std . kesalahanberartiumur pada hari Dibatasi dietAd libitum diet 106 89 968,75684,01 284,580134,084 27,64114,213Independent Sampel UjiUji Levene untuk Kesetaraan Varians t -test untuk Kesetaraan MeansF Sig . t df Sig . ( 2 - tailed) BerartiPerbedaan Std . Perbedaan Keyakinan Kesalahan 95 %Interval PerbedaanTurunkan atasumur pada hari varians Sama diasumsikanVarians yang sama tidak dianggap 33,433 .000 8,6649,161 193154,940 .000.000 284,73284,73 32,86631,081 219,912223,337 349,556346,131 Tampilan 2,9 Independent sampel keluaran t-test .yang kedua memungkinkan varians untuk berbeda ( versi dari tes ini adalah dijelaskan secara rinci dalam Everitt dan Rabe - Hesketh , 2001) .Hasil yang diberikan pada baris pertama ( t = 8,7 , df = 193 , p < 0,001 ) , di bawah judul kolom " t -test untuk Kesetaraan Berarti " adalah mereka untuk t - tes standar dan menganggap homogenitas varians . Kesimpulan dari tes ini adalah bahwa ada bukti kuat dari perbedaan dalam rata-rata umur di bawah dua rezim diet. Produksinya lagi memberikan perkiraan untuk perbedaan berarti dalam rentang hidup antara kedua diet ( 284,7 hari ) , dan menggunakan standard error estimator ini ( 32,9 hari ) untuk membangun CI 95 % untuk perbedaan rata-rata ( 219,9-349,6 hari ) . Rata-rata umur pada kelompok diet terbatas antara sekitar 220 dan 350 hari lebih lama dibanding nilai yang sesuai dalam makanan ad libitum .The " Independent Sampel Test" tabel juga mencakup uji signifikansi statistik yang diusulkan oleh Levene ( 1960 ) untuk menguji hipotesis nol bahwa varians dalam dua kelompok adalah sama . Dalam hal ini , tes menunjukkan bahwa ada perbedaan yang signifikan dalam ukuran dalam variansi diet ( p < 0,001 ) . Akibatnya, mungkin lebih tepat di sini untuk menggunakan versi alternatif dari t - tes yang diberikan di baris kedua dari tabel . Versi uji-t menggunakan varians terpisah daripada varians dikumpulkan untuk membangun standard error dan mengurangi derajat kebebasan untuk menjelaskan

Page 9: Bab 2 data deskripsi dan inferensial

varians ekstra diperkirakan ( untuk rincian lengkap , lihat Everitt dan Rabe - Hesketh , 2001 ) . Kesimpulan dari menggunakan kedua jenis t -test hampir identik dalam kasus ini .Karena analisis sebelumnya menunjukkan ada beberapa bukti kelainan dalam data rentang hidup , mungkin berguna untuk melihat hasil tes nonparametrik yang tepat yang tidak bergantung pada asumsi ini . SPSS memasok Mann - Whitney U -test ( juga dikenal sebagai Wilcoxon rank sum test ) , tes untuk membandingkan lokasi distribusi dari dua kelompok berdasarkan jajaran pengamatan ( lihat Kotak 2.2 untuk rincian ) . Uji nonparametrik tersebut dapat diakses di SPSS menggunakanAnalisa - Tes Nonparametrikdari menu bar . Memilih Dua Sampel Independen kemudian pasokan kotak Dialog ditunjukkan dalam Tampilan 2.10 . Pengaturan ini analoguous bagi mereka untuk sampel independen t -test .Output yang dihasilkan ditunjukkan pada Tampilan 2.11 . Semua pengamatan peringkat seolah-olah mereka dari sampel tunggal dan Wilcoxon W uji statistik adalah jumlah tingkat dalam kelompok yang lebih kecil . SPSS menampilkan jumlah tingkat bersama-sama dengan pangkat berarti sehingga nilai-nilai dapat dibandingkan antara kelompok . Secara default , software menggunakan pendekatan normal (tapi lihat juga Latihan 2.4.5 ) . Mann- Whitney ( z = 8,3 , p < 0,001 ) juga menunjukkan perbedaan kelompok yang signifikan secara konsisten dengan hasil awal dari uji-t .2.3.2 Suami dan IstriData pada Tabel 2.2 dapat diketik langsung ke Data View spreadsheet seperti yang ditunjukkan pada Tampilan 2.12 . Dalam kumpulan data , adalah penting untuk menghargai " dipasangkan " sifat usia yang timbul dari setiap pasangan . Agar SPSS untuk berurusan dengan struktur dipasangkan tepat , usia pada perkawinan dari Peringkatdiet N Berarti Sum Rank Peringkatumur pada hari Dibatasi dietLibitum diet adJumlah 10689195 128,85 61,25 13658,505.451,50Statistik tesjangka hidupdalam hariMann- Whitney UWilcoxon WZAsymp . Sig . ( 2 - tailed) 1.446,5005451.500-8,332.000a . Pengelompokan Variabel : diet Tampilan 2.11 output yang dihasilkan oleh perintah di Layar 2.10 .suami dan istrinya harus muncul dalam baris yang sama . Untuk tujuan identifikasi , hal ini berguna untuk memasukkan beberapa nomor.Seperti pada contoh sebelumnya , langkah pertama dalam analisis data tersebut akan menghitung ringkasan statistik untuk masing-masing dari dua variabel , usia kawin suami dan usia saat menikah istri . Contoh ini berbeda dari yang sebelumnya bahwa unit pengamatan , yaitu, pasangan suami istri, tidak jatuh ke dalam dua kelompok . Sebaliknya , kita memiliki dua hasil usia. Oleh karena itu , kali ini kita pilih perintah 

Page 10: Bab 2 data deskripsi dan inferensial

Analisa - Statistik Deskriptif - Frekuensi ...dari menu bar untuk memungkinkan kita untuk menghitung beberapa langkah ringkasan untuk kedua variabel usia (Display 2.13 ) .Tampilan 2.14 menunjukkan output yang dihasilkan . Median usia saat perkawinan suami adalah 29 tahun , yang istri sedikit lebih rendah pada 27 tahun . Ada variabilitas yang cukup baik di usia suami dan istri , seperti yang mereka lakukan mulai dari remaja akhir ke awal 70-an .Pertanyaan pertama yang ingin kita mengatasi tentang data ini adalah apakah ada bukti perbedaan sistematis dalam usia suami dan istri . Secara keseluruhan , istri yang lebih muda di pernikahan dalam sampel kami . Mungkinkah perbedaan ini diamati terjadi secara kebetulan ketika perbedaan usia yang khas antara suami dan istri di Cumberland County adalah nol ?  Differen Stem - and- Leaf Plot Frekuensi Stem & Leaf     5.00 -7 . 00000     1.00 -6 . 0     4.00 -5 . 0000     4.00 -4 . 0000 1,00 -3 . 0     4,00 -2 . 0000     8,00 -1 . 00000000 .00 -0 .     6.00 0 . 000000    20.00 1 . 00000000000000000000    15.00 2 . 000000000000000     6.00 3 . 000000     4,00 4 . 0000     4.00 5 . 0000 2.00 6 . 00 4.00 7 . 0000     2.00 8 . 00     2.00 9 . 00     1.00 10 . 0     7.00 Ekstrem ( > = 12,0 ) Lebar Stem : 1.00 Setiap daun : 1 kasus ( s ) Tampilan 2.15 petak Stem - and-leaf untuk perbedaan usia.Kemungkinan untuk menjawab pertanyaan ini adalah sampel uji-t berpasangan ( lihat Kotak 2.1 ) . Ini pada dasarnya adalah sebuah ujian apakah , dalam populasi , perbedaan usia suami dan istri pada pasangan menikah memiliki rata-rata nol . Tes mengasumsikan bahwa perbedaan populasi memiliki distribusi normal . Untuk menilai asumsi ini , pertama-tama kita perlu menghitung perbedaan usia masing-masing pasangan dalam sampel kami . Kami menyertakan variabel baru , differen , dalam kami Lihat Data spreadsheet dengan menggunakan perintah Compute dengan rumus differen = suami - istri ( lihat Bab 1 , Layar 1,13 ) .Perbedaan yang diamati sekarang dapat diperiksa dalam berbagai cara , termasuk menggunakan kotak plot atau histogram seperti yang dijelaskan sebelumnya . Namun untuk menghindari pengulangan di sini , kita akan menggunakan plot batang - dan - daun . SPSS memasok plot dari Jelajahi kotak seperti yang ditunjukkan dalam Tampilan 2.2 . Dalam kasus ini , Daftar Dependent hanya berisi perbedaan variabel , Daftar Faktor dibiarkan kosong dan pilihan Stem - and-leaf yang dipilih dalam Plot kotak sub - dialog . Hasil plotting diberikan dalam Tampilan 2.15 .Plot batang - dan - daun mirip dengan histogram diputar oleh 90R . Namun , di samping bentuk distribusi , juga mencantumkan nilai yang sebenarnya diambil oleh setiap pengamatan , dengan memisahkan setiap nomor menjadi " induk " yang cocok dan " daun . " Dalam contoh yang disajikan di sini , semua daun adalah nol hanya karena usia diukur hanya untuk tahun terdekat . Kita melihat

Page 11: Bab 2 data deskripsi dan inferensial

bahwa perbedaan usia berkisar antara -7 tahun (yaitu , istri adalah 7 tahun lebih muda dari suami karena kita menghitung perbedaan sebagai usia suami dikurangi usia istri ) sampai 10 tahun dengan 12 perbedaan usia menjadi " ekstrim " ( yaitu , > 12 tahun ) . Mengesampingkan pengamatan ekstrim, distribusi terlihat normal , namun masuknya nilai-nilai yang membuat penampilan positif miring .Jika kita puas bahwa perbedaan usia memiliki setidaknya distribusi normal perkiraan , kita dapat melanjutkan untuk menerapkan sampel t -test berpasangan dengan menggunakanAnalisa - Bandingkan Sarana - Pasangan- Samples T Test ...perintah dari menu bar seperti yang ditunjukkan pada Tampilan 2.16 . Daftar Variabel Paduan membutuhkan pasang variabel yang akan dibandingkan . Memilih Pilihan memungkinkan untuk menetapkan tingkat signifikansi pengujian .Tampilan 2.17 menunjukkan output yang dihasilkan . Adapun sampel independen ttest , SPSS menampilkan statistik yang relevan deskriptif , p-value yang berkaitan dengan uji statistik , dan interval kepercayaan untuk selisih rata-rata . Hasil penelitian menunjukkan bahwa ada perbedaan yang signifikan dalam usia rata-rata di pernikahan pria dan wanita dalam pasangan yang sudah menikah ( t ( 99 ) = 3,8 , p < 0,001 ) . Interval kepercayaan menunjukkan perbedaan usia adalah suatu tempat antara satu dan tiga tahun . Paduan Statistik SampelBerarti N Std . Deviasi Std . kesalahanberartiPasangan usia 1 suami 'di pernikahanusia istri 'di pernikahan 33,080031,1600 100100 12.3105 311,00479 1,231051,10048Paduan Sampel KorelasiN Korelasi Sig .' Usia saat menikah & istri ' pasangan suami 1 usia pada perkawinan 100 0,912 .000Paduan Sampel UjiPaduan Perbedaan t df Sig . ( 2 - tailed)Berarti Std . Deviasi Std . kesalahanBerarti 95 % Confidence Interval dariperbedaanTurunkan atas' Usia saat menikah - istri ' pasangan suami 1 usia pada perkawinan 1,9200 5,04661 .50466 .9186 2,9214 3,805 99 .000

Tampilan 2.17 Paduan sampel keluaran t -test untuk usia pada perkawinan .Jika kita tidak bersedia menanggung normalitas untuk perbedaan usia, kita dapat menggunakan prosedur nonparametrik seperti Wilcoxon menandatangani peringkat tes ( lihat Kotak 2.2 ) daripada sampel uji-t berpasangan . Tes ini dapat digunakan oleh memilih pertamaAnalisa - Tes Nonparametrik - Dua Sampel Terkait ...dari menu bar dan kemudian menyelesaikan kotak dialog yang dihasilkan seperti yang ditunjukkan pada Tampilan 2.18 .Tampilan 2.19 menunjukkan output SPSS dihasilkan . Signed ranks test Wilcoxon peringkat nilai absolut dari perbedaan dan kemudian menghitung jumlah tingkat dalam kelompok pasangan yang awalnya menunjukkan perbedaan positif atau negatif . Di sini , 67 pasangan menunjukkan perbedaan negatif ( yang menurut legenda tabel pertama berarti bahwa istri ' usia yang lebih muda dari suami ' usia , karena SPSS menghitung perbedaan sebagai usia istri dikurangi usia suami ) , 27 perbedaan

Page 12: Bab 2 data deskripsi dan inferensial

positif dan enam pasangan tidak perbedaan usia . Perbedaan negatif memiliki peringkat rata-rata lebih besar daripada perbedaan positif. Konsisten dengan pasangan- sampel t -test , tes menunjukkan bahwa perbedaan usia rata-rata laki-laki dan perempuan dalam pasangan yang sudah menikah tidak nol ( z = 3,6 , p < 0,001 ) .Pendekatan normal untuk uji Wilcoxon adalah tepat ketika jumlah pasangan besar dan nilai-nilai perbedaan yang dapat peringkat unik . Dalam contoh kita , usia dicatat dalam tahun penuh dan ada banyak hubungan dalam variabel perbedaan - misalnya , dalam 20 pasangan , yang Tampilan 2.18 Menghasilkan Wilcoxon signed ranks test .PeringkatN Berarti Sum Rank Peringkat' usia saat menikah - suami ' istri usia pada perkawinan Peringkat NegatifPeringkat positifdasiJumlah 67a27b6c100 47.5247.44 3.184,001.281,00a . ' usia pada perkawinan < suami ' istri usia pada perkawinanb . ' usia saat menikah > suami ' istri usia pada perkawinanc . ' usia saat menikah istri = ' suami usia pada perkawinan Uji Statisticsbusia istri 'pada perkawinan -usia suami 'di pernikahanZAsymp . Sig . ( 2 - tailed) - 3.605a.000a . Berdasarkan peringkat yang positif .b . Wilcoxon Signed Ranks Uji Tampilan ditandatangani jajaran output tes 2.19 Wilcoxon untuk usia pada perkawinan . Suami adalah satu tahun lebih tua dari istrinya . Akibatnya, pendekatan ini mungkin tidak berlaku ketat - untuk alternatif yang mungkin lihat Latihan 2.4.5 .Terakhir , kita akan ujian hubungan antara usia suami dan istri dari pasangan dalam data kami dan mengukur kekuatan hubungan ini . Sebuah sebar ( plot xy dari dua variabel ) sering memberikan tampilan grafis yang berguna tentang hubungan antara dua variabel . Plot diperoleh dari menu bar dengan memilihGrafik - Menyebarkan ... - sebar Sederhanadan mendefinisikan daftar variabel seperti yang ditunjukkan pada Tampilan 2.20 .Tidak mengherankan, yang dihasilkan sebar ( ditunjukkan dalam Tampilan 2.21 ) menggambarkan kecenderungan (setidaknya dalam sampel kami ) bagi perempuan muda untuk menikah laki-laki muda dan sebaliknya . Seringkali berguna untuk meningkatkan scatterplots dengan menunjukkan fit regresi linier sederhana untuk dua variabel ( lihat nanti ) . Bahkan lebih berguna dalam banyak kasus adalah dengan menambahkan apa yang dikenal sebagai fit regresi lokal tertimbang ( atau kurva Lowess ) untuk plot . Yang terakhir ini memungkinkan data untuk mengungkapkan bentuk hubungan antara dua zaman daripada berasumsi bahwa ini adalah linier , teknik ini dijelaskan secara rinci di Cleveland ( 1979) . Di sini , kurva Lowess dapat ditambahkan ke grafik dengan mengedit grafik awal dan memilih

Page 13: Bab 2 data deskripsi dan inferensial

Chart - Pilihan Usia Istri ' ( tahun ) Tampilan grafik Menyebarkan 2.21 suami 'dan istri ' usia kawin .  Usia Istri ' ( tahun ) Tampilan grafik pencar 2.23 Peningkatan yang dihasilkan dari perintah di Layar 2.22 .dari Bagan Editor menu bar . Hal ini menciptakan kotak dialog yang lain yang perlu diisi seperti yang ditunjukkan dalam Tampilan 2.22 . Yang dihasilkan ditingkatkan plot ditunjukkan pada Tampilan 2.23 . Kami akan kembali ke petak di bawah ini .Kita dapat mengukur hubungan antara usia dengan perkawinan dari suami dan istri dalam setiap pasangan dengan menghitung beberapa jenis koefisien korelasi . SPSS menawarkan beberapa bawahAnalisa - Berkorelasi - bivariat ...Di sini , hanya untuk ilustrasi , kita pilih semua koefisien yang tersedia (Display 2.24 ) . Daftar Variabel berisi nama-nama variabel yang berkorelasi - di mana lebih dari dua variabel yang terdaftar , matriks koefisien korelasi berpasangan akan dihasilkan ( lihat Bab 4 ) . Dalam contoh ini , output yang dihasilkan , meskipun agak panjang , cukup sederhana (Display 2.25 ) , pada dasarnya memberikan nilai tiga koefisien korelasi - korelasi Pearson ( r = 0,91 ) , Spearman rho ( V = 0,90 ) , dan versi Kendall tau ( X = 0,76 ) . ( Semua koefisien korelasi dijelaskan dan didefinisikan dalam Everitt , 2001. )Perkiraan ini disertai dengan nilai-p dari uji signifikansi statistik yang menguji hipotesis nol bahwa korelasi dalam populasi yang mendasari adalah nol - yaitu , bahwa tidak ada hubungan yang terarah. di sini kami memilih untuk mempertimbangkan hipotesis alternatif dua sisi bahwa ada korelasi, positif atau negatif . Untuk " parametrik " koefisien korelasi Pearson , uji ini bergantung pada asumsi normalitas bivariat untuk dua variabel . Tidak ada asumsi distribusi diperlukan untuk menguji Spearman rho atau tau Kendall . Tapi , seperti yang kita harapkan , tes pada masing-masing tiga koefisien menunjukkan bahwa korelasi antara usia suami dan istri dalam pernikahan sangat signifikan ( p - nilai dari ketiga tes kurang dari 0,001 ) .Kurva mulus dipasang ditunjukkan dalam Tampilan 2.23 menunjukkan bahwa hubungan linier antara ' usia dan istri ' suami usia adalah asumsi yang masuk akal . Kita dapat menemukan rincian ini cocok dengan menggunakan perintahAnalisa - Regresi - Linear ...Ini akan membuka kotak dialog Regresi Linear yang kemudian diselesaikan seperti yang ditunjukkan pada Tampilan 2.26 . (Di sini usia suami digunakan sebagai variabel dependen untuk menilai apakah itu dapat diprediksi dari usia istri . ) SPSS menghasilkan sejumlah tabel dalam jendela output yang akan kita bahas secara rinci dalam Bab 4 . Untuk saat ini kami berkonsentrasi pada tabel estimasi koefisien regresi ditunjukkan dalam Tampilan 2.27 .Output Tabel ini menyajikan perkiraan koefisien regresi dan kesalahan standar mereka dalam kolom berlabel " B " dan " Std . Kesalahan , " masing-masing.a) " parametrik " koefisien korelasikorelasi' usia di istri perkawinan ' suami usia pada perkawinanusia suami 'di pernikahan Pearson CorrelationSig . ( 2 - tailed)N 1.

Page 14: Bab 2 data deskripsi dan inferensial

100 0,912 **.000100usia istri 'di pernikahan Pearson CorrelationSig . ( 2 - tailed)N 0,912 **.000100 1.100** . Korelasi signifikan pada tingkat 0,01 ( 2 - tailed) .b ) "Non - parametrik " koefisien korelasi Korelasi' usia di istri perkawinan ' suami usia pada perkawinanUsia Kendall tau_b suami 'di pernikahan Koefisien KorelasiSig . ( 2 - tailed)N 1.000.100 0,761 **.000100usia istri 'di pernikahan Koefisien KorelasiSig . ( 2 - tailed)N 0,761 **.000100 1.000.100Usia Spearman rho suami 'di pernikahan Koefisien KorelasiSig . ( 2 - tailed)N 1.000.100 0,899 **.000100usia istri 'di pernikahan Koefisien KorelasiSig . ( 2 - tailed)N 0,899 **.000100 1.000.100** . Korelasi signifikan pada tingkat .01 ( 2 - tailed) . Tampilan 2,25 Korelasi antara suami 'dan istri ' usia pada perkawinan .Tabel tersebut juga memberikan lain t -test untuk menguji hipotesis nol bahwa koefisien regresi adalah nol . Dalam contoh ini , seperti yang terjadi di sebagian besar aplikasi , kami tidak tertarik pada mencegat . Sebaliknya, parameter kemiringan memungkinkan kita untuk menilai apakah suami ' usia kawin diprediksi dari istri ' usia kawin . Yang sangat kecil p - nilai yang terkait dengan uji tersebut memberikan bukti yang jelas bahwa koefisien regresi berbeda dari nol . Ukuran dari koefisien regresi estimasi menunjukkan bahwa untuk setiap tahun tambahan usia istri saat menikah, usia suami juga meningkat sebesar satu tahun ( untuk komentar lebih lanjut tentang menafsirkan koefisien regresi lihat

Page 15: Bab 2 data deskripsi dan inferensial

Bab 4 ) . CoefficientsaModel unstandardixedkoefisien StandarKoefisien t Sig .B Std . kesalahan Beta1 ( Constant )usia istri ' pada perkawinan 1.2801,021 1,5280,046 0,912 0,83722,053 0,404.000a . Usia suami 'di pernikahan : Dependent Variable Tampilan 2,27 estimasi koefisien regresi untuk usia pada perkawinan .2.4 Latihan2.4.1 Menebak Lebar Hall KuliahTak lama setelah satuan metrik panjang secara resmi diperkenalkan di Australia , sekelompok 44 siswa diminta untuk menebak , ke meter terdekat , lebar ruang kuliah di mana mereka duduk . Kelompok lain dari 69 siswa di ruangan yang sama diminta untuk menebak lebar di kaki , ke kaki terdekat ( Tabel 2.3 ) . ( Yang benar lebar hall adalah 13,1 meter atau 43 kaki . ) Selidiki dengan menggunakan tampilan grafis sederhana atau cara lain yang kelompok memperkirakan lebar ruang kuliah lebih akurat .Tabel 2.3 menebak dari Lebar Hall Kuliah a) dalam meter ( n = 44 )8 9 10 10 10 10 10 10 11 11 11 11 12 12 13 13 13 14 14 14 15 15 15 15 15 15 15 15 16 16 16 17 17 17 17 18 18 20 22 25 27 35 38 40b ) dalam kaki ( n = 69 )24 25 27 30 30 30 30 30 30 32 32 33 34 34 3435 35 36 36 36 37 37 40 40 40 40 40 40 40 4040 41 41 42 42 42 42 43 43 44 44 44 45 45 4545 45 45 46 46 47 48 48 50 50 50 51 54 54 54 55 55 60 60 63 70 75 80 94 Sumber : Hand et al , 1994 . .2.4.2 Lebih lanjut mengenai rentang hidup Tikus : Signifikansi Pengujian Asumsi ModelDalam Bagian 2.3.1 , kami menggunakan beberapa ringkasan statistik dan prosedur grafis untuk menilai asumsi Distribusi normal dalam setiap kelompok Homogenitas variansuntuk rentang hidup tikus yang diberikan dalam Tabel 2.1 . Gunakan uji signifikansi formal untuk menilai ini model asumsi , khusus : Gunakan tes Kolmogorov - Smirnov ( untuk rinciannya, lihat Conover , 1998 ) untuk menguji hipotesis nol bahwa rentang hidup dalam setiap kelompok mengikuti distribusi normal . Gunakan tes Levene ( Levene , 1960) untuk menguji hipotesis nol bahwa varians dari rentang hidup adalah sama pada kedua kelompok .( Petunjuk : Gunakan perintah Analisa - Statistik Deskriptif - Jelajahi dan Plot ... box sub - dialog untuk menghasilkan tes Kolmogorov - Smirnov dan uji Levene . )2.4.3 Pencurian Kendaraan Bermotor di ASData dalam Tabel 2.4 menunjukkan tingkat pencurian kendaraan bermotor di negara bagian di AS (dalam pencurian per 100.000 penduduk ) , dibagi menjadi dua kelompok tergantung pada apakah

Page 16: Bab 2 data deskripsi dan inferensial

negara-negara yang terletak di timur atau barat dari MississippiTabel 2.4 Pencurian Kendaraan Bermotor di ASTimur Negara ( n = 26 ) Pencurian Tingkat Negara Barat ( n = 24 ) Pencurian TingkatAlabama 348 565 AlaskaConnecticut 731 Arizona 863Delaware 444 Arkansas 289Florida 826 California 1016Georgia 674 Colorado 428Illinois 643 Hawaii 381Indiana 439 Idaho 165Kentucky 199 Iowa 170Maine 177 Kansas 335Maryland 709 Louisiana 602Massachusetts 924 Minnesota 366Michigan 714 Missouri 539Mississippi 208 Montana 243New Hampshire 244 Nebraska 178New Jersey 940 Nevada 593New York 1043 New Mexico 337North Carolina North Dakota 284 133Ohio 491 Oklahoma 602Pennsylvania 506 Oregon 459Rhode Island 954 South Dakota 110Carolina Selatan 386 Texas 909Tennessee 572 Utah 238Vermont 208 Washington 447Virginia 327 Wyoming 149Virginia Barat 154Wisconsin 416Sumber : Rossman , 1996. Dengan izin dari Springer -Verlag .River. Buat kotak plot tingkat pencurian untuk negara-negara Timur dan Barat , dan menerapkan uji signifikansi tepat untuk menentukan apakah tingkat rata-rata berbeda di dua lokasi .2.4.4 Anorexia nervosa TerapiTabel 2.5 berisi pengukuran berat pada sekelompok gadis anoreksia yang menerima terapi kognitif - perilaku ( CBT ) . Berat diukur dalam pound sebelum pengobatan dan setelah 12 minggu pengobatan .Tabel 2.5 Bobot ( Pounds ) dari anoreksia PerempuanSebelum Terapi Setelah 12 Minggu80,5 82,284,9 85,681,5 81,482,6 81,979,9 76,488,7 103,694,9 98,476,3 93,481 73.480,5 82,185 96.789,2 95,381,3 82,476,5 72,5

Page 17: Bab 2 data deskripsi dan inferensial

70 90,980,4 71,383,3 85,483 81,687,7 89,184,2 83,986,4 82,776,5 75,780,2 82,687,8 100,483,3 85,279,7 83,684,5 84,680,8 96,287,4 86,7 Dengan asumsi normalitas perubahan berat badan , gunakan sampel berpasangan kotak t-test untuk menghasilkan CI 95 % untuk perubahan berat badan rata-rata dari waktu ke waktu . Menghasilkan hasil yang sama melalui satu - sample t-test untuk menguji hipotesis nol bahwa perubahan berat badan rata-rata kelompok adalah nol . Menilai apakah ada pelacakan dalam data , yaitu , apakah gadis-gadis yang mulai pada berat badan rendah juga cenderung memiliki berat badan yang relatif rendah setelah terapi ?2.4.5 Lebih lanjut mengenai Suami dan Istri : Exact Tes NonparametrikUji nonparametrik untuk membandingkan kelompok yang beroperasi pada jajaran menggunakan perkiraan yang normal untuk menghasilkan nilai- p . Pendekatan yang digunakan oleh SPSS adalah tepat ketika ukuran sampel besar (katakanlah n > 25 ) dan tidak ada ikatan . Untuk Mann - Whitney U -test , asumsi kedua berarti bahwa setiap pengamatan hanya terjadi sekali dalam kumpulan data sehingga seluruh sampel dapat peringkat unik . Untuk Wilcoxon signed ranks test , asumsi ini menyatakan bahwa perbedaan mutlak antara pengamatan dipasangkan dapat peringkat unik . Ketika hanya ada beberapa ikatan dalam sampel yang besar , pendekatan normal mungkin masih digunakan . Namun, ketika sampel kecil atau ada banyak ikatan , tes yang tepat - tes yang tidak bergantung pada perkiraan - adalah lebih tepat ( Conover , 1998) .SPSS menyediakan tepat Mann - Whitney U - Wilcoxon tes dan tepat ditandatangani tes jajaran dari kotak sub - dialog Exact Two - Independent - Sampel Tes (lihat Tampilan 2.10 ) atau dua - Terkait - Sampel Tes kotak dialog (lihat Tampilan 2.18) . Tes-tes yang tepat beroperasi dengan membangun distribusi dari statistik uji di bawah hipotesis nol dengan permutasi dari kasus atau pasangan . Prosedur ini komputasi intensif karena mengevaluasi semua kemungkinan permutasi . SPSS menetapkan batas waktu dan menawarkan untuk sampel satu set permutasi . Dalam kasus terakhir , SPSS mengevaluasi ketepatan p - nilai dengan interval kepercayaan .Pada usia di Data pernikahan set ( Tabel 2.2 ) , usia suami dan istri tercatat dalam tahun penuh dan ada banyak hubungan dalam variabel perbedaan - misalnya , nilai perbedaan satu ( orang yang satu tahun lebih tua dari nya istri ) telah diamati selama 20 pasangan . Ini akan , oleh karena itu, lebih baik tidak menggunakan pendekatan normal sebelumnya bekerja di Layar 2.20 . Kembali menghasilkan sebuah Wilcoxon signed ranks test untuk usia di Data pernikahan - kali ini menggunakan versi yang tepat dari tes.