Download pdf - satatistik deskriptif

Transcript

Statistik Diskriptif

Statistik DiskriptifRWD (Minggu ke-3)Bahasan Statistika DeskriptifDistribusi frekuensiPenyajian grafikKesetangkupan & KemenjuluranKaidah EmpirikPersentil, Desil, Kuartil

STATISTIKA :Kegiatan untuk : mengumpulkan data menyajikan data menganalisis data dengan metode tertentu menginterpretasikan hasil analisisKEGUNAAN?STATISTIKA DESKRIPTIF :Berkenaan dengan pengumpulan, pengolahan, dan penyajian sebagianatau seluruh data (pengamatan) tanpa pengambilan kesimpulanSTATISTIKA INFERENSI :Setelah data dikumpulkan, maka dilakukan berbagai metode statistik untukmenganalisis data, dan kemudian dilakukan interpretasi serta diambil kesimpulan.Statistika inferensi akan menghasilkan generalisasi (jika sampel representatif)Melalui fasedan fase1. Konsep Statistika3RWD (Minggu ke-3)Distribusi FrekuensiPembagian data menurut besarnya nilai dan banyaknya observasi.

Disajikan dalam bentuk tabel & grafik (histogram & Poligon).

Definisi resmi : penyusunan suatu data mulai dari yg terkecil sampai terbesar yang membagi banyaknya data ke dalam beberapa kelas.

RWD (Minggu ke-3)Distribusi FrekuensiKegunaan : Memudahkan dalam penyajian dataMemudahkan pemahamanMemudahkan pembacaan data

Jenis :Distribusi frekuensi kategori (pengelompokkan data berbentuk kata-kata).Distribusi frekuensi numerik (pengelompokkan data berbentuk angka-angka).

RWD (Minggu ke-3)Distribusi FrekuensiKategoriNumerik

Pengeluaran (Rp)Frekuensi2.000.000 2.999.99933.000.000 3.999.9994Asal MahasiswaFrekuensiDKI300Jabar450

RWD (Minggu ke-3)Distribusi FrekuensiIstilah-istilah Kelas (kelompok) : tiap-tiap bagian dataFrekuensi : banyaknya observasi tiap kelasLower limit (batas bawah): nilai terendah tiap kelasUpper limit (batas atas): nilai tertinggi tiap kelasTepi bawah ( lower boundaries) : ujung dari batas bawahTepi atas ( upper boundaries) : ujung dari batas atasTitik tengah (mid point) : nilai tengah tiap kelasJarak kelas (interval kelas) : jarak antara tepi bawah dan tepi atas.

RWD (Minggu ke-3)Distribusi FrekuensiLangkah-langkah pembuatan distribusi frekuensi :Urutkan data dari terkecil hingga terbesar.Menghitung jarak atau rentangan ( R ) :R = data tertinggi data terendahc. Menghitung jumlah kelas (K) :K = 1 + 3,3 log n (n = jml data)d. Menghitung panjang kelas interval (P) :P = R / KMenentukan batas data terendah (ujung data pertama), kmdn hitung kelas interval (jumlahkan ujung bawah kelas + P, hasilnya dikurangi 1)Membuat tabel sementara dengan cara dihitung satu demi satu sesuai dengan urutan interval kelas.Membuat tabel distribusi frekuensi.

RWD (Minggu ke-3)Distribusi FrekuensiLangkah-langkah menyusun distribusi frekuensi (ref : Walpole) :Lihat Walpole hal. 51

2. Statistika & Metode IlmiahMETODE ILMIAH :Adalah salah satu cara mencari kebenaran yang bila ditinjau dari segi penerapannya, resiko untuk keliru paling kecil.LANGKAH-LANGKAH DALAM METODE ILMIAH :Merumuskan masalahMelakukan studi literaturMembuat dugaan-dugaan, pertanyaan-pertanyaan atau hipotesis

Mengumpulkan dan mengolah data, menguji hipotesis, atau menjawab pertanyaan

Mengambil kesimpulanPERAN STATISTIKAINSTRUMENSAMPELVARIABELSIFAT DATAMETODE ANALISIS103. DataDATA terbagi atas DATA KUALITATIF dan DATA KUANTITATIFDATA KUALITATIF :Data yang dinyatakan dalam bentuk bukan angka.Contoh : jenis pekerjaan, status marital, tingkat kepuasan kerjaDATA KUANTITATIF :Data yang dinyatakan dalam bentuk angkaContoh : lama bekerja, jumlah gaji, usia, hasil ulanganDATAJENISDATANOMINALORDINALINTERVALRASIOKUALITATIFKUANTITATIF114. DataDATA NOMINAL :Data berskala nominal adalah data yang diperoleh dengan cara kategorisasi atau klasifikasi.CIRI : posisi data setara tidak bisa dilakukan operasi matematika (+, -, x, :)CONTOH : jenis kelamin, jenis pekerjaanDATA ORDINAL :Data berskala ordinal adalah data yang dipeoleh dengan cara kategorisasi atau klasifikasi, tetapi di antara data tersebut terdapat hubunganCIRI : posisi data tidak setara tidak bisa dilakukan operasi matematika (+, -, x, :)CONTOH : kepuasan kerja, motivasiDATA INTERVAL :Data berskala interval adalah data yang diperoleh dengan cara pengukuran, di mana jarak antara dua titik skala sudah diketahui.CIRI : Tidak ada kategorisasi bisa dilakukan operasi matematikaCONTOH : temperatur yang diukur berdasarkan 0C dan 0F, sistem kalenderDATA RASIO :Data berskala rasio adalah data yang diperoleh dengan cara pengukuran, di mana jarak antara dua titik skala sudah diketahui dan mempunyai titik 0 absolut.CIRI : tidak ada kategorisasi bisa dilakukan operasi matematikaCONTOH : gaji, skor ujian, jumlah buku125. Pengolahan DataPROSEDUR PENGOLAHAN DATA :

PARAMETER : Berdasarkan parameter yang ada statistik dibagi menjadi

Statistik PARAMETRIK : berhubungan dengan inferensi statistik yang membahas parameter-parameter populasi; jenis data interval atau rasio; distribusi data normal atau mendekati normal.

Statistik NONPARAMETRIK : inferensi statistik tidak membahas parameter-parameter populasi; jenis data nominal atau ordinal; distribusi data tidak diketahui atau tidak normal JUMLAH VARIABEL : berdasarkan jumlah variabel dibagi menjadi

Analisis UNIVARIAT : hanya ada 1 pengukuran (variabel) untuk n sampel atau beberapa variabel tetapi masing-masing variabel dianalisis sendiri-sendiri. Contoh : korelasi motivasi dengan pencapaian akademik.

Analisis MULTIVARIAT : dua atau lebih pengukuran (variabel) untuk n sampel di mana analisis antar variabel dilakukan bersamaan. Contoh : pengaruh motivasi terhadap pencapaian akademik yang dipengaruhi oleh faktor latar belakang pendidikan orang tua, faktor sosial ekonomi, faktor sekolah. 136. Pengolahan DataMULAIJumlahVariabel ?AnalisisUnivariatAnalisisMultivariatJenisData ?StatistikParametrikStatistikNon ParametrikSATUDUA / LEBIHINTERVALRASIONOMINALORDINAL147. Penyajian DataTABEL

GRAFIK

158. Membuat TabelTABEL : memberikan informasi secara rinci. Terdiri atas kolom dan barisTABELKOLOMKolom pertama : LABELKolom kedua . n : Frekuensi atau label BARISBerisikan data berdasarkan kolomBidang pekerjaanPrestasi KerjaJumlahSangat jelekJelek Cukup baikBaik Sangat baikAdministrasiPersonaliaProduksiMarketingKeuanganJumlahTabel Tabulasi Silang169. Membuat Grafik GRAFIK : memberikan informasi dengan benar dan cepat, tetapi tidak rinci. Syarat :Pemilihan sumbu (sumbu tegak dan sumbu datar), kecuali grafik lingkaranPenetapan skala (skala biasa, skala logaritma, skala lain)Ukuran grafik (tidak terlalu besar, tinggi, pendek)Sumbu tegak12341234Sumbu datar0TitikpangkalJenis Grafik :

Grafik Batang (Bar)

Grafik Garis (line)

Grafik Lingkaran (Pie)

Grafik Interaksi (Interactive)

17

10. Jenis Grafik Grafik Batang (Bar)Grafik Garis (line)Grafik lingkaran (pie)Grafik Interaksi (interactive)1811. FrekuensiFREKUENSI : banyaknya data untuk satu kelompok/klasifikasiKELOMPOKFREKUENSIKelompok ke-1f1Kelompok ke-2f2Kelompok ke-3f3Kelompok ke-ifiKelompok ke-kfk kn = fi i=1PEKERJAANFREKUENSIAdministrasi18Personalia8Produksi19Marketing27Keuangan1385 kn = fi = f1 + f2 + f3 +.. + fi + + fk i=119DISTRIBUSI FREKUENSI : mengelompokkan data interval/rasio dan menghitung banyaknya data dalam satu kelompok/klasifikasi12. Distribusi FrekuensiMembuat distribusi frekuensi :Mencari sebaran (range) yakni selisih antara data paling besar dengan data paling kecil) 35 20 = 15Menentukan banyak kelas dengan rumus k = 1 + 3,3 log n 7Menentukan panjang kelas dengan rumus p = sebaran / banyak kelas 15/7 = 2KELOMPOK USIAFREKUENSI20 211122 231724 251426 271228 29730 311832 - 33534 - 351USIAFREKUENSI205216221323424725726727528329430153133353512013. Ukuran Tendensi Sentral RATA-RATA : suatu bilangan yang bertindak mewakili sekumpulan bilanganRATA-RATA HITUNG (RERATA) : jumlah bilangan dibagi banyaknyaX1 + X2 + X3 + + Xn n n Xii =1 nX =Bila terdapat sekumpulan bilangan di mana masing-masing bilangannya memiliki frekuensi,maka rata-rata hitung menjadi :X1 f1 + X2 f2 + X3 f3 + + Xkfk f1 + f2 + f3 + + fkX =k Xifii =1 k fii =1 Cara menghitung :Bilangan (Xi) Frekuensi (fi)Xi fi703210635315852170Jumlah10695Maka :X =695 10= 69.52114. Median MEDIAN : nilai tengah dari sekumpulan data setelah diurutkan yang fungsinya membantumemperjelas kedudukan suatu data.Contoh : diketahui rata-rata hitung nilai ulangan dari sejumlah siswa adalah 6.55. Pertanyaannya adalah apakah siswa yang memperoleh nilai 7 termasuk istimewa, baik, atau biasa-biasa saja ? Jika nilai ulangan tersebut adalah : 10 10 8 7 7 6 5 5 5 5 4,maka rata-rata hitung = 6.55, median = 6Kesimpulan : nilai 7 termasuk kategori baik sebab berada di atas rata-rata hitung dan median (kelompok 50% atas)Jika nilai ulangan tersebut adalah : 8 8 8 8 8 8 7 5 5 4 3, maka rata-rata hitung = 6.55, median = 8Kesimpulan : nilai 7 termasuk kategori kurang sebab berada di bawah median (kelompok 50% bawah)Jika sekumpulan data banyak bilangannya genap (tidak mempunyai bilangan tengah)Maka mediannya adalah rerata dari dua bilangan yang ditengahnya.Contoh : 1 2 3 4 5 6 7 8 8 9 maka median (5+6) : 2 = 5.52215. Modus MODUS : bilangan yang paling banyak muncul dari sekumpulan bilangan, yang fungsinya untuk melihat kecenderungan dari sekumpulan bilangan tersebut.Contoh : nilai ulangan 10 10 8 7 7 6 5 5 5 5 4 Maka : s = 6 ; k = 3 ; p =2 rata-rata hitung = 6.55 ; median = 6 modus = 5 ; kelas modus = 5 - 7Nilai Frekuensi1028172615441Jumlah11NilaiFrekuensi8 1035 772 41Jumlah11MoMe+-Kurva positif apabila rata-rata hitung > modus / medianKurva negatif apabila rata-rata hitung < modus / median 2316. Ukuran Penyebaran Rentang (range) : selisih bilangan terbesar dengan bilangan terkecil. Sebaran merupakan ukuran penyebaran yang sangat kasar, sebab hanya bersangkutan dengan bilangan terbesar dan terkecil.A : 100 90 80 70 60 50 40 30 20 10B : 100 100 100 100 100 10 10 10 10 10C : 100 100 100 90 80 30 20 10 10 10Contoh :X = 55r = 100 10 = 90UKURAN YANG MENYATAKAN HOMOGENITAS / HETEROGENITAS :RENTANG (Range)DEVIASI RATA-RATA (Average Deviation)VARIANS (Variance)DEVIASI STANDAR (Standard Deviation)Rata-rata2417. Deviasi rata-rata Deviasi Rata-rata : penyebaran Berdasarkan harga mutlak simpanganbilangan-bilangan terhadap rata-ratanya. Nilai XX - X|X X|100 4545903535802525701515605550-5540-151530-252520-353510-4545Jumlah0250Nilai XX - X|X X|10045451004545100454590353580252530-252520-353510-454510-454510-4545Jumlah0390Kelompok AKelompok BDR = 250 = 25 10DR = 390 = 39 10Makin besar simpangan,makin besar nilai deviasi rata-rataDR = n i=1|Xi X| nRata-rataRata-rata2518. Varians & Deviasi Standar Varians : penyebaran berdasarkan jumlah kuadrat simpangan bilangan-bilangan terhadap rata-ratanya ; melihat ketidaksamaan sekelompok datas2 = n i=1(Xi X)2n-1Deviasi Standar : penyebaranberdasarkan akar dari varians ;menunjukkan keragaman kelompok datas = n i=1(Xi X)2n-1Nilai XX -X(XX)2100 45202590351225802562570152256052550-52540-1522530-2562520-35122510-452025Jumlah8250Nilai XX -X(X X)210045202510045202510045202590351225802562530-2562520-35122510-45202510-45202510-452025Jumlah15850Kelompok AKelompok Bs = 8250 9= 30.28s = 15850 9= 41.97Kesimpulan :Kelompok A : rata-rata = 55 ; DR = 25 ; s = 30.28 Kelompok B : rata-rata = 55 ; DR = 39 ; s = 41.97 Maka data kelompok B lebih tersebar daripada kelompok A2619. Normalitas, Hipotesis, Pengujian Distribusi Normal : kurva berbentuk bel, simetris, simetris terhadap sumbu yang melalui nilai rata-rata +s +2s +3s -s +2s+3s68%95%99% Lakukan uji normalitas Rasio Skewness & Kurtosis berada 2 sampai +2 Rasio =

Jika tidak berdistribusi normal, lakukan uji melalui non parametrik (Wilcoxon, Mann-White, Tau Kendall)Skewness = kemiringanKurtosis = keruncingannilaiStandard error27RWD (Minggu ke-3)UJI NORMALITASSuatu distribusi (sebaran) dikatakan simetrik bila distribusi tersebut dapat dilipat sepanjang suatu sumbu tegak sehingga kedua belahannya saling menutupi.

Suatu distribusi yg tdk setangkup terhadap sumbu tegaknya dikatakan menjulur.

RWD (Minggu ke-3)Menjulur positif, bila menjulur ke sebelah kanan, ekor kanan lebih panjang dari ekor kiri. (lihat Walpole hal 57. Gambar 3.8 a)

Menjulur negatif, bila menjulur ke sebelah kiri, ekor kiri lebih panjang dari ekor kanan.(lihat Walpole hal 57.Gambar 3.8 b)

29RWD (Minggu ke-3)Bagi dist.yg setangkup, nilai tengah & median terletak pd posisi yg sama.

Bila menjulur +, nilai2 besar di ekor kanan tdk terlalu banyak dipengaruhi nilai2 kecil ekor kiri, sehingga nilai tengah lebih besar dari mediannya.

Bila menjulur -, nilai2 kecil di ekor kiri akan membuat nilai tengah lebih kecil dari median.

RWD (Minggu ke-3)Koefisien kemenjuluran PearsonDidefinisikan :

Untuk sebaran yg setangkup sempurna, nilai tengah dan mediannya identik, sehingga nilainya nol.