DESKRIPSI DATA
1
Pendahuluan :2
Sering digunakan peneliti, khususnya dalam memperhatikan perilaku data dan penentuan dugaan-dugaan yang selanjutnya akan diuji dalam analisis inferensi.
Analisis Statistik Deskriptif :3
Sari numerik (ringkasan angka)◦ Menyatakan nilai-nilai penting dalam
statistik meliputi ukuran pemusatan dan dispersi.
Distribusi◦ Menyatakan pola atau model dari
penyebaran data. Pencilan
◦ Menyatakan nilai data yang berada diluar kelompok nilai data yang lainnya.
Sari Numerik (ringkasan angka):
4
Ukuran pemusatan ◦ merupakan ukuran yang menyatakan pusat
dari sebaran data. Ada tiga macam ukuran pemusatan yaitu Rata-rata, Median, dan Modus.
Ukuran penyebaran (dispersi) ◦ adalah ukuran yang dipakai untuk
mengukur tingkat penyebaran data. ◦ Semakin kecil ukuran penyebaran semakin
seragam data tersebut dan semakin besar ukuran penyebaran semakin beragam data tersebut.
5
DISTRIBUSI FREKUENSI
Langkah-langkah Distribusi Frekuensi:
a. Mengumpulkan data
b. Mengurutkan data dari terkecil ke terbesar atau sebaliknya
c. Membuat kategori kelasJumlah kelas k = 1 + 3,322 log ndi mana 2k>n; di mana k= jumlah kelas; n = jumlah data
d. Membuat interval kelasInterval kelas = (nilai tertinggi – nilai terendah)/jumlah kelas
e. Melakukan penghitungan atau penturusan setiap kelasnya
6
DISTRIBUSI FREKUENSI RELATIF
Definisi: Frekuensi Relatif adalah frekuensi relatif setiap kelas dibandingkan dengan frekuensi totalnya.
7
CONTOH DISTRIBUSI FREKUENSI
Kelas ke- Interval Frekuensi
1 160 – 303 2
2 304 – 447 5
3 448 – 591 9
4 592 – 735 3
5 736 – 878 1
Batas kelas bawah
Batas kelas atas
8
NILAI TENGAH KELAS
Definisi:Nilai yang letaknya di tengah kelas.Contoh:
Kelas ke-
Interval Nilai Tengah Kelas
Keterangan
1 160-303
2 304-447
3 448-591
4 592-735
5 736-878
9
NILAI TEPI KELAS
Definisi: Nilai batas antar kelas (border) yang memisahkan nilai
antara kelas satu dengan kelas lainnya.
Contoh:Kelas
ke-Interval Frekuensi Nilai Tepi
KelasKeterangan
1
160-303
2
2
304-447
5
3
448-591
9
4
592-735
3
5
736-878
1
10
FREKUENSI KUMULATIF
Definisi:Penjumlahan frekuensi pada setiap kelas, baik meningkat (kurang dari) atau menurun (lebih dari).
Interval Frekuensi Tepi Kelas Frekuensi kurang dari
Frekuensi Lebih dari
160 - 303
2
159,5
304 - 447
5
303,5
448 - 591
9
447,5
592 - 735
3
591,5
736 - 878
1
735,5
878,5
11
HISTOGRAM
Definisi:Grafik yang berbentuk balok, di mana sumbu horisontal (X) adalah tepi kelas dan sumbu vertikal (Y) adalah frekuensi setiap kelas.
0
2
4
6
8
10
195.5-303.5 303.5-447.5 447.5-519.5 591.5-735.5 735.5-878.5
Tepi Kelas Interval Harga Saham
Jum
lah F
reku
ensi
Interval Frekuensi
159,5 - 303,5
2
303,5 - 447,5
5
447,5 – 591,5
9
591,5 – 735,5
3
735,5 – 878,5
1
12
POLIGON
Definisi:Grafik berbentuk garis dan menghubungkan antara nilai tengah kelas dengan jumlah frekuensi pada setiap kelas.
Nilai tengah kelas
Jumlah frekuensi
231,5 2
375,5 5
519,5 9
663,5 3
807,0 1
0
5
10
231,5 375,5 519,5 663,5 807,0
Nilai Tengah Interval Kelas Harga Saham
Freku
ensi
13
KURVA OGIF
Definisi:Diagram garis yang menunjukkan kombinasi antara interval kelas dengan frekuensi kumulatif.
Interval Tepi Kelas Frekuensi kurang dari
Frekuensi Lebih dari
160-303
159,5 0 (0%) 20 (100%)
304-447
303,5 2 (10%) 18 (90%)
448-591
447,5 7 (35%) 13 (65%)
592-735
591,5 16 (80%) 4 (20%)
736-878
735,5
878,5
19 (95%)
20 (100%)
1(5%)
0 (0%)
Penyajian Data Bab 2
Ukuran Pemusatan (1):14
Rata-rata adalah sebuah nilai yang khas yang dapat mewakili suatu himpunan data.
Rata-rata dari suatu himpunan n bilangan x1, x2 , ….., xn ditunjukkan oleh dan didefinisikan sbb :
n
x
n
xxxX
n
in
121 .....
Ukuran Pemusatan (2):15
Jika bilangan-bilangan x1, x2 , ….., xn masing-masing terjadi f1, f2 , ….., fn maka nilai rata-ratanya adalah :
n
i
n
ii
n
nn
f
xf
fff
xfxfxfX
1
1
21
2211
....
.....
Ukuran Pemusatan (3):16
Median adalah besaran yang membagi data menjadi dua kelompok yang memiliki persentase sama besar., dimana himpunan bilangan disusun menurut urutan besarnya.
Dimana L1 = batas kelas bawah dari kelas median.n = banyak data(Σ f)1= jumlah frekuensi semua kelas yang lebih rendah
dari kelas medianf med = frekuensi kelas medianc = panjang kelas
c
f
fn
LMedianmed
1
12
Ukuran Pemusatan (4):17
Modus suatu himpunan bilangan adalah nilai yang paling sering muncul (memiliki frekuensi maksimum). Modus mungkin tidak ada. Modus dapat diperoleh dari rumus :
Dimana L1 = batas kelas bawah dari kelas modus.1 = selisih frekuensi kelas modus dan
frekuensi kelas sebelumnya2 = selisih frekuensi kelas modus dan
frekuensi kelas sesudahnyac = panjang kelas
cLModus
21
11
Ukuran Dispersi/Penyebaran (1):
18
Derajat atau ukuran sampai seberapa jauh data numerik cenderung untuk tersebar disekitar nilai rata-ratanya.
Yang paling umum adalah Range (rentang), Variansi, dan Simpangan Baku.
Ukuran dispersi lain adalah kuartil, persentil.
Range / Rentang (R):19
adalah selisih antara bilangan terbesar dan terkecil dalam himpunan.
Nilai R akan selalu positif. Interpretasi nilai R adalah:
◦ R = 0, menunjukkan bahwa data terbesar sama dengan data terkecil, akibatnya semua data memiliki harga yang sama
◦ R kecil, memberikan informasi bahwa data akan mengumpul di sekitar pusat data
◦ R besar, menyatakan bahwa paling sedikit ada satu data yang harganya berbeda jauh dengan data lainnya
Simpangan baku (deviasi standar) (1):
20
Simpangan Baku (Deviasi Standar) suatu himpunan bilangan x1, x2, …, xn dinyatakan dengan s dan didefinisikan sebagai berikut :
2
1222
12
11
n
xnx
n
xxs ii
Simpangan baku (deviasi standar) (2):
21
Jika x1, x2, …, xn masing-masing muncul dengan frekuensi f1, f2, …, fn, maka simpangan baku dapat dituliskan :
2
1222
12
1
n
xf
n
xf
f
xxfs iiii
i
ii
ifn
22
Kuadrat dari simpangan baku adalah variansi. Nilai variansi dan simpangan baku selalu non-
negatif. Interpretasi nilai s2 adalah:
◦ s2 = 0 atau s = 0 berarti nilai data sama sengan rata-ratanya, sehingga nilai semua data sama
◦ s2 atau s kecil, berarti perbedaa n harga data yang satu dengan lainnya kecil Akibatnya semua data akan mengumpul disekitar pusat data.
◦ s2 atau s besar menyatakan bahwa paling sedikit ada satu data yang harganya berbeda jauh dengan data lainnya.
Simpangan baku (deviasi Simpangan baku (deviasi standar) (3):standar) (3):
Ukuran Penyebaran Lain :23
Suatu himpunan data membagi himpunan atas empat bagian yang sama. Nilai-nilai ini disebut Kuartil dan dinyatakan dengan Q1, Q2, dan Q3.
Suatu himpunan data membagi data atas sepuluh bagian yang sama disebut Desil dan dinyatakan dengan D1, D2, D3, …., D9.
Suatu himpunan data membagi data atas seratus bagian disebut Persentil dan dinyatakan dengan P1, P2, P3, ….., P99.
Kuartil :24
Di mana LQN = batas kelas bawah dari kelas kuartil ke-N n = banyak data (Σ f)N= jumlah frekuensi semua kelas sebelum kelas
kuartil ke N fQN = frekuensi kelas kuartil ke-N c = panjang kelas
Rumus Kuartil ke-N (N = 1,2,3) :
c
f
fn
NLQ
QN
N
QNN
4
.
Bentuk distribusi25
Dalam statistika, mempelajari distribusi merupakan suatu hal yang penting, karena akan menentukan metodologi statistika yang akan digunakan.
Distribusi adalah pola atau model penyebaran yang merupakan gambaran kondisi sekelompok data.
Ciri Bentuk Distribusi Simetri:
26
Mean = median = modus
1 2 3 4 5 6 7 8 9 10 11 12
Ciri Bentuk Distribusi Menjulur ke kanan (positif):
27
Mean > median > modus
1 2 3 4 5 6 7 8 9 10 11 12
Ciri Bentuk Distribusi Menjulur ke kiri (negatif):
28
Mean < median < modus
1 2 3 4 5 6 7 8 9 10 11 12
Mengukur derajat kemenjuluran distribusi data:29
Rumus Pearson
Dimana SK = derajat kemenjuluran
(skewness) = mean Mo = Modus S = Standar Deviasi
S
MoxSK
X
Interpretasi nilai derajat kemenjuluran:
30
Bila nilai SK = 0 atau mendekati nol, maka dikatakan distribusi data simetri
Bila nilai SK bertanda negatif, maka distribusi data menjulur ke kiri
Bila nilai SK bertanda positif, maka distribusi data menjulur ke kanan
Pencilan (Outlier)31
Memberikan informasi mengenai data yang harganya jauh berbeda dari harga data lainnya.
Dalam statistika, mendeteksi pencilan sangat penting karena data yang masuk dalam pencilan akan mengganggu hasil analisis data.
Oleh karena itu, data pencilan harus dianalisis tersendiri, terpisah dari kelompoknya.
Langkah-langkah mendeteksi pencilan:
32
Hitung besarnya nilai sebaran tengah, yaitu dq = QA – QB
Hitung nilai batas bawah pencilan (BBP), yaitu : BBP = QB – (1,5 x dq)
Hitung nilai batas atas pencilan (BAP), yaitu : BAP = QA + (1,5 x dq)
Apabila terdapat data dengan nilai lebih kecil atau sama dengan BBP maka data tersebut disebut pencilan bawah.
Apabila terdapat data dengan nilai lebih besar atau sama dengan BAP maka data tersebut disebut pencilan atas.
Soal 133
Distribusi frekuensi dari upah karyawan suatu perusahaan dalam ribuan rupiah per bulan adalah sbb.:
Nilai upah Banyaknya karyawan
100 – 199 15
200 – 299 20
300 – 399 30
400 – 499 25
500 – 599 15
600 – 699 10
700 – 799 5
Hitung mean dan modus
Hitung kuartil ke-3 dan simpangan baku
Soal 234
Diketahui besarnya pinjaman 7 orang nasabah suatu bank sbb. (dalam juta Rp).
Nama A B C D E F G
Pinjaman
12.57
14.65
25.50
5.75 11.80
16.55
15.89
Selidiki, apakah terdapat nasabah yang pinjamannya cukup sedikit atau sangat besar dibandingkan dengan nasabah lainnya
Soal 335
Sebuah obyek wisata di Bandung diamati selama 30 hari. Setiap hari dicatat banyaknya wisatawan domestik (satuan orang) yang mengunjungi obyek wisata tersebut yang ditampilkan dalam tabel berikut .
85 42 45 3 71 97 6 48 60 49
45 55 21 75 80 62 54 62 41 6
95 45 25 81 76 84 45 68 59 15
Dengan memanfaatkan analisis data statistik secara deskriptif, berikan analisis anda terkait dengan masalah di atas.
Soal 4 :36
Banyaknya mobil pribadi yang melewati 7 titik pengamatan pada jam 06.30 – 07.30 di kawasan jalan pahlawan adalah sbb.:
Lokasi
1 2 3 4 5 6 7
Jml mbl
70 73 93 71 109 75 71
Setelah data di atas dibakukan (*), selidiki betuk distribusinya melalui nilai rata-rata dan median.
37
Catatan (*): Membakukan data bertujuan untuk
mentransformasikan nilai-nilai data menjadi suatu kumpulan data baru dengan nilai rata-rata sama dengan nol dan variansi sama dengan 1.
Rumus pembakuan data adalah :
bakusimpangan
datapemusaukuran
s
xxZ
x
ii
tan