Upload
fajar-khair-tsabit
View
914
Download
9
Embed Size (px)
Citation preview
PROBABILITAS STATISTIK
Fajar Juniarto 2009420010
UNIVERSITAS MUHAMMADIYAH JAKARTA
2011
PERTEMUAN 1
BERKENALAN DENGAN STATISTIK
Tujuan Belajar Setelah mempelajari bab ini, Anda diharapkan mampu:
- Menjelaskan arti dari data, statistic dan statistika,
- Menjelaskan syarat-syarat data yang baik dan jenis-jenis data,
- Menguraikan peranan statistic dalam kehidupan sehari-hari.
I.1. Arti dan Kegunaan Data Menurut Webster’s New World Dictionary, data berarti sesuatu yang diketahui
atau dianggap. Dengan demikian data dapat memberikan gambaran tentang sesuatu
keadaan atau persoalan. Data tentang sesuatu pada umumnya dikaitkan dengan tempat
dan waktu. Misalnya, harga beras yang bermutu sedang di pasar Senen Jakarta, pada
tanggal 2 Januari 1999 adalah Rp. 450,- per-kg. Penyebutan tempat dan waktu ini
sangat penting, sebab selain data itu (harga beras per-kg) akan berubah-ubah dari
waktu ke waktu, data juga berbeda-beda menurut tempat.
Sesuatu yang dianggap juga merupakan data walaupun data seperti itu belum
tentu benar, sebab masih merupakan sesuatu yang perlu diuji terlebih dahulu. Didalam
praktek banyak sekali anggapan atau asumsi yang dipergunakan sebagai dasar
pembuatan keputusan. Misalnya, karena pemerintah menganggap persediaan beras
cukup (hasil produksi padi meningkat), maka diputuskan untuk tidak mengimpor beras.
Oleh karena suatu anggapan (pendapat atau asumsi) belum tentu benar, maka apabila
dipergunakan sebagai dasar pembuatan keputusan, dan keputusan tersebut bisa saja
salah. Oleh karena itu, anggapan yang masih merupakan hipotesis harus diuji terlebih
dahulu.
Kegunaan data pada dasarnya adalah untuk membuat keputusan oleh para
pembuat keputusan. Data dapat berguna, bila dikaitkan dengan masalah manajemen,
yaitu sebagai :
a. Dasar suatu perencanaan agar perencanaan sesuai dengan kemampuan yang ada
sehingga dapat dicegah perencanaan yang ambisius dan susah dilaksanakan.
Kemampuan yang dimaksud ialah kemampuan personil, kemampuan pembiayaan
(keuangan), serta kemampuan material.
b. Alat pengendalian terhadap pelaksanaan atau implementasi perencanaan tersebut,
agar bisa diketahui dengan segera kesalahan atau penyimpangan yang terjadi,
sehingga dapat segera dilakukan perbaikan atau koreksi.
c. Dasar evaluasi hasil kerja akhir. Apakah hasil kerja yang telah ditargetkan bisa
dicapai 100%, 90% atau kurang dari itu? Kalau target tidak tercapai, faktor-faktor
apa yang menyebabkannya? Untuk ini semua diperlukan data.
Kebutuhan Terhadap Statistik Bagaimanapun juga, merupakan suatu fakta bahwa anda membutuhkan statistik
untuk membantu anda dalam:
a. Menjabarkan dan memahami suatu hubungan antar variabel
Jumlah data kuantitaif yang dikumpulkan, diolah, dan disajikan kepada umum oleh
para pengambil keputusan dalam suatu organisasi untuk tujuan tertentu, telah
meningkat dengan sangat cepat. Karena itu diperlukan suatu kemampuan untuk
menyaring jumlah yang begitu besar agar kita dapat mengidentifikasi dan
menjabarkan hubungan antar variabel, yang kadang-kadang terselubung, tetapi
seringkali sangat penting dalam pengambilan keputusan.
Contoh: seorang wiraswasta, dengan mengumpulkan data pendapatan dan biaya,
dapat membandingkan hasil pengembalian atau investasi (return on investment)
dalam suatu periode dengan data dari periode-periode sebelumnya.
b. Merupakan alat bantu dalam mengambil keputusan
Seorang administrator dapat menggunakan statistik sebagai alat bantu untuk
menghasilkan keputusan yang lebih baik dalam ketidakpastian.
Contoh: Misalkan, anda adalah seorang manajer pembelian dari suatu pabrik
pengolahan makanan besar yang mengemas ayam goreng beku. Anda bertanggung
jawab atas pembelian 100.000 ekor ayam potong yang sudah dihilangkan bulunya.
Standar yang ditentukan menyebutkan bahwa berat rata-rata ayam dalam suatu
pengiriman harus 1kg (ayam yang melebihi berat tersebut cenderung liat; ayam yang
lebih ringan terlalu kurus). Truk pemasok akan dibongkar asalkan standar berat dan
kualitasnya dipenuhi. Tenaga penjual pemasok meyakinkan anda bahwa barangnya
akan memenuhi standar anda. Apakah anda akan menerima muatan dalam truk
berdasarkan pernyataan tadi? Mungkin sekali tidak, tetapi anda dapat menggunakan
teknik inferensi statistik untuk memlilih sample yang tepat, katakan per 100 ekor dari
populasi sebanyak 100.000 ekor ayam. Kemudian anda dapat menimbang setiap
sample dan menghitung berat rata-rata 100 ekor ayam tersebut. Dengan informasi
ini, anda dapat mengambil keputusan yang lebih baik mengenai akan diterima atau
tidaknya muatan tersebut.
c. Menangani perubahan
Merencanakan ialah memutuskan sebelum serangkaian tindakan di masa yang akan
datang; oleh karena itu, perencanaan dan keputusan didasari oleh oleh perkiraan
tentang kejadian-kejadian dan/atau hubungan di masa yang akan datang. Jadi, pada
hakekatnya seseorang perlu melakukan proses atau teknik peramalan untuk
memperoleh perkiraan tentang masa depan. Meskipun prosedur statistk jelas tidak
akan memungkinkan kita meramal masa depan dengan tepat tanpa kesalahan,
terdapat bantuan statistik yang bermanfaat seperti ditunjukkan pada contoh berikut,
yang dapat membantu mengukur perubahan saat ini dan meningkatkan proses
peramalan (forecasting).
Contoh: Misalkan seorang manajer penjualan mempunyai data penjualan suatu lini
produksi yang berkembang selama 10 tahun. Jika setelah mempelajari data deret
berkala (time-series) ini, manajer penjualan berkeyakinan bahwa pola masa lalu
yang diidentifikasi akan terus bertahan, ia dapat menyusun ramalan penjualn yang
akan datang dengan menggunakan prosedur statistik untuk memproyeksikan pola
masa lalu ke masa depan. Ia juga dapat mempercepat ramalannya dengan
memperhitungkan variasi musiman, misalnya penjualan yang lebih tinggi selama
bulan Desember dibandingkan dengan Februari.
Metodologi Pemecahan Masalah Secara Statistik Langkah-langkah dasar dalam pemecahan masalah secara statistik adalah :
1. Mengidentifikasi masalah atau peluang
Manajer atau staf riset pertama-tama harus memahami dan mendefnisikan masalah
atau peluang yang dihadapi secara tepat. Informasi kuantitatif yang bermanfaat
dalam hal ini mencakup data yang menggariskan sifat dan luas permasalahan,
misalnya: kurangnya produksi dan pesanan yang belum dipenuhi; fakta tentang
populasi perlu dipelajari dan juga dampak situasi terhadap sumber daya seperti
personalia, material, dana dan waktu.
2. Mengumpulkan fakta yang tersedia
Data yang dikumpulkan harus benar, tepat waktu, selengkap mungkin, dan relevan
terhadap permasalahan yang ditelaah. Sumber data dapat diklasifikasikan ke dalam
kategori internal dan eksternal. Data bisnis dan ekonomi internal dapat ditemukan di
bagian akuntasi, produksi serta pemasaran, dan juga dibagian lain dalam organisasi.
3. Mengumpulkan data orisinil yang baru
Dalam banyak hal, data yang diperlukan oleh analis tidak tersedia dari sumber-
sumber lain. Sehingga tidak ada alternatif bagi analis kecuali mengumpulkannya
sendiri. Ada bermacam-macam metode untuk memperoleh data yang diinginkan,
dimana yang umum adalah dengan menggunakan wawancara secara pribadi, atau
dengan pengumpulan kuesioner melalui pos.
4. Mengklasifikasikan dan mengikhtisarkan data
Setelah data dikumpulkan, langkah selanjutnya adalah mengorganisasikan atau
mengelompokkan data itu untuk tujuan penelaahan. Identifikasi jenis data dengan
karakteristik serupa dan mengaturnya ke dalam kelompok atau kelas, disebut
klasifikasi. Data produksi dapat diklasifikasikan, misalnya, berdasarkan produk yang
dibuat, lokasi pabrik, atau proses produksi yang digunakan.
5. Menyajikan data
Ikhtisar informasi dalam bentuk table, grafik, dan ukuran kuantitatif yang penting
menyediakan sarana pemahaman masalah, membantu mengidentifikasi hubungan-
hubungan, dan membantu para analis menyajikan serta mengkomunikasikan butir-
butir penting kepada pihak-pihak yang berkepentingan.
6. Menganalisis data
Mereka yang memecahkan masalah harus menginterpretasikan hasil dari langkah-
langkah sebelumnya, menggunakan ukuran deskriptif yang telah dihitung sebagai
dasar untuk menarik kesimpulan secara statistik yang mungkin bernilai, dan
menggunakan alat bantu statistik yang dapat membantu mencari kemungkinan
rangkaian tindakan paling menarik. Pengambil keputusan harus mempertimbangkan
pilihan-pilihan atas dasar sasaran yang telah ditentukan agar menghasilkan satu
rencana atau keputusan yang merupakan jawaban terbaik terhadap
permasalahannya. Sekali lagi, keputusan pilihan tergantung pada keterampilan
analitis (termasuk kemampuan menerapkan teknik kuantitatif yang tepat) dan
kualitas informasi.
I.2. Syarat data yang baik dan pembagian data Dua syarat yang baik untuk pembagian data antara lain:
1. Obyektif: Data harus sesuai dengan keadaan yang sebenarnya (as it is).
Misalnya: produksi yang turun dilaporkan naik, ini tidak obyektif; harga satu satuan
barang Rp. 500,- dilaporkan Rp. 750,-, walaupun ada kuitansi tetap tidak obyektif.
2. Reprentatif (mewakili): Data harus mewakili obyek-obyek yang diamati.
Misalnya: jika laporan produksi padi dari suatu daerah hanya didasarkan atas hasil
sawah-sawah yang subur saja, ini jelas tidak mewakili; laporan konsumsi susu hanya
dari golongan orang kaya saja juga tidak mewakili.
3. Kesalahan baku (standard error) kecilI: Suatu perkiraan (estimate) dikatakan baik
(mempunyai tingkat ketelitian yang tinggi) apabila kesalahan bakunya kecil.
Ketiga syarat tersebut diatas sering disebut syarat data yang dapat diandalkan
(reliable). Sedangkan kedua syarat berikut lebih menunjukkan manfaat atau
kegunaannya.
1. Tepat waktu
Apabila data akan dipergunakan untuk melakukan pengendalian atau evaluasi,
maka syarat tepat waktu ini penting sekali agar sempat dilakukan penyesuaian atau
koreksi seperlunya kalau ada kesalahan atau penyimpangan yang terjadi di dalam
implementasi suatu perencanaan.
2. Relevan: Data yang dikumpulkan harus ada hubungannya dengan masalah yang
akan dipecahkan.
Misalnya: pemerintah mengetahui faktor-faktor yang menyebabkan kemerosotan
produksi padi selama beberapa tahun terakhir.
Data Menurut Sifatnya, dapat dibedakan menjadi : 1. Data kualitatif: data yang berbentuk angka (nonnumeris).
misalnya: produksi daging sapi meningkat, harga daging ayam mahal dsb.
2. Data kuantitaif: data yang dinyatakan dalam bentuk angka (numeris).
misalnya: produksi padi meningkat 10%, harga daging sapi per kilogram rata-rata
adalah Rp. 15.000,-, sebanyak 99% pupuk telah disalurkan dsb.
Data Menurut Sumbernya, mengacu kepada sumber perolehan data, yaitu eksternal dan internal : 1. Data internal: data yang bersumber dari keadaan atau kegiatan suatu organisasi
atau kelompok.
Misalnya: data penjualan dan data produksi suatu perusahaan.
2. Data Eksternal: data yang bersumber dari luar suatu organisasi atau kelompok. Misalnya: suatu perusahaaan mencari data mengenai daya beli konsumen kepada
kantor pusat statistic setempat.
Data menurut cara memperolehnya, dapat dibedakan menjadi : 1. Data primer: data yang dikumpulkan dan diolah oleh suatu organisasi atau
perorangan langsung dari obyeknya.
Misalnya: suatu perusahaan ingin mengetahui konsumsi rata-rata penduduk disuatu
daerah dengan cara melakukan wawancara langsung kepada penduduk setempat.
2. Data sekunder: data yang diperoleh dalam bentuk jadi dan telah diolah oleh pihak
lain, yang biasanya dalam bentuk publikasi.
Data Menurut Waktu Pengumpulannya, dapat dibedakan menjadi : 1. Data cross section: data yang yang dikumpulkan dalam suatu periode tertentu,
biasanya menggambarkan keadaan atau kegiatan dalam periode tersebut.
Misalnya: hasil sensus penduduk tahun 1990 menggambarkan keadaan Indonesia
pada tahun 1990 menurut umur, jenis kelamin, agama, tingkat pendidikan dsb.
2. Data Berkala: data yang dikumpulkan dari waktu ke waktu. Tujuannya adalah untuk
menggambarkan perkembangan suatu kegiatan dari waktu ke waktu.
Misalnya: perkembangan produksi padi selama lima tahun terakhir, perkembangan
sembako selama 10 tahun terakhir. Data ini sering disebut sebagai data histories.
I.3. Definisi Statistik Dalam arti sempit, statistik berarti data ringkasan berbentuk angka (kuantitatif).
Statistik penduduk misalnya, adalah data atau keterangan berbentuk angka ringkasan
mengenai penduduk (jumlah, rata-rata umur, distribusinya, persentase yang buta huruf).
Statistik personalia (jumlahnya, rata-rata masa kerja, rata-rata jumlah anggota keluarga,
persentase yang sederhana) dsb.
Dalam arti luas, statistik berarti suatu ilmu yang mempelajari cara pengumpulan,
pengolahan/pengelompokan, penyajian, analisis data, serta cara pengambilan
kesimpulan secara umum berdasarkan hasil penelitian yang tidak menyeluruh.
Pengertian ini merujuk pada istilah statistics yang biasanya diterjemahkan dengan istilah
statistika.
Peran Komputer dalam Statistik 1. Jumlah masukan (input) yang besar
Semakin besar jumlah data yang harus diolah untuk menghasilkan informasi yang
diperlukan, pengolahan dengan komputer menjadi semakin ekonomis dibandingkan
dengan metode-metode yang lain.
2. Proyek yang negative
Sehubungan dengan biaya yang terlibat dalam menyiapkan tugas untuk pengolahan
komputer, maka seringkali yang paling ekonomis ialah menggunakan komputer
untuk proyek-proyek yang repetitive
3. Diinginkan dan diperlukan kecepatan tinggi dalam pengolahan
Semakin besar kebutuhan akan informasi yang tepat waktu, semakin besar nilai
komputer dibandingkan dengan metode metode-metode yang lainnya.
4. Diinginkan dan diperlukan ketepatan yang lebih besar
Pengolahan komputer akan cukup tepat jika tugas yang harus dilaksanakan telah
disiapkan dengan matang,
5. Mengolah hal-hal yang kompleks yang memerlukan bantuan elektronik
Dalam beberapa situasi yang melibatkan sejumlah besar variable yang berinteraksi,
maka tidak ada alternatif lain selain komputer. Misalnya pengambilan keputusan
dengan alat statistik seperti pemrogaman linier dan simulasi biasanya menggunakan
komputer.
PERTEMUAN 2 PENGUMPULAN DAN PENGOLAHAN DATA
Tujuan Belajar
Setelah mempelajari bab ini, Anda diharapkan mampu :
- Menggambarkan proses dan metode yang digunakan dalam pengumpulan data
- Menjelaskan proses dan metode yang digunakan dalam pengolahan data
PENGUMPULAN DATA Data statistik yang diharapkan adalah data yang dapat dipercaya dan tepat waktu. Untuk
mencapai tujuan tersebut, maka pengumpulan datanya harus baik dan mencakup seluruh unit yang
menjadi obyek penelitian. Informasi yang dikumpulkan itu harus sesuai dengan keadaan yang
sebenarnya dan dengan metode serta cara yang ditetapkan.
Sebelum pengumpulan data dilakukan, terlebih dahulu harus diketahui untuk apa data itu
dikumpulkan. Apakah data tersebut hanya sekedar untuk mendapatkan gambaran mengenai suatu
keadaan atau untuk memecahkan suatu persoalan. Apapun tujuan pengumpulan data, terlebih
dahulu harus diketahui jenis elemen atau obyek yang akan diselidiki.
Elemen adalah unit terkecil dari obyek penelitian, dapat berupa :
- Orang (pegawai negeri, mahasiswa, pedagang, karyawan, nasabah bank dsb);
- Organisasi/badan usaha (perusahaan, sekolah/universitas, departemen, propinsi,
kabupaten, kecamatan, desa, rumah tangga, pasar dsb);
- Barang (kendaraan, mesin, gedung, senjata dsb).
Tujuan pengumpulan data, selain untuk mengetahui jumlah elemen, juga untuk mengetahui
karakteristik dari elemen-elemen tersebut.
Karakteristik adalah sifat-sifat, ciri-ciri atau hal-hal yang dimiliki oleh elemen, yaitu semua
keterangan mengenai elemen. Misalnya: kalau elemen itu pegawai pemerintah/swasta maka
karakteristik yang perlu diketahui antara lain jenis kelamin, pendidikan, agama, umur, masa kerja,
golongan dan gaji. Sedangkan jika elemen itu perusahaan , maka karakteristiknya antara lain jumlah
karyawan, jumlah kekayaan, hasil produksi dan hasil penjualan,
Variabel atau peubah ialah sesuatu yang nilainya dapat berubah atau berbeda. Nilai
karakteristik suatu elemen merupakan nilai variable, misalnya harga (karakteristik harga suatu barang
akan berubah-ubah menurut waktu atau berbeda-beda menurut tempat). Biasanya untuk
menunjukkan suatu variable dipergunakan huruf latin (X, Y, Z) atau Yunani dsb.
Contoh : Kalau ada 3 perusahaan dengan modal X = modal perusahaan dalam jutaan rupiah dimana
X1 = 5, X2 =7, X3 = 4, berart perusahaan pertama mempunyai modal Rp. 5 juta,
perusahaan kedua Rp. 7 juta, dan perusahaan ketiga Rp. 4 juta.
Populasi adalah kumpulan dari seluruh elemen sejenis tetapi dapat dibedakan satu sama lain.
Perbedaan-perbedaan itu disebabkan karana adanya nilai karakteristik yang berlainan. Misalnya
seluruh karyawan perusahaan merupakan suatu populasi. Disini elemen merupakan orang, yaitu
karyawan perusahaan. Walaupun jenisnya sama, namun karakteristiknya secara keseluruhan akan
berlainan, misalnya umur, pendidikan, masa kerja, jumlah anak, gaji pokok dsb. Jadi, populasi bisa
merupakan seluruh penduduk Indonesia, seluruh perusahaan industri di Indonesia, seluruh petani di
Jawa Tengah, seluruh kendaraan Departemen Keuangan. Untuk menunjukkan banyaknya elemen
populasi , kita berikan notasi N.
Catatan: Karena pengumpulan data akan menghasilkan nilai observasi sebagai nilai karateristik dari
masing-masing elemen, maka kumpulan seluruh nilai (data) observasi disebut populasi.
Kumpulan seluruh kemungkinan hasil eksperimen juga disebut populasi. Oleh karena itu
populasi dan sample sering ditulis sebagai berikut :
Populasi : X1,X2, ……..,Xi,………XN
Sampel : X1,X2, ,Xi,………Xn
Sampel adalah sebagian dari populasi. Jika n adalah jumlah elemen sample dan N adalah
jumlah elemen populasi, maka n , N. Istilah lain dari sample adalah contoh.
Metode Pengumpulan Data Pada dasarnya terdapat 3 macam metode pengumpulan data dalam riset yaitu :
1. Sensus Sensus adalah cara pengumpulan data dimana seluruh elemen populasi diselidiki. Data yang
diperoleh sebagai hasil pengolahan sensus disebut data yang sebenarnya (true value), atau sering
disebut parameter. Kesimpulan yang ditarik berlaku umum (untuk populasi) dan pasti. Misalnya , hasil
sensus penduduk Indonesia tahun 1980 memberikan data sebenarnya mengenai penduduk
Indonesia (jumlahnya menurut umur, menurut jenis kelamin, menurut lapangan kerja, menurut
agama, pendidikan).
Kebaikan sensus adalah bahwa kita bias memperoleh nilai yang sebenarnya, sedangkan
kelemahannya adalah bahwa sensus itu mahal biayanya, serta makan banyak waktu dan tenaga.,
sehingga jarang dipergunakan dalam riset.
2. Sampling Sampling adalah cara pengumpulan data dimana yang diselidiki adalah elemen sampel dari
suatu populasi. Data yang diperoleh dari hasil sampling merupakan data perkiraan (estimate value),
yang mengandung kesalahan sampling (sampling error). Kesimpulan yang ditarik berlaku umum
(generalisasi) akan tetapi tidak pasti (mengandung unsure ketidakpastian “uncertainty”). Jadi, jika
dari 1.000 perusahaan hanya akan diselidiki 100 saja, maka hasil penyelidikannya merupakan suatu
perkiraan. Misalnya, perkiraan jumlah karyawan, perkiraan jumlah produksi, perkiraan jumlah modal
dsb.
Dibandingkan dengan sensus, pengumpulan data dengan cara sampling membutuhkan biaya
yang jauh lebih sedikit, memerlukan waktu yang lebih cepat, tenaga yang tidak terlalu banyak, dan
dapat menghasilkan cakupan data yang lebih luas serta terperinci. Dalam banyak hal, metode
pengumpulan data dengan cara sampling lebih disukai dengan pertimbangan keterbatasab biaya dan
waktu.
3. Case Study Case study adalah metode pengumpulan data dengan jalan mengambil beberapa elemen
atau satu elemen saja dan sering tidak jelas populasinya, kemudian masing-masing elemen diselidiki
secara mendalam. Metode ini tidak dapat memperkirakan nilai sesungguhnya, mengingat
populasinya tidak jelas. Kesimpulan yang diambil tidak berlaku umum akan tetapi hanya terbatas
pada kasus yang diteliti.
Misalnya, kita menyelidiki 4 buah pabrik rokok, maka hasil yang kita peroleh dari penyelidikan
4 buah pabrik rokok tersebut tidak bias dipergunakan untuk menyimpulkan keadaan pabrik-pabrik
rokok seluruh Indonesia.
Beberapa Macam Sampling Pada dasarnya ada dua cara pengambilan sampel, yaitu : probability sampling dan
nonprobability sampling.
Probability Sampling ialah suatu sampling yang pemilihan obyek atau elemen dari populasi
yang akan dimasukkan di dalam sampel didasarkan atas nilai probability. Penggunaan probability
sampling ini penting sekali apabila kita akan membuat analisis statistic yang mendalam, misalnya
ingin membuat perkiraan interval (interval estimate) atau pengujian hipotesis atas hasil penelitian
tersebut.
Kalau soalnya hanya ingin membuat perkiraan tunggal (point estimate) misalnya rata-rata,
persentase, maka cukup dengan non-probability sampling. Penelitian harus menggunakan random
sampling yang bersifat obyektif, oleh karena itu harus dilakukan pengujian hipotesis dimana
kesimpulannya tidak pasti berdasarkan konsep probabilitas.
Beberapa contoh Probability Sampling: 1. Simple Random Sampling
2. Stratified Random Sampling
3. Systematic Random Sampling
4. Multi Stage Random Sampling
5. Cluster Random Sampling
Beberapa contoh Non Probability Sampling: 1. Accidental Sampling
2. Quota Sampling
3. Purposive Sampling
4. Judgemental Sampling
5. Convenient Sampling
Penjelasan :
1. Simple Random Sampling ialah suatu sampel yang terdiri dari n elemen, yang dipilih dari suatu
populasi dengan cara sedemikian rupa, sehingg setiap kombinasi dari n elemen mempunyai
kesempatan yang sama untuk dipilih seperti kombinasi-kombinasi lainnya. Cara pengumpulannya
disebut simple random sampling.
Simple random sample bisa diperoleh dengan cara undian/lotere atau dengan menggunakan
apa yang disebut bilangan random. Cara pengambilan sampel yang demikian akan menjamin
bahwa pemilihan elemen-elemen yang akan diselidiki didasarkan atas obyektivitas, bulan
subyektivitas.
Ada dua cara pemilihan pemilihan sample yaitu :
a. With Replacement : elemen yang terpilih dikembalikan lagi sehingga ada kemingkinan terpilih
lagi.
b. Without Replacement : elemen yang terpilih tidak dikembalikan lagi sehingga tidak akan
terpilih kembali.
2. Stratified Random Sampling
Seringkali sebelum kita mengambil sampel, biasanya populasi yang sangat heterogen / bervariasi
kita bagi-bagi dahulu menjadi beberapa populasi dengan jumlah elemen yang lebih kecil.
Populasi-populasi yang lebih kecil itu deisebut stratum sedangkan proses pembagian tersebut
disebut stratifikasi. Elemen-elemen di dalam setiap stratum harus homogen atau relative
homogen, sehinggarata-rata yang kita ambil dari setiap stratum bias mewakili stratum yang
bersangkutan
3. Systematic Random Sampling
Ialah suatu sampling dimana pengambilan elemen yang pertama sebagai anggota sampel terpilih
secara random, dan pemilihan elemen-elemen selanjutnya ditentukan secara sistematis dengan
menggunakan suatu interval sebesar k, dimana k = N/n
4. Multi Stage Random Sampling
Ialah sampling dimana pemilihan elemen sampel dilakukan secara bertahap (by stages).
Contoh : Penelitian untuk mengetahui rata-rata upah karyawan restoran Padang diseluruh ibu
kota propinsi.
Tahap pertama, memlih sampel kota
Tahap kedua, memilih sampel restoran dari kota terpilih
Tahap ketiga, memilih sampel karyawan dari restoran terpilih
Tahap keempat, lakukan wawancara
5. Cluster Random Sampling
Ialah sampling dimana elemen sampel terdiri dari elemen-elemen yang lebih kecil disebut cluster.
Contoh ; Penelitian untuk mengetahui rata-rata modal yang dibutuhkan oleh pemilik took di
Jakarta. Dalam hal ini “shopping center” dijadikan cluster (Pasar Baru, Blpk M, PIM dsb). Cluster
yang terpilih seluruh elemennya (tokonya) diteliti satu persatu.
6. Accidental Sampling
Ialah sampling yang cara memilih elemen-elemen untuk menjadi anggota sampel ditentukan
dengan subyektif sekali, artinya sesuka hati saja dan hasilnya kasar sekali sehingga kurang
mewakili.
Contoh : seorang wartawan ingin membuat kabar sensasi, kemudian berdiri di muka salah satu
took di Pasar Baru menanyakan kepada gadis-gadis / teen agers yang lewat dengan pertanyaan :
apakah adik senang rok mini. Dari 100 orang ternyata 80 orang menjawab ya. Kemudian pada
pagi harinya terbaca berita di surat kabar : 80% wanita Indonesia sengan rok mini. Informasi yang
demikian itu kasar sekali / tidak valid.
7. Quota Sampling
Ialah sampling seperti stratified sampling akan tetapi stratum diberi jatah atau quota. Mungkin
pemilihannya juga tidak random / sangat subyektif.
8. Purposive Sampling
Ialah sampling dimana pengmbilan elemen – elemen yang dimasukkan dalam sampel dilakukan
dengan sengaja, dengan catatan bahwa sampel tersebut representative atau mewakili populasi.
Sering juga disebut judgment sampling.
Alat Pengumpulan Data Apabila pengumpulan dsata sudah ditentukan, kemudian ditentukan alat untuk memperoleh
data dari obyek yang akan diteliti, antara lain:
1. Daftar pertanyaan (questioner)
2. Wawancara
3. Observasi atau pengamatan langsung
4. Melalui pos, telepon, atau alat komunikasi lainnya.
Bagian yang sangat penting dalam pengumpulan data adalah merancang kuesioner. Kuesioner
atau daftar isian adalah satu set pertanyaan yang tersusun secara sistematis dan standar sehingga
setiap pertanyaan yang sama dapat diajukan terhadap setiap responden.
Sistematis adalah bahwa item=item pertanyaan disusun menurut logika sesuai dengan maksud dan
tujuan pengumpulan data. Sedangkan yang dimaksud Standar adalah setiap item pertanyaan
mempunyai pengertian, konsep, dan definisi yang sama.
Usaha untuk membuat kuesioner suatu survey yang baik, harus diarahkan pada dua tujuan
utama, yaitu :
- Memperoleh informasi / data yang berhubungan dengan maksud dan tujuan survey
- Mengumpulkan informasi dengan kecermatan dan ketelitian yang dapat dipertanggungjawabkan.
Jenis pertanyaan dalam kuesioner dapat dibedakab menjadi pertanyaan terbuka dan pertanyaan
tertutup. Perbedaan kedua jenis pertanyaan tersebut terletak pada tingkat kebebasan responden
dalam menjawab pertanyaan-pertanyaan kuesioner. Pertanyaan terbuka memungkinkan responden
memberikan jawaban yang dikehendaki dengan kata-kata yang dipilihnya sendiri. Sedangkan
pertanyaan tertutup membatasi jawaban responden dengan keharusan memilih diantara jawaban-
jawaban yang sudah tercantum dalam kuesioner.
PENGOLAHAN DATA Pengolahan data pada dasarnya merupakan suatu proses untuk memperoleh data / angka
ringkasan berdasarkan kelompok data mentah. Data / angka ringkasan dapat berupa jumlah (total),
proporsi, persentase, rata-rata dsb.
Data statistik pada dasrnya merupakan angka-angka ringkasan dari hasil pengolahan
berdasarkan data mentah, seperti total, rata-rata, persentase, angka indeks, simpangan baku,
koefisien korelasi dan koefisien regresi.
Jadi pada dasarnya tujuan dari pengolahan data adalah mendapatkan data statistic yang
dapat digunakan untuk melihat atau menjawab persoalan secara agregat atau kelompok, bukan satu
persatu atau individu.
Metode Pengolahan Data Untuk menentukan metode pengolahan data yang lebih baik, jawabannya tergantung pada seberapa
besar ukuran datanya. Jika hasil observasi yang dikumpulkan jumlahnya sedikit, maka dapat
dilakukan pengolahan secara manual. Akan tetapi jika jumlah observasi sangat besar, maka
pengolahan data secara elektronik (dengan computer).
PERTEMUAN 3 PENYAJIAN DATA
Tujuan Belajar
Setelah mempelajari bab ini, anda diharapkan mampu :
- Menggambarkan cara menyajikan data dalam bentuk tabel
- Menjelaskan cara menyajikan data dalam bentuk grafik
- Menyebutkan jenis-jenis table dan grafik yang digunakan dalam menyajikan data
Data statistic tidak hanya cukup dikumpulkan dan diolah, tapi juga perlu disajikan
dalam bentuk yang mudah dibaca dan dimengerti oleh pengambil keputusan.
Penyajian data ini bisa dalam bentuk tabel atau grafik dengan keuntungan bahwa
data tersebut akan lebih mudah ditangkap dan dimengerti daripada disajikan dalam
bentuk kata-kata.
Seorang manajer penjualan bisa menganalisis kecenderungan peningkatan
penjualan dengan melihat grafik penjualan yang menunjukkan kecenderungan
(trend) menaik. Berdasarkan grafik itu, ia dapat memperkirakan berapa jumlah
barang yang akan diproduksi, berapa tingkat permintaan pasar, dan berapa jumlah
barang yang akan terjual, sehingga over production atau under production dapat
dihindari. Dengan kata lain penyajian data dalam bentuk tabel dan grafik akan
membuat proses pengmbilan keputusan lebih tepat, cepat dan akurat.
Selain berupa angka-angka ringkasan (summary figures), penyajian data juga
dapat berbentuk tabel dan grafik. Tabel merupakan kumpulan angka-angka yang
disusun menurut kategori-kategori (misalnya: jumlah pegawai menurut pendidikan
dan masa kerja; jumlah penjualan menurut jenis barang dan daerah penjualan;
jumlah produksi menurut jenis barang dan kantor cabang dsb) sehingga
memudahkan untuk pembuatan analisis data.
Grafik merupakan gambar-gambar yang menunjukkan secara visual data berupa
angka (mungkin dalam bentuk simbol-simbol) yang biasanya berasal dari tabel-tabel
yang telah dibuat. Baik tabel maupun grafik bisa dipergunakan untuk menyajikan
cross section data dan data berkala.
CROSS SECTION DATA Penyajian dengan tabel
Tabel berikut merupakan contoh bentuk data yang disajikan dalam bentuk
tabel.
Tabel penjualan hiptetis PT. Sinar Sakti menurut jenis barang dan daerah penjualan
pada tahun 1999 (dalam satuan)
Jenis Barang Daerah Penjualan
Total I II III IV
(1) (2) (3) (4) (5) (6)
A 20 30 50 60 160
B 15 25 40 50 130
C 10 20 25 30 85
Total 45 75 115 140 375
Tabel diatas merupakan tabel dua arah (two ways table), yaitu tabel yang
menunjukakan hubungan timbal balik antara dua hal: jenis barang dan daerah
penjualan. Dari tabel tersebut, selain diperoleh jumlah seluruh penjualan (sebesar
375 satuan), juga akan diperoleh gambaran tentang perbandingan hasil penjual
antara daerah yang satu dengan daerah yang lain dan antara jenis barang yang satu
dengan jenis barang lainnya. Hal tersebut akan memudahkan kita untuk melakukan
analisis guna mengetahui jenis barang apa yang paling laku dan di daerah mana,
yang selanjutnya dapat digunakan sebagai dasar penentuan alokasi barang-barang
untuk berbagai daerah. Misalnya berapa jumlah barang A yang harus didrop di
daerah I, II, III dan IV, berapa untuk barang C dsb. Hal tersebut untuk mencegah
atau menghindari pengiriman jenis barang yang terlalu banyak untuk daerah yang
tidak laku atau terlalu sedikit untuk daerah dimana barang tersebut sangat laku. Jadi
tabel semacam itu juga berguna untuk kebijakan logistic.
Penyajian dengan grafik
Data juga bisa disajikan dalam bentuk grafik dengan menggunakan bagan batangan
atau bar chart.
DATA BERKALA
Penyajian dengan tabel
Tabel perkembangan seluruh hasil penjualan PT. Sinar Sakti menurut jenis barang
dari tahun1993 s/d 1999 (dalam satuan)
Jenis barang Jenis barang Jenis barang
Tahun A B C Jumlah
(1) (2) (3) (4) (5)
1993 90 85 50 225
1994 110 90 55 255
1995 115 105 60 280
1996 130 110 65 305
1997 140 120 75 335
1998 155 125 80 360
1999 160 130 85 375
Dari tabel tersebut diatas, selain bisa dilihat perkembangan jumlah hasil penjualan
pertahun, juga sekaligus hasil penjualan untuk setiap jenis barang.
Penyajian dengan grafik
Gambar tentang perkembangan hasil penjualn akan lebih jelas lagi jika data disajikan
dalam bentuk grafik. Dengan menggunakan grafik, kita dengan cepat dapat melihat
perkembangan hasil penjualan untuk setiap hasil penjualan dari1993-1999, sekaligus
laju perkembangan dari masing-masing jenis barang.
Apabila dilanjutkan dengan analisis yang lebih mendalam, maka bisa diketahui
besarnya laju kenaikan dari masing-masing produk (rate of increase) selama
periode tsb, sehingg untuk masa yang akan dating kita dapat melihat atau
meramalkan jenis produk mana yang akan meningkat dan mana yang selalu
menunjukkan kecenderungan menurun; mungkin jenis barang tersebut tidak laku lagi
dan kalau perlu dibuang untuk diganti dengan yang baru atau cukup diperbaiki
mutunya saja. Hal ini hanya mungkin dilakukan jika perusahaan melakukan
penelitian dan pengembangan (R&D).
Dari uraian tersebut, sebetulnya sudah bisa ditarik kesimpulan, bahwa penyajian
data dengan tabel bisa memberikan angka-angka yang lebih teliti, tetapi tidak bisa
dengan cepat diambil kesimpulannya. Sedangkan dengan grafik, kesimpulan bisa
dengan cepat diambil tetapi angka-angkanya kurang teliti.
BENTUK TABEL
Ada berbagai bentuk tabel yang dikenal, yaitu tabel satu arah (one way table), tabel
dua arah (two way table), dan tabel tiga arah (three way table).
Tabel satu arah ialah tabel yang memuat keterangan mengenai satu hal atau satu
karakteristik saja, misalnya :
- Data personalia : jumlah personalia menurut : a) pendidikan,b) masa kerja, c)
umur, d) golongan dsb.
- Data peralatan : jumlah kendaraan bermotor menurut : a) merk, b) jenis, c)
umur, d) harga dsb.
Contoh tabel satu arah :
Tabel produksi kayu hutan menurut jenis produksi 1996 – 1997 (000 m3)
Jenis Banyaknya
(1) (2)
Kayu bulat 26.069
Kayu gergajian 3.427
Kayu lapis 10.948
Jumlah 40.444
Sumber : Departemen Kehutanan dalam Statistic Indonesia, 1997, BPS
Tabel dua arah ialah tabel yang menunjukkan hubungan dua hal atau dua
karakteristik, misalnya :
- Data personalia, menurut masa kerja dan pendidikan, masa kerja dan
golongan, agama dan pendidikan dsb.
- Data peralatan, menurut umur dan merk, umur dan jenis dsb.
Contoh tabel dua arah :
Tabel jumlah Universitas Persada menurut semester dan fakultas tahun 1999 :
Smt Smt Smt Smt Smt Smt Smt
Fakultas I II III IV V VI VII Jumlah
Ekonomi 285 120 113 47 85 - - 650
Pendikan 99 37 33 18 26 - - 213
Ilmu Pasti 75 68 30 10 20 - - 203
Teknik 123 66 54 29 40 - - 312
Hukum 42 29 20 6 19 - - 116
Kedokteran 57 79 70 65 65 64 68 468
Jumlah 681 399 320 175 255 64 68 1962
Tabel tiga arah ialah tabel yang menunjukkan tiga hal atau tiga karakteristik,
misalnya :
- Data personalia, menurut masa kerja, pendidikan, dan golongan ; masa kerja,
umur, serta golongan dsb.
- Data peralatan, menurut umur, merk, dan jenis; merk dan unit kerja dsb
BENTUK GRAFIK
Grafik garis tunggal (single line chart) adalah grafik yang terdiri dari satu garis untuk
menggambarkan perkembangan (trend) dari suatu karakteristik.
Grafik garis berganda (multiple line chart) adalah grafik yang terdiri dari beberapa
garis untuk menggambarkan perkembangan beberapa hal/kejadian sekaligus.
Misalnya, perkembangan export menurut gongan A, B, dan minyak bumi,
perkembangan hasil penjualan menurut jenisnya (barang A,B,C), perkembangan
jumlha korban kecelakaan lalu lintas menurut jenis korban (meninggal, luka berat
dan luka ringan) dsb.
Grafi garis komponen berganda (Multiple component line chart), serupa dengan
grafik berganda, tetapi garis yang teratas/terakhir menggambarkan jumlah (total) dari
komponen-komponen, sedangkan garis lainnya menggambarkan masing-masing
komponen.
Grafik garis persentase komponen berganda (multiple percentage component line
chart), adalah sama seperti grafik garis berganda, kecuali bahwa masing-masing
nilai komponen dinyatakan dalam persentase, sehingga garis teratas (terakhir)
merupakan garis yang menunjukkan 100%.
Grafik garis berimbang neto (net balanced line). Nilai-nilai selisih dengan garis
timbangan dapat diberi warna yang berbeda untuk menilai selisih yang positif dan
negative.
Grafik batangan tunggal (single bar chart)
Grafik batangan komponen berganda (multi component bar chart)
Grafik batangan berimbang neto (net balanced bar chart)
Grafik lingkaran tunggal (single pie chart), penggambaran ini akan lebih tepat apabila
kita hendak mengetahui perbandingan nilai-nilai karakterisitik yang satu dengan yang
lain, dan dengan keseluruhannya.
Grafik lingkaran berganda (multi pie chart)
Grafik peta (cartogram chart), cartogram adalah grafik berupa peta. Suatu
karakteristik (sifat/hal) yang akan digambarkan, diberi tanda/cirri khusus (berupa
ganbar sederhana) misalnya untuk menggambarkan hasil bumi (kopi) di
daerah/tempat yang menghasilkan hasil bumi (kopi) pada peta diberi tanda gambar
kopi dsb.
Grafik gambar (pictogram chart), adalah grafik yang disajikan dalam bentuk gambar.
Didalam bidang koordinat XY dinyatakan gambar-gambar dengan cirri khusus untuk
suatu karakteristik. Misalnya, untuk menyatakan jumlah penduduk dapat
digambarkan berupa gambar orang (secara sederhana).
STATISTIK INDUSTRI – MODUL 4 DISTRIBUSI FREKUENSI
Tujuan Belajar Setelah mempelajari bab ini, Anda diharap ,kan mampu :
- menyebutkan arti dan manfaat distribusi frekuensi - menyusun distribusi frekuensi data kualitatif dan kuantitatif - menggambar grafik frekuensi, frekuensi relatif dan frekuensi kumulatif
Untuk dapat memahami data dengan mudah, maka baik data kualitatif maupun kuantitatif harus disajikan dalam bentuk yang ringkas dan jelas. Salah satu cara untuk meringkas data adalah dengan distribusi frekuensi, yaitu pengelompokan data ke dalam beberapa kelompok (kelas) dan kemudian dihitung banyaknya data yang masuk ke dalam tiap kelas. 1. DISTRIBUSI FREKUENSI DATA KUALITATIF
Data pada tabel di bawah ini merupakan data kualitaif 50 orang pembeli komputer dari lima jenis perusahaan komputer. Dari data tersebut kita kesulitan untuk mengetahui dengan cepat jenis komputer mana yang paling banyak diminati. Untuk menjawab pertanyaan tersebut, maka datanya perlu disajikan dalam distribusi frekuensi. Data hipotesis 50 orang pembeli komputer dari beberapa jenis perusahaan komputer IBM Compaq Compaq IBM IBM Compaq Compaq Packard Bell Gateway 2001 Packard Bell Apple Apple IBM Apple Compaq Packard Bell Compaq Compaq IBM Packard Bell Gateway 2000 Apple Apple Packard Bell Compaq IBM Apple Apple Packard Bell Packard Bell Apple Apple Compaq Gateway 2000 Compaq Packard Bell IBM Gateway 2000 Compaq Apple Packard Bell IBM Packard Bell Compaq Packard Bell Gateway 2001 Apple IBM Apple Apple Distribusi Hipotesis Frekuensi Pembelian Komputer
Perusahaan Frekuensi Apple
Compaq Gateway 2000
IBM Packard Bell
13 12 5 9
11 Jumlah 50
Distribusi Frekuensi Relatif dan Persentase Data Kualitatif
Distribusi frekuensi menunnjukkan jumlah atau banyaknya item dalam setiap kategori.Meskipun demikian, kita sering tertarik untuk mengetahui proporsi atau persentase item dalam setiap kelas. Frekuensi relatif dari suatu kelas adalah proporsi item dalam setiap jumlah kelas terhadap jumlah keseluruhan item dalam data tersebut. Jika sekelompok data memiliki n observasi, maka frekuensi relatif dari setiap kategori atau kelas akan diberikan sebagai berikut : Frekuensi relatif dari suatu kelas = Frekuensi kelas n Sedangkan frekuensi persentase dari suatu kelas adalah frekuensi relatif kelas tersebut dikalikan dengan 100. Distribusi frekuensi relatif adalah ringkasan dalam bentuk tabel dari sekelompok data yang menunjukkan frekuensi relatif bagi setiap kelas. Distribusi frekuensi persentase adalah ringkasan dalam bentuk tabel dari sekelompok data yang menunjukkan frekuensi persentase dari bagi setiap kelas. Dengan menggunakan rumus frekuensi relatif diatas, kita akan mendapatkan data tentang pembelian komputer. Dari tabel diatas dapat kita hitung frekuensi relatif untuk Apple, yaitu 13/50 = 0,26, untuk Compaq ,yaitu 12/50 = 0, 24 dan seterusnya. Sedangkan untuk mendapatkan frekuensi persentase, frekuensi relatif tersebut dikalikan dengan 100. Hasil perhitungan seluruhnya seperti pada tabel dibawah ini. Distribusi Hipotetis Frekuensi Relatif dan Persentase Pembelian Komputer
Perusahaan Frekuensi Relatif Frekuensi Persentase
Apple Compaq Gateway 2001 IBM Packard Bell
0,26 0,24 0,10 0,18 0,22
26 24 10 18 22
Total 1,00 100
2. DISTRIBUSI FREKUENSI DATA KUANTITATIF Definisi tentang distribusi frekuensi adalah sama baik untuk data kualitatif maupun kuantitatif. Meskipin demikian kita harus lebih hati-hati dalam menentukan kelas yang digunakan pada distribusi frekuensi. Ada tiga hal yang perlu diperhatikan dalam menentukan kelas bagi distribusi frekuensi untuk data kuantitatif, yaitu jumlah kelas, lebar kelas dan batas kelas.
Jumlah Kelas Banyaknya kelas sebaiknya antara 7 dan 15, atau paling banyak 20 (tidak ada aturan umum yang menentukan jumlah kelas). HA Sturges pada tahun 1926 menulis artikel dengan judul : “The Class of a Class Interval” dalam Journal of the American Statistical Association, yang mengemukakan suatu rumus untuk menentukan banyaknya kelas sebagai berikut : k = 1 + 3,322 log n dimana k = banyaknya kelas n = banyaknya nilai observasi Rumus tersebut diberi nama Kriterium Sturges dan merupakan perkiraan tentang banyaknya kelas. Misalnya data dengan n = 100, maka banyaknya kelas k adalah sebagai berikut : k = 1 + 3,322 log 100 = 1 + 3,322 (2) = 1 + 6,644 = 7,644 Jadi banyaknya kelas sebaiknya 7 Interval Kelas Disarankan interval atau lebar kelas adalah sama untuk setiap kelas. Sebenarnya, pemilihan interval kelas dan jumlah kelas atau banyaknya kelas tidak independen. Semakin banyak jumlah kelas berarti semakin kecil interval kelas dan sebaliknya. Pada umumnya, untuk menentukan besarnya kelas (panjang interval) digunakan rumus : Xn – X1 c = ---------- k dimana : c = perkiraan besarnya kelas (class width, class size, class length) k = banyaknya kelas Xn = nilai observasi terbesar X1 = nilai observasi terkecil Ada beberapa hal yang perlu diperhatikan dalam penentuan interval kelas, yaitu : a. Kelas interval tidak perlu harus sama
Pembuatan kelas interval sangat tergantung pada tujuannya.Misalnya, kita hanya tertarik kepada rincian perusahaan yang mempunyai modal antara 50 – 70 juta dan dibawah 50 serta 70 atau lebih, maka bentuk tabel frekuensinya adalah sebagai berikut :
Batas Kelas Modal f < 50
50 – 59 60 – 69
> 70
5 11 20 64
b. Kalau datanya diskrit, atau hasil pengumpulan data dari variabel diskrit, maka
pembuatan kelas intervalnya seperti terlihat dalam tabel berikut :
Upah Mingguan ( Rp ) Banyaknya Karyawan ( f ) < 1.000
1000 – 1999 2000 - 2999 3000 - 3999 4000 - 4999 5000 - 5999 6000 - 7499 7500 - 9999
10000 – 14999 > 15000
2.918 5.327 6.272 7.275 7.117 6.363 6.940 5.186 3.017
Batas Kelas
Batas kelas bawah menunjukkan kemungkinan nilai data terkecil pada suatu kelas. Sedangkan batas kelas atas menunjukkan kemungkinan nilai data terbesar dalam suatu kelas. Jika diketahui kelas-kelas interval adalah 30 – 39, 40 – 49, 50 – 59, dan seterusnya, maka untuk nilai batas bawahnya (lower limit) adalah 30, 40, 50, dan seterusnya.Sedangkan nilai batas atasnya (upper limit) adalah 39,49,59, dan seterusnya. Perlu diperhatikan bahwa kelas interval 30 – 39, 40 – 49, dan seterusnya secara teoritis mencakup seluruh nilai interval 29,5 – 39,5 ; 39,5 – 49,5, dan seterusnya. Nilai – nilai 29,5 ; 39,5 disebut batas kelas bawah yang sebenarnya (lower class boundary), sedangkan 39,5 ; 49,5, dan seterusnya disebut batas kelas atas yang sebenarnya (upeer class boundary). Jarak batas kelas atas dan batas kelas bawah disebut juga lebar atau panjang kelas.
Frekuensi Relatif, Frekuensi Kumulatif dan Grafik Seringkali unyuk keperluan analisis selain dibuat tabel frekuensi juga dibuat tabek frekuensi relatif dan kumulatif (untuk analisis tabel), kemudian dibuat grafiknya (untuk analisis grafik). Grafik berupa gambar pada umumnya lebih mudah diambil kesimpulannya secara cepat daripada tabel. Itulah sebabnya data seringkali disajikan dalam bentuk grafik. Pada dasarnya, bentuk tabel frekuensi relatif dan kumulatif adalah seperti terlihat pada tabel berikut :
X f fr fk* fk** X1 X2 .
Xi . .
Xk
f1 f2 . fi . . fk
f1 /n f2 / n
. fi / n
.
. fk / n
f 1 f 1 + f 2
. f 1 + f2 + ..+ fi
.
. f1+f2+..+fi+..+fk
f1+f2+..+fi+..+fk f2+..+fi+..+fk
. fi+..+fk.
.
. fk
Jumlah
k ∑ fi = n
I = 1
∑fi = 1
n
* = ≤ , ** = ≥ Contoh pembuatan tabel frekuensi, frekuensi relatif dan frekuensi kumultaif : Suatu penelitian dilakukan oleh pejabat dari Badan Koordinasi Penanamana Modal (BKPM) terhadap 100 perusahaan. Salah satu karakteristik yang ditanyakan ialah besarnya modal yang dimiliki perusahaan tersebut. Kalau X adalah modal dalam jutaan rupiah, maka nilai X adalah sebagai berikut : 75 86 66 86 50 78 66 79 68 60 80 83 87 79 80 77 81 92 57 52 58 82 73 95 66 60 84 80 79 63 80 80 58 84 96 87 72 65 79 80 86 68 76 41 80 40 63 90 83 94 76 66 74 76 68 82 59 75 35 34 65 63 85 87 79 77 76 74 76 78 75 60 96 74 73 87 52 98 88 64 76 69 60 74 72 76 57 64 67 58 72 80 72 56 73 82 78 45 75 56
Penyelesaian : Data diatas merupakan data mentah (raw data) yang belum dapat menjawab pertanyaan mengenai misalnya, berapa banyak perusahaan yang mempunyai modal antara Rp. 30 – 39 juta, berapa yang memiliki modal antara Rp. 90 – 90 juta. Kemudian berapa persen perusahaan yang modalnya antara Rp. 90 – 99 juta; kurang dari Rp. 79 juta, berapa rata-rata modal dsb. Untuk menjawab pertanyaan pertama harus dibuat tabel frekuensi; untuk pertanyaan kedua harus dibuat tabel frekuensi relatif; untuk pertanyaan ketiga harus dibuat frekuensi kumulatif, sedangkan untuk pertanyaan terakhir mengenai besarnya rata-rata modal perusahaan harus dilakukan perhitungan
Batas
Kelas Modal (jutaan Rp)
Nilai Tengah/
Mean X
Frekuens
i f
Frekuensi Relatif
fr
Frekuensi Kumulatif
fk*(FL)
fk** (FM)
(1) (2) (3) (4) (5) (6) 30-39 40-49 50-59 60-69 70-79 80-89 90-99
34,5 44,5 54,5 64,5 74,5 84,5 94,5
2 3 11 20 32 25 17
9,02 ( 2%) 0,03 ( 3%) 0,11 (11%) 0,20 (20%) 0,32 (32%) 0,25 (25%) 0,07 ( 7%)
2 ( 2%) 5 ( 5%) 16 (16%) 36 (36%) 68 (68%) 93 (93%) 100 (100%)
100 (100%) 96 ( 96%) 95 ( 95%) 84 ( 84%) 64 ( 64%) 32 ( 32%) 7 ( 7%)
Jumlah 100 1 (100%) FL : Frekuensi data yang lebih kecil dari batas kelas atas yang sebenarnya pada tiap kelas (39,5; 49,5 dan seterusnya) FM : Frekuensi data yang lebih besar dari batas kelas bawah yang sebenarnya pada tiap kelas (29,5; 39,5 dan seterusnya) ISTILAH PENTING Distribusi frekuensi adalah ringkasan dalam bentuk tabel dari suatu kelompok data yang menunjukkan item-item (kategori-kategori) dalam beberapa kelas. Frekuensi relatif adalah proporsi dari jumlah item / kategori dalam setiap kelas terhadap keseluruhan item dalam data tersebut. Frekuensi persentase adalah frekuensi relatif kelas dikalikan 100. Distribusi frekuensi relatif adalah ringkasan dalam bentuk tabel dari sekelompok data yang menunjukkan frekuensi relatif bagi setiap kelas. Distribusi frekuensi persentase adalah ringkasan dalam bentuk tabel dari sekelompok data yang menunjukkan frekuensi persentase bagi setiap kelas. Nilai kelas interval adalah selisih antara dua lower limit ( batas atas kelas)
STATISTIK INDUSTRI MODUL 5 UKURAN PEMUSATAN
Tujuan Belajar : Setelah mempelajari bab ini, Anda diharapkan :
- mengetahui jenis-jenis ukuran pemusatan - menggunakan rumus-rumus ukuran pemusatan - menghitung beberapa ukuran pemusatan - memahami arti dan manfaat dari beberapa ukuran pemusatan
DEFINISI UKURAN PEMUSATAN Rata-rata (average) adalah nilai yang mewakili himpunan atau sekelompok data (a set of data). Nilai rata-rata umumnya cenderung terletak di tengah suatu kelompok data yang disusun menurut besar kecilnya nilai. Dengan perkataan lain, ia mempunyai kecenderungan memusat, sehingga sering disebut ukuran kecenderungan memusat (measures of central tendency). Beberapa jenis rata-rata yang sering dipergunakan ialah rata-rata hitung (aritmetic mean atau sering disingkat mean saja), rata-rata ukur (geometric mean), dan rata-rata harmonis (harmonic mean). Setiap rata-rata tersebut selain mempunyai keunggulan juga memilki kelemahan, dan ketepatan penggunaannya sangat tergantung pada sifat dari data dan tujuannya (misalnya, untuk melakukan analisis). Dalam modul ini yang dimaksud dengan nilai rata-rata ialah rata-rata hitung, kecuali kalau ada keterangan atau penjelasan lain. Dalam kehidupan sehari-hari rata-rata ini lebih banyak dikenal. Misalnya rata-rata gaji / upah karyawan perusahaan swasta per bulan, rata-rata produksi beras per tahun, rata-rata umur karyawan suatu departemen dsb. Rata-rata hitung, yang untuk selanjutnya kita songkat dengan rata-rata, sering digunakan sebagai dasar perbandingan antara dua kelompok nilai atau lebih. Misalnya ada dua mahasiswa, yaitu Toni dan Joni dari Fakultas Ekonomi suatu perguruan tinggi swasta di Jakarta, yang menempuh ujian lima mata kuliah, yaitu statistik, matematika, teori ekonomi, pemasaran, dan metode riset.. Untuk menentukan mana yang lebih pandai antara Toni dan Joni, dapat dipergunakan nilai rata-rata. Misalkan hasil ujian Toni dan Joni adalah sebagai berikut :
Mata Kuliah Hasil Ujian Toni ( X ) Hasil Ujian Joni ( Y )
Statistik Matematika Teori Ekonomi Pe masaran Metode Riset
8 7 6 8 7
7 6 5 6 6
Jumlah 36 30 Rata-rata 36:5 = 7,2 30:5 = 6 Dari nilai rata-rata tersebut, dapat disimpulkan bahwa Toni lebih pandai dari Joni
1. Rata-rata Hitung Kalau kita mempunyai nilai variabel X, sebagai hasil pengamatan atau observasi sebanyak N kali, yaitu X1, X2,........, Xb, .......,XN, maka : a. Rata-rata sebenarnya (populasi)
1 N µ = ---- ∑ Xi N i = 1
1 = ---- (X1 + X 2 + .....+ Xi + ......+ XN)
N µ dibaca myu,yaitu rata-rata sebenarnya yang disebut parameter. Rata-rata
hitung ini dihitung berdasarkan populasi. Karena itu, rata-rata sebenarnya sering juga disebut rata-rata populasi.
b. Rata-rata perkiraan (sample)
Kalau rata-rata tersebut dihitung berdasarkan sampel sebanyak n dimana n < N observasi, maka rata-rata yang diperoleh disebut rata-rata perkiraan, atau rata- rata sampel, yang diberi simbol X bar (X dengan garis diatas) yang rumusnya adalah sebagai berikut :
1
n X bar = --- ∑ Xi
n i = 1
= 1 ( X1 + X2 +.......+ Xi +.......+ Xn )
n X dengan garis diatas (dibaca X bar), yaitu simbol rata-rata
X bar merupakan perkiraan µ
Contoh : Berikut disajikan data penjualan suatu perusahaan selama 10 tahun Xi = hasil penjualan dalam jutaan rupiah, i = 10 X1 = 50, X2 = 60, X3 = 40, X4 = 70, X5 = 80, X6 = 90, X7 = 100, X8 = 65, X9 = 75, X10 = 85
(Angka-angka yang digaris bawahi merupakan sampel) a. Hitung rata-rata hasil penjualan sebenarnya b. Ambil sampel sebanyak n = 5. Misalnya sampel yang diambil X2, X4, X5, X8, X10. Hitung rata-rata perkiraan hasil penjualan per tahun
Penyelesaian : a. Rata-rata sebenarnya = 1/10 (50 + 60 +.......+ 85) = 1/10 (715) = 71,5 Jadi rata-rata hasil penjualan per tahun = Rp. 71,5 juta b. Rata-rata perkiraan = 1/5 ( 60 + 70 + 80 + 65 + 85 ) = 72
Jadi rata-rata perkiraan hasil penjualan per tahun = Rp. 72 juta (sangat mendekati rata-rata sebenarnya)
2. Rata-rata Hitung Data Berkelompok
Apabila data sudah disajikan dalam bentuk tabel frekuensi, dimana X1 terjadi f1 kali, X2 terjadi f2 kali, dan seterusnya fk terjadi fk kali, maka rumus rata-rata dari data yang sudah dibuat tabel frekuensinya adalah sebagai berikut : k ∑ fi Xi
i = 1 X bar = ------------ k ∑ fi i = 1 k k Oleh karena ∑ fi = n, maka X = 1 ∑ fi Xi I = 1 n i = 1 k ∑ Mi fi i = 1 atau X = -------------- , dimana Mi = nilai tengah kelas interval k ke- i (untuk data berkelompok) ∑ fi i = 1 Contoh : Perhatikan tabel berikut. Berdasarkan data tersebut, hitunglah rata-ratanya. x 8 6 4 5 7 9 f 2 3 4 3 2 1
Penyelesaian : ∑ fi Xi 8(2) + 6(3) + 4(4) + 5(3) + 7(2) + 9(1) 88 X bar = --------- = -------------------------------------------------- = --- = 5,87 ∑ fi 2 + 3 + 4 + 3 + 2 + 1 15 Jadi rata-rata dari data diatas adalah 5,87
3. Rata-rata Hitung Tertimbang Seringkali dalam suatu persoalan, masing-masing nilai mempunyai nilai bobot/timbangan tertentu, misalnya X1 dengan timbangan W1, X2 dengan timbangan W2, dan seterusnya sampai Xn dengan timbangan Wn. Oleh karena itu, ratta-rata yang menggunakan timbangan tersebut disebut rata-rata tertimbang (weighted arithmetic mean) dengan rumus sebagai berikut : ∑ Wi Xi W1X1 + W2X2 + ........+ WiXi + ........+ WkXk X bar = ----------- = ------------------------------------------------------------- ∑ Wi W1 + W2 +,,,,,,,, + Wi + …….+ Wk Perhatikan bahwa dalam rumus diatas, timbangannya berupa frekuensi (Wi=fi) Contoh : Data berikut menunjukkan nilai hasil ujian matematika mahasiswa semester IV sebuah perguruan tinggi. 70 75 45 70 50 60 90 75 45 60 60 90 70 50 45 75 70 60 90 45 90 70 75 60 60 45 50 60 Carilah rata-rata nilai hasil ujian matematika dengan cara : a, data tidak berkelompok b. data dikelompokkan Penyelesaian : ∑ Xi 1 a. X bar = ------- = ----- (70 + 75 + …….. + 60) = 64,46 n 28 b. x 45 50 60 70 75 90 f 5 3 7 5 4 4
X = nilai matematika f = banyak mahasiswa ∑ fiXi 45(5) + 50(3) + 60(7) + 70(5) + 75(4) + 90(4) X bar = ------- = ------------------------------------------------------------ = 64,46 ∑ fi 5 + 3 + 7 + 5 + 4 + 4
4. Beberapa Sifat / Ciri Rata-rata Hitung a.Jumlah deviasi atau selisih dari suatu kelompok nilai terhadap rata- ratanya sama dengan nol, yaitu :
n 1 ∑ ( Xi – X bar) = 0 dimana X bar = --- ∑ Xi atau ∑ Xi = n X i = 1 n
Bukti : ∑ ( Xi – X bar) = ∑ Xi - ∑ X bar = ∑ Xi - n X bar = ∑ Xi - ∑ Xi = 0 n Ingat : ∑ k = k + k + k + .......+ k = nk I=1 n ∑ X bar = X bar + X Contoh : Diketahui X1 = 5, X2 = 4, X3 = 6, X4 = 7 dan X5 = 3. Hitung rata- ratanya ( X bar) dan tunjukkan bahwa ∑ ( Xi – X bar) = 0 Penyelesaian : 1 1 25 X = ----- ∑ Xi = ------ ( 5 + 4 + 6 + 7 + 3 ) = ------- = 5 n 5 5 ∑ ( Xi – X bar ) = (5 – 5) + (4 – 5) + (6 – 5) + (7 – 5) + (3 – 5) = 0 + (- 1) + 1 + 2 + (-2) = 0 b. Jumlah deviasi kuadrat dari suatu kelompok nilai terhadap nilai k akan minimum ( terkecil) kalau k = X bar. Maksudnya n ∑ ( Xi – k )2 ≥ ∑ ( Xi – X )2
i = 1 i = 1 Contoh :
Diketahui X1 = 5, X2 = 7, X3 = 8. Hitunglah X dan tunjukkan bahwa
∑(Xi - k)2 ≥ ∑ (Xi - X)2 , kalau k merupakan salah satu nilai dari kelompok nilai tersebut. Penyelesaian : 1 1 X = ---- ∑ Xi = ----- ( 5 + 7 + 8 ) = 6,67 n 3 k = 5 -- ∑ ( Xi – 5 )2 = ( 5 – 5 )2 + ( 7 – 5 )2 + ( 8 – 5 )2 = 13 k = 7 -- ∑ ( Xi – 7 )2 = ( 5 – 7 )2 + ( 7 – 7 )2 + ( 8 – 7 )2 = 5 k = 5 -- ∑ ( Xi – 5 )2 = ( 5 – 5 )2 + ( 7 – 5 )2 + ( 8 – 5 )2 = 10 k = X bar = 6,67 -- ∑ ( Xi – X bar)2 = ∑ ( Xi – 6,67 )2
= (5 – 6,67)2 + (7 – 6,67)2 + (8 – 6,67)2 = 4,67 Jadi ternyata ∑ ( Xi – k )2 ≥ ∑ ( Xi – X bar )2, dimana 13, 5 dan 10 adalah ≥
dari 4,67.
c. Kalau ada kelompok nilai. Kelompok pertama sebanyak f1 nilai dengan rata-rata X1 Kelompok kedua sebanyak f2 nilai dengan rata-rata X2 Kelompok ke-i sebanyak fi nilai dengan rata-rata Xi Kelompok ke-k sebanyak fk nilai dengan rata-rata Xk Oleh karenanya, rata-rata dari seluruh nilai adalah sebagai berikut : ∑ fiXi bar f1X1bar + f2X2bar + ...... + fiXibar + .......+ fkXkbar X = ------------ = ---------------------------------------------------------------------- ∑ fi f1 + f2 + ......+ fi + ......+ fk Contoh : Ada 2 kelompok karyawan. Kelompok pertama terdiri dari 60 orang, dimana masing-masing menerima upah per minggu Rp. 30.000 dan kelompok kedua terdiri dari 20 orang masing-masing menerima upah perminggu Rp. 20.000. a. Hitung rata-rata upah perminggu dari seluruh karyawan b. Apakah hasil perhitungan rata-ratanya akan sama kalau 60 orang tersebut
menerima rata-rata upah per minggu Rp. 30.000 ( Xi = Rp. 30.000 ) dan 20 orang menerima rata-rata upah perminggu Rp. 20.000 ( X2 = Rp. 20.000 )
Penyelesaian : a. X = upah mingguan dalam ribuan rupiah f = banyaknya karyawan yang menerima upah X
X 30 20 F 60 20
f1X1 + f2X2 60(30) + 20(20) 2.200
X bar = ----------------- = -------------------------- = --------- = 27,5 f1 + f2 60 + 20 80
Jadi rata-rata upah mingguan per karyawan = Rp. 27.000.
∑ Xi b. Jika X bar = ------ , maka n X bar = ∑ Xi n
∑ Xi Kelompok pertama X1 bar = ------ , T1 = ∑ Xi ( kelompok pertama) n1 Karena n1 = f1 , maka T1 = X1 bar.n1 atau X1 barf1 atau f1X1 bar ∑ Xi Kelompok kedua X2 bar = ------ , T2 = ∑ Xi ( kelompok kedua) n2 Karena n2 = f2 , maka T2 = X2 bar.n2 atau X2 barf1 atau f1X2 bar
Jumlah karyawan = f1 + f2 = 60 + 20 atau 80 Jumlah upah seluruh karyawan dibagi dengan banyaknya karyawan T1 + T2 f1X1 bar + f2X2 bar 2.200 X bar = ------------- = ---------------------------- = --------- = 27,5 f1 + f2 60 + 20 80
5. Median
a. Data tidak berkelompok
Kalau ada sekelompok nilai sebanyak n diurutkan mulai dari yang terkecil X1 sampai dengan yang terbesar Xn, maka nilai tengah disebut Median (Med). Untuk n ganjil : Kalau k adalah suatu bilangan konstan dan n ganjil, maka selalu dapat ditulis : n - 1 n = 2k + 1 atau k = ------- 2 Contoh : Ada 7 orang karyawan dengan upah per bulan masing-masing Rp. 20.000, Rp. 80.000, Rp. 75.000, 60.000, Rp. 50.000, Rp. 85.000, dan Rp. 45.000. Tentukan median upah karyawan tersebut. Penyelesaian : Pertama : Urutkan dari yang terkecil sampai dengan yang terbesar X1 = 20.000, X2 = 45.000, X3 = 50.000, X4 = 60.000 X5 = 75.000, X6 = 80.000, X7 = 85.000 Kedua : Tentukan nilai dari k dari 7 = 2k + 1 -- k = 3 Jadi median = Med = Xk + 1 = X4 = Rp. 60.000 Perhatikan bahwa X4 merupakan nilai yang berada di tengah – tengah setelah diurutkan mulai yang terkecil sampai dengan yang terbesar. X1 X2 X3 X4 X5 X6 X7 ---- X4 adalah median
Untuk n genap : Kalau k adalah suatu bilangan konstan dan n genap, maka selalu dapat ditulis n = 2k atau k = n/2. Misal n = 8, maka k = 4 Median = ½ (Xk + Xk + 1) Contoh ; 8 karyawan mempunyai upah (dalam ribuan rupiah) adalah 20,80,75,60,50,85,45,90. Berapa nilai median? Penyelesaian : X1 = 20, X2 = 45, X3 = 50, X4 = 60 X5 = 75, X6 = 80, X7 = 85, X8 = 90 8 = 2k --- k = 4 Med = ½ ( X4 + X5 ) = ½ ( 60 + 75 ) = 67,5 Jadi median upah karyawan = Rp. 67.500
b.Data Berkelompok Untuk data yang berkelompok, nilai median dicari dengan interpolasi dengan rumus sebagai berikut : n/2 – ( ∑ f i ) 0 Med = L0 + e x ------------------ f m L0 = nilai batas bawah dari kelas yang mengandung atau memuat nilai median n = banyak observasi ∑fi = jumlah frekuensi dari semua kelas dibawah kelas yang mengandung median ( kelas yang mengandung median tidak termasuk ) f m = frekuensi dari kelas yang mengandung median c = besarnya kelas interval, jarak antara kelas yang satu dengan lainnya atau besarnya kelas interval yang mengandung median Secara geometrik median juga merupakan nilai X dari absis ( sumbu horizontal ) sesuai dengan jarak tegak lurus yang membagi suatu histogram ( seluruh kurva ) menjadi dua daerah yang sama luasnya ( 50% sebelah kiri median, 50% sebelah kanan median ). Jadi seluruh observasi seolah-olah dibagi menjadi dua, setengah disebelah kiri median ( yang terdiri dari observasi yang nilainya sama atau lebih kecil dari median ) dan setengahnya lagi disebelah kanan median ( yang terdiri dari observasi yang nilainya sama atau lebih besar dari median ). Contoh : Misalkan X adalah upah bulanan karyawan sebuah perusahaan asing yang dibulatkan menjadi ribuan rupiah. Ada 40 orang karyawan yang sedang diselidiki
dan salah satu perttanyaan tentang besarnya upah bulanan dalam ribuan rupiah hasilnya adalah sebagai berikut : 146 147 147 148 149 150 150 152 153 154 156 157 158 161 163 164 165 168 173 176 119 125 126 128 132 135 135 135 136 138 138 140 140 142 142 144 144 145 145 146
a. Berapa besarnya nilai median upah karyawan? b. Kalau data dikelompokkan, kelas-kelas disajikan pada tabel dibawah ini.
Dengan menggunakan rumus median untuk data berkelompok, hitunglah nilai median
Upah hipotetis per bulan 40 karyawan
Upah Sistem Tally Frekuensi 118 – 126 127 – 135 136 – 144 145 – 153 154 – 162 163 – 171 172 – 180
/// ///// ///// //// ///// ///// // ///// //// //
3 5 9
12 5 4 2
Jumlah 40 Penyelesaian : a. Data diurutkan dari yang terkecil ( X1) sampai yang terbesar ( X40)
119 125 126 128 132 135 135 135 136 138 138 140 140 142 142 144 144 145 145 (146) 146 147 147 148 149 150 150 152 153 154 156 157 158 161 163 164 165 168 173 176
Menentukan nilai k : 40 = 2 k - k = 40 : 2 = 20 Med = ½ ( Xk + Xk+1) = ½ ( X20 + X20+1) = ½ ( X20 + X21) = ½ ( 146 + 146 ) = 146 b. Perhatikan tabel berikut :
Upah Frekuensi 118 – 126 127 – 135 136 – 144 145 – 153 154 – 162 163 – 171 172 – 180
3 5 9
12 -------- 5 4 2
Kelas mengandung med dengan nilai frekuensi fm = 12
Jumlah 40
Upah dianggap sebagai bilangan-bilangan yang didistribusikan secara kontinu. Dalam hal ini median merupakan upah yang mempunyai ciri/sifat sedemikian rupa sehingga setengah atau 50% dari observasi (jumlah frekuensi), yaitu 40/2 = 20 observasi, terletak dibawah median dan setengah lainnya diatas median tersebut. Jumlah tiga frekuensi pertama f1 + f2 + f3 = 3 + 5 + 9 = 17 observasi belum sampai 20, atau belum ada setengahnya. Untuk mencapai 20 observasi diperlukan tiga observasi dari kelas keempat yang frekuensinya = f4 = 12. Jadi median terletak dalam kelas keempat. Karena kelas interval yang keempat, yaitu 145 – 153, sama dengan (setelah memperhitungkan bahwa upah merupakan data yang kontinyu) 144,5 – 153,5, maka median akan terletak di posisi 3/12 dalam jarak kelas interval 144,5 – 153,5. L0 = 144,5 (nilai batas kelas bawah,setelah diadakan koreksi kontinuitas) n/2 = 40/2 = 20 (∑fi)0 = f1 + f2 + f3 = 17 fm = 12 c = (153,5 – 144,5 ) = 9 ...> jarak antara nilai batas bawah dan nilai batas atas darikelas interval yang memuat median atau jarak antara suatu kelas dengan kelas berikutnya, baik diukur dengan nilai atas bawah atau batas atas 145-136 = 9 atau 153-144 = 9 (sama) Cara ini disebut interpolasi, sehingga hasilnya tidak tepat seperti kalau dihitung secara langsung. Walaupun demikian, hasilnya akan mendekati nilai sebenarnya. Didalam prpakteknya kita sering tidak tahu data aslinya, tetapi data tersebut sudah disajikan dalam tabel frekuensi, sudah dibuat kelas-kelas, kelompok-kelompok, atau kategori-kategori. Jadi, rumus interpolasi ini sangat penting untuk menghitung median. Dengan menggunakan rumus median untuk data berkelompok, akan dihasilkan sebagai berikut : n/2 – ( ∑ f i ) 0 40/2 – 17 27 Med = L0 + c x ------------------ = 144,5 + 9 x ----------- = 144,5 + ------ f m 12 12 = 146,75
6. Modus
a. Data tidak berkelompok Modus dari suatu kelompok nilai adalah nilai kelompok tersebut yang mempunyai frekuensi tertinggi, atau nilai yang paling banyak terjadi didalam suatu kelompok nilai. Untuk selanjutnya kita sebut Mod.
X f X1 X2 . .
Xi . .
Xn
f1 f2 . . fi . .
fn
Xi = Modus = Mod kalau fi mempunyai nilai terbesar dibandingkan dengan frekuensi lainnya f1 > f i +1 dan > fi+1 dan f1 > f i – 1, untuk semua i Suatu distribusi mungkin tidak mempunyai Mod atau mungkin mempunyai dua Mod atau lebih. Distribusi disebut Unimodal, kalau mempunyai satu Mod, Bimodal kalau mempunyai dua mod, atau Multimodal kalau mempunyai lebih dari dua mod. Contoh :
Dari data berikut, apakah ada Mod-nya? Kalau ada, tentukan nilainya.
a. 2 2 5 7 9 9 9 10 10 11 12 18 b. 3 5 8 10 12 15 16 c. 2 3 4 4 4 5 5 7 7 7 9 Penyelesaian : a. Langkah pertama susunlah tabel frekuensinya
X F 2 5 7
Mod ------- 9 10 11 12 18
2 1 1 3 2 1 1 1
Jadi Mod = 9, sebab nilai observasi ini yang paling banyak atau mempunyai frekuensi terbesar
b. Buatlah tabel frekuensi X F 3 5 8
10 12 15 16
1 1 1 1 1 1 1
Karena semua nilai mempunyai frekuensi yang sama, maka distribusi ini tidak mempunyai Mod
c.Buatlah tabel frekuensinya X F 2
3 Mod 1 4 5 Mod 2 7
9
1 1 3 2 3 1
Oleh karena terdapat dua nilai observasi yang mempunyai frekuensi terbanyak, maka distribusi memiliki dua Mod, yaitu 4 dan 7 b. Data berkelompok
Apabila data sudah dikelompokkan dan disajikan dalam tabel frekuensi, maka dalam mencari modusnya harus dipergunakan rumus berikut ini : ( f i ) 0 Mod = L0 + c x ------------------------ ( f i ) 0 +( f 2 ) 0 L0 = nilai batas bawah, kelas yang memuat modus f m0 = frekuensi kelas yang memuat modus ( f 1 ) 0 = f m0 - f( m0 - 1 ) = selisih frekuensi kelas yang memuat modus dengan frekuensi kelas
sebelumnya (bawahnya) ( f 2 ) 0 = f m0 f( m0 + 1 ) = selisih frekuensi kelas yang memuat modus dengan frekuensi kelas sebelumnya (bawahnya) c = besarnya jarak antara nilai batas atas dan nilai batas bawah dari kelas
yang memuat modus Contoh : Dari data yang disajikan dalam tabel frekuensi berikut ini, carilah modusnya
Kelas F 50,00 – 59,99 60,00 – 69,99 70,00 – 70,99
80,00 – 89,99 90,00 – 99,99
100,00 – 109,00 110,00 – 119,00
8 10
16 ---- kelas yang berisi modus fm0 = 16
14 10 5 2
Jumlah Penyelesaian : L0 = ½ ( 69,99 + 70,00 ) = 69,995
c = 79,995 – 69,995 = 10 f( m0-1) = 10 f( m0+1) = 14 ( f 1 ) 0 = 16 – 10 = 6 ( f 2 ) 0 = 16 – 14 = 2 ( f i ) 0 6 Mod = L0 + c x ------------------------ = 69,995 + 10 x ------ = 77,5 ( f i ) 0 +( f 2 ) 0 6 + 2 Jadi nilai modus = 77,5
7. Perbandingan antara Rata-rata, Median dan Modus Apabila distribusi frekuensi mempunyai kurva yang simetris dengan satu puncak
saja, maka letak rata-rata X bar, Median dan Modus adalah sama, yaitu X bar = Mod = Med
Kalau kurva menceng kekanan, maka nilai rata-rata adalah yang paling besar,
diikuti dengan median, kemudian modus. Kalau kurva menceng kekiri, maka nilai rata-rata paling kecil, diikuti median,
kemudian modus.
8. Rata-rata Ukur Dalam masalah bisnis dan ekonomi seringkali diperlukan data untuk mengetahui
rata-rata persentase tingkat perubahan sepanjang waktu (average percentage rates of change over time), misalnya rata-rata persentase tingkat perubahan hasil penjualan,produksi, harga, dan pendapatan nasional selama 10 tahun yang lalu. Perhatikan data berkala mengenai hasil penjualan suatu perusahaan ( dalam jutaan rupiah ) berikut :
Tahun 1996 1997 1998 1999 Penjualan 10 8 12 15
Berapa besarnya rata-rata persentase tingkat perubahan per tahun dari data penjualan tersebut ? Pertanyaan ini sebetulnya sama dengan mencari nilai konstan, sebagai persentase tingkat perubahan tahunan yang diperlukan sehingga angka hasil penjualan berubah dari Rp. 10 juta pada tahun 1996 menjadi Rp. 15 juta pada tahun 1999. Nilai ini dapat diperoleh dengan menggunakan rumus rata-rata ukur atau rumus bungan majemuk bersusun (compound interest).Rumus rata-rata ukur adalah sbb : n G = √ X1 . X2........Xn Jadi rata-rata ukur suatu kelompok nilai X1, X2,......,,Xn merupakan akar
pangkat n dari hasil kali masing-masing nilai keompok tersebut. Untuk mencari rata-rata ukur, juga dapat dipergunakan rumus berikut ;
∑ log X1 log G = ------------- n Contoh : Cari rata-rata ukur dari data berikut : X1 = 10, X2 = 8. X3 = 12, X4 = 15 Penyelesaian : 4 4 G = √ (10) (8) (12) (15) = √ 14.400 = 10,95. Atau dapat dihitung dengan : Log G = ¼ (log 10 + log 8 + log 12 + log 15) = ¼ ( 1,0000 + 0,9031 + 1,0792 + 1,1761 ) = 1,0396 G = antilog 1,0396 = 14,5
9. Rata-rata Harmonis Rata-rata harmonis (Rn) dari n angka, X1, X2,....,Xn adalah nilai yang
diperoleh dengan jalan membagi n dengan jumlah kebalikan dari masing- masing X tersebut diatas. Rumusnya adalah sebagai berikut :
n Rn = ------------- n 1 ∑ ---- i = 1 Xi Contoh :
Seorang pedagang batik di Tegal memperoleh hasil penjualan sebesar Rp. 100.000 per minggu dengan rincian sebagai berikut : Minggu pertama : dapat menjual 10 helai seharga Rp. 10.000 / helai Minggu kedua : dapat menjual 25 helai seharga Rp. 4.000 / helai Minggu ketiga : dapat menjual 20 helai seharga Rp. 5.000 / helai Minggu keempat : dapat menjual 40 helai seharga Rp. 2.500 / helai Berapa harga rata-rata kain tersebut per helai ? Penyelesaian : Untuk menghitung rata-rata harga batik per helai dipergunakan rumus rata- rata
harmonis sebagai berikut : n 4 400.000 Rn = ------------- = -------------------------------------------- = --------- = 4.210,53 n 1 1 1 1 1 95 ∑ ---- ------- + -------- + ------- + --------- i = 1 Xi 10.000 4.000 5.000 2.500 Jadi harga rata-rat batik per helai adalah Rp. 4.210,53 (rata-rata harmonis ini
jarang dipergunakan, dan oleh karena itu kita tidak akan membahasnya lebih lanjut)
10.Kuartil, Desil, dan Persentil
a. Data tak berkelompok Kalau kita berbicara tentang Median, maka nilai ini seolah-olah membagi kelompok data menjadi dua bagian yang sama. Artinya 50% dari kelompok data ini (seluruh nilai observasi) mempunyai nilai sama atau lebih kecil dari median, sedangkan 50% lainnya mempunyai nilai yang sama atau lebih besar dari median tersebut. Ingat bahwa nilai median merupakan salah satu dari nilai observasi / pengamatan. 50% Med 50% ---------------- ----------------- ( X ≤ Med ) , ( X ≥ Med ) Q2,Q3 yang membagi kelompok data tersebut menjadi 4 bagian yang sama, yaitu setiap bagian memuat data yang sama atau jumlah harus dipergunakan rumus berikut : i ( n + 1 ) Qi = nilai yang ke ------------- , i = 1,2,3 4 Contoh : Berikut ini adalah data upah bulanan dari 13 karyawan dalam ribuan rupiah yaitu : 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100 (n = 13). Cari nilai Q1, Q2 dan Q3
Penyelesaian : Pertama -tama data diurutkan dulu : X1 = 30, X2 = 35, X3 = 40, X4 = 45 X5 = 50 ,X6 = 55, X7 = 60, X8 = 65, X9 = 70,X10 = 80, X11 = 85, X12 = 95, X13 = 100 I ( n + 1 ) 1 (13 + 1 ) Q1 = nilai yang ke ------------ = nilai yang ke --------------- 4 4 Q1 = nilai yang ke–3 ½ (nilai ke-3½, berarti rata-rata dari X3 dan X4) Jadi : Q1 = ½ (X3 + X4) = ½ (40 + 45) = 42,5 2 (13 + 1 ) Q2 = nilai yang ke --------------- 4 Q2 = nilai yang ke – 7 (nilai X7) Jadi : Q2 = X7 = 60 3 (13 + 1 ) Q3 = nilai yang ke ------------- 4 Q3 = nilai yang ke–10½ (nilai ke10½ berarti rata-rata dari X10 & X11) Jadi : Q3 = ½ (X10 + X11) = ½ (80 + 85) = 82,5 (nilai kuartil tidak perlu sesuai dengan nilai data yang asl. Untuk kelompok data dimana n ≥ 10, dapat ditentukan 9 nilai yang membagi kelompok data tersebut menjadi 10 bagian yang sama, misalnya D1, D2,......., D3, artinya setiap bagian mempunyai jumlah observasi yang sama, sedemikian rupa sehingga nilai10% observasi sama atau lebih kecil dari D1, nilai 20% observasi sama atau lebih kecil daei D2 dan seterusnya. Nilai tersebut dinamakan desil pertama, kedua dan seterusnya sampai desil kesembilan. Kalau nilai kelompok data tersebut sudah diurutkan dari yang terkecil (=X1) sampai yang terbesar (=Xn), maka rumus desil adalah sebagai berikut :
i(n + 1) Di = nilai yang ke ------------ , 1 = 1, 2, .......,9 10 Contoh :
Berdasarkan contoh diatas, hitunglah D1, D2 dan D9 1(13 + 1) 4 4 D1 = nilai yang ke ------------ = nilai ke 1 ---- , berarti X1 + --- (X2 – X1) 10 10 101 4 = 30 + ----- (35 – 30) = 31 10 2(13 + 1) 8 8 D2 = nilai yang ke ------------ = nilai ke 2 ---- , berarti X2 + --- (X2 – X1) 10 10 10 8 = 35 + ----- (40 – 35) = 39 10 9(13 + 1) 6 6 D9 = nilai yang ke ------------ = nilai ke 12 ----,berarti X12+ --- (X13–X11) 10 10 10 6 = 95 + ----- (100 – 95) = 98 10
Akhirnya untuk kelompok data, dimana n ≥ 100, dapat ditentukan 99 nilai, P1, P2,.......,P99 yang disebut persentil pertama, kedua, dan ke – 99, yang membagi kelompok data tersebut menjadi 100 bagian; masing-masing mempunyai bagian dengan jumlah observasi yang sama, dan sedemikian rupa, sehingg 1% dari observasi mempunyai nilai yang sama atau lebih kecil dari P1, 2% observasi mempunyai nilai yang sama atau lebih kecil dari P2 dan seterusnya. Apabila data sudah disusun mulai dari yang terkecil (X1) sampai yang terbesar (Xn), maka rumus persentil adalah sebagai berikut : i(n + 1) Pi = nilai yang ke -----------, i = 1,2,......,99 100
b. Data berkelompok
Untuk data berkelompok, yaitu data yang sudah dibuat tabel frekuensinya, maka rumus kuartil, desil, dan persentil adalah sebagai berikut :
in/4 - ( ∑ f i ) 0
Rumus Kuartil : Qi = L0 + c x -------------------- , i = 1,2,3, f q
dimana : L0 = nilai batas bawah dari kelas yang memuat kuartil ke-i n = banyaknya observasi = jumlah semua frekuensi ( ∑ f i ) 0 = jumlah frekuensi dari semua kelas sebelum kelas yang mengandung kuartil ke-i (kelas yang mengandung kuartil ke-i tidak termasuk)
f q = frekuensi dari kelas yang mengandung kuartil ke-i c = besarnya kelas interval yang mengandung kuartil ke-i atau jarak nilai batas bawah (atas) dari suatu kelas terhadap nilai batas bawah (atas) kelas berikutnya i = 1,2,3, in = i kali n
in/10 - ( ∑ f i ) 0 Rumus Desil : Di = L0 + c x ---------------------- f d
in/100 - ( ∑ f i ) 0 Rumus Persentil : Pi = L0 + c x ----------------------- f p
dimana : L0 = nilai batas bawah dari kelas yang memuat desil ke-I (persentil ke-i) n = banyaknya observasi = jumlah semua frekuensi ( ∑ f i ) 0 = jumlah frekuensi dari semua kelas sebelum kelas yang mengandung desil ke-i (persentil ke-i)
f d = frekuensi dari kelas yang mengandung desil ke-i f p = frekuensi dari kelas yang mengandung persentil ke-i c = besarnya kelas interval yang mengandung desil ke-i (persentil ke-i) Contoh : Berdasarkan data berikut, hitunglah Q1, Q3, D6 dan P50
Nilai Kelas f 72,2 – 72,4 72,5 – 72,7 72,8 – 73,0 73,1 – 73,3
2 5
10 13
73,4 – 73,6 73,7 – 73,9 74,0 – 74,2 74,3 – 74,5
27 23 16 4
Jumlah ∑ f I = n = 100
Penyelesaian : Untuk menghitung Q1 : f1 + f2 + f3 = 17 belum mencapai 25% (25). Agar mencapai jumlah frekuensi 25, harus ikut dijumlahkan frekuensi kelas yang ke-4, dengan demikian diketahui kelas ke-4 memuat Q1. Dari data ( ∑ f i ) 0 = 17; n = 100; fq = 13.Nilai batas bawah dan batas atas dari kelas yang memuat Q1, masing-masing adalah ½ (73,0 + 73,1) = 73,05 dan ½ (73,3 + 73,4) = 73,35. Jadi c = 73,35 – 73,05 = 0,30 in/4 - ( ∑ f i ) 0 100/4 - 17 Q1 = L0 + c x -------------------- = 73,05 + 0,30 x ------------- = 72,3 f q 13 Untuk menghitung Q3 : f1 + f2 + f3 + f4 + f5 = 2 + 5 + 10 + 13 + 27 = 57, belum mencapai angka 75% (=75), masih kurang (75 – 57) = 18. Kekurangan ini harus ditambah dengan frekuensi kelas ke – 6, sehingga kelas ke – 6 memuat Q3. Dari data ( ∑ f i ) 0 = 57, n = 100 dan f q = 23. Nilai batas bawah dan batas atas dari kelas yang memuat Q3,masing – masing adalah ½ (73,6 + 73,7) = 73,65 dan ½ (73,9 + 74,0) = 73,95; jadi L0 = 73,65; c = 73,95 – 73,65 = 0,30. 3n/4 - ( ∑ f i ) 0 300/4 - 57 Q3 = L0 + c x -------------------- = 73,65 + 0,30 x ------------- = 73,89 f q 23 Untuk menghitung D6 : f1 + f2 + f3 + f4 + f5 = 57 belum mencapai 60% (= 60). Agar mencapai nilai 60, harus ditambah dengan frekuensi dari kelas ke-6, yaitu kelas ke – 6 yang memuat D6 . Dari data ( ∑ f i ) 0 = 57; n = 100; fd = 23. Nilai batas bawah dan batas atas dari kelas yang memuat D6, masing-masing adalah ½ (73,6 + 73,7) = 73,65 dan ½ (73,9 + 74) = 73,95. Jadi c = 73,95 – 73,65 = 0,30 6n/10 - ( ∑ f i ) 0 600/10 - 57 D6 = L0 + c x -------------------- = 73,65 + 0,30 x ------------- = 73,69 f d 23 artinya nilai 60% dari observasi sama atau lebih kecil dari 73,69
Untuk menghitung P50 : f1 + f2 + f3 + f4 = 2 + 5 + 10 + 13 = 30, belum mencapai angka 50% (=50). Kekurangan ini harus ditutup dengan frekuensi kelas ke – 5. Jadi kelas ke – 5 memuat P50.Dari data ( ∑ f i ) 0 = 30, n = 100 dan f p = 27. Nilai batas bawah dan batas atas dari kelas yang memuat P50,masing – masing adalah ½ (73,3 + 73,4) = 73,35 dan ½ (73,6 + 73,7) = 73,65; jadi L0 = 73,65; c = 73,65 – 73,35 = 0,30. 50n/100 - ( ∑ f i ) 0 5000/100 - 30 P50 = L0 + c x - ------------------------ = 73,35 + 0,30 x ------------------- f p 27 = 73,57, artinya 59% dari observasi mempunyai nilai sama atau lebih kecil dari 73,57
STATISTIK INDUSTRI MODUL 6 UKURAN VARIASI ATAU DISPERSI
Tujuan Belajar Setelah mempelajari bab ini, Anda diharapkan mampu :
- menjelaskan jenis-jenis ukuran dispersi - menggunakan rumus-rumus ukuran dispersi - menghitung beberapa ukuran dispersi - menjelaskan arti beberapa ukuran dispersi
Dalam kehidupan sehari-hari kita sering mendengar orang menyebutkan data statistik. Misalnya si Toni lulus SMA dengan nilai rata-rata 8, sehingga dapat diterima di universitas negeri. Atau rata-rata upah bulanan karyawan PT. Teguh sebesar Rp. 50.000,-. Setiap kali kita mendengar kata rata-rata, maka secara otomatis kita akan membayangkan sekelompok nilai ”di sekitar” rata-rata tersebut. Ada yang sama dengan rata-rata, ada yang lebih kecil, dan ada yang lebih besar dari rata-rata tersebut. Dengan perkataan lain, ada variasi atau dispersi dari nilai-nilai tersebut, baik terhadap nilai lainnya maupun terhadap rata-ratanya (terhadap rata-rata hitung, median, atau modus). Kita mengenal tiga kelompok nilai, yaitu kelompok nilai homogen (tidak bervariasi), kelompok nilai heterogen (sangat bervariasi), dan kelompok nilai relatif homogen (tidak begitu bervariasi). Perhatikan 3 kelompok data berikut : (1). 50 50 50 50 50 rata-rata hitung = 50 (2). 50 40 30 60 70 rata-rata hitung = 50 (3) 100 40 80 20 10 rata-rata hitung = 50 Walaupun rata-rata hitung dari masing-masing kelompok adalah sama, namun kelompok (1) rata-ratanya dapat mewakili kelompok data dengan baik (sempurna), kelompok (2) cukup baik dan kelompok (3) tidak dapat mewakili dengan baik. Keadaan tingkat variasi ini dapat dilihat dari grafik berikut : Ada beberapa macam ukuran variasi atau dispersi, misalnya nilai jarak (range), rata-rata simpangan (mean deviation), simpangan baku (standard deviation), dan koeffisien variasi (coeffisien of variation). Diantara ukuran variasi tersebut simpangan baku yang sering dipergunakan, khususnya untuk keperluan analisis data. MENGAPA MEMPELAJARI DISPERSI Nilai rata-rata seperti mean atau median hanya menitikberatkan pada pusat data, tapi tidak memberikan informasi tentang sebaran nilai pada data tersebut. Kita tentu tidak akan menyeberangi sebuah danau begitu saja jika kita tahu kedalaman rata-ratanya 2 m. Alasan kedua mempelajari dispersi adalah untuk membandungkan sebaran data dari dua informasi distribusi nilai.Misalnya untuk membandingkan tingkat produktifitas dari dua perusahaan. Meskipun kita mengetahui bahwa produksi rata-rata dari dua perusahaan mobil adalah 20 mobil sehari, namun kita tentu tidak dapat langsung
mengatakan bahwa tingkat produksi mereka identik. Kita perlu melihat bagaimana sebaran nilai jumlah (jumlah produksi harian) dari kedua perusahaan tersebut. Bisa jadi perusahaan pertama cenderung lebih homogen, dalam arti bahwa jumlah produksi harian tidak jauh dari kisaran rata-rata. Bisa jadi pula perusahaan kedua ternyata cenderung memiliki tingkat distribusi produksi yang lebih heterogen, dalam arti bahwa jumlah produksi harian sangat beragam dan menyebar jauh di sekitar rata-rata. PENGUKURAN DISPERSI 1. Data tidak dikelompokkan a.Nilai Jarak
Diantara ukuran variasi yang paling sederhana dan paling mudah dihitung ialah nilai jarak (range). Kalau suatu kelompok nilai (data) sudah disusun menurut urutan yang terkecil (X1) sampai dengan yang terbesar (Xn), maka untuk menghitung nilai jarak dipergunakan rumus berikut : Nilai jarak = NJ = Xn –X1, atau NJ = nilai maksimum – nilai minimum Contoh : Carilah jarak dari data berikut 50 40 30 60 70 Penyelesaian : X1 = 30, X2 = 40, X3 = 50, X4= 60, X5 = 70 NJ = Xn –X1 = 70 – 30 = 40
b. Rata-rata Simpangan
Apabila dipunyai data X1, X2, ……, Xi,……, Xn, dana rata-rata X bar = 1/n ∑ Xi, maka simpangan terhadap rata-rata hitung diartikan sebagai berikut : (X1 – X bar), (X2 – X bar),......., (Xi – X bar), ……, (Xn– X bar) Rata-rata simpangan (RS) adalah rata-rata hitung dari nilai absolut simpangan yang dirumuskan : RS = 1/n ∑│Xi – X bar│ Untuk simpangan selalu kita ambil nilai mutlaknya. Simpangan terhadap median diartikan sebagai berikut : (X1 – Med), (X2 – Med),......., (Xi – X Med), ……, (Xn– X Med) Jadi, simpangan terhadap median dirumuskan : RS = 1/n ∑│Xi – Med│ Contoh : Cari rata-rata simpangan, baik terhadap rata-rata hitung maupun terhadap median dari contoh diatas
Penyelesaian : X bar = 1/5 (50 + 40 + 30 + 50 + 70) = 50 Med = 50 RS = 1/5 ∑│Xi – X bar│= 1/5 (│0│+│- 10│+│- 20│+│10│+│20│) = 12 RS = 1/5 ∑│Xi – Med│ = 12
c. Simpangan Baku
Di antara ukuran dispersi atau variasi, simpangan baku adalah yang paling banyak dipergunakan, sebab mempunyai sifat-sifat matematis (mathematical property) yang sangat penting dan berguna sekali untuk pembahasan teori dan analisis. Simpangan baku merupakan salah satu ukuran dispersi yang diperoleh dari akar kuadrat positif varians. Varians adalah rata-rata hitung dan kwadrat simpangan setiap pengamatan terhadap rata-rata hitungnya. Kalau kita mempunyai suatu populasi dengan jumlah elemen sebanyak N dan sampel dengan n elemen, dan selanjutnya nilai suatu karakteristik tertentu kita kumpulkan (umur, hasil penjualan perusahaann, harga barang, produksi barang, nilai ujian), maka kita akan memperoleh sekumpulan nilai observasi sebagai berikut : Populasi : X1,....., X2,......, Xi,......, Xn N µ = 1/N ∑ Xi = rata-rata sebenarnya dari X (rata-rata populasi) i = 1 Sampel : X1,....., X2,......, Xi,......, Xn n X bar = 1/n∑ Xi = rata-rata perkiraan dari X (rata-rata sampel) I = 1 X bar = adalah perkiraan dari Seperti pada rata-rata, dalam varians pun ada yang disebut sebagai varians populasi dan varians sampel. Simpol dari varians populasi adalah (dibaca sigma kuadrat) yang merupakan varians sebenarnya dari X bar. Rumusnya adalah : N α2 = 1/N ∑ (Xi - µ)2 i = 1 dimana (Xi - µ) adalah simpangan (deviasi) dari observasi terhadap rata – rata
sebenarnya. Sedangkan varians sampel (S2) dirumuskan sebagai berikut : 1 N
S2 = -------- ∑ ( Xi – X bar)2 N i = 1 Atau 1 n S2 = -------- ∑ ( Xi – X bar)2 n I = 1 dimana (Xi – X bar) adalah simpangan (deviasi) dan observasi terhadap rata-rata sampel. Rumus dan simbol dari simpangan baku populasi adalah : N N ∑ ( Xi - µ )2 ( ∑ Xi )2 i = 1 1 i = 1
α = akar dari ----------------- = akar dari ------ { ∑ X2i - ------------}
N N N Dimana α merupakan simpangan baku dari X Pada prakteknya, pengumpulan data yang hanya didasarkan atas sampel tidak menghasilkan varian atau simpangan baku yang sebenarnya, tetapi hanya suatu perkiraan saja dengan rumus sebagai berikut : n n ∑ ( Xi – X bar)2 ∑ ( Xi – X bar)2 i = 1 i = 1 S = akar dari ---------------------- = akar dari ----------------------- n n – 1
Rumus (*) Rumus (**)
Catatan : Simpangan baku perkiraan ( S perkiraan dari α ) / simpangan baku sample. Bisa ditunjukkan secara statistic matematis bahwa kalau pembaginya (penyebutnya) n – 1, E (S2) = α2, artinya S2 “unbiased estimate” dari α2, sehingga dalam prakteknya rumus (**) banyak digunakan. : Rumus (*) dapat ditulis : n
n (∑ Xi ) 2
S = akar dari 1/n x { ∑ X2i - i = 1 } i = 1 n Sedangkan rumus (**) dapat ditulis : n
n (∑ Xi ) 2
S = akar dari 1/(n – 1) x { ∑ X2i - i = 1 } i = 1 n
2. Data dikelompokkan
a. Nilai Jarak Untuk data berkelompok, nilai jarak (NJ) dapat dihitung dengan dua cara : a. NJ = nilai tengah kelas terakhir – nilai tengah kelas pertama b. NJ = batas atas kelas terakhir – batas bawah kelas pertama Contoh : Hitung nilai jarak dari berat badan 100 mahasiswa
Berat Badan ( kg ) Banyaknya mahasiswa ( f) 60 – 62 63 – 65 66 – 68 69 – 71 72 – 74
5 18 42 27 8
Penyelesaian : Cara i : Nilai tengah kelas terakhir = (72 + 74) : 2 = 73 kg Nilai tengah kelas pertama = (60 + 62) : 2 = 61 kg NJ = nilai tengah kelas terakhir – nilai tengah kelas pertama = 73 – 61 = 12 kg Cara 2 : Batas atas kelas terakhir = (74 + 75) : 2 = 74,5 kg Batas atas kelas pertama = (59 + 60) : 2 = 59,5 kg NJ = batas atas kelas terakhir – batas bawah kelas pertama = 74,5 – 59,5 = 15 kg Catatan : cara 1 cenderung menghilangkan kasus-kasus ekstrim
b. Simpangan baku
Untuk data yang berkelompok dan sudah disajikan dalam tabel frekuensi, rumus simpangan baku populasi adalah sebagai berikut :
n ∑fi (Mi - µ)2
I = 1 α = akar dari --------------- , Mi = nilai tengah dari kelas ke–i =1,2,...,k N Atau :
k k ∑fi d2i ∑(fi di)2
i = 1 i = 1 α = c x akar dari ---------- - (-----------), untuk kelas interval yang N N sama Dimana : c = besarnya kelas interval fi = frekuensi kelas ke-i
di = deviasi = simpangan dari kelas ke-i terhadap titik asal asumsi
k ( ∑fi Mi2
i = 1 α = akar dari 1/N { ∑fi Mi2 - ----------- }, untuk kelas interval yang
N tidak sama Mi = nilai tengah kelas ke-i
Umtuk data sampel diperooleh simpangan baku sampel dengan rumus :
k k ∑fi d2i ∑(fi di)2
i = 1 i = 1 S = c x akar dari ---------- - (-----------), untuk kelas yang sama n - 1 n - 1 dan
k ( ∑fi Mi2
i = 1 S = akar dari 1/N { ∑fi Mi2 - ----------- }, untuk kelas yang
N tidak sama
Contoh : Hitunglah simpangan baku dari data berikut : 1) Xi = 50 ,X2 = 50 ,X3 = 50 ,X4 = 50 ,X5 = 50 (kelompok karyawan pertama) 2) Xi = 50 ,X2 = 50 ,X3 = 50 ,X4 = 50 ,X5 = 50 (kelompok karyawan kedua) 3) Xi = 50 ,X2 = 50 ,X3 = 50 ,X4 = 50 ,X5 = 50 (kelompok karyawanketiga) X = upah bulanan karyawan suatu perusahaan (dalam jutaan rupiah) Penyelesaian :
N ( ∑ Xi )2
1 i = 1
α = akar dari ----------------- { ∑ X2i - ------------}
N N
Kelompok 1 Kelompok 2 Kelompok 3
X X2 X X2 X X2
X1 = 50 X2 = 50 X3 = 50 X4 = 50 X5 = 50
2.500 2.500 2.500 2.500 2.500
X1 = 50 X2 = 40 X3 = 30 X4 = 40 X5 = 70
2.500 1.600 900
1600 4900
X1 = 100 X2 = 40 X3 = 80 X4 = 20 X5 = 10
10.000 1. 600 6.400 400 100
∑ X2i = 250 ∑ Xi
2= 12.500
∑ X2i =
250 ∑ X2
i = 13.500
∑ X2i = 250 ∑ X2
i = 18.500
α1 = akar 1/5 {12.500 – (250)2/5} = 0 (Kelompok karyawan pertama upah bulanannya homogen, dengan kata lain tidak bervariasi, nilai simpangannya = α1 = 0 )
α 2 = akar 1/5 {13.500 – (250)2/5} = 14,14 (= Rp 14.140)
α 3 = akar 1/5 {18.500 – (250)2/5} = 34,64 (= Rp. 34.640) Ternyata hasil perhitungan diatas menunjukkan bahwa kelompok data yang heterogen, mempunyai simpangan baku yang besar. α1≤ α1 ≤ α1 ---- > o ≤ 14,14 ≤ 34,34 kelompok data kelompok data heterogen homogen kelompok data relative homogen Contoh : Modal dari 40 populasi perusahaan (dalam jutaan rupiah) adalah sebagai berikut : 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144 168 126 138 176 163 119 154 165 146 173 142 147 135 153 140 135 161 145 135 142 150 156 145 128 Kemudian data dikelompokkan dan disajikan dalam bentuk tabel frekuensi sebagai berikut :
Modal (M) Nilai tengah Sistem Tally F 118 – 126 127 – 135 136 - 144
122 131 140
/// /////
///// ////
3 5 9
145 – 153 154 – 152 163 – 171 172 – 180
149 158 167 176
///// ///// // ///// //// //
12 5 4 2
Jumlah 40 Hitunglah simpangan baku terhadap data yang berkelompok Penyelesaian : Untuk data berkelompok, kalau kita perhatikan jarak antara kelas yang satu dengan kelas berikutnya sama, atau dengan perkataan lain selisih nilai tengah yang satu dengan nilai tengah lainnya sama, yaitu sebesar (131 -132) = (140 – 131) = ...... = 9, jadi c = 9. Kita tentukan titik asumsi = M = 149, yaitu kelas 145 – 153. Dengan demikian kita dapat memperoleh nilai simpangan (deviasi) dari setiap nilai tengah terhadap titik asal asumsi sebagai berikut :
Kelas f d d2 fd fd2 118 – 126 127 – 135 136 - 144 145 – 153 154 – 152 163 – 171 172 – 180
3 5 9
12 5 4 2
-3 -2 -1 0 1 2 3
9 4 1 0 1 4 9
-9 -10 -9 0 5 8 6
27 20 9 0 5
16 18
Jumlah 40 0 0 ∑ fdi = -9 ∑ fdi2 k k ∑fi d2i ∑(fi di)2 i = 1 i = 1
α = c x akar dari ---------- - (-----------) N N = 9 x akar { 95/40 – (-9/40) 2} = 13,72
Contoh : a. Berdasarkan data yang sudah dikelompokkan pada contoh sebelumnya,
hitunglah simpangan baku dengan menggunakan rumus k ( ∑fi Mi2
i = 1 α = akar dari 1/N { ∑fi Mi2 - ----------- }
N b. Dengan menggunakan rumus tersebut diatas, hitunglah simpangan baku
untuk data berikut . X = nilai ujian statistik matematik dari 50 mahasiswa Akademi Ilmu Statistik
Kelas M f 30 – 39 40 – 49 50 – 59 60 – 69
34,5 44,5 54,5 64,5
4 6 8
12
70 – 79 80 – 89 90 - 100
74,5 84,5 94,5
9 7 4
Karena selisih nilai bawah dan atas dari kelas yang terakhir tidak sama dengan kelas-kelas sebelumnya (100 – 90 = 10, padahal untuk kelas lainnya = 9), maka kelompok data ini dikatakan mempunyai kelas interval yang tidak sama. Penyelesaian : Untuk menghitung simpangan baku, diperlukan lembaran kerja sebagai berikut: a.
M M2 f fM fM2 122 131 140 149 158 167 176
14.484 17.161 19.600 22.201 24.964 27.889 30.976
3 5 9 12 5 4 2
366 655 1260 1788 790 668 352
44.652 85.805 176.400 266.412 124.820 111.556 61.952
Jumlah ∑ fi = 40 ∑ fiM = 5.879 ∑ fiM2 = 871.507
α = akar 1/40 {871.597 – (5.879)2 /40} = 13,72 b.
M M2 f fM fM2 34,5 44,5 54,5 64,5 74,5 84,5 94,5
1.190,25 1.980,25 1.970,25 4.160,25 5.550,25 7.140,25 8.930,25
4 6 8 12 9 7 4
138,0 267,0 436,0 774,0 670,0 591,0 378,0
4.761,00 11.881,50 23,762,00 49.923,00 49.952,25 49.981,75 35.721,00
Jumlah ∑ fi = 50 ∑ fiM = 3.255 ∑ fiM2 =
225.982,50 α = akar 1/50 {225.982,50 – (3.255)2 /50} = 16,78
NILAI ATAU DATA YANG DIBAKUKAN (STANDARDIZED VALUE) Variabel X mempunyai rata-rata µ dengan simpangan baku α. Jadi, Xi / α merupakan nilai baku dari Xi, dan Zi = Xi - µ / α merupakan nilai simpangan atau deviasi yang baku (standardized).
Contoh : Dari data X1 = 2, X2 = 8, X3 = 10, X4 = 4, X5 = 1 (N = 5)
a. Hitunglah µ, α, dan Xi / α b. Kalau Zi = Xi - µ / α , hitunglah Zi, i = 1,2,.....,5 c. Hitunglah µzdan αz
Penyelesaian : a. µ = 1/N ∑ X = 1/N (X1 + X2+......+ X1) = 1/5 (2 + 8 + ....+ 1) = 25/5 = 5
α = akar 1/N ∑( Xi - µ )2 = akar 1/5 (2 – 5)2 +(2 – 5)2 +.......+ (1 – 5)2 = 3,46 = 3,5
X1 / α = 2 / 3,5 = 0,57; X2 / α = 8 / 3,5 = 2,29 ; X3 / α = 10/ 3,5 = 2,86 X4 / α = 4 / 3,5 = 1,14; X5 / α = 1 / 3,5 = 0,29
b. Z1 = (2 – 5) / 3,5 = - 0,86; Z2 = (8 – 5) / 3,5 = 0,86; Z3 = (10 – 5) / 3,5 = 1,43; Z4 = (4 – 5) / 3,5 = - 0,29; Z5 = (1 – 5) / 3,5 = - 1,14
c. µz = 1/N ∑ Zi = 1/5 (Z1 + Z1 + Z1 + Z1 + Z1 ) = 1/5 (0) = 0 Rata-rata simpangan yang dibakukan = 0, sehingga :
( ∑Zi
2 )
α 2 = akar 1/N { ∑Zi2 - ------------ } N = akar 1/5 { (- 0,86)2 +(- 0,86) (- 0,86)2 + ............+ (-1,14)2 – (0) 2/5} = 0,9907 = 1 Secara teoritis dapat ditunjukkan bahwa µz = 0 dan αz = 1. Variabel X dengan µx dan αx : µx = 1/N ∑ Xi αx = akar 1/N ∑ (Xi - µx)2
Zi = Xi - µx / αx µz = 1/N ∑ Zi = 1/N ∑ (Xi - µx / α) = 1/N αx ∑ (Xi - µx)
= ∑ Xi - N µx) / N αx = 0 / N αx = 0
αx = akar 1/N ∑ (Xi - µz)2 = 1/N ∑ Zi2 = akar 1/N (∑ (Xi - µz / αx) 2 = akar (1/ αx) (1/N) (∑ (Xi - µz ) 2 = akar αx2 / αx2 = 1
Dengan menggunakan data dari contoh tersebut diatas, perhatikan bahwa antara simpangan baku, nilai X, dan µx berikut : X1 = 2, X2 = 8, X3 = 10, X4 = 4, X5 = 1, µx = 5, αx = 3,5
0 1 2 3 4 5 6 7 8 9 10 ·
X5 X1 X4 µx X2 X3 Makin kecil simpangan bakunya, makin dekat nilai- nilai X pada µx. Sebaliknya makin besar simpangan baku, makin menjauh nilai-nilai X tersebut dari µx. KOEFFISIEN VARIASI Simpangan baku mempunyai satuan yang sama dengan satuan data aslinya. Hal ini merupakan suatu kelemahan kalau kita ingin membandingkan dua kelompok data, misalnya modal dari 10 perusahaan besar di Amerika dengan yang ada di Indonesia, harga 10 mobil (jutaan rupiah) dengan harga 10 ekor ayam (ribuan rupiah), dan berat 10 ekor gajah dengan berat 10 ekor semut. Walaupun nilai simpangan baku untuk berat gajah atau harga mobil lebih besar, naun belum tentu lebih heterogen atau lebih bervariasi daripada berat semut dan harga ayam. Untuk keperluan perbandingan dua kelompok nilai dipergunakan Koeffisen Variasi (KV), yang bebas dari satuan data asli, dengan rumus sebagai berikut : KV = ( α / µ ) x 100 % , untuk populasi kv = ( S / X ) x 100 % , untuk sampel Jika ada dua kelompok data dengan KV1 dan KV2, dimana KV1> KV2, maka kelompok pertama lebih bervariasi atau lebih heterogen daripada kelompok kedua. Contoh : Harga 5 mobil bekas masing-masing adalah Rp. 4.000.000, Rp. 4.500.000, Rp. 5.000.000, Rp. 4.750.000, dan Rp. 4.250.000, dan harga 5 ayam masing – masing Rp. 600, Rp. 800, Rp. 900, Rp. 550, dan Rp. 1.000. Hitunglah simpangan baku harga mobil
αm atau harga ayam αa . Mana yang yang lebih bervariasi (heterogen), harga mobil atau harga ayam ? Penyelesaian : µm = 1/5 (4.000.000 + 4.500.000 + ...................+ 4.250.000) = Rp. 4.500.000 αm = akar 1/N ∑ (Xi - µm)2 = Rp. 353.550 µa = 1/5 (600 + 800 + ...................+ 1.000) = Rp. 770 αa = akar 1/N ∑ (Xi - µa)2 Rp. 172,05 KVm = ( αm / µm ) x 100% = (352.550/ 4.500.000= 7,865% KVa = ( αa / µa ) x 100% = (172,05 / 770) x 100% = 22.34 % UKURAN KEMENCENGAN KURVA Apabila kita mempunyai sekelompok data sebanyak n : X1, X2,........., Xn, maka yang disebut momen ke – r (Mr), adalah sebagai berikut :
n Mr = 1/n ∑ Xr
i .......... (untuk data tak berkelompok) i =1 Untuk data yang sudah dikelompokkan menjadi k kelas, Mi merupakan nilai tengah kelas ke –i, maka perumusan momen ke – r (Mr) adalah sebagai berikut : n Mr = 1/n ∑ fi M
ri .......... (untuk data berkelompok)
i =1 Untuk r = 1, maka M1 (momen pertama) merupakan rata-rata hitung. Momen tersebut merupakan momen terhadap titik asal, sedangkan momen terhadap rata-rata hitung adalah sebagai berikut : n Mr = 1/n ∑ ( Xi – X bar )r .......... (untuk data tak berkelompok) i =1 n Mr = 1/n ∑ fi ( Mi – X bar ) r .......... (untuk data berkelompok)
i =1 Untuk r = 2, maka M2 merupakan varians (= kuadrat dari simpangan baku = S r). Momen ketiga dan keempat, yaitu M3 dan M4 masing - masing berguna untuk mengukur kemencengan (skewness) dan keruncingan (kurtosis) dari suatu distribusi frekuensi. UKURAN KEMENCENGAN KURVA (Skewness) Kurva yang tidak simetris dapat menceng ke kiri atau ke kanan. Didalam kurva yamh simetris, letak modus, median da rata-rata (X bar) sama. Ukuran tingkat kemencengan (TK) menurut Pearson adalah sebagai berikut : X bar - Mod TK = ---------------- S Dimana : X bar = rata-rata hitung Mod = modus S = simpangan baku Atau : 3 ( X bar – Med ) TK = ---------------------- S Secara emoiris dapat ditunjukkan bahwa X bar – Mod = 3 ( X bar – Med ). Ukuran tingkat kemencengan dapat juga dihitung berdasarkan momen ketiga dengan rumus sebagai berikut : M3 1 n α3 = ----= ------ ∑ ( Xi – X bar )3 .......... (untuk data tak berkelompok)
S3 n S3 i = 1 Atau : M3 1 n α3 = ----- = ------ ∑ fi ( Mi – X bar )3 ........(untuk data berkelompok,
S3 n S3 i = 1 ada k kelas)
Disini α3 sering disebut momen koeffisien kemencengan (moment coefficient of skewness). Apabila kelas intervalnya sama, maka untuk menghitung α3 dapat dipergunakan rumus berikut :
c3 1 n 1 1 1 α3 = ----- { ----- ∑ fi d
3i – 3 ( --- ∑ fi d
2i.) (---
∑ fi di.) + 2 (--- ∑ fi di.)3
S3 n i = 1 n i = 1 n i = 1 n i = 1 Dimana : α3 = ukuran tingkat kemencengan S = simpangan baku c = besarnya kelas interval fi = frekuensi kelas ke-i di = simpangan kelas ke-i k = banyaknya kelas Contoh : Berdasarkan data berkelompok berikut, hitunglah TK dan α3
Kelas M F fM d fd fd2 fd3 fd4* 118 – 126 127 – 135 136 – 144 145 – 153 154 – 162 163 – 171 172 - 180
122 131 140 149 158 167 176
3 5 9 12 5 4 2
366 655 1.260 1.788 700 668 352
-3 -2 -1 0 1 2 3
-9 -10 - 9 0 5 8 6
27 20 9 0 5 16 18
-81 -40 -9 0 5 32 54
243 80 9 0 5
64 162
Jumlah ∑ fi=40 ∑ fi Mi =
5,879
∑ fi di = 0
∑ fi d2i
= 95 ∑ fi d
3i
= - 39 fd4i = 563
* Untuk menghitung α4 X bar = ∑ fi Mi / ∑ fi = 5.879 / 40 = 146,975 n/2 – (∑ fi)0 Med = L0 + c { -----------------} fm Dari data f1 + f2 + f3 = 3 + 5 + 7 = 17, belum mencapai 50% observasi ( = 20). Untuk mencapai angka 20, harus ditambah dengan frekuensi kelas keempat. Jadi kelas keempat memuat median fm = 12, (∑ fi)0 = 17. Nilai batas bawah dan atas dari kelas yang menuat median masing-masing adalah : ½ (144 + 145) = 144,5 dan ½ (153 + 154) = 153,5 c = 153,5 – 144,5 = 9 ; L0 = 144,5 Med = 144,5 + 9 {(20 – 170)/12} = 146,75
S = akar c { ∑ fi di 2 / n - (∑ fi di / n) 2
= akar 9 { 95/40 - ( - 9/40 ) 2 } = 13,72 TK = 3 (X bar – Med) / S = 3 ( 146,975 – 146,75 ) / 13,72 = 0,049 α3 = 93/ (13,72)3 { - 39/40 – 3 (95/40)(-9/40) + 2 ( -9 /40) 3} = 0,282 (0,605) = 0,17 Makin besar α3, kurva suatu distribusi makin menceng atau miring. Ukuran kemencengan lainnya dengan menggunakan kuartil dan persentil adalah sebagai berikut : (Q3 – Q2 ) - (Q2 – Q1 ) (Q3 – Q2 ) (Q3 – 2Q2 + Q1 ) QCS = ------------------------------- = ----------------------------------------- Q3 – Q1 Q3 – Q1 (P90 – P50 ) - (P50 – P10 ) P90 – 2 P50 + P10 10 – 90 PCS = ------------------------------------ = ------------------------- P90 – P10 P90 – P10 QCS = Quartile Coefficient of Skewness (kuartil koeffisien kemencengan) 10 – 90 PCS = 10 – 90 Percentile Coefficient of Skewness (persentil koeffisient kemencengan) UKURAN KERUNCINGAN KURVA (Kurtosis) Dilihat dari tingkat keruncingan kurva distribusi frekuensi dibagi menjadi 3, yaitu leptokurtis (puncaknya sangat runcing), platykurtis (puncak agak datar/merata), dan mesokurtis (puncaknya tidak begitu runcing). Untuk menghitung tingkat keruncingan suatu kurva distribusi dipergunakan α4, yaitu moment of kurtosis yang rumusnya sebagai berikut : M4 n α4 = ---- = {1/n∑ ( Xi – X bar )4} / S4 .... (untuk data tak berkelompok)
S4 i = 1
Atau : M4 n α4 = ----- = { 1/n ∑ fi ( Mi – X bar )4}/ S4 .....(untuk data berkelompok)
S4 i = 1 Kalau kelas intervalnya sama, maka rumus tersebut diatas akan menjadi :
C4 1 n 1 k 1 k α4 = ----- { ----- ∑ fi di4 – 4 (--- ∑ fi di3.) (--- ∑ fi di.) +
S4 n i = 1 n i = 1 n i = 1 1 k 1 k 1 k
6 (--- ∑ fi di2.) (--- ∑ fi di.)2 – 3 (-- ∑ fi di.)4 } n i = 1 n i = 1 n i = 1 n i = 1 Keterangan simbol-simbol sama seperti pada rumus untuk α3 Contoh : Berdasarkan data pada contoh sebelumnya, hitunglah tingkat keruncingan kurva dengan menggunakan rumus tersebut diatas (lihat juga contoh sebelumnya) α4 = 94/ 13,724{ 1/40 (563) – 4 (-39/40) (-9/40) + 6 (95/40) (-9)/40)2 – 3(-9/40)4} = 2,57 Kalau α4 > 3 dihasilkan kurva leptokurtis (meruncing) α4 = 3 dihasilkan kurva mesokurtis (normal) α4 < 3 dihasilkan kurva platykurtis (mendatar) Rumus lainnya disebut Quartile Coeffisien of kurtosis (QCK), yaitu sebagai berikut : QCK = ½ (Q3 – Q1) / P90 – P10 Suatu distribusi yang mempunyai nilai QCK = 0,263 dapat didekati dengan fungsi normal.
STATISTIK INDUSTRI MODUL 7 ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA
Tujuan Belajar Sesudah mempelajari bab ini, Anda diharapkan mampu :
Menjelaskan pentingnya analisis hubungan Menghitung koeffisien korelasi dan regresi sederhana Menjelaskan arti koeffisien korelasi dan koeffisien regresi sederhana Memahami dan menerapkan regresi dan korelasi Menggunakan teknik ramalan dan melakukan analisis regresi
PENTINGNYA ANALISIS HUBUNGAN Di dunia ini kita tidak dapat hidup sendiri, tetapi memerlukan hubungan dengan orang lain (dengan tetangga, kawan kantor, kawan sekolah, petugas bank, petugas pajak dan sebagainya). Hubungan ini pada umumnya dilakukan dengan maksud tertentu seperti mendapatkan keringanan pajak, memperoleh kredit, meminjam uang, serta minta pertolingan / bantuan lainnya. Seperti kita ketahui, pada semua kejadian ekonomi maupun lainnya, pasti ada factor yang menyebabkan terjadinya kejadian – kejadian tersebut. Misalnya merosotnya hasil penjualan tekstil mungkin disebabkan karena kalah bersaing dengan tekstil impor, merosotnya produksi padi mungkin disebabkan karena pupuknya berkurang, merosotnya hasil penjualan mungkin karena menurunnya biaya advertensi, dan sebagainya. Uraian diatas menunjukkan adanya hubungan (korelasi) antara kejadian yang satu dengan kejadian lainnya. Kejadian itu dapat dinyatakan dengan perubahan nilai variable. Misalnya, kalau X = variable harga, maka naik turunya harga dapat dinyatakan dengan perubahan nilai X. Apabila Y = variable hasil penjualan, maka naik turunnya hasil penjualan dapat dinyataka dengan perubahan nilai Y. Jadi hubungan antara dua kejadian dapat dinyatakan dengan hubunga dua variable. Hubungan antara X dan Y disebut hubungan linier.
Apa perlunya mengetahui hubungan antar variable? Di dalam [erencanaan, selain data masa lampau dan masa sekarang, juga diperlukan data hasil ramalan yang menggambarkan kemampuan dimasa yang akan dating. Misalnya, untuk perencanaan impor, pemerintah memerlukan ramalan produksi padi, sedangkan perusahaan dalam merencanakan produksi memerlukan ramalan hasil penjualan (kemampuan menjual di masa yang akan datang, sehingga dapat dicegah terjadinya over production). Over production berarti produksi melebihi permintaan, sehingga banyak yang tidak laku. Sedangkan under production menyebabkan tidak terpenuhinya pesanan (order) yang dapat menghilangkan kesempatan menjual (loss of opportunity to sell). Apabila dua variable X dan Y mempunyai hubungan, maka nilai variable X yang sudah diketahui dapat dipergunakan untuk memperkirakan / menaksir Y. Ramalan pada dasarnya merupakan perkiraan / taksiran mengenai terjadinya suatu kejadian (nilai variable untuk waktu yang akan datang, seperti ramalan produksi dua tahun yang akan datang, ramalan harga bulan depan, ramalan jumlah penduduk 10 tahun yang akan dating, dan sebagainya. Variabel Y yang nilainya akan diramalkan disebut variable tidak bebas (dependent variable), sedangkan variable X yang nilainya dipergunakan untuk meramalkan nilai Y disebut variable bebas (independent variable) atau variable peramal (predictor) dan seringkali disebut variable yang menerangkan (explanatory). Jadi, jelas analisis korelasi ini memungkinkan kita untuk mengetahui sesuatu di luar hasil penyelidikan, misalnya dengan ramalan kita dapat mengetahui terjadinya suatu kejadian baik secara kualitatif (akan turun hujan, akan terjadi perang, akan lulus ujian, dan lain sebagainya), maupun kuantitatif (produksi padi akan mencapai 16 juta ton, indeks harga 9 macam bahan pokok naik 10%, penerimaan devisa turun 5%, dan sebagainya). Salah satu cara untuk melakukan peramalan adalah dengan menggunakan garis regresi. KOEFFISIEN KORELASI DAN KEGUNAANNYA Hubungan dua variable ada yang positif dan negative. Hubungan X dan Y dikatakan positif apabila kenaikan (penurunan) X pada umumnya diikuti oleh
kenaikan (penurunan) Y. Sebaliknya dikatakan negative kalau kenaikan (penurunan) X pada umumnya diikuti oleh penurunan (kenaikan) Y. Contoh hubungan positif :
X = pupuk Y = produksi X = biaya advertensi Y = hasil penjualan X = berat badan Y = tekanan darah
Contoh hubungan negatif : X = jumlah akseptor Y = jumlah kelahiran X = harga suatu barang Y = permintaan barang X = pendapatan masyarakat Y = kejahatan ekonomi Kuat dan tidaknya suatu hubungan antara X dan Y apabila dinyatakan dengan fungsi linier (paling tidak mendekati), diukur dengan suatu nilai yang disebut Koeffisien Korelasi. Nilai koeffisien korelasi ini paling sedikit – 1 dan paling besar 1. Jadi jika r = koeffisien korelasi, maka nilai r dapat dinyatakan sebagi berikut :
-1 ≤ r ≤ 1
Artinya : Jika r = 1, hubungan X dan Y sempurna dan positif (mendekati 1, yaitu
hubungan sangat kuat dan positif) = - 1, hubungan X dan Y sempurna dan negative (mendekati – 1,
yaitu hubungan sangat kuat dan negative) = 0, hubungan X dan Y lemah sekali atau tidak ada hubungan Disini X dikatakan mempengaruhi Y, jika berubahnya nilai X akan menyebabkan perubahan nilai Y, artinya naik turunnya X akan membuat nilai Y jufga nail turun, sehingga nilai Y akan bervariasi, baik terhadap rata-rata Y maupun terhadap garis linier yang mewakili diagram pencar. Akan tetapi naik turunnya Y adalah sedemikian rupa sehingga nilai Y bervariasi, tidak semata-mata
disebabkan oleh X, karena masih ada factor lain yang menyebabkannya. Misalnya kalau Y = hasil penjualan, X = biaya iklan (advertensi), maka naik turunya Y selain disebabkan oleh variable X juga oleh factor-faktor (variable) lainnya (seperti pendapatan masyarakat, harga, selera, dan lain-lain). Kemudian timbul pertanyaan, berapa besarnya kontribusi dari X terhadap naik turunnya nilai Y ini? Untuk menjawab pertanyaan ini harus dihitung suatu koeffisien yang disebut koeffisien penentuan (coefficient of determination). Kalau koeffisien penentuan ditulis KP, maka untuk menghitung KP digunakan rumus berikut :
KP = r2
Jika r = 0,9, maka nilai KP = (0,9)2 = 0,81 (=81%), yaitu besarnya sumbangan variabel X terhadap naik turunnya Y adalah 81%, sedangkan 19% disebabkan oleh factor lainnya. Cara menghitung r adalah sebagai berikut :
n n n
r = ( ∑ xiyi ) / ( akar ∑ xi2) ( akar ∑ yi
2 ) (1) i = 1 i = 1 i = 1
n
xi = Xi - X bar = ∑ Xi i = 1 n
yi = Yi - Y bar = ∑ Yi i = 1 Atau : n n n n n n n
r = (n ∑ XiYi - ∑ Xi ∑Yi ) / {akar n∑Xi2 – (∑Xi)
2} {akar n∑Yi2 – (∑Yi)
2} (2)
i =1 i =1 i =1 i =1 i =1 i =1 i =1 Rumus (1) dan (2) disebut koeffisien korelasi Pearson Contoh : Jika X adalah persentase kenaikan biaya iklan dan Y adalah persentase kenaikan hasil penjualan, maka berdasarkan table di bawah ini, hitunglah koeffisien korelasi (r).
X 1 2 4 5 7 9 10 12
Y 2 4 5 7 8 10 12 14
Penyelesaian : X Y X – X bar Y- Y bar x2
y2 xy (x) (y) 1 2 - 5,25 - 5,75 27,5625 33,0625 30,1875 2 4 - 4,25 - 3,75 18,0625 14,0625 15,9375 4 5 - 2,25 - 2,75 5,0625 7,5625 6,1875 5 7 - 1,25 - 0,75 1,5625 0,5625 0,9375 7 8 0,75 0,25 0,5625 0,0625 0,1875 9 10 2,75 2,25 7,5625 5,0625 6,1875 10 12 3,75 4,25 14,0625 18,0625 15,9375 12 14 5,75 6,25 33,0625 39,0625 35,9375
∑Xi =50 ∑ yi=62 ∑xi =0 ∑yi = 0 ∑ xi2 = 107,5 ∑yi2 =
117,5 ∑xiyi = 111,5
X bar =6,25 Ybar=7,75 r = 115,5 : (akar 107,5 – akar 117,5) = 0,99 Hubungan X dan Y ternyata sangat kuat dan positif,artinya kenaikan biaya iklan pada umumnya menaikkan harga penjualan. Dari nilai r, dicari nilai KP = r2 = 0,9801 (=98%). Artinya sumbangan biaya iklan terhadap variasi Y (naik turunya hasil penjualan) adalah 0,98 atau 98%, sedangkan sisanya yang 2% disebabkan oleh factor-faktor lainnya, seperti harga dan daya beli masyarakat. Kita juga dapat mencari r dengan menggunakan lembaran kerja yang dari rumus (2)
X Y X2
Y2 XY 1 2 1 4 2 2 4 4 16 8 4 5 16 25 20 5 7 25 49 35 7 8 49 64 56 9 10 81 100 90 10 12 100 144 120 12 14 144 196 168 ∑Xi = 50 ∑Yi = 62 ∑Xi2 = 420 ∑Yi2=598
∑ XiYi = 499
Memakai rumus (2) :
r = {8(499) – (50)(62)} : {akar (8)(42) – (50)2 - akar 8(598) – (62)2} = 0,99 Kalau hasil rumus (1) dan (2) tidak sama, ini disebabkan hanya karena kesalahan pembulatan atau rounding error. Apabila nilai r negative, missal r = - 99, artinya hubungan X dan Y kuat dan
negative. Dengan demikian, nilai KP = r2 = (0,99)2 = 0,9801 = 0,98 = 98% KOEFFISIEN KORELASI DATA BERKELOMPOK Rumus r untuk data berkelompok adalah sebagai berikut :
r = n (∑uvf) - (∑ufu)(∑ vfv) / {akar n∑u2fu – (∑ufu)2} { akar n∑v2fv
– (∑vfv)2} (3) Contoh : 100 orang mahasiswa Akademi Ilmu Statistik, Jakarta, mengambil ujian, diantaranya mata kuliah statistic dan matematika. Ada suatu pendapat bahwa pada umumnya mahasiswa yang mempunyai kemampuan matematika lemah maka akan mengalami kesulitan dalam belajar statistik, dan sebaliknya. Maksudnya kalau nilai matematika yang diperoleh rendah, maka nilai statistiknya juga rendah.Sebaliknya, kalau nilai matematikanya tinggi, maka nilai statistiknya juga tinggi. Dengan perkataan lain, ada hubungan positif antara nilai ujian matematika (X) dan nilai ujian statistic (Y). Misal setelah dinilai diperoleh hasil yang dikelompokkan sebagai berikut :
Matematika Statistik
40 - 49
50 - 59
60 - 69
70 - 79
80 - 89
90 - 99
Jumlah
90 – 99 80 – 89 70 – 79 60 – 69 50 – 59 40 – 49
1 3 3
4 6 5
1 5 9 6 4
2 4 10 5 2
4 6 8 2
4 5 1
10 16 24 21 17 12
Jumlah 7 15 25 23 20 10 100 Cara membaca tabel : Jumlah mahasiswa yang mendapat nilai matematika antara 70 – 79 dan nilai statistic antara 70 – 79 adalah 10 orang, sedangkan yang nilai matematikanya antara 40 – 49 dan statistiknya antara 40 – 49 sebanyak 3 orang. Pada umumnya dapat disimpulkan bahwa jika nilai matematikanya rendah, nilai statistiknya juga rendah, sedangkan kalau nilai matematikanya tinggi, maka nilai statistiknya juga tinggi. Sekarang, bagaimana cara menghitung koeffisien korelasinya ? Perhatikan bahwa sebetulnya data dari table yang menunjukkan hubungan nilai matematika dan statistika dapat dilihat sebagai dua tabel frekuensi berikut :
Kelas nilai Nilai Matematika Tengah (X) u fu
40 – 49 44,5 -2 7 50 – 59 54,5 -1 15 60 – 69 64,5 0 25 70 – 79 74,5 1 23 80 – 89 84,5
Dari tabel tersebut dapat dilihat bahwa u dan v, yang masing-masing adalah skala baru dari X dan Y, hanya merupakan kode saja untuk
menyederhanakan perhitungannya (sebelumnya kita mempergunakan symbol M untuk nilai tengah). Dalam hal ini karena ada dua variable kita pergunakan X dan Y. Kelas mana atau nilai tengah mana yang harus diberi nilai 0? Untuk data genap (seperti dalam contoh ini ada 6 kelas), pilihlah kelas yang dekat dengan nilai tengah, misalnya untuk X - 64,5 atau 74,5, disamakan 0, jadi u = 0. Sedangkan untuk Y juga sama saja. Disini f frekuensi untuk tiap sel, fu = frekuensi untuk X
atau u, dan fv untuk Y atau v.
Apabila dua table frekuensi tersebut dilihat secara bersama-sama, akan diperoleh tabel berikut : u
- 2
- 1
0
1
2
3
fv
2 20 90 – 99 94,5 3 10
Kelas nilai Nilai Statistika Tengah (Y) v fv
90 – 99 94,5 2 10 80 – 89 84,5 1 16 70 – 79 74,5 0 24 60 – 69 64,5 -1 21 50 – 59 54,5 -2 17 40 – 49 44,5 -3 12
v
2 1 0 1 -2 -3
1 3 3
4 6 5
1 5 9 6 4
2 4 10 5 2
4 6 8 2
4 5 1
10 16 24 21 17 12
fu 7 15 25 23 20 10 100 Kemudian untuk keperluan perhitungan r, harus dibuat table korelasi sebagai berikut (perhatikan perubahan letak u,v, fu, dan fv. (I) (II) (III) (IV) (V)
v fv vfv v2fv uvf
1 3 3
4 6 5
1 5 9 6 4
2 4 10 5 2
4 6 8 2
4 5 1
2 1 0 -1 -2 -3
10 16 24 21 17 12
20 16 0 -21 -34 -36
40 16 0 21 68 108
44 31 0 -3 20 33
(VI)u -2 -1 0 1 2 3 100 -55 253 125 fu ufu
u2fu uvf
7
15 -15
15 31
25 0 0 0
23 23
23 -1
20 40
80 24
10 30
90 39
100 64
236 125
(VII) (VIII)
(IX) (X)
Untuk memudahkan perhitungan :
u diletakkan di bagian bawah table (kolom VI) v disebelah kanan table (kolom I) Kolom (II) memuat frekuensi fv yang diperoleh dengan jalan
menjumlahkan semua frekuensi untuk semua nilai v, yaitu semua nilai dalam sel. Misal fv pada baris 1 = 2 + 4 + 4 = 10
Pada baris 5 = 3 + 6 + 6 + 2 = 1 …..dan seterusnya Kolom (III) memuat hasil kali vfv, yaitu hasil kali dari kolom (I) dan kolom
(III), misal 2 x 10 = 20, -2 x 17 = -34 ….dan seterusnya
Kolom (IV) memuat hasil kali v2fv yang diperoleh dari hasil perkalian
kuadrat kolom (I) dengan kolom (II), misal 22 x 10 = 40 atau kolom (I) dikalikan dengan kolom (III), misal 2 x 20 = 40…dan seterusnya
Nilai-nilai pada baris VII,VIII dan IX dapat diperoleh dengan jalan yang sama, dengan menggunakan u dan fu.
Perhatikan bahwa :
Jumlah kolom (II) = ∑ fv = n = 100
Jumlah kolom (III) = ∑ vfv = - 55
Jumlah kolom (IV) = ∑ v2fu = 253
Jumlah baris (VII),(VIII) dan (IX) masing-masing = ∑ fu = n = 100, ∑
ufu = 64 dan ∑ v2fu = 236
Untuk menghitung r masih diperlukan ∑ uvf, dimana f adalah frekuensi untuk setiap sel (cell frequency). Misalnya kalau dilihat dari baris ke baris :
Untuk v = 2, nilai f = 2, 4 dan 4 Untuk v = 1, nilai f = 1, 4, 6, dan 5 Untuk v = -3, nilai f = 3, 5, dan 4
(frekuensi v untuk semua nilai u) Sebaliknya f juga dapat dianggap sebagai frekuensi u untuk nilai v. Kalau dilihat dari kolom ke kolom, misalnya :
Untuk u = -2, frekuensinya 1, 3, dan 3
Untuk u = 2, nilai f = 4,6,8, dan 2 Untuk u = 3, nilai f = 4, 5, dan 1
Jadi ∑ uvf dapat diperoleh sebagai berikut : a. Dengan mengalikan setiap frekuensi sel dengan u dan v yang
bersangkutan :
∑uvf = (1)(2)(2) + (2)(2)(4) + (3)(2)(4) + (0)(1)(1) + (1)(1)(4) + (2)(1)(6) + (3)(1)(5) + (0)(0)(5) + (1)(0)(10) + (2)(0)(8) + (3)(0)(1) + (-2)(-1)(1) + (-1)(-1)(4) + (0)(-1)(9) + (1)(-1)(5) + (2)(-1)(2) + (-2)(-2)(3) +(-1)(-2)(6) + (0)(-2)(6) + (1)(-1)(2) + (-2)(-3)(3) + (-1)(-3)(5) + (0)(-3)(4)
= 125
Dari tabel korelasi di atas dapat diikhtisarkan hasil sebagai berikut :
n = 100 ∑ ufu = 64 ∑ u2fu = 236
∑ uvf = 125 ∑ vfu = - 55 ∑ v2fv = 253
r = {(100)(125) – (64)(-55)} : [{akar (100)(236) – (64)2} x akar (100)(253)– (-55)2}] = 0,7686 atau 0,77 Kesimpulan : Hubungan antara nilai matematika dan statistic cukup kuat dan positif. Artinya, nilai matematika yang diperoleh akan mempengaruhi nilai statistic (pada umumnya mahasiswa dengan nilai matematika yang rendah akan memperoleh nilai ujian statistic yang rendah; sebaliknya jika nilai matematikanya tinggi, maka nilai statistic yang akan dicapai tinggi). Note : Rumus untuk menghitung korelasi bagi data berkelompok penting sekali sebab dalam praktek, misalnya di dalam suatu penelitian, hasil data yang dipeoleh sudah disajikan dalam bentuk data berkelompok dengan kelas interval yang sama.
KORELASI RANK (PERINGKAT) Misalkan ada dua orang, Joni dan Tono, yang sama-sama penggemar rokok. Kedua orang tersebut diminta untuk memberikan nilai terhadap 10 mek rokok. Rokok yang paling digemari diberi nilai 1 dan seterusnya sampai pada rokok yang tidak disenangi diberi nilai 10. Dengan perkataan lain, Joni dan Tono diminta untuk memberikan rank (peringkat). Pembeian rank ini bias dibalik, maksudnya untuk rokok yang disenangi diberi nomor 10 dan seterusnya, sementara yang tidak disenangi diberi nilai 1. Hasil pemberian rank adalah sebagai berikut : Rank hipotetis nilai rokok Joni dan Tono
Nomer urut Merk Rokok Rank dari Jono Rank dari Tono 1 2 3 4 5 6 7 8 9 10
Kansas Jarum 555 Bentoel Mascot Marlboro Salem Kent Gudang Garam Dunhill
9 5 10 1 8 7 3 4 2 6
8 3 9 2 7 10 4 6 1 5
Apabila dibuat koeffisien korelasi antara rank Joni dan Tono terhadap 10 merk rokok tersebut, maka akan diperoleh koeffisien korelasi rokok :
rrank = 1 - { 6 ∑ di2 / n (n2 – 1) }
dimana : di = selisih dari pasangan rank ke – i
n = banyaknya pasangan rank (dalam hal ini n = 10) Rumus ini disebut rumus Spearman
Contoh : Cari koeffisien korelasi rank antara rank Tono dan Joni didalam menilai 10 merk rokok
Rank Tono 8 3 9 2 7 10 4 6 1 5 Rank Joni 9 5 10 1 8 7 3 4 2 6 Selisih rank (d) -1 -2 -1 1 -1 3 1 2 -1 -3
d2 1 4 1 1 1 9 1 4 1 9 Penyelesaian :
rrank = 1 - { 6 ∑ di2 / n (n2 – 1) }
= 1 - { 6 (1 + 4 + 1 + ….+1) / 10 (100 – 1) } = 0,85 Contoh (apabila ada nilai yang sama) : Ada 10 calon salesman yang diuji mengenai teknik penjualan. Setelah mereka selesai diuji kemudian ditugaskan untuk melakukan penjualan. Hasil-hasilnya adalah X = hasil ujian, Y = hasil penjualan tahun pertama. Nilai X dan Y dari 10 salesman termasuk rank-nya dan selisih rank (d) adalah sebagai berikut :
Nama
Nilai Ujian
Rank
Hasil Penjualan Tahun Pertama
(ribuan rupiah)
Rank
Selisih rank
(X) (Y) (d) d2
Amin Joni Tono Amir Ahmad Paulus Purwanto Bambang Jatmiko Aryo
48 32 40 34 30 50 26 50 22 43
3 6 5 7 8
1,5
9 1,5
10 4
312 164 280 196 200 288 146 361 149 252
2 8 4 7 6 3
10 1 9 5
1 - 2
1 0 2
-1,5 -1 0,5 1
-1
1 4 1 0 4
2,25 1 0,25 1 1
Oleh karena Paulus dan Bambang mempunyai nilai sama, maka rank mereka harus sama yaitu (1 + 2) / 2 = 1,5. Mula-mula Pulus diberi rank 1, Bambang rank 2 (atau sebaliknya), kemudian dirata-ratakan. Ada kemungkinan tiga orang mempunyai nilai yang sama dan jatuh pada rank 5, 6, dan 7, dimana masing - masing mendapat rank yang sama, yaitu : (5 + 6 +7) / 3 = 6. Dalam hal ini, masing-masing diberi rank sesuai dengan urutnanya, kemudian dicari rata-rata ranknya. Apabila ada beberapa rank yang sama, maka biasanya koeffisien korelasi rank tidak sama dengan koeffisien korelasi yang dihitung berdasarkan rumus Pearson (product moment coefficient of correlation). Penyelesaian :
rrank = 1 - { 6 ∑ di2 / n (n2 – 1) }
= 1 - {6 (1 + 4 + 1 + ……+ 1) } / 10 (102 – 1) } = 1 - { 6 (15,5) / 10 (99) } = 0,91
Note : Perhitungan koeffisien korelasi dengan menggunakan rumus koeffisien korelasi rank (Spearman) jauh lebih sederhana dibandingkan rumus product moment dari Pearson, sebab dengan menggunakan rank, angka-angkanya menjadi lebih kecil, sedangkan perhitungan adalah sama atau sangat mendekati. Nilai terendah diberi rank terkecil dan nilai tertinggi diberi rank terbesar. Kalau penilaian terhadap mutu barang didasarkan pada selera atau kegemaran, maka barang yang jelek (tak disenangi) diberi rank terkecil, sedangkan barang yang bagus (paling disenangi) diberi rank terbesar atau sebaliknya. KORELASI DATA KUALITATIF Rumus koeffisien korelasi yang telah diahas diatas hanya berlaku untuk data kuantitatif. Rank juga berupa data kuantitatif sebab berbentuk angka. Banyak sekali hasil pengumpulan data (penelitian) yang menghasilkan data kualitatif, khususnya yang berupa kategori-kategori. Misalnya, penduduk dikategorikan berpendapatan tinggi, sedang/menengah, dan rendah; senang dikategorikan mempunyai mobil sedan berukuran besar, sedang, dan kecil. Kita seringingin mengetahui apakah ada hubungan antara selera konsumen dengan letak geogrfis; antara kedudukan orang tua dengan kedudukan anak (kalau orang tua pangkatnya tinggi, apakah anaknya juga demikian); antara pendidikan orang tua dan anak; antara pendidikan dan pendapatan (makin tinggi pendidikan, makin tinggi pendapatan?) dan sebagainya. Untuk data kualitatif yang dipergunakan dalam mengukur kuatnya hubungan disebut Contingency Coefficient (koeffisien bersyarat) yang mempunyai pengertian sama seperti koeffisien korelasi. Misalnya, hasil penelitian disajikan dalam bentuk p x q table. Telah disebut diatas bahwa koeffisien bersyarat (Cc), dipergunakan untuk mengukur kuatnya hubungan data kualitatif yang mempunyai arti seperti
koeffisien korelasi, dimana nilai Cc sebesar 0, yang berarti tidak ada hubungan.
Akan tetapi batas Cc tidak sebesar 1, tergantung atau sebagai fungsi
banyaknya kategori (baris atau kolom). Batas tertinggi nilai Cc ialah akar (r-1)/r, dimana nilai r ialah banyaknya baris
atau kolom. Kalau banyaknya baris tidak sama dengan banyaknya kolom, pilih nilai yang terkecil. Adapun untuk menghitung nilai koeffisien bersyarat (Cc) digunakan rumus :
Cc = akar X2 / (X2 + n)
p q p q p q n = ∑ ∑ fij = ∑ ni. = ∑ n.j = ∑ ∑ nij = banyaknya observasi i = 1 j= 1 i = 1 j= 1 i = 1 j= 1 p q
X2 = ∑ ∑ (fij - eij)2 / eij
i = 1 j = 1 Dimana : fij = nij = frekuensi atau banyaknya observasi baris I kolom j
i = 1,2,……..,p j = 1,2,……..,q
X2 dibaca kai skuer atau khi kuadrat II I
1
2
…….
f
……
q
(1) (2) (3) (4) (5) (6) (7) (8) 1 f11
(e11)
f12
(e12)
f1j
(e1j)
f1q
(e1q)
n1.
2 f21
(e21)
f22
(e22)
F2j
(e2j)
f2q
(e2q)
n2.
.
.
i fi1
(ei1)
fi2
(ei2)
fij
(eij)
fiq
(eiq)
ni.
.
.
p fp1
(ep1)
fp2
(ep2)
fpj
(epj)
fpq
(epq)
np.
n1 n2 nj nq n
fij = frekuensi kategori i dan j
eij = frekuensi harapan kategori I dan j
eij = (ni.)(n.j) / n = frekuensi harapan (expected frecuency)
q p ni. = ∑ fij ---.> ∑ ni. = n
j = 1 i = 1 q p n.j = ∑fij ---.> ∑ n.i = n
i = 1 j = 1 p q ∑ ∑nij = n i = 1 j = 1
Kalau nilai perbandingan Cc dengan batas tertinggi :
Cc < 0,50 maka hubungan lemah
0,50 < Cc < 0,75 maka hubungan sedang / cukup
0,75 < Cc < 0,90 maka hubunga kuat
0,90 < Cc < 1 maka hubungan sangat kuat
Cc = 1 maka hubungan sempurna
Contoh : Untuk mengetahui apakah ada hubungan antara tingkat pendidikan ibu rumah tangga dengan konsumsi susu dari anggota keluarga mereka, dilakukan penelitian yang hasilnya disajikan dalam table berikut : Pendidikan Konsumsi Kurang Cukup Sangat cukup Tidak tamat SLA 82 65 12 Tamat SLA 59 112 24 Pernah masuk PT 37 94 42 Hitung Cc (contingency coefficient) untuk mengukur hubungan antara tingkat pendidikan dan konsumsi susu Penyelesaian : Untuk memudahkan kita susun table berikut :
II I
1
2
3
Jumlah
1 82 (53,70)
65 (81,76)
12 (23,53)
n1 = 159
2 59 (65,86)
112 (100,28)
24 (28,86)
n2 = 195
3 37
94
42
n3 = 173
(58,43) (88,96) (25,61) Jumlah n1 = 178 n1 = 271 n1 = 78 n = 527
e11 = n1.n1 / n = (159)(178) / 527 = 53,70
e12 = n1.n2 / n = (159)(271) / 527 = 81,76
e13 = n1.n3 / n = (159)(78) / 527 = 23,53
e21 = n2.n1 / n = (195)(178) / 527 = 65,86
e22 = n2.n2 / n = (195)(271) / 527 = 100,28
e23 = n2.n3 / n = (195)(78) / 527 = 28,86
e31 = n3.n1 / n = (173)(178) / 527 = 58,43
e32 = n3.n2 / n = (173)(271) / 527 = 88,96
e33 = n3.n3 / n = (173)(78) / 527 = 25,61
3 3
X2 = ∑ ∑ (28,30)2 / 53,70 + (-16,76)2 / 81,76 + (-11,53)2 / 23,53 + i = 1 j = 1
(-6,86)2 / 65,86 + (11,72)2 / 100,28 + (-4,86)2 / 28,86 + (-21,43)2 /
58,43(5,04)2 / 88,96 + (16,39)2 / 25,61 = 45,54
Cc = akar X2 / ( X2 + n ) = akar 45,54 / (45,54 + 527) = 0,28
Karena jumlah baris dan jumlah kolom sama dengan 3, maka r = 3. Batas atas Cc ialah akar {(3-1)/3} = 0,82.
Karena nilai perbandingan Cc dengan batas atas lebih kecil dari 0,50, maka
hubungan atau korelasi antara tingkat pendidikan ibu rumah tangga dengan tingkat konsumsi susu anggota rumah tangga tidak begitu kuat, bahkan bias dikatakan lemah. TEKNIK RAMALAN DAN ANALISIS REGRESI
Teknik ramalan dan analisis regresi adalah untuk menghitung suatu perkiraan atau persamaan yang akan menjelaskan hubungan antara dua variable. Pembahasan ini terbatas pada regresi sederhana, yaitu mengenai hubungan antara dua variable yang biasanya cukup tepat dinyatakan dalam suatu garis lurus. 1. Diagram Pencar (Scatter Diagram)
Setelah ditetapkan bahwa terdapat hubungan logis diantara dua variable, maka untuk mendukung analisis lebih jauh, barangkali tahap selanjutnya adalah menggunakan grafik. Grafik ini disebut diagram pencar, yang menunjukkan titik-titik tertentu. Setiap titik memperlihatkan suatu hasil yang kita nilai svariabel tidak bebas (dependent) maupun bebas (independent). Diagram pencar memiliki dua manfaat, yaitu : a. membantu menunjukkan apakah terdapat hubungan yang bermanfaat
untuk dua variable. b. Membantu menetapkan tipe persamaan yang menunjukkan hubungan
antara kedua variable tersebut
2. Persamaan Regresi Linier
Garis lurus yang terdapat pada diagram pencar dan menggambarkan hubungan antara variable, desebut garis regresi atau garis perkiraan. Persamaan yang digunakan untuk mendapatkan garis regresi pada data diagram pencar disebut persamaan regresi atau persamaan perkiraan. Bentuk persamaan regresi yang menggunakan metode kuadrat terkecil adalah sebagai berikut : Y’ = a + b X Dimana : a = Y pintasan, (nilai Y’ bila X = 0)
b = kemiringan dari garis regresi (kenaikan atau penurunan Y’ untuk setiap perubahan satuan-satuan X) atau koeffisien regresi, yang mengukur besarnya pengaruh X terhadap Y atau kalau X naik satu unit.
X = nilai tertentu dari variable bebas Y’ = nilai yang diukur / dihitung pada variable tidak bebas. Kesamaan diantara garis regresi dan garis trend tidak dapat berakhir dengan persamaan garis lirus. Garis regresi (seperti garis trend dan nilai tengah aritmatika) memiliki dua sifat-sifat matematis berikut : ∑ (Y – Y’) = 0 Dan ∑ (Y – Y’) = nilai terkecil atau terendah Dengan perkataan lain, garis regresi akan ditempatkan pada data dalam diagram sedemikian rupa sehingga penyimpangan (perbedaan) positif titik-titik terhadap titik peb\ncar di atas garis akan mengimbangi penyimpangan negative tititk-titik pencar yang terletak di bawah garis, sehingga hasil penyimpangan keseluruhan tititk-titik terhadap garis lurus adalah nol. Untuk tujuan kita diatas, perhitungan analisis regresi dan analisis korelasi dapat dipermudah dengan menggunakan rumus dalam bentuk penyimpangan nilai tengah variable X dan Y, yaitu penyimpangan dari X bar dan Y bar. Oleh karena itu, dapat digunakan simbol berikut ini : x = (X – X bar) y = (Y – Y bar) dan xy = (X-X bar) (Y – Y bar) Ciri / sifat kuadrat terkecil :
∑ (Y – Y ‘) = 0
∑ (Y – Y”)2 = nilai terkecil (atau nilai terendah) Nilai a dan b pada persamaan regresi dapat dihitung dengan rumus berikut :
b = ∑ xiyi /∑ x2i
atau b = (n ∑XiYi – ∑Xi∑Yi) / n ∑X2i – (∑Xi)2
a = Y bar – bX bar Contoh :
Karyawan Hasil produksi Skor tes y x xy x2 y2 (lusin) (Y) (X) (Y–Ybar) (X – Xbar)
A 30 6 - 7 - 1 7 1 49 B 49 9 12 2 24 4 144 C 18 3 -19 - 4 76 16 361 D 42 8 5 1 5 1 25 E 39 7 2 0 0 0 4 F 25 5 -12
- 2 24 4 144 G 41 8 4 1 4 1 16 H 52 10 15 3 45 9 225 296 56 0 0 185 36 968 Ybar = ∑ Y/N = 296/8 = 37 ; Xbar =∑X / N = 56/8 = 7
b = xy / x2 = 185/36 = 5,138 atau 5,14 a = Ybar – b. Xbar = 37 - 5,14 ( 7 ) = 1,02 Sehingga persamaan regresi yang memperlihatkan hubungan kedua variable antara hasil produksi dan hasil tes kecerdasan karyawan pada pabrik mainan anak-anak “Takey” adalah : Y’ = 1,02 + 5,14 X Penggunaan Persamaan Regresi dalam Peramalan Tujuan utama penggunaan persamaan regresi adalah untuk memperkirakan nilai dari variable tak bebas pada nilai variable bebas tertentu. Misalnya, Hiram Hess, seorang manajer personalia pada pabrik mainan “Takey” sedang mempertimbangkan akan mempekerjakan seorang calon karyawan dengan nilai tes kecerdasan 4. Sedangkan penyelia (supervisor) pada departemen tersebut menginginkan seorang karyawan baru yang dapat berproddukdi pada tingkat minimal 30 lusin. Tentu saja, tidak mungkin untuk mengatakan dengan tepat berapa tingkat produksi si calon karyawan pada waktu mendatang, tetapi Hirem dapat menggunakan persamaan diatas untuk melihat ramalan produksi si calon karyawan pada waktu mendatang.
Bagaimana? Yaitu dengan menyukihkan (mensubstitusikan) nilai 4 pada X dari persamaan regresi, maka ramalan dapat ddihitung menjadi sebagai berikut : Y’ = 1,02 + 5,14 (x) = 1,02 + 5,14 (4) = 21,58
STATISTIK INDUSTRI MODUL 8 REGRESI LINIER BERGANDA DAN REGRESI (TREND) NONLINIER
Tujuan Belajar : Setelah mempelajari bab ini, Anda diharapkan mampu :
Memahami hubungan lebih dari dua variable Mendapatkan persamaan regrresi linier berganda Menghitung korelasi berganda dan korelasiparsial Membuat persamaan trend nonlinier dari suatu series data
HUBUNGAN LEBIH DARI DUA VARIABEL REGRESI LINIER BERGANDA
Hubungan linier dari variable X dan Y yang dibahas pada modul 8 menggunakan persamaan regresi linier Y’ = a + bX, misalnya hubungan antara biaya periklanan (X) dan hasil penjualan (Y). Selain biaya periklanan, factor apalagi yang mempengaruhi hasil penjualan ? Apabila terdapat lebih dari dua variable, maka hubungan linier dapat dinyatakan dalam persamaan regresi linier berganda sebagai berikut : Y’ = b0 + b1X1 + b2X2 + …….+ bkXk
(1) Y’i = b0 + b1X1i + b2X2i + …….+ bkXki
(2) Dengan : i = 1,2,…….n Dimana : Y = nilai observasi ( data hasil pencatatan ) Y’ = nilai regresi Disini ada satu variable tidak bebas (dependent variable), yaitu Y’ dan ada k variable (independent variable), yaitu X1, ……., Xk.
Untuk menghitung b0, b1, b2,……, bk kita gunakan Metode Kuadrat Terkecil
(Least Square Method) yang menghasilkan persamaan normal sebagai berikut : b0n + b1∑X1 + b2∑X2 + …….+ bk ∑Xk = ∑Y
b0∑X1 + b1∑X12 + b2∑X1X2 + ……. bk ∑ X1Xk = ∑ X1Y
b0∑ X2 + b1∑X2 X1 + b2∑X2 2 + ……. bk ∑ X2 Xk = ∑ X22 Y
. . . . . . . . . . . . . . .
b0 ∑Xk + b1∑ Xk X1 + b2∑Xk X2 + ……. bk ∑Xk2 = ∑ Xk Y
Kalau persamaan ini dipecahkan, kita akan memperoleh nilai b0, b1, b2,
…..,bk. Kemudian dapat dibentuk persamaan regresi linier berganda. Apabila
persamaan regresi itu telah diperoleh, barulah kita dapat meramalkan nilai Y dengan syarat kalau nilai X1 , X2 , ……., Xk sebagai variable bebas
(independent/explanatory variables) sudah diketahui. Untuk k = 2, Y’ = b0 + b1X1 + b2X2 , satu variable tak bebas ( Y ),
dan dua variable bebas (X1 dan X2 ), maka b0, b1 dan b2 dapat dihitung
dari persamaan normal berikut : b0n + b1∑X1 + b2∑X2 = ∑Y
b0∑X1 + b1∑X12 + b2∑X1X2 = ∑ X1Y
b0∑ X2 + b1∑X2 X1 + b2∑X2 2 = ∑ X2 Y
. . . . . (ada tiga persamaan dengan tiga variable yang tak diketahui nilainya, yaitu b0,
b1, b2 dan bk ).Persamaan tersebut dapat dinyatakan dalam persamaan
berikut : n ∑X1 ∑X2 b0 ∑Y
∑X1 ∑X12 ∑X1X2 b1 = ∑ X1Y
∑ X2 ∑X2 X1 ∑X2 2 b2 ∑ X2 Y
. . . A b H Dengan : A = matriks (diketahui) H = vector kolom (diketahui) b = vector kolom (tidak diketahui) Variabel b dapat diselesaikan dengan cara sebagai berikut : Ab = H
b = A-1 H
dimana A-1 adalah kebalikan (invers) dari matriks A. CARA MEMECAHKAN PERSAMAAN LEBIH DARI DUA VARIABEL Banyak sekali cara untuk memecahkan persamaan dengan variable lebih dari dua, diantaranya dengan menggunakan determinan. Contoh 1 : Dalam suatu penelitian yang dilakukan terhadap 10 rumah tangga yang dipilih secara acak, diperoleh data pengeluaran untuk pembelian barang-barang tahan lama per minggu (Y), pendapatan per minggu (X1), dan jumlah anggota rumah
tangga (X2) sebagai berikut :
Y (ratusan rupiah) 23 7 15 17 23 22 10 14 20 19 X1(ratusan rupiah) 10 2 4 6 8 7
4 6 7 6 X1(orang) 7 3 2 4 6
5 3 3 4 3 Kalau seandainya suatu rumah tangga mempunyai X1 dan X2, masing-masing
11 dan 8, berapa besarnya nilai Y, artinya berapa ratus rupiah rumah tangga
yang bersangkutan akan mengeluarkan untuk pembelian barang-barang tahan lama? Penyelesaian : Langkah pertama adalah mengolah data diatas menjadi sebagai berikut :
Y X1 X2 X1Y X2Y X1X2 Y2 X12 X22
23
15 17 23 22 10 14 20 19
10 2 4 6 8 7 4 6 7 6
7 3 2 4 6 5 3 3 4 3
230
102 184 154
140 114
161 21 30 68 138 110 30 42 80 57
70 6 8 24 48 35 12 18 28 18
529 49 225 289 529 484 100 196 400 361
100 4 16 36 64 49 16 36 49 36
49 9 4 16 36 25 9 9 19
∑ Y = 170
∑X1 = 60
∑X2 = 40
∑X1Y
=1.122
∑X2Y=
737
∑X1X2=
267 ∑Y2 = 3.162
∑
X12=
406
∑ X2
2 =182
Persamaan normal adalah sebagai berikut : b0n + b1∑X1 + b2∑X2 = ∑Y
maka : 10 b0 + 60 b1 + 40 b2 = 170
b0 ∑X1 + b1∑X12 + b2∑X1X2 = ∑ X1Y
maka : 60b0 + 40 b1 + 267 b2 = 1.122
b0∑X2 + b1∑X2 X1 + b2∑X22 = ∑ X2Y
maka : 40 b0 + 267 b1 + 182 b2 = 737
Dengan cara determinan, persamaan diatas menghasilkan b0 = 3,92, b1 = 2,50
dan b2 = - 0,48, sehingga persamaannya adalah sebagai berikut :
Y = 3,92 + 2,50 X1 - 0,48 X2 = 3,92 + 2,50 (11) - 0,48 (8) =
27,58 Jadi untuk suatu rumah tangga dengan pendapatan per minggu Rp. 11.000 dan jumlah anggota keluarga 8 orang, diperkirakan akan mengeluarkan Rp. 2.758 untuk pembelian barang-barang tahan lama. Kita juga dapat menghitung hubungan antara perubahan pendapatan dan pengeluaran. Untuk tujuan ini, kita gunakan persamaan regresi linier berganda. Y’ = b0 + b1X1 + b2X2
(3) b0 = nilai Y’, kalau X1 = X2 = 0
b1 = besarnya kenaikan (penurunan) Y dalam satuan, kalau X1 naik
(turun) satu satuan, sedangkan X2 konstan
b2 = besarnya kenaikan (penurunan) Y dalam satuan, kalau X2 naik
(turun) satu satuan, sedangkan X1 konstan
Jadi, jika X1 naik Rp. 1.000 sementara X2 konstan, maka Y naik Rp. 250.
Demikian juga jika X2 bertambah satu orang, sedangkan X1 konstan, maka Y
turun (makin besar jumlah anggota keluarga, makin berkurang pengeluaran untuk pembelian barang-barang tahan lama). Nilai b1 dan b2 dinamakan
koeffisien regresi parsial (partial coefficient regression) dan sering ditulis sebagai b1 = b01.2 dan b2 = b02.1.
Korelasi Berganda Pada modul 7, telah dibahas tentang korelasi antara dua variable X dan Y. Koeffisien korelasi antara X dan Y sering diberi symbol rxy atau r saja.
rxy = ∑xiyi / ( ∑xi2)( ∑yi2)
(4) dimana : xi = X1i - X bar
yi = Yi - Y bar
Apabila kita mempunyai tiga variable Y, X1,X2 maka korelasi X1 dan Y
digambarkan dengan rumus berikut :
rxiy = r1y = ∑ x1iyi / ( ∑ x1i2)( ∑yi2)
(5) dimana : x1i = X1i - X bar
yi = Yi - Y bar
Korelasi X2 dan Y digambarkan dengan rumus berikut :
rx2y = r2y =∑ x2iyi / ( ∑ x2i2)( ∑ yi2)
(6) dimana : x2i = X2i - X2bar
yi = Yi - Ybar
Akhirnya korelasi X1 dan X2 adalah :
rx1x2 = r12 = ∑ x1ix2i / (akar ∑ x1i2)( akar∑ x2i2)
(7) dimana : x1i = X1i - X1bar
x2i = X2i - X2bar
Koeffisien korelasi antara dua variable yang disebut koeffisien korelasi linier sederhana (KKLS). Kalau kita ingin mengetahui kuatnya hubungan antara variable Y dengan beberapa variable X lainnya (misalnya antara Y dengan X1 dan X2), maka kita
harus menggunakan suatu koeffisien korelasi yang disebut koeffisien korelasi linier berganda (KKLB) yang rumusnya adalah sebagai berikut :
KKLB = Ry.12 = (r21y + r22y - 2 r1yr2yr12 ) / (1 –
r212) (8)
Apabila KKLB dikuadtratkan, maka akan diperoleh koeffisien penentuan (KP), yaitu suatu nilai untuk mengukur besarnya sumbangan (share) dari beberapa variabel X terhadap variasi (naik-turunnya) Y. Kalau Y’ = b0 + b1X1 + b2X2 , KP mengukur besarnya sumbangan X1 dan X2 terhadap variasi atau naik turunnya Y.
KP = R2y.12
(9) Apabila dikalikan dengan 100% akan diperoleh persentase sumbangan X1 dan
X2 terhadap naik turunnya Y.
Misalkan : X1 = biaya iklan
X2 = pendapatan
Y = hasil penjualan Ry.12 = 0,90
KP = (0,90)2 = 0,81 (kalikan 100% = 81%).
Ini berarti bahwa variasi atau naik turunnya nilai Y , 81 % disebabkan oleh biaya iklan X1 dan pendapatan X2, sementara 19% lainnya, disebabkan olah
faktor-faktor lain yang mempengaruhi hasil penjualan tetapi tidak dimasukkan dalam persamaan regresi linier berganda. Makin besar nilai KP makin baiklah persamaan regresi berganda untuk meramalkan nilai Y. Koeffisien penentuan dapat juga dihitung berdasarkan rumus berikut :
KP = R2y.12 = ( b1∑x1i yi + b2∑x2i yi ) / ∑ yi2
(10) b1 dan b2 diperoleh dari Y’ = b0 + b1X1 + b2X2
Dimana : ∑x1i yi = ∑(X1i – X1bar) (Yi – Y bar)
= ∑X1i Yi - 1/n ∑X1i∑Yi
∑x2i yi = ∑(X2i – X2bar) (Yi – Y bar)
= ∑X2i Yi - 1/n ∑X2i∑Yi
∑yi = ∑ (Yi – Y bar)2
= ∑ Yi2 - 1/n (∑Yi)2 Contoh 2 : Dengan menggunakan contoh 1, hitunglah KP dengan rumus 10 Penyelesaian : Y = 3,92 + 2,50 X1 - 0,48 X2
b1 = 2,50 , b1 = - 0,48 ,
∑X1i Yi= 1.122 , ∑X1i = 60 , ∑Yi = 170
∑x1i yi = = ∑X1i Yi - 1/n ∑X1i∑Yi = 1.122 – 1/10 (60)(170) = 102
∑X2i Yi = 737 , ∑X2i = 40 , ∑Yi = 170
∑x2i yi = ∑X2i Yi - 1/n ∑X2i∑Yi = 737 - 1/10 (40) (170) = 57
∑ Yi
2 = 3.162 , ∑Yi = 170
∑yi2= ∑ Yi2 - 1/n (∑Yi)2 = 3.162 - 1/10 (170)2 = 272
KP = R2y.12 = ( b1∑x1i yi + b2∑x2i yi ) / ∑ yi2
= {2,50 (102) – 0,48 (57)} / 272 = 0,8369 = 0,84 Jadi besarnya sumbangan pendapatan (X1) dan jumlah anggota rumah tangga
(X2) terhadap variasi atau naik turunnya pengeluaran untuk pembelian barang-
barang tahan lama (Y) adalah 84%, sedangkan sisanya sebesar 16% disebabkan oleh factor-faktor lainnya. Besarnya KKLB adalah sebagai berikut :
KKLB = Ry.12 = akar R2y.12
= akar 0,8369 = 0,90 Koeffisien Korelasi Parsial Kalau variable Y berkorelasi dengan X1 dan X1, maka koeffisien korelasi
antara Y dan X1 (X2 konstan), antara Y dan X2 (X1 konstan), dan antara
X1 dan X2 (Y konstan) disebut Koeffisien Korelasi Parsial (KKP) dengan
rumus sebagai berikut : a. Koeffisien Korelasi parsial Y dan X1 ( kalau X2 konstan ) :
r1y.2 = r1y – r2y r12 / (1 - r2y2) (1 - r12
2)
(11)
b. Koeffisien Korelasi parsial Y dan X2 ( kalau X1 konstan ) :
r2y.1 = r2y – r1y r12 / (1 - r1y2)( (1 - r12
2)
(12) c. Koeffisien Korelasi parsial X1 dan X2 ( kalau Y konstan ) :
r12.y = r12 – r1y r2y/ (1 - r1y2) ( 1 - r2y
2)
(13) Contoh 3 : Dengan menggunakan contoh 1, hitunglah koeffisien korelasi parsial antara Y dan X1 , Y dan X2 serta X1 dan X2
Penyelesaian :
Dari contoh 2 : ∑x1i yi = 102 , ∑x2i yi = 57 , ∑yi2 = = 272
Dari contoh 1 : ∑X1i2 = ∑X12 = 406 , ∑X1i = ∑X1= 60
∑X2i2 = ∑X2
2 = 182 , ∑X2i = ∑X2 = 40 , ∑X1i X2i = 267
Kemudian dihitung : ∑x1i 2 = ∑X1i 2 - 1/n (∑X1i) 2 = 406 - 1/10 (60)2 =
46
∑x2i 2 = ∑X2i 2 - 1/n (∑X2i) 2 = 182 - 1/10 (40)2 =
22
∑x1ix2i = ∑X1iX2i - 1/n ∑x1i∑x2i = 267 - 1/10 (60)(40) =
27
r1y = ∑ x1iyi / ( ∑ x1i2 ∑y1i2 = 102 / 46 272 = 0,91
r2y = ∑ x2iyi / ( ∑ x2i2 ∑yi2 = 57 / 22 272 = 0,74
r12 = ∑ x1iy2i / ( ∑ x1i2 ∑x2i2 = 27 / 46 222 = 0,81
r1y.2 = r1y – r2 r12 / (1 - r2y2) (1 - ry2
2)
= { 0,91 - (0,74)(0,85)} / {1 – (0,74)2} {1 – (0,85)2} = 0,80
r2y.1 = r2y – r1y r12 / (1 - r1y2)( (1 - ry2
2)
= { 0,74 - (0,91)(0,85)} / {1 – (0,91)2} {1 – (0,85)2} = - 0,15
r12.y = r12 – r1y r2y/ (1 - r1y2) ( 1 - ry2
2)
= { 0,85 - (0,91)(0,74)} / {1 – (0,91)2} {1 – (0,74)2} = 0,63 Dalam prakteknya kita sering ingin mengetahui koeffisien korelasi antara dua variabel dengan menganggap variabel-variabel lainnya konstan (tidak mempengaruhi). Misal : Y’ = b0 + b1X1 + b2X2
Dimana Y = hasil penjualan, X1 = biaya iklan , X2 = pendapatan masyarakat
r1y.2 = koeffisien korelasi parsial antara biaya iklan dan hasil penjualan kalau pendapatannya konstan. Jadi pengaruh pendapatan terhadap hasil penjualan tidak diperhitungkan
r2y.1 = koeffisien korelasi parsial antara pendapatan dan hasil penjualan kalau
biaya iklan konstan. Jadi pengaruh iklan terhadap hasil penjualan tidak diperhitungkan
r12.y = koeffisien korelasi parsial antara biaya iklan dan pendapatan kalau
hasil penjualan konstan. Jadi pengaruh hasil penjualan terhadap pendapatan tidak diperhitungkan
Sebenarnya hubungan diatas terjadi secara timbale balik (reciprocal). Misalnya tetapi kalau kita ingin menggunakan garis regresi untuk melakukan biaya iklan mempengaruhi hasil penjualan, tetapi sebaliknya hasil penjualan juga mempengaruhi biaya iklan, sebab sebagian hasil penjualan itu disisihkan untuk biaya iklan. Akan peramalan, maka variable yang dianggap mempengaruhi naik turunnya Y tersebut dinamakan variable bebas (X1, X2 ….., Xk) atau variable yang
menjelaskan / menerangkan. Jika persamaan regresi linier berganda Y’ = b0 + b1X1 + b2X2 + ……
bkXk, ingin dipergunakan untuk meramalkan nilai Y, maka nilai-nilai X1, X2 …..,
Xk harus diketahui terlebih dahulu, yang mungkin sesuai dengan perencanaan
(rencana pembiayaan iklan, rencana pembelian pupuk, dan lainsebagainya) atau yang akan diramalkan. Misal Y’ = 3,4892 - 0,0899 (10) + 0,0637 (20) + 0,0187 (100) = 5,7342 TREND PARABOLA Garis trend pada dasarnya adalah garis regresi dimana variable bebas X merupakan variable waktu. Baik garis regresi maupun trend dapat berupa garis lurus (linear regression) maupun tidak lurus (non linier /trend). Persamaan garis trend parabola adalah sebagai berikut :
Y’ = a + bX + cX2 ( X = waktu )
Perhatikan bahwa bentuk persamaan seperti persamaan garis regresi linier berganda adalah Y’ = b0 + b1X1 + b2X2 , dimana b0 = a , b1 = b,
b2 = c , X1 = X dan X2 = X2 . Dengan demikian cara menghitung koeffisien
a, b, dan c sama seperti menghitung b0 , b1 dan b2, yaitu menggunakan
persamaan normal sebagai berikut :
an + b∑X1 + c∑X2 = ∑Y
a∑X1 + b∑X2 + c∑X3 = ∑ XY
a∑ X2 + b∑ X3 + c∑X4 = ∑ X2Y . . . . . (ada tiga persamaan dengan tiga variable yang tak diketahui nilainya, yaitu b0,
b1, b2 dan bk ).Persamaan tersebut dapat dinyatakan dalam persamaan
berikut :
n ∑X ∑X 2 a ∑ X
∑X1 ∑X2 ∑X 3 b = ∑ XY
∑ X2 ∑X 3 ∑X4 c ∑ X 2 Y A B C
AB = C ; B = A- 1 ; C A- 1 = kebalikan (invers) A Contoh : Hasil penjualan perusahaan PT. Sinar Surya selama 10 tahun terakhir adalah sebagai berikut : Tahun 1989 1990 1991 199
2 1993
1994
1995
1996 1997 1998 1999
Hasil Penjualan (jutaanRp)
23,2
31,4
39,8
50,2
62,9
76,0
92,0
105,7
122,8
131,7
151,1
Berapa besarnya ramalan hasil penjualan tahun 2000?
Penyelesaian : Karena jumlah tahunnya adalah ganjil, maka pilih tahun yang ada di tengah sebagai titik asal, X = 0. Perhitungannya adalah sebagai berikut : Tahun X Y X2 X3 X4 XY X2Y 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
-5 -4 -3 -2 -1 0 1 2 3 4 5
23,2 31,4 39,8 50,2 62,9 76,0 92,0 105,7 122,8 131,7 151,1
25 16 9 4 1 0 1 4 9 16 25
-125 -64 -27 -8 -1 0 1 8 27 64 125
625 256 81 16 1 0 1 16 81 256 625
- 116,0 -125,6 -119,4 -100,4 -62,0 0
92,0 211,4 368,4 525,8 755,5
580,0 502,4 358,2 200,8 62,9 0
92,0 422,8 1.105,2 2.107,2 3,777,5
Jumlah ∑X = 0 ∑Y = 886,9
∑X2= 110
∑ X3=0 ∑ X4= 1.958
∑XY = 1.429,8
∑X2Y = 9.209,0
Persamaan normal : (1) 11a + 0 + 110c = 886,8 (2) 0 + 110b + 0 = 1.429,8 b = 1.492,8 / 110 = 13,0 (3) 110a + 0 + 1.958c = 9.209,0 Persamaan (1) kalikan 10 110a + 1.100c = 8.868 Persamaan (3) 110a + 1.958c = 9.209 ----------------------------------- - - 858c = - 341 c = - 341 / - 858 = 0,40
Nilai c masukkan ke (1) 11a + 110 (0,40) = 886,8 11a = 886,8 – 44 = 842,8 a = 76,62
Jadi persamaan trend parabola : Y’ = 76,62 + 13,00 X + 0,40X2 Pada tahun 2000, X = 6, ramalan hasil penjualan : Y’ = 76,62 + 13,00 (6) + 0,40 (36) = 169,02 (= Rp. 169,02 juta) TREND EXPONENSIAL (LOGARITMA) Kita telah mengenal trend garis lurus (linear trend) dengan bentuk persamaan Y’ = a + bX. Dalam hal ini b adalah rata-rata kenaikan Y persatuan waktu (per bulan, per tahun dsb). Ada beberapa jenis trend yang tidak linear tetapi dapat dibuat linear dengan jalan melakukan transformasi (perubahan bentuk). Misalnya, trend eksponensial
Y’ = abX dapat diubah menjadi trend semi log : log Y’ = log a + (log b) X ; log Y’ = Y’0 ; log a = a0 dan log b = b0.
Dengan demikian Y’0 = a0 + b0X, dimana koeffisien a0 dan b0 dapat dicari
berdasarkan persamaan normal. Trend eksponensial sering dipergunakan untuk meramalkan jumlah penduduk, pendapatan nasional, produksi, hasil penjualan, dan kejadian-kejadian lian yang perkembangan/pertumbuhannya secara geometris (berkembang dengan cepat sekali).
Contoh : Hasil penjualan PT. Sinar Surya selama 3 tahun menunjukkan perkembangan yang cepat sekali, seperti ditunjukkan pada table berikut :
Tahun 1997 1998 1999 Hasil penjualan (jutaan rupiah)
20 80 400
Dengan menggunakan trend eksponensial, ramalkan hasil penjualan tahun 2000 Penyelesaian : Persamaan normal : Tahun X Y log Y X log Y X2 1997 1998 1999
-1 0 1
20 80 400
1,30103 1,90309 1,60205
- 1,30103 0
2,60205
1 0 1
Jumlah ∑X = 0 ∑Y = 500 ∑Y0 =886,9 ∑XY0= 1,30102 ∑ X2= 2 Persamaan normal : (1) a0n + b0∑X = ∑Y’0
3 a0 = 5,80617
(2) a0∑X + b0∑X2 = ∑XY’0
2 b0 = 1,30102
Dari persamaan (1) : 3 a0 = 5,80617
a0 = log a = 1/3 (5,80617) = 1,93539
(Dari daftar log dapat diketahui bahwa log a = 1,93539) Dengan demikian, nilai a merupakan antilog 1,93539 = 86,2
Dari persamaan (2) : 2 b0 = 1,30102
b0 = log b = ½ (1,30102) = 0,65051,
jadi nilai b = 4,47 Garis trend : Y’0 = a0 + b0X
Y’0 = 1,93539 + 0,65051 X (dalam semi log).
Untuk tahun 2000, X = 2 , maka Y’0 = 1,93539 +
0,65051 (2) = 1,93539 + 1,30102 = 3,2364
Dari daftar log, angka yang dekat untuk dengan 3,2364 adalah 3,2380 , jadi Y = 1.730
Y’ = abx , maka Y’ = (86,2)(4,47)x (dalam eksponensial)
Untuk X = 2, maka Y’ = (86,2)(4,47)2 = (86,2)(19,9809) = 1.722,35 (hasilnya ada perbedaan sedikit karena pembulatan).
TREND EKSPONENSIAL YANG DIUBAH Seperti telah diuraikan sebelumnya, trend (regresi) eksponensial mempunyai
bentuk persamaan antara lain seperti Y’ = abx atau Y’ = aXb, yang masing-masing melalui proses transformasi menjadi bentuk linear dalam semilog dan sepenuhnya log, yaitu : Y’0 = a0 + b0X Y’0 = log Y’
(semi log) a0 = log a
b0 = log b
Y’0 = a0 + b0X Y’0 = log Y’
(log) a0 = log a
X = log X
Bentuk Y’ = abx dapat dikonversi dengan jalan menambah bilangan konstan k. Dengan demikian, persamaannya menjadi :
Y’ = k + abx Misalkan nilai k, a dan b masing-masing adalah 40, - 20 dan ½, sehingga
persamaan menjadi Y’ = 40 – 20 (1/2)x
Untuk X = -1 Y’ = 40 – 20 (1/2) -1 = 0
Untuk X = 0 Y’ = 40 – 20 (1/2) 0 = 20
Untuk X = 1 Y’ = 40 – 20 (1/2) 1 = 30
Untuk X = 2 Y’ = 40 – 20 (1/2) 2 = 35 Makin lama angka-angka diatas makin mendekati nilai k. Dengan perkataan lain, k merupakan nilai asymptote (selalu didekati, tetapi tidak pernah dicapai) Oleh karena bentuk trend (regresi) eksponensial yang diubah tidak dapat dijadikan bentuk linear dengan jalan transformasi, maka untuk memperkirakan atau menghitung a dan b tidak dapat menggunakan metode kuadrat terkecil. Jadi disini harus dipergunakan cara lain, yaitu dengan memilih beberapa titik. Caranya adalah sebagai berikut : Kita peroleh 3 titik, yaitu : X = 0, X = 2, X = 4
Y1 = k + ab0 = k + a
(1)
Y2 = k + ab2
(2)
Y3 = k + ab4
(3)
Dalam 3 persamaan diatas terdapat 3 bilangan konstan yang tidak diketahui, yaitu k, a dan b. Dengan melakukan pemecahan terhadap persamaan diatas, kita peroleh : k = Y1 - a
(1)
b2 = (Y3 – Y2 ) / (Y2 – Y1)
(2)
a = (Y2– Y1 ) / (b2 – 1)
(3) Apabila banyaknya tahun antara Y1,Y2 dan Y3 bukan 2 tahun, akan tetapi t
tahun, maka rumus untuk menghitung k, a dan b adalah sebagai berikut : k = Y1 - a
(1)
bt = (Y3 – Y2 ) / (Y2 – Y1)
(2)
a = (Y2– Y1 ) / (bt – 1)
(3) Contoh : Hasil penjualan perusahaan XYZ dalam jutaan rupiah selama 6 tahun adalah sebagai berikut : Tahun 1994 1995 1996 1997 1998 1999 Hasilpenjualan 3 7 9 21 33 70
Dengan menggunakan trend eksponensial yang diubah, berapa besarnya ramalan penjualan untuk tahun 2000 Penyelesaian : Dengan cara memilih beberapa titik, misalnya dipilih 3 titik yaitu tahun penjualan 1994 (X = 0), 1996 (X = 2) dan 1998 (X = 4) dimana masing-masing berjarak 2 tahun, maka dengan menggunakan rumus k, a dan b kita peroleh :
b2 = (Y3 – Y2 ) / (Y2 – Y1) = 33 – 9 / 9 – 3 = 4
b = 2
a = (Y2– Y1 ) / (b2 – 1) = 9 – 3 / 4 – 1 = 2
k = Y1 - a = 3 – 2 = 1
Y’ = k + abx = 1 + (2) x Nilai X yang digunakan untuk meramal penjualan tahun 2000 adalah Y’=1 + (2)
6 = 129 (Rp. 129 juta) TREND LOGISTIK Trend logistic biasanya digunakan untuk mewakili data yang menggambarkan perkembangan / pertumbuhan yang mula-mula cepat sekali, tetapi lambat laun agak lambat, dimana kecepatan pertumbuhannya makin berkurang sampai tercapai suatu titik jenuh (saturation point). Pertumbuhan semacam ini biasanya dialami oleh pertumbuhan suatu jenis industri, dan pertumbuhan biologis lainnya. Bentul trend logistik misalnya adalah sebagai berikut :
Y’ = k / 1 + 10a +bX , dimana k, a dan b adalah konstan, biasanya b < 0
Dalam hal ini kalau X mendekati tak terhingga,, maka 10a +bX mendekati 0, dan Y mendekati k , maka k merupakan asymptote, yaitu batas atas.
Contoh : Tahun X Y 1994 0 T1 (titik pertama)
Y0
1995 1 Y1
1996 2 T2 (titik kedua)
Y2
1997 3 Y3
1998 4 T3 (titik ketiga)
Y4
1999 5 Y5
Kita pilih titik T1, T2, T3 dengan nilai (X = 0 ; Y0), (X = 2; Y2) dan (X = 4;
Y4)
Setelah nilai X dimasukkan ke persamaan Y’ = k / 1 + 10a +bX , kita dapat mencari persamaan untuk T sebagai berikut :
T1, = k / 1 + 104 (1)
T2 = k / 1 + 10a + 2b (2)
T3 = k / 1 + 10a + 4b (3)
Dari 3 persamaan tersebut, dapat kita peroleh pemecahan yang memberikan nilai b, a dan k. Untuk mencari b, perhatikan bahwa :
1/ T3 - 1/ T2 10a + 4b - 10a + 2b
---------------------- = -------------------------- = 102b
1/ T2 - 1/ T1 10a + 2b - 10a
Jadi : 102b= log { T1 (T3 – T2)} / { T3 (T2 – T1)} , diambil log-nya
log 102b= log { T1 (T3 – T2)} / { T3 (T2 – T1)}
2b = log { T1 (T3 – T2)} / { T3 (T2 – T1)}
Untuk mencari a, perhatikan bahwa :
T1 1 + 10a + 2b
---- = -----------------
T2 1 + 10a
T1 (1 + 10a ) = T2 ( 1 + 10
a + 2b )
T1 + 10a T1 = T2 + 10
a + 2b T2
= T2 + 10a . 102b T
10a (102b T2 - T1) = T1 – T2
T1 – T2
10a = -----------------------
102b T2 - T1
Setelah diketahui log-nya, dicari nilai a sebagai berikut : T1 – T2
a = -----------------------
102b T2 - T1
Akhirnya k = T1(1 + 10a )
Pada umumnya kalau titik yang diambil berjarak t tahun, maka : (1) tb = log { T1 (T3 – T2)} / { T3 (T2 – T1)}
(2) a = log { T1 – T2} / {102b (T2 – T1)}
(3) k = T1 (1 + 10a )
Contoh : Perkembangan jumlah perusahaan industri pengolahan di suatu daerah ditunjukkan pada table berikut :
Tahun X Y Titik 1994 1995 1996 1997 1998 1999
0 1 2 3 4 5
2 4 6 9 9 10
T1 = (0,2)
T2 = (2,6)
T3 = (4,9)
Berapa ramalan banyaknya industri pengolahan pada tahun 2000 (X=6) ? Penyelesaian : Kita pilih 3 titik untuk T1, T2 , T3 , yaitu untuk x = 0, 2 dan 4 ; dan Y = 2, 6
dan 9 2b = log { T1 (T3 – T2)} / { T3 (T2 – T1)}
= log {2 (9-6)} / {9 (6 – 2)} = - 0,7782
b = - 0,3891
a = log { T1 – T2} / {102b (T2 – T1)}
= log (2 – 6) / {6 ( 1/6) – 2} = 0,6021
k = T1 (1 + 10a )
= 2 (1 + 4) = 10
Jadi trend logistic adalah : Y’ = 10 / {1 + 10 0,6021 – 0,3891X} X = 0, pada pertengahan tahun 1994 Untuk tahun 2000, X = 6 :
Y’ = 10 / {1 + 10 0,6021 –
0,3891(6)}
= 10 / {1 + 10 0,6021 –
2,3346} = 9,823 Jadi kalau dibulatkan, ramalan banyaknya perusahaan industri di daerah tersebut pada tahun 2000 = 10 buah. Kalau sudah mencapai titik jenuh, maka ini berarti bahwa nilai Y = 10 (mendekati 10) TREND GOMPERTZ Trend gompertz biasanya dipergunakan untuk meramalkan jumlah penduduk pada usia tertentu. Bentuknya sebagai berikut :
Y’ = kabX Dimana k, a dan b konstanta
Kalau diambil lognya, log Y’ = log k + (log a) (bX) Selanjutnya, kalau log Y’ = Y’0 ; log k = k0 dan log a = a0 , maka
bentuknya menjadi Y’0 = k0 + a0 bX , sama seperti
trend eksponensial yang diubah. Cara mencari koeffisiennya sama seperti kita menggunakan kurva 1. Contoh 1 : Dalam suatu penelitian yang dilakukan terhadap 10 rumah tangga yang dipilih secara acak, diperoleh data pengeluaran untuk pembelian barang-barang tahan lama per minggu (Y), pendapatan per minggu (X1), dan jumlah anggota rumah
tangga (X2) sebagai berikut :
Y (ratusan rupiah) 23 7 15 17 23 22 10 14 20 19 X1(ratusan rupiah) 10 2 4 6 8 7
4 6 7 6 X1(orang) 7 3 2 4 6
5 3 3 4 3 Kalau seandainya suatu rumah tangga mempunyai X1 dan X2, masing-masing
11 dan 8, berapa besarnya nilai Y, artinya berapa ratus rupiah rumah tangga yang bersangkutan akan mengeluarkan untuk pembelian barang-barang tahan lama? Penyelesaian : Langkah pertama adalah mengolah data diatas menjadi sebagai berikut :
Y X1 X2 X1Y X2Y X1X2 Y2 X12 X2
2
23
15 17 23 22 10 14 20 19
10 2 4 6 8 7 4 6 7 6
7 3 2 4 6 5 3 3 4 3
230
102 184 154
140 114
161 21 30 68 138 110 30 42 80 57
70 6 8 24 48 35 12 18 28 18
529 49 225 289 529 484 100 196 400 361
100 4 16 36 64 49 16 36 49 36
49 9 4 16 36 25 9 9 19
∑ Y = 170
∑X1 = 60
∑X2 = 40
∑X1Y
=1.122
∑X2Y=
737
∑X1X2=
267 ∑Y2 = 3.162
∑
X12=
406
∑ X2
2 =182
b0n + b1∑X1 + b2∑X2 = ∑Y
maka : 10 b0 + 60 b1 + 40 b2 = 170
b0 ∑X1 + b1∑X12 + b2∑X1X2 = ∑ X1Y
maka : 60b0 + 40 b1 + 267 b2 = 1.122
b0∑X2 + b1∑X2 X1 + b2∑X22 = ∑ X2Y
maka : 40 b0 + 267 b1 + 182 b2 = 737
Dengan cara determinan, persamaan diatas menghasilkan b0 = 3,92, b1 = 2,50
dan b2 = - 0,48, sehingga persamaannya adalah sebagai berikut :
Y = 3,92 + 2,50 X1 - 0,48 X2 = 3,92 + 2,50 (11) - 0,48 (8) =
27,58 Jadi untuk suatu rumah tangga dengan pendapatan per minggu Rp. 11.000 dan jumlah anggota keluarga 8 orang, diperkirakan akan mengeluarkan Rp. 2.758 untuk pembelian barang-barang tahan lama.
Kita juga dapat menghitung hubungan antara perubahan pendapatan dan pengeluaran. Untuk tujuan ini, kita gunakan persamaan regresi linier berganda. Y’ = b0 + b1X1 + b2X2
(3) b0 = nilai Y’, kalau X1 = X2 = 0
b1 = besarnya kenaikan (penurunan) Y dalam satuan, kalau X1 naik
(turun) satu satuan, sedangkan X2 konstan
b2 = besarnya kenaikan (penurunan) Y dalam satuan, kalau X2 naik
(turun) satu satuan, sedangkan X1 konstan
Jadi, jika X1 naik Rp. 1.000 sementara X2 konstan, maka Y naik Rp. 250.
Demikian juga jika X2 bertambah satu orang, sedangkan X1 konstan, maka Y
turun (makin besar jumlah anggota keluarga, makin berkurang pengeluaran untuk pembelian barang-barang tahan lama). Nilai b1 dan b2 dinamakan
koeffisien regresi parsial (partial coefficient regression) dan sering ditulis sebagai b1 = b01.2 dan b2 = b02.1.
2. Contoh KORELASI BERGANDA : Dengan menggunakan contoh 1, hitunglah
KP dengan rumus 10 Penyelesaian : Y = 3,92 + 2,50 X1 - 0,48 X2
b1 = 2,50 , b1 = - 0,48 ,
∑X1i Yi= 1.122 , ∑X1i = 60 , ∑Yi = 170
∑x1i yi = = ∑X1i Yi - 1/n ∑X1i∑Yi = 1.122 – 1/10 (60)(170) = 102 ∑X2i Yi = 737 , ∑X2i = 40 , ∑Yi = 170
∑x2i yi = ∑X2i Yi - 1/n ∑X2i∑Yi = 737 - 1/10 (40) (170) =
57 ∑ Yi
2 = 3.162 , ∑Yi = 170
∑yi2= ∑ Yi2 - 1/n (∑Yi)2 = 3.162 - 1/10 (170)2 = 272
KP = R2y.12 = ( b1∑x1i yi + b2∑x2i yi ) / ∑ yi2
= {2,50 (102) – 0,48 (57)} / 272 = 0,8369 = 0,84 Jadi besarnya sumbangan pendapatan (X1) dan jumlah anggota rumah tangga
(X2) terhadap variasi atau naik turunnya pengeluaran untuk pembelian barang-
barang tahan lama (Y) adalah 84%, sedangkan sisanya sebesar 16% disebabkan oleh factor-faktor lainnya. Besarnya KKLB adalah sebagai berikut :
KKLB = Ry.12 = akar R2y.12
= akar 0,8369 = 0,90 3. Contoh KOEFFISIEN KORELASI PARSIAL : Dengan menggunakan contoh 1, hitunglah koeffisien korelasi parsial antara Y dan X1 , Y dan X2 serta X1 dan X2
Penyelesaian :
Dari contoh 2 : ∑x1i yi = 102 , ∑x2i yi = 57 , ∑yi2 = = 272
Dari contoh 1 : ∑X1i2 = ∑X12 = 406 , ∑X1i = ∑X1= 60
∑X2i2 = ∑X22 = 182 , ∑X2i = ∑X2 = 40 , ∑X1i X2i = 267
Kemudian dihitung : ∑x1i 2 = ∑X1i 2 - 1/n (∑X1i) 2 = 406 - 1/10 (60)2 =
46
∑x2i 2 = ∑X2i 2 - 1/n (∑X2i) 2 = 182 - 1/10 (40)2 =
22
∑x1ix2i = ∑X1iX2i - 1/n ∑x1i∑x2i = 267 - 1/10 (60)(40) =
27
r1y = ∑ x1iyi / ( ∑ x1i2 ∑y1i2 = 102 / 46 272 = 0,91
r2y = ∑ x2iyi / ( ∑ x2i2 ∑yi2 = 57 / 22 272 = 0,74
r12 = ∑ x1iy2i / ( ∑ x1i2 ∑x2i2 = 27 / 46 222 = 0,81
r1y.2 = r1y – r2 r12 / (1 - r2y2) (1 - ry2
2)
= { 0,91 - (0,74)(0,85)} / {1 – (0,74)2} {1 – (0,85)2} = 0,80
r2y.1 = r2y – r1y r12 / (1 - r1y2)( (1 - ry2
2)
= { 0,74 - (0,91)(0,85)} / {1 – (0,91)2} {1 – (0,85)2} = - 0,15
r12.y = r12 – r1y r2y/ (1 - r1y2) ( 1 - ry2
2)
= { 0,85 - (0,91)(0,74)} / {1 – (0,91)2} {1 – (0,74)2} = 0,63 (20) + 0,0187 (100) = 5,7342
4. Contoh TREND PARABOLA Hasil penjualan perusahaan PT. Sinar Surya selama 10 tahun terakhir adalah sebagai berikut : Tahun 1989 1990 1991 199
2 1993
1994
1995
1996 1997 1998 1999
Hasil Penjualan (jutaanRp)
23,2
31,4
39,8
50,2
62,9
76,0
92,0
105,7
122,8
131,7
151,1
Berapa besarnya ramalan hasil penjualan tahun 2000? Penyelesaian : Karena jumlah tahunnya adalah ganjil, maka pilih tahun yang ada di tengah sebagai titik asal, X = 0. Perhitungannya adalah sebagai berikut : Tahun X Y X2 X3 X4 XY X2Y 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
-5 -4 -3 -2 -1 0 1 2 3 4 5
23,2 31,4 39,8 50,2 62,9 76,0 92,0 105,7 122,8 131,7 151,1
25 16 9 4 1 0 1 4 9 16 25
-125 -64 -27 -8 -1 0 1 8 27 64 125
625 256 81 16 1 0 1 16 81 256 625
- 116,0 -125,6 -119,4 -100,4 -62,0 0
92,0 211,4 368,4 525,8 755,5
580,0 502,4 358,2 200,8 62,9 0
92,0 422,8 1.105,2 2.107,2 3,777,5
Jumlah ∑X = 0 ∑Y = 886,9
∑X2= 110
∑ X3=0 ∑ X4= 1.958
∑XY = 1.429,8
∑X2Y = 9.209,0
Persamaan normal : (1) 11a + 0 + 110c = 886,8 (2) 0 + 110b + 0 = 1.429,8 b = 1.492,8 / 110 = 13,0 (3) 110a + 0 + 1.958c = 9.209,0 Persamaan (1) kalikan 10 110a + 1.100c = 8.868 Persamaan (3) 110a + 1.958c = 9.209 ----------------------------------- - - 858c = - 341 c = - 341 / - 858 = 0,40 Nilai c masukkan ke (1) 11a + 110 (0,40) = 886,8 11a = 886,8 – 44 = 842,8 a = 76,62
Jadi persamaan trend parabola : Y’ = 76,62 + 13,00 X + 0,40X2 Pada tahun 2000, X = 6, ramalan hasil penjualan : Y’ = 76,62 + 13,00 (6) + 0,40 (36) = 169,02 (= Rp. 169,02 juta) 5. Contoh TREND EXPONENSIAL (LOGARITMA) Hasil penjualan PT. Sinar Surya selama 3 tahun menunjukkan perkembangan yang cepat sekali, seperti ditunjukkan pada table berikut :
Tahun 1997 1998 1999 Hasil penjualan (jutaan rupiah)
20 80 400
Dengan menggunakan trend eksponensial, ramalkan hasil penjualan tahun 2000 Penyelesaian : Tahun X Y log Y X log Y X2 1997 1998 1999
-1 0 1
20 80 400
1,30103 1,90309 1,60205
- 1,30103 0
2,60205
1 0 1
Jumlah ∑X = 0 ∑Y = 500 ∑Y0 =886,9 ∑XY0= 1,30102 ∑ X2= 2 Persamaan normal : (1) a0n + b0∑X = ∑Y’0
3 a0 = 5,80617
(2) a0∑X + b0∑X2 = ∑XY’0
2 b0 = 1,30102
Dari persamaan (1) : 3 a0 = 5,80617
a0 = log a = 1/3 (5,80617) = 1,93539
(Dari daftar log dapat diketahui bahwa log a = 1,93539) Dengan demikian, nilai a merupakan antilog 1,93539 = 86,2 Dari persamaan (2) : 2 b0 = 1,30102
b0 = log b = ½ (1,30102) = 0,65051,
jadi nilai b = 4,47 Garis trend : Y’0 = a0 + b0X
Y’0 = 1,93539 + 0,65051 X (dalam semi log).
Untuk tahun 2000, X = 2 , maka Y’0 = 1,93539 +
0,65051 (2) = 1,93539 + 1,30102 = 3,2364
Dari daftar log, angka yang dekat untuk dengan 3,2364 adalah 3,2380 , jadi Y = 1.730
Y’ = abx , maka Y’ = (86,2)(4,47)x (dalam eksponensial)
Untuk X = 2, maka Y’ = (86,2)(4,47)2 = (86,2)(19,9809) = 1.722,35 (hasilnya ada perbedaan sedikit karena pembulatan).
6. Contoh TREND EKSPONENSIAL YANG DIUBAH Hasil penjualan perusahaan XYZ dalam jutaan rupiah selama 6 tahun adalah sebagai berikut : Tahun 1994 1995 1996 1997 1998 1999 Hasilpenjualan 3 7 9 21 33 70 Dengan menggunakan trend eksponensial yang diubah, berapa besarnya ramalan penjualan untuk tahun 2000 Penyelesaian : Dengan cara memilih beberapa titik, misalnya dipilih 3 titik yaitu tahun penjualan 1994 (X = 0), 1996 (X = 2) dan 1998 (X = 4) dimana masing-masing berjarak 2 tahun, maka dengan menggunakan rumus k, a dan b kita peroleh :
b2 = (Y3 – Y2 ) / (Y2 – Y1) = 33 – 9 / 9 – 3 = 4
b = 2
a = (Y2– Y1 ) / (b2 – 1) = 9 – 3 / 4 – 1 = 2
k = Y1 - a = 3 – 2 = 1
Y’ = k + abx = 1 + (2) x Nilai X yang digunakan untuk meramal penjualan tahun 2000 adalah Y’=1 + (2)
6 = 129 (Rp. 129 juta) 7. Contoh TREND LOGISTIK Contoh : Tahun X Y 1994 0 T1 (titik pertama)
Y0
1995 1 Y1
1996 2 T2 (titik kedua)
Y2
1997 3 Y3
1998 4 T3 (titik ketiga)
Y4
1999 5
Y5
Kita pilih titik T1, T2, T3 dengan nilai (X = 0 ; Y0), (X = 2; Y2) dan (X = 4;
Y4)
Setelah nilai X dimasukkan ke persamaan Y’ = k / 1 + 10a +bX , kita dapat mencari persamaan untuk T sebagai berikut :
T1, = k / 1 + 104 (1)
T2 = k / 1 + 10a + 2b (2)
T3 = k / 1 + 10a + 4b (3)
Dari 3 persamaan tersebut, dapat kita peroleh pemecahan yang memberikan nilai b, a dan k. Untuk mencari b, perhatikan bahwa :
1/ T3 - 1/ T2 10a + 4b - 10a + 2b
---------------------- = -------------------------- = 102b
1/ T2 - 1/ T1 10a + 2b - 10a
Jadi : 102b= log { T1 (T3 – T2)} / { T3 (T2 – T1)} , diambil log-nya
log 102b= log { T1 (T3 – T2)} / { T3 (T2 – T1)}
2b = log { T1 (T3 – T2)} / { T3 (T2 – T1)}
Untuk mencari a, perhatikan bahwa :
T1 1 + 10a + 2b
---- = -----------------
T2 1 + 10a
T1 (1 + 10a ) = T2 ( 1 + 10
a + 2b )
T1 + 10a T1 = T2 + 10
a + 2b T2
= T2 + 10a . 102b T
10a (102b T2 - T1) = T1 – T2
T1 – T2
10a = -----------------------
102b T2 - T1
Setelah diketahui log-nya, dicari nilai a sebagai berikut : T1 – T2
a = -----------------------
102b T2 - T1
Akhirnya k = T1(1 + 10a )
Pada umumnya kalau titik yang diambil berjarak t tahun, maka : (1) tb = log { T1 (T3 – T2)} / { T3 (T2 – T1)}
(2) a = log { T1 – T2} / {102b (T2 – T1)}
(3) k = T1 (1 + 10a )
Contoh : Perkembangan jumlah perusahaan industri pengolahan di suatu daerah ditunjukkan pada table berikut :
Tahun X Y Titik 1994 0 2 T1 = (0,2)
1995 1996 1997 1998 1999
1 2 3 4 5
4 6 9 9 10
T2 = (2,6)
T3 = (4,9)
Berapa ramalan banyaknya industri pengolahan pada tahun 2000 (X=6) ? Penyelesaian : Kita pilih 3 titik untuk T1, T2 , T3 , yaitu untuk x = 0, 2 dan 4 ; dan Y = 2, 6
dan 9 2b = log { T1 (T3 – T2)} / { T3 (T2 – T1)}
= log {2 (9-6)} / {9 (6 – 2)} = - 0,7782 b = - 0,3891
a = log { T1 – T2} / {102b (T2 – T1)}
= log (2 – 6) / {6 ( 1/6) – 2} = 0,6021
k = T1 (1 + 10a )
= 2 (1 + 4) = 10
Jadi trend logistic adalah : Y’ = 10 / {1 + 10 0,6021 – 0,3891X} X = 0, pada pertengahan tahun 1994
Untuk tahun 2000, X = 6 : Y’ = 10 / {1 + 10 0,6021 – 0,3891(6)}
= 10 / {1 + 10 0,6021 –
2,3346 }= 9,823 Jadi kalau dibulatkan, ramalan banyaknya perusahaan industri di daerah tersebut pada tahun 2000 = 10 buah. Kalau sudah mencapai titik jenuh, maka ini berarti bahwa nilai Y = 10 (mendekati 10)
STATISTIK INDUSTRI MODUL 9
ANALISIS DATA BERKALA
Tujuan Belajar Setelah mempelajari bab ini, Anda diharapkan mampu :
Memahami arti dari data berkala Menyebutkan jenis-jenis gerakan / variasi data berkala Menggunakan berbagai metode untuk memperoleh trend
ARTI DAN PENTINGNYA ANALISIS DATA BERKALA Seperti telah dibahas dalam modul2, data berkala (time series) adalah data yang dikumpulkan dari waktu ke waktu untuk menggambarkan perkembangan suatu kegiatan (perkembanagan produksi, harga, hasil penjualan, jumlah personil,penduduk, jumlah kecelakaan dsb). Analisis data berkala memungkinkan kita untuk mengetahui perkembangan suatu atau beberapa kejadian serta hubungan / pengaruhnya terhadap kejadian lainnya. Misalnya, apakah kenaikan biaya iklan akan diikutui dengan kenaikan penerimaan hasil penjualan, apakah kenaikan jumlah penggunaan pupuk diikuti dengan kenaikan produksi padi, apakah kenaikan gaji diikuti oleh kenaikan prestasi kerja dsb. Dengan perkataan lain, apakah perubahan suatu kejadian akanmempengaruhi kejadian lainnya, dan kalau memang ada pengaruhnya, berapa besar pengaruh tersebut secara kuantitatif? Contohnya, kalau biaya iklan naik Rp. 100 juta, berapa kenaikan hasil penjualan yang dapat diharapkan; kalau gaji naik 1%, berapa % kenaikan prestasi kerja; kalau penggunaan pupuk naik 10 juta ton, berapa ton produksi padi dapat diharapkan, dsb. Hal ini sudah dibahas dalam analisis korelasi dan regresi pada modul 7 dan 8. Dengan data berkala,
kita juga dapat membuat ramalan-ramalan berdasarkan garis regresi atau garis trend. Olah karena data berkala itu terdiri dari beberapa komponen, maka dengan analisis data berkala kita bisa mengetahui masing-masing komponenn, bahkan dapat menghilangkan satu atau beberapa komponen kalau kita ingin menyelidiki komponen tersebut secara mendalam tanpa kehadiran komponen lainnya. Data berkala, karena adanya pengaruh dari komponen-komponen tersebut, selalu mengalami perubahan sehingga apabila dibuat grafiknya akan menunjukkan suatu fluktuasi (fluctuation), yaitu gerakan naik-turun. KLASIFIKASI GERAKAN / VARIASI / DATA BERKALA Gerakan/variasi data berkala terdiri dari empat macam atau empat komponen sebagai berikut :
1. Gerakan trend jangka panjang (long term movement or secular trend) , yaitu suatu gerakan yang menunjukkan arah perkembangan secara umum (kecenderungan menaik , menurun). Cara menarik garis trend akan diterangkan pada bagian lain. Garis trend sangat berguna untuk membuat ramalan (forecasting) yang sangat diperlukan bagi perencanaan.
2. Gerakan / variasi siklis ( cyclical movement or variations), adalah
gerakan / variasi jangka panjan disekitar garis trend (berlaku untuk data tahunan). Gerakan siklis ini bias terulang setelah jangka waktu tertentu (setiap 3 tahun, 5 tahun, atau lebih) dan bias juga terulang dalam jangka waktu yang sama. Business cycles (konjungtur) adalah suatu contoh gerakan siklis yang menunjukkan waktu terjadinya kemakmuran (prosoeriry), kemunduran (recession), depresi (depression), dan pemulihan (recovery).
3. Gerakan / variasi musiman (seasonal movement / variation),
adalah gerakan yang mempunyai pola tetap dari waktu ke waktu, misalnya kenaikan harga pohon cemara menjelang hari natal,meningkatnya harga-harga bahan makanan dan pakaian menjelang hari raya idul fitri, menurunnya harga beras pada waktu panen dsb. Walaupun pada umumnya gerakan musiman terjadi pada data bulanan yang dikumpulkan dari tahun ke tahun, namun juga berlaku bagi data harian, mingguan, atausatuan waktu yang lebih kecil lagi.
4. Gerakan / variasi yang tidak teratur (irregular or random
movements), adalah gerakan / variasi yang sifatnya sporadic, misalnya naik-turunnya produksi akibat banjir yang datangnya tidak teratur.
Analisis data berkala pada umumnya terdiri dari uraian (description) secara matematis tentang komponen-komponen yang menyebabkan gerakan-gerakan atau variasi-variasi yang tercermin dalam fluktuasi. Apabila gerakan trend, siklis, musiman, dan acak masing-masing diberi symbol T,C,S dan I, maka data berkala Y merupakan hasil kali dari 4 komponen tersebut, yaitu : Y = T x C x S x I Ada juga ahli statistic yang menganggap bahwa data berkala merupakan penjumlahan dari 4 komponen tersebut, yaitu : Y = T + C + S + I
Dalam modul 9 ini akan dibahas garis trend linier dan metode untuk memperolehnya. MENENTUKAN TREND Terdapat beberapa metode yang umum digunakan untuk menggambarkan garis trend. Beberapa diantaranya adalah :
1. metode tangan bebas 2. metode rata – rata 3. metode rata – rata bergerak 4. metode kuadrat terkecil
1. Metode Tangan Bebas Langkah – langkah untuk menentukan garis trend dengan menggunakan metode tangan bebas (free hand methode) adalah sebagai berikut : a. Buat sumbu tegak Y dan sumbu mendatar X b. Buat scatter diagram, yaitu kumpulan titik-titik koordinat (X,Y), X =
variable waktu c. Dengan jalan observasi atau pengamatan langsung terhadap bentuk
scatter diagram, tariklah garis yang mewakili atau paling mendekati semua titik koordinat yang membentuk diagram pencar tersebut. Misalnya Y = data berkala, X = waktu (tahun, bulan dsb)
Cara menarik garis trend dengan tangan bebas merupakan cara yang paling mudah, tetapi sifatnya sangat subyektif, maksudnya kalau ada lebih dari satu orang diminta untuk menarik garis trend dengan cara ini, akan diperoleh garis trend lebih dari satu. Sebab masing-masing
mempunyai pilihan sendiri sesuai dengan anggapannya, garis mana yang mewakil diagram pencar tersebut.
Contoh 1 : Tahun
1992 1993 1994 1995 1996 1997 1998 1999
T 0 1 2 3 4 5 6 7 PDB (Y)
10.164,9
11.169,2
12.054,6
12.325,4
12.842,2
13.511,5
14.180,8
14.850,1
Apabila data tersebut dibuat diagram pencarnya, maka akan terlihat bahwa titik-titik koordinat menurut data tersebut ada yang terletak dibawah atau diatas garis trend, dan ada juga yang terletak tepat pada garis trend. Ramalan dengan garis trend lebih realistis karena sudah memperhitungkan kemampuan masa lampau. Dengan metode tangan bebas, diperoleh nilai ramalan Produk Domestik Bruto pada tahun 2000 kurang lebih sebesar Rp. 15.515,5 milyar (dibaca pada skala).
Misalkan selanjutnya bahwa garis trend tersebut melewati titik koordinat untuk tahun 1992 dan 1999. Kalau tahun 1992 dan 1999, nilai X sama dengan 0 dan 7, maka kita bias mengatakan bahwa garis trend yang lurus mempunyai persamaan Y = a + bX. Seperti telah dijelaskan sebelumnya bahwa metode tangan bebas lebih bersifat subyektif, maka untuk memperoleh garis trend yang lebih obyektif adalah dengan duia tititk koordinat yaitu titik asal dan titik akhir.
Dalam contoh ini, kita anggap tahun 1992 sebagai tititk asal (X = 0), 1993 titik pertama (X = 1), dan seterusnya. Kalau 1993 sebagai titik asal, maka untuk tahun 1992 (X = -1), 1993 (X = 0), dan seterusnya. Kalau 1992 sebagai titik asal dan 1999 titik akhir, maka kita peroleh dua tititk koordinat [ (0), (10.164,9)] dan [ (7), (14.850,1)]. Kalau nilai-nilai ini kita masukkan ke persamaan garis lurus Y = a + bX, maka kita peroleh persamaan berikut : Untuk [ (0), (10.164,9)] 10.164,9 = a + b (1) a = 10.164,9 Untuk [ (7), (14.850,1)] 14.850,1 = a + b (7) 14.850,1 = 10.164,9 + 7b 7b = 14.850,1 – 10.164,9 = 4.685,2 b = 669,3 jadi Y = 10.164,9 + 669,3 X (X = variable waktu) b = 669,3 berarti bahwa setiap tahun secara rata-rata terjadi
kenaikan PDB sebesar 669,3 milyar. Untuk meramalkan tahun 2000 dan 2001, maka nilai X adalah 8 dan 9, kemudian dimasukkan dalam persamaan tersebut. Jadi ramalan PDB tahun 2000 dan 2001 adalah :
PDB2000 (X = 8) = 10.164,9 + 669,3 ( 8 ) = Rp. 15.519,3
milyar PDB2001 (X = 9) = 10.164,9 + 669,3 ( 9 ) = Rp. 16.188,6
milyar Cara ini lebih obyektif karena didasarkan atas perumusan matematik dan bukan didasarkan atas penilaian individu yang sering dipengaruhi oleh subyektifitas pribadi. 2. Metode Rata-rata Semi
Metode rata-rata semi memerlukan langkah-langkah sebagai berikut : a. Data dikelompokkan menjadi 2, masing-masing kelompok harus
mempunyai jumlah data yang sama. Kalau datanya 10, menjadi 2 kelompok, masing-masing 5 8, menjadi 2 kelompok, masing-
masing 4 6, menjadi 2 kelompok, masing-
masing 3 Kalau datanya ganjil, hilangkan 1, yaitu yang ditengah. Contoh : 9 data, masing-masing 4 7 data, masing-masing 3 b. Masing-masing kelompok dicari rata-ratanya, misal Y1 bar dan Y2
bar, yang merupakan ordinatnya.
c. Titik absis harus dipilih dari variable X yang berada di tengah masing-masing kelompok ( tahun atau waktu yang di tengah )
Data 6 tahun : X1, X2, X3, X4, X5, X6
0 1 2 3 4 5 I II
1 dan 4 merupakan titik absis (artinya tahun ke 2 dan 5 sebagai absis)
Data 8 tahun : X1, X2, X3, X4, X5, X6, X7, X8
0 1 2 3 4 5 6 7
Kelompok I : 0 1 2
3 Kelompok II : 4 5 6
7
1,5 dan 5,5 merupakan titik absis (absis pertama antara tahun ke 2 dan 3, absis kedua antara tahun ke 6 dan 7)
Data 7 tahun : X1, X2, X3, X4, X5, X6, X7
0 1 2 3 4 5 6 ----- data ke 3 dihapus
Kelompok I : 0 1 2 Kelompok II : 4 5 6
1 dan 5 merupakan titik absis (tahun ke 2 dan 6
sebagai absis 0 d. Titik koordinat terdiri dari b) dan c) dimasukkan kedalam
persamaan Y = a + bX, untuk menghitung a dan b; Y1 bar dan
Y2 bar dipergunakan sebagai nilai Y.
Contoh 2 : Berdasarkan data pada contoh 1, buatlah trend dengan metode rata-rata semi.
Tahun X Y Rata-rata 1992 0 10.164,9 1993 1 11.169,2 Rata-rata 1992 – 1995 = Y1 bar
1994 2 12.054,6 = 45.714,1 / 4 = 11.428,5 1995 3 12.325,4 1996 4 12.842,2 1997 5 13.511,5 Rata-rata 1996 – 1999 = Y1 bar 1998 6 14.180,8 = 45.714,1 / 4 = 11.428,5 1999 7 14.850,1
Kita peroleh 2 titik koordinat { (1,5), (11.428,5)] dan [ (5,5) , (13.846,2) ]. Kemudian nilai – nilai ini dimasukkan ke dalam persamaan Y = a + bX sebagai berikut :
11.428,5 = a + b (1,5) ……(1) 13.846,2 = a + b (5,5) ……(2) Dari (1) -- a = 11.428,5 - 1,5 b -- dimasukkan ke (2) 13.486,2 = 11.428,5 - 1,5 b + 5,5 b = 11.428,5 + 4 b 4 b = 2.417,7 --- b = 604,42 a = 11.428,5 - 1,5 (604,42) = 10.521,87 Y = 10.521,87 + 604,42 X (X = variable waktu) Dari persamaan diatas, ramalan PDB tahun 2000 dan 2001 sebagai berikut :
PDB2000 (X = 8) = 10.521,87 + 604,42 (8) = Rp. 15.357,23
milyar PDB2001 (X = 9) = 10.521,87 + 604,42 (9) = Rp. 15.961,65
milyar Dengan metode rata-rata semi ini tidak diperlukan ganbar (grafik). Kita dapat nilai ramalan langsung dari persamaan. Sedangkan dengan metode tangan bebas, hasil ramalan harus dibaca dari skala pada sumbu Y.
Dari cintoh 2, rata-rata kenaikan per tahu PDB (=b) adalah 604,42 milyar, yang ternyata lebih rendah daripada dengan cara menghubungkan titik terendah dan tertinggi
3. Metode Rata-rata Bergerak Kalau kita mempunyai data berkala sebanyak n : Y1, Y2,......., Yi,……,
Yn, maka rata-rata bergerak (moving average) n waktu (tahun, bulan,
minggu,hari) merupakan urutan rata-rata hitung sebagai berikut :
Y1+ Y2+.......+ Yn, Y2 + Y3 +.......+ Yn + 1, Y2 + Y3 +.......+
Yn+2
n n n
dan seterusnya. Setiap rata-rata hitung diatas disebut total bergerak (moving total), yang berguna untuk mengurangi variasi dari data asli. Didalam data berkala, rata-rata bergerak sering dipergunakan untuk memuluskan fluktuasi yang terjadi dalam data tersebut. Proses pemulusan ini disebut pemulusan data berkala. Apabila rata-rata bergerak dibau dari data tahunan atau bulanan sebanyak n waktu, maka rata-rata bergerak disebut rata-rata bergerak tahunan atau bulanan dengan orde n (moving average of order n) Contoh 1 : Berikut disajikan data penjualan hipotetis PT. Malvinas
Tahun Penjualan Tahun Penjualan
(jutaan rupiah)
(jutaan rupiah)
1989 1990 1991 1992 1993 1994
50,0 36,5 43,0 44,5 38,9 38,1
1995 1996 1997 1998 1999
32,6 38,7 41,7 41,1 33,8
Berdasarkan data diatas, buatlah rata-rata bergerak 4 tahun dan 5 tahun, kemudian gambarkan kurva dari data asli, rata-rata bergerak 4 tahun dan 5 tahun dalam satu gambar. Penyelesaian : Perhitungan rata-rata bergerak 4 tahun dan 5 tahun PT. Malvinas
Tahun Y (= jutaan rupiah)
Rata-rata bergerak 4 tahun
Rata-rata bergerak 5 tahun
1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999
50,0 36,5 43,0 44,5 38,9 38,1 32,6 38,7 41,7 41,1 33,8
43,5 40,7 41,1 38,5 37,1 37,8 38,5 38,8
42,6 40,2 39,4 39,6 38,0 38,4 37,6
Apabila data asli digambarkan bersama-sama dengan rata-rata bergerak, maka akan terlihat bahwa makin besar derajat rata-rata bergerak, maka bentukkurva semakin mulus. Maksudnya, makin berkurang fluktuasinya maka tampak dengan jelas adanya trend (pada contoh ini trend menurun). Dengan menggunakan rata-rata bergerak untuk mencari trend, maka kita kehilangan beberapa data dibandingkan dengan data asli. Artinya, banyaknya rata-rata bergerak menjadi tidak sama dengan banyaknya data asli. Dari contoh ini, jumlah asli data yang tadinya 11 berkurang menjadi 8 pada rata-rata bergerak 4 tahun, kemudian berkurang menjadi 7 pada rata-rata bergerak 5 tahun. Pada umumnya, jumlah data asli berkurangs sebanyak (n-1), n = derajat rata-rata bergerak, yaitu banyaknya data (dengan demikian banyaknya waktu) untuk menghitung rata-rata bergerak.
3. Metode Kuadrat Terkecil
Seperti kita ketahui bahwa garis trend linear dapat ditulis sebagai persamaan garis lurus : Y = a + bX Dimana : Y’ = data berkala (time series data) X = waktu (hari, minggu, bulan, tahun) a & b = bilangan konstan Jadi untuk mencari garis trend berarti mencari nilai a dan b. Apabila a dan b sudah diketahui, maka garis trend tersebut dapat dipergunakan untuk meramalkan Y.
Untuk mencari persamaan trend garis lurus dengan metode kuadrat terkecil, dapat dilakukan dengan beberapa cara. Disini diberikan 2 cara. Cara 1 : Pada cara 1, untuk mengadakan perhitungan diperlukan nilai tertentu pada variable waktu (X) sedemikian rupa , sehingga jumlah nilai variable waktu adalah nol . Xi = 0
Misal : untuk n = 3, maka X1, X2 , X3
- 1 0 1 untuk n = 4, maka X1, X2 , X3 X4
- 3 -1 1 3 Pada umumnya yang diberi nilai 0 adalah variable waktu yang letaknya di tengah. a. Untuk n ganjil ---- n = 2k + 1 2k = n - 1 k = (n – 1) / 2
Xk + 1 = 0
n = 3 ---- k = (3 – 1) / 2 = 2/2 = 1
Xk
+ 1 = X1 + 1 = X2 = 0
n = 5 ---- k = (5 – 1) / 2 = 4/2 = 2 Xk
+ 1 = X2 + 1 = X3 = 0
n = 7 ---- k = (7 – 1) / 2 = 6/2 = 3 Xk
+ 1 = X3 + 1 = X4 = 0
a. Untuk n genap ---- n = 2k k = n / 2
X k + (k + 1) = 0 , artinya titik 0 terletak antara X k dan X k + 1 ( seolah-olah disisipkan dan tak
perlu dituliskan untuk n genap) X [{ k + (k + 1)} / 2 ] = X ( 5/2) = X2,5
Yang dibagi 2 adalah {k + (k + 1)} n = 4 ---- k = 4/2 = 2 -- X2,5 = 0
n = 6 ---- k = 6/2 = 3 -- X3,5 = 0
n = 8 ---- k = 8/2 = 4 -- X4,5 = 0 Jarak antara 2 waktu diberi nilai dua satuan. Diatas 0 diberi tanda +, dibawahnya tanda – (0, 1, 3, 5, 7, 9……dan ……, -9, -7, -5, -3, -1, 0) atau …., -7, -5, -1, 1, 3, 5, 7,…… Seperti telah disebutkan sebelumnya, mencari garis trend juga berarti mencari nilai a dan b dari persamaan garis trend Y’ = a + bX. Kalau kita perhatikan, garis trend yang dimaksudkan untuk mewakili suatu diagram pencar. Tidak semua titik koordinat yang membentuk diagram pencar tersebut terletak tepat pada garis trend, ada yang di atas dan ada juga yang di bawahnya. Metode kuadrat terkecil (least square methode) untuk mencari garis trend dimaksudkan suatu perkiraan atau taksiran mengenai nilai a dan b dari persamaan Y’ = a + bX yang didasarkan atas data hasil observasi sedemikian rupa, sehingga dihasilkan jumlah kesalahan kuadrat terkecil (minimum). Tanda aksen sering ditiadakan. Jadi persamaan garis trend, asal tidak membingungkan, dapat ditulis Y = a + bX. Perlu diperhatikan bahwa sebetulnya ada dua macam nilai Y, yaitu berdasarkan pencatatan dan trend.
a = Ybar – bXbar
dimana : Ybar = 1/n sigma∑ Yi = rata-rata Y
Xbar = 1/n sigma∑ Xi = rata-rata X
n∑ xi Yi - ∑xi ∑Yi
b = ----------------------
n∑Xi2 – ∑ (Xi)2
Rumus ini sama dengan rumus garis regresi linear yang sudah dibahas dalam modul 4, mengenai teknik ramalan. Untuk garis trend lurus, rumusnya menjadi sederhana, karena : ∑Xi = 0 dan Xbar = 1/n∑Xi
Dengan demikian untuk garis trend yang lurus, rumusnya adalah : a = Ybar ∑ Xi Yi
b = ------------
∑ Xi2
Y’ = a + bX (persamaan garis trend linear) dimana X merupakan variable waktu. Contoh : Tahun X Y XY X2 1992 1993 1994 1995 1996 1997
-7 -5 -3 -1 1 3
10.164,9 11.169,2 12.054,6 12.325,4 12.842,2 13.511,5
-71.154,3 -55.846,0 -36.163,8 -12.325,4 12.842,2 40.534,5
49 25 9 1 1 9
1998 1999
5 7
14.180,8 14.850,1
70.904,0 103.950,7
25 49
∑Y = 101.098,7 Ybar =
12.637,34
∑XY = 52.741,9
∑X2 = 168
a = Ybar = 12.637,3
∑ Xi Yi 52.741,9 b = ------------ = ------------- = 313,94
∑ Xi2
168 Persamaan trend linier : Y = 12.637,34 + 313,94 Y tahun 2000 (X = 9) --- Y = 12.637,34 + 313,94 (9) = 15.426,8 Jadi ramalan PDB tahun 2000 = 15.426,8 milyar Cara 2 : Cara lain untuk menentukan garis trend lurus adalah dengan menentukan periode awal pada variable waktu X = 1, jadi tidak perlu membuat ∑ Xi
= 0. Jika data pengamatan terdiri dari delapan nilai dari tahun 1992 sampai dengan 1999, maka nilai X pada 1992 adalah 1 dan 1999 adalah 9.
Garis trend lurus dengan cara ini diperoleh dengan rumus sebagai berikut : a = Ybar - Xbar
n∑ Xi Yi - ∑Xi ∑Yi
b = -------------------------
n∑Xi2 – ∑ (Xi)2
Contoh :
Dari data pada contoh sebelumnya, buatlah persamaan garis trend dengan menggunakan metode kuadrat terkecil (gunakan cara 2)
Tahun X Y XY X2 1992 1993 1994 1995 1996 1997 1998 1999
1 2 3 4 5 6 7 8
10.164,9 11.169,2 12.054,6 12.325,4 12.842,2 13.511,5 14.180,8 14.850,1
10.169,4 22.338,4 36.163,8 49.301,6 64.211,0 81.069,0 99.265,6 118.800,8
1 4 9 16 25 36 49 64
∑
36 101.098,7
481.315,1 204
X bar = 36 / 8 = 4,5 Y bar = 101.098,7 / 8 = 12.637,34
n ∑ Xi Yi - ∑ Xi ∑Yi 3.850.520,8 – 3.639.553,2
b = --------------------------- = -----------------------------------------
n ∑ Xi2 - ∑ (Xi) 2 1.632 - 1.296 = 210.967,6 / 336 = 627,879 atau 627,88 a = Ybar - bXbar = 12.637,34 - 627,88 (4,5) = 9.811,88 Persamaan garis trend linear : Y = 9.811,88 + 627,88X Y pada tahun 2000 (X = 9) --- Y = 9.811,88 + 627,88 (9) = 15.462,8 Jadi ramalan PDB tahun 2000 = 15.462,8 milyar. Nilai ramalan untuk tahun 2000 dengan cara pertama maupun kedua menghasilkan nilai yang sama, walaupun persamaannya berbeda. Jadi yang perlu diperhatikan adalah jika anda mempunyai suatu persamaan trend, cara mana yang anda gunakan perlu dijelaskan atau diketahui karena hal ini menyangkut masalah penggunaan model / persamaan untuk peramalan nilai-nilai mendatang. Sebagai contoh, untuk meramal nilai pada tahun 2001, maka kalau menggunakan cara pertama anda memasukkan nilai X = 11, sedangkan kalau menggunakan cara kedua anda harus memasukkan nilai X = 10. Hal ini akan mendapatkan nilai peramalan yang sama, yaitu 16.090,68 untuk tahun 2001
STATISTIK INDUSTRI MODUL 10 INDEKS MUSIMAN DAN GERAKAN SIKLIS
Tujuan Belajar Setelah mempelajari bab ini, Anda diharapkan :
Mengenali komponen data berkala Membedakan masing-masing komponen data berkala Menghilangkan pengaruh musiman
GERAKAN MUSIMAN, PENYESUAIAN DATA BULANAN, DAN INDEKS MUSIMAN Dalam modul 9 telah dibahas salah satu komponen data berkala yaitu trend. Didalam modul ini akan dibahas komponen lainnya seperti gerakan musiman dan gerakan siklis. Gerakan musiman (seasonal movement or variation) merupakan gerakan yang tertentu dalam arti naik turunya terjadi pada waktu-waktu yang sama atau sangat berdekatan. Disebut gerakan musiman oleh karena terjadinya bertepatan dengan pergantian musiman dalam satu tahun (musim panen padi harga beras turun dan pada waktu menjelang panen harga masih tinggi, juga harga buah-buahan seperti rambutan, duku dsb, akan dipengaruhi oleh musim panen. Gerakan lainnya yang terjadi secara teratur dalam waktu yang sangat singkat juga disebut gerakan musiman, misalnya :
Naik turunnya temperature seorang pasien tiap jam dari hari ke hari Naik turunya produksi karet tiap bulan dari tahun ke tahun Naik turunnya jumlah orang keluar negeri pada waktu muism haji
Penegetahuan tentang gerakan musiman ini sangat penting sebagai dasar penentuan langkah-langkah kebijakan dalam rangka mencegah hal-hal yang diinginkan. Untuk menstabilkan harga beras, pemerintah melalui Bulog akan membeli beras pada waktu panen, disimpan di gudang-gudang, kemudian akan dijual lagi kepada masyarakat pada waktu menjelang panen (jauh sebelum panen), agar harga tidak melonjak tinggi. Contoh lainnya : pemilik bioskop menyediakan karcis lebih banyak pada malam minggu, khususnya pada bulan muda, pemilik restoran menyediakan makanan lebih banyak pada malam minggu, pemerintah mengimpor beras menjelang panen dsb). Oleh karena jumlah hari pada setiap bulan tidak sama, maka perlu diadakan penyesuaian data. Pennyesuaian data mempunyai alasan-alasan berikut :
Jumlah hari tiap bulan tidak sama Jumlah hari kerja tidak sama Jumlah jam kerja tidak sama
Jadi kalau produksi / penjualan suatu barang pada bulan Februari lebih kecil daripada bulan lainnya, itu tidak berarti bahwa ada kemerosotan pada bulan itu, tetapi karena harinya hanya ada 28 hari. Jumlah hari yang terdapat dalam setiap tahun adalah berbeda dari jumlah rata-rata hari dalam setiap bulan. Untuk menyesuaikan data bulanan dengan perbedaan jumlah hari itu, maka data bulanan dari hasil observasi harus dikalikan dengan suatu factor pengali yang diperoleh dengan jalan mengalikan jumlah hari yang terdapat di dalam bulan itu dengan jumlah rata-rata hari dalam setiap bulan. Jika satu tahun = 365 hari, maka jumlah hari per bulan secara rata-rata adalah 365/12 = 30,4167 hari. Perhatikan table 1 berikut ini :
Bulan Jumlah hari Kolom (2) dibagi 365/12
Factor Pengali = 100 x kebalikan kolom (3)
(1) (2) (3) (4) Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember
31 28 31 30 31 30 31 31 30 31 30 31
1,01918 0,92055 1,01918 0,98630 1,01918 0,98630 1,01918 1,01918 0,98630 1,01918 0,98630 1,01918
98,11809 ( = 98,118) 108,63071 ( = 108,631) 98,11809 ( = 98,118 ) 101,38902 ( = 101,389) 98,11809 ( = 98,118 ) 101,38902 ( = 101,389) 98,11809 ( = 98,118 ) 98,11809 ( = 98,118 ) 101,38902 ( = 101,389) 98,11809 ( = 98,118 ) 101,38902 ( = 101,389) 98,11809 ( = 98,118 )
365 12,00000 1.200,000
Kolom (3) dari table diatas menunjukkan hasil bagi dari jumlah hari setiap bulan dengan 30,4167. Penyimpangan hasil bagi itu dari 1 menunjukkan (penyimpangan dalam bentuk
perbandingan) data yang diamati dengan data yang seharusnya, seandainya setiap bulan mempunyai jumlah hari yang sama. Untuk menyesuaikan data bulanan dengan jumlah kebalikan dari angka yang terdapat dalam kolom (3) tabel tersebut. Factor pengali yang dimaksud dapat dilihat dalam kolom (4). Untuk keperluan penyesuaian , maka data berkala dari hasil observasi seyogyanya dikalikan dengan factor pengali dari kolom (4). Walaupun jumlah hari dalam satu bulan itu sama, namun jumlah hari kerja belum tentu sama. Kalau analisis menghendaki penyesuaian yang lebih teliti, maka angka darikolom (2) diganti dengan jumlah hari kerja tiap bulan. Selanjutnya juga perlu diperhatikan, seandainya jumlah hari dan jumlah hari kerja sama tetapi jumlah jam kerja tidak sama dan perlu penyesuaian terhadap jumlah jam kerja, maka kolom (2) dapat diganti dengan jumlah jam kerja tiap bulan. Jadi factor pengali dalam kolom (4) dapat untuk penyesuaian jumlah hari, jumlah hari kerja, dan jumlah jam kerja, tergantung pada persoalan dan tujuan analisis. Untuk keperluan analisis, seringkali data berkala dinyatakan dalam bentuk angka indeks. Apabila kita ingin menunjukkan ada tidaknya gerakan musiman, perlu dibuat indeks musiman (seasonal index). Pada modul 9 telah dibahas bahwa data berkala yang dinyatakan sebagai variable Y terdiri dari 4 komponen, yaitu : Y = T x C x S x I Kalau pengaruh dari trend (T), siklis (C) dan irregular (I) dihilangkan, tinggallah satu komponen S, yaitu komponen musiman. Apabila S dinyatakan dalam angka indeks, maka kita peroleh indeks musiman. Jadi angka indeks musiman merupakan angka yang menunjukkan nilai relative dari variable Y yang merupakan data berkala selama seluruh bulan dalam satu tahun (dapat lebih dari 1 tahun). Contoh : Diketahui hasil penjualan suatu jenis barang selama bulan Januari, Februari, Maret, April,……, masing-masing sebesar 75%, 125%, 110%, 150%,….dari rata-rata hasil penjualan untuk seluruh tahun. Angka-angka tersebut merupakan angka indeks musiman. Rata-rata angka indeks musiman untuk seluruh tahun seharusnya sebesar 100%, dan
jumlah seluruh angka indeks musiman harus 1.200% (tanda % sering dihilangkan / tidak ditulis). Beberapa metode untuk menghitung angka indeks musiman, antara lain :
1. Metode rata-rata sederhana (simple average method) 2. Metode relative bersambung (link relative method) 3. Metode rasio terhadap trend (ratio to trend method) 4. Metode rasio tarhadap rata-rata bergerak (ratio to moving average method)
1. Metode Rata-rata Sederhana
Perhatikan table 2 : Produksi Gas Indonesia 1995 - 1998 (000 MCF) Bulan 1995 1996 1997 1998 Jumlah (2)
s/d (5) Rata-rata (6) : 4
(1) (2) (3) (4) (5) (6) (7) Januari Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember
259.982 244.993 268.423 236.293 251.439 244.756 246.631 254.749 228.903 245.213 243.994 273.852
278.525 259.589 274.530 250.171 248.524 238.479 256.076 267.292 255.964 280.989 273.245 283.237
276.438 276.439 278.306 268.242 263.570 238.531 263.283 272.805 250.000 257.920 263.112 280.028
267.785 239.373 250.492 230.830 236.124 229.838 252.718 262.069 241.952 238.903 257.450 268.948
1.082.730 1.020.394 1.071.751 985.537 999.657 951.604 1.018.708 1.056.915 976.819 1.023.025
270.682,50 255.098,50 267.937,75 246.384,25 249.914,25 237.901,00 254.677,00 264.228,75 244.204,75 255.756,25 259.450,25 276.516,25
1.037.801 1.106.065
Jumlah 3.082.751,50 Cara menghitung indeks musiman :
a. Hitung produksi rata-rata bulanan untuk seluruh tahun (menggunakan rata-rata hitung, median atau jenis rata-rata lainnya). Angka rata-rata dipakai untuk mewakili bulan Januari, Februari dst.
b. Setelah diperoleh rata-rata untuk tiap bulan, angka rata-rata ini beserta jumlahnya kita pindahkan ke table berikut dibawah ini dalam kolom (2). Rata-rata kemudian dinyatakan sebagai persentase terhadap totalnya {(270.682,50 / 3.082.751,50) x 100% = 8,7805 dst}. Hasil pembagian terdapat di kolom (3)
c. Untuk memperoleh angka indeks musiman pada kolom (4), nilai pada kolom (3) dikalikan dengan 12. Contoh : 8,7805 x 12 = 105,37, dst. Semua dibulatkan menjadi 2 angka dibelakang koma, untuk mendapatkan jumlah kolom (4) yaitu 1.200,00. Perhatikan bahwa karena kesalahan pembulatan, ada kemungkinan jumlah kolom (3) tidak tepat 100, dan jumlah kolom (4) tidak tepat 1.200.
Pengambilan nilai rata-rata tiap bulan dimaksudkan utnuk menghilangkan pengaruh trend (T). Untuk memperoleh gerakan musiman yang murni, pengaruh dari gerakan siklis seharusnya juga dihilangkan. Karena gerakan siklis akan terulang setelah beberapa tahun (4 tahun, 5 tahun atau lebih), maka banyaknya tahun yang diselidiki harus sebanyak tahun terulangnya gerakan siklis tersebut. Apabila indeks musiman dari kolom (4) table berikut kita buat kurvanya, aka akan diperoleh grafik yang menunjukkan terjadinya penurunan indeks musiman produksi gas di Indonesia dari bulan Januari sampai dengan Juni, kemudian meningkat sampai bulan Agustus, dan turun kembali pada bulan September. Setelah itu produksi meningkat kembali sampai dengan bulan Desember. Tabel 3 : Indeks Musiman Produksi Gas Indonesia 1995 – 1998 (000 MSCF) Bulan Harga Rata-rata Persentase (%) terhadap total
dari kolom (2) Indeks Musiman
(1) (2) (3) (4) Januari 270.682,50 8,7805 105,37
Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember
255.098,50 267.937,75 246.384,25 249.914,25 237.901,00 254.677,00 264.228,75 244.204,75 255.756,25 259.450,25 276.516,25
8,2750 8,6915 7,9923 8,1069 7,7172 8,2614 8,5712 7,9216 8,2964 8,4162 8,9688
99,30 104,30
95,91 97,28 92,61 88,14 99,14
102,85 95,06 99,56
107,64 Jumlah 3.082.751,50 100,00 1.200,00
2. Metode Relatif Bersambung
Untuk menggunakan metode relative bersambung, data bulanan yang asli mula-
mula dinyatakan sebagai persentase dari data pada bulan yang mendahuluinya. Persentase-persenatse yang didapat dengan cara demikian disebut relative bersambung (link relative).
Jadi, relative bersambung menghubungkan data pada bulan yang mendahuluinya.
Kemudian diambil rata-rata atau median dari persentase – persentase tersebut untuk setiap bulan. Untuk keperluan ilustrasi, perhatikan table 2 yang ditulis kembali untuk memudahkan. Tabel 4 : Produksi Gas Indonesia 1995 – 1998 (000 MSCF) Bulan 1995 1996 1997 1998 (1) (2) (3) (4) (5)
Januari 259.982 278.525 276.438 267.785
Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember
244.993 268.423 236.293 251.439 244.756 246.631 254.749 228.903 245.213 243.994 273.852
259.589 274.530 250.171 248.524 238.479 256.076 267.292 255.964 280.989 273.245 283.237
276.439 278.306 268.242 263.570 238.531 263.283 272.805 250.000 257.920 263.112 280.028
239.373 250.492 230.830 236.124 229.838 252.718 262.069 241.952 238.903 257.450 268.948
Jumlah Dari data table 4 dapat dihitung angka relative bersambung sebagai berikut : Data Februari 1885 Untuk Februari 1995 = -------------------------- x 100% Data Januari 1995 = (244,993 / 259.982) x 100% = 94,23% Dengan cara yang sama, angka relative bulan berikutnya dapat dicari. Misalnya angka relative untuk bulan Maret 1995 dan Juni 1995 adalah masing-masing 109,56% dan 97,34%. Angka-angka relative bersambung ini dimasukkan ke table 5, dan kita peroleh rata-rata untuk masing-masing bulan. Rata-rata Januari = (101,71 + 97,60 + 98,31) / 3 = 97,60 Rata-rata Februari = ( 94,23 + 93,20 + 100,00 + 89,39 ) / 3 = 94,21 Rata-rata Maret = ( 109,56 + 105,76 + 100,68 + 104,65 ) / 3 = 105,16 Dan seterusnya…..
Tabel 5 : Angka Relatif Bersambung Bulan 1995 1996 1997 1998 Rata-rata Median
Januari Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember
- 94,23
109,56 88,03
106,41 97,34
100,77 103,85
89,85 107,13
99,50 112,24
101,71 93,20
105.76 91,13 99,34 95,96
107,38 104,38
95,76 109,78
97,24 103,66
97,60 100,00 100,68
96,38 98,26 90,50
110,38 103,62
91,64 103,17 102,01 106,43
98,31 89,39
104,65 92,15
102,29 97,34
105,95 103,70
92,32 98,74
107,76 104,47
97,60 94,21
105,16 91,92
101,58 95,28
107,12 103,75
92,40 104,70 101,63 106,70
- 93,72
105,20 91,84
100,82 96,65
108,67 103,66
91,98 105,15 100,76 105,45
Contoh 1 : Berdasarkan data table 5, buatlah indeks musiman dengan menggunakan metode rata-rata Penyelesaian : Perhatikan angka rata-rata pada table 5 diatas :
Kita anggap angka Januari = 100% Angka bulan Februari = 94,21% dari rata-rata data Januari, yaitu 87/94,21
x 100% = 94,21% Untuk Maret angkanya adalah 105,16 dari Februari, yaitu 105,16 x 94,21%
= 99,07% Hasil perhitungan ini disebut relative berantai (chain relative) yang terlihat
pada table 6 berikut : Tabel 6 : Relative Berantai Bulan Rata-rata relative bersambung Relatif Berantai
Januari Februari Maret April
97,60 94,21
105,16 91,92
100,00 94,21 99,07 96,67
Mei Juni Juli Agustus Se[ptember Oktober November Desember
101,58 95,28
107,12 103,75
92,40 104,70 101,63
106,70
93,79 96,79
102,07 111,13
95,86 96,74
106,41 108,44
Januari* 106,61 *Relative berantai Januari kedua = 98,31% dari Desember (108,44%) = (98,31/100) x 108,44% = 106,61%
Perhatikan table 6 :
Oleh karena nilai relative berantai Januari kedua = 106,61%, baerati terjadi kenaikan sebesar 106,61 – 100% = 6,61%. Kenaikan ini disebabkan adanya pengaruh trend jangka panjang. Untuk menghilangkan pengaruh trend ini, maka relative Januari kedua harus dikurangi {( 12/12 ) x 6,61%, yaitu 106,61% - 6,61% = 100%.
Oleh karena pengaruh trend sudah dihilangkan, maka baik Januari pertama
(baris pertama table 6) maupun Januari kedua (baris terakhir table 6) mempunyai relatif berantai yang sama yaitu sebesar 100,00%.
Untuk Desember = 108,44% - (11/12 x 6,61%) = 102,38%
Untuk November = 106,41% - (10/12 x 6,61%) = 103,99%
Untuk Oktober = 96,74% - (9/12 x 6,61%) = 91,78% dst
Hasil perhitungan ini merupakan angka indeks musiman dengan menggunakan
metode bersambung. Apabila jumlah dari indeks ini (A) = 1.200%, maka perhitungan selesai, tetapi kalau jumlahnya tidak sama dengan 1.200%, maka masing-masing angka indeks dari bulan Januari s/d Desember harus diadakan penyesuaian, yaitu dengan mengalikan masing-masing nilai dengan angka penyesuaian sebesar 1.200 / A (lihat table 7)
Tabel 7 : Indeks Musiman
Bulan Belum disesuaikan Sudah disesuaikan (1) (2) (3)
Januari Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember
100,00 93,66 97,97 95,01 91,17 94,03 98,76
107,28 91,45 91,78
103,99 102,38
103,06 96,52
100,96 97,92 93,96 96,91
101,78 110,56
94,25 94,59
106,18 105,51
Januari*
Ternyata jumlah indeks, kolom (2) table 7 adalah 1.164,39 dan bukan 1.200. Dengan demikian setiap angka harus dikalikan dengan angka penyesuaian sebesar 1200 :1.164,39 = 1,0306.
Untuk Januari = 100 x 1,0306 = 103,06. Februari = 93,66 x 1,0306 =
96,52 dst (lihat kolom 3 tabel 7)
Apabila dibuat grafik indeks musiman yang disesuaikan, maka kurvanya menunjukkan bahwa telah terjadi kenaikan produksi pada bulan Agustus. Gerakan musiman ini tidak begitu jelas, sebab ada kecenderungan berfluktuasi dari bulan ke bulan. Dengan jalan yang sama dapat dibuat median sebagai pengganti rata-rata. Angka median terdapat pada kolom (7) table 5.
3. Metode Rasio Terhadap Trend
Didalam metode ini, data asli untuk setiap bulan dinyatakan sebagai persentase dari nilai-nilai trend bulanan. Rata-rata (median) dari persentase ini merupakan indeks musiman. Kalau rata-rata indeks ini ≠ 100%, atau jumlahnya ≠ 1.200 %, perlu diadakan penyesuaian.
Seperti kita ketahui, suatu data berkala Y mempunyai komponen T (trend), siklis (C) , musiman (S), dan gerakan tidak teratur (I). Jadi Y = TCSI. Apabila dipergunakan sebagai indeks musiman, maka ini sebetulnya bukan merupakan indeks musiman yang murni, tetapi masih mengandung komponen C dan I. Inilah salah satu kelemahan dari cara ini.
Contoh : Dari table rata-rata bulanan berikut, buatlah indeks musiman menggunakan metode rasio terhadap trend (pertama dengan rata-rata, kedua dengan median) Table 8 : penjualan rata-rata bulanan hipotetis PT. Sinar Surya
Tahun 1992 1993 1994 1995 1996 1997 1998 1999 Rata-rata
bulanan
273,7
293,5
315,0
336,8
364,4
394,8
424,2
458,7
Penyelesaian : Seharusnya kita mencari persamaan trend bulanan, tetapi cara ini kurang praktis karena kita harus melakukan perhitungan terhada 12 x 8 angka = 96 angka. Sebagai penggantinya kita akan mencari garis trend tahunan dengan menggunakan angka rata-rata bulanan tersebut yang mewakili angka tahunan. Tren yang akan kita pergunakan merupakan trend garis kurus untuk tahun 1992 – 1999. Dengan mengasumsikan bahwa angka bulanan ini terletak pada pertengahan bulan, maka rata-rata yang mewakili tahun akan terletak pada tanggal 30 Juni - 1 Juli tahun bersangkutan. Untuk mencari trend tahunan diperlukan perhitungan-perhitungan sebagai berikut : Tabel 9 : Tahun X Y XY X2 1992 1993 1994 1995
-7 -5 -3 -1
273,7 293,5 315,0 336,8
-1.915,9 -1.467,5
-945,0 -336,8
49 25
9 1
1996 1997 1998 1999
1 3 5 7
364,4 394,8 424,2 458,7
-364,4 1.284,4 2.121,0 3.210,9
1 9
25 49
Jumlah 0 2.861,1 2.215,5 168 a = 1/n sigma Yi
= 1/8 x 2.861,1 = 357,64 Xi Yi
b = ----------
Xi2
= 2.215,5 / 168 = 13,19
Y = a + bX = 357,64 + 13,19X
Dalam hal ini X diukur menurut pertengahan tahun (6 bulan) dan titik asalnya pada tanggal 31 Desember 1995 atau 1 Januari 1996. (Ingat bahwa karena jumlah tahun genap, maka jarak antara tahun yang satu dengan tahun lainnya sebesar 2 satuan. Dua satuan = 1 tahun, sehingga satu satuan sama dengan setengah tahun = 6 bulan). Dari persamaan Y = 357,64 + 13,19X, berarti bahwa nilai Y naik sebesar 13,19 setiap 6 bulan. Jadi setiap bulannya naik secara rata-rata 13,19 / 6 = 2,20. Jadi ketika nilai X = 0 ( yaitu pada tanggal 1 Januari 1996 ) --- Y = 357,64 + ½ (2,20) = 358,7, yaitu merupakan nilai trend pada bulan Januari 1996. Dengan melakukan penambahan secara berurutan sebesar 2,20 terhadap 358,7 akan diperoleh nilai trend untuk bulan Februari 1996, Maret 1996, April 1996 dsb, masing-masing sebesar 358,7 + 2,20 = 360,9 ; 360,9 + 2,20 = 363,1 dst.
Dengan cara yang sama, kita bisa memperoleh nilai-nilai trend untuk bulan-bulan pada tahun sebelum 1996, yaitu dengan mengurangkan nilai 2,20 terhadap 358,7 secara berurutan sehingga kita memperoleh nilai trend untuk Desember 1995, November 1995,
Oktober 1995 dst, masing-masing sebesar 358,7 – 2,20 = 356,5 ; 356,5 – 2,20 = 354,3; 354,3 – 2,20 = 352,1 dst. Hasil perhitungan ini menghasilkan nilai trend dan hasil perhitungan, seluruhnya disajikan pada table 10 berikut : Tabel 10 : Nilai trend PT. Sinar Surya Tahun 1992 1993 1994 1995 1996 1997 1998 1999 (1). (2) (3) (4) (5) (6) (7) (8) (9)
Jan. Feb. Maret April Mei Juni Juli August Sept. Okt. Nov. Des.
253,1 255,3 257,5 259,7 261,9 264,1 266,,3 268,5 270,7 272,9 275,1 277,3
279,5 281,7 283,9 286,1 288,3 290,5 292,7 294,9 297,1 299,3 301,5 303,7
205,9 308,1 310,3 312,5 314,7 316,9 319,1 321,3 323,5 325,7 327,9 330,1
332,3 334,5 336,7 338,9 341,1 343,3 345,5 347,7 349,9 352,1 354,3 356,5
359,7 360,9 363,1 365,3 367,5 369,7 371,9 374,1 376,3 378,5 380,7 382,9
385,1 387,3 389,5 391,7 393,9 396,1 398,3 400,5 402,7 404,9 407,1 409,3
411,5 413,7 415,9 418,1 420,3 422,5 424,7 426,9 429,1 431,3 433,5 435,7
437,9 440,1 442,3 444,5 446,7 448,9 451,1 453,3 455,5 457,7 459,9 462,1
Angka-angka dari table 10 dipergunakan untuk membagi data asli dari tabel 11 berikut . Hasil pembagian ini dinyatakan dalam persentase, misalnya untuk : Januari 1992 = (318 / 253,1) x 100% = 125,64% Februari 1992 = (281 / 255,3 ) x 100% = 110,06% Maret 1992 = (278 / 257,5) x 100% = 107,96% Hasil pembagian ini disajikan dalam table 11 berikut : Tabel 11 : Nilai Rasio terhadap Trend (%)
Bulan 1992 1993 1994 1995 1996 1997 1998 1999 Rata2 Median (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)
Jan. Feb Maret April Mei Juni Juli Agust Sept. Okt. Nov. Des.
125,6 110,1 108,0 96,3 88,2 81,1 83,7 91,2 99,4 110,7 118,1 125,1
122,4 110,0 105,3 93,7 86,4 81,2 82,7 88,8 96,9 107,3 113,4 119,9
120,0 106,5 103,1 91,8 85,5 79,2 81,2 88,4 95,5 105,9 111,9 119,4
118,0 104,3 101,6 91,8 85,0 79,5 81,6 87,7 93,7 103,4 109,8 117,0
117,1 104,7 101,9 91,4 85,4 80,1 82,0 88,2 94,6 104,6 110,8 118,0
117,6 106,4 102,2 92,4 86,6 81,3 84,1 89,6 97,3 105,5 111,5 118,0
118,3 106,4 103,1 94,0 88,0 81,3 84,1 90,9 96,7 106,0 113,3 118,4
120,8 108,4 104,7 95,2 89,1 84,7 86,2 92,4 98,4 107,7 114,4 121,2
119,98 107,10 103,74 93,33 86,78 81,24 83,20 89,65 96,56 106,39 112,90 119,63
119,2 106,4 103,1 93,0 86,5 81,2 83,2 89,2 96,8 106,0 112,6 189,9
1.200,5 1.196,1 Untuk menghitung indeks musiman dengan menggunakan rata-rata, kitapergunakan kolom (10) table 11. Apabila jumlah tersebut tidak sama dengan 1.200, maka perlu diadakan penyesuaian, tetapi karena jumlahnya = 1.200,50 yang sudah dekat dengan 1.200, maka penyesuaian tidak diperlukan lagi. Kalau median akan dipergunakan untuk menghitung indeks musiman, kita pergunakan kolom (11) table 11. Akan tetapi, karena jumlahnya tidak sama dengan 1.200, maka perlu dilakukan penyesuaian, yaitu dengan mengalikan setiap angka pada kolom (11) table 11 dengan factor pengali sebesar 1.200/ 1.196,1 = 1,003. Setelah dikalikan dengan factor pengali, kita peroleh indeks musiman sebagai berikut : Januari = 119,2 x 1,003 = 119,56 Februari = 106,4 x 1,003 = 106,72 Maret = 103,1 x 1,003 = 103,41 dst
Apabila seluruhnya dikalikan, maka kita peroleh indeks untuk setiap bulan yang tersaji pada table 12 berikut :
Bulan Indeks Musiman Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember
119,56 106,72 103,41
93,28 86,76 81,44 83,44 89,47 97,09
106,32 112,94 119,26
Jumlah 1.200,00 Apabila indeks musiman dengan menggunakan metode rasio terhadap trend tersebut digambarkan grafiknya, maka kita peroleh bentuk kurva yang memperlihatkan bahwa kurva indeks dengan metode rata-rata maupun median tidak jauh berbeda. Pada umumnya , berdasarkan indeks musiman tersebut terjadi penurunan hasil penjualan pada bulan Juni. 4. Metode Rasio terhadap Rata-rata Bergerak
Didalam metode ini harus dihitung terlebih dahulu rata-rata bergerak selama 12 bulan. Oleh karena hasil perhitungan rata-rata bergerak 12 bulan ini terletak antara
2 bulan yang berdekatan (tidak terletak di pertengahan bulan), maka harus dibuat rata-rata bergerak 2 bulan yang didasarkan atas rata-rata bergerak 12 bulan tersebut. Ini disebut rata-rata bergerak 12 bulan terpusat (centered 12 months moving average). Apabila rata-rata bergerak 12 bulan terpusat sudah dihitung, maka angka-angka ini dapat dipergunakan untuk membagi data asli yang hasilnya dalam persentase, kemudian dibuat rata-rata angka persentase ini dari bulan ke bulan. Kalau jumlah rata-rata dari bulan ke bulan sudah sama atau dekat sekali dengan 1.200, maka angka rata-rata sudah merupakan angka indeks musiman. Apabila jumlah A tidak sama dengan 1.200, maka harus dilakukan penyesuaian, yaitu dengan jalan mengalikan setiap angka rata-rata (median) dengan factor pengali sebesar 1.200/A Contoh : Dengan menggunakan data table 2, buatlah angka indeks musiman dengan metode rasio terhadap rata-rata bergerak.
Penyelesaian ; Sebagai langkah awal, harus dibuat rata-ata bergerak 12 bulan terpusat terlebih dahulu, seperti ditunjukkan pada table 13 berikut ini.
Table 13 : Rata-rata Bergerak 12 Bulan Terpusat Produksi Gas Indonesia, 1995 – 1999 (000 MSCF)
Tahun & Bulan
(1)
Produksi Gas (Y)
(2)
Rata-rata Bergerak 12 Bulan
(3)
Rata-rata Bergerak 1 Bulan Terpusat
(4) 1995 : 1
2 3 4 5 6 7 8 9
10 11 12 1996 : 1
259.982 244.993 268.423 236.293 251.439 244.756 246.631 254.749 228.903 245.213 243.994 273.852 278.525
249.935,75 251.481,00 252.697,33 253.206,25 254.362,67 254.119,75 253.596,67 254.383,75
250.708,38 252.089,17 252.951,79 253.784,46 254.241,21 253.858,21 253.990,21
2 3 4 5 6 7 8 9
10 11 12 1997 : 1
2 3 4 5 6 7 8 9
10 11 12 1998 : 1
2 3 4 5 6 7 8 9
10 11 12
259.589 274.530 250.171 248.524 238.479 256.076 267.292 255.964 280.989 273.245 283.237 276.438 276.439 278.306 268.242 263.570 238.531 263.283 272.805 250.000 257.920 263.112 280.028 267.785 239.373 250.492 230.830 236.124 229.838 252.718 262.069 241.952 238.903 257.450 268.948
257.684,08 257684,08 260.665,42 263.103,00 263.885,08 263.711,17 265.115,33 265.430,00 266.935,92 268.189,75 268.194,08 268.794,67 269.254,08 268.757,08 266.834,67 265.990,25 265.722,83 265.001,75 261.912,92 259.595,08 256.477,42 254.190,25 253.465,83 252.585,42 251.690,75 251.020,08 249.435,33 248.963,50 248.040,17
256.556,54 258.556,54 239.174,75 261.884,21 263.292,04 263.798,13 264.413,25 265.272,67 266.182,96 267.562,83 268.191,92 268.494,38 269.024,38 269.005,58 267.795,88 266.412,46 265.856,54 265.362,29 263.437,33 260.754,00 258.036,25 255.333,83 253.828,04 253.025,63 252.138,08 251.355,42 250.227,71 249.199,42 248.502.83
Cara memperoleh angka-angka kolom (3) adalah sebagai berikut :
259.982 + 244.933 + ……+ 273.852 249.935,75 = --------------------------------------------------- (antara Juni – Juli) 12
244.993 + 268.423 + …….+ 278.525 251.481,00 = --------------------------------------------------- (antara Juli – Agus- 12 tus) dst Kemudian cara memperoleh angka pada kolom (4) adalah sebagai berikut 249.935,75 + 251.481,00 250.708,38 = ----------------------------------- , diletakkan pada Juli 1995 2 251.481,00 + 252.697,33 252.089,17 = ----------------------------------- , diletakkan pada Agustus 1995 2 dst Hasil perhitungan ini menghasilkan rata-rata bergerak 12 bulan terpusat. Angka rata-rata bergerak ini dapat juga diperoleh dengan mencari jumlah bergerak 12 bulan (menjumlahkan 12 angka), kemudian dari angka ini dibuat jumlah bergerak 2 bulan (menjumlahkan 2 angka) dan akhirnya dibagi 24.
Tabel 14 :
Jumlah bergerak 12 bulan
Jumlah bergerak 2 builan dari kolo (1)
Rata-rata bergerak 12 bulan terpusat
(1) (2) (3) = (2) : 24 2.999.229
3.166.621
3.188.674
2.976.482
6.165.850
6.355.295
6.165.136
256.910,42
264.803,96
256.881,50
Perhatikan bahwa dengan menggunakan rata-rata bergerak kita kehilangan beberapa angka. Angka rata-rata bergerak dimulai pada bulan Juli 1995 (250.708,38) dan berakhir pada bulan Juni 1998 (248.502,83). Langkah selanjutnya, data asli, yaitu mulai Juli 1995 (246.631) sampai pada bulan Juni 1998 (229.838) dibagi dengan angka rata-rata bergerak 12 bulan terpusat. Hasil pembagian dinyatakan dalam persentase. Misal : Hasil pembagian pada Juli 1995 = (246.631 / 250.708,38) x 100% Agustus 1995 = (254.748 / 252.089,17) x 100% Dst Seluruh hasil pembagian dimuat dalam table 15 berikut :
Bulan 1995 1996 1997 1998 Rata-rata Median (1) (2) (3) (4) (5) (6) (7)
Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember
93,37 101,06
90,49 96,62 05,97
107,88
109,66 101,84 107,01
96,53 94,50 90,51 97,07
101,09 96,49
105,56 102,12 105,61
102,96 102,76 103,46 100,17
98,93 89,72 99,22
103,55 95,88 99,95
103,05 110,32
105,83 94,94 99,66 92,25 94,75 92,49
106,15 99,84
103,66 96,31 96,19 90,91 98,22
101,90 94,29
100,71 100,38 107,94
105,83 101,84 103,46
96,53 94,90 90,51 98,37
101,09 95,88 99,95
102,12 107,88
Jumlah 1.196,22 1.198,35 Angka-angka kolom (6) diperoleh dari : 100,66 + 102,96 + 105,83 106,15 = -------------------------------------- 3 101,84 + 102,76 + 94,94 99,84 = ------------------------------------- 3 Angka-angka kolom (7), misal 105,83 yang merupakan nilai tengah data pada bulan Januari dengan mengurutkan dari nilai terkecil sampai terbesar (102,96 ; 105,83 ; 109,66).
Apabila jumlah rata-rata kolom (6) dan jumlah median kolom (7) sama dengan 1.200, maka masing-masing kolom tersebut dapat dipergunakan sebagao indeks musiman. Akan tetapi kalau jumlahnya tidak sama dengan 1.200, maka perlu diadakan penyesuaian. Terakhir, perlu diadakan penyesuaian, kalau rata-rata akan dipergunakan sebagai indeks musiman, dimana masing-masing nilai dari bulan ke bulan pada kolom (6) harus dikalikan dengan factor pengali 1.200 / 1,196,22 = 1,0014. Setelah dilakukan perkalian terhadap factor pengali, maka kita peroleh indeks musiman yang disajikan dalam tabel 16 berikut : Tabel 16 : Indeks Musiman, Rasio terhadap Rata-rata Bergerak dengan menggunakan
Rata-rata dan Median. Bulan Indeks Musiman dengan
Rata-rata Indeks Musiman dengan
Median (1) (2) (3)
Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember
106,49 100,18 103,70
96,62 96,50 91,19 98,53
102,22 94,58
101,03 100,70 108,28
105,98 101,98 103,60
96,66 95,03 90,63 98,51
101,23 96,01
100,09 100,09 108,02
Jumlah 1.200,00 1.200,00 Data indeks musiman pada table 16, kemudian dibuat kurvanya (untuk rata-rata dan median). Perlu disebutkan disini bahwa nilai rata-rata dari suatu kelompok nilai sangat dipengaruhi oleh adanya nilai ekstrim dalam kelompok tersebut. Oleh karena itu, apabila memang terdapat nilai ekstrim sebaiknya menggunakan median saja. Tetapi kalau seandainya akan dipergunakan rata-rata dalam membuat indeks musiman, maka nilai
ekstrim harus dihilangkan terlebih dahulu (tidak dimasukkan dalam perhitungan rata-rata tersebut). 5. Menghilangkan Pengaruh Musiman dan Trend
Apabila kita ingin menghilangkan pengaruh musiman terhadap data berkala, maka setiap nilai (data Asli) bulanan dari tahun ke tahun harus dibagi dengan indeks musiman. Angka bulan Januari (dari tahun ke tahun) harus dibagi dengan angka indeks musiman bulan Februari dan seterusnya. Jadi, yang tinggal ialah pengaruh dari trend siklis variasi tak teratur. Contoh : Hilangkan pengaruh musiman terhadap data produksi gas di Indonesia dari table 2. Gambarkan grafiknya sebelum dan sesudah pengaruh musiman dihilangkan. Penyelesaian : Angka indeks musiman yang akan digunakan untuk membagi diambil dari table 16 kolom (3), yaitu indeks musiman dengan menggunakan median. Angka pada bulan Januari 1995 dibagi dengan 105,98% (1,0598), Februari 1995 dengan 101,98%.(1,0598), dan seterusnya. Misal : Januari 1995 = 259.982 : 1,0598 = 245.312,32 Januari 1996 = 278.525 : 1,0598 = 262.809,02, dst Februari1995 = 244.993 : 1,0198 = 240.236,32 Februari 1996 = 259.589 : 1,0198 = 254.548,93, dst Hasil seluruh perhitungan ini menghasilkan data yang bebas dari pengaruh musiman dab disajikan pada table 17 berikut ini.
Tabel 17 : Produksi Gas di Indonesia 1995 – 1998 yang bebas dari pengaruh musiman Bulan 1995 1996 1997 1998
Januari Februari Maret April Mei Juni Juli
245.312,32 240.236,32 259.095,56 244.458,93 264.589,08 270.060,69 250.361,38
262.809,02 254.548,93 264.990,35 258.815,44 261.521,62 263.134,72 259.949,24
260.839,78 271.071,78 266.635,14 277.510,86 277.354,52 263.192,10 267.265,25
252.675,03 234.725,44 241.787,64 238.806,12 248.473,11 253.600,35 256.540,45
Agustus September Oktober November Desember
251.653,66 238.415,79 244.992,51 238.601,60 253.519,72
264.044,26 266.801,40 280.736,34 267.206,14 262.207,92
269.490,27 260.389,54 257.688,08 257.296,09 259.237,18
258.884,72 252.007,08 238.688,18 251.760,22 248.979,82
GERAKAN SIKLIS DAN CARA MENGUKURNYA Seperti kita ketahui, data berkala diberi symbol Y = TCSI. Apabila dibagi dengan S, maka : Y / S = TCSI / S = TCI (bebas pengaruh musiman) yang kemudian kalau dibagi dengan T menjadi : Y / ST = TCI / T = CI (bebas pengaruh musiman dan trend) Kalau pengaruh musiman dan trend dihilangkan dari data berkala, maka sisanya merupakan gerakan siklis dan gerakan yang tak teratur (CI). Hasil pembagian dinyatakan dalam persentase. Contoh : Berdasarkan data pada table 18 berikut, yang sudah bebas dari pengaruh musiman, hilangkan pengaruh trendnya, kemudian gambarkan grafik dari gerakan siklis dan gerakan yang tak teratur (CI), untuk tahun 1995 – 1998 Tabel 18 : Hasil Penjualan yang Bebas dari Pengaruh Musiman PT. Sinar Surya
Bulan 1995 1996 1997 1998 1999 (1) (2) (3) (4) (5) (6)
Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember
325,6 325,0 328,8 333,3 336,0 339,6 342,2 342,7 341,0 342,1 343,0 345,5
348,8 352,0 355,8 358,0 363,8 368,2 363,1 370,8 370,1 372,2 372,1 374,5
376,2 383,6 382,7 389,2 395,1 400,5 406,6 403,4 407,5 401,3 400,4 408,5
404,5 409,7 412,5 421,2 428,7 431,6 433,3 436,0 431,4 429,5 433,0 427,5
439,4 444,1 445,2 453,4 461,2 472,6 472,1 470,8 465,7 463,3 463,8 464,0
Penyelesaian : Niali trend mempergunakan data dari table 10. Semua nilai table 18 mulai dari Januari 1995 s/d Desember 1999 harus dibagi dengan nilai trend dari table 10, pada bulan yang bersangkutan Misal untuk : Januari 1995 = (325,6 / 332,3) x 100% = 97,98% Februari 1995 = (325,0 / 334,5) x 100% = 97,16%, dst Seluruh hasil pembagian dapat dilihat dalam table 19 berikut. Tabel 19 : Hasil Penjualan Bebas Pengaruh Musiman dan trend
Bulan 1995 1996 1997 1998 1999 Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember
97,98 97,16 97,65 98,35 98,50 98,92 99,04 98,56 97,46 97,16 96,81 96,91
97,24 97,53 97,99 98,00 98,99 99,59 97,63 99,12 98,35 98,34 97,74 97,81
97,69 99,04 98,25 99,36 100,30 191,11 102,08 100,72 101,19 99,11 98,35 99,80
98,30 99,03 99,18 100,74 102,00 102,15 102,02 102,13 100,54 99,58 99,98 98,12
100,34 100,91 100,66 102,00 103,25 102,74 104,66 103,86 102,24 101,22 100,85 100,41
Untuk menggambarkan grafik dari gerakan siklis dan gerakan tak teratur (CI), masing-masing nilai data yang sudah bebas dari pengaruh musiman dan trend dikurangi dengan 100%. Hasilnya merupakan persentase jarak (selisih terhadap 100%). Setelah semua nilai dari table 19 dikurangi dengan 100, kita peroleh hasil perhitungan yang disajikan dalam table 20 untuk dasar pembuatan grafik. Table 20 : Persentase Selisih Data Bebas Pengaruh Musiman dan Trend terhadap
100% Bulan 1995 1996 1997 1998 1999
Januari Februari Maret April Mei
-2,02 -2,84 -2,35 -1,65 -1,50
-2,76 -2,47 -2,01 -2,00 -1,01
-2,31 -0,96 -1,75 -0,64 0,30
-1,70 -0,97 -0,82 0,74 2,00
0,34 0,91 0,66 2,00 3,25
Juni Juli Agustus September Oktober November Desember
-1,08 -0,96 -1,44 -2,54 -2,84 -3,19 -3,09
-0,41 -2,37 -0,88 -1,65 -1,66 -2,26 -2,19
1,11 2,08 0,72 1,19 -0,89 -1,65 -0,20
2,15 2,02 2,13 0,54 -0,42 -0,12 -1,88
2,74 4,06 3,86 2,24 1,22 0,85 0,41
CONTOH TAMBAHAN MENGENAI INDEKS MUSIMAN Indeks musiman adalah suatu angka yang bervariasi terhadap nilai dasar 100. Jika suatu blan (minggu, kuartal, atau periode musiman lainnya) mempunyai nilai indeks 100, maka nilai ini menunjukkan bahwa pada bulan tersebut tidak ada pengaruh musiman. Dua metode untuk memperoleh indeks musiman akan disajikan disini, yaitu :
1. Metode 1 : Menemukan indeks musiman dengan membandingkan rata-rata musiman dengan nilai tengah utama. Metode ini paling tepat untuk data berkala yang tidak mempunyai trend atau variasi siklis yang kuat.
2. Metode 2 : Membandingkan setiap nilai musiman sebenarnya dengan rata-rata
bergerak tahunan untuk memperoleh sebuah nilai indeks. Indeks hasil akhir berupa rata-rata keseluruhan periode dalam deret. Penggunaan metode ini lebih luas karena dapat memberikan indeks musiman yang berarti untuk data dengan trend dan variasi siklis yang kuat.
Contoh persoalan dalam bab ini adalah bagaimana menentukan indeks musiman untuk setiap kuartal dalam satu tahun. Jika akan menghitung indeks bulanan, maka teknik yang sama dapat digunakan. Kita menghitung indeks kuartalan disini hanya untuk memperlihatkan metodenya tanpa menggunakan ruang yang berlebihan. Contoh : Table 21 berikut menyajikan data kuartalan 10 tahun penjualan produk X. Pabrik merekomendasikan penggunaan produk X tersebut untuk musim semi dan gugur. Tentukan indeks penjualan musiman untuk keempat kuartal dalam setahun. Penyelesaian : Tabel 21 : Perhitungan Indeks Penjualan Kuartalan (dalam ton) Produk X
Tahun Kuartal 1 Kuartal 2 Kuartal 3 Kuartal 4 1 257 288 263 311
2 3 4 5 6 7 8 9 10
291 319 305 332 368 332 351 355 408
368 485 364 435 520 464 440 504 490
341 325 336 410 415 405 411 449 740
408 381 383 449 444 468 668 527 649
Total 3.318 4.358 4.095 4.688 Total utama = 3.318 + 4.358 + 4.095 + 4.688 = 16.649 Nilai tengah kuartalan (=Total kuartal : 10) 331,8 435,8 409,5 468,8 Nilai tengah utama = (331,8 + 435,8 + 409,5 + 468,8) : 4 = 411,48 Indeks kuartalan = 80,7 105,9 99,5 113,9 (Nilai tengah kuartalan : nilai tengah utama) x 100 Jumlah indeks 400 Berdasarkan perhitungan diatas dapat dijelaskan sebagai berikut :
Rata-rata penjualan kuartal pertama hanya 80,7% dari rata-rata penjualan kuartalan. Sebaliknya, penjualan kuartal keempat adalah 13,9% diatas rata-rata penjualan kuartalan.
Karena indeks musiman bervariasi terhadap 100, maka keempat indeks kuartalan harys berjumlah 400.
Jika indeks yang dihitung adalh indeks bulanan, jumlahnya harus 1.200, yang merata-ratakan nilai 100 untuk setiap bulan.
MENEMUKAN UKURAN MUSIMAN DENGAN PENGGUNAAN REGRESI BERGANDA (MULTIPLE REGRESSION) Metode ini dilaksanakan dengan langkah-langkah sebagai berikut :
1. Kita harus memilih satu musim sebagai musim dasar. Bila data tersedia dalam kuartal, kita boleh memilih kuartal pertama, yaitu musim dingin sebagai musim
dasar. Semua indeks musiman akan diukur berdasarkan musim ini. Selain tiu, tidak ada aturan tertentu yang mutlak untuk memilih musim dasar ini.
2. Berikutnya, data deret berkala ini dicatat sepanjang periode waktu dengan menggunakan variable dummy untuk menunjukkan musim lain dari musim dasar.
Contoh :
Data penjualan setahun suatu perusahaan adalah $50, $125,$105 dan $60 (dalam ribuan). Bila musim dingin kita pilih sebagi dasar, maka data tersebut dapat dicatat dengan menggunakan indicator atau variable dummy, sebagai berikut :
Y (Penjualan) t (waktu) S2 (Musim Semi) S3 (Musim Panas) S2 (M. Gugur)
50 125 105 60
1 2 3 4
0 1 0 0
0 0 1 0
0 0 0 1
Perhatikan bahwa indeks musiman – musim semi, panas dan gugur – adalah nol
pada periode waktu yang tidak merupakan musimnya. Notasi ini memungkinkan kita menyajikan keempat musim dengan hanya 3 variabel. Sebagai contoh, periode musim dingin disajikan dengan 3 nol dalam variable musiman (0,0,0). Musim semi disajikan dengan (1,0,0), musim gugur denagn (0,0,1).
Dengan data yang disajikan pada model diatas, kita dapat membangun persamaan regresi dari rumus :
Y = a + b1t + b2S2 + b3S3 + b4 S4 Dimana : Y = ramalan hasil penjualan t = waktu
Sj = variable indicator yang menunjukkan musim semi, panas dan
gugur Untuk memperoleh ramalan dengan menggunakan persamaan regresi ini, kita
harus menetapkan periode waktu t dan musim Sj untik ramalan yang
diinginkan. Jika kita menggunakan ramalan untuk kuartal musim panas, dengan mengikuti data terakhir, t = 7, dan indikasi musiman adalah (0,1,0), ramalan akan menjadi :
Y = a + + b1(7) + b2 (0) + b3 (1) + b4(0)
= a + b1(7) + b3
Dengan hasil ini, kita dapat melihat bahwa ramalan musiman terdiri dari nilai
trend a + b1(7) ditambah jumlah b3 yang merupakan penyesuaian data
musiman dari penjualan musim panas. Dengan alas an yang sama, adalah data yang disesuaikan untuk musim
semi, dan adalah penyesuaian untuk musim gugur. Karena musim dingin adalah musim dasar, maka tidak ada data penyesuaian
yang ditambahkan pada trend. Tentu saja, pada masalah nyata, lebih dari 4 data dibutuhkan untuk mendapatkan persamaan regresi.
STATISTIK INDUSTRI MODUL 11 ANGKA INDEKS
PENGERTIAN ANGKA INDEKS Angka indeks (indeks) adalah suatu angka yang dibuat sedemikian rupa sehingga
dapat dipergunakan untuk melakukan perbandingan antara kegiatan yang sama (produksi, ekspor, hasil penjualan dsb) dalam waktu yang berbeda. Dari angka indeks bisa diketahui maju mundurnya atau naik turunnya suatu usaha atau kegiatan.
Tujuan pembuatan angka indeks adalah untuk mengukur secara kuantitatif terjadinya perubahan dalam waktu yang berlainan, misalnya indeks harga untuk mengukur perubahan harga, indeks produksi untuk mengetahui perubahan yang terjadi dalam kegiatan produksi dsb.
Angka indeks diperlukan oleh siapa saja yang ingin mengetahui maju mundurnya kegiatan atau usaha yang dilaksanakan, seperti pemilik perusahaan, para pejabat pemerintahan, para ahli ekonomi dan social dsb.
Didalam membuat angka indeks diperlukan dua macam waktu, yaitu waktu dasar (base period) dan waktu yang bersangkutan atau sedang berjalan (current period). Waktu dasar adalah waktu dimana suatu kegiatan (kejadian) dipergunakan sebagai dasar perbandingan, sedangkan waktu yang bersangkutan ialah waktu dimana suatu kegiatan (kejadian) dipergunakan sebagai dasar perbandingan terhadap kegiatan (kejadian) pada waktu dasar.
INDEKS HARGA RELATIF SEDERHANA Indeks harga relative sederhana (simple relative price index) ialah indeks yang terdiri
dari satu macam barang saja, baik untuk indeks produksi maupun indeks harga. Rumus indeks harga sederhana : It,0 = ( pt / p0 ) x 100%
Dimana : It,0 = indeks harga pada waktu t dengan waktu dasar 0
pt = harga pada waktu t
p0 = harga pada waktu 0
Rumus indeks produksi : It,0 = (qt / q0 ) x 100%
Dimana : It,0 = indeks produksi pada waktu t dengan waktu dasar 0
qt = produksi pada waktu t
q0 = produksi pada waktu 0
INDEKS AGREGATIF Indeks agragatif merupaka indeks yang terdiri dari beberapa barang (kelompok
barang), misalnya indeks harga 9 macam bahan pokok, indeks impor Indonesia, indeks biaya hidup dsb.
Indeks agregatif memungkinkan kita untuk melihat persoalan secara agregatif ( secara makro), yaitu secara keseluruhan, bukan melihat satu per satu.
Indeks agregatif dibagi menjadi 2 yaitu : 1. Indeks agregatif tidak tertimbang, yang digunakan untuk unit-unit yang
mempunyai satuan sama. Indeks diperoleh dengan jalan membagi hasil penjumlahan harga pada waktu yang bersangkutan dengan hasil penjumlahan pada waktu dasar.
Rumus : It,0 = ( pt / p0 ) x 100%
2. Indeks Agregatif tertimbang, ialah indeks yang yang dalam pembuatannya telah mempertimbangkan factor – factor yang akan mempengaruhi naik turunnya angka indeks tersebut.
Timbangan yang akan dipergunakan untuk pembuatan indeks biasanya :
a. Kepentingan relative (relative importance) b. Hal-hal yang ada hubungannya atau ada pengaruhnya terhadap naik
turunnya indeks tersebut. Misalnya, karena produksi akan mempengaruhi harga (produksi naik mengakibatkan suplai naik, apabila daya beli tetap permintaan dan daya beli tetap, maka harga barang tersebut dapat turun. Sebaliknya penurunan produksi menyebabkan harga naik).
Beberapa rumus angka indeks tertimbang adalah sebagai berikut :
1. Rumus Laspeyres a. Indeks harga agregatif tertimbang : Lt,0 = ( ptq0 / p0q0 ) x
100% L = Laspeyres pt = harga waktu t
p0 = harga waktu 0 q0 = produksi waktu 0 sebagai timbangan b. Indeks produksi agregatif tertimbang : Lt,0 = ( p0qt / p0q0 ) x
100%
qt = produksi waktu t
q0 = produksi waktu 0 p0 = harga waktu 0 sebagai timbangan 2. Rumus Paasche a. Indeks harga agregatif tertimbang : Lt,0 = ( ptqt / p0qt ) x
100% P = Paasche pt = harga waktu t
p0 = harga waktu 0 qt = produksi waktu t, sebagai timbangan b. Indeks produksi agregatif tertimbang : Lt,0 = ( ptqt / ptq0 ) x 100%
qt = produksi waktu t
q0 = produksi waktu 0 pt = harga waktu 0 sebagai timbangan
3. Rumus Irving Fisher
I = akar L x P= akar { { ( ptq0 / p0q0 ) ( ptqt / p0qt ) }
x 100% } 4. Rumus Drobisch
I = ( L x P ) / 2
= { ( ptq0 / p0q0 ) ( ptqt / p0qt ) } x 100%
ANGKA INDEKS BERANTAI It,t- 1 = (qt / qt - 1 ) x 100%
Dimana : qt = ekspor tahun t
qt - 1 = ekspor tahun t – 1
INDEKS RATA – RATA HARGA RELATIF Rumusnya adalah :
It,0 = 1/n ( pt / p0 ) x 100%
Dimana : n = banyaknya jenis barang
STATISTIK INDUSTRI MODUL 12 PROBABILITAS
1. Pengertian : Probabilitas adakah peluang bahwa sesuatu akan terjadi Suatu nilai yang digunakan untuk mengukur tingkat terjadinya sesuatu
kejadian yang acak 3 kata kunci : eksperimen, hasil (outcome) dan peristiwa (event) Pendekatan : Obyektif : 1. Klasik P (A) = x / n 2. Frekuensi Relatif P (A) = lim fi/n n Subyektif : Didasarkan atas penilaian seseorang dalam menyatakan
tingkat kepercayaan 2. Kejadian :
Interseksi 2 kejadian misal A dan B ditulis A B (dibaca A interseksi B) atau AB, terdiri dari elemen-elemen anggota S yang selain mempunyai sifat atau ciri-ciri A juga B, artinya selain anggota A juga anggota B
Union 2 kejadian A dan B ditulis A B (dibaca A union B) atau A + B merupakan himpunan bagian S yang menjadi anggota A saja atau B saja, atau menjadi A dan B sekaligus
a. Aturan Penjumlahan :
Kejadian saling meniadakan P(A atau B) = P (A B)= P(A)+ P(B) Kejadian tidak saling meniadakan P (A atau B) = P (A) + P (B) - P (A dan B)
Atau P (A B) = P (A) + P (B) - P (A B) b. Aturan Perkalian :
Kejadian tak bebas (bersyarat) : probabilitas kejadian A dengan syarat bahwa B sudah / akan terjadi disebut probabilitas bersyarat
P (A/B) = P (A B) / P (B) atau P (B/A) = P (A B) / P (A) Dengan demikian : P (A B)= P (A) P (B/A =P (B) P (A/B)
P (A) = probabilitas bahwa A terjadi P (B/A) = probabilitas B terjadi dengan syarat A terjadi P (B) = probabilitas bahwa B terjadi P (A/B) = probabilitas A terjadi dengan syarat B terjadi
Kejadian bebas : dua kejadian atau lebih dikatakan merupakan kejadian bebas apabila terjadinya kejadian tersebut tidak saling mempengaruhi. Dua kejadia A dan B dikatakan bebas, kalau kejadian A tidak mempengaruhi B atau sebaliknya Jika A dan B merupakan kejadian bebas, maka : P (A/B) = P(A) dan P(B/A) = P(B) P (A B) = P(A) P(B) = P(B) P(A)
3. Probabilitas Marjinal : Bila R merupakan suatu kejadian sedemikian rupa sehingga salah satu dari kejadian – kejadian yang saling meniadakan S1, S2, ….,Sk harus terjadi
bersama (joint) dengan salah satu kejadian dari R, kemudian P(R) disebut Probabilitas Marjinal, dan nilai P(R) ditentukan dengan aturan berikut : P(R) = sigma P(RSi) Oleh karena P(RSi) = P(Si)P(R/Si) , maka kita peroleh rumus probabilitas marjinal berikut : k P(R) = sigma ∑ P(Si)P(R/Si) i=1
4. Rumus Bayes Misal suatu himpunan lengkap mengenai berbagai kejadian yang terbagi habis
A1, A2, …., Ai, ….Ak (i = 1,2,….,k). Terjadinya salah satu kejadian, katakan Ai, merupakan salah satu syarat yang diperlukan untuk terjadinya kejadian lainnya, misalnya A yang sudah diketahui sebagai hasil observasi. Maka posterior probability kejadian Ai dengan syarat bahwa A sudah atau akan terjadi dapat dihitung berdasarkan rumus Bayes berikut :
P(Ai) P(A/Ai) P(Ai/A) = ------------------------ k ∑ P(Ai) P(A/Ai) i-1 5. Permutasi Adalah suatu pengaturan atau urutan beberapa elemen atau obyek (missal
hasil suatu eksperimen) dimana urutan itu penting, maksudnya 123 ≠ 213, ABC ≠ BCA dst