Upload
others
View
8
Download
0
Embed Size (px)
Citation preview
2.1 Pengertian Statistika
Statistika adalah sekumpulan konsep dan metode untuk mengumpulkan data, menyajikan
data, menganalisis data dan menarik kesimpulan dalam situasi ada ketidakpastian dan variasi
dalam sekumpulan data.
2.2 Pengertian Statistika Deskriptif
Secara garis besar statistika dapat dibedakan menjadi dua bagian, yaitu statistika
deskriptif dan statistika inferensia. Statistika deskriptif merupakan bagian dari statistika yang
membahas tentang bagaimana merangkum sekumpulan data dalam bentuk yang mudah
dibaca dan cepat memberikan informasi, yang disajikan dalam bentuk tabel, grafik, nilai
pemusatan dan nilai penyebaran. Penekanan pada statistika deskriptif pada umumnya
diberikan pada pengumpulan dan penataan data serta penggunaan pengukuran–pengukuran
yang sifatnya merupakan penyederhanaan. Misalnya rata–rata, modus dan sebagainya.
Yang perlu diperhatikan dalam hal ini, statistika deskriptif hanya merupakan teknik
pengumpulan, pengolahan, sampai penyajian data, dan tidak termasuk penarikan kesimpulan
terhadap suatu data yang lebih besar ruang lingkupnya.
2.3 Macam Statistika Deskriptif
2.3.1 Ukuran pemusatan
1. Mean atau Rata-rata
Mean adalah hasil pembagian antara jumlahan nilai setiap pengamatan dengan
jumlah data pengamatan. Mean disebut juga sebagai rata–rata hitung. Mean
dirumuskan sebagai berikut:
Untuk data tunggal:
Keterangan:
X = Rata – rata
X =
∑i=1
n
xi .
n
x i = Data
n = Banyaknya kelas
Untuk data berkelompok:
Keterangan:
X = Rata – rata
x i = Nilai tengah
∑i=1
n
f i= Jumlah seluruh frekuensi
2. Median
Adalah nilai tengah dari segugus data yang telah diurutkan mulai yang terkecil
sampai terbesar atau sebaliknya. Dengan kata lain, median adalah nilai yang tepat di
tengah jika banyaknya data ganjil atau rata-rata dari dua nilai yang berada di tengah
jika banyaknya data genap.
Untuk data tunggal:
Jika banyak data ganjil:
Jika banyak data genap:
Untuk data berkelompok:
Keterangan:
Me = Median
Lmed = Batas bawah kelas median
n = banyaknya data
fe = jumlah frekuensi sebelum kelas median
X =
∑i=1
n
xi . f i
∑ f i
Me = lmed +
12
n−∑ f e
f mi
fm = frekuensi median
i = lebar kelas
3. Modus
Adalah nilai yang paling sering terjadi atau paling banyak muncul (mempunyai
frekuensi paling tinggi).
Untuk data berkelompok:
Keterangan :
Mo = Modus
lmo = Batas bawah kelas modus
d1 = selisih frekuensi kelas modus dengan frekuensi kelas sebelumnya
d2 = selisih frekuensi kelas modus dengan frekuensi kelas berikutnya
i = Lebar kelas
2.3.2 Ukuran Penyebaran
1. Varians
Adalah rata-rata kuadrat selisih atau kuadrat simpangan dari semua nilai data
terhadap rata-rata hitung.
Keterangan:
S2 = Varians
n = Banyaknya data
Xi = Nilai data ke-i
X = Nilai rata rata
2. Standart Deviasi
Adalah akar pangkat dua dari varians, standart deviasi sering disebut simpangan
baku.
Mo = lmod +
d1
d1+d2i
S2= 1n−1∑i=1
n
(X i−X )2
Rumus:
Keterangan:
σS = Simpangan baku
n = Banyaknya data
Xi = Nilai data ke i
X = Nilai rata rata
3. Kuartil
Adalah nilai-nilai yang membagi segugus pengamatan menjadi 4 bagian sama
besar.
Untuk data berkelompok:
Keterangan:
Qt = Kuartil ke-t
LQ = Batas bawah kelas kuartil
n = banyaknya data
fe = jumlah frekuensi sebelum kelas kuartil
fQ = frekuensi kuartil
i = lebar kelas
4. Range
Adalah selisih atau jarak antara nilai maksimum dengan nilai minimum.
Rumus: R = Xmax – Xmin
S=√∑i=1
n
(x i−x )2
n
Qt = lQt +
t4
n−∑ f e
f Qi
2.3.3 Pengertian Histogram
Adalah kumpulan persegi panjang yang masing-masing mempunyai alas pada sumbu
mendatar yang lebarnya sama dengan lebar selang kelas dan luasnya sebanding dengan
frekuensi kelas.
2.3.4 Pengertian Pie Chart
Adalah suatu cara untuk menggambarkan data dengan grafik lingkaran, dimana
lingkaran itu dibagi menjadi beberapa bagian sesuai dengan kepentingan. Tiap bagian
menunjukkan karakteristik data yang terlebih dahulu diubah menjadi derajat.
2.4 Distribusi Sampling
Distribusi sampling adalah distribusi peluang dari statistik. Statistik merupakan suatu
nilai numerik yang dihitung dari sampel. Pengertian sampling menunjukkan distribusi
peluang diambil dari sampel secara berulang-ulang. Dengan kata lain, distribusi sampling
dapat dikatakan sebagai distribusi statistik. Contoh distribusi sampling yang sering digunakan
adalah distribusi sampling rata-rata, distribusi sampling proporsi dan distribusi sampling
varians.
2.4.1 Distribusi Sampling Rata-rata
Distribusi sampling pertama yang paling penting yang akan dibahas adalah distribusi
sampling rata-rata. Misalkanlah sampel acak n pengamatan diambil dari populasi normal
dengan rataan µ dan variansi σ2. Tiap pengamatan Xi, i=1,2,...,n, dari sampel acak tersebut
akan berdistribusi normal yang sama dengan populasi yang diambil sampelnya.
X=X1+X 2+.. .+X n
n
Distribusi X akan berdistribusi normal dengan rataan
μx=μ1+μ2+. ..+μn
n=μ
dan variansi
σ x2=
σ12+σ2
2+. . .+σn2
n2 =nσ 2
n2 =σ2
n
σ x=σ√n
Untuk ukuran sampel yang besar (n ≥ 30) atau nilai varians populasi (σ2) diketahui,
berlaku Teorema Limit Pusat.
z= x−μσ /√n
Untuk ukuran sampel yang kecil (n < 30) dan nilai varians populasi (σ2) tidak
diketahui, yang diketahui adalah nilai varians sampel (s2), maka digunakan distribusi t,
dengan derajat bebas v = n – 1.
t= x−μs /√n
2.4.2 Distribusi Sampling Proporsi
Statistik proporsi dalam suatu percobaan pada populasi dilambangkan dengan p=x /n
. Distribusi p berdistribusi hampir normal dengan rataan.
μ p=E ( P )=E ( Xn
)= 1n
E( X )=
npn = p
dan variansi
σ p2=σ x /n
2 =σ x
2
n2 =npqn2 = pq
n
Dengan demikian dapat dituliskan distribusi p dalam distribusi Z (normal baku).
z= p−p
√ pqn atau
z=
xn−p
√ pqn
2.4.3 Distribusi Sampling Varians
Bila sampel acak berukuran n diambil dari populasi normal dengan rataan µ dan
varians σ2, dan varians sampel s2 dihitung, maka diperoleh suatu nilai statistik S2.
Distribusi sampling varians ini hanya sedikit kegunaannya dalam praktek.
Distribusi sampling varians akan mengikuti distribusi Chi-Square dengan peubah
acak χ2, dengan derajat kebebasan v = n – 1.
χ2=(n−1)S2
σ2
2.5 Penaksiran Parameter
2.5.1 Pengertian Penaksiran Parameter
Dalam statistika, populasi dipelajari berdasarkan data yang diambil secara sampling.
Dan mengingat berbagai faktor, lebih baik mengambil sebuah sampel yang representatif
lalu berdasarkan pada hasil analisis terhadap data sampel, kesimpulan mengenai populasi
dapat dibuat. Kelakuan populasi yang akan ditinjau salah satunya adalah mengenai
parameter populasi dan sampel yang menggunakan sampel acak. Data sampel dianalisis,
nilai-nilai statistik dihitung dan dari nilai-nilai statistik ini dapat disimpulkan bagaimana
parameter bertingkah laku. Cara pengambilan kesimpulan tentang parameter yang
dipelajari adalah sehubungan dengan cara-cara menaksir harga parameter.
Penaksiran adalah suatu proses penaksiran suatu kasus yang diterapkan dalam suatu
distribusi tertentu, yang dapat memenuhi dan menyelesaikan kasus tersebut dengan suatu
selang kepercayaan tertentu dan memiliki nilai galat tertentu. Salah satu distribusi yang
memenuhi dan menyelesaikan suatu kasus tertentu adalah distribusi normal yang
merupakan dasar seluruh distribusi, sebab apabila dalam suatu populasi terdapat ruang
sampel yang memiliki distribusi ruang sampel pada n lebih besar, maka distribusinya
akan mendekati distribusi normal (central limit theorem).
2.5.2 Jenis-Jenis Penaksiran
1. Penaksiran Titik
Penaksiran titik adalah suatu metode untuk menaksir nilai parameter populasi
dalam satu titik tertentu. Penaksiran titik sangat sederhana dan mudah dihitung, tetapi
ketepatannya diragukan. Dikatakan demikian, karena jarang terjadi bahwa nilai
parameter populasi sama persis dengan statistik sampel.
2. Penaksiran Interval
Penaksiran interval merupakan suatu metode untuk menaksir parameter populasi
dalam bentuk interval antara dua titik. Artinya nilai parameter ditaksir antara dua
harga atas dasar interval keyakinan (confidence interval) tertentu. Ukuran batas
keyakinan (confidence limit) biasanya dinyatakan dalam %.
2.5.3 Selang Kepercayaan
Dalam bidang penaksiran terdapat derajat ketelitian nilai taksiran yang berasal dari
pengetahuan distribusi sampling bagi populasi. Dan juga terdapat ruang keputusan yang
merupakan himpunan semua kemungkinan nilai taksiran yang dapat diambil oleh suatu
penaksir. Ada beberapa sifat-sifat penaksiran yang harus diketahui, misalnya penaksiran
takbias (dalam definisi ragam contoh suatu kasus yang memiliki n lebih kecil, maka
dalam rumus ragam tersebut harus dibagi dengan n – 1 dan bukan n dan kasus tersebut
menginginkan E(S2)=σ2
, statistik Θ¿
¿ dikatakan penaksiran takbias bagi parameter θ bila
μΘ¿
=E¿¿¿
θ dan penaksiran paling efisien (diantara semua kemungkinan penaksiran
takbias bagi parameter θ, yang ragamnya terkecil adalah penaksir paling efisien bagi θ).
2.5.4 Penaksiran Parameter Rata-Rata untuk Satu Populasi
Salah satu penduga titik bagi rata-rata populasi μ adalah statistik x−
. Distribusi
sampling X berpusat di μ, dan dalam sebagian besar penerapannya variansnya lebih kecil
daripada varians penduga-penduga lainnya. Jadi rata-rata contoh x akan digunakan
sebagai nilai dugaan titik bagi rata-rata populasi μ.
1. Untuk nilai varians σ2 diketahui
Bila x−
adalah rata-rata sampel acak berukuran n yang diambil dari suatu populasi
dengan varians σ2 diketahui, maka selang kepercayaan (1-α)100% bagi μ adalah
x−
- zα/2
σ√n < μ < x
−
+ zα/2
σ√n
Dengan zα/2 adalah nilai z yang luas daerah di sebelah kanan di bawah kurva
normal baku adalah α/2.
2. Untuk nilai varians σ2 tidak diketahui dengan n kecil (n<30)
Jika σ tidak diketahui dan μ untuk sampel berukuran kecil, selang kepercayaannya
adalah sebagai berikut :
x−
- tα/2
s√n < μ < x
−
+ tα/2
s√n
Dengan tα/2 adalah nilai t dengan v = n-1 derajat bebas yang disebelah kanannya
terdapat daerah seluas α/2.
2.5.5 Penaksiran Parameter Rata-Rata untuk Dua Populasi
Bila terdapat dua populasi dengan rata-rata μ1 dan μ2 diberikan oleh statistik x1
−
-x−
2 .
Oleh karena itu untuk mendapatkan nilai dugaan titik bagi μ1-μ2, diambil dua sampel acak
bebas, satu dari masing-masing populasi, yang berukuran n1 dan n2, kemudian
menghitung selisih kedua rata-rata contoh x1
−
-x−
2 .
1. Untuk σ 12
dan σ 22
diketahui
Jika μ1-μ2 ; σ 12
dan σ 22
diketahui, maka selang kepercayaan (1-α)100% bagi μ1-μ2
adalah
(x1
−
-x−
2 ) - zα/2 √ σ12
n1+ σ2 2
n2 < μ1-μ2 < (x1
−
-x−
2 ) + zα/2 √ σ12
n1+ σ2 2
n2
Dalam hal ini zα/2 adalah nilai peubah normal baku z yang luas daerah di sebelah
kanannya sebesar α/2.
2. Untuk n kecil (n<30), nilai σ 12
dan σ 22
tidak diketahui dengan asumsi σ 12
=
σ 22
Selang kepercayaan (1-α)100% bagi μ1-μ2 untuk sampel berukuran kecil (n<30)
dan σ 12
= σ 22
tetapi nilainya tidak diketahui adalah :
(x1
−
-x−
2 ) - tα/2 Sp√ 1
n1+ 1
n2 < μ1-μ2 < (x1
−
-x−
2 ) + tα/2 Sp √ 1
n1+ 1
n2
Sedangkan Sp adalah nilai dugaan gabungan bagi simpangan baku populasi, yang
dapat dihitung dengan Sp
2=(n1−1 )S1
2+(n2−1 )S22
n1+n2−2 .
Dan tα/2 adalah nilai t dengan v = n1 + n2 -2 derajat bebas yang luas daerahnya
disebelah kanannya sebesar α/2.
3. Untuk n kecil (n<30), nilai σ 12
dan σ 22
tidak diketahui dengan asumsi σ 12
≠
σ 22
Selang kepercayaan (1-α)100% bagi μ1-μ2 untuk sampel berukuran kecil (n<30)
dan σ 12
≠ σ 22
tetapi nilainya tidak diketahui adalah :
(x1
−
-x−
2 ) - tα/2 √ S12
n1+
S22
n2 < μ1-μ2 < (x1
−
-x−
2 ) + tα/2 √ S12
n1+
S22
n2
Dengan tα/2 adalah nilai distribusi t dengan derajat kebebasan
v=(S1
2/n1+S22/n2)
2
[(S12 /n1)
2 /(n1−1) ]+[(S22/n2)
2 /(n2−2) ]
2.6 Pengujian Hipotesis
Pengujian hipotesis merupakan metode statistika yang dapat digunakan untuk membantu
dalam penarikan kesimpulan. Kesimpulan statistika tidaklah harus menjadi kesimpulan untuk
mengambil keputusan. Penarikan kesimpulan mengandung arti ketidakpastian. Metode
statistika hanya memberikan bantuan dalam mengurangi sebagian ketidakpastian itu, tetapi
tidaklah menghilangkan sama sekali adanya ketidakpastian.
2.7 Hipotesis Statistik
Hipotesis statistik adalah suatu anggapan atau pernyataan, yang mungkin benar atau
tidak, mengenai satu populasi atau lebih. Kebenaran atau ketidak benaran suatu hipotesis
statistik tidak pernah diketahui dengan pasti karena hipotesis itu diambil sampel acak dari
populasi yang ingin diselidiki dan dengan menggunakan informasi yang terkandung dalam
sampel itu. Hipotesis yang dirumuskan dengan harapan untuk ditolak disebut hipotesis nol
dan dinyatakan dengan H0. Penolakan H0 mengarah pada penerimaan suatu hipotesis
tandingan yang dinyatakan dengan H1 . Jadi, bila H0 menyatakan hipotesis nol p = 0,5 untuk
populasi binomial, hipotesis tandingan H1 mungkin salah satu dari p = 0,75, p > 0,5, p < 0,5
atau p ≠ 0,5.
Galat Jenis I dan Jenis II
a. Galat jenis I adalah penolakan hipotesis nol yang benar (menolak H0 dan menerimaH1 ,
padahal H0 yang benar). Peluang melakukan galat jenis I disebut taraf keberartian uji dan
dinyatakan denganα . Contoh, galat jenis I akan terjadi bila 9 atau lebih tidak terserang
virus dalam waktu melebihi dua tahun dengan menggunakan vaksin baru padahal
sesungguhnya vaksin baru itu sama dengan vaksin yang lama. Jadi, X menyatakan
banyaknya orang yang tetap sehat selama paling sedikit dua tahun.
Rumus :
μ=npσ=√npq
Ζ=x−μσ
Sehingga, α = P(galat jenis I)
= P(X > x | H0 benar)
b. Galat jenis II adalah penerimaan hipotesis nol yang salah (menerima H0 padahal
sebenarnya hipotesis itu salah). Peluang melakukan galat jenis II, dinyatakan dengan β ,
tidak mungkin dihitung kecuali bila hipotesis tandingannya ditentukan secara khusus.
Bila hipotesis nol p = ¼ diuji lawan hipotesis tandingan p = ½, maka dapat dihitung
peluang menerima H0 bila H0 salah.
Rumus :
μ=npσ=√npq
Ζ=x−μσ
Sehingga, β = P(galat jenis II)
= P(X < x | H1 benar)
Sifat penting dari galat jenis I dan jenis II :
1. Galat jenis I dan jenis II berkaitan. Memperkecil peluang yang satu biasanya
memperbesar peluang yang lain.
2. Ukuran daerah kritis, jadi juga peluang melakukan galat jenis I, selalu dapat
diperkecil dengan menyesuaikan nilai (nilai-nilai) kritis.
3. Menaikkan ukuran sampel n akan memperkecil α dan β secara serentak.
4. Bila hipotesis nol salah, β akan mencapai maksimum bila nilai parameter
sesungguhnya dekat dengan nilai yang dihipotesiskan. Makin besar jarak antara nilai
sesungguhnya dengan nilai yang dihipotesiskan, makin kecil pulaβ .
2.8 Uji Satu Arah dan Uji Dua Arah
a. Uji satu arah adalah uji hipotesis statistik dengan tandingan yang berarah satu seperti :
H0 : θ = θ0 , H1 : θ > θ0 atau H0 : θ = θ0 , H1 : θ < θ0 . Seluruh daerah kritis untuk
hipotesis tandingan θ > θ0 terletak di ujung kanan distribusi, sedangkan seluruh daerah
kritis untuk hipotesis tandingan θ < θ0 terletak di ujung kiri.
b. Uji dua arah adalah uji hipotesis satistik dengan tandingan berarah dua seperti H0 : θ =
θ0 , H1 : θ ≠ θ0 . Hipotesis tandingan menyatakan salah satu dari θ < θ0 atau pun θ >
θ0 . Nilai pada kedua ujung distribusi membentuk daerah kritis.
2.9 Uji Menyangkut Rataan dan Variansi
Masalah pengujian bahwa rataan populasi dengan variansi σ2
yang diketahui, sama
dengan nilai μ0 tertentu lawan tandingan dwiarah bahwa rataan tersebut tidak sama dengan
μ0 ; yaitu, akan diuji : H0 : μ = μ0 , H1 : μ ≠ μ0 . Distribusi sampel X−
hampir normal
dengan rataan μ
x−=μ
dan variansi σ
x−2 =σ2 ¿n
, bila μ dan σ2
menyatakan rataan dan
variansi populasi yang secara acak diambil sampelnya yang berukuran n. Bila digunakan taraf
keberartian α , maka dapat dicari dua nilai kritis x1
−
dan x2
−
sedemikian rupa sehingga x1
−
< X−
< x2
−
, menyatakan daerah penerimaan dan kedua ujung distribusi, yaitu X−
< x1
−
dan X−
>
x2
−
, menyatakan daerah kritis. Daerah kritis dapat dinyatakan dalam nilai z yang diberikan
oleh rumus :
Ζ=x−
−μ0
σ /√n
Langkah-langkah dalam pengujian suatu hipotesis mengenai parameter populasi θ
lawan suatu hipotesis tandingan dapat diringkaskan:
1. H0 : θ = θ0
2. H1 : tandingannya θ < θ0 , θ > θ0 ,θ ≠ θ0
3. Pilih daftar keberartian α
4. Pilih uji statistik yang sesuai dan cari daerah kritis
5. Hitunglah nilai statistik dari sampel acak ukuran n
6. Kesimpulan : tolak H0 bila satistik tersebut mempunyai nilai dalam daerah kritis; jika
tidak, terima H0.
2.10 Uji Normalitas Data
Untuk menguji kenormalan suatu data, digunakan Normality Test yang terdapat pada
program Minitab. Dalam uji normalitas ini, hipotesis yang digunakan adalah sebagai berikut:
H0 : data berdistribusi normal
H1 : data tidak berdistribusi normal
dengan taraf keberartian yang digunakan α=0,5.
Dalam Probability Plot yang dihasilkan dalam uji normalitas ini akan didapatkan nilai P-
Value. Jika P-Value > α maka H0 diterima, berarti data tersebut berdistribusi normal.
Sedangkan jika P-Value < α, maka H0 ditolak, yang berarti bahwa data tidak berdistribusi
normal.
2.11 Uji Kesamaan Varians
Dalam menguji kesamaam varians dua buah data, digunakan Uji 2 Variances yang
terdapat pada program Minitab. Dalam uji kesamaan varians ini, hipotesis yang digunakan
adalah sebagai berikut :
H0 : varians kedua data sama
H1 : varians kedua data tidak sama
dengan taraf keberartian yang digunakan α=0,5.
Dalam plot yang dihasilkan dari uji kesamaan varians akan didapatkan nilai P-Value.
Jika P-Value > α maka, H0 diterima, berarti kedua data tersebut mempunyai varians yang
sama. Sedangkan jika P-Value < α, maka H0 ditolak, yang berarti bahwa kedua data tersebut
mempunyai varians yang tidak sama. Kesamaan varians ini akan digunakan dalam Uji 2-
Sample t.
2.12 Regresi
Regresi adalah salah satu metode untuk menentukan tingkat pengaruh suatu variabel
terhadap variabel yang lain. Variabel yang pertama disebut dengan variabel bebas atau
variabel X (karena seringkali digambarkan dalam grafik sebagai absis, atau sumbu X).
Variabel yang kedua adalah variabel yang variabel terikat atau variabel Y. Kedua variabel ini
dapat merupakan variabel acak (random), namun variabel yang dipengaruhi harus selalu
variabel acak.
Dalam analisis regresi diperlukan asumsi-asumsi terhadap data residual (jarak vertikal
titik-titik pada garis regresi dengan titik-titik hasil pengamatan) sebagai berikut:
1. Data residual identik, tidak terlalu berbeda jauh.
2. Data residual independent, tidak berhubungan satu sama lain.
3. Data residual berdistribusi normal.
2.13 Persamaan Regresi
Persamaan regresi adalah persamaan matematik yang memungkinkan kita meramalkan
nilai-nilai suatu variabel terikat dari nilai-nilai satu atau lebih variabel bebas.
Untuk regresi sederhana, digunakan model regresi linier. Persamaan regresi linier ini
dituliskan dalam bentuk
y=β0+β1 x
Untuk menentukan nilai β0 dan β1 berdasarkan data sampel yang diketahui, digunakan
suatu metode yang dinamakan metode kuadrat terkecil. Metode ini memilih suatu garis
regresi yang membuat jumlah kuadrat jarak vertikal dari titik-titik pengamatan ke garis
regresi tersebut sekecil mungkin. Jarak ini dinamakan residual dan dilambangkan dengan ei
Metode kuadrat terkecil menghasilkan rumus untuk menghitung β0 dan β1 sehingga
jumlah kuadrat semua residual tersebut minimum. Dari metode ini didapatkan rumus untuk
menentukan nilai β0 dan β1.
β1=
n∑i=1
n
x i y i−(∑i=1
n
x i)(∑i=1
n
y i)n∑
i=1
n
xi2−(∑
i=1
n
xi)2
Sedangkan nilai β0 dapat dihitung dengan rumus di bawah ini.
β0= y−β1 x
2.14 Uji Parsial
Uji parsial digunakan untuk menguji apakah koefisien regresi mempunyai pengaruh
yang signifikan. Rumusan hipotesisnya :
H0 : j = 0
H1 : j 0, j = 0,1
Statistik uji yang digunakan adalah
t=bi
Sb i
dan
dimana bi = nilai dugaan i
Kemudian thitung dibandingkan dengan nilai tabel distribusi t dengan derajat bebas (n-2)
dan tingkat signifikansi .
S y . x=√ SSEn−1−k
=√ (Y −Y )2
n−1−kSb=
S y . x
√∑ X2−(∑ X )2
n
2.15 Uji Serentak
Untuk mengetahui apakah koefisien yang ada dalam model secara serentak nyata atau
tidak, digunakan uji F, dengan hipotesisnya sebagai berikut :
H0 : β0=β1=0
H1 : H0
Statistik uji yang digunakan adalah :
F= SSR /kSSE /(n−1−k )
Dimana nilai Fhitung yang didapat dibandingkan dengan F (V1,V2) dengan derajat bebas V1 =
k, V2 = n-k-1 dan tingkat signifikansi . Apabila Fhitung F (k, n-k-1), maka H0 ditolak, yang
berarti paling sedikit ada satu j yang tidak sama dengan nol.
2.16 Koefisien Determinasi (R2)
Koefisien determinasi didapat dari analisis regresi dengan menggunakan minitab.
Apabila R2 bernilai di atas 75% dapat dijelaskan bahwa nilai variabel Y yang berada di atas
75% tersebut dapat dijelaskan oleh variabel- variabel bebas yang ada dalam model.
Sedangkan sisanya yang berada di bawah 75% dijelaskan oleh variabel-variabel yang tidak
ada dalam tabel. Tingginya nilai R2 ini menandakan baiknya model yang telah didapatkan,
artinya model telah sesuai dan antar variabel pada model tersebut mempunyai korelasi yang
sama.
2.17 Uji Kebebasan
Untuk menentukan ada tidaknya hubungan antara dua variabel, dilakukan uji kebebasan
dengan uji chi square. Dalam menentukan uji kebebasan ini, terlebih dahulu dibuat tabel 3.1
seperti di bawah ini.Tabel 3.1 Tabel Kontingensi
X1 x2 . . . xj
y1 n11 n12 . . . n1j n1.
Y2 n21 n22 . . . n2j n2.
. . . . . .
.
.
.
.
.
.
.
.
.
..
.
yj ni1 ni2 .... nij ni.
n.1 n.2 .... n.j n..
Dari tabel tersebut, kita menentukan nilai frekuensi harapan yang akan digunakan untuk
menghitung statistik uji.
Rumus frekuensi harapan tersebut adalah
e ij=ni . xn. j
n . .
Keterangan :
eij : frekuensi harapan baris ke i kolom ke j.
ni. : jumlah frekuensi pada baris ke i
n.j : jumlah frekuensi pada kolom ke j
n.. : jumlah seluruh frekuensi pengamatan.
Dalam uji kebebasan ini, hipotesis yang digunakan adalah :
H0 : kedua variabel independen (saling bebas)
H1 : kedua variabel dependen (saling berhubungan).
Daerah kritis yang digunakan dalam uji ini adalah χ2> χα , v
2, dengan nilai derajat bebas
v = (b-1)(k-1)
Keterangan :
b : jumlah baris
k : jumlah kolom
Sedangkan statistik uji yang digunakan dalam uji chi square adalah sebagai berikut :
χhitung2 =∑
j
k
∑i
b (oij−eij )2
e ij
Jika nilai statistik uji yang didapatkan berada di daerah kritis, maka H0 ditolak, sehingga
kedua variabel memiliki hubungan.