13
Rendy Dwi Ardiansyah Putra 7410040018 / 2 D4 IT A Statistika Resume Regresi Linear dan Korelasi 1. Regresi Linear Regresi linear merupakan suatu metode analisis statistik yang mempelajari antara dua atau lebih variabel. Pada kenyataan sehari-hari sering dijumpai sebuah dipengaruhi oleh lebih dari satu variabel, oleh karenanya selain regresi linear s dikembangkan analisis regresi linier berganda. 1. Regresi Linear Sederhana Regresi linear sederhana adalah regresi yang hanya terdiri darisatuvariabel dependen dan satu variabel independen. Regresi linear sederhana digun mengetahui hubungan nilai satuvariabel bebas dan satuvariabel terikat melalui persamaan regresi. Bentuk dari persamaaan regresi linear sederhana adalah: di mana: a = konstanta (atau intersep) populasi b = koefisien regresi populasi Y = variabel terikat X = variabel bebas 2. Regreasi Linear Berganda Regresi linear berganda adalah regresi dimana variabel terikatnya (Y) dihubungkan atau dijelaskan lebihdari satu variabel bebas (X1, X 2,...., X n) namun masih menunjukkandiagram hubungan yang linear. Regresi linear bergandadigunakan untuk mengetahui hubungan nilai beberapa variabel bebas dan satu var melalui persamaan regresi.

Resume Regresi Linear Dan Korelasi

Embed Size (px)

Citation preview

Rendy Dwi Ardiansyah Putra 7410040018 / 2 D4 IT A Statistika

Resume Regresi Linear dan Korelasi1. Regresi Linear Regresi linear merupakan suatu metode analisis statistik yang mempelajari pola hubungan antara dua atau lebih variabel. Pada kenyataan sehari-hari sering dijumpai sebuah kejadian dipengaruhi oleh lebih dari satu variabel, oleh karenanya selain regresi linear sederhana juga dikembangkan analisis regresi linier berganda.

1.

Regresi Linear Sederhana Regresi linear sederhana adalah regresi yang hanya terdiri dari satu variabel dependen dan satu variabel independen. Regresi linear sederhana digunakan untuk mengetahui hubungan nilai satu variabel bebas dan satu variabel terikat melalui persamaan regresi. Bentuk dari persamaaan regresi linear sederhana adalah:

di mana: a = konstanta (atau intersep) populasi b = koefisien regresi populasi Y = variabel terikat X = variabel bebas 2. Regreasi Linear Berganda Regresi linear berganda adalah regresi dimana variabel terikatnya (Y) dihubungkan atau dijelaskan lebih dari satu variabel bebas (X1, X2,...., Xn) namun masih menunjukkan diagram hubungan yang linear. Regresi linear berganda digunakan untuk mengetahui hubungan nilai beberapa variabel bebas dan satu variabel terikat melalui persamaan regresi.

Bentuk dari persamaaan regresi linear berganda adalah:

di mana: a = b = Y = X = k = konstanta (atau intersep) populasi koefisien regresi populasi variabel terikat variabel bebas jumlah variabel bebas

Analisis Regresi Linear Sederhana Analisis regresi linear adalah suatu analisis terhadap persamaan regresi dimana hubungan variabel bebas dan variabel tidak bebas berbentuk garis lurus. Kata sederhana dalam regresi linear sederhana mengandung arti bahwa variabel yang dibicarakan hanya menyangkut satu variabel bebas dan satu variabel tidak bebas saja.

Persamaan Garis Regresi Linear Sederhana Bentuk dari persamaaan garis regresi linear sederhana adalah:

di mana: a b Y X = konstanta (atau intersep) populasi = koefisien regresi populasi = variabel terikat = variabel bebas

Nilai a dan b dapat dicari dengan persamaan berikut:

Atau dengan persamaan normal, nilai a dan b juga dapat dicari dengan:

Keterangan: X, Y = variabel a, b = bilangan konstanta Kesalahan Baku Regresi dan Koefisien Regresi Sederhana Kesalahan baku atau selisih taksir standard merupakan indeks yang digunakan untuk mengukur tingkat ketepatan regresi (pendugaan) dan koefisien regresi (penduga) atau mengukur variasi titik-titik observasi di sekitar garis regresi. Untuk regresi, kesalahan bakunya dirumuskan:

Keterangan : Se = kesalahan baku regresi Sa = koefisien regresi a (penduga a) Sb = koefisien regresi b (penduga b) X, Y = variabel a,b = konstanta n = jumlah sampel

Pengujian Statistik Regresi Linear Sederhana Ukuran proporsi keragaman total nilai peubah Y yang dapat dijelaskan oleh nilai peubah X melalui hubungan linear. Penetapan dan interpretasi koefisien korelasi dan koefisien determinasi dirumuskan sebagai berikut: Koefisien Korelasi (r)

Dimana: r = koefisien korelasi pearson n = jumlah sampel X, Y = variabel

Koefisien Determinasi

Dimana: R = koefisien determinasi

Langkah-langkah pengujian statistik regresi linear sederhana dengan menggunakan rumus sebagai berikut: Rumus Uji Statistik Keterangan: t0 r2 = nilai t hitung

r = koefisien korelasi = koefisien determinasi

Rumus uji statistik untuk tiap parameter A dan B adalah sebagai berikut:

Keterangan: ta ; tb = nilai t hitung

a ; b = konstanta regresi Sa ; Sb = kesalahan baku penduga a dan b

Keterangan: Z0 = nilai Z hitung

Rumus tabel anova

Analisis of Variance untuk Regresi Linear Sederhana

2. Pengertian Korelasi Korelasi merupakan salah satu teknik statistik yang digunakan untuk mencari hubungan antara dua variabel atau lebih, yang sifatnya kuantitatif. Teknik korelasi merupakan teknik analisis yang melihat kecenderungan pola dalam satu variabel berdasarkan kecenderungan pola dalam variabel yang lain. Ketika satu variabel memiliki kecenderungan untuk naik maka akan terlihat kecenderungan dalam variabel yang lain apakah naik, turun, atau tidak menentu. Jika kecenderungan dalam satu variabel selalu diikuti oleh kecenderungan dalam variabel lain, kita dapat mengatakan bahwa kedua variabel ini memiliki hubungan atau korelasi.

Asumsi Dasar Korelasi Agar dapat menghitung besar korelasi antar variabel, harus terpenuhi asumsi dasar korelasi. Asumsi-asumsi tersebut antara lain:

1. Kedua variabel bersifat independen satu dengan lainnya, artinya masingmasing variabel berdiri sendiri dan tidak tergantung pada satu variabel dengan variabel lainya

2. Data untuk kedua variabel berdistribusi normal. Data yang mempunyai distribusi normal artinya data yang distribusinya simetris sempurna (kurva berbentuk lonceng). Menurut Johnston (2004) ciri-ciri data yang mempunyai distribusi normal adalah sebagai berikut: a. Kurva frekuensi normal menunjukan frekuensi tertinggi berada di tengahtengah, yaitu berada pada rata-rata (mean) nilai distribusi dengan kurva

sejajar dan tepat sama pada bagian sisi kiri dan kanannya. b. Kurva normal berbentuk simetris sempurna. c. Disebabkan dua bagian sisi dari tengah-tengah adalah simetris, maka frekuensi nilai-nilai diatas rata-rata (mean) nilai dibawah rata-rata. d. Frekuensi total semua nilai dalam populasi akan berada dalam area dibawah kurva. sama dengan frekuensi nilai-

Macam-Macam Korelasi Korelasi dibagi menjadi dua jenis, yaitu : 1. Korelasi Sederhana Korelasi sederhana adalah korelasi yang digunakan untuk mengetahui keeratan hubungan antara dua variabel dan untuk mengetahui arah hubungan yang terjadi. Koefisien korelasi sederhana menunjukkan seberapa besar hubungan yang terjadi antara dua variabel.

2. Korelasi Parsial Korelasi parsial adalah korelasi yang digunakan untuk mengetahui hubungan antara dua variabel di mana variabel lainnya dianggap berpengaruh dikendalikan atau dibuat tetap (sebagai variabel kontrol).

Pengertian Koefisien Korelasi Ukuran yang digunakan untuk mengukur derajat hubungan (korelasi) linear disebut koefisien korelasi (correlation coefficient) yang dinyatakan dengan notasi r yang sering dikenal dengan nama koefisien korelasi Pearson atau Product Moment Coefficient of Correlation

Jenis- jenis Koefisien Korelasi Jenis-jenis koefisien korelasi yang sering digunakan berdasarkan jenis datanya terdiri dari uji korelasi Pearson (product moment), uji korelasi Rank Spearman dan uji korelasi Rank Kendall. Perbedaan antara ketiga uji tersebut adalah :

1. Korelasi Pearson (Product Moment) Korelasi ini digunakan jika sampel datanya lebih dari 30 data (sampel besar), jenis datanya adalah interval dan rasio, dan data berdistribusi normal Rumus dari korelasi ini adalah:

Dimana : r = koefisien korelasi X = skor variabel X Y = skor variabel Y n = besar sampel/banyaknya responden

Dalam pengujian signifikansi r, jika tabel r tidak ada, maka pengujian signifikansi r dapat dilakukan dengan menggunakan tabel t. Untuk keperluan itu, nilai r harus ditransformasi menjadi nilai t yang rumusnya sebagai berikut:

2. Korelasi Rank Spearman Korelasi Rank Spearman digunakan jika sampel datanya kurang dari 30 data (sampel kecil), jenis datanya adalah ordinal, dan data tidak berdistribusi normal. Koefisien korelasi Rank Spearman dinotasikan rs. Dalam aplikasinya, setiap data xi dan yi ditetapkan peringkat relatifnya terhadap data x dan y lainnya dari data terkecil sampai terbesar. Peringkat terkecil diberi nilai 1 dan jika terdapat data yang sama maka masing-masing nilai diberi peringkat rata-rata dari posisi yang seharusnya. Korelasi Rank Spearman dapat dihitung dengan rumus:

dimana : rs : Korelasi Rank Spearman n : Jumlah Sampel

3. Koefisien Korelasi Bersyarat (Koefisien Kontingensi) Koefisien korelasi bersyarat digunakan untuk data kualitatif. Data kualitatif adalah data yang tidak berbentuk angka-angka, tetapi berupa kategori-kategori, misalnya data yang berkategorikan kurang, cukup, sangat cukup atau tinggi, menengah atau sedang, rendah, atau gejala-gejala yang bersifat nominal (data nominal). Seperti halnya koefisien korelasi data kuantitatif, koefisien korelasi bersyarat ini disimbolkan C dan mempunyai interval nilai antara -1 dan 1(-1C1). Koefisien korelasi bersyarat dirumuskan:

Keterangan: 2 = C = kai kuadrat koefisien korelasi bersyarat

n =jumlah semua frekuensi

4. Koefisien Penentu (KP) atau Koefisien Determinasi (R2) Jika koefisien korelasi dikuadratkan akan menjadi koefisienpenentu (KP) atau koefisien determinasi, yang artinya penyebab perubahan pada variabel Y yang datang dari variabel X, sebesar kuadrat koefisien korelasinya. Koefisien penentu ini menjelaskan besarnya pengaruh nilai suatu variabel (variabel X) terhadap naik/turunnya (variasi) nilai variabel lainnya (variabel Y). Koefisien

penentu dirumuskan:

Keterangan: KK =koefisien korelasi Jika koefisien korelasinya adalah koefisien korelasi Pearson (r) maka koefisien penentunya adalah:

Dalam bentuk rumus, koefisien penentu (KP) dituliskan:

Contoh Aplikasi Regresi linear, dan Korelasi dibidang TIK 1.SPSS

SPSS adalah sebuah program komputer yang digunakan untuk membuat analisis statistika. SPSS dipublikasikan oleh SPSS Inc. SPSS (Statistical Package for the Social Sciences atau Paket Statistik untuk Ilmu Sosial) versi pertama dirilis pada tahun 1968, diciptakan oleh Norman Nie, seorang lulusan Fakultas Ilmu Politik dari Stanford University, yang sekarang menjadi Profesor Peneliti Fakultas Ilmu Politik di Stanford dan Profesor Emeritus Ilmu Politik di University of Chicago. SPSS adalah salah satu program yang paling banyak digunakan untuk analisis statistika ilmu sosial.

SPSS digunakan oleh peneliti pasar, peneliti kesehatan, perusahaan survei, pemerintah, peneliti pendidikan, organisasi pemasaran, dan sebagainya. Selain analisis statistika, manajemen data (seleksi kasus, penajaman file, pembuatan data turunan) dan dokumentasi data (kamus metadata ikut dimasukkan bersama data) juga merupakan fitur-fitur dari software dasar SPSS.

Statistik yang termasuk software dasar SPSS: Statistik Deskriptif: Tabulasi Silang, Frekuensi, Deskripsi, Penelusuran, Statistik Deskripsi Rasio

Statistik Bivariat: Rata-rata, t-test, ANOVA, Korelasi (bivariat, parsial, jarak), Nonparametric tests Prediksi Hasil Numerik: Regresi Linear Prediksi untuk mengidentivikasi kelompok: Analisis Faktor, Analisis Cluster (two-step, K-means, hierarkis), Diskriminan.

Kelebihan SPSS SPSS mampu mengakses data dari berbagai macam format data yang tersedia seperti dBase, Lotus, Access, text file, spreadsheet, bahkan mengakses database melalui ODBC (Open Data Base Connectivity) sehingga data yang sudah ada, dalam berbagai macam format, bisa langsung dibaca SPSS untuk dianalisis. SPSS memberi tampilan data yang lebih informatif, yaitu menampilkan data sesuai nilainya (menampilkan label data dalam kata-kata) meskipun sebetulnya kita sedang bekerja menggunakan angka-angka (kode data). Misalnya untuk field Jenis Kelamin, kode angka yang digunakan adalah 1 untuk pria dan 2 untuk wanita, maka yang akan muncul di layar adalah label datanya, yaitu pria dan wanita.

SPSS memberikan informasi lebih akurat dengan memperlakukan missing data secara tepat, yaitu dengan memberi kode alasan mengapa terjadi missing data. Misalnya karena pertanyaan tidak relevan dengan kondisi responden, pertanyaan tidak dijawab, atau karena memang pertanyaannya yang harus dilompati.

SPSS melakukan analisis yang sama untuk kelompok-kelompok pengamatan yang berbeda secara sekaligus hanya dalam beberapa mouse click saja. Contohnya : mengetahui nilai minimum, maksimum dan rata-rata penjualan per kuartal per wilayah penjualan secara bersamaan pada masing-masing kelompok produk.

mengetahui hal-hal yang signifikan berpengaruh terhadap volume penjualan (apakah kelompok umur konsumen, tingkat pendidikan, jenis kelamin, besar pengeluaran per bulan, dll) pada masing-masing wilayah penjualan.

SPSS mampu merangkum data dalam format tabel multidimensi (crosstabs), yaitu beberapa field ditabulasikan secara bersamaan. Contohnya : tabel persentase jumlah responden dari beberapa kelompok umur terhadap beberapa kategori produk perawatan rambut. tabel persentase jumlah responden dari beberapa tingkat pendidikan terhadap beberapa partai politik pilihan menurut beberapa wilayah pemilihan umum.

Tabel multidimensi SPSS sifatnya interaktif. Kolom tabel bisa dirubah menjadi baris tabel dan sebaliknya. Semua nilai dalam sel-sel tabel akan disesuaikan secara otomatis. Hal ini sangat memudahkan pekerjaan eksplorasi data.