5
Memilih Transformasi Data dengan STATA Memilih jenis transformasi data merupakan kegiatan yang kadang sangat membosankan, sebab memaksa kita untuk melakukan percobaan berkali-kali untuk menentukan transformasi apa yang tepat pada data yang tidak berdistribusi normal. Namun dengan adanya aplikasi Statistik, kebosanan itu sedikit berkurang. Apalagi dengan aplikasi STATA, sebab aplikasi statistik yang satu ini telah dibekali dengan satu fitur, yaitu mendeteksi kenormalan data secara otomatis. Deteksi tersebut dapat dilakukan dengan beberapa metode, antara lain: Metode Deteksi Histogram, QQ Plots dan Skewness-Kurtosis. Apa maksud keterangan di atas? tentunya anda bertanya-tanya. Baiklah, kami berikan sebuah ilustrasi: Anda akan melakukan sebuah uji parametris yang mengharuskan data anda pada variabel berdistribusi normal. Ciri-ciri data berdistribusi normal antara lain: berdasarkan nilai uji normalitas skewness-kurtosis menunjukkan p value > 0,05, histogram berbentuk kurve normal dan dalam Normal QQ Plots, plots yang ada mengikuti garis fit line. Ada saatnya data anda ternyata tidak berdistribusi normal dan anda menginginkan untuk melakukan transformasi. Kemudian anda pusing untuk memilih transformasi apa yang dapat membuat data anda berubah menjadi normal. Nah, disinilah STATA memberikan kemudahan karena hanya dengan satu kali klik, kita sudah dapat menentukan metode transformasi apa yang tepat. Agar anda mudah memahami tutorial ini, sebaiknya anda pelajari artikel kami: 1. Transformasi Data 2. Normalitas Pada STATA 3. Normalitas Pada SPSS 4. Normalitas Pada Minitab

Memilih Transformasi Data dengan STATA.docx

Embed Size (px)

Citation preview

Memilih Transformasi Data dengan STATA

Memilih jenis transformasi data merupakan kegiatan yang kadang sangat membosankan, sebab memaksa kita untuk melakukan percobaan berkali-kali untuk menentukan transformasi apa yang tepat pada data yang tidak berdistribusi normal. Namun dengan adanya aplikasi Statistik, kebosanan itu sedikit berkurang. Apalagi dengan aplikasi STATA, sebab aplikasi statistik yang satu ini telah dibekali dengan satu fitur, yaitu mendeteksi kenormalan data secara otomatis. Deteksi tersebut dapat dilakukan dengan beberapa metode, antara lain: Metode Deteksi Histogram, QQ Plots dan Skewness-Kurtosis.

Apa maksud keterangan di atas? tentunya anda bertanya-tanya. Baiklah, kami berikan sebuah ilustrasi: Anda akan melakukan sebuah uji parametris yang mengharuskan data anda pada variabel berdistribusi normal. Ciri-ciri data berdistribusi normal antara lain: berdasarkan nilai uji normalitas skewness-kurtosis menunjukkan p value > 0,05, histogram berbentuk kurve normal dan dalam Normal QQ Plots, plots yang ada mengikuti garis fit line. Ada saatnya data anda ternyata tidak berdistribusi normal dan anda menginginkan untuk melakukan transformasi. Kemudian anda pusing untuk memilih transformasi apa yang dapat membuat data anda berubah menjadi normal. Nah, disinilah STATA memberikan kemudahan karena hanya dengan satu kali klik, kita sudah dapat menentukan metode transformasi apa yang tepat.

Agar anda mudah memahami tutorial ini, sebaiknya anda pelajari artikel kami:1. Transformasi Data2. Normalitas Pada STATA3. Normalitas Pada SPSS4. Normalitas Pada Minitab

Langsung saja kita masuk pada bahasan tutorial.

Kita mempunyai 1 variabel yang berdistrubusi tidak normal. Contoh seperti pada data dalam file kerja tutorial ini yang menggunakan 100 sampel.Sebaiknya untuk mempermudah anda, kami anjurkan download file kerja STATA ini:Non Normalitas.dta

Kita cek apakah data memang tidak berdistribusi normal. Berikut hasilnya dengan menggunakan uji skewness-kurtosis:

. sktest var1

Skewness/Kurtosis tests for Normality ------- joint ------ Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2-------------+--------------------------------------------------------------- var1 | 100 0.0000 0.0030 24.08 0.0000

Nilai Prob>chi2 di atas sebesar 0,0000 di mana kurang dari 0,05 berarti data berdistribusi tidak normal.

Untuk menentukan model transformasi apa yang tepat, maka pada Menu klik Statistics, klik (Summaries, tables and test), klik Distributional plots and test, klik Ladder of powers. Kemudian isi Combobox Variable dengan variabel yang akan dideteksi. Kemudian klik OK. Lihat hasilnya!

. ladder var1

Transformation formula chi2(2) P(chi2)------------------------------------------------------------------cubic var1^3 66.67 0.000square var1^2 46.01 0.000identity var1 24.08 0.000square root sqrt(var1) 14.30 0.001log log(var1) 6.83 0.0331/(square root) 1/sqrt(var1) 2.35 0.309inverse 1/var1 1.20 0.5501/square 1/(var1^2) 4.45 0.1081/cubic 1/(var1^3) 13.82 0.001

Berdasarkan hasil di atas, lihat nilai P(chi2), nilai > 0,05 menunjukkan model transformasi tersebut dapat membuat variabel berdistribusi normal.Maka model yang tepat antara lain: 1/(square root) atau inverse square root, inverse dan 1/square atau inverse square.Dari ketiga model transformasi yang tepat, model inverse memberikan nilai terbesar (0,550), maka model inverse selayaknya dipilih sebagai model transformasi pada data anda.

Untuk memperkuat penilaian anda, dapat menggunakan deteksi histogram. Caranya sebagai berikut:PadaMenuklikStatistics, klik (Summaries, tables and test), klikDistributional plots and test, klikLadder of powers histogram. Kemudian isiCombobox Variabledengan variabel yang akan dideteksi. Kemudian klikOK. Lihat hasilnya!

Dari beberapa histogram di atas, model inverse, inverse square root (1/sqrt) dan inverse square (1/square) memberikan bentuk histogram yang paling mendekati kurve normal. Dan model inverse adalah yang terbaik.

Selanjutnya kita bisa kuatkan lagi dengan deteksi Normal Quantile Plots dengan cara:PadaMenuklikStatistics, klik (Summaries, tables and test), klikDistributional plots and test, klikLadder of powers quantile-normal plots. Kemudian isiCombobox Variabledengan variabel yang akan dideteksi. Kemudian klikOK. Lihat hasilnya!

Dari beberapa normal quantile plots di atas, model inverse, inverse square root (1/sqrt) dan inverse square (1/square) memberikan bentuk di mana plot-plot mengikuti garis lurus fit line. Dan model inverse adalah yang terbaik.

Untuk membuktikan, mari kita coba melakukan transformasi dengan metode inverse kemudian dilakukan uji skewness-kurtosis. Dan ternyata hasilnya sesuai dengan deteksi di atas. Lihat di bawah ini:

Skewness/Kurtosis tests for Normality ------- joint ------ Variable | Obs Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi2-------------+--------------------------------------------------------------- var1 | 100 0.8613 0.2856 1.20 0.5498Nilai Prob>chi2 sebesar 0,5498 yang apabila dibulatkan menjadi 0,550 dimana sama persis dengan deteksi di atas.