Transcript

STUDI KASUS DALAM IBM SPSS STATISTICS VERSI 20

Oleh :Abdullah M. Jaubah

STUDI KASUS DALAM IBM SPSS STATISTICS VERSI 20Oleh :Abdullah M. Jaubah

PendahuluanStudi dan penghayatan atas buku-buku statistik dan buku-buku SPSS di Indonesia dan bahan-bahan bacaan SPSS dari Institute For Digital Research and Education dalam University of California mengungkap bahwa buku-buku tersebut adalah sangat tidak lengkap ditinjau dari sudut ruang lingkup pembahasan. Kesenjangan ini dialami jika dibanding dengan ruang lingkup pembahasan yang terkandung dalam Case Studies SPSS.Ruang lingkup pembahasan dalam Case Studies SPSS mencakup pembahasan mengenai Introduction, Statistics Base, Advanced Statistics Option, Bootstrapping Option, Categories Option, Complex Samples Option, Conjoint Option, Data Preparation Option, Decision Trees Option, Direct Marketing, Missing Values Option, Neural Networks Option, Regression Option, dan Forecasting Option. Pembahasan dalam Introduction adalah sangat singkat dan hanya menjelaskan bahwa Case Studies dalam SPSS ini menyediakan contoh-contoh tentang cara mencipta berbagai jenis analisis statistik dan cara menginterpretasikan hasil-hasil. Contoh-contoh ini tersedia untuk mereka yang telah biasa memakai operasi-operasi dasar dalam SPSS. Studi kasus ini dicinci lebih lanjut dan rincian ini adalah sangat luas dan dalam. Studi kasus SPSS ini dapat dipakai sebagai bahan studi dan penghayatan atas SPSS dan statistik.SPSS dapat dipakai untuk mengolah data hasil penelitian bersifat kualitatif, data hasil penelitian bersifat kuantitatif, dan data hasil penelitian kombinasi (mixed research). Data dan variabel berjenis kualitatif mencakup data dan variabel nominal dan data dan variabel ordinal. Data dan variabel berjenis kuantitatif mencakup data dan variabel scale. Data dan variabel berjenis kualitatif sering disebut data dan variabel kategorikal.Studi kasus SPSS ini dilaksanakan melalui pemakaian cara point and click berdasar atas menu SPSS. Langkah ini akan menghasilkan dua kelompok informasi. Salah satu kelompok informasi ini adalah perintah-perintah sintaksis SPSS. Perintah-perintah sintaksis yang dicipta melalui cara point and click ini dalam dimanfaatkan sebagai arsip sintaksis yang dapat disimpan dan dapat dipakai setiap saat diperlukan dengan cara membuka arsip sintaksis tersebut seperti membuka arsip data. Arsip sintaksis ini akan disajikan dalam Syntax Editor dan melalui menu dalam Syntax Editor arsip sintaksis itu dapat dilaksanakan dengan cara memakai perintah Run>All.Rincian Statistics BasePembahasan dalam Statistics Base mencakup pembahasan mengenai Summary Statistics Using Frequencies, Summary Statistics Using Descriptives, Exploratory Data Analysis, Analysis of cross-classifications using Crosstabs, The Summarize Procedure, The Means Procedure. The OLAP Cubes Procedure, T Tests, One-Way analysis of variance, GLM Univariate, Bivariate Correlations, Partial Correlations, Linear models, Linear regression, Ordinal Regression, Curve Estimation, Partial Least Squares Regression, Nearest Neighbor Analysis, Discriminant Analysis, Factor Analysis, TwoStep Cluster Analysis, Hierarchical Cluster Analysis, K-Means Cluster Analysis, Nonparametric Tests, Multiple Response Analysis, Measures of reliability in scale problems, Ratio Statistics, ROC Curve, Control Charts, Select Predictors, dan pembahasan mengenai Naive Bayes. Pembahasan mengenai Partial Least Square Regression dan pembahasan mengenai Nave Bayer hanya dapat dilaksanakan jika modul-modul bersangkutan diinstal. Perkembangan telah mencatat bahwa paket program khusus telah dikembangkan yaitu Visual Partial Least Square, Smart Partial Least Square, atau Wrap Partial Least Square sebagai tandingan atas paket program Lisrel dan paket program Amos yang biasa dipakai dalam Pemodelan Persamaan Struktural sebagai bagian pengembangan lebih lanjut dari analisis multivariat. Regresi Ordinal mencerminkan analisis regresi atas data berjenis kulitatif, atas data berjenis ordinal.

Rincian Advanced Statistics

Rincian Advanced Statistics mencakup pembahasan mengenai Multivariate General Linear Modeling, Generalized Linear Models, Generalized linear mixed models, Loglinear Modeling, Life Tables, Kaplan-Meier Survival Analysis, dan pembahasan mengenai Cox Regression.Pembahasan mengenai Bootstrapping juga terkandung dalam studi kasus.Rincian CategoriesPembahasan mengenai Categories mencakup pembahasan mengenai Categorical Regression, Categorical Principal Components Analysis, Nonlinear Canonical Correlation Analysis, Correspondence analysis, Multiple Correspondence Analysis, Multidimensional Scaling, dan pembahasan mengenai Multidimensional Unfolding.Rincian Complex SamplesPembahasan mengenai rincian dari Complex Samples mencakup pembahasan mengenai Planning for Complex Samples, Complex Samples Sampling Wizard, Complex Samples Analysis Preparation Wizard, Complex Samples Analysis Procedures: Tabulation, Complex Samples Analysis Procedures: Descriptives, Complex Samples Frequencies, Complex Samples Descriptives, Complex Samples Crosstabs, Complex Samples Ratios, Complex Samples General Linear Model, Complex Samples Logistic Regression, Complex Samples Ordinal Regression, dan pembahasan mengenai Complex Samples Cox Regression.Rincian ConjointRincian pembahasan mengenai Conjoint mencakup pembahasan mengenai Introduction and Methodology dan pembahasan mengenai Using Conjoint Analysis to Model Carpet-Cleaner Preference.Rincian Data PreparationRincian pembahasan mengenai Data Preparation mencakup pembahasan mengenai Validate Data, Automated Data Preparation, Identify Unusual Cases, dan pembahasan mengenai Optimal Binning.Rincian Decision TreesRincian pembahasan mengenai Decision Trees mencakup pembahasan mengenai Decision Trees, Data assumptions and requirements, Using Decision Trees to Evaluate Credit Risk, Building a Scoring Model, dan pembahasan mengenai Missing Values in Tree Models.Rincian Direct MarketingRincian pembahasan mengenai Direct Marketing mencakup pembahasan mengenai RFM Analysis, RFM Analysis from Transaction Data, Cluster analysis, Prospect profiles, Postal code response rates, Propensity to purchase, dan pembahasan mengenai Control package test.Rincian Missing Value AnalysisRincian pembahasan mengenai Missing Value Analysis mencakup pembahasan mengenai Missing Value Analysis dan pembahasan mengenai Multiple Imputation.Rincian Neural NetworksRincian pembahasan mengenai Neural Networks mencakup pembahasan mengenai Multilayer Perceptron dan pembahasan mengenai Radial Basis Function.Rincian RegressionRincian pmbahasan mengenai Regression mencakup pembahasan mengenai Binary Logistic Regression, Multinomial Logistic Regression, Nonlinear Regression, Probit Analysis, Weight Estimation, dan pembahasan mengenai Two-Stage Least-Squares Regression.Rincian ForecastingRincian pembahasan mengenai Forecasting mencakup pembahasan mengenai Time Series Modeling and Forecasting, Bulk Forecasting with the Expert Modeler, Bulk Reforecasting by Applying Saved Models, Using the Expert Modeler to Determine Significant Predictors, Experimenting with Predictors by Applying Saved Models, Seasonal Decomposition, dan pembahasan mengenai Spectral Plots.PertanyaanApakah pernyataan bahwa buku-buku statistik dan buku-buku SPSS di Indonesia dan University of California Los Angels mengungkap bahwa buku-buku tersebut adalah sangat tidak lengkap ditinjau dari sudut ruang lingkup pembahasan dapat dibuktikan bahwa pernyataan tersebut mengandung kebenaran atau ketidakbenaran?Apakah pernyataan bahwa kesenjangan ini dialami jika dibanding dengan ruang lingkup pembahasan yang terkandung dalam Case Studies SPSS dapat dibuktikan bahwa pernyataan tersebut mengandung kebenaran atau ketidakbenaran?Beberapa buku statistik dan buku SPSS dapat dipakai untuk membandingkan ruang lingkup pembahasan dalam buku-buku statistik dan buku-buku SPSS dengan ruang lingkup yang telah disajikan secara rinci di atas.Apakah terdapat buku statistik dan buku SPSS yang telah membahas Complex Samples dan Neural Networks?Kesenjangan-kesenjangan dalam buku-buku statistik dan buku-buku SPSS akan tercermin pula dalam kurikulum dan silabus Statistik yang dikuliahkan dalam berbagai Perguruan Tinggi dan kesenjangan ini akan berdampak pada kualitas dari hasil-hasil penelitian dan kualitas jurnal ilmiah yang menerbitkan hasil-hasil penelitian tersebut.Kumpulan Studi Kasus SPSSJumlah halaman jika informasi dalam studi kasus SPSS itu dikumpulkan akan mencakup lebih daripada 2500 halaman. Hal ini mencerminkan bahwa studi kasus itu banyak mengandung informasi yang bermanfaat untuk melakukan studi dan penghayatan atas statistik yang dapat dimanfaatkan dalam penelitian kualitatif, penelitian kuantitatif, dan penelitian kombinasi.Contoh Arsip SintaksisContoh arsip sintaksis yang dikumpulkan dari studi kasus tersebut adalah sebagai berikut :******************************************************** Abdullah M. Jaubah***************************************************

GET FILE='F:\SPSS\carpet.sav'.

******************************************************** Kategori***************************************************

REGRESSION /MISSING LISTWISE /STATISTICS COEFF OUTS R ANOVA /CRITERIA=PIN(.05) POUT(.10) /NOORIGIN /DEPENDENT pref /METHOD=ENTER package brand price seal money /SCATTERPLOT=(*ZRESID ,*ZPRED) /SAVE ZRESID.

* Chart Builder.GGRAPH /GRAPHDATASET NAME="graphdataset" VARIABLES=pref ZRE_1 MISSING=LISTWISE REPORTMISSING=NO /GRAPHSPEC SOURCE=INLINE.BEGIN GPL SOURCE: s=userSource(id("graphdataset")) DATA: pref=col(source(s), name("pref"), unit.category()) DATA: ZRE_1=col(source(s), name("ZRE_1")) GUIDE: axis(dim(1), label("Preference")) GUIDE: axis(dim(2), label("Standardized Residual")) SCALE: linear(dim(2), include(0)) ELEMENT: point(position(pref*ZRE_1))END GPL.

CATREG VARIABLES=pref package brand price seal money /ANALYSIS=pref(LEVEL=NUME) WITH package(LEVEL=SPORD,DEGREE=2,INKNOT=2) brand(LEVEL=SPORD,DEGREE=2,INKNOT=2) price(LEVEL=SPORD,DEGREE=2,INKNOT=2) seal(LEVEL=SPORD,DEGREE=2,INKNOT=2) money(LEVEL=SPORD,DEGREE=2,INKNOT=2) /MISSING=pref(LISTWISE) package(LISTWISE) brand(LISTWISE) price(LISTWISE) seal(LISTWISE) money(LISTWISE) /MAXITER=100 /CRITITER=.00001 /PRINT=R COEFF HISTORY OCORR CORR QUANT(package price) /INITIAL=NUMERICAL /PLOT=TRANS(package price)(20) /SAVE= RES /REGULARIZATION=NONE /RESAMPLE=NONE.

GET FILE='F:\SPSS\ozone.sav'.

CATREG VARIABLES=ozon vh ibh dpg vis temp doy /ANALYSIS=ozon(LEVEL=NUME) WITH vh(LEVEL=NOMI) ibh(LEVEL=NOMI) dpg(LEVEL=NOMI) vis(LEVEL=NOMI) temp(LEVEL=NOMI) doy(LEVEL=NOMI) /DISCRETIZATION=ibh(GROUPING,EQINTV=100) dpg(GROUPING,EQINTV=10) vis(GROUPING,EQINTV=10) temp(GROUPING,EQINTV=1.8) doy(GROUPING,EQINTV=10) /MISSING=ozon(LISTWISE) vh(LISTWISE) ibh(LISTWISE) dpg(LISTWISE) vis(LISTWISE) temp(LISTWISE) doy(LISTWISE) /MAXITER=100 /CRITITER=.00001 /PRINT=R COEFF ANOVA /INITIAL=NUMERICAL /PLOT=TRANS(ozon vh ibh dpg vis temp doy)(20) /REGULARIZATION=NONE /RESAMPLE=NONE.

GET FILE='F:\SPSS\guttman.sav'. CATPCA VARIABLES=intnsity frquency blonging proxmity formlity cluster /ANALYSIS=intnsity(WEIGHT=1,LEVEL=ORDI) frquency(WEIGHT=1,LEVEL=ORDI) blonging(WEIGHT=1,LEVEL=ORDI) proxmity(WEIGHT=1,LEVEL=ORDI) formlity(WEIGHT=1,LEVEL=ORDI) /MISSING=intnsity(PASSIVE,MODEIMPU) frquency(PASSIVE,MODEIMPU) blonging(PASSIVE,MODEIMPU) proxmity(PASSIVE,MODEIMPU) formlity(PASSIVE,MODEIMPU) /DIMENSION=2 /NORMALIZATION=VPRINCIPAL /MAXITER=100 /CRITITER=.00001 /PRINT=LOADING OBJECT /PLOT=BIPLOT(LOADING) (20) OBJECT (20) CATEGORY(intnsity frquency blonging proxmity formlity ) (20).

CATPCA VARIABLES=intnsity frquency blonging proxmity formlity cluster /ANALYSIS=intnsity(WEIGHT=1,LEVEL=ORDI) frquency(WEIGHT=1,LEVEL=ORDI) blonging(WEIGHT=1,LEVEL=ORDI) proxmity(WEIGHT=1,LEVEL=ORDI) formlity(WEIGHT=1,LEVEL=ORDI) /MISSING=intnsity(PASSIVE,MODEIMPU) frquency(PASSIVE,MODEIMPU) blonging(PASSIVE,MODEIMPU) proxmity(PASSIVE,MODEIMPU) formlity(PASSIVE,MODEIMPU) /DIMENSION=3 /NORMALIZATION=VPRINCIPAL /MAXITER=100 /CRITITER=.00001 /PRINT=LOADING OBJECT /PLOT=BIPLOT(LOADING) (20) OBJECT (20) CATEGORY(intnsity frquency blonging proxmity formlity ) (20).

Pelaksanaan arsip sintaksis di atas akan menghasilkan informasi sebagai berikut :Variables Entered/Removeda

ModelVariables EnteredVariables RemovedMethod

1money, price, seal, brand, packageb.Enter

a. Dependent Variable: pref

b. All requested variables entered.

Model Summaryb

ModelRR SquareAdjusted R SquareStd. Error of the Estimate

1.841a.707.6153.998

a. Predictors: (Constant), money, price, seal, brand, package

b. Dependent Variable: pref

ANOVAa

ModelSum of SquaresdfMean SquareFSig.

1Regression615.6975123.1397.704.001b

Residual255.7571615.985

Total871.45521

a. Dependent Variable: pref

b. Predictors: (Constant), money, price, seal, brand, package

Coefficientsa

ModelUnstandardized CoefficientsStandardized CoefficientstSig.

BStd. ErrorBeta

1(Constant)22.5295.1774.3520

package-4.1591.036-0.56-4.0150.001

brand0.4291.0540.0560.4070.689

price2.7031.0090.3662.6810.016

seal-4.3141.78-0.33-2.4230.028

money-2.7791.921-0.197-1.4470.167

a. Dependent Variable: pref

Residuals Statisticsa

MinimumMaximumMeanStd. DeviationN

Predicted Value-.1420.2511.455.41522

Residual-8.2024.639.0003.49022

Std. Predicted Value-2.1421.624.0001.00022

Std. Residual-2.0521.160.000.87322

a. Dependent Variable: pref

Charts

Credit

Catreg

Version 3.0

by

Data Theory Scaling System Group (DTSS)

Faculty of Social and Behavioral Sciences

Leiden University, The Netherlands

Case Processing Summary

Valid Active Cases22

Active Cases with Missing Values0

Supplementary Cases0

Total22

Cases Used in Analysis22

Iteration History

Multiple R SquareApparent Prediction ErrorDecrease in Apparent Prediction Error

Iteration Number0a.000.000

1.916.084-.084

2.917.083.001

3b.917.083.000

a. The error of iteration 0 is the error of the solution with all variables treated as numerical (with error difference 0.0001 and maximum number of iterations 50).

b. The iteration process stopped because the convergence test value was reached.

Correlations Original Variables

packagebrandpricesealmoney

package1.000-.189-.126.081.066

brand-.1891.000.065-.042-.034

price-.126.0651.000.000.000

seal.081-.042.0001.000-.039

money.066-.034.000-.0391.000

Dimension12345

Eigenvalue1.2911.038.980.905.785

Correlations Transformed Variables

packagebrandpricesealmoney

package1.000-.171-.110.052.094

brand-.1711.000.115-.092-.020

price-.110.1151.000.001-.001

seal.052-.092.0011.000-.039

money.094-.020-.001-.0391.000

Dimension12345

Eigenvalue1.3041.053.979.852.812

Model Summary

Multiple RR SquareAdjusted R SquareApparent Prediction Error

Standardized Data.958.917.855.083

Raw Data

Dependent Variable: prefPredictors: package brand price seal money

Coefficients

Standardized CoefficientsdfFSig.

BetaBootstrap (1000) Estimate of Std. Error

package-.723.108144.773.000

brand.068.1161.345.568

price.354.100312.570.001

seal-.332.104210.124.003

money-.165.09922.763.103

Dependent Variable: pref

Correlations and Tolerance

CorrelationsImportanceTolerance

Zero-OrderPartialPartAfter TransformationBefore Transformation

package-.807-.926-.705.636.952.942

brand.266.225.066.020.954.961

price.442.773.350.171.978.982

seal-.370-.754-.330.134.988.991

money-.223-.497-.164.040.989.993

Dependent Variable: pref

Quantifications

package Package designa

CategoryFrequencyQuantification

1 A*9-1.202

2 B*6.832

3 C*7.832

a. Optimal Scaling Level: Spline Ordinal (Degree 2, Interior Knots 1).

price Pricea

CategoryFrequencyQuantification

1 $1.198-1.162

2 $1.396-.029

3 $1.5981.183

a. Optimal Scaling Level: Spline Ordinal (Degree 2, Interior Knots 1).

Credit

Catreg

Version 3.0

by

Data Theory Scaling System Group (DTSS)

Faculty of Social and Behavioral Sciences

Leiden University, The Netherlands

Case Processing Summary

Valid Active Cases330

Active Cases with Missing Values0

Supplementary Cases0

Total330

Cases Used in Analysis330

Model Summary

Multiple RR SquareAdjusted R SquareApparent Prediction Error

Standardized Data.955.912.779.088

Raw Data

Dependent Variable: ozonPredictors: vh ibh dpg vis temp doy

ANOVA

Sum of SquaresdfMean SquareFSig.

Regression300.9951981.5206.866.000

Residual29.005131.221

Total330.000329

Dependent Variable: ozonPredictors: vh ibh dpg vis temp doy

Coefficients

Standardized CoefficientsdfFSig.

BetaBootstrap (1000) Estimate of Std. Error

vh.330.0915213.291.000

ibh.266.0794211.356.000

dpg.375.0871618.774.000

vis.230.0721710.215.000

temp.501.1243516.370.000

doy.447.0953622.206.000

Dependent Variable: ozon

Correlations and Tolerance

CorrelationsImportanceTolerance

Zero-OrderPartialPartAfter TransformationBefore Transformation

vh.459.727.314.166.905.242

ibh.256.666.264.075.989.590

dpg.181.760.347.074.856.674

vis.380.604.225.096.952.748

temp.716.843.464.393.857.234

doy.398.806.404.195.817.775

Dependent Variable: ozon

Credit

CATPCA

Version 1.1

by

Data Theory Scaling System Group (DTSS)

Faculty of Social and Behavioral Sciences

Leiden University, The Netherlands

Case Processing Summary

Valid Active Cases7

Active Cases with Missing Values0

Supplementary Cases0

Total7

Cases Used in Analysis7

Iteration History

Iteration NumberVariance Accounted ForLoss

TotalIncreaseTotalCentroid CoordinatesRestriction of Centroid to Vector Coordinates

0a4.515315.0000005.4846854.0755831.409101

31b4.726009.0000085.2739914.2737951.000196

a. Iteration 0 displays the statistics of the solution with all variables, except variables with optimal scaling level Multiple Nominal, treated as numerical.

b. The iteration process stopped because the convergence test value was reached.

Model Summary

DimensionCronbach's AlphaVariance Accounted For

Total (Eigenvalue)% of Variance

1.8813.38967.774

2.3151.33726.746

Total.986a4.72694.520

a. Total Cronbach's Alpha is based on the total Eigenvalue.

Object Scores

Case NumberDimension

12

1-1.2661.816

2.284.444

3-1.726-1.201

4.931.229

51.089.159

6.188-1.408

7.500-.039

Variable Principal Normalization.

Component Loadings

Component Loadings

Dimension

12

intnsity.987-.136

frquency.968-.169

blonging.731-.646

proxmity.486.825

formlity.841.438

Variable Principal Normalization.

Credit

CATPCA

Version 1.1

by

Data Theory Scaling System Group (DTSS)

Faculty of Social and Behavioral Sciences

Leiden University, The Netherlands

Case Processing Summary

Valid Active Cases7

Active Cases with Missing Values0

Supplementary Cases0

Total7

Cases Used in Analysis7

Iteration History

Iteration NumberVariance Accounted ForLoss

TotalIncreaseTotalCentroid CoordinatesRestriction of Centroid to Vector Coordinates

0a4.876515.00000710.1234857.6487722.474713

38b4.999966.00000810.0000346.6880493.311985

a. Iteration 0 displays the statistics of the solution with all variables, except variables with optimal scaling level Multiple Nominal, treated as numerical.

b. The iteration process stopped because the convergence test value was reached.

Model Summary

DimensionCronbach's AlphaVariance Accounted For

Total (Eigenvalue)% of Variance

1.8853.42468.480

2-.232.84416.871

3-.459.73214.649

Total1.000a5.00099.999

a. Total Cronbach's Alpha is based on the total Eigenvalue.

Category Points

Object Scores

Case NumberDimension

123

1-.6461.477-.002

2-.489.695.784

3-.992-.244-1.652

41.414.682-.998

51.684-.672.364

6-.648-1.830-.083

7-.323-.1081.587

Variable Principal Normalization.

Component Loadings

Component Loadings

Dimension

123

intnsity.980-.005-.201

frquency.521-.643.561

blonging.980-.002-.197

proxmity.519.656.549

formlity.981.004-.193

Variable Principal Normalization.

Biplot Component Loadings and Objects

Hasil di atas belum diinterpretasikan dan disajikan hanya untuk mengungkap ketangguhan dari perintah-perintah sintaksis SPSS yang belum terjamah dalam buku-buku SPSS yang telah diterbitkan di Indonesia. Interpretasi atas hasil-hasil di atas terkandung dalam studi kasus SPSS. Data yang dipakai juga tersedia dalam paket program IBM SPSS Statistics Versi 20. Sintaksis di atas dapat dijalankan dalam IBM SPSS Statistics Versi 21 dan IBM SPSS Versi 22 walau sintaksis itu dicipta dalam IBM SPSS Statistics versi 20.

RangkumanBahan studi dan penghayatan statistik terkandung dalam Case Studies SPSS. Case Studies ini mencakup ruang lingkup pembahasan yang sangat luas, lengkap, dan dalam. Pembahasan seperti ini tidak ditemukan dalam buku-buku statistik dan buku-buku SPSS. Pemakaian cara point and click melalui menu SPSS dapat mencipta perintah-perintah sintaksis. Perintah-perintah sintaksis ini membutuhkan pengolahan sedikit agar dapat disimpan ke dalam arsip sintaksis dan arsip sintaksis ini dapat dibuka, dimuat, dan dijalankan melalui Syntax Editor dengan perintah Run>All.

Penulis mengharap kritik dari para pembaca dan kritik tersebut mungkin dapat dipakai untuk memperbaiki isi tulisan ini.

Daftar Kepustakaan

IBM Incorporation (2011). Case Studies.

Permata Depok Regency, 10 Februari 20169


Recommended