8
2007 겨겨 겨겨겨겨 겨겨겨겨 겨 4 겨 : GLM(General Linear Model) ▫ 겨겨겨 겨겨겨겨 겨겨

2007 겨울 통계강좌 중급과정

  • Upload
    lilli

  • View
    53

  • Download
    0

Embed Size (px)

DESCRIPTION

2007 겨울 통계강좌 중급과정. 제 4 강 : GLM(General Linear Model) ▫ 다변량 일반선형 모형. ▣ 변량분석의 종류와 차이점에 따른 알기 쉬운 구분법. ▣ 다변량 일반선형모형. 변인의 수와 측정방법 다변량 일반선형모델의 경우는 명목 ( 명명 ) 척도로 측정된 두 개 이상의 독립변인이 등간 혹은 비율척도로 측정된 여러 개의 종속변인에 대해 다수의 요인변수 또는 공변량이 측정된 자료에 대해 모델링 분석을 하는 것이다 . - PowerPoint PPT Presentation

Citation preview

Page 1: 2007  겨울 통계강좌  중급과정

2007 겨울 통계강좌 중급과정

제 4 강 : GLM(General Linear Model)

▫ 다변량 일반선형 모형

Page 2: 2007  겨울 통계강좌  중급과정

간단 구분 1way -anova 2(n)way-anova

GLM

독립변수 명목척도 1 개 명목척도로 구성된 2개 이상

명목척도로 구성된 2개 이상

종속변수 등간척도 1 개 등간척도 1 개 등간척도 2 개 이상

사후분석 불필요 필요 필요

그래프 활용 불필요 필요 필요

▣ 변량분석의 종류와 차이점에 따른 알기 쉬운 구분법

Page 3: 2007  겨울 통계강좌  중급과정

▣ 다변량 일반선형모형

변인의 수와 측정방법 다변량 일반선형모델의 경우는 명목 ( 명명 ) 척도로 측정된 두 개 이상의 독립변인이 등간 혹은

비율척도로 측정된 여러 개의 종속변인에 대해 다수의 요인변수 또는 공변량이 측정된 자료에 대해 모델링 분석을 하는 것이다 .

요인의 차이가 다수의 반응 ( 종속 ) 변수 각 각에 대하여 어떠한 영향을 주는지 ?

요인들간의 상호작용이 존재하는지 ?

요인조합간에는 어떠한 차이가 있는지를 알고자 할 때 활용한다 .

[GLM : 다변량 일반선형모형의 성립요건 ]

▶ 독립변인① 수 : 두 개 이상 ② 측정 : 명명척도 ( 다른 척도 명목척도로 리코딩 )③ 독립변인은 요인 (factor) 이라 칭함

▶ 종속변인① 수 : 두 개 이상 ② 측정 : 등간 또는 비율척도 ( 연속변수임 )

Page 4: 2007  겨울 통계강좌  중급과정

▣ 다변량 일반선형모형 분석의 절차 및 실제사례

1) 독립변인과 종속변인의 기술통계 값을 교차비교분석표를 통해 살핀다 . 각 집단의 사례 수와 평균값 , 표준편차 값을 분석한다 .

2) 설명변량을 살펴보고 변량분석표를 통해 독립변인 전체의 유의도 , 주 효과와 상호작용효과를 분석하여 유의도를 검증하고 에타 (eta) 계수 분석을 통해 개별 변인의 영향력을 분석 .

3) 집단간 차이를 사후검정한다 .

실제사례 : 플라스틱 개발에 대한 실험연구

▣ 연구주제 : 공정조건에 따라 플라스틱의 특성이 어떤 영향을 받는지 ? ▶ 변수설정 :

독립변수 -> 공정조건 : ① extrusn(=extrusion rate, 사출률 ) - 2 수준 [ 명목 ]

②additive(additive amount, 첨가제 량 ) - 2 수준 [ 명목 ]

종속변수 -> 반응특성 : ① tear_res(tear resistance, 찢어짐에 견디는 정도 ) - 연속형

② gloss( 반질거리는 정도 )- 연속형

③ opacity( 불투명도 )- 연속형

공정조건에 따른 결합별 반복횟수는 5 회로 2(extrusn)*2(additive) *5 회 ( 반복 ) = 20

Page 5: 2007  겨울 통계강좌  중급과정

Instruction step 1 :

Analyze -> General Linear Model -> Multivariate -> 다변량 대화상자

변수투입 : 독립변인 -> Fixed Factor( 모수요인 ) : extrusn , additive

종속변수 -> Dependent Variable : tear_res, gloss, opacity

* 다변량 대화상자에서는 Random Factor 를 선택할 수 없음

** Covariate( 공변량 ) 은 연구에서 사전에 설정할 수 있는 변수로 , 연구주제에 따른 공통적인 속성으로 독립이나

종속에 영향을 미칠 수 있는 변인이다 . 예를 들면 서울시 중고생 학업수준에 대한 연구를 진행하면서 거주지역에

대한 공변량을 설정치 않을 경우 심각한 오류를 가져올 수 있다 .

Instruction step 2 :

Instruction step 3 :

모형설정 : Custom 선택 -> 독립변수 투입 주 효과와 상호작용 효과 설정 -> 실행

Page 6: 2007  겨울 통계강좌  중급과정

Instruction step 4 :

Instruction step 5 :

Contrast : Change Contrast 선택 -> 옵션 선택

옵션 : deviation( 편차 ) : 각 수준과 전체 평균간의 차이를 대비로 정의한다 simple( 단순 ) : 지정된 수준 ( 처음 / 마지막 ) 과 각 수준의 차이를 대비로 정의 . difference( 차분 ) : 각 수준과 이전 수준들간의 평균간 차이를 대비로 정의 .,Helmert : 각 수준과 이후 수준들의 편균간 차이를 대비로 정의 . Repeated( 반복 ) : 모든 연이은 2 개 수준간 차이를 대비로 정의 . Polynomial( 다항 ) : 서로 직교하는 1 차항 , 2 차항 , 3 차항 등의 대비를 설정 .

Plot(Profile Plots) ->

horizontal Axis( 수평축 변수 ),

Separate Lines( 선구분 변수 ) – 도표에 제 2 의 요인을 넣기 위해

사용되는 다수의 선을 구별

Separate Plots( 도표구분 변수 ) : 다수의 도표를 구분

horizontal Axis( 수평축 변수 ) extrusn 투입 , Separate Lines( 선구분 변수 ) 에 additive 투입

Page 7: 2007  겨울 통계강좌  중급과정

Instruction step 6 :

사후검정 (Post Hoc Multiple Comparison) :

1) Factor( 요인 ) -> Post Hoc test for ( 사후검정 변수 지정 )

extrusn, additive 지정

2) 등분산을 가정할 때 -> Turkey, scheffe 검증 지정

Instruction step 7 :

옵션 (Option) : 선택

1) Discriptive statistic -> 기술통계량 체크

2) Estimates of Effect Size -> 에타 (eta) 값 산출 체크

3) Observed Power -> 관측값의 정확도 측정

4) Parameter estimates -> 모수 추정값 체크

5) SSCP MATRIX -> sum of squares and cross products : 제곱합 및 교차곱 행렬

=> 각 종속변수에 대한 잔차들의 공변성 (covariation) 을 보여줌

Instruction step 8 : 실행 다변량 결과물 .spo 참조

Page 8: 2007  겨울 통계강좌  중급과정

앞선 2 way – anova 사례처럼 사후검증에 대한 결과가 산출이 안되기에 [extrusn,

additive 가 3 미만의 집단으로 구성되어 있기에 사후검증 비교가 실행되지 않음 ]

사후검증을 실시하기 위해 compute 를 실시한 후 다시 한번 다변량 일반선형

모형 실행

다변량 결과물 .spo 참조

직접 실습 검증 과제 : 지역조사 .sav

학력과 종교에 따라 ‘심리적 이웃관계’와 ‘실질적 이웃관계’에 통계적으로 유의미한 차이가 있는지 검증하시오 .

성별과 학력에 따른 ‘심리적 이웃관계’ 와 ‘실질적 이웃관계’에 통계적으로 유의미한 차이가 있는지 검증하시오

성별과 종교에 따른 ‘심리적 이웃관계’ 와 ‘실질적 이웃관계’에 통계적으로 유의미한 차이가 있는지 검증하시오 .

실습 - 학력 - 종교 .spo 참조