74
195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은 R.A Fisher에 의해 개발된 3 개 이상의 모평균에 대한 분석으로, 측정치의 변동을 총 제곱 합(total sum of squares)으로 나타내고 이 총 제곱 합을 실험과 관련된 요인(인자의 작용)에 대한 각자의 제곱 합으로 분해한 후, 나머지를 오차변동으로 해석하는 검정법을 말한다. 각 요인 마다 분해한 분산을 오차분산과 비교하여 특히 큰 영향을 주는 인자(요인)가 무엇인가를 검정하고 그 결과 유의치가 있으면 요인마다 효과 추정을 행한다. 따라서 분산분석은 측정치의 변동을 요인 별로 분해하여 어느 요인이 특성치에 어느 정도 영향을 주는지를 파악하는 것이라 말할 수 있다. 분산분석은 원칙적으로 계량치에 대해서 사용되고 그 계량치가 정규분포를 따른다고 가정한다. 12.1 분산분석의 종류 12.1.1 인자(요인) 수에 의한 분류 일원분산분석(one-way ANOVA)[일원배치법(one-way classification)]: 인자가 하나인 분석. 다른 인자는 측정치에 경미한 영향으로 무시할 수 있거나 또는 영향이 일정할 때, 인자(요인)의 집단(수준) 수가 3 개 이상일 때 그에 대한 평균 사이의 차를 검증하며 실험순서는 임의적이다. 이원분산분석(two-way ANOVA)[이원배치법(two-way classification)]: 측정치에 영향을 미치는 인자가 둘일 때의 분석으로 두 인자(요인)의 집단(수준)수 조합이 반복이 없는 경우와 있는 경우 로 분류하여 검증한다. 이 분석은 두 인자 모두가 모수인자인 경우와 하나는 모수 다른 하나는 변 량, 둘 다 변량인 경우가 존재하며 변동의 계수는 모두 같지만 분산의 기대치가 다르다. 그 외에 인자가 셋인 삼원분산분석, 셋 이상인 다원분산분석이 있다. 12.1.2 인자의 모형에 의한 분류 모수효과 모형(Fixed effect model): 기술적으로 지정해서 제어 가능한 집단은 모수모형이며 온도, 압력 같은 것이 이에 해당한다. 변량효과 모형(Random effect model): 기술적으로 집단을 지정해도 제어할 수 없는 요인으로 예 를 들면 공정에서 임의로 뽑은 제품의 롯트등이다. 혼합효과 모형(Mixed effect model): 위의 양자를 모두 포함한 것. 구조모형: 데이터 구조를 요인효과와 오차로 분해하여 식으로 표현하는 것. ij i ij x i i a i ij i ij x 에 대입하면 일원배치 모형이된다. 일원배치의 구조모형: ij i ij x a (12.1) 여기서 ij x 는 데이터, 는 데이터 전체의 평균, i i 집단의 모평균, i a 는 인자 A 의 제 i

제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

  • Upload
    dodiep

  • View
    228

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

195

제 12장. 분산분석(Analysis of Variance: ANOVA)

분산분석은 R.A Fisher에 의해 개발된 3 개 이상의 모평균에 대한 분석으로, 측정치의 변동을 총

제곱 합(total sum of squares)으로 나타내고 이 총 제곱 합을 실험과 관련된 요인(인자의 작용)에

대한 각자의 제곱 합으로 분해한 후, 나머지를 오차변동으로 해석하는 검정법을 말한다. 각 요인

마다 분해한 분산을 오차분산과 비교하여 특히 큰 영향을 주는 인자(요인)가 무엇인가를 검정하고

그 결과 유의치가 있으면 요인마다 효과 추정을 행한다. 따라서 분산분석은 측정치의 변동을 요인

별로 분해하여 어느 요인이 특성치에 어느 정도 영향을 주는지를 파악하는 것이라 말할 수 있다.

분산분석은 원칙적으로 계량치에 대해서 사용되고 그 계량치가 정규분포를 따른다고 가정한다.

12.1 분산분석의 종류

12.1.1 인자(요인) 수에 의한 분류

일원분산분석(one-way ANOVA)[일원배치법(one-way classification)]: 인자가 하나인 분석.

다른 인자는 측정치에 경미한 영향으로 무시할 수 있거나 또는 영향이 일정할 때, 인자(요인)의

집단(수준) 수가 3 개 이상일 때 그에 대한 평균 사이의 차를 검증하며 실험순서는 임의적이다.

이원분산분석(two-way ANOVA)[이원배치법(two-way classification)]: 측정치에 영향을 미치는

인자가 둘일 때의 분석으로 두 인자(요인)의 집단(수준)수 조합이 반복이 없는 경우와 있는 경우

로 분류하여 검증한다. 이 분석은 두 인자 모두가 모수인자인 경우와 하나는 모수 다른 하나는 변

량, 둘 다 변량인 경우가 존재하며 변동의 계수는 모두 같지만 분산의 기대치가 다르다.

그 외에 인자가 셋인 삼원분산분석, 셋 이상인 다원분산분석이 있다.

12.1.2 인자의 모형에 의한 분류

모수효과 모형(Fixed effect model): 기술적으로 지정해서 제어 가능한 집단은 모수모형이며 온도,

압력 같은 것이 이에 해당한다.

변량효과 모형(Random effect model): 기술적으로 집단을 지정해도 제어할 수 없는 요인으로 예

를 들면 공정에서 임의로 뽑은 제품의 롯트등이다.

혼합효과 모형(Mixed effect model): 위의 양자를 모두 포함한 것.

구조모형: 데이터 구조를 요인효과와 오차로 분해하여 식으로 표현하는 것.

i j i i jx

i ia

i 를 i j i i jx 에 대입하면 일원배치 모형이된다.

일원배치의 구조모형: i j i i jx a (12.1)

여기서 i jx 는 데이터, 는 데이터 전체의 평균, i 는 i 집단의 모평균, ia 는 인자 A 의 제 i

Page 2: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

196

집단의 효과(모평균에 대한 오차), i j 는 오차.

모수 모형에서 0ia (12.2)

변수 모형에서 ( ) 0iE a (12.3)

12.1.3 실험순서에 의한 분류

모든 실험의 순서를 임의로 행하는 것(완전 확률화 실험)과 일부만 임의로 하는 분할법(split-plot

design)의 두 가지가 있다.

12.1.4 실험

동일한 실험에서 비교 및 검토하고자 하는 집단(수준)의 조합이 최저 한 조가 있는 계획을 완비형

계획이라 하고, 한 조도 들어있지 않는 계획을 불완비형계획이라 한다. 공장실험은 대부분 완비형

이다.

12.2 일원분산분석(일원배치법)

개요: 앞장(9장)에서 공부한 것은 두 집단(수준)에서 나온 자료가 동일한 평균과 분포를 갖는가를

검정하는 것이었다. 일원분산분석을 단순하게 표현하면 이것을 확장하여 인자(요인)는 하나이고

이 인자를 k 개 집단(수준)으로 나뉜 표본들을 서로 비교 검정하는 것이며, 집단(수준)은 3 개 이

상( 3k ), 실험치(나타나는 결과)는 하나인 것을 일원배치 분산분석(oneway ANONA)이라 한다.

일원배치 분산분석을 이해하기 위하여 다음의 예를 보자.

[예] 3 대의 기계에서 생산되는 공구들의 파괴강도를 측정한 후, 각 기계가 생산한 공구의 파괴강

도간에 차이가 있는지를 검정하는 경우에 분산분석을 적용할 수 있다. 여기서 파괴강도가 분석하

고자 하는 하나의 실험치이고, 3 대의 기계는 생산된 제품에 대한 집단(수준)으로 3k 이 된다.

좀더 자세히 말하면 어떤 특성에 대해 영향을 끼친다고 생각하는 오직 하나의 실험결과(여기서는

파괴강도) 효과를 조사하는 것으로 다른 인자는 영향이 거의 없거나 일정하게 유지할 수 있을 때

하는 분석이며, 집단수(수준수)가 3 개( 3 대의 기계에서 생산된 제품) 이상으로 평균치 사이에 차

이가 있는가를 검정한다. 반복 수에는 제한이 없으며 실험순서는 임의로 선택하여 실시한다. 총변

동을 급간(집단간 또는 수준간 또는 요인간) 변동과 급내(집단내) 변동(오차)으로 나누어서 분산비

를 검정한다. 특히 일원배치법에서 인자 구조모형의 분산분석표 구조는 모수형(fixed effect

model)과 변량형(random effect model) 모두 같다.

확률화 실험계획: 실험단위들을 각 처리집단에 무작위로 배정하는 계획으로, 일원배치법에 어떻게

적용되는지를 이해하기 위하여 다음의 예를 보자.

[예] 위암에 대한 서로 다른 치료제 3 가지 1A , 2A , 3A 가 있다고 할 때, 이 세가지 치료제의 효

과를 비교하기 위한 실험계획을 세워라.

Page 3: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

197

(풀이) 여기서 실험치는 위암의 치료효과이고, 집단수(수준수 또는 요인수)는 1A , 2A ,

3A 의 서로

다른 치료제이다. 실험계획은 위암에 걸린 입원한 환자 30명을 대상으로 한다고 하자.

(1) 10명씩 1A , 2A , 3A 의 세 집단으로 무작위로 나눔.

(2) 1A 집단에 치료제 A , 2A 집단에 치료제 B ,

3A 집단에 치료제 C 를 각각 투여.

(3) 한 종류 암을 치료하는 데까지 걸린 시간을 관측하여 각 약에 대한 치료효과를 분석.

이 실험의 경우 모집단은 모든 위암환자이며 표본은 그중 30명의 실험 대상인 환자, 실험치는 치

료약의 효과, 수준(집단)은 치료제 , ,A B C 이다. 반응은 평균과 분산을 이용하여 각각의 약의 치

료 평균시간이 동일한가를 검정한다.

일원배치 분산분석에는 급간(집단간 또는 수준간) 내에 실험의 반복수가 같은 경우와 다른 경우의

둘로 나누어 이론적인 계산을 할 수 있다.

12.2.1 반복수가 같은 경우의 일원배치법

인자 A 의 수준(집단)수가 k 개( 1A , 2A , , kA )이며, 각 수준마다 n 번씩 동일하게 반복 실험을

할 경우, 일원배치법의 데이터는 다음과 같이 배열된다. 여기서 N kn 은 총 실험횟수이다.

표 [12-1] 일원배치법의 데이터 배열(반복수가 같은 경우)

처리군( iA )

구 분

인자의 수준(요인 또는 집단) 평균(합계)

1A 2A iA pA

수준 별 실험의

반복 수: n

11y 21y 1iy 1ky

12y 22y 2iy 2ky

1 jy 2 jy

i jy k jy

1ny 2ny iny kny

평균[합계] 1

y [ 1T ] 2y [ 2T ] i

y [ 2T ] py [ pT ] y [T ]

iT 와 iy : 실험 수준(집단) iA 에서 n 개 데이터의 합과 평균. 여기서 1,2, ,i k

i 열의 합:

1

n

i i j

j

T y

(12.4)

i 열의 평균: ii

Ty

n (12.5)

T 와 y : 전체 데이터 N kn 개의 합과 평균

총 합계: 1

k

i

i

T T

(12.6)

총 평균: T

yN

(12.7)

Page 4: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

198

데이터 i jy 의 일반화:

i j i i jy , ( 1,2, ,i k ), ( 1,2, ,j n )

인자 i 수준(집단)의 모평균 i 에 대해 실험 전체의 모평균 를 기준으로 표시하면

i ia (12.8)

모수 모형에서 1

0k

k

i

a

이므로 다음과 같이 요약할 수 있다.

반복수가 같은 일원배치법의 구조모형 요약

i j i i jy

i ia

i j : 실험 오차, 독립적이고 2(0, )N 분포를 따른다.

ia : i 번째 처리효과( i 번째 모평균의 오차), 단 1

0k

kia

i j i i jy a , [( 1,2, ,i k ), ( 1,2, ,j n )] (12.9)

1

1 k

i

ik

(12.10)

분산분석을 하려면 먼저 집단간에 분산의 동질성이 검정되어야 한다. 그것은 | |i j i j iz y y 로

만들어진 표로 계산한 Levene의 등분산 검정통계량 LF 에 의해 검정된다.

<Levene’s test: 분산의 동질성(equality of variances) 검정>

귀무(영)가설 0H : 1 2 k ( k 개의 집단에 대한 분산이 동일하다).

대립(연구)가설 1H : i r ( k 개 중 하나 이상 다른 분산이 존재한다).

Levene의 등분산 검정 통계량:

2

1

2

1 1

( ) ( )

( 1) ( )

k

iiiL k n

ii ji j

i

N k n z zF

k z z

k : 시료 수준(집단)의 수

in : i 번째 수준에 속한 표본의 수

N : 총 표본 수(1

k

i

i

N n

: k 에 속한 표본 수들이 모두 n 으로 같다면 N kn ).

i jz : i 번째 수준(집단)에 속한 j 번째 표본

| |, : group (mean)

| |, : group (median)

i j i i

i j

i j i i

y y y iz

y y y i

번째

번째 (수준)의 평균

중앙값의

| |i j i j iz y y 로 만든 표로 계산한 것은 Brown-Forsythe test에 사용된다.

1 1

1 k

i j

i j

in

z zN

: 모든 i jz 의 평균.

1

1n

i i j

ji

i

z zn

: 수준 i 에 대한 i jy 의 평균.

Page 5: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

199

검정통계량 LF 은 ( 1, ; )F k N k 로 결정한다. 여기서 ( 1, ; )LF F k N k 이면 0H 즉

등분산이 채택되고, 크기가 반대이면 1H 이 채택되어 Brown-Forsythe test에 의한 통계량이 사용

된다. 분산분석은 Levene’s test로 등분산이 검정되고 난 후, 평균에 대한 검정을 할 수 있다.

[도움말] Brown-Forsythe 통계량을 계산하여 집단 평균의 동일성을 검정합니다. 등분산을 가정

하지 않는 경우 F 통계량보다 이 통계량을 사용하는 것이 좋습니다.

<분산분석: 평균에 대한 가설의 설정과 검정>

귀무(영)가설) 0H : 1 2 k 또는 1 2 0ka a a (모평균은 모두 같다).

대립(연구)가설 1H : i 가 모두 같다고 할 수 없다. 또는 ia 가 모두 0 이라고 할 수 없다.

이들 가설은 분산분석표를 작성하여 검정할 수 있다. 이때 사용되는 수식들은 다음과 같다.

측정값 i jy 와 총평균 y 의 편차, 즉 ( i jy y )의 제곱합을 총제곱합(total sum of square: SST)

또는 총변동(total variance)이라 한다. 총변동(총제곱합)은 다음과 같이 분해된다.

총제곱합: 2

1 1

( ) ( )k n

T i j

i j

SST S y y

(12.11)

2

1 1

[( ) ( )]k n

i j i i

i j

y y y y

2 2

1 1

[( ) 2( )( ) ( ) ]k n

i j i ji i i i

i j

y y y y y y y y

2 2

1 1 1 1 1 1

[( ) 2 ( )( ) ( )k n k n k n

i j i ji i i i

i j i j i j

y y y y y y y y

여기서 1 1 1 1

1( ) ( ) 0

n n n n

i j i j i j i ji i

j j j j

y y y ny y n yn

따라서 TS 는

2

1 1

( )k n

T i j

i j

S y y

2 2

1 1 1

[( ) ( )k n k

i j i i

i j i

y y n y y

(12.12)

(12.12)의 우측 첫째 항은 각 집단 내에서 편차의 제곱합이므로 급내변동(variance within group)

또는 오차변동(잔차제곱합)이라 하고 ( )ESSE S 로 나타낸다. 두 번째 항은 인자 A 의 각 집단의

효과 차이로 인한 변동이므로 급간변동(variation between group) 또는 A 의 변동(처리제곱합)이

라 하며 ( )ASSA S 로 표시한다. 즉

T A ES S S (12.13)

총변동(total variance): 2

1 1

( ) ( )k n

T i j

i j

S SST y y

(12.14)

급간변동(variation between group): 2 2

1 1 1

( ) ( ) ( )k k n

A i i

i i j

S SSA n y y y y

(12.15)

급내변동(variation within group): 2

1 1

( ) [( )k n

E i j i

i j

S SSE y y

(12.16)

Page 6: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

200

변동의 자유도

TS (총변동)의 자유도 T : 1T kn (12.17)

AS (급간변동)의 자유도 A : 1A k (12.18)

ES (급내변동)의 자유도 E : ( 1) ( 1) ( 1)E kn k k n (12.19)

변동들을 계산할 때에 다음의 공식을 사용할 수도 있다.

<변동의 계산 공식>

(1) 수정항(correction term: CT ):

2

, ( )T

CT N knN

(12.20)

(2) 총변동: 2

1 1

( )k n

T i j

i j

S y y

2

1 1

k n

i j

i j

y CT

(12.21)

(3) 급간변동: 2

1 1

1( )

k k

A i ii

i i i

S n y y T CTn

(12.22)

(4) 급내변동: E T AS S S (12.23)

AS 와 ES 를 자유도로 나누어 분산으로 나타낸 것을 각각 처리평균 제곱( A AMSA MS V )과 잔

차평균제곱( E EMSE MS V )이라 한다. 여기서 M 은 mean(평균)을 의미한다.

※ AMSA MS 와 EMSE MS 를 분산이라는 의미에서 AV 와 EV 로 각각 쓰기로 하자.

(5) 처리평균제곱: AA

A

SV

(12.24)

(6) 잔차평균제곱: EE

E

SV

(12.25)

AV (구룹간 평균제곱)와 EV (구룹내 평균제곱)의 비가 검정통계량 tF 이다.

검정통계량: At

E

VF

V (12.26)

반복수가 같은 경우 일원배치법의 분산분석표는 다음과 같이 작성된다.

표 [12-2] 일원배치 분산분석(반복수가 같은 경우)

변동요인 제곱합( SS ) 자유도 평균제곱 tF 값

구룹간(처리)

구룹내(오차)

( )ASSA S

( )ESSE S

1A k

( 1)E k n

( ) AA A

A

SV MS

( ) EE E

E

SV MS

At

E

VF

V

합계 ( )TSST S 1T kn

검정: 유의수준 일 때 검정통계량 ( , ; )t A EF F 이면 0H 가 기각된다. 즉 요인( iA )이 특성

치에 영향을 미친다고 말할 수 있으며 요인의 수준간에 유의한 차이가 있다고 결론을 내릴 수 있

Page 7: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

201

다. 다른 말로 하면 검정통계량 tF 를 확률로 전환했을 때 유의확률 ( )tP F 가 유의수준 보다 작

은 경우 oH 를 기각하고 1H 을 채택한다.

<사후분석: 분산분석 후의 추정 및 검정>

분산분석의 tF -검정에 의하여 인자(요인)의 수준(집단)간에 유의한 차가 있으면 0H 가 기각된다.

그 결과 인자의 각 수준에서 모평균 i 가 다를 경우 처리효과(treatment effect)에 대한 분석을

하여야 한다. 이것은 다음의 세 가지에 대해 추정이 가능하다.

(1) 각 수준의 모평균 추정

(i) 모평균의 점추정: 1

1( )

n

i i j i

j

A y yn

(12.27)

(ii) 모평균의 구간추정(각 수준마다 모평균의 신뢰한계)

( , ) ( , )2 2

E EE i Ei i

V Vy t y t

n n

(12.28)

(2) 각 수준의 모평균 차에 대한 추정

(i) 모평균 차의 점추정: ( , 1,2,3, )i r i r i ra a y y i r (12.29)

(ii) 모평균 차의 구간추정: 모평균의 차 i r 에 대한 신뢰율 (1- )의 신뢰구간은 다음과 같이

구할 수 있다.

2 2( ) ( , ) ( ) ( , )

2 2

E EE i r Ei r i r

V Vy y t y y t

n n

(12.30)

신뢰구간에서 0 을 포함한다면 i 와 r 간에 유의한 차가 있다고 말할 수 없다.

(3) 분산의 추정

모수모형일 때는 수준마다 모평균을 구하지만 변량모형일 때는 수준간의 변동(분산)을 추정할 필

요가 있다. 일원배치법에서 평균제곱은 2 2( )A E AE V n (12.31)

2( )E EE V (12.32)

이들로부터 다음과 같이 분산을 추정할 수 있다.

2 ( ) ( )A EA

E V E V

n

(12.33)

A EA

V V

n

SPSS 통계처리 문제

(반복수가 같은 경우의 일원분산분석)

Page 8: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

202

[보기 12_1] 어느 기계공장에서 제품의 수율에 미치는 요인은 사용 재료에 달려있다고 믿고 있

다. 그래서 재료를 네 수준(집단)으로 구분하여 각 수준에서 동일하게 반복 6 회를 실험하고 순서

는 임의로 행한 결과 아래와 같은 결과를 얻었다.

(a) <수준(집단)별 모평균 신뢰구간>

수준별 표준편차와 표준오차를 계산하고 모평균이 가질 수 있는 범위(신뢰구간)를 구하여라.

(b) <Levene’s test>

재료 수준(집단)들의 측정치들이 서로 등분산인지 유의수준 0.05 에서 검정하라.

(c) <분산분석>

수준간에 평균 차이(사용 재료간에 수율의 차이)가 있는지 유의수준 0.05 에서 양쪽검정하라.

(d) <사후분석>

분산분석결과 tF 값의 유의확률이 유의수준 보다 작다면 0H 가 기각되고 1H 이 채택된다. 즉

재료에 따라 제품의 수율에 영향을 미친다고 할 수 있다. 이 경우 각 재료 수준간의 모평균 차에

대한 95% 신뢰구간과 검정통계량 그리고 검정통계량에 의한 유의확률을 각각 구하여라.

표 [12-3] 네 종류 재료에 따른 제품수율 (단위: %)

처리군

측정수

인자의 수준(재료의 구분)

1A 2A 3A 4A

1

2

3

4

5

6

76 82 79 81

80 75 87 74

78 83 88 76

79 78 86 78

83 85 84 73

74 80 82 70

각각의 값은 재료

에 따른 수율 i jy

이다.

합계 1T 470 2T 483 3T 506 4T 452 T 1911

평균 1y 78.333 2

y 80.50 3y 84.333 4

y 75.333 y 79.625

표준편차 1 3.141s 2 3.619s 3 3.386s 4 3.882s 4.689s

표준오차 1 1.282D 2 1.477D 3 1.382D 4 1.585D 0.957D

(풀이) 표에 나타난 표준편차와 표준오차는 다음과 같이 계산된 것이다.

수준(집단)별 실험횟수와 총 실험횟수: 6n , 24N

분산공식: 2 2

1

1( )

1

n

i i j ijs y y

n

수준별 표준편차:

2

i is s

2 2 2

1

1 1[(76 78.33) (74 78.33) ] (49.333) 9.867

5 5s , 1 9.867 3.141s

Page 9: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

203

2 2 2

2

1 1[(82 80.50) (80 80.50) ] (65.50) 13.10

5 5s , 2 13.10 3.619s

2 2 2

3

1 1[(79 84.33) (82 84.33) ] (57.333) 11.467

5 5s , 3 11.467 3.386s

2 2 2

4

1 1[(81 75.33) (70 75.33) ] (75.333) 15.07

5 5s , 4 15.067 3.882s

전체에 대한 분산: 2 2

1 1

1( )

1

k n

i ji js y y

N

2 2 21 1

[(76 79.625) (70 79.625) ] (505.625) 21.98423 23

s

전체에 대한 표준편차: 21.984 4.689s

수준(집단)별 표준오차 ii

sD

n

1

3.1411.282

6D ,

2

3.6191.477

6D ,

3

3.3861.382

6D ,

4

3 . 8 8 21 . 5 8 5

6D

전체에 대한 표준오차: 4.689

0.95724

sD

N

(a) <수준(집단)별 모평균 신뢰구간(범위) >

유의수준 0.05 (양쪽검정)일 때 수준별 신뢰구간(모평균 범위)

수준(집단)별 및 총 자유도: 6 1 5n , 24 1T

수준별 t -분포 값: ( , / 2) (5,0.025) 2.571nt t

전체 t -분포 값: ( , / 2) (23,0.025) 2.069Tt t

※ t -분포: http://www.statdistributions.com/t/

( , ) (5,0.025)2

nt t

와 ( , ) (23,0.025)2

Tt t

의 값.

(a) [p-value] box에 0.05(유의수준) 입력.

(b) [d.f.] box에 5 또는 23을 각각 입력. [d.f.: degree of freedom]

(c) [two tails]를 선택(양쪽검정).

[t-value] box에서 (5,0.025) 2.571t 그리고 (23,0.025) 2.069t 를 각각 얻는다.

구간 공식: ( , ) ( , )2 2

i i i i ii iy t D y t D

1(5,0.025) (2.571)(1.282) 3.296t D

2(5,0.025) (2.571)(1.477) 3.797t D

Page 10: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

204

3(5,0.025) (2.571)(1.382) 3.553t D

4(5,0.025) (2.571)(1.585) 4.075t D

(23,0.025) (2.069)(0.957) 1.980t D

수준(집단)별 모평균 범위 계산 모평균 신뢰구간

178.333 3.296 ( ) 78.333 3.296A 175.04 ( ) 81.63A

280.500 3.797 ( ) 80.500 3.797A 276.70 ( ) 84.30A

384.333 3.553 ( ) 84.333 3.533A 380.78 ( ) 87.88A

475.333 4.075 ( ) 75.333 4.075A 471.26 ( ) 79.41A

79.625 1.980 ( ) 79.625 1.980A : 77.65 ( ) 81.61A

(b) <Levene’s test: 수준(집단)간 등분산 검정>

Levene’s test를 위한 | |i j i j iz y y 표는 다음과 같다.

표 [12-4] Levene’s test 표

1 jz 2 jz

3 jz 4 jz 합계 평균

2.333 1.5 5.333 5.667

1.667 5.5 2.667 1.333

0.333 2.5 3.667 0.667

0.667 2.5 1.667 2.667

4.667 4.5 0.333 2.333

4.333 0.5 2.333 5.333

합계 14 17 16 18 65

평균 1 2.333z 2 2.833z 3 2.667z 4 3.0z 2.708z

등분산 가설 및 검정통계량

귀무(영)가설 0H : 1 2 3 4 ( 4 개의 수준에 대한 분산이 동일하다).

대립(연구)가설 1H : 4 개 중 하나 이상의 다른 분산이 존재한다.

Levene 등분산 검정통계량 LF :

2

1

2

1 1

( ) ( )

( 1) ( )

k

ii

L k n

ii ji j

N k n z zF

k z z

다음의 표는 Levene’s test의 분모에 사용하는 값을 얻기 위하여 작성된 표이다.

Page 11: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

205

표 [12-5] 2

1 1( )

k

i ji ji j

inz z

계산에 필요한 수 표

211( )jz z

222( )jz z

233( )jz z

244( )jz z 합계

0 1.777 7.107 7.113

0.443 7.113 0 2.779

4.0 0.111 1.0 5.443

2.775 0.111 1.0 0.111

5.447 2.779 5.447 0.445

4.0 5.443 0.111 5.443

합계 16.667 17.333 14.667 21.333 70.0

여기서 Levene 식에 있는 계산 값들은 다음과 같다.

2 2 2 2

1 1( ) (0 2.333) (1.777 2.8333) (5.443 3.0) 70.00

k n

ii ji jz z

2 2 2 2 2

1( ) 6[(2.333 2.708) (2.833 2.708) (2.667 2.708) (3.0 2.708)

k

ii

n z z

1.4592

(24 4)(1.4592)

0.139(4 1)(70)

LF

수준(집단)의 자유도: 1 3k

자료 자유도 24 4 20N k

유의수준 0.05 일 때 F -분포 값: ( 1, ; ) (3,20;0.05) 3.099F k N k F

※ F -분포: http://www.statdistributions.com/f/

(1) 1 2( , ; ) (3,20; 0.05)F F 의 값

(a) [p-value] box에 0.05 입력.

(b) [numerator d.f.] box에 3 입력.

(c) [denominator d.f.] box에 20 입력.

(d) [right tail]을 선택.

[F-value] box에서 3.099를 얻는다.

(2) 0.139LF 확률(유의확률) 값

(a) [F-value] box에 0.139 입력.

(b) [numerator d.f.] box에 3 입력.

(c) [denominator d.f.] box에 20 입력.

(d) [right tail]을 선택.

[p-value] box에서 0.935를 얻는다.

Page 12: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

206

등분산 검정 결과

(1) 검정통계량에 의한 검정: 0.139 (3,20;0.05) 3.099LF F 이기 때문에 귀무가설 oH 가

채택된다.

(2) 유의확률에 의한 검정: ( 0.139) 0.935 0.05LP F 이기 때문에 oH 가 채택된다.

검정통계량에 의한 검정 또는 유의확률에 의한 검정에서 귀무(영)가설 oH 가 채택되었다. 즉 수준

(집단)간은 등분산이다. 따라서 수준간 평균비교(분산분석)가 가능하다.

(c) <분산분석>

수율에 미치는 영향은 요인이 하나인 재료뿐이므로 일원배치법으로 평균을 비교한다.

수준은 재료의 종류인 1 4, ,A A 로 4k 이며 여기서 일원인자는 재료이다.

귀무가설(영가설) 0H : 1 2 3 4 (재료 종류에 관계없이 수율의 평균은 같다).

대립(연구)가설 1H : 재료 종류에 따라 수율의 평균은 적어도 하나 이상 같지 않다.

가설을 검정하려면 분산분석표를 작성하여야 하고 그것을 위해 다음의 계산이 필요하다.

총변동(Total Sum of Square or Total Variance: TSST S ):

2 2 2 2

1 1

( ) [(76 79.625) (80 79.625) (70 79.625) ] 505.625k n

T i j

i j

S y y

급간변동(Variation between Group: ASSA S ):

2 2 2 2

1

( ) 6[(78.333 79.625) (80.5 79.625) (84.333 79.625)k

A i i

i

S n y y

2(75.333 79.625) ] 258.125

급내변동(Variation within Group: ESSE S ): 2

1 1

( )k n

E i j i

i j

S y y

또는 E T AS S S

505.625 258.125 247.5E T AS S S

변동의 자유도: 23 3 20E T A

AS 와 ES 를 자유도로 나누면 분산이 된다. 이들의 이름은 처리평균제곱( A AMS V )과 잔차평균

제곱( E EMS V )이라 하고 이들의 비가 검정통계량 F 이다.

처리평균제곱: 258.125

86.0423

AA

A

SV

잔차평균제곱: 247.5

12.37520

EE

E

SV

검정통계량 F : 86.042

6.95312.375

A

E

VF

V

계산 값들에 의한 분산분석표는 다음과 같다.

Page 13: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

207

표 [12-6] 일원배치 분산분석표(반복수는 동일)

변동요인 제곱합 자유도 평균제곱 tF 값 유의확률

구룹간

구룹내

AS 258.125

ES 247.500

3A

20E

AV 86.042

EV 12.375 tF 6.953 0.002

합계 TS 505.625 23T

검정통계량: 6.953tF

F -분포 값: ( , ; ) (3, 20; 0.05) 3.099A EF F

※ F -분포: http://www.statdistributions.com/f/

(1) 1 2( , ; ) (3,20; 0.05)F F 의 값

(a) [p-value] box에 0.05 입력.

(b) [numerator d.f.] box에 3 입력.

(c) [denominator d.f.] box에 20 입력.

(d) [right tail]을 선택.

[F-value] box에서 3.099을 얻는다.

(2) 6.953tF 의 확률(유의확률)

(a) [F-value] box에 6.953 입력.

(b) [numerator d.f.] box에 3 입력.

(c) [denominator d.f.] box에 20 입력.

(d) [right tail]을 선택.

[p-value] box에서 0.002 를 얻는다.

검정통계량에 의한 검정: 6.953 (3,20;0.05) 3.099tF F 이므로 귀무(영)가설 0H 는 기각하고

대립(연구)가설 1H 을 채택한다.

유의확률에 의한 검정: 유의확률은 [ (6.953)] 0.002tP F 이다. 이것은 유의수준 0.05 보다 작

기 때문에 귀무(영)가설 0H 는 기각하고 대립(연구)가설 1H 을 채택한다. 즉 유의수준 0.05 (신뢰

수준 95%)에서 재료에 따라 제품의 수율은 다르다고 할 수 있다.

(d) <사후 분석>

0H 가 기각되면 각각의 모평균 차에 대한 신뢰구간을 결정하는 사후 분석이 필요하다.

차에 대한 신뢰범위(신뢰한계)는 다음과 같다. 모평균 차

1 278.33 80.50 2.17y y

1 378.33 84.33 6.0y y

Page 14: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

208

1 478.33 75.33 3.0y y

2 380.50 84.33 3.83y y

2 480.50 75.33 5.17y y

3 44.33 75.33 9.0y y

표준오차(Standard Error): 2 2(12.375)

2.0316

EVD

n

모평균차에 대한 검정통계량

1 2 1 212

( ) 2.171.068

2.0312 /E

y y y yT

DV n

13

62.954

2.031T

,

14

3.01.477

2.031T ,

23

3.831.886

2.031T

,

24

5.172.546

2.031T ,

34

9.04.431

2.031T

※ t -분포: http://www.statdistributions.com/t/

(1) ( , ) (20,0.025)2

Et t

(a) [p-value] box에 0.05 입력.

(b) [d.f.] box에 20 입력.

(c) [two tails]를 선택.

[t-value] box에서 2.086 을 얻는다.

( , ) (20,0.025) 2.0862

Et t

(2) 12 13, 34, ,T T T 확률(유의확률)

(a) [d.f.] box에 20 입력

(b) [two tails] 선택

(c) [ t -value] box에 1.068, 2.954, 1.477, 1.886, 2.546, 4.431을 각각 입력

[p-value] box에서 다음의 확률을 얻는다.

12( 1.068) 0.298p T , 13( 2.954) 0.008p T , 14( 1.477) 0.155p T

23( 1.886) 0.074p T , 24( 2.546) 0.019p T

34( 4.431) 0.000p T

양쪽 검정 구간공식: 2 2

( ) ( , ) ( ) ( , )2 2

E EE i r Ei r i r

V Vy y t y y t

n n

여기서 1 2 3 4 6n n n n n , 23 3 20E T A , 0.05 , 12.375EV

2( , ) (2.086)(2.031) 4.24

2

EE

Vt

n

Page 15: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

209

구간계산 평균차 신뢰구간 유의확률

1 22.17 4.24 2.17 4.24 1 26.41 2.07 0.298

1 36.00 4.24 6.00 4.24 1 310.24 1.76 0.008

1 43.00 4.24 3.00 4.24 1 41.24 7.24 0.155

2 33.83 4.24 3.83 4.24 2 38.07 0.41 0.074

2 45.17 4.24 5.17 4.24 2 40.93 9.41 0.019

3 49.00 4.24 9.00 4.24 3 44.76 13.24 0.000

검정결과: 12 13 34, , ,T T T 의 유의확률로 보면 1 과 2 ,

1 과 4 , 그리고 2 와 3 가 유의수준

0.05에서 같다고 할 수 있고 다른 것은 같다고 할 수 없다.

SPSS 통계처리 [12_1_재료수율.sav]

SPSS 데이터 편집기에 표 [12_3]의 데이터를 변수명 [재료]: 1=”재료1”, 2=”재료2”, 3=”재료3”,

4=”재료4”로 구분하고, 해당하는 수율을 변수명 [수율]로 각각 입력하여 통계들을 구한다.

분석>평균비교>일원배치 분산분석

보조창에서 [수율]을 종속변수, [재료]를 요인으로 각각 이동. 옵션단추를 눌러 모수 및 변량효과

를 제외한 통계량을 모두 선택. 계속>확인

일원배치 분산분석 결과

기술통계

수율

6 78.33 3.141 1.282 75.04 81.63 74 83

6 80.50 3.619 1.478 76.70 84.30 75 85

6 84.33 3.386 1.382 80.78 87.89 79 88

6 75.33 3.882 1.585 71.26 79.41 70 81

24 79.63 4.689 .957 77.65 81.60 70 88

재료1

재료2

재료3

재료4

합계

N 평균표준편차

표준오차 하한값 상한값

평균에 대한 95% 신뢰구간

최소값 최대값

분산의 동질성에 대한 검정

수율

.139 3 20 .936

Levene 통계량 자유도1 자유도2 유의확률

분산분석

수율

258.125 3 86.042 6.953 .002

247.500 20 12.375

505.625 23

집단-간

집단-내

합계

제곱합 자유도 평균제곱 F 유의확률

Page 16: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

210

평균 동질성 검정

수율

6.019 3 11.081 .011

6.953 3 19.525 .002

Welch

Brown-Forsythe

통계량a 자유도1 자유도2 Sig.

비동시적 F 분포a.

평균 도표

검정결과

(1) Levene’s test는 유의확률이 0.936으로 유의수준 0.05보다 크기 때문에 자료들은 등분산이다.

따라서 평균 동질성 검정, 즉 Welch, Brown-Forsythe 검정은 사용하지 않는다.

(2) SPSS에서 얻은 분산분석표 내용은 위에서 이론으로 계산한 값과 동일하다. 여기서 분산분석

tF 의 유의확률 0.002 는 유의수준 0.05 보다 작기 때문에 0H 가 기각된다. 즉 제품의 수율은

재료에 따라 다르다.

<사후 분석>

1H 이 채택될 경우 평균 값들의 대소관계를 파악하는 방법을 다중비교라고 하며, 이는 자료가 등

분산일 때 분산분석표에서 검정한 결과가 평균의 차이를 인정한 경우나 이분산인 경우 Welch와

Brown-Forsythe의 검정에서 둘다 유의한 경우만 실시하는 절차이다.

사후분석은 등분산인 경우: LSD, Scheffe, Tukey, S-N-K, Duncan, …

이분산인 경우: Tamhane, T2, Dunnet, T3, Games-Howell, Dunnett의 C.

중에서 합당하다고 생각하는 것을 선별하여 출력한다.

Page 17: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

211

[도움말] 일원배치 분산분석 사후분석 검정

평균들 간에 차이가 있다고 판단되면 사후분석 범위 검정과 대응별 다중비교를 수행하여 차이가 나

는 평균을 판별할 수 있습니다. 범위 검정은 차이가 없는 평균의 동일 집단군을 식별하며, 대응별

다중 비교는 각 대응 평균 간 차이를 검정하고 유의수준 0.05 에서 다른 집단 평균이 유의하다는

것을 행렬에 별표로 나타냅니다.

분석>평균비교>일원배치 분산분석

재설정을 누르고 [수율]을 종속변수로, [재료]를 요인으로 이동

사후분석을 클릭하고 등분산을 가정함 중에서 “LSD”와 “Duncan”을 선택. 계속>확인

사후 분석 결과

다중 비교

종속변수: 수율

LSD

-2.167 2.031 .299 -6.40 2.07

-6.000* 2.031 .008 -10.24 -1.76

3.000 2.031 .155 -1.24 7.24

2.167 2.031 .299 -2.07 6.40

-3.833 2.031 .074 -8.07 .40

5.167* 2.031 .019 .93 9.40

6.000* 2.031 .008 1.76 10.24

3.833 2.031 .074 -.40 8.07

9.000* 2.031 .000 4.76 13.24

-3.000 2.031 .155 -7.24 1.24

-5.167* 2.031 .019 -9.40 -.93

-9.000* 2.031 .000 -13.24 -4.76

(J) 재료재료2

재료3

재료4

재료1

재료3

재료4

재료1

재료2

재료4

재료1

재료2

재료3

(I) 재료재료1

재료2

재료3

재료4

평균차 (I-J) 표준오차 유의확률 하한값 상한값

95% 신뢰구간

.05 수준에서 평균차가 큽니다.*.

동일 집단군

수율

6 75.33

6 78.33 78.33

6 80.50 80.50

6 84.33

.155 .299 .074

재료재료4

재료1

재료2

재료3

유의확률

DuncanaN 1 2 3

유의수준 = .05에 대한 부집단

동일 집단군에 있는 집단에 대한 평균이 표시됩니다.

조화평균 표본 크기 = 6.000을(를) 사용a.

사후분석 결과: LSD의 다중비교를 보면 앞서 이론으로 계산한 모평균 차의 신뢰구간과 유의확률

이 동일함을 알 수 있다. Duncan의 동일 집단군 비교는 평균이 가장 작고 유의확률이 0.05를 넘

는 것을 짝을 지어 비교한 결과이다. 예를 들면 재료4와 재료1은 평균이 각각 75.33과 78.33이고

유의확률은 0.155로 유의수준 0.05보다 크기 때문에 유의수준 내에서 두 평균은 같다고 할 수 있

다. 다른 것도 같은 방법으로 해석한다.

Page 18: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

212

12.2.2 반복수가 다른 경우의 일원배치법

실험 횟수가 같지 않거나 결측치가 있는 경우로 자료의 구조는 표 [12-1]에서 시험횟수만 n 이

in 로 대치된다. 그리고 검정 방법도 시험횟수가 같은 경우와 동일하다.

반복수가 다른 일원배치법의 구조모형

i j i i jy a , ( 1,2, ,i k ), ( 1,2, , ij n )

총 평균: 1

1 k

i

ik

ia : i 번째 처리효과, 단 0i in a

i j : 실험오차이며, 독립적이고 2(0, )N 이다.

자료의 총 개수: 1

i

k

i

N n

변동분해 및 표시

반복수가 같은 경우와 마찬가지로 다음과 같이 표시된다.

2

1 1

( ) ( )T i j

ink

i j

S SST y y

2 2

1 1 1

[( ) ( )i j ii i

ink k

i j i

y y n y y

( ) ( ) ( )T A ES SST S SSA S SSE

총변동(total variance): 2

1 1

( )T i j

ink

i j

S y y

급간변동(variation between group): 2

1

( )A i i

k

i

S n y y

급내변동(variation within group): 2

1 1

[( )E i j i

ink

i j

S y y

또는 E T AS S S

변동의 자유도

TS 의 자유도(총 자유도): 1T N

AS 의 자유도: 1A k

ES 의 자유도: E N k

AS 와 ES 를 자유도로 나누어 분산으로 나타내면 이것은 각각 처리평균 제곱( A AMSA MS V )

과 잔차평균제곱( E EMSE MS V )이다. 여기서 M 은 mean(평균)을 의미한다.

분산의 표시

처리평균제곱: 1

AA

SV

k

Page 19: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

213

잔차평균제곱: EE

SV

N k

검정통계량 tF : A

t

E

VF

V

이들을 종합하여 표로 나타내면 다음과 같다.

표 [12-7] 반복수가 같지 않은 일원배치법의 분산분석표

변동요인 제곱합( SS ) 자유도 평균제곱 tF 값

처리

오차

( )AS SSA

( )ES SSE

1A k

E N k

( ) /A A A AV MS S

( ) /E E E EV MS S /A EV V

합계 ( )TS SST 1T N

검정: 유의수준 일 때 검정통계량 tF 가 ( , ; )t A EF F 이면 귀무(영)가설 0H 가 기각되고

대립가설 1H 이 채택된다. 즉 요인이 측정치에 영향을 미친다(요인의 수준간에 유의한 차이가 있

다)고 결론을 내릴 수 있다. 그 이후의 방법은 반복수가 같은 경우와 동일하다.

SPSS 통계처리 문제

(반복수가 다른 경우 일원분산분석 예1)

[보기 12_2] 세 대의 기계에서 생산되는 공구들의 파괴강도가 차이가 있는지를 알아보기 위하여

다음과 같은 실험값들을 수집하였다. 이론으로 아래 내용을 각각 계산하고, SPSS 통계프로그램에

서 얻은 결과와 비교하라. 여기서 유의수준은 0.05 (양쪽검정)이다.

(a) 수준별 그리고 전체에 대한 표준편차와 표준오차 그리고 모평균이 가질 수 있는 값의 범위.

(b) Levene’s test에 의한 수준간 등분산 검정.

(c) 분산분석에 의한 평균검정.

(d) 1H (모평균이 다름)이 채택될 경우의 사후분석으로 모평균차 범위.

표 [12-8] 파괴강도 데이터

기계 1 36 41 42 49

기계 2 40 48 39 45 44

기계 3 35 37 42 34 32

(풀이) (a) <표준편차, 표준오차 및 신뢰범위>

기계1은 1A , 기계 2 는 2A , 기계 3 은 3A 로 하고 하나의 요인효과인 파괴강도 평균을 각각 1y ,

2y , 3

y 그리고 총 평균을 y 로 표시하며, 계산을 위해 다음의 계산용표를 참고하자.

Page 20: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

214

표 [12-9]: 요인별 파괴강도 계산표

처리군

실험횟수

인자(요인)의 수준(기계의 종류)

1A 2A 3A

1

2

3

4

5

36 40 35

41 48 37

42 39 42

49 45 34

44 32

각 값은 기계에

따른 제품의 강도

합계 1T 168 2T 216 3T 180 T 564

평균 1y 42 2

y 43.2 3y 36 y 40.286

표준편차 1s 5.354 2s 3.701 3s 3.808 s 5.150

표준오차 1D 2.677 2D 1.655 3D 1.703 D 1.377

수준(집단)별 자유도: 1 4 1 3 , 2 5 1 4 , 3 5 1 4

총자유도: 14 1 13T

수준(집단)별 분산, 표준편차 및 표준오차: 5

2 2 2 2

1 1 1

11

1 1 1( ) [(36 42) (49 42) ] (86) 28.667

3 3j

j

s y y

6

2 2 2 2

2 2 2

12

1 1 1( ) [(40 43.2) (44 43.2) ] (54.8) 13.70

4 4j

j

s y y

4

2 2 2 2

3 3 3

13

1 1 1( ) [(35 36) (32 36) ] (58) 14.50

4 4j

j

s y y

표준편차 표준오차( /i i iD s n )

1 28.667 5.354s 1 2.677D

2 13.70 3.701s 2 1.655D

3 14.50 3.808s 3 1.703D

전체 분산, 표준편차 및 표준오차:

42 2 2 2

1

1 1( ) [(36 40.286) (32 40.286) ]

13

in

i j

i jT

s y y

1

(344.857) 26.52813

26.528 5.150s 1.377D

※ t -분포: http://www.statdistributions.com/t/

(3,0.025)t , (4,0.025)t , (13,0.025)t 분포 양쪽검정 값

Page 21: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

215

(a) [p-value] box에 0.05 입력.

(b) [two tails] 선택

(c) [d.f.] box에 3, 4, 13을 각각 입력

[ t -value] box에서 3.182, 2.777, 2.161을 차례로 얻을 수 있다.

1( , ) (3,0.025) 3.1822

t t

2 3( , ) ( , ) (4,0.025) 2.7772 2

t t t

( , ) (13,0.025) 2.1612

Tt t

양쪽검정 구간공식: ( , ) ( , )2 2

i i i i ii iy t D y t D

계 산 수준별 구간범위

142 (3.182)(2.677) 42 (3.182)(2.677) 133.48 ( ) 50.52A

243.2 (2.777)(1.655) 43.2 (2.777)(1.655) 238.61 ( ) 47.79A

336 (2.777)(1.703) ) 36 (2.777)(1.703) 331.27 ( ) 40.73A

전체 모평균 범위

40.286 (2.1604)(1.377) 40.286 (2.1604)(1.377) 37.31 ( ) 43.26A

(b) <Leven’s test(등분산 검정)>

귀무(영)가설 0H : 1 2 3 (각 집단에 대한 분산이 동일하다).

대립(연구)가설 1H : 3 개 중 하나 이상 다른 분산이 존재한다.

Levene의 검정통계량:

2

1

2

1 1

( ) ( )

( 1) ( )

k

iiiL k n

ii ji j

i

N k n z zF

k z z

분산분석은 수준간에 등분산을 가정한 분석이므로 제일 먼저 해야할 일은 Levene의 등분산 검정

이다. 여기서는 자료가 크지 않기 때문에 Levene’s test를 이해하기 위하여 자세히 계산하였다.

i jz 는 | |i j i j iz y y 로 만들어지는 값들로 다음과 같이 계산한다.

i jz components를 만드는 방법, 그리고 이들에 의한 i jz 표.

11 11 1| | | 36 42 | 6z y y

12 12 1| | | 41 42 | 1z y y

13 13 1| | | 42 42 | 0z y y

34 34 3| | | 34 36 | 2z y y

35 35 3| | | 32 36 | 4z y y

Page 22: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

216

이들 값에 의해 만들어진 Leven’s test i jz 표는 다음과 같다.

표 [12-10] Levene’s test i jz 표

1 jz 2 jz

3 jz 합계 평균

6 3.2 1

1 4.8 1

0 4.2 6

7 1.8 2

0.8 4

합계 14 14.8 14 42.8

평균 1z 3.5 2z 2.96 3z 2.8 z 3.057

3 2 2 2 2 2

1 1( ) (6 3.5) (1 3.5) (0 3.5) (7 3.5)

in

ii ji jz z

2 2 2 2(3.2 2.96) (4.8 2.96) (4.2 2.96) (1.8 2.96) (0.8 2.96)

2 2 2 2 2(1 2.8) (1 2.8) (6 2.8) (2 2.8) (4 2.8)

66.792

3 2 2 2 2

1( ) 4 (3 . 5 3 . 057 ) 5( 2 . 96 3 . 057 ) 5( 2 . 8 3 . 057 )iii

n z z

0.785 0.047 0.330 1.162

Lenene 검정통계량:

2

1

2

1 1

( ) ( ) (14 3)(1.162)0.0957

(3 1)(66.792)( 1) ( )

k

iiiL k n

ii ji j

i

N k n z zF

k z z

자유도 1 3 1 2A k , 14 3 11E N k 및 유의수준 0.05 의 F 분포 경계값:

( 1, ; ) ( 2, 11; 0 .05) 3 .982F k N k F

※ F -분포: http://www.statdistributions.com/f/

1 2( , ; ) (2,11.0.05)F F 의 값과 0.0957LF 의 확률(유의확률).

(1) 1 2( , ; ) (2,11.0.05)F F 의 값

(a) [p-value] box에 0.05 입력.

(b) [numerator d.f.] box에 2 입력.

(c) [denominator d.f.] box에 11 입력.

(d) [right tail]을 선택.

[F-value] box에서 3.982를 얻을 것이다.

(2) 0957LF 의 확률(유의확률)

(a) [F-value] box에 0.0957 입력.

(b) [numerator d.f.] box에 2 입력.

Page 23: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

217

(c) [denominator d.f.] box에 11 입력.

(d) [right tail]을 선택.

[p-value] box에서 0.909 를 얻을 것이다.

Levene’s test 결과: 0.0957 (2,11;0.05) 3.982LF F 이므로 수준(집단)간의 자료들은 등분

산이다. 또한 유의확률 ( 0.0957) 0.909p F 는 유의수준 0.05 보다 크기 때문에 oH 가 채

택된다. 따라서 수준간 분산은 등분산이므로 다음의 분산분석이 가능하다.

(b) <분산분석>

가설 및 가설을 검증하기 위한 변동계산

귀무(영)가설 0H : 1 2 3 (기계에 따라 강도에 영향을 미치지 않는다.)

대립(연구)가설 1H : 최소 한 기계 이상은 강도에 영향을 미친다.

총변동: 2 2 2

1 1

( ) (36 40.286) (41 40.286) (49 40.286)T i j

ink

i j

S y y

2 2 2( 40 40.286) ( 48 40.286) ( 44 40.286)

2 2 2(35 40.286) (37 40.286) (32 40.286) 344.86

급간변동: 2 2 2 2

1

( ) 4(42 40.286) 5(43.2 40.286) 5(36 40.286)A i i

k

i

S n y y

146.06

급내변동:

344.86 146.06 198.80E T AS S S

자료 수: 1 4n , 2 5n , 3 5n

총 자료수: 4 5 5 14N

수준 수: 3k

변동의 자유도

1 14 1 13T N

1 3 1 2A k

14 3 11E N k

처리평균제곱: 146.057

73.0292

AA

A

SV

잔차평균제곱: 198.80

18.07311

EE

E

SV

검정통계량: 73.029

4.04118.073

At

E

VF

V

계산된 값들에 의한 분산분석표는 다음과 같다.

Page 24: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

218

표 [12-11] 수준 3인 기계강도의 분산분석표

변동요인 제곱합( SS ) 자유도 평균제곱 tF 값 유의확률

구룹간

구룹내

AS 146.057

ES 198.800

A 2

E 11

AV 73.029

EV 18.073 4.041 0.048

합계 TS 344.857

T 13

자유도 2A , 11E 과 유의수준 0.05 에 대한 F 분포의 값:

( , ; ) (2,11; 0.05) 3.982A EF F

※ F -분포: http://www.statdistributions.com/f/

1 2( , ; ) (2,11;0.05)F F 의 값과 LF 의 확률(유의확률)

(1) 1 2( , ; ) (2,11;0.05)F F 의 값

(a) [p-value] box에 0.05 입력.

(b) [numerator d.f.] box에 2 입력.

(c) [denominator d.f.] box에 11 입력.

(d) [right tail]을 선택.

[F-value] box에서 3.982을 얻을 것이다.

(2) 4.041tF 의 확률(유의확률)

(a) [F-value] box에 4.041 입력.

(b) [numerator d.f.] box에 2 입력.

(c) [denominator d.f.] box에 11 입력.

(d) [right tail]을 선택.

[p-value] box에서 0.048를 얻을 것이다.

검정결과: 4.041 (2,11;0.05) 3.982F F 이므로 0H 가 기각되고 1H 이 채택된다. 똑 같은

논리로 유의확률 ( 4.041) 0.048P F 은 유의수준 0.05 보다 작기 때문에 oH 가 기각되고

1H 이 채택된다. 즉 “기계에 따라 제품의 강도에 영향을 미친다”고 말할 수 있다. 다른 말로하면

“기계에 따라 제품의 강도가 유의미하다”이다.

(c) <사후 분석>

0H 가 기각되면 수준간 평균차의 신뢰구간, 검정통계량 및 이에 대한 신뢰수준을 구한다.

두 수준(집단)간 평균차의 검정통계량: ( )

2 /

i r

E i r

y yT

V n

두 수준(집단)간 평균차의 신뢰수준: ( ) ( )

( , ) ( , )2 22 /

i ri rE E

E ir

y yt T t

V n

Page 25: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

219

위의 수식을 양쪽검정 모평균차에 대한 것으로 다시 쓰면 다음과 같다.

2 2

( ) ( , ) ( ) ( , )2 2

E EE i r Ei r i r

i r i r

V Vy y t y y t

n n

여기서 i rn 은 두 수준(집단)간 실험횟수를 조화평균한 값이다.

실험 횟수: 1 4n , 2 3 5n n

실험(1, 2 ), 또는 실험(1,3 )의 조화평균 실험횟수: 12 13

2 24.444

(1/ 4) (1/ 5) 0.45n n

실험( 2 ,3 )의 조화평균 실험횟수: 23

2 3

2 25

(1/ ) (1/ ) (1/ 5) (1/ 5)n

n n

표준오차(Standard Error: SE D 로 표시):

1 2 1 3

12

2 2(18.073)2.852

4.444

EVD D

n

23

23

2 2(18.073)2.689

5

EVD

n

계산값:

1 2 1 3

12

2( , ) (11,0.025) (or ) (2.201)(2.852) 6.277

2

EE

Vt t D D

n

23

23

2( , ) (11,0.025) (2.201)(2.689) 5.918

2

EE

Vt t D

n

검정통계량

1 212

12

( ) 42 43.20.4208

2.8522 /E

y yT

V n

1 313

13

( ) 42 362.104

2.8522 /E

y yT

V n

2 323

23

( ) 43.2 362.6776

2.6892 /E

y yT

V n

※ t -분포: http://www.statdistributions.com/t/

(1) ( , ) (11,0.025)2

Et t

(a) [p-value] box에 0.05 입력.

(b) [d.f.] box에 11 입력.

(c) [two tails]를 선택.

[t-value] box에서 2.201을 얻을 것이다.

(2) 12 13,T T 와 23T 유의확률

(a) [d.f.] box에 11 입력

Page 26: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

220

(b) [two tails] 선택

(c) [ t -value] box에 0.4208, 2.104, 2.6776를 각각 입력

[p-value] box에 다음의 확률을 각각 얻을 수 있다.

12( 0.4208) 0.682p T

13( 2.104) 0.059p T

23( 2.776) 0.021p T

모편균차 구간 계산 모평균 차의 신뢰구간 신뢰확률

1 21.2 6.277 1.2 6.277

1 27.48 5.08 모 0.682

1 36 6.277 6 6.277

1 30.28 12.28 0.059

2 37.2 5.918 7.2 5.918

2 31.28 13.12 0.021

위의 계산 값들을 SPSS 통계에서 확인하자.

SPSS 통계처리 [12_2_strength.sav]

분석>평균비교>일원배치 분산분석

보조창이 뜨면 [파괴강도]를 종속변수로, [기계종류]를 요인으로 각각 이동.

옵션단추를 눌러 통계량 모두를 선택.

계속>확인

일원배치 분산분석 결과

기술통계

파괴강도

4 42.00 5.354 2.677 33.48 50.52 36 49

5 43.20 3.701 1.655 38.60 47.80 39 48

5 36.00 3.808 1.703 31.27 40.73 32 42

14 40.29 5.150 1.377 37.31 43.26 32 49

4.251 1.136 37.78 42.79

2.297 30.40 50.17 11.837

기계 1

기계 2

기계 3

합계

고정형식 효과

변량효과

모형

N 평균표준편차

표준오차 하한값 상한값

평균에 대한 95% 신뢰구간 최소

값최대값 성분-간 분산

분산의 동질성에 대한 검정

파괴강도

.096 2 11 .909

Levene 통계량 자유도1 자유도2 유의확률

Page 27: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

221

분산분석

파괴강도

146.057 2 73.029 4.041 .048

198.800 11 18.073

344.857 13

집단-간

집단-내

합계

제곱합 자유도 평균제곱 F 유의확률

평균 동질성 검정

파괴강도

4.455 2 6.628 .059

3.783 2 8.240 .068

Welch

Brown-Forsythe

통계량a 자유도1 자유도2 Sig.

비동시적 F 분포a.

평균 도표

분석: (1) 먼저 “분산의 동질성에 대한 검정”을 보면 유의확률이 0.909 으로 유의수준

0.05 보다 크기 때문에 등분산이 가정되어 “평균 동질성 검정의 Welch와 Brown-

Forsythe”의 분석은 사용하지 않는다.

(2) 분산분석표에서 유의확률은 0.048이므로 유의수준 0.05보다 낮아 0H 가 기각된다. 즉, “세

대의 기계에서 생산되는 공구들의 파괴강도는 차이가 있다.”는 결론을 얻는다.

사후 분석: oH 가 기각되고 1H 이 채택되었기 때문에 사후 분석으로 평균 값들의 대소관계를 파

악한다.

분석>평균비교>일원배치 분산분석>사후 분석

등분산을 가정함에서 LSD와 Duncan을 선택. 계속>확인

Page 28: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

222

사후 분석 결과

다중 비교

종속변수: 파괴강도

-1.200 2.852 .682 -7.48 5.08

6.000 2.852 .059 -.28 12.28

1.200 2.852 .682 -5.08 7.48

7.200* 2.689 .021 1.28 13.12

-6.000 2.852 .059 -12.28 .28

-7.200* 2.689 .021 -13.12 -1.28

(J) 기계종류기계 2

기계 3

기계 1

기계 3

기계 1

기계 2

(I) 기계종류기계 1

기계 2

기계 3

LSD평균차 (I-J) 표준오차 유의확률 하한값 상한값

95% 신뢰구간

.05 수준에서 평균차가 큽니다.*.

동일 집단군

파괴강도

Duncana,b

5 36.00

4 42.00 42.00

5 43.20

.055 .676

기계종류기계 3

기계 1

기계 2

유의확률

N 1 2

유의수준 = .05에 대한 부집단

동일 집단군에 있는 집단에 대한 평균이 표시됩니다.

조화평균 표본 크기 = 4.615을(를) 사용a.

집단 크기가 같지 않습니다. 집단크기의 조화평균이사용됩니다. 제1종 오류 수준은 보장할 수 없습니다.

b.

검정분석: (1) LSD 다중비교의 95% 신뢰구간은 이론으로 계산한 신뢰구간과 동일하고 또한 표

준오차 및 유의확률도 계산값과 같음을 확인할 수 있다. (2) Duncan의 동일 집단군 비교에서 기

계 3 과 기계 1의 유의확률은 0.055이므로 이것은 유의수준 0.05보다 크기때문에 이 수준에서 평

균이 같다고 할 수 있다. 또한 기계 1과 기계 2 는 유의확률이 0.676으로 유의수준 0.05보다 훨

씬 크기 때문에 두 평균은 서로 근접되어 있음을 수 있다.

SPSS 통계처리 문제

(반복수가 다른 경우 일원분산 분석 2)

[보기 12_3] 어느 공장에 네 종류의 기계 1 2 3 4, , ,A A A A 가 있다. 각 기계에서 생산된 제품의

강도를 측정하여 얻은 데이터가 다음 표와 같다.

(a) 집단(수준)별로 95% 신뢰구간을 구하여라.

(b) Levene의 등분산 검정통계량과 유의확률을 구하고 유의수준 0.05 에서 검정하라.

(c) 각 집단의 평균을 유의수준 0.05 에서 검정하라.

(d) 분산분석 후 귀무(영)가설이 기각되면 집단간 평균차에 대한 95% 신뢰구간과 검정통계량 및

유의확률을 구하여라.

Page 29: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

223

표 [12-12] 네 종류 기계에 의한 제품강도

처리군

실험횟수

인자의 수준(기계의 종류)

1A 2A 3A 4A

1

2

3

4

5

6

16 12 19 13

14 15 17 11

18 13 18 18

19 18 16 15

15 18

16

각 값은 기계에

따른 제품의 강도

합계 67 89 88 57 301

평균 1y 16.75 2

y 14.83 3y 17.60 4

y 14.25 y 15.84

표준편차 1s 2.217 2s 2.137 3s 1.140 4s 2.986 s 2.410

표준오차 1D 1.109 2D 0.872 3D 0.510 4D 1.493 D 0.553

(풀이) 평균, 표준편차 및 표준오차 계산은 다른 곳에서 이미 충분히 보여줬기 때문에 생략한다.

(a) 수준별 95% 신뢰구간

수준별 자유도: 1 4 1 3 , 2 6 1 5 , 3 5 1 4 , 4 4 1 3

총 자유도: 19 1 18T

※ t -분포: http://www.statdistributions.com/t/

(3,0.025)t , (4,0.025)t , (5,0.025)t 및 (18,0.025)t 의 값.

(a) [p-value] box에 0.05 입력.

(b) [two tails] 선택.

(c) [d.f.] box에 3, 5, 4 및 18을 각각 입력.

[ t -value] box에서 아래의 값들을 차례로 얻을 수 있다.

1 4( , ) ( , ) (3,0.025) 3.1822 2

t t t

2( , ) (5,0.025) 2.5712

t t

3( , ) (4,0.025) 2.7772

t t

( , ) (18,0.025) 2.1012

Tt t

구간 공식: ( , ) ( ) ( , )2 2

i i i i ii iy t D A y t D

Page 30: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

224

계 산 수준별 구간범위

116.75 (3.182)(1.109) 16.75 (3.182)(1.109) 113.22 20.28

214.833 (2.571)(0.872) 14.833 (2.571)(0.872) 212.59 17.07

317.60 (2.777)(0.510) 17.60 (2.777)(0.510) 316.18 19.02

414.25 (3.182)(1.493) 14.25 (3.182)(1.493) 49.50 19.00

전체 평균 범위

15.842 (2.101)(0.553) 15.842 (2.101)(0.553) 14.68 17.00

(b) <Levene’s test>

분산분석은 집단(수준)간에 등분산이 전제되어야만 검정이 가능하다.

귀무(영)가설 0H : 1 2 3 4 (각 집단에 대한 분산이 동일하다).

대립(연구)가설 1H : 4 개 중 하나 이상 다른 분산이 존재한다.

귀무가설의 채택 여부는 Levene의 검정통계량에 의해 이루어진다.

등분산을 검증하는 Levene’s test | |i j i j iz y y 표는 다음과 같다.

표 [12-13] Levene’s test 표

1 jz 2 jz

3 jz 4 jz 합계 평균

0.75 2.833 1.4 1.25

2.75 0.167 0.6 3.25

1.25 1.833 0.4 3.75

2.25 3.167 1.6 0.75

0.167 0.4

1.167

합계 7 9.334 4.4 9 29.734

평균 1z 1.75 2z 1.556 3z 0.88 4z 2.25 z 1.565

Levene 검정 통계량:

2

1

2

1 1

( ) ( )

( 1) ( )

k

iiiL k n

ii ji j

i

N k n z zF

k z z

여기서 계산 값들은 다음과 같다.

2

1 1( ) 18.641

k n

ii ji j

i z z

2 2 2 2 2

1( ) 4(1.75 1.565) 6(1.556 1.565) 5(0.88 1.565) 4(2.25 1.565)

k

iiin z z

4.3604

Page 31: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

225

표 [12-14] Levene’s test 계산값 표

211( )jz z

222( )jz z

233( )jz z

244( )jz z 합계

1.0 1.630 0.2704 1.0

1.0 1.929 0.0784 1.0

0.25 0.077 0.2304 2.25

0.25 2.595 0.5184 2.25

1.929 0.2304

0.151

합계 2.5 8.313 1.328 6.5 18.641

Levene 검정통계량 계산 값: (19 4)(4.3604)

1.170(4 1)(18.641)

LF

F 분포 값: ( 1, ; ) (3,15;0.05) 3.288F k N k F

※ F -분포: http://www.statdistributions.com/f/

(1) 1 2( , ; ) (3,15;0.05)F F 의 값

(a) [p-value] box에 0.05 입력.

(b) [numerator d.f.] box에 3 입력.

(c) [denominator d.f.] box에 15 입력.

(d) [right tail]을 선택.

[F-value] box에서 3.288을 얻을 것이다.

(2) 1.1670LF 의 확률(유의확률)

(a) [F-value] box에 1.170 입력.

(b) [numerator d.f.] box에 3 입력.

(c) [denominator d.f.] box에 15 입력.

(d) [right tail]을 선택.

[p-value] box에서 0.354 를 얻을 것이다. 즉 ( 1.170) 0.354Lp F

검정결과: 1.170 (3,15;0.05) 3.288LF F 이므로 0H 가 채택된다.

유의확률로 검정하면 ( 1.170) 0.354Lp F 는 유의수준 0.05 보다 크기 때문에 oH 가 채택

된다. 즉 위의 자료 집단(수준)은 등분산이므로 분산분석이 가능하다.

(c) <분산분석>

등분산이 증명되면 다음 단계로 평균비교의 분산분석을 행한다.

귀무(영)가설 0H : 1 2 3 4 (기계에 따라 강도에 영향을 미치지 않는다.)

Page 32: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

226

대립(연구)가설 1H : 최소한 한 기계 이상은 강도에 영향을 미친다.

가설은 다음의 계산으로 분산분석표를 작성하여 검정통계량 tF 나 이에 대한 유의확률로 검정한다.

총변동:2 2 2 2

1 1

( ) (16 15.842) (14 15.842) (15 15.842)T i j

ink

i j

S y y

104.526

급간변동:

2 2 2

1

( ) 4(16.75 15.842) 6(14.833 15.842) 5(17.60 15.842)A i i

k

i

S n y y

24(14.25 15.842) 34.993

급내변동:

104.526 34.993 69.533E T AS S S

변동의 자유도: 1 4 1 3A k

19 4 15E N k

1 19 1 18T N

처리평균제곱: 34.993

11.6643

AA

A

SV

잔차평균제곱: 69.553

4.63715

EE

E

SV

검정통계량: 11.664

2.51554.637

At

E

VF

V

표 [12-15]: 분산분석표

변동요인 제곱합( SS ) 자유도 평균제곱 tF 값 유의확률

구룹간

구룹내

AS 34.993

ES 69.553

A 3

E 15

AV 11.664

EV 4.637 2.516 0.098

합계 TS 104.526 T 18

유의 수준 0.05 에 대한 F 분포의 값: ( , ; ) (3,15; 0.05) 3.29A EF F

※ F -분포: http://www.statdistributions.com/f/

(1) 1 2( , ; ) (3,15;0.05)F F 의 값

(a) [p-value] box에 0.05 입력.

(b) [numerator d.f.] box에 3 입력.

(c) [denominator d.f.] box에 15 입력.

(d) [right tail]을 선택.

[F-value] box에서 3.288을 얻을 것이다.

(2) 2.516tF 의 확률(유의확률)

(a) [F-value] box에 2.516 입력.

Page 33: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

227

(b) [numerator d.f.] box에 3 입력.

(c) [denominator d.f.] box에 15 입력.

(d) [right tail]을 선택.

[p-value] box에서 0.098를 얻을 것이다.

분산분석 결과

(1) 2.516 (3,15;0.05) 3.29tF F 이므로 0H 가 채택된다.

(2) 유의확률 ( 2.516) 0.098P F 은 유의수준 0.05 보다 크기 때문에 oH 가 채택된다. 기

계간에 생산된 제품의 강도는 유의하지 않다(기계종류에 따라 제품의 강도에 차이가 없다).

oH 가 채택되었으므로 사후분석은 필요하지 않지만 내용을 확실히 보기 위하여 사후분석을 해 보

도록 한다.

(c) <사후 분석>

여기서 사용되는 수식은 두 수준(집단) 평균차의 검정통계량과 각각의 신뢰수준이다.

두 수준(집단)간 평균차의 검정통계량: ( )

2 /

i r

E i r

y yT

V n

두 수준(집단)간 평균차의 신뢰수준: ( ) ( )

( , ) ( , )2 22 /

i ri rE E

E ir

y yt T t

V n

모 평균차에 대한 구간으로 위 수식을 다시 쓰면 다음과 같다.

2 2

( ) ( , ) ( ) ( , )2 2

E EE i r Ei r i r

i r i r

V Vy y t y y t

n n

여기서 i rn 은 두 수준(집단)간 조화평균 실험횟수이다.

실험 횟수 및 EV : 1 4 4n n , 2 6n , 3 5n , 4.637EV

실험(1, 2 ) 또는 실험( 2 , 4 )의 조화평균 실험수: 12 24

24.800

(1/ 4) (1/ 6)n n

실험(1,3 ) 또는 실험( 3 , 4 )의 조화평균 실험수: 13 34

24.4444

(1/ 4) (1/ 5)n n

실험(1, 4 )의 조화평균 실험수: 14

24.000

(1/ 4) (1/ 4)n

실험( 2 ,3 )의 조화평균 실험수: 23

25.4545

(1/ 6) (1/ 5)n

표준오차(Standard Error: SE D 로 표시)

12 24

12

2 2(4.637)1.390

4.80

EVD D

n

Page 34: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

228

13 34

13

2 2(4.637)1.445

4.444

EVD D

n

14

14

2 2(4.637)1.523

4

EVD

n

23

23

2 2(4.637)1.3039

5.4545

EVD

n

평균 차

1 216.75 14.83 1.92y y

1 316.75 17.60 0.85y y

1 416.75 14.25 2.50y y

2 314.83 17.60 2.77y y

2 414.83 14.25 0.58y y

3 417.60 14.25 3.35y y

검정통계량

1 2 1 212

1212

( ) ( ) 1.921.381

1.3902 /E

y y y yT

DV n

1 313

13

( ) 0.850.5882

1.445

y yT

D

1 414

14

( ) 2.501.642

1.523

y yT

D

2 323

23

( ) 2.772.1243

1.3039

y yT

D

2 424

24

( ) 0.580.418

1.390

y yT

D

3 434

34

( ) 3.302.285

1.445

y yT

D

※ t -분포: http://www.statdistributions.com/t/

(1) 12 13,T T , 14T , 23T , 24T , 34T 확률(유의확률)

(a) [d.f.] box에 15 입력

(b) [two tails] 선택

(c) [ t -value] box에 1.381, 0.588, 1.642, 2.124, 0.418, 2.285를 차례로 입력

[p-value] box에 다음의 확률을 각각 얻을 수 있다.

12( 1.381) 0.188p T

Page 35: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

229

13( | 0.588 |) 0.565p T

14( 1.642) 0.121p T

23( | 2.124 |) 0.051p T

24( 0.418) 0.682p T

34( 2.285) 0.037p T

(2) ( , ) (15,0.025)2

t t

(a) [p-value] box에 0.05 입력.

(b) [d.f.] box에 15 입력.

(c) [two tails]를 선택.

[t-value] box에서 2.132 를 얻을 것이다. 즉 ( , ) (15,0.025) 2.1322

Et t

1 2 2 4

12

2( , ) (15,0.025) (or ) (2.132)(1.390) 2.964

2

EE

Vt t D D

n

1 3 3 4(15, 0 .025) ( or ) ( 2 .132) (1 .445) 3 .080t D D

14(15,0.025) (2.132)(1.523) 3.247t D

23(15,0.025) (2.132)(1.304) 2.780t D

평균차 구간: 2 2

( ) ( , ) ( ) ( , )2 2

E EE i r Ei r i r

i r i r

V Vy y t y y t

n n

모평균차 구간계산 95% 신뢰구간 (유의확률)

1 21.92 2.964 1.92 2.964

1 21.04 4.88 (0.188)

1 30.85 3.080 0.85 3.080

1 33.93 2.23 (0.565)

1 42.50 3.247 2.50 3.247

1 40.75 5.75 (0.121)

2 32.77 2.780 2.77 2.780

2 35.55 0.01 (0.051)

2 40.58 2.964 0.58 2.964

2 42.38 3.54 (0.682)

3 43.35 3.080 3.35 3.080

3 40.27 6.43 (0.037)

SPSS 통계처리 [12_3_제품강도.sav]

SPSS 데이터 편집기에 [표 12_12]의 데이터를 변수명 [기계종류]에 1=”기계1”, 2=”기계2”, 3=”

기계3”, 4=”기계4”로 구분하고 그에 해당하는 수율을 변수명 [제품강도]로 각각 입력하여 통계값

들을 구한다.

분석>평균비교>일원배치 분산분석

보조창이 뜨면 [제품강도]를 종속변수로, [기계종류]를 요인으로 각각 이동.

옵션단추를 눌러 통계량 중 모수 및 변량효과를 제외하고 모두 선택. 계속>확인

Page 36: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

230

일원배치 분산분석 결과 (반복수가 같지 않은 자료의 분산분석)

기술통계

제품강도

4 16.75 2.217 1.109 13.22 20.28 14 19

6 14.83 2.137 .872 12.59 17.08 12 18

5 17.60 1.140 .510 16.18 19.02 16 19

4 14.25 2.986 1.493 9.50 19.00 11 18

19 15.84 2.410 .553 14.68 17.00 11 19

기계1

기계2

기계3

기계4

합계

N 평균표준편차

표준오차 하한값 상한값

평균에 대한 95% 신뢰구간

최소값 최대값

분산의 동질성에 대한 검정

제품강도

1.169 3 15 .354

Levene 통계량 자유도1 자유도2 유의확률

분산분석

제품강도

34.993 3 11.664 2.516 .098

69.533 15 4.636

104.526 18

집단-간

집단-내

합계

제곱합 자유도 평균제곱 F 유의확률

평균 동질성 검정

제품강도

2.912 3 7.048 .110

2.332 3 9.489 .139

Welch

Brown-Forsythe

통계량a 자유도1 자유도2 Sig.

비동시적 F 분포a.

검정결과 분석: (1) 분산의 동질성 검정(Levene’s test)은 유의확률이 0.354 로 유의수준 0.05보

다 크기 때문에 수준간의 자료는 등분산이 가정된다. 따라서 비모수 통계인 중앙값으로 계산한 평

균 동질성 검정의 Welch나 Brown-Forsythe 분석은 필요하지 않다.

(2) 분산분석의 내용을 보면 이론으로 계산한 값과 동일하고, 유의확률 0.098 은 유의수준

0.05 보다 크기 때문에 0H 가 채택되며 그 결과 사후분석은 하지 않는 것이 일반적이다. 필

요하다면 앞의 보기문제처럼 다음과 같이 사후분석을 할 수도 있다.

<사후 분석>

분석>평균비교>일원배치 분산분석

재설정을 누른 후 [파괴강도]를 종속변수로, [기계종류]를 요인으로 이동

사후분석을 누르고 등분산을 가정함에서 LSD와 Duncan을 선택.

계속>확인

Page 37: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

231

사후 분석 결과

다중 비교

종속변수: 제품강도

1.917 1.390 .188 -1.05 4.88

-.850 1.444 .565 -3.93 2.23

2.500 1.522 .121 -.74 5.74

-1.917 1.390 .188 -4.88 1.05

-2.767 1.304 .051 -5.55 .01

.583 1.390 .681 -2.38 3.55

.850 1.444 .565 -2.23 3.93

2.767 1.304 .051 -.01 5.55

3.350* 1.444 .035 .27 6.43

-2.500 1.522 .121 -5.74 .74

-.583 1.390 .681 -3.55 2.38

-3.350* 1.444 .035 -6.43 -.27

(J) 기계종류기계2

기계3

기계4

기계1

기계3

기계4

기계1

기계2

기계4

기계1

기계2

기계3

(I) 기계종류기계1

기계2

기계3

기계4

LSD평균차 (I-J) 표준오차 유의확률 하한값 상한값

95% 신뢰구간

.05 수준에서 평균차가 큽니다.*.

동일 집단군

제품강도

4 14.25

6 14.83 14.83

4 16.75 16.75

5 17.60

.114 .083

기계종류기계4

기계2

기계1

기계3

유의확률

DuncanN 1 2

유의수준 = .05에 대한 부집단

동일 집단군에 있는 집단에 대한 평균이 표시됩니다.

평균 도표

Page 38: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

232

[일원배치 분산분석 교과서 예제(p326)]

SPSS 통계처리 [지역조사.sav]

응답자의 학력에 따라 평균연령의 차이가 모집단의 평균차이에 의한 것인지(유의미 한지), 우연히

표본의 평균 차이에 의한 것이지를 알아 본다.

분석>평균비교>일원배치 분산분석

보조창이 뜨면 [연령]을 종속변수로, [학력]을 요인으로 이동

옵션을 선택하여 통계량 중에서 모수 및 변량효과를 제외시키고 모두 선택.

사후분석을 누름

보조창이 뜨면 등분산을 가정하지 않음 에서 Dunnett T3를 선택.

계속>확인

일원배치 분산분석 결과

기술통계

연령

34 58.74 15.54 2.665 53.31 64.16 21 85

68 47.19 9.975 1.210 44.78 49.61 28 70

275 39.64 10.37 .625 38.41 40.87 18 75

212 34.74 11.25 .772 33.21 36.26 19 76

15 39.20 8.922 2.304 34.26 44.14 29 60

604 39.83 12.43 .506 38.84 40.83 18 85

초등학교이하

중학교

고등학교

대학교

대학원이상

합계

N 평균표준편차

표준오차 하한값 상한값

평균에 대한 95%신뢰구간

최소값 최대값

분산의 동질성에 대한 검정

연령

3.971 4 599 .003

Levene 통계량 자유도1 자유도2 유의확률

분산분석

연령

21353.627 4 5338.407 44.493 .000

71869.816 599 119.983

93223.444 603

집단-간

집단-내

합계

제곱합 자유도 평균제곱 F 유의확률

평균 동질성 검정

연령

31.784 4 73.035 .000

39.955 4 131.897 .000

Welch

Brown-Forsythe

통계량a 자유도1 자유도2 Sig.

비동시적 F 분포a.

Page 39: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

233

평균 도표

분석: “분산의 동질성에 대한 검정”에서 유의확률은 0.03으로 유의수준 0.05보다 작기 때문에

학교수준에 대한 연령간에는 등분산이 아니다. 따라서 분산분석을 하지 않고, 이분산인 경우의 평

균차이를 검정하는 Brown-Forsythe와 Welch의 검정을 사용한다. 이때 “평균 동질성 검정”의

Brown- Forsythe와 Welch의 검정의 유의수준은 0 이므로 oH 가 기각되고 1H 이 채택된다. 즉

학교 수준간에는 연령차이가 있다. 1H 이 채택되었으므로 사후분석이 필요하다.

사후분석 결과

다중 비 교

종속변수: 연령

Dunnett T3

11.544* 2.927 .003 2.97 20.12

19.092* 2.738 .000 10.97 27.21

23.999* 2.775 .000 15.79 32.21

19.535* 3.523 .000 9.18 29.89

-11.544* 2.927 .003 -20.12 -2.97

7.548* 1.362 .000 3.66 11.44

12.455* 1.435 .000 8.37 16.54

7.991 2.602 .051 -.02 16.00

-19.092* 2.738 .000 -27.21 -10.97

-7.548* 1.362 .000 -11.44 -3.66

4.908* .994 .000 2.11 7.70

.444 2.387 1.000 -7.18 8.07

-23.999* 2.775 .000 -32.21 -15.79

-12.455* 1.435 .000 -16.54 -8.37

-4.908* .994 .000 -7.70 -2.11

-4.464 2.430 .525 -12.16 3.23

-19.535* 3.523 .000 -29.89 -9.18

-7.991 2.602 .051 -16.00 .02

-.444 2.387 1.000 -8.07 7.18

4.464 2.430 .525 -3.23 12.16

(J) 학력중학교

고등학교

대학교

대학원이상

초등학교이하

고등학교

대학교

대학원이상

초등학교이하

중학교

대학교

대학원이상

초등학교이하

중학교

고등학교

대학원이상

초등학교이하

중학교

고등학교

대학교

(I) 학력초등학교이하

중학교

고등학교

대학교

대학원이상

평균차 (I-J) 표준오차 유의확률 하한값 상한값

95% 신뢰구간

.05 수준에서 평균차가 큽니다.*.

Page 40: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

234

12.3 이원배치법(이원분산분석: two-way factorial design)

영향을 미치는 두 인자의 효과에 대하여 조사하고자 할 때 이용되는 분산분석으로 반복이 없는

경우와 반복이 있는 경우로 분류한다. 이원배치법은 두 인자 모두 모수인 경우, 한 인자는 모수,

한 인자는 변량인 경우와 두 인자 모두 변량인 경우가 있다. 이 경우에 변동계산은 모두 같으나

분산의 기대치는 다르다.

12.3.1 반복이 없는 이원배치법

인자가 모두 모수인 경우 A 인자의 수준수가 p , B 인자의 수준수가 q 인 반복이 없는 이원배치

법의 데이터 구조는 다음과 같다.

이원배치법의 구조모형(반복이 없는 경우)

i j i j i jy a b e

2~ (0, )i j Ee N 이고 서로 독립. 여기서 ( 1,2, ,i p ), ( 1,2, ,j q )

: 실험전체의 모평균

ia : 인자 A 의 i 번째 열(column) 효과

jb : 인자 B 의 j 번째 행(row) 효과

1 1

0p q

i j

i j

a b

이 실험의 자료 수 N pq 는 다음 표와 같이 배열된다.

표 [12-16] 이원배치법의 데이터 구조(반복이 없는 경우).

iAjB

1A 2A iA pA 합계 평균

1B 11y 12y 1iy 1py 1 (r)T 1(r)

y

2B 21y 22y 2iy 2 py 2 (r)T 2(r)

y

jB

1jy 2jy j iy jpy (r)jT (r)j

y

qB 1qy 2qy qiy qpy (r)qT (r)q

y

합계 1(c)T 2(c)T (c)iT (c)pT T

평균 1(c)y 2(c)

y (c)iy (c)p

y

y

※ 아래첨자 (c) 와 (r) 은 column(열)과 row(행)을 각각 나타낸다. 예로 2(c)y 와 2 (c)T 는 2 열의

평균과 2 열의 총합이다.

Page 41: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

235

인자들의 각 수준에서 데이터들의 합과 평균

i 열의 합: (c)

1

q

i i j

j

T y

i 열의 평균: (c)

1

1 q

i ji

j

y yq

j 행의 합: ( r)

1

p

j i j

i

T y

, j 행의 평균: (r)

1

1 p

i jj

i

y yp

총합(total): 1(c) 2(c) (c) 1(r) 2(r) (r)p qT T T T T T T

총 평균(total average): T

ypq

데이터 i jy 와 총평균 y 의 차이를 제곱한 후에 합하여 얻은 총제곱합은 A 의 효과에 의한 제곱

합과 B 의 효과에 의한 제곱합, 그리고 잔차 제곱합으로 다음과 같이 분해된다.

총변동(총제곱합):

2

1 1

( ) ( )p q

T i j

i j

S SST y y

급간변동

A 에 의한 급간변동( A 효과에 의한 제곱합):

2

(c)

1

( ) [ ]p

A i

i

S SSA q y y

B 에 의한 급간변동( B 효과에 의한 제곱합): 2

(r)

1

( ) [ ]q

B j

j

S SSB p y y

급내변동

잔차 제곱합: 2

(c) (r)

1 1

( ) [ ]p q

E i j i j

i j

S SSE y y y y

( )T A B ES S S S 또는 ( )E T A BS S S S

<변동 계산용 다른 공식>

(1) 수정항(Correction Term: CT ):

2TCT

N , N pq

(2) 총변동: 2

1 1

( )p q

T i j

i j

S y y

2

1 1

p q

i j

i j

y CT

(3) 급간변동:

2

(c)2

(c)

1 1 1

[ ]p q p

i

A i

i j i

TS y y CT

q

2

(r)2

(r)

1 1 1

[ ]p q q

j

B j

i j j

TS y y CT

p

(4) 급내변동: E T A BS S S S

총 자유도: 1T pq

인자 A 의 자유도: 1A p

인자 B 의 자유도: 1B q

오차 E 의 자유도: ( 1)( 1)E T A B p q

Page 42: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

236

AS , ES 를 자유도로 나누어 분산으로 나타낸 것이 처리평균제곱 ( )A AMSA MS V ,

( ) BMSB MS V 과 잔차평균제곱( ( )E EMSE MS V )이다. M 은 mean(평균)을 의미한다.

처리평균제곱 ( A 인자): 1

A AA

A

S SV

p

처리평균제곱 ( B 인자): 1

A BB

B

S SV

q

잔차평균제곱: ( 1)( 1)

E EE

E

S SV

p q

AV , BV 와 EV 의 비가 각각의 검정통계량 AF 와 BF 이다.

검정통계량: AA

E

VF

V B

B

E

VF

V

따라서 반복이 없는 이원배치의 분산분석은 다음과 같이 구성된다.

표 [12-17] 이원배치법의 분산분석표(반복이 없는 경우)

변동 요인 제곱합 자유도 평균제곱 tF 값

구룹간(처리) 인자 A

구룹간(처리) 인자 B

구룹내(오차): 잔차

( )AS SSA

( )BS SSB

( )ES SSE

1A p

1B q

( 1)( 1)E p q

( ) /A A A AV MS S

( ) /B B B BV MS S

( ) /E E E EV MS S

/A A EF V V

/B B EF V V

합 계 ( )TS SST 1T pq

검정해석: 유의수준 일 때,

( , ; )A A EF F 이면 A 에 대한 귀무(영)가설 0 ( )H A 를 기각.

( , ; )B B EF F 이면 B 에 대한 귀무(영)가설 0 ( )H B 를 기각.

이러한 경우 각각의 요인이 특성치에 영향을 미친다고 말할 수 있고 요인의 수준간에 유의한 차

가 존재한다고 결론을 내릴 수 있다.

<분산분석 후의 추정 및 검정>

( )oH A 나 ( )oH B 가 기각되면 추후 검정을 검토하여야 한다.

(1) 각 수준의 모평균 추정

(i) 모평균의 점추정

(c)

1

1 q

A i j i

ji

y yq

(r)

1

1 p

B i j j

ij

y yp

(ii) 모평균의 구간추정

(c) (c)

( , ) ( , )E EE A Ei ii

V Vy t y t

q q

Page 43: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

237

(r) (r)

( , ) ( , )E EE B Ej jj

V Vy t y t

p p

(2) 두 인자의 수준을 조합한 조건에서 모평균의 추정

(i) A 인자의 i 수준과 B 인자의 j 수준에서의 모평균의 점추정

( c ) ( r )A B i ji jy y y

(ii) A Bi j 의 구간추정

( c ) ( r ) ( c ) ( r )( ) ( , ) ( ) ( , )E EE A B Ei j i j

e ei j

V Vy y y t y y y t

n n

여기서 1

e

A B

Nn

(3) 한 인자가 모수인자, 다른 인자가 변량인자인 경우의 추정(난괴법)

분산분석은 변함 없지만 모수인자는 최적조건의 모평균을, 변량인자는 모분산을 추정한다.

(i) 모수인자 iA 수준에서의 모평균의 신뢰구간

( ) ( )( , / 2 ) ( , / 2 )B A E B A E

S A Si c i ci

V V V Vy t y t

N N

S 는 Satterthwaite 자유도:

2

2 2

( )

[( ) / ] [( ) / ]

B A ES

B B A E E

V V

V V

(ii) 변량인자 B 간의 모분산 추정: 분산분석표에서 평균제곱은

2 2

B E BV p 2

E EV

분산추정: 2

B EB

V V

p

표준편차 추정: B E

B

V V

p

[보기 12_4] 어느 공장에서 4 가지 반응온도와 3 종류의 원료에 의하여 제품의 수율에 미치는 영

향을 조사하고자 반복이 없는 이원배치법에 의하여 실험한 결과 얻은 자료가 아래 표 [12-18]이

다. 분산분석표를 작성하고 반응온도와 원료의 종류에 따라 제품의 수율이 다르다고 할 수 있는지

유의수준 0.05 에서 검정하라.

표 [12-18] A 인자(반응온도)와 B 인자(원료)에 의한 제품의 수율

온도

원료

인자의 수준(반응온도의 종류) 합계 평 균

1A 2A 3A 4A

1B

2B

3B

72 71 59 47

78 73 66 57

74 69 63 55

249[ 1(r)T ]

274[ 2(r)T ]

261[ 3(r)T ]

62.25[ 1(r)y ]

68.5[ 2(r)y ]

65.25[ 3(r)y ]

합계 224[ 1(c)T ] 213[ 2(c)T ] 188[ 3(c)T ] 159[ 4(c)T ] 784[T ]

평균 74.67[ 1(c)y ] 71[ 2(c)

y ] 62.67[ 3(c)y ] 53[ 4(c)

y ] 65.33[ y ]

Page 44: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

238

(풀이) 귀무(영)가설 ( )oH A : 1(c) 2(c) 3(c)

( )oH B : 1(r) 2(r) 3(r) 4(r)

대립(연구)가설 1H : 각 인자의 수준간에 평균이 같지 않다.

가설의 검정에 필요한 계산

A 수준 수(column 수): 4p

B 수준 수(row 수): 3q

총 자료 수: 12N pq

총변동: 4 3

2 2 2 2

1 1

( ) [(72 65.33) (78 65.33) (55 65.33) ] 942.67T i j

i j

S y y

급간변동: 4

2 2 2

(c)

1

[ ] 3[(74.67 65.33) (71 65.33)A i

i

S q y y

2 2(62.67 65.33) (53 65.33) ] 835.34

32 2 2 2

(r)

1

[ ] 4[(62.25 65.33) (68.5 65.33) (65.25 65.33) ] 78.17B j

j

S p y y

급내변동: ( ) 942.667 (835.347 78.167) 29.16E T A BS S S S

총 자유도: 1 (4)(3) 1 11T pq

인자 A 의 자유도: 1 4 1 3A p

인자 B 의 자유도: 1 3 1 2B q

오차 E 의 자유도: E T A B ( 1)( 1) (3)(2) 6p q

처리평균제곱:

8 3 5 . 3 4 7

( ) 2 7 8 . 4 4 91 3

A AA A

A

S SV MS

p

7 8 . 1 6 7

( ) 3 9 . 0 8 41 2

B BB B

B

S SV MS

q

잔차평균제곱: 29.153

( ) 4.859( 1)( 1) (3)(2)

E EE E

A B

S SV MS

p q

검정통계량:

2 7 8 . 4 4 9

5 7 . 3 0 84 . 8 5 9

AA

E

VF

V

39.0848.044

4.859

BB

E

VF

V

유의 수준 0.05 에서 경계 값:

( , ; ) (3, 6; 0 .05) 4 .76A EF F

Page 45: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

239

( , ; ) (2,6;0.05) 5.14B EF F

※ F -분포: http://www.statdistributions.com/f/

(1) 57.294AF 과 8.044BF 의 확률(유의확률)

(a) [denominator d.f.] box에 6 입력.

(b) [right tail]을 선택.

(c) [numerator d.f.] box에 3과 2를 각각 입력.

(d) [F-value] box에 57.294와 8.044를 각각 입력.

[p-value] box에서 0.000과 0.02를 얻을 것이다.

(2) ( , ; ) (3,6;0.05)A EF F 와 ( , ; ) (2,6;0.05)B EF F 의 값

(a) [p-value] box에 0.05 입력.

(b) [right tail]을 선택.

(c) [denominator d.f.] box에 6 입력.

(d) [numerator d.f.] box에 3과 2를 각각 입력.

[F-value] box에서 4.76과 5.14를 각각 얻을 것이다.

(3,6;0.05) 4.757AF

(2,6;0.05) 5.143BF

계산값들에 의한 분산분석표는 다음과 같다.

표 [12-19] A 인자(온도)와 B 인자(원료)에 의한 제품의 수율 분산분석표

변동요인 제곱합 자유도 평균제곱 tF 값 유의확률

인자 A

인자 B

잔 차

AS 835.34

BS 78.17

ES 29.16

A 3

B 2

E 6

AV 278.447

BV 39.085

EV 4.86

t AF 57.294

t BF 8.044

0.000

0.02

합 계 TS 942.667 T 11

검정결과: 여기서 등분산 검정 즉 Leven’s test는 실험횟수가 한번이기 때문에 불가능하다. 따라

서 등분산을 제외한 평균비교로 검정을 한다.

97.294 (3,6;0.05) 4.76AF F

8.044 ( 2, 6; 0 .05) 5 .143BF F

검정통계량 AF 와 BF 는 자신의 자유도를 가진 유의수준 0.05 에서 F 분포 값보다 크므로 각

각의 귀무(영)가설 ( )oH A 와 ( )oH B 는 기각된다. 즉 반응온도와 원료의 종류에 따라 제품의 수

율에 차이가 있다 (반응온도와 원료의 종류에 따라 제품의 수율이 유의하다).

Page 46: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

240

<사후 분석>

인자 A 와 B 의 귀무가설은 기각되었기 때문에 점추정에 근거하여 다음과 같이 구간을 구한다.

구간 공식:

(c)(c) (c)

( , ) ( , )E EE i Ei i

V Vy t y t

q q

(r)(r) (r)

( , ) ( , )E EE j Ej j

V Vy t y t

p p

제 1열의 구간추정

대입할 값: 1( )c

y 74.67 2(c)

y 71.0, 3(c)

y 62.67, 4( )c

y 53.0

1 ( c )

4 . 8 5 9 4 . 8 5 97 4 . 6 7 ( 6 , 0 . 0 5) 7 4 . 6 7 ( 6 , 0 . 0 5)

3 3t t

(6,0.05) 2.0150t , 4.859

1.27273

: 4.859

(6,0.05) (2.0150)(1.2727) 2.56443

t

1 ( c )74 . 67 2 . 5644 74 . 67 2 . 5644

1(c)72.1056 77.2344

같은 방법으로 다른 열을 구하면 각각 다음과 같다.

2 ( c )65 . 4356 73 . 5644

3 ( c )60 . 1056 65 . 2344

4(c)50.4356 55.5644

제 1행의 구간추정: 1(r)

4.859 4.85962.25 (6,0.05) 62.25 (6,0.05)

4 4t t

1(r)y 62.25, 2(r)

y 68.50, 3(r)y 65.25

162.25 ( 2 .015) (1 .1022) 62 .25 ( 2 .015) (1 .1022)r

1 ( r )60 . 0292 64 . 4708

다른 행의 구간추정도 같은 방법으로 한다.

12.3.2 반복이 있는 이원배치법

개요: 인자가 둘인 실험의 분산분석은 (1) 등분산을 제일 먼저 검정하고, (2) 등분산일 경우 분산

분석을 통해 수정모델로 타당성 검정을 하여 두 인자로 인한 실험치에 효과가 있다고 결론을 얻

으면 (3) 상호작용 효과(interaction effect)를 검정한다. (4) 상호작용이 없다면 각각의 인자에 대

한 수준들의 효과를 비교 분석하며, 이때 각 인자의 수준간 차이가 있다면 (5) 사후검정의 교차분

석으로 평균비교를 한다. (6) 상호작용이 있다면 사후분석에서 이에 대한 교차분석도 변행하여야

Page 47: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

241

한다. 예를 들면 결핵은 복합약을 사용하여야만 큰 효과를 볼 수 있다. 이 경우 약의 효과는 상호

작용이 두드러 져 나타날 것이다.

인자 A 의 수준이 p , 인자 B 의 수준이 q 라고 하고 임의의 실험횟수를 r 이라 하면 데이터 배

열은 다음과 같다. 표 [12-20] 반복수가 있는 인자 A , B 의 배열

요인 1A 2A iA pA 합계 평균

1B

111y 121y 1 1iy

1 1py

11ry 12ry 1i ry

1pry

1(r)T 1(r)

y

11T 12T

1iT 1pT

11y

12y

1iy

1py

2B

211y 221y 2 1iy

2 1py

21ry 22ry 2i ry

2 pry 2(r)T

2(r)y

21T

22T 2iT

2 pT

21y

22y

2iy

2 py

jB

11jy 21jy

2 1iy 2 1py

1j ry 2j ry

j i ry jpry

(r)jT (r)j

y

1jT 2jT

jiT jpT

1jy

2jy

jiy

jpy

qB

11qy 221y 1qiy 1qpy

1q ry 2q ry qi ry qpry (r)qT (r)q

y

1qT 2qT

qiT qpT

1qy

2qy

qiy

qpy

합계 1(c)T 2(c)T (c)iT

(c)pT T

평균 1(c)y 2(c)

y (c)i

y (c)p

y

y

※ 여기서 T (합계)와 y (평균)에 있는 아래첨자 (c) 와 (r) 은 column(열)과 row(행)를 나타낸다.

※ 앞으로 A 인자(요인)는 행에 나타내고 수준수는 p , 이것의 일반적인 수의 대표는 i 로 하자.

한편 인자(요인) B 는 열에 표시하고 수준수는 q , 그리고 수의 대표는 j 로 표시한다. 실험횟수

는 r 로 하고 이 수의 대표는 k 로 나타내도록 한다.

Page 48: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

242

<Levene’s test: 분산의 동질성(equality of variances) 검정>

분산분석을 하려면 Levene’s test로 수준간 자료가 등분산인지 먼저 검정하고, 만일 등분산이 아

니면 다른 검정(비모수 통계에 의한 검정)을 하여야 한다. 즉 자료가 등분산이 증명된 후 분산분

석이 수행된다. 따라서 아래의 등분산 검정통계량으로 검정한 결과가 귀무가설을 채택할 때 분산

분석을 할 수 있다.

귀무(영)가설 0H : 11 12 i j ( i j 집단에 대한 분산이 동일하다).

대립(연구)가설 1H :

i j 중 하나 이상 다른 분산이 존재한다).

Levene의 등분산 검정통계량:

2

1 1

2

1 1 1

( 1) ( )

( 1) ( )

p q

i ji j

L p q r

i ji j ki j k

pq r r z zF

pq z z

여기서 i j kz 는 | |i j k i j k i j

z y y 로 만드는 표이며 LF 은 이 표로부터 계산된다.

검정: ( , ; )L AB EF F 이면 oH (등분산)가 채택되어 분산분석에서 평균을 비교할 수 있다. 따

라서 분산분석을 하려면 Levene’s test로 귀무가설 oH 가 확률적으로 채택되어야 한다.

<분산분석>

Levene’s test에서 등분산이 입증되면 다음과 같이 순차적으로 계산한 후 분산분석표를 작성하고

평균에 대한 가설을 검정한다.

귀무(영)가설 ( )oH A : 1(r) 2(r) 3(r)

( )oH B : 1(c) 2(c) 3(c) 4(c)

인자들의 각 수준(집단)에서 합과 평균

합 평균

1

r

i j i j k

k

T y

1

1 r

i j ki j

k

y yr

(c)

1 1

q r

i i j k

j k

T y

(c)

1 1

1 q r

i j ki

j k

y yqr

(r)

1 1

p r

j i j k

i k

T y

(r)

1 1

1 p r

i j kj

i k

y ypr

1( ) 2( ) (c) 1(r) 2(r) (r)c c p qT T T T T T T 1 1 1

1 p q r

i j k

i j k

y ypqr

총제곱합: 2

1 1 1

( ) ( )p q r

T i j k

i j k

S SST y y

or T A B A B ES S S S S

급간변동: ( )AS SSA 2

(c)

1

[ ]p

i

i

qr y y

Page 49: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

243

2

(r)

1

( ) [ ]q

B j

j

S SSB pr y y

상호(교호)작용: ( )A B A BS SS 2

(c) (r)

1 1

[ ]p q

i j i j

i j

r y y y y

※ 앞으로 A B C 로 쓸 것이다.

수정모형: ( )AB AB A B A BS SS S S S

급내변동: ( )ES SSE 2

1 1 1

( )p q r

i j k i j

i j k

y y

or E T ABS S S

변동을 쉽게 계산하기 위하여 다은 공식을 정의하여 사용할 수 있다.

변동계산 공식

(1) 수정항(Correction Term: CT):

2

( )T

CT N pqrN

(2) 총변동: 2 2

1 1 1 1 1 1

( )p q p qr r

T i j k i j k

i j k i j k

S y y y CT

(3) 급간변동: 2

(c)

1

1 p

A i

i

S T CTqr

, 2

(r)

1

1 q

B j

j

S T CTpr

(4) 수정모형: 2

1 1

1 p q

AB i j

i j

S T CTr

(5) 상호(교호)작용: C AB A BS S S S

(6) 급내변동: E T ABS S S

자유도

총 자유도: 1T pqr

A 급간변동 자유도: 1A p

B 급간변동 자유도: 1B q

상호작용 자유도(C A B ): ( 1)( 1)C p q

수정모형 자유도: 1AB A B C pq

급내변동 자유도: ( 1)E T C pq r

각 요인들의 평균제곱(분산)

처리평균제곱: ( ) AA

A

SV MSA

, ( ) B

B

B

SV MSB

상호작용 평균제곱: ( ) CC C

C

SV MS

잔차평균제곱: ( ) EE

E

SV MSE

Page 50: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

244

수정모형 제곱: ( ) ABAB AB

AB

SV MS

표 [12-21] 이원배치법의 분산분석표(반복이 있는 경우)

제곱합

( SS )

자유도 평균제곱( MS ) tF 값

A

B

( )AB ABS SS

( )AS SSA

( )BS SSB

( )C CS SS

( )ES SSE

1AB pq

1A p

1B q

( 1)( 1)C p q

( 1)E pq r

( ) /AB AB AB ABV MS S

( ) /A A A AV MS S

( ) /B B B BV MS S

/C C CV S

( ) /E E E EV MS S

/AB AB EF V V

/A A EF V V

/B B EF V V

/C C EF V V

( )TSST S

1T pqr

<분산분석 후의 추정 및 검정>

분산분석에서 평균에 대한 귀무가설이 기각되고 대립가설이 채택되면 즉 인자간의 평균이 다르다

고 하면 상호간에 모평균 비교와 구간추정을 한다.

(1) 각 수준의 모평균 추정

(a) 모평균의 점추정

Page 51: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

245

( c )

1 1

1( )

q r

i i j k i

j k

A y yqr

(r)

1 1

1( )

p r

j i j k j

i k

B y ypr

(b) 모평균의 구간추정

유의수준이 이고 양쪽검정일 때 인자 ,A B 의 각 수준마다 모평균의 신뢰한계는 다음과 같다.

( c ) ( c )

( , ) ( ) ( , )2 2

E EE i Ei i

V Vy t A y t

qr qr

( r ) ( r )

( , ) ( ) ( , )2 2

E EE j Ej j

V Vy t B y t

pr pr

(2) 모평균 차의 구간추정

유의수준이 이고 양쪽검정일 때 두 모평균 차의 신뢰한계는 다음과 같다.

'(c) '(c) (c) '(c)

2 2[ ] ( , ) ( ) ( ) [ ] ( , )

2 2

E EE i i Ei i i i

V Vy y t A A y y t

qr qr

(r) (r) (r) (r)' ''

2 2[ ] ( , ) ( ) ( ) [ ] ( , )

2 2

E EE j Ej j j jj

V Vy y t B b y y t

pr pr

(3) 두 인자의 수준을 조합한 조건에서 모평균의 추정

<상호작용을 무시할 수 있는 경우>

(a) A 인자의 i 수준과 B 인자의 j 수준에서 모평균의 점추정

( c ) ( r )

( )i j i j i jAB a b y y y

(b) ( )i jA B 의 구간추정

유의수준이 (양쪽)일 때 두 인자의 수준을 조합한 모평균의 신뢰한계는 다음과 같다.

( c ) ( r ) ( c ) ( r )( ) ( , ) ( ) ( ) ( , )2 2

E EE i j Ei j i j

e e

V Vy y y t A B y y y t

n n

여기서 1 1

e

A B

N Nn

p q

<상호작용을 무시할 수 없는 경우>

(a) A 인자의 i 수준과 B 인자의 j 수준에서 모평균의 점추정

( ) ( )i j i j i j i jAB a b ab y

(b) ( )i jA B 의 구간추정

( , ) ( ) ( , )2 2

E EE i j Ei j i j

V Vy t A B y t

r r

(4) 한 인자가 모수, 다른 인자가 변량인 경우의 추정

A 가 모수인자, B 가 변량인자 일 때 분산분석은 변함이 없지만 분산분석 후의 추정은 모수인자

는 최적조건에 관한 모평균을 추정하고, 변량인자는 모분산을 추정하여야 한다.

Page 52: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

246

(a) 모수인자 iA 수준에서 모평균의 신뢰구간(상호작용을 무시할 경우)

* *

(c) (c)( , ) ( ) ( , )B A E B A E

ii i

V V V Vy t A y t

pqr pqr

Satterthwaite 자유도:

2*

2 2

( )

[( ) / ] [( ) / ]

B A E

B B A E E

V V

V V

(b) 변량인자 B 간의 모분산 추정

분산분석표에서 평균제곱은 2 2

B E BV pr , 2

E EV

이다. 이들로부터 다음과 같이 분산을 추정할 수 있다.

2B E

B

V V

pr

B E

B

V V

pr

이원배치 분산분석 절차의 요약

(1) Levene’s test로 등분산 검정.

(2) 수정모형 타당성 검정: 각각의 요인이 실험치에 작용하여야 검정가능 ( 1H 이 채택되어야 함).

(3) 요인간의 상호작용 확인: 두 요인간 상호작용 검정.

(4) 상호작용이 없으면 각 인자효과를 분리하여 각각의 인자의 수준에 대해 다중비교.

(5) 상호작용이 있다면 두 요인의 효과를 동시에 고려한 처리평균에 대해 다중비교.

(6) 상호작용의 경우 각 인자의 분리비교는 무의미하다.

SPSS 통계처리 문제 (상호작용이 없는 경우)

[보기 12_5] 2 종류의 비료( 1A , 2A )와 3 종류의 토양( 1B , 2B , 3B )에 따라 옥수수를 실험 재배하

여 수확량을 조사하였더니 다음과 같았다. 옥수수 수확량이 토양과 비료에 따라 차이가 있는지 유

의수준 0.05 (양쪽)에서 검정하라.

표 [12-22]비료와 토양의 옥수수 수확량

요인 1A (비료1) 2A (비료2)

1B (토양1)

21

23

19

21

22

20

2B (토양2)

30

29

26

26

29

27

3B (토양3)

25

22

23

23

19

20

표 [12-23] 계산용 표

요인 1A 2A 평균

[합계]

1B 21 21 1(r)

y 21.00

Page 53: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

247

23

19

22

20

[1(r)T 126]

11y 21.0 ( 11T 63) 12

y 21.0 ( 12T 63)

2B

30

29

26

26

29

27 2(r)

y 27.833

[2(r)T 167]

21y 28.33 ( 21T 85) 22

y 27.33 (22T 82)

3B

25

22

23

23

19

20 3(r)

y 22.00

[3(r)T 132)]

31y 23.33 ( 31T 70) 11

y 20.67 ( 32T 62)

평균

(합계)

1(c)y 24.222

[1(c)T 218]

2(c)y =23.00

[2(c)T 207]

y 23.611

[T 425]

※ (r) 은 row(행), (c) 는 column(열)을 표시.

(풀이) (a) <Levene’s test: 등분산 검정>

분산분석을 위해 먼저 하여야 할 일은 Levene의 등분산 검정이다. Levene의 검정용 표는 아래와

같이 작성된다.

표 [12-24] | |i j k i j k i jz y y 에 의한 Levene’s test 표

iA

jB 1A (비료1) 2A (비료2) 평균

1B (토양1)

0 ( 111z )

2 ( 112z )

2( 113z )

0( 121z )

1( 122z )

1( 123z ) 1(r)z 1

11z 1.33 12z 0.67

2B (토양2)

1.67 ( 211z )

0.67 ( 212z )

2.33 ( 213z )

1.33 ( 221z )

1.67 ( 222z )

0.33( 223z ) 2(r)z 1.33

21z 1.56 22z 1.11

3B (토양3)

1.67 ( 311z )

1.33 ( 312z )

0.33 ( 313z )

2.33 ( 321z )

1.67 ( 322z )

0.67 ( 323z ) 3(r)z 1.33

31z 1.11 32z 1.56

평균 1(c)z 1.33 2(c)z 1.11 z =1.22

※ 여기서 아래첨자 (r) 은 row(행), (c) 는 column(열)을 의미한다.

Page 54: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

248

귀무(영)가설 0H :

11 12 i j ( i j 집단에 대한 분산이 동일하다).

대립(연구)가설 1H : i j 중 하나 이상 다른 분산이 존재한다.

Levene’s test:

2

1 1

2

1 1 1

( 1) ( )

( 1) ( )

p q

i ji j

L p q r

i ji j ki j k

pq r r z zF

pq z z

2 3 32 2

1 1 1 1 1 1( ) ( )

p q r

i j i ji j k i j ki j k i j kz z z z

2 2 2[(0 1.33) (2 1.33) (2 1.33) ] 2 2 2[(0 0.67) (1 0.67) (1 0.67) ]

2 2 2[(1.67 1.56) (0.67 1.56) (2.33 1.56) ] 2 2 2[(1.33 1.11) (1.67 1.11) (0.33 1.11) ]

2 2 2[(1.67 1.11) (1.33 1.11) (0.33 1.11) ] 2 2 2[(2.33 1.56) (1.67 1.56) (0.67 1.56) ]

8.0741 2 32 2

1 1 1 1( ) ( )

p q

i j i ji j i j

z z z z

2 2 2 2(1.33 1.22) (0.67 1.22) (1.56 1.22) (1.11 1.22)

2 2(1.11 1.22) (1.56 1.22) 0.5679

비료의 종류: 2p

토양의 종류: 3q

측정횟수: 3r

수정모형 자유도:

1 (2)(3) 1 5AB pq

급내변동 자유도:

( 1) (2)(3)(3 1) 12E pq r

Levene의 검정통계량 값: (12)(3)(0.5679) 20.4444

0.50645(8.0741) 40.3705

LF

F 분포 값: ( , ;0.05) (5,12;0.05) 3.106AB EF F

※ F -분포: http://www.statdistributions.com/f/

(1) ( , ; ) (5,12;0.05)AB EF F 의 값

(a) [p-value] box에 0.05 입력.

(b) [numerator d.f.] box에 5 입력.

(c) [denominator d.f.] box에 12 입력.

(d) [right tail]을 선택.

[F-value] box에서 3.106을 얻을 것이다.

(2) 0.5064LF 의 확률(유의확률)

Page 55: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

249

(a) [F-value] box에 0.5064 입력.

(b) [numerator d.f.] box에 5 입력.

(c) [denominator d.f.] box에 12 입력.

(d) [right tail]을 선택.

[p-value] box에서 0.767 을 얻을 것이다.

검정결과: 0.5064 (5,12;0.05) 3.106LF F 이므로 귀무가설 oH 가 채택된다. 한편 유의확률

로 보면 ( 0.5064) 0.767LP F 은 유의수준 0.05 보다 크기 때문에 oH 가 채택된다. 비료

와 토양에 의한 교차 자료의 분산(2

i j )은 등분산이다. 따라서 다음 단계의 분산분석이 가능하다.

(b) <분산분석>

귀무(영)가설 oH : 다음은 네 종류의 차례로 검정해야 할 귀무가설 내용이다. 이들의 반대가 대립

(연구)가설 1H 이다.

(1) 비료와 토양은 각각 또는 상호작용에 의한 옥수수의 수확량과 관련이 없다(두 인자 비료와 토

양은 옥수수 수확량에 영향을 주지 않는다).

(2) 비료와 토양은 옥수수 수확량에 서로 상호작용을 하지 않는다.

(3) 비료의 두 종류는 수확량이 같다.

(4) 토양의 세 종류는 수확량이 같다.

분산분석에서 우선 (1)번은 1H (비료와 토양은 옥수수 수확과 관련이 있다)이 채택되어야만 그 다

음을 진행할 수 있다. (2)번은 oH (비료와 토양은 옥수수 수확량에 서로 상호작용을 하지 않는다)

가 채택된다면 (3)번과 (4)번을 독립적으로 검정할 수 있다. 만일 1H (비료와 토양은 수확에 서로

상호작용을 한다)이 채택되면 (3)번과 (4)번의 검정은 무의미하다. 이들을 순차적으로 검정하는

분산분석표를 작성하려면 다음의 계산이 필요하다.

총변동: 2 3 3 2 2 2

1 1 1( ) ( ) (21 23.61) (20 23.61) 212.278T i j ki j k

S SST y y

급간변동: 2 2 2

(c)1( ) [ ] 9[(24.222 23.611) (23.0 23.611) ] 6.722

p

A iiS SSA qr y y

2 2 2

( r )1( ) [ ] 6 [ ( 21 23 . 611) ( 27 . 833 23 . 611)

q

B jjS SSB pr y y

2(22 23.611) ] 163.444

상호작용: ( )C CS SS 2

(c) (r)

1 1

[ ]p q

i j i j

i j

r y y y y

2 23[(21 24.22 21 23.61) (21 23 21 23.61)

2 2(28.33 24.22 27.83 23.61) (27.33 23 27.83 23.61)

2 2(23.33 24.22 22 23.61) (20.67 23 22 23.61) ] 5.445

수정모형: ( ) 6.722 163.444 5.445 175.611AB AB A B A BS SS S S S

Page 56: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

250

급내변동: ( )ES SSE 2

1 1 1

( )p q r

i j k i j

i j k

y y

or 212.278 175.611 36.667E T ABS S S

위의 값들은 공식을 이용하여 다음과 같이 계산할 수도 있다.

수정항(correction term):

2 2(425)10034.722

18

TCT

N

총변동:

2 2 2[(21) (23) (20) ] 10034.722 10247 10034.72 212.278TS

급간변동:

2 21 1[(218) (207) ] (90373) 10034.72 6.722

9AS CT

qr

2 2 21 1[(126) (167) (132) ] (61189) 10034.72 163.444

6BS CT

pr

2 2 21 1[(63) (85) (62) (30631) 10034.722 175.611

3ABS CT

r

175.611 6.722 163.444 5.445C AB A BS S S S

급내변동: 212.278 175.611 36.667E T ABS S S

자유도(degree of freedom)

A (비료)의 자유도: 1 2 1 1A p

B (토양)의 자유도: 1 3 1 2B q

상호작용 자유도: ( 1)( 1) (2 1)(3 1) 2C p q

잔차(오차) 자유도: ( 1) (2)(3)(3 1) 12E pq r

수정모형자유도: 1 (2)(3) 1 5AB pq

총 자유도: 1 (2)(3)(3) 1 17T pqr

처리평균제곱: 6.722

6.7221

AA

A

SV

163.44481.722

2

BB

B

SV

175.61135.122

5

ABAB

AB

SV

5.4452.723

2

CC

C

SV

잔차평균제곱: 36.667

3.05612

EE

E

SV

검정통계량:

35.12211.493

3.056

ABAB

E

VF

V

2.7220.891

3.056

CC

E

VF

V

6.7222.200

3.056

AA

E

VF

V

81.72226.742

3.056

BB

E

VF

V

이들 값으로 이원분산분석표를 작성하면 다음과 같다.

Page 57: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

251

표 [12-25] 비료와 토양 이원분산분석표

변동 요인 제곱합( SS ) 자유도 평균제곱 tF 값 유의확률

수정모형 175.61(ABS ) 5( AB ) 35.122( ABV ) 11.49( )ABF 0.000

절편(수정항) 10034.72(CT ) 1 10034.722 3284.09

A (비료) 6.722( AS ) 1( A ) 6.722( AV ) 2.20( AF ) 0.164

B (토양) 163.44 ( BS ) 2( B ) 81.725( BV ) 26.74( BF ) 0.000

A B 5.445( CS ) 2( C ) 2.722( CV ) 0.891( CF ) 0.436

오차 36.667( ES ) 12( E ) 3.056( EV )

17(T )

※ F -분포: http://www.statdistributions.com/f/

(1) (5,12;0.05)F , (1,12;0.05)F , (2,12;0.05)F , (2,12;0.05)F 의 값

(a) [p-value] box에 0.05 입력.

(b) [right tail]을 선택.

(c) [denominator d.f.] box에 12 입력.

(d) [numerator d.f.] box에 5, 1, 2, 2를 차례로 입력.

[F-value] box에서 다음의 값을 얻을 것이다.

( , ; ) (5,12; 0.05) 3.106AB EF F

( , ; ) (1,12; 0.05) 4.743A EF F

( , ; ) (2,12; 0.05) 3.885B EF F

( , ; ) (2,12; 0.05) 3.885C EF F

(2) ABF , AF , BF , CF 의 확률(유의확률)

(a) [denominator d.f.] box에 12 입력.

(b) [right tail]을 선택.

(c) [numerator d.f.]와 [F-value]에 (5, 11.493), (1, 2.200), (2, 26.742), (2, 0.891)을 서로

matching시켜 각각 box에 차례로 입력.

[p-value] box에서 다음의 확률을 각각 얻을 것이다.

( 11 .493) 0 .00ABP F

( 2 .20) 0 .164AP F

( 26 .742) 0 .00BP F

( 0.891) 0.436CP F

Page 58: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

252

검정결과

(1) 수정모형 타당성 검정: 각각의 요인효과가 유의한지를 검정하는 부분으로 가장 먼저 분석해야

할 부분이다. 만일 귀무(영)가설 oH 를 채택하면 이것은 비료나 토양이 옥수수 수확량에 아무런

영향을 주지 않는다는 것으로 해석되며 이 경우 이원배치 분산분석은 타당성을 잃고 더 이상의

검정을 할 수 없다. 따라서 수정모형의 귀무(영)가설은 기각되고 대립가설, 즉 옥수수 수확량은

두 요인인 토지와 비료에 각각 의존하고 또는 둘의 상호작용있다는 가설 1H 이 채택되어야 그 다

음 분석을 할 수 있다. 이것을 F -분포 값으로 확인하면, 11.493 (5,12,0.05) 3.106ABF F

이므로 귀무(영)가설은 기각된다. 확률로 보면 ABF 유의확률 0.00은 유의수준 0.05 보다 작

기 때문에 oH (모형이 타당성이 없다. 또는 토지와 비료 두 요인은 옥수수 수확량과 아무런 관련

이 없다)가 기각되고 1H (모형은 타당하다. 또는 옥수수 수확량은 비료와 토지의 두 요인과 관련

이 있다)가 채택되어 다음의 분석을 수행할 수 있다.

(2) 상호(교호)작용: 상호작용이란 두 인자(비료와 토지)가 옥수수의 생산량에 동시에 영향을 주는

것을 의미한다. 따라서 다음 단계를 진행하려면 이 부분의 검정은 상호작용이 없는 oH 가 채택되

어야 한다. 0.891 ( , ;0.05) (2,12;0.05) 3.89C C EF F F 이므로 귀무(영)가설이 채택되어

비료와 토지의 상호작용은 없다. 이것을 확률로 보면 CF 유의확률 0.436은 유의수준 0.05

보다 크기 때문에 oH (상호작용이 없다)가 채택된다. 그 결과 비료와 토지의 효과를 분리하여 검

정할 수 있다.

(3) A (비료)효과: 2.20 ( , ; ) (1,12;0.05) 4.743A A EF F F 이므로 귀무(영)가설이 채택된

다. 즉 두 종류의 비료효과 차이는 없다는 결론을 얻는다. 이것을 확률로 해석하면 AF 의 유의확

률은 0.164로 유의수준 0.05보다 크기 때문에 oH 가 채택되어 옥수수 수확량에 두 비료효과의

차이는 없다고 검정된다.

(4) B (토양)효과: 26.745 ( , ; ) (2,12;0.05) 3.89B B EF F F 이므로 귀무(영)가설 oH 가

기각되므로 토양의 종류에 따라 옥수수 수확량은 차이가 있다. 이것을 확률에서 검정하면 BF 의

확률은 0.00으로 유의수준 0.05보다 작기 때문에 1H (옥수수 수확량은 토양에 따라 유의미하다)

이 채택된다.

검정의 요약 및 절차

(1) 등분산 검정: 분산분석은 집단간의 모분산이 같다고 가정하고 설계된 이론이므로 Levene’s

test로 자료간 분산이 등분산일 때 비로소 분산분석을 진행할 수 있다. 만일 등분산이 아니라면

분산분석을 하지않고 비모수분석 방법을 사용하여야 한다. 위의 검정에서 두 인자(비료와 토지)의

교차로 얻은 측정치(옥수수 수확량)들은 등분산이었다.

(2) 수정모형 검정: 우선 모형이 이원배치 분산분석에 타당한가를 점검한다. 만일 수정모형에서 귀

무(영)가설이 채택된다면 이것은 각 인자의 수준(요인)들이 결과에 아무런 작용을 할 수 없다는

뜻이기 때문에 검정을 멈추게 된다. 그러므로 이원배치 분산분석을 하려면 필연적으로 수정모형의

귀무(영)가설 oH , 즉 “두 인자(비료와 토양)는 측정치(옥수수 수확량)와 관련이 없다.”가 기각되

Page 59: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

253

고 대립가설 1H , 즉 “두 인자는 측정치와 관련이 있다(작용한다).”가 채택되어야 그 다음 분석을

진행시킬 수 있다.

(3) 사후 분석: 위의 분석에서 두 비료효과는 차이가 없었고(유의하지 않고), 토양효과는 있었다

(유의하다). 따라서 토양효과에 대한 사후분석 즉 평균의 교차비교와 신뢰구간을 보여 주는 것이

필요하다.

(C) <사후 분석>

계산에 필요한 값들

표준오차: 2 2(3.056)

1.0093(2)(3)

EVD

pr

토양의 평균차:

1(r) 2(r)21 27.83 6.83y y

1(r) 3(r)

21 22 1.0y y

2(r) 3(r)

27.83 22 5.83y y

검정통계량: (r) '(r) (r) '(r)

'(r)2 /

j j j j

j j

E

y y y yT

DV pr

1 ( r ) 2 ( r )

1 2 ( r )

6 . 8 36 . 7 6 7

1 . 0 0 9 3

y yT

D

1 ( r ) 3 ( r )

1 3 ( r )

1 . 00 . 9 9 0 8

1 . 0 0 9 3

y yT

D

2 ( r ) 3 ( r )

2 3 ( r )

5 . 8 35 . 7 7 6 3

1 . 0 0 9 3

y yT

D

※ t -분포: http://www.statdistributions.com/t/

(1) ( , ) (12,0.025)2

t t

(a) [p-value] box에 0.05 입력.

(b) [d.f.] box에 12 입력.

(c) [two tails]를 선택.

[t-value] box에서 2.179 를 얻을 것이다.

(2) T 의 확률(유의확률)

(a) [d.f.] box에 12 입력.

(b) [two tails]를 선택.

(c) [t-value] box에 6.767, 0.991, 5.776을 차례로 입력.

Page 60: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

254

[p-value] box에서 다음의 확률을 얻는다.

1 2 ( r )( | 6 . 767 | ) 0 . 00P T

1 3 ( r )( 0 . 991) 0 . 341P T

2 3 ( r )( 5 . 776) 0 . 00P T

토양효과의 모평균 차에 대한 95% 신뢰구간

(r) (r) (r) (r)' ''

2 2[ ] ( , ) ( ) ( ) [ ] ( , )

2 2

E EE j Ej j j jj

V Vy y t B b y y t

pr pr

2( , ) (12,0.025) (2.179)(1.0093) 2.199

2

EE

Vt t D

pr

평균차 신뢰구간 계산 95% 평균차 신뢰구간 유의확률

1 26.83 2.2 ( ) ( ) 6.83 2.2B B 1 29.03 ( ) ( ) 4.63B B 0.00

1 31.0 2.2 ( ) ( ) 1.0 2.2B B 1 33.20 ( ) ( ) 1.20B B 0.341

2 35.83 2.2 ( ) ( ) 5.83 2.2B B 2 33.63 ( ) ( ) 8.03B B 0.00

SPSS 통계처리 [12_5_corn.sav]

SPSS 데이터 편집기에 표 [12-22]의 데이터를 변수명 [토양] 1에 [비료] 1, 그리고 세 개의 실

험횟수에 해당하는 [수확량]을 차례로 대응시켜 입력한다.

변수값 설명에 다음과 같이 설명을 덧붙여라.

1 토양1

2 토양2

분석>일반선형모형>일변량

보조창이 뜨면 [수확량]을 종속변수로, [토양]과 [비료]를 모수요인으로 각각 이동.

옵션단추를 눌러 통계량 중에서 기술통계량과 동질성검정을선택. 유의수준은 0.05를 입력

계속>확인

일변량 분산분석 결과

개체-간 요인

토양1 6

토양2 6

토양3 6

비료1 9

비료2 9

1

2

3

토양

1

2

비료

변수값 설명 N

Page 61: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

255

기술통계량

종속변수: 수확량

21.00 2.000 3

21.00 1.000 3

21.00 1.414 6

28.33 2.082 3

27.33 1.528 3

27.83 1.722 6

23.33 1.528 3

20.67 2.082 3

22.00 2.191 6

24.22 3.632 9

23.00 3.536 9

23.61 3.534 18

비료비료1

비료2

합계

비료1

비료2

합계

비료1

비료2

합계

비료1

비료2

합계

토양토양1

토양2

토양3

합계

평균 표준편차 N

오차 분 산의 동일성에 대한 Levene의 검정a

종속변수: 수확량

.506 5 12 .766F 자유도1 자유도2 유의확률

여러 집단에서 종속변수의 오차 분산이 동일한 영가설을 검정합니다.

계획: Intercept+토양+비료+토양 * 비료a.

개체-간 효과 검정

종속변수: 수확량

175.611a 5 35.122 11.495 .000

10034.722 1 10034.722 3284.091 .000

163.444 2 81.722 26.745 .000

6.722 1 6.722 2.200 .164

5.444 2 2.722 .891 .436

36.667 12 3.056

10247.000 18

212.278 17

소스수정 모형

절편

토양

비료

토양 * 비료

오차

합계

수정 합계

제 III 유형제곱합 자유도 평균제곱 F 유의확률

R 제곱 = .827 (수정된 R 제곱 = .755)a.

검정결과 분석: SPSS로 나온 값들은 위에서 이론으로 계산한 값들과 정확히 일치한다.

개체-간 효과 검정 표는 여러 가설들을 검정하는 부분으로 수정모형이 가장먼저 확인되어야 할

부분이다. 수정모형에서 유의확률이 0.000라는 뜻은 대립(연구)가설 1H 을 채택하는 것이므로 비

료와 토지는 옥수수 수확에 유의하다. 즉 “비료와 토지는 옥수수 수확량과 관련이 있다”이기 때문

에 다음 검정을 진행하는 것이 가능해 진다.

두 번째 검토하여야 할 부분은 토양*비료의 상호(교호)작용 부분이다. 유의확률은 0.436이므로 귀

무가설 oH 가 채택된다. 즉 “토양과 비료는 상호작용이 없다”이기 때문에 비료와 토양의 독립적

인 다음의 분석이 가능하다.

Page 62: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

256

(1) 비료의 유의확률 0.164는 유의수준 0.05보다 크므로 귀무(영)가설 oH 가 채택된다. 즉 “유의

수준 5%(신뢰수준 95%)에서 두 종류의 비료에 따른 옥수수 수확량은 차이가 없다.”

(2) 토양의 유효확률 0.000은 유의수준 0.05보다 작으므로 대립(연구)가설 1H 이 채택된다. 즉

“유의수준 5%하에서 세 종류의 토양에 따른 옥수수의 수확량은 차이가 있다.”

옥수수의 수확량이 토양에 따라 다르므로 어떤 토양이 옥수수의 수확에 가장 크게 영향을 미치는

지를 사후 분석할 필요가 있다.

<사후 분석>

분석>일반선형모형>일변량

재설정을 누르고 [수확량]을 종속변수, [토양]과 [비료]를 모수요인으로 이동.

옵션을 눌러 출력에서 모수추정값 선택 후 계속.

사후 분석을 클릭한 후 [토양]을 사후 검정변수로 이동.

등분산을 가정함 내에 있는 LSD와 Duncan을 check.

계속>확인

사후 분석 결과

토양

다중 비교

종속변수: 수확량

-6.83* 1.009 .000 -9.03 -4.63

-1.00 1.009 .341 -3.20 1.20

6.83* 1.009 .000 4.63 9.03

5.83* 1.009 .000 3.63 8.03

1.00 1.009 .341 -1.20 3.20

-5.83* 1.009 .000 -8.03 -3.63

(J) 토양토양2

토양3

토양1

토양3

토양1

토양2

(I) 토양토양1

토양2

토양3

LSD평균차(I-J) 표준오차 유의확률 하한값 상한값

95% 신뢰구간

관측된 평균에 기초합니다.

.05 수준에서 평균차는 유의합니다.*.

동일집단군

Page 63: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

257

수확량

6 21.00

6 22.00

6 27.83

.341 1.000

토양토양1

토양3

토양2

유의확률

Duncana,bN 1 2

집단군

동일집단군의 그룹에 대한 평균이 표시됩니다.유형 III 제곱합에 기초합니다오차항은 평균제곱(오차) = 3.056입니다.

조화평균 표본 크기 6.000을(를) 사용합니다.a.

유의수준 = .05.b.

위의 평균 값들은 이미 이론에서 계산된 것들이다. 토양 1과 3 은 거의 차이가 없고 토양 2 는

이들과 차이가 있다. 따라서 토양 2 를 이용하면 옥수수의 소출을 극대화 할 수 있다.

SPSS 통계처리 문제 (상호작용이 있는 경우)

[보기 12_6] 아래 표는 어느 공장에 4 가지 반응온도와 3 종류의 원료에 의하여 제품의 수율에

미치는 영향을 조사하고자 각 수준의 조합마다 3 회씩 반복하여 얻은 수율자료이다. 다음을 이론

으로 계산하여 검정하고 SPSS에서 얻은 결과와 비교하라.

(a) Levene’s test표 작성과 유의수준 0.05 에서 등분산인지 검정하라.

(b) 등분산이 입증되면 가설을 세우고 그에 따른 분산분석표를 작성하며 유의수준 0.05 에서

각 가설을 검정하라.

(c) 상호작용이 있을 경우 사후 분석으로 두 요인의 효과를 동시에 고려한 처리평균에 대하여 다

중비교를 하라.

표 [12-26] 반응온도와 원료에 따른 제품의 수율

온도

원료

인자의 수준(반응온도) 합계 평 균

1A 2A 3A 4A

1B

71 70 60 50

73 72 61 49

70 71 57 51 755 62.9167

평균(합)

71.333(214) 71(213) 59.333(178) 50(150)

2B

79 75 68 59

75 74 67 60

76 76 65 55 829 69.0833

평균(합)

76.667(230) 75(225) 66.667(200) 58(174)

3B

73 70 66 57

75 68 62 56

76 71 63 54

791 65.9167

Page 64: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

258

74.667(224) 69.667(209) 63.667(191) 55.667(167)

합계 668 647 569 491 2375

평균 74.222 71.889 63.222 54.556 65.972

(풀이) (a) <Levene’s test: 등분산 검정>

| |i j k i j k i jz y y 에 의한 Levene’s test 표는 다음과 같이 만들어 진다.

표 [12-27] Levene’s test 표

요인 1A 2A 3A 4A 평균

1B

0.333

1.667

1.333

1

1

0

0.667

1.667

2.333

0

1

1 1(r)z 1

평균 11z 1.111 12z 0.667 13z 1.555 14z 0.667

2B

2.333

1.667

0.667

0

1

1

1.333

0.333

1.667

1

2

3 2(r)z 1.33

평균 21z 1.555 22z 0.667 23z 1.111 24z 2

3B

1.667

0.333

1.333

0.333

1.667

1.333

2.333

1.667

0.667

1.333

0.333

1.667 3(r)z 1.22

평균 31z 1.111 32z 1.111 33z 1.556 34z 1.111

총평균 1(c)z 1.259 2(c)z 0.815 3(c)z 1.407 4(c)z 1.259 z =1.1852

※ 여기서 아래첨자 (r) 은 row(행), (c) 는 column(열)을 의미한다.

등분산 가설

귀무(영)가설 0H : 11 12 i j ( i j 집단에 대한 분산이 동일하다).

대립(연구)가설 1H : i j 중 하나 이상 다른 분산이 존재한다.

가설의 검정통계량

Levene’s test:

2

1 1

2

1 1 1

( 1) ( )

( 1) ( )

p q

i ji j

L p q r

i ji j ki j k

pq r r z zF

pq z z

p 는 반응온도의 종류로 4p

q 는 원료의 종류로 3q

r 은 측정 횟수로 3r .

4 3 32 2

1 1 1 1 1 1( ) ( )

p q r

i j i ji j k i j ki j k i j kz z z z

2 2 2 2(0.333 1.111) (1.667 1.111) (2.333 1.556) (1.667 1.111) 13.037

Page 65: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

259

4 3 2 2 2 2

1 1( ) (1.111 1.222) (0.667 1.222) (1.111 1.222) 1.910i j

i jz z

2

1 1

2

1 1 1

( 1) ( ) (4)(3)(2)(3)(1.910)0.959

(11)(13.037)( 1) ( )

p q

i ji j

L p q r

i ji j ki j k

pq r r z zF

pq z z

유의수준 0.05 에서 자유도 11AB , 24E 의 F -분포 값

( , ; ) (11,24;0.05) 2.216AB EF F

※ F -분포: http://www.statdistributions.com/f/

(1) (11,24; 0.05)F 의 분포 값

(a) [p-value] box에 0.05 입력.

(b) [numerator d.f.] box에 11 입력.

(c) [denominator d.f.] box에 24 입력.

(d) [right tail]을 선택.

[F-value] box에서 다음의 값을 얻을 것이다.

( , ; ) (11,24;0.05) 2.216AB EF F

(2) LF 의 확률(유의확률)

(a) [numerator d.f.] box에 11 입력.

(b) [denominator d.f.] box에 24 입력.

(c) [right tail]을 선택.

(d) [F-value] box에 0.959 입력.

[p-value] box에서 다음의 확률을 얻는다.

( 0.959) 0.506LP F

Levene’s test(등분산 검정) 결과: 0.959 (11,24;0.05) 2.216LF F 이므로 반응온도와 원

료들의 교합에 의해 이루어진 실험치들은 서로간에 등분산이다. 또한 유의수준 와 비교하여 유

의확률은 ( 0.9587) 0.506LP F > 0.05 이기 때문에 oH (등분산)가 채택된다.

(b) <분산분석>

등분산이 입증되었기 때문에 다음은 분산분석에 의해 차례로 검정해야 할 네 종류의 귀무가설 내

용이다. 이들의 반대가 대립(연구)가설 1H 이다.

(1) ( )oH AB : 반응온도와 원료는 수율과 관련이 없다.

(2) ( )oH C : 반응온도와 원료는 상호작용으로 수율에 영향을 주지 않는다.

(3) ( )oH A : 반응온도 사이에 수율의 차이는 없다.

(4) ( )oH B : 원료의 종류에 따른 수율의 차이는 없다.

여기서 (1)은 수정모형의 타당성 검정으로 ( )oH AB 가 기각되고 1( )H AB 이 채택되어야 다음 검

Page 66: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

260

정 (2)를 행할 수 있다. (2)는 반응온도와 원료 사이의 상호작용을 검정하는 것으로 귀무가설

( )oH C 가 채택되어야 그 다음 단계 (3)과 (4)를 검정할 수 있다. 여기서 C 는 A B 를 의미한다.

만일 상호작용 1( )H C 가 채택되면 (3)과 (4)의 검정은 무의미하다.

이들 가설을 검정하려면 다음의 계산에 의해 분산분석표를 작성하여야 한다. 여기서는 변동 값을

얻기 위하여 계산공식을 사용하도록 하자.

변동계산

수정항:

2 2(2375)156684.0278

36

TCT

N

총변동: 2 2

1 1 1 1 1 1

( )p q p qr r

T i j k i j k

i j k i j k

S y y y CT

2 2 2[(71) (73) (54) ] 156684.0278 2510.9722

급간변동

2

_

1

1 p

A i c

i

S T CTqr

2 2 2 21[(668) (647) (569) (491) ] 156684.0278 2168.75

9

2

_

1

1 q

B j r

j

S T CTpr

2 2 21[(755) (829) (791) ] 156684.0278 228.2222

12

2

1 1

1 p q

AB i j

i j

S T CTr

2 2 21[(214) (230) (167) ] 156684.0278 2441.6389

3

C AB A BS S S S 2441.6389 2168.75 228.2222 44.6667

급내변동(오차): E T ABS S S 2510.9722 2441.6389 69.3333

자유도(degree of freedom)

총자유도 1 36 1 35T pqr

A 의 자유도 A : 1 4 1 3A p

B 의 자유도 B : 1 3 1 2B q

교호(상호)작용 자유도 C : ( 1)( 1) (3)(2) 6C p q

급내변동 자유도 E : ( 1) (4)(3)(3 1) 24E pq r

수정모델 자유도: 1 11AB pq 평균제곱(분산)

2 1 6 8 . 7 5

( ) 7 2 2 . 9 1 6 73

AA A

A

SV MS

2 2 8 . 2 2 2( ) 1 1 4 . 1 1 1

2

BB b

B

SV MS

4 4 . 6 6 6 7

( ) 7 . 4 4 4 56

CC C

C

SV MS

2441.64221.967

11

ABAB

AB

SV

69.3333( ) 2.8889

24

EE E

E

SV MS

검정통계량

Page 67: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

261

7 2 2 . 9 1 7

2 5 0 . 2 3 92 . 8 8 9

AA

E

VF

V

1 1 4 . 1 1 13 9 . 5 0 0

2 . 8 8 9

BB

E

VF

V

7 . 4 4 5

2 . 5 7 72 . 8 8 9

CC

E

VF

V

2 2 1 . 9 6 77 6 . 8 3

2 . 8 8 9

ABAB

E

VF

V

※ F -분포: http://www.statdistributions.com/f/

(1) 검정통계량의 확률(유의확률) 계산. 여기서 교호(상호)작용의 통계량을 제외한 것의 유의확률

은 모두 0 이다. 따라서 상호작용의 확률만 계산하면

(a) [numerator d.f.] box에 6 입력.

(b) [denominator d.f.] box에 24 입력.

(c) [right tail]을 선택.

(d) [F-value] box에 2.577을 입력.

[p-value] box에서 다음의 확률을 얻는다.

( 2.577) 0.045CP F

(2) 다음의 F -분포 값

( , ; ) (11,24;0.05)AB EF F , ( , ; ) (6,24;0.05)C EF F ,

( , ; ) (3,24;0.05)A EF F , ( , ; ) (2,24;0.05)B EF F

(a) [p-value] box에 0.05 입력.

(b) [denominator d.f.] box에 24 입력.

(c) [right tail]을 선택.

(d) [numerator d.f.] box에 11, 6, 3, 2 를 각각 입력.

[F-value] box에서 다음의 값을 각각 얻는다.

( , ; ) (11,24;0.05) 2.216AB EF F , ( , ; ) (6,24;0.05) 2.508C EF F

( , ; ) (3,24;0.05) 3.009A EF F , ( , ; ) (2,24;0.05) 3.403B EF F

계산 값들에 의해 분산분석표를 작성하면 다음과 같다. 표 [12-28] 반응온도와 원료에 따른 수율의 분산분석표

변동 요인 제곱합( SS ) 자유도( ) 평균제곱( MS ) tF 값 유의확률

수정모델

상호작용( A B )

인자 A

인자 B

오 차

2441.64( ABS )

44.667( CS )

2168.75( AS )

228.222( BS )

69.333( ES )

11( AB )

6( C )

3( A )

2( B )

24( E )

221.97( ABV )

7.44( CV )

722.92( AV )

114.11( BV )

2.889( EV )

76.83( ABF )

2.577( CF )

250.240( AF )

39.50( BF )

0.000

0.045

0.000

0.000

합 계 2510.972( TS ) 35( T )

Page 68: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

262

검정 결과

(1) 수정모델 검정: 76.83 (11,24;0.05) 2.205ABF F 이므로 oH 가 기각되고

1H 이 채택된다.

즉 두 인자(반응온도와 원료)는 수율에 관여한다. 만일 귀무가설 oH , 즉 “두 인자는 수율과 관계

가 없다.”가 채택된다면 이 후의 분산분석은 의미가 없다. 유의확률로 검정하면 0.000 이므로

1H 이 채택된다.

(2) 상호(교호)작용 검정: 2.577 (6,24;0.05) 2.508CF F 이므로 oH 가 기각되고 1H 이 채택

된다. 즉 “수율은 두 인자(온도와 원료)의 서로 상호작용에 의한 효과가 있다”. 따라서 반응온도

와 수율간 그리고 원료와 수율간의 독립적인 검정이 불가능하다. 이 경우 반응온도 사이의 수율이

나 원료 사이의 수율을 독립적으로 보려면 인자 각각(반응온도와 재료)에 대한 수준별 수율을 얻

어 일원배치 분산분석으로 검정 하여야 한다.

상호작용이 있기 때문에 다음 검정이 진실일 수 없음에도 불구하고 계속해서 검정을 하도록 하자.

(3) 반응온도간 수율: 250.239 (3,24;0.05) 3.009AF F 이기 때문에 귀무(영)가설 ( )oH A 는

기각되고 대립(연구)가설) 1( )H A 가 채택된다. 즉 반응온도에 따라 수율은 다르다. 유의확률로 보

면 0.000이기 때문에 0.05 보다 작아 1( )H A 가 채택된다.

(4) 원료간 수율: 39.50 (2,24;0.05) 3.403BF F 이기 때문에 귀무(영)가설 ( )oH B 는 기각되

고 대립(연구)가설) 1( )H B 가 채택된다. 즉 원료의 종류에 따라 수율은 다르다. 유의확률로 보면

0.000이기 때문에 0.05 보다 작아 1( )H A 가 채택된다.

(5) 상호작용의 신뢰구간: 상호작용이 있기 때문에 이에 대한 신뢰구간을 검토하는 것이 필요하다.

이것은 다음과 같이 계산된다.

상호작용을 무시할 수 없는 경우의 상호작용 신뢰구간

※ t -분포: http://www.statdistributions.com/t/

( , ) (24,0.025)2

Et t

(a) [p-value] box에 0.05 입력.

(b) [d.f.] box에 24 입력.

(c) [two tails]를 선택.

[t-value] box에서 2.064 를 얻을 것이다.

{표 [12-26] 반응온도와 원료에 따른 제품의 수율}로부터 4 3 12 개의 i jA B 평균 조합을 표로

나타내면 다음과 같다.

표 [12-29] i jA B 의 평균 조합

iA

jB 1A 2A 3A 4A 행 평균

Page 69: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

263

1B 71.33 [11

y ] 71.00 [12

y ] 59.33 [13

y ] 50.00 [14

y ] 62.92 [1(r)

y ]

2B 76.67 [ 21y ] 75.00 [ 22

y ] 66.67 [ 23y ] 58.00 [ 24

y ] 69.08 [2(r)

y ]

3B 74.67 [ 31y ] 69.67 [ 32

y ] 63.67 [ 33y ] 55.67 [ 34

y ] 65.92 [3(r)

y ]

열평균 74.22 [1(c)

y ] 71.89 [2(c)

y ] 63.22 [3(c)

y ] 54.56 [4(c)

y ] 65.97 [ y ]

상호작용 신뢰구간 공식: ( , ) ( ) ( , )2 2

E EE i j Ei j i j

V Vy t A B y t

r r

여기서 24E , 2.889EV , 3r , ( , / 2) (25,0.025) 2.064Et t

표준오차: 2.889

0.9813

EV

r

( , ) (2.064)(0.981) 2.0252

EE

Vt

r

신뢰구간 계산 신뢰구간

1 171.33 2.025 ( ) 71.33 2.025A B 1 169.31 ( ) 73.36A B

2 171.00 2.025 ( ) 71.00 2.025A B 2 168.98 ( ) 73.03A B

3 159.33 2.025 ( ) 59.33 2.025A B 3 157.31 ( ) 61.36A B

4 150.00 2.025 ( ) 50.00 2.025A B 4 147.98 ( ) 52.03A B

1 276.67 2.025 ( ) 76.67 2.025A B 1 274.65 ( ) 78.70A B

2 275.00 2.025 ( ) 75.00 2.025A B 2 272.98 ( ) 77.03A B

3 258.00 2.025 ( ) 58.00 2.025A B 3 255.98 ( ) 60.03A B

4 265.92 2.025 ( ) 65.92 2.025A B 4 263.90 ( ) 67.95A B

1 374.67 2.025 ( ) 74.67 2.025A B 1 372.65 ( ) 76.70A B

2 369.67 2.025 ( ) 69.67 2.025A B 2 367.65 ( ) 71.70A B

3 365.67 2.025 ( ) 63.67 2.025A B 3 363.65 ( ) 65.70A B

4 455.67 2.025 ( ) 55.67 2.025A B 4 353.65 ( ) 57.70A B

상호작용 전체에 대한 신뢰구간 계산 전체에 대한 신뢰구간

65.97 2.025 ( ) 65.97 2.025AB 63.95 ( ) 68.00AB

(c) <사후 분석>

※ 상호작용이 있기 때문에 모평균차의 신뢰구간은 분석하지 않아도 되지만 여기서는 비교를 위

해 계산하였다.

Page 70: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

264

모평균 차의 구간추정

(a) 반응온도(iA )사이 평균차에 대한 신뢰범위 계산

'(c) '(c) (c) '(c)

2 2[ ] ( , ) ( ) ( ) [ ] ( , )

2 2

E EE i i Ei i i i

V Vy y t A A y y t

qr qr

표준오차: 2 2(2.889)

0.8012(3)(3)

EV

qr

2 2(2.889)( , ) (24,0.025) (2.064)(0.8012) 1.6537

2 (3)(3)

EE

Vt t

qr

1(c) 2(c)74.222 71.889 2.333y y

1(c) 3(c)74.222 71.889 11y y

1(c) 4(c)74.222 54.556 19.666y y

2(c) 3(c)71.889 63.222 8.667y y

2(c) 4(c)71.889 54.556 17.333y y

3(c) 4(c)63.222 54.556 8.666y y

iA (반응온도) 평균수율 차의 신뢰구간

1 22.333 1.6537 ( ) ( ) 2.333 1.6537A A

1 20.6793 ( ) ( ) 3.9867A A

1 39.3463 ( ) ( ) 12.6537A A

1 418.0123 ( ) ( ) 21.3197A A

2 37.0133 ( ) ( ) 10.3207A A

2 415.6793 ( ) ( ) 18.9867A A

3 47.0123 ( ) ( ) 10.3197A A

(b) 원료( jB )사이 평균차에 대한 신뢰범위 계산

(r) (r) (r) (r)' ''

2 2[ ] ( , ) ( ) ( ) [ ] ( , )

2 2

E EE j Ej j j jj

V Vy y t B B y y t

pr pr

표준오차: 2 2(2.889)

0.6939(4)(3)

EV

pr

계산량: 2 2(2.8889)

( , ) (24,0.025) (2.0639)(0.6939) 1.43212 (4)(3)

EE

Vt t

pr

1 ( r ) 2 ( r )62 . 917 69 . 083 6 . 166y y

Page 71: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

265

1(r) 3(r)62.917 65.917 3.000y y

2(r) 3(r)69.083 65.917 3.166y y

jB (원료) 평균수율 차의 신뢰구간

1 26.166 1.4321 ( ) ( ) 6.166 1.4321B B

1 27.5981 ( ) ( ) 4.7334B B

1 34.4321 ( ) ( ) 1.5679B B

2 31.7339 ( ) ( ) 4.5981B B

SPSS 통계처리 [12_6_온도원료.sav]

SPSS 데이터 편집기에 표 [12-26] 데이터의 변수명을 [A], [B], [제품수율]로 하고 보기[12_5]

와 같은 방법으로 입력한다. 변수보기에서 [A]행의 값 [ ]을 눌러 변수값과 변수값 설명에 1=”

온도A1”, 2=”온도A2”, 3=”온도A3”, 4=”온도A4”로 하고, 다시 [B]행의 값 [ ]을 눌러 변수값과

변수값 설명에 1=”원료B1”, 2=”원료B2”, 3=”원료B3”로 구분하여 입력한다.

분석>일반선형모형>일변량

보조창이 뜨면 [제품수율]을 종속변수로, 변수 [A]와 [B]를 모수요인으로 이동.

주변평균 추정에서 [B*A]를 평균출력 기준으로 이동

옵션을 눌러 출력에서 기술통계량과 동질성 검정을 선택.

유의수준에 0.05를 입력.

계속>확인

일변량 분산분석 결과

개체-간 요인

원료B1 12

원료B2 12

원료B3 12

온도A1 9

온도A2 9

온도A3 9

온도A4 9

1

2

3

B

1

2

3

4

A

변수값 설명 N

오차 분 산의 동일성에 대한 Levene의 검정a

종속변수: 제품수율

.959 11 24 .506F 자유도1 자유도2 유의확률

여러 집단에서 종속변수의 오차 분산이 동일한 영가설을 검정합니다.

계획: Intercept+B+A+B * Aa.

Page 72: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

266

개체-간 효과 검정

종속변수: 제품수율

2441.639a 11 221.967 76.835 .000

156684.028 1 156684.028 54236.779 .000

228.222 2 114.111 39.500 .000

2168.750 3 722.917 250.240 .000

44.667 6 7.444 2.577 .045

69.333 24 2.889

159195.000 36

2510.972 35

소스수정 모형

절편

B

A

B * A

오차

합계

수정 합계

제 III 유형제곱합 자유도 평균제곱 F 유의확률

R 제곱 = .972 (수정된 R 제곱 = .960)a.

추정된 주변평균

B * A

종속변수: 제품수율

71.333 .981 69.308 73.359

71.000 .981 68.975 73.025

59.333 .981 57.308 61.359

50.000 .981 47.975 52.025

76.667 .981 74.641 78.692

75.000 .981 72.975 77.025

66.667 .981 64.641 68.692

58.000 .981 55.975 60.025

74.667 .981 72.641 76.692

69.667 .981 67.641 71.692

63.667 .981 61.641 65.692

55.667 .981 53.641 57.692

A온도A1

온도A2

온도A3

온도A4

온도A1

온도A2

온도A3

온도A4

온도A1

온도A2

온도A3

온도A4

B원료B1

원료B2

원료B3

평균 표준오차 하한값 상한값

95% 신뢰구간

Page 73: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

267

기술통계량

종속변수: 제품수율

71.33 1.528 3

71.00 1.000 3

59.33 2.082 3

50.00 1.000 3

62.92 9.366 12

76.67 2.082 3

75.00 1.000 3

66.67 1.528 3

58.00 2.646 3

69.08 7.937 12

74.67 1.528 3

69.67 1.528 3

63.67 2.082 3

55.67 1.528 3

65.92 7.537 12

74.22 2.774 9

71.89 2.619 9

63.22 3.598 9

54.56 3.909 9

65.97 8.470 36

A온도A1

온도A2

온도A3

온도A4

합계

온도A1

온도A2

온도A3

온도A4

합계

온도A1

온도A2

온도A3

온도A4

합계

온도A1

온도A2

온도A3

온도A4

합계

B원료B1

원료B2

원료B3

합계

평균 표준편차 N

<사후 분석>

분석>일반선형모형>일변량

보조창이 뜨면 재설정을 누름

[제품수율]을 종속변수로, 변수 [A]와 [B]를 모수요인으로 이동. 사후 분석을 누름.

요인에 있는 [B]와 [A] 사후검정 변수로 이동.

등분산을 가정함에서 LSD와 Duncan을 선택. 계속>확인

사후검정

B(원료)

다중 비 교

종속변수: 제품수율

-6.17* .694 .000 -7.60 -4.73

-3.00* .694 .000 -4.43 -1.57

6.17* .694 .000 4.73 7.60

3.17* .694 .000 1.73 4.60

3.00* .694 .000 1.57 4.43

-3.17* .694 .000 -4.60 -1.73

(J) B원료B2

원료B3

원료B1

원료B3

원료B1

원료B2

(I) B원료B1

원료B2

원료B3

LSD평균차(I-J) 표준오차 유의확률 하한값 상한값

95% 신뢰구간

관측된 평균에 기초합니다.

.05 수준에서 평균차는 유의합니다.*.

Page 74: 제 12장 분산분석 Analysis of Variance: ANOVAcontents.kocw.net/KOCW/document/2013/koreasejong/HongSungsik4/1… · 195 제 12장. 분산분석(Analysis of Variance: ANOVA) 분산분석은

268

동일집단군

제품수율

12 62.92

12 65.92

12 69.08

1.000 1.000 1.000

B원료B1

원료B3

원료B2

유의확률

Duncana,bN 1 2 3

집단군

동일집단군의 그룹에 대한 평균이 표시됩니다.유형 III 제곱합에 기초합니다오차항은 평균제곱(오차) = 2.889입니다.

조화평균 표본 크기 12.000을(를) 사용합니다.a.

유의수준 = .05.b.

A(반응온도)

다중 비 교

종속변수: 제품수율

2.33* .801 .008 .68 3.99

11.00* .801 .000 9.35 12.65

19.67* .801 .000 18.01 21.32

-2.33* .801 .008 -3.99 -.68

8.67* .801 .000 7.01 10.32

17.33* .801 .000 15.68 18.99

-11.00* .801 .000 -12.65 -9.35

-8.67* .801 .000 -10.32 -7.01

8.67* .801 .000 7.01 10.32

-19.67* .801 .000 -21.32 -18.01

-17.33* .801 .000 -18.99 -15.68

-8.67* .801 .000 -10.32 -7.01

(J) A온도A2

온도A3

온도A4

온도A1

온도A3

온도A4

온도A1

온도A2

온도A4

온도A1

온도A2

온도A3

(I) A온도A1

온도A2

온도A3

온도A4

LSD평균차(I-J) 표준오차 유의확률 하한값 상한값

95% 신뢰구간

관측된 평균에 기초합니다.

.05 수준에서 평균차는 유의합니다.*.

동일집단군

제품수율

9 54.56

9 63.22

9 71.89

9 74.22

1.000 1.000 1.000 1.000

A온도A4

온도A3

온도A2

온도A1

유의확률

Duncana,bN 1 2 3 4

집단군

동일집단군의 그룹에 대한 평균이 표시됩니다.유형 III 제곱합에 기초합니다오차항은 평균제곱(오차) = 2.889입니다.

조화평균 표본 크기 9.000을(를) 사용합니다.a.

유의수준 = .05.b.

※ SPSS에서 얻은 모든 결과는 위의 이론에서 계산한 값들과 완전히 일치함을 알 수 있다.