Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
분 산 분 석
목 차
1. 분산분석의목적2. 분산분석의예3. 분산분석에사용되는용어4. 일원배치법5. 이원배치법
1. 분산분석의목적
연구대상인특성은몇가지인자에의하여영향을받는다. 이몇가지인자중에서어느인자에 따라서가장많이영향을받는지를결정하거나이인자를어떻게조절하면 최적의상태로되는가의 조건을결정하는일이중요하다.이에분산분석이사용되어진다.
2. 분산분석의정의
실험결과생긴자료의분산을각인자에기인하는부분과우연오차에기인하는부분으로분해하고인자에기인하는분산과우연오차에기인하는분산차이의유의성을검증함으로써각인자의영향을가려내는방법이다.
3.분산분석에사용되는용어
인자(factor) : 실험결과에영향을미치는원인수준(level) : 인자의상태를지정한조건요인 (factorial factor) : 주효과와교호작용의원인이되는요소의전체 (주효과, 교호작용)
*확률변수 : 한 동전을 2회던지는시행에서앞면이나오는사건은 H, 뒷면이나오는사건 T라하고표본공간 S={TT,TH,HT,HH} 이때앞면의수를 X라고하면 X에의하여표본공간의원소에앞면의수를대응시킬수있다. X(S)={0, 1, 1, 2}가된다. 표본공간 S의각원소를어떤규칙 X에의하여실수 x로바꾸어생각하는경우 x=X(S)와같이 X는표본공간S를정의구역으로하는함수이다.즉 표본공간을정의구역으로하는실수함수이다.
*귀무가설 : 어떤회사제품의전구의평균수명은 1500시간이라고주장하고있다. 지금이회사의전구중에서 36개를무작위추출하여검사해보니 1478시간이었다.이때일반적으로표본으로뽑힌모집단의평균을 1500이라가정하고이가정은모집단의평균과회사에서주장하는평균 1500과차이가없다라는가정을귀무가설이라한다.
*대립가설 : 귀무가설이기각되는경우모집단의평균은 1500이아니라는가정이다.
*유의적 : 표본평균값이귀무가설를기각할만큼모집단평균값으로부터떨어진상태를유의적이라 한다.
*위험역 : 가설이참인데도기각할때참인가설을기각하는과오를범하는확률을어느정도허용하느냐의기준을유의수준혹은위험영역이라한다.
. 1)-(n 1)-(n
iX .
n 1)-(n 0)X(
)X()X(X
X,X,X
iX
1 iX
)X,X,(X :
2n
1
_
i
_
n
_
2
_
1
n
1
_
i
n21
2n
1
_
i
2n
1
_
i
n21
X
X
X
X
이다
자유도는가지므로독립변수를개의값은의
평방합따라서된다결정이머지값에의하여
나머는변수제수있으나취할자유로이값은개의
의중이있으므로관계가인
수사이에는
변들이보이지만개로의겉보기로는
수는변수의좌우하는값을의이유는그
자유도는대하여에평방합
에서표본임의의자유도
∑
∑
∑
∑
=
=
=
=
⎟⎟⎠
⎞⎜⎜⎝
⎛−
=−+⋅⋅⋅+
−+−=⎟⎟
⎠
⎞
⎜⎜
⎝
⎛−
⋅⋅⋅
⎟⎟⎠
⎞⎜⎜⎝
⎛−
−⎟⎟⎠
⎞⎜⎜⎝
⎛−
⋅⋅⋅∗
i
i
i
i
X
XX
n
n
4. 일원배치법3개이상의 평균의균일성을검증하는데사용되는방법
일원배치표
/ n T
/ n T x x x x A
/ n T x x x x A
/ n T x x x x A
/ n T x x x x A
A
....
_
..
..
_
kk.knkkjk2k1k
..
_
ii.iniiji2i1i
2.2.2
_
22.2n22j22212
1.1.1
_
11.1n11j12111
x xx
xx
nT
nT
nk
nT
nT
kkk
iii
=
=⋅⋅⋅⋅⋅⋅
=⋅⋅⋅⋅⋅⋅
=⋅⋅⋅⋅⋅⋅
=⋅⋅⋅⋅⋅⋅
계
평균자료수계자료값인자
ΜΜΜΜΜΜΜΜΜ
) ,0( ji, :
A : :
ji,Xji,X ji, x
2ji,
ii
ji,i
αε
αµ
εαµ
정규분포실험오차로서나타나는관계없이와
상수가리키는주효과를의수준
평균자료전체의이
를확률변수나타난로실측값
++=
평방합대한전체에자료즉합제곱의차의
의와전체평균자료의와변수각
.. : ) variation total(
(1) )..( ) variation total(
)1., 1(.
1
)1.( .
)(11.
_
1
2_
1
1
_
1
___
11
_
1
__
11
_
XS
XS
X
X
ijT
n
jij
k
iT
n
iij
i
n
ii
iii
n
jij
k
ii
n
iij
ii
ij
n
ii
i
n
iij
i
X
X
niniXnij
nii
nX
ni
j
iij
i
ii
∑∑
∑∑∑∑=
∑
∑∑
==
====
=
==
−=
==++=
=++=
++==
εαααµ
εαµ
εαµ
εε
εε
2k
1i
__2
_
2k
1i
__
1
_ k
1i
__2
_
2___
T
TT
) .. .( ).(
) .. .(
).() .. .( 2 ).(
)} .. .( ).{(S
다 )1(1 S
X
X
X
X
∑∑∑
∑
∑∑∑∑
∑∑
=
=
==
−+−=
−+
−−+−=
−+−=
−=
iiX
i
iXiiX
iiX
n
XX
X
XXX
XX
i jij
n
jij
i jij
i jij
i
변형하면같이음과식을
자유도의전변동 ν
1-k
)...() ( S
) 1n )i. ( (
)1(n
)i. ( )(S
A
2__k
1iA
i
n
1j
2_
k
1iiE
2k
1 1
_
E
X
X
X
=
−=
−−
−=−=
−=
∑
∑
∑
∑∑
=
=
=
= =
ν
ν
자유도
변동급간
자유도는의
자유도
급내변동
in
X
kn
X
Xi
ij
i
n
jij
i
Θ
2_ _
i.i1
2_
i
_
i1
2__
1
2_
1i 1ij
_
i
_
iji
2_
i
k
1i 1iji
2k
1i
_
1E
).. i. (
)}.. )i. {()...(
)i. (
i. . ,
)}i. () {( ).( S
εε
εε
ε
ε
ε
αα
αµαµ
ε
αµεαµ
αµεαµ
−+=
++−++=−=
−=
++=++=
++−++=−=
−∑
∑∑
∑∑
∑∑∑∑
=
==
= =
= == =
k
ii
k
ii
k
iiA
j
ij
n
jij
n
j
n
ninS
iX
iX
XX
X
Xii
. F k-n 1,-k
F
1V
V
:H " "
A
E
k21 0
한다분포를
인자유도분모의자유도분자의이는
분산비이들의
불편분산급간
급내불편분산
세우면를귀무가설즉
가설라는없다차이가사이에주효과수준의각
E
A
A
A
A
E
E
E
i
VV
kS
VS
knS
VS
=
−==
−==
==⋅⋅⋅== αααα
E
A
EA
a T EATE
a2
2..
2.
A
T
2..
T
0
VVF
V 1
V
S SS )(
1 )(S
1 )(S (2)
. A :H )1(
=
−=
−=
−=−=−=
−=−=
−=−=
∑
∑∑
∗
분산비
불편분산
오차급내변동
급간변동
전변동
없다차이가주효과의수준사이에의인자가설
분산분석일원배치의
knS
kS
kn
kn
Tn
T
nn
Tx
EA
i i
i
i jij
ννν
ν
ν
(4) A
)(FF (3) 1-kk-n
작성분산분석표
유의적차이는효과의수준간의한에인자즉
기각가설을로유의수준이면우측검정 αα≥
1-n S k-n/SV k -n S
)(F V /V F 1-/kSV 1-k S
T
EEE
1-kk-nEAAAA
전
급내
급간
판정기준분산비불편분산자유도평방합요인
=== α
*두수준간의평균의 차의검정분석결과수준간의주효과의유의차가인정되면각수준중의어느두수준의평균차가유의적인가를알아보는것이다.이때귀무가설을검정할때의유의수준의위험역은양측검과우측검정으로한다.
좌측검정
우측검정
양측검정
불편분산이때의
표본평균값
표본값얻은
추출하여표본을인크기각각독립적으로서로에서
세운다가설을같다라는모평균이대하여에
정규분포집단두같은모분산이
검정평균차의
(5)(4)
(3)
/1/1 t
})()({2
1
1 , 1
),(y ),,(x ,n B(2)A,
. BA, )1(),(: ),,(:
21
__
2_
11
2_
21
2
11
_
11
_
221121
21
22
yx
yx
yx2
2
nn
yxnn
yn
xn
yyxxn
NBNA
n
ii
n
ii
n
ii
n
ii
nn
i
i
+−
=
−+−−+
=
==
∗
∧
==
∧
==
∑∑
∑∑
σ
σ
σµσµ
ΚΚ
)/1/1()2(x
(2)
)/1/1()(x
(1)
0.01_) 0.05
. t )/1/1(
T
:
i
.i.
.i.
E..
jiEknj
jiEknj
jiE
ji
jiji
ji
nnVtx
nnVtx
knnnV
XX
j
+≥−
+≥−
=
−=+
−=
=+=+
++
−
−
α
α
α
ν
αααµαµ
αµαµ
우측검정
양측검정
위험역은인
또는유의수준검정할때의을귀무가설따라서
한다분포를인자유도인
즉가설
이면모평균을수준의째와모평균수준의째
ㅑ
ㅑ
Ex)어떤합성반응에서촉매의양이합성물의생산량에영향을알기취해촉매의양을 2g, 4g, 6g 의 3수준으로하여각수준마다 4회씩실험한결과다음과같은자료를얻었다. 촉매의양은합성물의생성량에영향을미친다고할수있는가?
uij = xij-77 (77은가평균)과같이변환함으로써자료값 xij를 uij로고치면
79 80 85 82 )6( 78 75 81 79 )4(
67 73 69 74 )2(
3
2
1
gAgAgA
생성량촉매량
974 2- 324 18 2 3 8 5
25 5 1 2- 4 2 625 25- 10- 4- 8- 3-
)( 77u
3
2
1
2ij
계
계계인자
AAA
xA ij −=
CT=(-2)2/12=0.33전변동 : ST={(-3)2+(-8)2 +(-4)2 +(-10)2 +(2)2 +(4)2 +(-2)2 +(1)2 +(5)2
+(8)2 +(3)2 +(2)2}- CT=316-0=316 전변동의자유도 12-1=11촉매량간변동 : SA={(-252/4)+(-52/4)+(182/4)- CT=244촉매량간변동의자유도 3-1=2촉매량내변동 : SE=ST-SA =72
자유도 11-2=9
11 316 02.8)01.0(F 8 9 72
26.4)05.0(F 15.2 122 2 244
29
29
전
급내
급간
판정기준분산비불편분산자유도평방합요인
=
=
위의예제각촉매량에대한평균의차의유의성을개별적으로비교하면
500.6)4/14/1()01.0( t
524.4)4/14/1()05.0( t
8 , 4250.3)01.0( t, 262.2)05.0( t
9
50.81774
18
25.787745 70.2577
425-
,
, 6g , 4g , 2g
9
9
E4321
99
.3
_
.2
_
.1
_.3
_
.2
_.1
_
x
xxxx
x
=+
=+
=======∴
=+=
=+==+=
E
E
V
V
nnnn ν
자유도오차변동의
하면라
각각평균을생성량의합성물대한에촉매량
.
4.524 )4/14/1()05.0( t 25.325.8125.78
.3 .2.3
. 1%
5.6 )4/14/1()01.0( t 0.1125.8125.70
.2 .1 .2
. 1%
5.6 )4/14/1()01.0( t 0.825.7825.70
.2 .1 .1
9
__
9
__
9
__
아니다유의적이
차의과
유의적이다으로유의수준
차의과
유의적이다으로유의수준
차의과
⇒
=+⟩=−=
⇒
=+⟩=−=
⇒
=+⟩=−=
E
E
E
V
V
V
xx
xx
xx
5. 이원배치법
두인자 A,B가있어서인자 A의수준은 k개, 인잔 B의수준은 l개가 있다고하면 A수준의 Ai와 B수준의 Bj가결합된조건(Ai,Bj)에서의측정값 xij를얻으면이실험을이원배치라하고이원배치표에서인자의각수준에서의측정값이가로로 배열된것을행 (행인자), 세로로배열된것을열 (열인자)
..
_
.
_
.
_
2.
_
1.
_
...l.j.2i1
.
_
k.klkjk2k1k
.
_
i.iliji2i1i
.2
_
2.2lij22212
.1
_
1.1lij12111
lj 21
xxxxx
xx
xx
T T T T T
T x x x x A
T x x x x A
T x x x x A
T x x x x A
B B B B
lj
k
i
⋅⋅⋅⋅⋅⋅
⋅⋅⋅⋅⋅⋅
⋅⋅⋅⋅⋅⋅
⋅⋅⋅⋅⋅⋅
⋅⋅⋅⋅⋅⋅
⋅⋅⋅⋅⋅⋅
⋅⋅⋅⋅⋅⋅
평균
계
평균계
ΜΜΜΜΜΜΜ
) ,0(
ji, :
B ,A : , :
ji,Xji,X ji, x
2
ji,
jiji
ji,ji
α
ε
βαµ
εβαµ
정규분포실험오차로서
나타나는관계없이와
상수가리키는주효과를의수준
평균모자료전체의이
를확률변수나타난로실측값
+++=
평방합대한전체에자료즉합제곱의차의
의와전체평균자료의와변수각
마찬가지로일원배치법과ㅣ
.. : on) variati total(
(1) )..( on) variati total(
)1., 1(.
1
)1.( .
)(11.
_
1
2_
1
1
_
1
___
11
_
1
__
11
_
XS
XS
X
X
ijT
jij
k
iT
n
iij
i
n
ii
iii
n
jij
k
ii
n
iij
ii
ij
n
ii
i
n
iij
i
X
X
niniXnij
nii
nX
ni
iij
i
ii
∑∑
∑∑∑∑=
∑
∑∑
==
====
=
==
−=
==++=
=++=
++==
εαααµ
εαµ
εαµ
εε
εε
∑∑
∑
∑∑
++
++−=
++++
−+−=
−=
i j
i jij
i
kil
i
iiX
kl
X
X
X
XX
2___
ij
2__2
i
__
2___
ij
__
___
T
TT
)...j- .-X(
)...j() .. .(
)}...j- .-(X )...j(
) .. .( ).{(S
다 )1(1 S
X X
X XX
X XX X
X
변형하면같이음과식을
자유도의전변동 ν
1)-1)(l-(k1)-(-1)-(-1)-(
SSSS
)...j- .-X( S
1 )...j(S B
1 ) .. .(S A
BAE
EBAT
2___
ijE
B2
__
B
A
2
i
__
A
X X
X X
X
==−−=
++=∴
+=
−=+=
−=−=
∑∑
∑
lkkl
i
lk
kil
T
i jX
X
νννν
ν
ν
자유도오차변동의
오차변동
자유도간변동
자유도간변동
2_ _
i1
2_ _
i1
2__ _
1i 1ijE
j
_
1
_
1
_
___
j
_
_
i
_
iji
).. .ji. (
).. i. (
)...j- i. (S
) kl1
.. , 1 .j. , 1i. (
.... , .j. .
i. . ,
-
X
εε
εε
εεε
εεε
εε
ε
β
α
ε
εεε
µβµ
αµεαµ
−+=
−+=
−=
===
+=++=
++=++=
∑
∑
∑∑
∑∑∑∑
=
=
= =
==
l
iB
k
iA
j
iij
k
iij
l
jij
ij
kS
lS
kl
j
iX
X
X
단
. F 1)-1)(l-(k 1,-l
F , 1
V
0 :H
F , 1
V
0 :H )1)(1(
V
0 :H 0 :H
A
0
A
0
E
0
0
한다분포를
인자유도분모의자유도분자의이는
분산비
참이면가가설
분산비
참이면가가설
가설
가설
E
BA
B
B
j
E
AA
A
A
i
E
E
E
j
i
VV
lS
VS
VV
kS
VS
lkS
VS
=−
==
=
=−
==
=−−
==
==
β
α
βα
β
α
β
α
따라서 일원배치법의경우와 마찬가지로인자 A ,B의각수준의평균의균일성의 검정을 분산분석표에의해할수있다.또한 각수준의평균의차를개별적으로검정할때의위험역을 일원배치법의경우와마찬가지로결정할수있다.