18
장 두 모집단 비교 17 모평균에 대한 검정 17.1 두 모집단으로부터 추출된 자료를 바탕으로 두 모집단의 평균이 같은지에 대한 검정을 수행 , 한다 표본이 작은 경우에는 두 모집단에 대해 정규분포를 가정한다 이표본과 함께 일표본의 . . 경우도 함께 다룬다. 을 이용한 검정 17.1.1 R 함수는 일표본 과 이표본 의 모평균에 대한 t.test() (one sample) (two sample) 검정을 수행한 - 함수의 사용상 주의점과 주요 옵션은 다음과 같다 . t.test() . 함수는 두 집단에 대해 서로 다른 분산 을 가정하며 t.test() (unequal variance) , Welsh 자유도를 사용하여 검정을 수행한다 - . 옵션은 모집단에 대해 공통분산을 가정하고 공통분산에 대한 추정치 var.equal=TRUE , 를 사용하여 (pooled variance estimate) 검정을 수행한다 - . 디폴트 옵션을 제공한다 alternative="two.sided"( ), "less", "greater" . 독립인 두집단 (a) 검정 - 수치형 벡터 이진형 요인 t.test(y~x) # y: , x: (binary factor) 수치형 벡터 t.test(y1, y2) # y1, y2: 대응 (b) (paired) 검정 대응 비교 - : 수치형 벡터 이진형 요인 t.test(y~x, paired=TRUE) # y: , x: (binary factor) 수치형 벡터 t.test(y1, y2, paired=TRUE) # y1, y2: 위의 결과와 같음 t.test(y1-y2) # 대응 비교 는 대응되는 자료 간의 차이 자료 를 일표본 (paired comparison) (differenced data) 자료로 취급하므로 본질적으로 일표본 검정과 같다. 일표본 (c) 검정 - 디폴트 t.test(y, mu=) # mu=0( ) 유의 함수는 모집단이 정규분포를 따른다는 가정하에 개발된 통계이론이다 모집단의 t.test() ( 분산은 모른다고 가정 실제의 자료 분석에서 모집단에 대한 정규분포 정규성 가정이 적절치 ). ( ) 않은 경우가 발생하며 이 경우에는 다음에 소개되는 비모수적 검정을 수행하는 것이 바람직 ,

17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

장 두 모집단 비교17

모평균에 대한 검정17.1

두 모집단으로부터 추출된 자료를 바탕으로 두 모집단의 평균이 같은지에 대한 검정을 수행,한다 표본이 작은 경우에는 두 모집단에 대해 정규분포를 가정한다 이표본과 함께 일표본의. .경우도 함께 다룬다.

을 이용한 검정17.1.1 R

함수는 일표본 과 이표본 의 모평균에 대한t.test() (one sample) (two sample) 검정을 수행한-다 함수의 사용상 주의점과 주요 옵션은 다음과 같다. t.test() .

함수는 두 집단에 대해 서로 다른 분산 을 가정하며 의t.test() (unequal variance) , Welsh▶자유도를 사용하여 검정을 수행한다- .

옵션은 모집단에 대해 공통분산을 가정하고 공통분산에 대한 추정치var.equal=TRUE ,▶를 사용하여(pooled variance estimate) 검정을 수행한다- .디폴트 옵션을 제공한다alternative="two.sided"( ), "less", "greater" .▶

독립인 두집단(a) 검정-

⋅ 수치형 벡터 이진형 요인t.test(y~x) # y: , x: (binary factor)⋅ 수치형 벡터t.test(y1, y2) # y1, y2:

대응(b) (paired) 검정 대응 비교- :

⋅ 수치형 벡터 이진형 요인t.test(y~x, paired=TRUE) # y: , x: (binary factor)⋅ 수치형 벡터t.test(y1, y2, paired=TRUE) # y1, y2:⋅ 위의 결과와 같음t.test(y1-y2) #

대응 비교 는 대응되는 자료 간의 차이 자료 를 일표본(paired comparison) (differenced data)자료로 취급하므로 본질적으로 일표본 검정과 같다.

일표본(c) 검정-

⋅ 디폴트t.test(y, mu=) # mu=0( )

유의 함수는 모집단이 정규분포를 따른다는 가정하에 개발된 통계이론이다 모집단의t.test() (분산은 모른다고 가정 실제의 자료 분석에서 모집단에 대한 정규분포 정규성 가정이 적절치). ( )않은 경우가 발생하며 이 경우에는 다음에 소개되는 비모수적 검정을 수행하는 것이 바람직,

Page 2: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

하다.

예제 자료에서 변속기 유형 에 따라 자동 수동 에 따라 연비[ 1] mtcars{datasets} (am) (0: , 1: )가 다른지에 대한 검정을 수행한다(mpg) .

> data(mtcars)> boxplot(mpg ~ am)

> t.test(mpg ~ as.factor(am))

Welch Two Sample t-test

data: mpg by as.factor(am)t = -3.7671, df = 18.332, p-value = 0.001374alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:-11.280194 -3.209684sample estimates:mean in group 0 mean in group 1

17.14737 24.39231----------------------------------해석 유의수준 기준에서 변속기의 형태 에 따라 연비 가 같다는 귀무가설을 기( ) 1% (am) (mpg)각할 만한 증거가 충분하다.

예제 자료는 두 종류의 수면제의 효과를 측정한 자료로 같은 대상 명에[ 2] sleep{stats} , 10대해 두 종류의 수면제의 효과 가 통제 집단에 비해 증가했는지의 여부를 측정(group=1, 2)한 자료이다 두 종류의 수면제의 효과가 서로 같은지에 대한 검정을 수행한다. .

> attach(sleep)

Page 3: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

> str(sleep)> t.test(extra[group==1], extra[group==2], paired=TRUE)

와 같은 결과# > t.test(extra ~ group, paired=TRUE)

Paired t-test

data: extra[group==1] and extra[group==2]t = -4.0621, df = 9, p-value = 0.002833alternative hypothesis: true difference in means is not equal to 095 percent confidence interval:-2.4598858 -0.7001142sample estimates:mean of the differences

-1.58--------------------------------해석 유의수준 기준에서 두 종류의 수면제의 효과가 유의함을 알 수 있다( ) 1% .

앞서 언급한 바와 같이 대응, 검정은 다음과 같이 개체별 차이 자료에 대한 일표본- 검정-을 수행하는 것과 같다.

> sleep.d <- with(sleep, extra[group==2] - extra[group==1])> t.test(sleep.d)

One Sample t-test

data: sleep.dt = 4.0621, df = 9, p-value = 0.002833alternative hypothesis: true mean is not equal to 095 percent confidence interval:0.7001142 2.4598858sample estimates:mean of x

1.58--------------------------------해석( ) 값이 위의 결과와 같음을 알 수 있다- .

Page 4: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

검정 이론 소개17.1.2

일표본과 이표본의 경우 모평균에 대한 검정 이론을 소개한다 이 절에서 소개되는 가지의. 3

검정은 모집단에 대해서 분산을 모르는 정규분포를 가정하고 있다- .

일표본 검정(a)

일표본에서 모평균이 특정한 값 를 갖는지를 검정하기 위해 다음과 같은 가설을 설정한다. ≠

위의 가설을 검정하기 위한 검정통계량은 다음의 통계량을 사용한다- .

여기서 는 표본표준편차를 의미한다 귀무가설 하에서 위의 통계량은 자유도가. 인 -분포를 따른다.

이표본 검정(b)

이표본에서 두 모집단이 차이가 있는지를 알아보기 위해 두 집단의 모평균의 차를 이용하여검정하는데 가설은 다음과 같이 설정한다.

그리고 이 가설을 검정하기 위해 다음과 같은 검정통계량을 사용한다.

여기서

이며, 과 은 두 집단에서의 표본분산을 의미한다.

귀무가설 하에서 위 통계량은 자유도가 인 분포를 따른다- .

이표본 검정에서는 두 집단의 모분산이 심각하게 다를 때에는 위의 검정통계량을 사용하여 검정할 수가 없다 따라서 두 모평균의 차에 관한 검정을 하기 전에 두 모분산이 같은지를 먼저.검정하여야 한다.분산의 동일성 검정

Page 5: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

함수는 정규모집단으로부터의 두 표본에 대해 분산이 같은지에 대한var.test() 검정 결과-를 제공한다.

> x <- rnorm(50, mean=0, sd=2)> y <- rnorm(30, mean=1, sd=1)> var.test(x, y)

F test to compare two variances

data: x and yF = 2.585, num df = 49, denom df = 29, p-value = 0.007643alternative hypothesis: true ratio of variances is not equal to 195 percent confidence interval:1.298761 4.863450sample estimates:ratio of variances

2.584994-------------------------------해석 유의수준 기준에서 두 모분산이 같다는 귀무가설을 기각할 만한 증거가 충분하다( ) 1% .

의(c) Welch 검정-

두 표본의 분산이 다를 경우 이표본, 검정은 의 근사적 방법을 사용한다 이때 검정- Welch . ,통계량은

이며 이 통계량은 귀무가설하에서 자유도가,

인 분포를 따른다 이를 의 자유도라 한다- . Welch-Satterthwaite .

Page 6: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

대응비교(d)

앞서 두 집단의 자료가 서로 독립인 경우에 대해 모평균에 대한 검정을 실시한 반면 대응비,교는 두 집단의 자료가 서로 연관이 된 경우 모평균에 대한 검정방법이다.

대응비교 는 같은 실험조건을 가지는 서로 독립적인 두 개의 실험집단을(paired comparison)구성하기 어려운 경우 같은 개체에 대해 두 가지의 실험을 수행하여 그 결과를 얻게 된다, .따라서 개체간의 자료사이에는 독립성이 만족되지만 개체내의 두 변수 간에는 서로 연관이 되어 있으므로 두 표본이 서로 독립이라 말할 수 없다 이 경우에 두 변수의 모평균의 차이를, .검정하기 위해서는 개체간의 특성을 무시하는 전체의 평균을 비교하는 것보다 개체 내에서 발생하는 차이들에 대한 평균값을 고려하는 것이 바람직 할 것이다.

각 개체에 대해 조사된 표본을 , ⋯이라 하자 이 때 두 모평균이 같은지에.대한 검정은 각 개체 내에서의 차이를 라고 할 때, 의 평균이 인지를 검0정하는 문제로 생각될 수 있다 즉 두 모평균이 같은지에 대한 검정은 다음과 같이 표현될. ,수 있다.

위의 검정은 일표본에서의 모평균에 대한 검정과 같으므로 다음의 검정통계량을 통해 수행될수 있다 즉 검정통계량은. ,

으로 주어지며, 와 는 각각 들의 평균과 표준편차를 의미한다 위의 검정통계량은 귀.무가설 하에서 자유도가 인 분포를 따른다- .

모집단에 대한 가정(e)

이 절에서 소개한 가지 검정통계량은 모두 귀무가설하에서3 분포를 따른다 이 사실은 이론- .적으로 모집단에 대해 정규분포를 가정할 때 성립되는 이론이다 모본산은 모르는 경우를 가(정 표본이 충분히 큰 경우에는 모집단에 대해 정규분포의 가정이 필요 없게 된다 충분히). , .큰 표본의 경우에는 중심극한정리에 의해 표본평균과 관련된 위의 가지 검정통계량이 모두, , 3귀무가설하에서 표준정규분포를 따르게 되므로 근사적으로 정규검정을 수행할 수 있다.

Page 7: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

모비율에 대한 검정17.2

을 이용한 검정17.2.1 R

는 모비율에 대한 검정을 수행한다 함수는 여러 그룹의 비율 성공 확prop.test() . prop.test() (률 이 같은지 또는 비율들이 특정한 값을 가지는지에 대해 카이제곱) ( 검정을 수행한다 이) .검정은 일종의 근사적인 검정이다 함수의 일반형식은 다음과 같다. prop.test() .

prop.test(x, n, p=NULL,alternative=c("two.sided", "less", "greater"),conf.level=0.95, correct=TRUE)

위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default) Yates (continuity correction)실시함 연속성 수정을 고려한 카이제곱 통계량의 형태는 다음과 같다. .

예제 성공확률에 대한 검정[ 3]

> set.seed(500)에서 개의 난수를 발생> heads <- rbinom(1, size=100, prob=.5) # B(100, 0.5) 1

연속성 수정 디폴트 을 고려한 검정 수행> prop.test(heads, n=100, p=0.5) # ( )에서 는 디폴트임> ## prop.test() p=0.5

1-sample proportions test with continuity correction

data: heads out of 100, null probability 0.5X-squared = 1.69, df = 1, p-value = 0.1936alternative hypothesis: true p is not equal to 0.595 percent confidence interval:0.4672127 0.6673464sample estimates:

p0.57------------------------------------------해석 연속성 수정을 고려하여 가설( ) , 에 대한 양측검정 결과 유의수준 에서 귀5%무가설을 기각할 수 없다.

Page 8: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

모비율에 대한 정확한 검정

함수는 베르누이 모집단의 성공확률에 대한 정확한 검정 을 제공한다binon.test() (exact test) .예를 들어 예제 의 자료에 대해 적용하면 다음과 같다, [ 3] .

> binom.test(heads, n=100, p=0.5)또는 > binom.test(c(heads, 100-heads), p=0.5)

Exact binomial test

data: heads and 100number of successes = 57, number of trials = 100, p-value = 0.1933alternative hypothesis: true probability of success is not equal to 0.595 percent confidence interval:0.4671337 0.6686090sample estimates:probability of success

0.57----------------------------------해석 이항분포에 기초한 정확한 검정 결과 유의수준 기준에서 귀무가설을 기각할 수 없( ) , 5%다.

예제 여러 모집단의 성공비율 검정 아래의 자료는 곳의 환자집단 으로부터 흡[ 4] ( ) 4 (patients)연자의 수 를 조사한 자료이다 각 집단에서의 흡연자 비율이 모두 같은지에 대한(smokers) .검정을 수행한다.

> smokers <- c( 83, 90, 129, 70 )> patients <- c( 86, 93, 136, 82 )> prop.test(smokers, n=patients)

4-sample test for equality of proportions without continuitycorrection

data: smokers out of patientsX-squared = 12.6004, df = 3, p-value = 0.005585alternative hypothesis: two.sidedsample estimates:

prop 1 prop 2 prop 3 prop 40.9651163 0.9677419 0.9485294 0.8536585-----------------------------------

Page 9: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

해석 네 집단에서의 흡연비율이 모두 같다는 귀무가설을 기각할 만한 근거가 충분하다고 할( )수 있다( 값- ≈0.006).

Page 10: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

검정 이론 소개17.2.2

일표본 모비율 검정(a)

일표본에서 모비율 가 특정한 비율값 인지에 대한 다음의 가설

에 대한 검정통계량은 다음과 같다.

또는

여기서 를 표본의 성공 횟수라고 할 때, 은 표본의 성공 비율을 나타낸다 귀무가설.하에서 위 통계량은 근사적으로 표준정규분포를 따른다.

이표본 모비율 검정(b)

두 모비율에 차이가 같은지에 대한 다음의 가설

에 대한 검정통계량은 다음과 같다.

여기서 를 각 표본의 성공 횟수라고 할 때, 을 의미한다 귀무가설 하에서.

검정통계량 는 근사적으로 표준정규분포를 따른다.

모집단에 대한 가정(c)

일표본 모비율의 검정시 모집단에 대해서는 성공의 확률이 인 베르누이분포를 가정한다 이.때 표본의 성공비율, ( 은 베르누이 모집단으로부터의 표본평균이며 따라서 중심극한정리에) ,의해 표준정규분포를 따르게 되므로 근사적으로 정규검정을 수행하게 되는 것이다, .

Page 11: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

비모수적 방법17.3

통계학에서 비모수적 방법은 모집단에 대해 특별한 제한을 두지 않고 개발된(nonparametric)분석 방법이다 여기서는 모집단에 대해 연속인 모집단 또는 연속이며 대칭인 모집단 정. “ ” “ ”도로만 가정한다 이러한 가정하에서 개발된 통계적 방법은 특정한 모집단 가령 정규분포 가. ( )정하에서는 최적이 아닐 수 있으나 이 가정이 위배되는 많은 상황에 대해 적용이 가능한 장,점을 가진다 즉 비모수적 방법은 부분 최적은 아닐 수 있으나 모집단이 정규분포인 경우. , (등 이상치가 포함된 자료를 분석하거나 자료의 수가 크지 않은 경우에 대해 효과가 뛰어난),방법이라 할 수 있다.

을 이용한 검정17.3.1 R

함수는 일표본과 이표본에서의wilcox.test() 검정에 대응하는 비모수적 검정을 수행한다- .

⋅ 디폴트alternative="two.sided"( ), "less", "greater"

독립인 두 모집단의 위치모수에 대한 검정 맨 휘트니(a) : - (Mann-Whitney) 검정 또는 윌콕슨 의 순위합 검정(Wilcoxon) (rank sum test)

⋅ 수치형 벡터 이진형 요인wilcox.test(y~A) # y: , A: (binary factor)⋅ 수치형 벡터wilcox.test(y, x) # y, x:

대응비교 대응인 두 모집단의 위치모수 비교 윌콕슨 의 부호순위 검정(b) ( ): (Wilcoxon) (signedrank test)

⋅ 수치형 벡터wilcox.test(y1, y2, paired=TRUE) # y1, y2:⋅ 위의 결과와 같음wilcox.test(y1-y2) #

일표본 검정 윌콕슨 의 부호순위 검정(c) : (Wilcoxon)

⋅ 수치형 벡터 표본을 지정하는 인자가 한 개임wilcox.test(y, mu=) # y: .

일표본 위치모수 중앙값 에 대한 검정 부호 검정# ( ) :⋅ 패키지 에서 제공함sign.test(x) # R {BSDA}

예제 자동차 부품 공장에서 관리자가 두 종업원 의 제품의 검수 시간에 차이가 있는[ 5] (A, B)지를 알아보기 위해 회에 걸쳐 검수 시간 단위 분 을 측정하였다10 ( : ) .

Page 12: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

1 2 3 4 5 6 7 8 9 10A 6.0 2.2 2.3 3.3 3.7 2.3 2.2 2.4 4.4 3.9B 2.7 3.9 7.8 5.8 2.3 2.4 6.9 4.4 2.4 2.5

이 자료는 오른쪽으로 꼬리가 긴 형태를 띠므로, 검정의 가정인 정규분포의 가정에 부합하-지 않는다 그러나 두 표본의 밀도함수의 형태가 유사하므로 비모수적 검정법인 순위합 검정. ,이 적절한 것으로 판단된다 절 참고(17.3.2 ).

윌콕슨의 순위합 검정> ##> A <- c(6.0,2.2,2.3,3.3,3.7,2.3,2.2,2.4,4.4,3.9)> B <- c(2.7,3.9,7.8,5.8,2.3,2.4,6.9,4.4,2.4,2.5)> plot(density(A)); plot(density(B))

> boxplot(A); boxplot(B)> wilcox.test(A, B)

Wilcoxon rank sum test with continuity correction

data: A and BW = 33, p-value = 0.2104alternative hypothesis: true location shift is not equal to 0

Warning message:가 있어 정확한 값을 계산할 수 없습니다In wilcox.test.default(A, B) : tie p

---------------------------------------------------------해석( ) 값이 유의하지 않으므로 두 종업원 간에는 차이가 없다고 할 수 있다- , .

Page 13: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

검정 원리 소개17.3.2

맨 휘트니 검정통계량(a) -

두 모집단의 위치모수가 같다: . : 모집단의 위치모수가 모집단의 위치모수보다 크다.

두 표본의 자료가 주어질 때 윌콕슨의 순위합 통계량( 과 맨 휘트니 검정통계량) - ( 의 값은)다음과 같이 계산된다.

혼합표본 에서= (combined sample) 자료들의 순위합 각= 들에 대해 그 값보다 큰 자료의 개수들의 합

예 맨 휘트니 검정통계량( ) -

부호 검정과 부호순위 검정통계량(b)

모집단의 위치모수가: 이다. 모집단의 위치모수가: 보다 크다.

부호 검정통계량( )ⅰ

보다 큰 자료의 개수

예 부호 검정통계량( ) :

Page 14: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

부호순위 검정통계량( )ⅱ

보다 큰 자료에 대한 와의 차이의 절댓값들의 순위합

예 부호순위 검정통계량( ) :

위의 두 통계량의 귀무가설하에서의 분포는 표본의 크기에 따라 달라진다 에서는 맨 휘(c) . R -트니 통계량과 부호순위 통계량의 밀도함수값 누적확률 분위수 난수 생성 등을 제공한다, , ,

절 참고(2.2 ).

⋅wilcox()⋅signrank()

예제 을 이용하여 맨 휘트니 검정통계량의 귀무가설하에서의 분포를 구해보기로 한다[ 6] R - .

의 범위 지정과 밀도함수 분포함수> ## x ,> x <- -1:(3*2 + 1)

인 경우를 가정> fx <- dwilcox(x, 3, 2) # m=3, n=2밀도함수값> fx #

[1] 0.0 0.1 0.1 0.2 0.2 0.2 0.1 0.1 0.0누적분포함수값> Fx <- pwilcox(x, 3, 2) #

> Fx[1] 0.0 0.1 0.2 0.4 0.6 0.8 0.9 1.0 1.0

밀도함수와 분포함수 시각화> ##> layout(rbind(1, 2), widths=1, heights=c(3,2))

은 그래픽 디바이스를 지정한 형태로 나눔> ## layout()는 첫 번째와 두 번째 그림을 행으로 합함> ## rbind(1, 2)

함수의 사용 예# layout() : layout(matrix(c(1,1,0,2), 2, 2, byrow=TRUE))해석 그래픽 디바이스를 행 열로 나눈 뒤 번 그림은 행의 두 곳에 위치시키# ( ) 2 2 , 1 1

고 번 그림은 행 열에 위치시킨다, 2 2 , 2 .

그림의 마진을 지정> par(mar=c(1,1,3,1)) #

Page 15: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

> plot(x, fx, type="h", col="violet",main="Probabilities (density) of Wilcoxon-Statist.(m=3, n=2)")

> plot(x, Fx, type="s", col="blue",main="Distribution of Wilcoxon-Statist.(m=3, n=2)")

> abline(h=0:1, col="gray20", lty=2)그래픽 디바이스를 원위치로 돌림> layout(1) #

참고 위 분포의 이론적인 유도 대해서는 수리통계학 나종화 을 참고하기 바란다( , 2012) .

모집단에 대한 가정(d)

부호 검정과 부호순위 검정부호 검정과 부호순위 검정은 일표본에 대한 검정으로 모두 모집단의 중앙값에 대한 검정을수행한다 부호 검정의 경우 모집단에 대해. 연속인 가정만을 필요로 하며 부호순위 검정의,경우 연속이며 대칭인 분포를 가정한다.

윌콕슨 순위합 검정윌콕슨의 순위합 검정은 이표본에 대한 검정으로 모집단의 위치모수에 대한 검정을 수행한,다 윌콕슨의 순위합 검정은 두 모집단에 대해 위치모수만 다른 같은. 연속의 분포를 가정한다 아래 그림은 유사한 두 모집단 분포로부터의 확률표본을 나타낸 것으로 오른쪽으로 이동. ,된 분포로부터의 자료가 상대적으로 큰 순위를 가진다.

Page 16: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

그림 유사한 두 모집단 분포로부터의 확률표본[ 17.1]

Page 17: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

장 연습문제17

자료에서 비타민 의 유형에 따라 이빨의 길이가 다른지에 대한 검정을 실1. ToothGrowth C

시하여라 만약 등분산의 가정을 하였다면 그 이유를 말하여라. .

어느 대학에서 실시한 예비 시험과 본 시험을 치렀다 시험을 치른 학생 가운데 몇 명을2. .

임의로 추출하여 성적을 조사한 결과가 다음과 같이 주어졌다.

본 시험의 결과가 예비 시험의 결과보다 향상되었는지에 대한 검정을 수행하고자 한다.

표본을 예비 시험을 치른 학생과 본 시험을 치른 학생 가운데 각각 명씩을 임의로 뽑아(a) 10

조사하였을 때 위 검정을 수행하여라 만약 등분산 또는 대응비교의 가정을 하였다면 그 이, .

유를 말하여라.

임의로 명의 학생을 뽑은 후 예비 시험과 본 시험의 성적을 조사하였을 때 위 검정을(b) 10 ,

수행하여라 만약 등분산 또는 대응비교의 가정을 하였다면 그 이유를 말하여라. .

년 만 명의 표본을 대상으로 빈곤층의 비율을 조사한 결과 로 조사되었고 같3. 2010 4 12.8% ,

은 조사를 년에 만 명을 대상으로 실시한 결과 로 조사되었다 빈곤층의 비율이2011 5 13.1% .

더 커졌다고 주장할 수 있는지를 검정하여라.

어느 개인의 휴대용 전화의 회 통화 시간 단위 분 을 임의로 회 측정한 결과가 다음과4. 1 ( : ) 15

같다.

3 1 2 3 3 1 3 4 15 2 2 12 20 3 1

이 사람의 통화시간의 중앙값 또는 평균 이 보다 작다고 주장할 수 있는지를 검정하고 자 한( ) 5

다.

위의 자료에 대해 상자그림을 그려라(a) .

(b) 검정이 적절하지 않은 이유를 말하여라- .

부호 검정을 수행하여라 모집단에 대해 어떤 가정을 하였다면 그 이유를 말하여라(c) . .

부호순위 검정을 수행하여라 모집단에 대해 어떤 가정을 하였다면 그 이유를 말하여라(d) . .

시험 점수

예비 시험 68 67 64 74 55 59 62 66 58 79

본 시험 62 76 66 69 52 60 70 85 76 90

Page 18: 17장 두 모집단 비교 - elearning.kocw.netelearning.kocw.net/KOCW/document/2016/chungbuk/najonghwa/... · 2016. 9. 9. · 위 함수에서 옵션은 의 연속성 수정 을correct=TRUE(default)

부호 검정과 부호순위 검정 가운데 어떤 방법이 더 적절한가 그 이유는(e) ? ?

에서 선택한 검정이 모평균에 대한(b) (e) 검정을 수행하는 것에 비해 어떤 장점을 가지는-

가?

번 문제에 대해 적절한 비모수적 방법으로 검정을 수행하여라 이때 모집단에 대해 필요5. 2 . ,

한 가정과 가설은 무엇인가?