21
1 Marketing Research 자자자자자 자자 자자자 자자자 자자 자자자 자자자 (data validation) : 자자자 ( 자자자 ) 자 자자자 자자자 자자자자자자자 자자 자자자 자자자자 자자자자 자자자 자자자자자 자자자 자자자 자자자자자 자자 noise 자 자자자자자 자자자자 자자자자 자자자 자자자자자 자자자자자 자자 , 10 ~ 20% 자 자자자자자자 자자 자자자자자 자자자 자자 자자자자 자자자 자 자자 . 자자자자 자자자자자자 자자자자 자자 자자자자 , 자자 자자 자자자자 자자자자 자자자자자자 자자자 자자자 자자자 자 자자자자 자자 자자자 자자자 자자자자 자자자자 자자자자자 자자 자자자자 자자 . 자자자 자자자 자자자 자자 자자자자 자 자자 자자 자자 » 자자자 자 자자자자 자자자 자자자자자 ? : 자자자 자자자 자자자자 자자 자자자자 , 자자자 자자자 자자자자 자자자 자자자자 자자자자자 자자자자 자 . » 자자자자 자자자자자 자자자 자자자자 ? : 자자자자 자 자자자 자자자 자자자 자자자 자자 자자자 자자자자 자자자 자자 . » 자자 자자자 자자자 자자자 자자자 자자자자 ? : 자자자 자자자 자자자 자자 자자자자 자자자자자자 자자 자 . » 자자자 자자자 자자자 자자자 자자 자자자자 ? » 자자자자 자자자자자 자자자자 자자 자자자 자자자 자자자자자 ? 자 11 자 자자자자자 자자자 자자자자

자료분석의 준비 자료의 타당성 점검

  • Upload
    vian

  • View
    58

  • Download
    1

Embed Size (px)

DESCRIPTION

자료분석의 준비 자료의 타당성 점검 자료의 타당성 ( data validation ) : 서베이 ( 인터뷰 ) 가 실제로 적절히 수행되었는가와 관련 것으로 면접원이 마음대로 조작한 설문응답을 분석의 대상에 포함시키면 이는 noise 로 작용하므로 설문지에 응답자의 성명과 전화번호를 기입하도록 하고 , 10 ~ 20% 의 응답자들에게 자료 수집직후에 전화를 하여 타당성을 점검할 수 있다 . - PowerPoint PPT Presentation

Citation preview

Page 1: 자료분석의 준비 자료의 타당성 점검

1

Marketing Research

자료분석의 준비 자료의 타당성 점검

• 자료의 타당성 (data validation) : 서베이 ( 인터뷰 ) 가 실제로 적절히 수행되었는가와 관련 것으로 면접원이 마음대로 조작한 설문응답을 분석의 대상에 포함시키면 이는 noise 로 작용하므로 설문지에 응답자의 성명과 전화번호를 기입하도록 하고 , 10 ~ 20% 의 응답자들에게 자료 수집직후에 전화를 하여 타당성을 점검할 수 있다 . 부적절한 설문응답지는 폐기해야 함은 물론이고 , 만약 어떤 면접원이 인터뷰한

설문응답지의 다수에 문제가 있으면 그 면접원의 설문 응답지 전체를 대상으로 타당성을 점거하거나 모두 계기해야 한다 .

자료의 타당성 점검을 위해 고려해야 할 다섯 가지 측면» 실제로 그 응답자가 설문에 응답했는가 ? : 자료의 타당성 점검에서 가장

중요하며 , 면접원 자신이 설문지에 임의로 응답하지 않았는지를 점검하는 것 .» 응답자가 응답자로서 적격한 사람인가 ? : 설문지의 첫 부분에 적격한 응답자

선정을 위한 질문이 주어지는 경우가 많다 .» 미리 정해진 인터뷰 절차를 제대로 따랐는가 ? : 사전에 정해진 절차를 따라

인터뷰가 수행되었는가 하는 점 .» 응답자 자신이 설문의 응답을 모두 하였는가 ?» 면접원이 예의바르게 행동하고 미리 준비한 선물을 제공했는가 ?

제 11 장 자료분석의 준비와 기초통계제 11 장 자료분석의 준비와 기초통계

Page 2: 자료분석의 준비 자료의 타당성 점검

2

Marketing Research 자료의 편집 (editing) : 면접원 혹은 응답자의 실수를 점검하고 수정하는 것으로 가급적

자료수집 직후에 하며 , 응답자와의 접촉이 불가능한 경우에는 그 부분을 결측값 (missing value) 으로 처리하거나 설문지 전체를 폐기할 수 있다 .• 모든 필요한 질문에 대한 응답이 있는가 ? : 면접원 또는 응답자의 실수로 응답이

없는 경우 전화 등을 이용하여 답변을 획득 ( 이러한 과정을 통해서도 응답하지 않은 부분은 코딩시 결측값으로 처리하고 , 아주 많은 부분에 대하여 응답이 되지 않은 설문지는 폐기 ).

• 적격성 판단을 위한 질문에 응답이 행해졌는가 ? : 사후적으로 결정 .• 개방형 질문의 경우 응답이 유용한 응답인가 ? : 응답이 구체적이지 못한 경우

탐사질문 (probing questions) 에 의해 응답을 획득할 수 있으나 제대로 되지 않았다면 사후 편집과정에서 보완되어야 한다 .

• 기술한 내용을 읽고 이해할 수 있는가 ?• 응답에 일관성이 있는가 ?

A 브랜드를 구매하는 것은 나쁘다 좋다

현명하다 어리석다

해롭다 유익하다

바람직하다 바람직하지 않다

일관성이 결여되어 있다 .

Page 3: 자료분석의 준비 자료의 타당성 점검

3

Marketing Research 자료의 코딩 (coding) : 수집된 응답자료를 컴퓨터에 입력하기 위하여 숫자로 표현하는

것으로 자료를 코딩할 때 가장 중요한 사실은 분석방법을 생각하면서 코딩해야 하는 것이다 . ∴ 설문지 – 코딩 – 분석이 연계성을 갖도록 설문지가 개발되어야 한다 .• ID 부여 : 개인별로 ID(Identification number) 를 기입하는데 , 응답자의 숫자에 따라

column 의 수가 결정됨 .• 단일 응답 혹은 복수 응답

“ 다음의 콘도나 리조트 중 가장 많이 이용해 보신 경험이 있는 것은 어떤 것입니까 ? 하나만 표시해

주십시오 .

→ 응답대안이 10 개이므로 01 ~ 10 중 한 번호로 코딩한다 .

“ 다음의 콘도나 리조트중 직접 이용해 보신 경험이 있는 것은 어떤 것들입니까 ? 해당 난에 모두 표시해 주십시오 .”

→ 각각의 콘도 , 리조트는 하나의 칼럼에 코딩하며 , 이용경험이 있으면 1, 없으면 0 으로 코딩하므로 전체 9 개 칼럼을 사용 .

금호콘도 대명콘도 사조마을 일성콘도 코레스코

클럽 하일라 풍림후렌드리 한국콘도 한화콘도 경험없음

금호콘도 대명콘도 사조마을 일성콘도 코레스코

클럽 하일라 풍림후렌드리 한국콘도 한화콘도

Page 4: 자료분석의 준비 자료의 타당성 점검

4

Marketing Research• 개발형 질문 (open-ended questions) : 코딩방법에 대한 사전 지침을 매우 구체적으로

마련해야 하며 , 이를 위해 응답자들의 응답을 개략적으로 살펴보고 몇 가지 유형으로 나누어 범주를 정하게 되는데 , 필요에 따라 코딩을 진행하면서 범주대안을 추가할 수도 있다 . 이때 “기타” 범주에 너무 많이 분류되지 않도록 한다 . 많은 응답들이 기타에 분류되면 분석결과의 가치가 떨어지기 때문이다 .

• 결측값 (missing value) : 처리 시 변수의 값이 가질 수 있는 대안 이외의 값을 부여( 응답자가 응답을 하지 않은 경우 ).

• 부여하는 값의 크기 : 응답이 정도 혹은 긍정 / 부정의 형태인 경우 많은 정도 또는 보다 긍정적일수록 높은 값을 부여하며 분석결과의 해석이 용이 ( 역 척도 (reverse scale) 인 경우 그대로 코딩하고 분석을 위한 명령에서 recode 명령을 주면 됨 ).

• 코딩담당자 (coder) : 개방형 질문에 대한 응답을 코딩할 때 주어진 지침에 따라 진행하며 , 설문지가 많은 경우 1 인당 몇 개 설문지의 모둔 문항을 맡아서 코딩하면 일관성이 떨어지므로 코딩담당자별로 몇 개의 문항을 맡아서 하면 코딩의 일관성을 유지할 수 있고 효율성을 높일 수 있다 .

Page 5: 자료분석의 준비 자료의 타당성 점검

5

Marketing Research 자료코딩의 예 (Cable TV Shopping 에서 구매경험이 있는 소비자들에게 의견을 조사 )

Cable TV Shopping 구매경험 소비자 대상 설문지

⑴ 귀하는 XX cable TV shopping 에서 금년에 제품을 구매한 적이 있습니까 ? ( 명목척도 )

⑵ 귀하가 금년이나 그전에 구매한 제품은 다음 중 어느 것입니까 ? 대항 난에 모두 표시하십시오 . ( 명목척도 )

⑶ 귀하가 XX cable TV shopping 에서 구매한 후의 전체적인 만족도는 어느 정도 입니까 ? 해당 난에 표시해 주십시오 . (간격척도 )

⑷ 귀하는 앞으로 XX cable TV shopping 에서 구매할 의사가 있습니까 ? ( 간격척도 )

⑸ 귀하는 기회가 되면 다른 사람에게 XX cable TV shopping 에서 구매하도록 추천하시겠습니까 ?( 간격쳑도 )

⑹ 귀하의 성별은 ?

⑺ 귀하의 연령은 ? (2001 – 출생년도 ; 간격 또는 명목척도 )

과거 구매한 적이 있으나 금년에는 구매한 적이 없다 .금년에는 구매한 것이 있다 .

식품 의류 운동기구 가전제품 기타

매우 불만족 불만족 보통 만족 매우 만족

절대로 구매하지 않겠다 .

구매하지 않겠다 .

모르겠다 . 구매하겠다 .반드시

구매하겠다 .

절대로 추천하지 않겠다 .

추천하지 않겠다 .

모르겠다 . 추천하겠다 .반드시

추천하겠다 .

남 여

20 세 미만 40 세 이상 ~ 50 세 미만20 세 이상 ~ 30 세 미만 50 세 이상 ~ 60 세 미만30 세 이상 ~ 40 세 미만 60 세 이상

Page 6: 자료분석의 준비 자료의 타당성 점검

6

Marketing Research코딩지침

Column

질문번호 변수 코딩방법

1 ~ 3 - ID 번호 (V1) 001 에서 시작

4 1 구매경험 (V2) 0 = 금년에 구매한 적이 없다 .1 = 금년에 구매한 적이 있다 .

5 ~ 9 2 식품구매 (V3)의류구매 (V4)운동기구구매(V5)

가전제품구매(V6)기타구매 (V7)

0 = 구매한 적이 없다 .1 = 구매한 적이 있다 .

10 3 만족도 (V8) 1 = 매우 불만족 4 = 만족

2 = 불만족 5 = 매우 만족

3 = 보통

11 4 구매의도 (V9) 1 = 절대 구매하지 않음 4 = 구매함

2 = 구매하지 않음 5 = 반드시 구매함

3 = 모르겠다

12 5 추천의도 (V10) 1 = 절대 추천하지 않음 4 = 추천함

2 = 추천하지 않음 5 = 반드시 추천함

3 = 모르겠다

13 6 성별 (V11) 1 = 남 2 = 여

14 7 연령 (V12) 1 = 20 세 미만 4 = 40 세 이상 ~ 50 세 미만

2 =20 세 이상 ~ 30 세 미만

5 = 50 세 이상 ~ 60 세 미만

3 = 30 세 이상 ~ 40 세 미만

6 = 60 세 이상

HWP 나 word processor에서 코딩할 경우에 필요하나 SPSS 의 데이터 편집기에 직접 입력한느 경우에는 ID 번호를 코딩하지 않는다 .

Page 7: 자료분석의 준비 자료의 타당성 점검

7

Marketing Research

코딩결과의 예

1 2 3 4 5 6 7 8 9 10 11 12 13 14

0 0 1 1 0 1 1 0 0 5 5 4 1 3

0 0 2 1 1 1 0 0 0 3 3 2 2 4

0 0 3 0 1 0 0 1 0 4 4 3 2 2

0 0 4 0 1 0 0 0 1 3 3 2 2 5

· · · · · · · · · · · · · ·

· · · · · · · · · · · · · ·

· · · · · · · · · · · · · ·

2 0 0 1 0 1 1 0 0 1 1 1 1 4

Page 8: 자료분석의 준비 자료의 타당성 점검

8

Marketing Research 통계학의 종류와 기본용어

기술통계학 (descriptive statistics) : 주어진 자료의 특성을 그대로 기술하는 것 (1년간 월평균 매출 , 부서별 사원 수 , 연령별 인구 등 ).

추계통계학 (inferential statistics) : 표본의 특성으로부터 모집단의 특성을 추정(infer) 하는 것 .

기술통계학 추계통계학

요인분석군집분석

다차원척도법

평균검증비율검증

평균차이검증비율차이검증

분산분석상관관계분석회귀분석

χ2 독립성검증

χ2 적합도검증판별분석

모수 (母數 ; parameter) : 추계통계학에서 모집단의 특성을 나타내는 값 .

통계량 (statistics) : 표본의 특성을 나타내는 값 .

추계통계학은 표본의 통계량으로부터 모집단의 모수를 추정하는 것에 관한 것 .

Page 9: 자료분석의 준비 자료의 타당성 점검

9

Marketing Research모수와 통계량

모수 통계량평균비율

표준편차분산

회귀계수상관관계계수

μpσσ2

βρ(rho)

(X bar) (p hat)

ss2

(beta hat)r

Xp

N

X

N

X

Np

N

X

i

i

i

2

2

2

수구성원의는갖특성을특정

1

12

2

2

n

XXs

n

XXs

np

n

XX

i

i

i

수구성원의갖는특정특성을

( N : 모집단의 크기 , n : 표본의 크기 )

불편추정치 ( 자유도 )

Page 10: 자료분석의 준비 자료의 타당성 점검

10

Marketing Research 추정의 오류진단과 표본분포

추계통계학 : 표본의 특성값 ( 통계량 ) 으로부터 모집단의 특성값 ( 모수 ) 을 추정하는 것과 관련되어 있기 때문에 추정한 값이 오류를 내포할 가능성을 언제나 존재 .

표본분포 (sampling distribution) : 표본통계량의 분포를 말하며 , 이에 대응되는 개념으로는 모집단분포가 있다 .<참고 >• Sampling distribution : 같은 크기의 표본을 반복적으로 추출했을 때 각 표본의

통계량의 분포 .• Sample distribution : 하나의 표본을 추출했을 때 그 구성요소들의 분포 .• 표본의 수와 표본의 크기를 구분해야 함 .

모집단분포 (population distribution) : 모집단 구성요소들의 분포 .

표본평균값들의 도수분포로 종모양의 분포 , 즉

정규분포 (normal distribution) 에 가깝게 보여진다 .

표본분포의 대표적인 것으로 평균의 표본분포 (sam

pling distribution of means) 로서 , 이는 크기가

동일한 표본을 무한히 추출했을 때 표본평균값들의

분포인데 실제표본추출을 무한회수로 추출하는

것이 불가능하므로 표본분포는 가설적인 것이라

하겠다 .

Page 11: 자료분석의 준비 자료의 타당성 점검

11

Marketing Research 표본평균의 분포

평균의 표본분포의 성격 : 중심극한정리 (central limit theorem) 로 표현됨 – 평균 μ와 표준편차 σ 를 갖는 모집단에서 크기 n 의 표본을 반복적으로 추출하면 표본평균 의 분포는 정규분포와 근사하게 되며 , 평균 μ 와 표준편차 이 된다 . 이 때의 표준편차 , 즉 표본분포의 표준편차를 표준오차 (standard error) 라고 부른다 . 그리고 표본분포는 표본의 크기가 클수록 정규분포에 보다 근사하게 된다 .

모집단크기 N

표본 1크기 n

표본 2크기 n

표본 3크기 n

1x

2x

3x

· · · · · · · ·

· · · · · · · ·

평균의 분포가 된다 .

x

n

Page 12: 자료분석의 준비 자료의 타당성 점검

12

Marketing Research• 가설검정에서 표준오차는 매우 중요한 개념인데 평균의 표본분포의 표준오차는

이지만 σ 를 모르면 대신 s, 즉 표본의 표준편차를 사용 . 표준오차 : 비율의 표본분포의 경우 표준오차 이며 , 이 경우도 역시 p 와 q

를 모르는 경우 표본의 비율값인 와 을 사용하여 다음과 같이 표현한다 .

가설검증의 기초 귀무가설과 대립가설

• 가설 (hypothesis) : 연구자가 어떤 현상에 대해 “그럴 것이다”라고 추측하는 부분으로 연구가설 (research hypothesis) 이라고 하며 모집단에 대한 추정이 된다 . 대립가설 (alternative hypothesis) : 연구자가 믿는 그리고 지지하기를 원하는 가설 . 귀무가설 (null hypothesis) : 대립가설의 반대에 해당하는 진술이며 바로 검증 (test)

의 대상이 된다 . 통계적 가설검증 과정에서는 귀무가설을 검증하여 reject 하거나 not reject 한다 .

결국 “연구가설이 지지되거나 지지되지 않는다 .” 두 개간의 크기를 비교할 때 둘 간에 차이가 없다는 것을 보다 보수적인 견해로

보며 , 이러한 보수적인 견해 , 혹은 기존의 주장이 바로 귀무가설로 설정된다 .

n

ns;errordardtans(SE x )표준오차npq

qp

nqpSE p

Page 13: 자료분석의 준비 자료의 타당성 점검

13

Marketing Research 1종 오류와 2종 오류

• 1종 오류 (type 1 error) : 귀무가설이 진실 (true) 인데 기각하는 오류로서 보통 1종 오류의 허용확률이 정해지는데 이를 α 로 표현되며 , 보수적인 입장에서 심각하게 받아들여 진다 .

• 2종 오류 (type 2 error) : 귀무가설이 허위 (false) 인데 이를 기각하지 않는 오류 .

• α 의 크기에 따라 기각역 (reject region) 이 정해지며 , α 가 클수록 귀무가설은 기각될 가능성이 높다 . 따라서 α 의 크기가 작을수록 기각이 어렵지만 , 이때 귀무가설을 기각하면 ( 연구가설을 지지하면 ) 잘못 기각했을 가능성이 작으므로 연구자는 자신의 의사결정에 보다 자신을 갖는다 . 반면에 α 가 클수록 H0를 쉽게 기각하므로 2종 오류 확률 , 즉 β 는 작아진다 . 반대로 α 가 작을수록 쉽게 기각하지 않으므로 β 는 커진다 . 이와 같이 α 와 β 는 서로 반대방향으로 작용한다 . α↑→ β↓, α↓→ β↑

오류의 종류

결정귀무가설 (H0)

진실 허위H0 기각 1 종 오류 바른 결정

H0 기각 안 함 바른 결정 2 종 오류

Page 14: 자료분석의 준비 자료의 타당성 점검

14

Marketing Research• α : 통계적 유의수준 (statistical significance)• β : 귀무가설이 허위일 때 기각하지 않을 확률이므로 1 - β 는 귀무가설이 허위일 때

기각할 확률이며 , 다른 말로는 연구가설이 옳을 때 연구가설을 지지할 확률이므로 1 - β 를 통계적 검증력 (statistical power) 이라고 부른다 . 그런데 1 - β 가크면 귀무가설이 허위일 때 쉽게 기각할 수 있어 1 - β 는 클수록 바람직하게 생각되지만 , 이 경우 β 는 작아지고 α 는 다시 커진다 . 반대로 α 를 작게 하면 β 가 커지게 된다 .

• ∴ 연구자 혹은 의사결정자는 적당한 수준의 α 크기를 정할 수 밖에 없기 때문에 0.01 과 0.1 보다는 0.05 가 더 자주 이용되는 경향이 있다 .

가설검증 절차① 귀무가설과 대립가설 설정 .② 가설의 성격에 따라 Z- 검증 , t- 검증 , F- 검증 , χ2 검증 (chi-square test) 중 어떤

검증을 할 것인지를 결정 ( 관심과 모수에 따라 결정 ).

③ 통계자료로부터 검증통계량이 계산됨 (Zobs, tobs, Fobs, χ2obs ; 여기서 obs 는 observed va

lue, 즉 관측치를 나타낸다 ).

④ 통계표로부터 Zcrit, tcrit, Fcrit, χcrit2를 발견하고 기각역과 채택역이 설정됨 ( 여기서 crit

는 critical value, 즉 임계치를 나타낸다 ).

1 종 오류의 허용확률이 커진다는 의미 .

Page 15: 자료분석의 준비 자료의 타당성 점검

15

Marketing Research⑤ 검증통계량 (test statistic) 이 기각역과 채택역 중 어디에 위치하는지 본다 .

기각역에 위치하면 귀무가설을 기각하고 그렇지 않으면 귀무가설을 기각하지 않는다 .

“ 기각하지 않는다 (not reject).” 대신 “채택한다 (accept).” 라고 표현하면 옳지 않다 . 가설검증에 따른 결정은 귀무가설의 ‘기각여부’이지 ‘기각 혹은 채택’이 아니다 . 이는 ‘주어진 표본 자료로는 귀무가설이 틀렸다고 할 수 없다’는 결정이며 , ‘ 귀무가설이 옳다’고 결정하는 것이 아니기 때문이다 .

추계통계기법에서 사용되는 검증들평균검증 Z- 검증 , t- 검증비율검증 Z- 검증평균차이검증 Z- 검증 , t- 검증비율차이검증 Z- 검증분산분석 F- 검증상관관계분석 t- 검증회귀분석 F- 검증 , t- 검증χ2 독립성검증 χ2- 검증χ2 적합도검증 χ2- 검증판별분석 F- 검증 , χ2- 검증

Page 16: 자료분석의 준비 자료의 타당성 점검

16

Marketing Research 가설설정 방법

• 비방향적 가설 (양측가설 ) 판매원의 경력에 따라 판매실적이 다르다 . 가격에 따라 수요는 달라진다 . 심장병 환자의 비율은 남 ·녀 간에 차이가 있다 . 맥주 한 병에 들어있는 맥주량은 640㎖가 아니다 .

• 방향적 가설 ( 단측가설 ) ← 더 많은 정보를 가지고 있다 . ∴ 더 나은 가설 . 판매원의 경력이 많을수록 판매실적은 높다 . 가격이 낮을수록 수요는 증대된다 . 심장병 환자 비율은 여자보다 남자의 경우 더 크다 . 맥주 한 병에 들어있는 맥주량은 640㎖보다 적다 .

• 가설표현방식

A B C

H0 = = (≥) =(≤)

H1 ≠ < ( 좌측검증 ) > ( 우측검증 )

방향적 가설을

나타내는 표현으로

기각역은 좌측에

위치한다 .

귀무가설은 반드시 등호 (equal sign) 을 포함해야 한다 .

방향적 가설을 나타내는 표현으로 기각역은 우측에 위치한다 .

비방향적 가설을 나타내는 표현으로 기각역은 좌 · 우에 위치한다 .

Page 17: 자료분석의 준비 자료의 타당성 점검

17

Marketing Research 단일모집단 평균검증 ( 가장 기초적 ) : 모집단의 평균 (μ) 값을 일반적인 이해 (

또는 지금까지의 이해 ) 와 다르게 연구자가 생각하는 경우 사용 . 모집단의 구성요소들이 정규분포를 이룬다는 가정 하에 t-test 를 사용 (n≥30 일 때 , Z-

test 를 사용할 수 있으나 “ t-test” 가 더 엄격 ).

검증통계량 :

한 백화점에서 과거 소비자 불평건수는 일평균 15건 이상이었다 . 마케팅관리자는 최근 몇 개월간 소비자 만족도 향상을 위해 노력했으며 , 이에 따라 평균 불평건수가 과거보다 감소했을 것으로 추측한다 . 최근 29 일간의 불평건수를 조사한 결과 평균 13.5건 , 표준편차 4건으로 나타났다 . 이러한 자료로써 마케터는 평균 불평건수가 감소했다고 할 수 있는가 ? α= 0.05 에서 검증하라 .• H0 : μ≥15, H1 : μ< 15 ( 마케팅관리자가 ‘불평건수가 감소했을 것이다’ 또는 ‘

불평건수가 감소했을지도 모른다’는 생각을 가지고 있으므로 )

• tobs =

)n.f.d(ns

Xt 10

= 표본의 평균값

= 귀무가설로 설정된 모집단의 평균값

= 표본의 표준편차

= 의 표준오차 ( 즉 , 표본분포의 표준오차 )

ns

s

X

0

X X

01.2294

155.130

ns

X

가 어느 방향으로 표준오차의 몇 배만큼 떨어져 있는가를 나타냄 .

X

Page 18: 자료분석의 준비 자료의 타당성 점검

18

Marketing Research• H1 : μ< 15 이므로 좌측검정이며 , 기각역은 t-curve 에서 좌측에 위치된다 . t-curve

의기각역 결정에는 자유도 (degree of freedom : d.f.) 가 필요하다 . 단일모집단 평균검증에서 자유도는 n – 1 이므로 d.f.=28 이 된다 ( 자유도의 크기는 표본크기 – 추정하고자 하는 모수의 수이며 , 이 경우 추정하고자 하는 모수는 한 개이다 ). α=.05 와 d.f.=28 로써 t-table 에서 tcrit= 1.701 을 찾을 수 있다 .

• p-value 를 이용한 가설검증 : p-value 는 검증결과가 유의적일 수 있는 최소한의 α이다 .

• tobs=-2.01 은 위의 t-curve 에서 – 1.701 보다 작으며 , 기각역에 위치하므로 H0 는 기각된다 . 따라서 마케팅관리자는 실제로 불평건수가 줄었다는 결론을 내일 수 있다 . 이 경우 불평건수가 과거 그대로 15 이상인데도 이러한 결론을 내릴 가능성 (즉 결론이 틀린 가능성 ) 은 .05, 5% 미만이다 .

tobs=-2.01, α=.05

-1.701

-2.01

• 이 영역의 크기를 t-table(d.f.=28) 에서 찾으면 0.025 < p< 0.05 이다 . p-value 에 의한 검증을 위한 규칙은 다음과 같다 .

p-value≤α 이면 , 귀무가설은 기각 .p-value> α 이면 , 귀무가설은 기각되지

않는다 .

Page 19: 자료분석의 준비 자료의 타당성 점검

19

Marketing Research• 위의 예에서 과거 1 일 불평건수가 평균 15건이었으나 어떤 이유에서건

마케팅관리자가 이것이 맞지 않다고 생각한다고 가정하자 . 이 경우는 양측검증이 된다 . H0 : μ= 15, H1 : μ≠15 t-test tobs=-2.01 양측검증의 경우 α 로부터 α/2 가 계산되어 기각역은 다음과 같이 결정 (d.f.=28)

• p-value 를 이용한 가설검증

-2.048

2.048

tobs=-2.01

.025

tobs 는 위의 기각역에 위치하지 못하므로 H0

는 기각되지 않는다 . 결론적으로 마케터의 생각은 옳지 않으며 기존의 믿음 즉 , μ=15를 거부할 수 없다 .

-2.01 2.01

한 쪽 영역의 크기는 p/2 에 해당하며 , t-table (d.f.=28) 에서 찾으면 0.025< p/2< 0.05 이다 . 이를 두 배하면 0.05< p< 1 이 되며 , 결국 p> α 이므로 H0 는 기각되지 않으며 , 수집된 통계자료가 동일하면 양측검증의 경우 p-value 는 단측검증의 정확히 2배가 되어 H0 는 단측검증에 비해 양측검증의 경우 기각되기 어렵다 .

Page 20: 자료분석의 준비 자료의 타당성 점검

20

Marketing Research 단일모집단 비율검증 : 기본적으로 이항분포 (binominal distribution) 를 사용하나

표본의 크기가 크면 중심극한정리에 따라 비율의 표본분포 (sampling distribution of proportion) 가 정규분포에 가까워지므로 표본의 크기가 큰 경우 ( 대체로 n≥30) 일반적으로 Z-test 사용 .

검증통계량 :

치약 제조회사는 전체가구 중 10% 정도가 자사의 브랜드 A 를 사용하는 것으로 알고 있었다 . 마케팅부서는 시장점유율을 높이기 위해 6 개월간 집중적으로 프로모션 활동을 하였다 . 프로모션 활동에 따라 점유율이 높아졌는지 알기 위해 표본추출에 의한 조사를 실시하였다 . 조사결과 전체조사대상 200 가구 중 26 가구가 브랜드 A 를 구매하는 것으로 나타났다 . 이러한 결과에 따라 마케터는 시장점유율이 향상되었다고 할 수 있는가 (α=.05)?• Ho : p=.10, H1 : p> .10• Z-test

• Zobs =

• H1 : p> .10 이므로 우측검증이다 .

nqp

pp

SE

ppZ

p 00

00

= 비율추정치로서 표본의 비율값

=귀무가설로 설정된 모집단의 비율값

= 1 – p0

= 의 표준오차pSE

q

p

p

0

0

p

4112009010

1013

00

00 .))(.(.

..

nqp

pp

SE

pp

p

Page 21: 자료분석의 준비 자료의 타당성 점검

21

Marketing Research

이 문제를 p-value 로서 접근해 보면 표준정규분포에서 p-value 는 .0793 이며 이는 α=0.05 보다 크므로 Ho는 기각되지 않는다 . 그러나 α=0.1 로 설정하면 Ho는 기각된다 .

1.645

Zobs=1.41

α=.05

Zobs 는 채택역에 위치하므로 H0 는 기각되지 않는다 . 결국 주어진 자료로서는 유의수준 .05 에서 시장점유율이 향상되었다고 할 수 없다 .

1.41

0.793