27
통계이론의 이해 3 -통계분석 한국성서대학교 간호학과

통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

  • Upload
    others

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

통계이론의 이해 3 -통계분석

한국성서대학교 간호학과

장 인 순

Page 2: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

❏모수통계학(parametric statistics) 모집단의 분포에 대한 가정을 필요로 하는 통계적 방법으로서 대체로 연속형의 수량적 자료를 분석할 때 사용 ❏비모수통계학(non‐parametric statistics) 모집단의 분포에 대한 가정을 필요로 하지 않으며 질적 자료 혹은 비연속형의 수량적 자료를 분석할 때 사용

모수/비모수통계

Page 3: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

가설검정을 위한 통계방법 선택

모수(parameter) 비모수

(non-parameter)

모집단의 평균과 분산, 정규분포

비정규분포, 표본수가 작은 경우, 명목, 순위척도

교차분석 Chi-square

(Fisher exact test)

두집단 평균비교 T-test Wilcoxon rank sum test

K집단 평균비교 ANOVA Kruskal wallis test

짝지은 평균비교 Paired-test Wilcoxon signed rank sum test

상관관계 Pearson correlation Spearman test

모수/비모수통계

Page 4: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

통계분석

1. 데이터를 가지고 통계분석을 하기 위해서는 1) 데이터에 있는 변수들의 성질 파악 - 변수들은 측정 방법에 따라 명목척도 변수, 순서척도 변수, 구간∙비율척도 변수로 구분 - 변수의 척도에 따라 분석방법이 달라짐 2) 명목척도, 순위척도 변수-범주형(categorical) 변수 3) 구간 ∙비율척도 변수- 척도변수

Page 5: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved. 5

1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한 데이터의 수집절차

연구목적, 연구내용 및 분석방법 결정

설문지 작성, 표본추출방법과 표본크기결정, 조사방법 결정, 조사원 훈령, 예비조사

설 문 조 사

데이터의 코딩과 컴퓨터 입력 및 오류데이터 수정

수정 완료된 데이터

통계분석

Page 6: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved. 6

(2) 통계분석 작업의 단계 (가) 제1단계: 각 변수의 분포 파악

- 빈도분석(Frequency Analysis) - 기술 통계분석(Descriptive Statistics Analysis)

각 변수에 대한 분포 파악

범주형 변수 빈도분석

구간 ∙비율척도 변수 기술 통계분석

통계분석

Page 7: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved. 7

(나) 제2단계: 데이터의 타당성 및 신뢰성 검토 - 요인분석(Factor Analysis) - 신뢰도 분석(Reliability Analysis)

데이터의 타당성과 신뢰성

여러 개의 순서척도(3점, 5점, 7점척도)변수

요인분석 신뢰도분석

통 계 분 석

Page 8: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved. 8

(다) 제3단계: 통계분석기법의 선정 1. 몇 개의 변수를 동시에 분석할 것인가? 2. 변수의 측정척도는 무엇인가? 3. 분석목적은 무엇인가?

통 계 분 석

Page 9: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved. 9

1.빈도분석: 명목척도나 순서척도 변수에 대해 빈도(Frequency)분포를 알아보는 분석 2.기술 통계분석: 구간 ∙비율척도 변수에 대해 요약 통계략(평균, 표준편차 등)을 구하는 분석. 3.요인분석: 많은 문항(변수)를 적은 수의 요인변수로 축소하는데 사용하는 분석 -하나의 개념을 측정하기 위해 여러 개의 문항(변수)들을 사용했을 경우에 이 문항들이 한 개의 요인으로 묶여지는 것은 그 측정도구가 타당함을 나타냄 4.신뢰도분석: 동일한 개념을 여러 문항(변수)으로 질문하였을 경우에, 응답들이 비슷하게 나타나는지를 측정하는 신뢰계수를 계산

통 계 분 석

Page 10: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved. 10

두 변수의 연관성 정도

두 개 모두 범주형 변수 => 교차분석

두 개 모두 구간 ∙비율척도변수

=> 상관분석

집단간 평균 비교

독립변수: 범주형변수(2개범주) 종속변수: 구간 ∙비율척도 변수 => T-검정(t-test)

독립변수: 범부형변수(3개이상범주) 종속변수: 구간 ∙비율척도 변수 => 일원배치분산분석(ANOVA)

두 변수의 연관성 정도

통 계 분 석

Page 11: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

인하대학교 통계학과

11

여러 개의 독립변수와 한 개의 종속변수 간의 관계

독립변수 모두: 범주형 변수 종속변수: 구간 ∙비율척도 변수 => 분산분석(ANOVA)

독립변수, 종속변수모두 구간 ∙비율척도 변수

=>다중회귀 분석

통 계 분 석

독립 변수가 종속변수에 영향을 주는지 파악

독립변수와 종속변수: 구간 ∙비율척도 변수 => 단순회귀분석

Page 12: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

12

2. 통계적 추론과 가설검정 (1) 모집단(Population)과 표본(Sample)

우리나라 간호학생

2000명의 간호학생

모집단

표본추출

표본

통 계 분 석

Page 13: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

13

(2) 통계적 추론(Statistical Inference) - 표본은 모집단의 아주 작은 일부이기 때문에 이 표본만을 가지고 모집단 전체에 대해 정확히 알아낼 수는 없음 -> 모집단에 대한 통계적 추측방법을 통계적 추론 이라고 함 -> 추론방법: 신뢰구간에 의한 방법, 가설검정방법 -> 신뢰구간(흔히 95% 신뢰구간): 모집단의 한 특성의 값을 신뢰구간 내에서 추측하는 구간을 말함 -> 가설검정: 모집단에 대한 가설을 세워놓고서 이 가설이 옳거나 그르다고 추측하는 방법

[Ex]

어느 도시의 실업률에 대한 95%신뢰구간은 (0.058,0.106)으로 나타났다.

통 계 분 석

Page 14: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

14

(3) 가설 검정(Hypothesis Testing) -많은 통계분석 방법(T-검정, 분산분석, 회귀분석 등)에서는 가설검정방법을 통해 추측을 함. -가설검정에 대한 추측의 단계

1단계

가성을 세운다.

H0(귀무가설)

H1(대립가설)

2단계

표본자료를 가지고

검정통계량

(T, x2, F등)값을 계산한다.

3단계

검정통계량 값의

P값(유의확률)을 계산한다.

4단계

결론을 내린다.

P값 유의수준이면

H1을 채택한다.(H0기각)

통 계 분 석

Page 15: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

15

1단계:가설 - 연구자는 귀무가설과 대립가설, 두 개의통계적 가설을 세움. -가설은 모두 모집단에 대한 기술이어야 함 - 예상하거나 새로 알아내고자 하는 명제를 대립가설(연구가설, 목적가설 alternative hypothesis)로 하고 대립가설에 반대되는 명제를 귀무가설(null hypothesis)로 설정함 - 귀무가설(영가설)은 흔히’동일하다’,’차이가 없다’, 등으로 표현됨

[Ex1]

HO: 두 변수는 상관(correlation)이 없다.

H1: 두 변수는 상관이 있다.

[Ex2]

H0: 새로운 간호중재와 기존 간호중재의 효과에 차이가 없다.

H1: 새로운 간호중재는 기존 간호중재보다 효과가 좋다.

통 계 분 석

Page 16: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

16

가설

통 계 분 석

1.가설: 모수에 대한 예상, 주장, 또는 단순한 추측 예) 인간은 질병에 걸린다 -> 아직은 하나의 추측일 뿐임. 통계적 가설검정은 이러한 가설에 대해 증거를 수집하여 과학적으로 증명하는 것임 2.귀무가설(영가설): 기각하기를 희망하여 형식화한 가설. 기존에 받아들이던 가설, 모수에 관한 귀무가설은 항상 모수의 정확한 값을 지정하도록 진술될 것인 반면 대립가설은 여러 개의 값의 가능성이 허용됨 ->보통 같다, 차이가 없다, 0이다 3. 대립가설(연구가설): 표본을 통해 입증하고자 하는 새로운 가설, 모수에 대한 관심의 영역 중에서 귀무가설로 지정되지 않은 모든 경우를 포괄적으로 지정함 ->보통 다르다, 차이가 있다, 0이 아니다

Page 17: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

17

2단계: 검정통계량 값 (Test Statistics) - 가설을 검정하기 위한 통계량 값 - T 검정통계량, x2 검정통계량, F 검정통계량 등이 있는데, 이것은 표본자료 값을 가지고 계산됨 3단계: P값(유의확률, p-value, significance probability) - 귀무가설이 참(true)일 경우, 2단계에서 계산된 검정통계량 값이 얼마나 빈번하게 일어날지에 대한 확률 값임 -만약 P값이 작으면 귀무가설하에서 일반적인 현상이 아니므로 귀무가설을 기각하고 대립가설을 채택하게 됨 - 이 때의 기준으로 유의수준을 사용함. 유의수준으로는 1%, 5%, 10%를 일반적으로 설정하는데 5%수준이 가장 널리 사용됨

통 계 분 석

Page 18: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

18

4단계: 결론 - 통계적으로 결론은 ‘H0를 기각한다’나 ‘H0를 기각할 수 없다’의 두 가지인데, 연구자는 통계적 결론을 바탕으로 연구의 결론을 내리게 됨 - 즉, 표본 데이터에 의거해서 연구의 목적하던 바를 옳다고 받아들이거나, 받아들일 수 없다고 기술함

통 계 분 석

Page 19: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

통계분석방법

Page 20: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

통계분석방법

Page 21: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

통계분석방법

Page 22: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

통계분석방법

Page 23: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

통계분석방법

Page 24: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

주제에 맞는 분석방법?? 1. 학생의 성별에 따른 삶의 질 정도의 차이

2. 혈중 콜레스테롤 농도와 지방간 발생과의 관계

① t-test ② 분산분석 ③ 상관분석 ④ 회귀분석 ⑤ 카이스키 검정

Q&A

Page 25: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

주제에 맞는 분석방법?? 1. 정신과 환자의 성별에 따른 우울 정도의 차이

2. 실험군과 대조군의 암발생 여부 비교

① t-test ② 분산분석 ③ 상관분석 ④ 회귀분석 ⑤ 카이스키 검정 ⑥ paired t-test

Q&A

Page 26: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

주제에 맞는 분석방법?? 3. 환자 기분상태를 상,중, 하로 나누었을 때 혈압의

차이

4. 혈중 크레아틴 농도와 하루 소변량의 관계 ① t-test ② 분산분석 ③ 상관분석 ④ 회귀분석 ⑤ 카이스키 검정 ⑥ paired t-test

Q&A

Page 27: 통계분석 - elearning.kocw.netelearning.kocw.net/KOCW/document/2015/bible/janginsun/3.pdf · 1. 설문조사에 의한 데이터의 수집과 통계분석 (1) 설문조사에 의한

Copyright © by Ryu Kyoung Mu All rights reserved.

주제에 맞는 분석방법?? 5. 대학생의 건강증진행위에 영향을 주는 요인

6. 여대생의 흡연정도와 친구의 흡연정도의 관계 ① t-test ② 분산분석 ③ 상관분석 ④ 회귀분석 ⑤ 카이스키 검정 ⑥ paired t-test

Q&A