Upload
others
View
1
Download
0
Embed Size (px)
Citation preview
www.kasl.org 33
Sample size calculation and statistical analysis plan
신 임 희
대구가톨릭대학교 의과대학 의학통계학교실
□ 임상시험 : Sample Size Calculation(Determination)
1) 표본수 결정에 들어가기전에....
- sample size의 개념
모집단(population) 표본(sample)
두 집단의 차이가 크면 ? / 표준편차가 크면 ?
모집단(population) 표본(sample)
추정(Estimation)
가설검정(Hypothesis testing)
→ 귀무가설( H 0)/ 대립가설( H 1
)
→ p-value
제3회 임상연구방법론 워크숍
34 대한간학회
검정결과 : H 0 accept H 1
accept
H 0 (true) 옳은 결정 제1종오류 α
H 1 (true) 제2종오류 β 옳은 결정(1-β)
note) . p-value < 인 경우에 귀무가설 기각,
즉, 대립가설을 받아들임
. 이런 오류가 왜 생기는 것인가?
. 유의수준( )의 설정 : = 0.1, 0.05, 0.01
. 검정력(power)의 설정 : =0.80, 0.90
. 가설검정의 형태 : 양측검정 / 단측검정
. 제1종오류와 제 2종오류의 설정 및 percentile
제1종 오류(α) 단측( Zα) 양측( Zα/2)
0.01
0.05
0.10
1.282
1.645
1.282
1.645
1.960
1.645
제2종 오류(β) 검정력 (power) Zβ
0.05
0.10
0.20
0.95
0.90
0.80
1.645
1.282
0.842
2) 적합한 표본수 결정의 중요성
- 윤리적이고 과학적인 면(Ethical and Scientific view)
신임희 | Sample size calculation and statistical analysis plan
www.kasl.org 35
- 연구비와 직접적인 관련
- 주요관점(main focus) : 가장 적합한 sample size로 가장 효과적인 연구결과의 기대
note) - 표본의 수가 적으면 좋은가? : 윤리적인면?/과학적인면?
- 표본의 수가 많으면 좋은가? : 윤리적인면?/과학적인면?
note) ICH-E9
3) 적합한 표본수를 결정하기 위해 무엇을 먼저 고려해야 하는가?
- 그룹의 수?
- 연구에 관여하는 센터수?
- 1차 유효성 평가변수 : primary endpoint(variable)?
- 1차 유효성 평가변수의 형태?
- drop rate?
- compliance rate?
- control/treatment의 sample size의 비
- 유의수준, power의 설정
- 기존의 예비연구/참고문헌을 통한 review
- clinical difference의 설정이 가능한가??? (비열등성, 동등성)
note) 변수의 형태 : 양적 (평균, 표준편차 ) /질적(발병률, 반응율)
연구기간을 고려한 유효성 평가변수의 설정
연구대상수는 군간에 항상 같아야 하는가? power problem
4) 표본수를 조금이라도 줄이고 싶다면...
- 1차 유효성 평가변수 : 연속형변수의 이용함
- 측정을 정밀하게 하여 표준편차를 최대한 줄임
- 보다 빈번히 발생하는 변수를 1차 유효성 평가변수로 설정하는 방법
note) 표본의 수가 생각보다 크면, 임상시험을 할 수 없을까?
5) 흔히 발견되는 오류...
- 표본수 계산공식없이 임의로 연구대상수의 결정? 예) 대조군 시험군 각 30명
- 표본수 산출 공식이 있으나 적용이 잘못된 경우?
제3회 임상연구방법론 워크숍
36 대한간학회
- 표본수를 계산하는데 필요한 요인(유의수준, power, clinical difference..)??
- 표본수를 계산하는데 필요한 요인이 있으나, 그 근거의제시가 없는 경우
- 계산을 잘못하여 오류?
- 관찰연구, 서술적 연구..임의로 sample size계산은 필요없다고 언급하는 경우??
......
6) 임상시험에서의 표본수 결정 :
A. 한그룹 : 양적인 경우(mean, S.D) / 질적인 경우(proportion, rate)
B. 두그룹 : 양적인 경우(mean, S.D) / 질적인 경우(proportion, rate)
C. 동등성 /비열등성, 우위성인 경우
D. 생존분석과 관련된 경우
note) 세집단(이상), 상관계수, ....
두그룹의 경우)
양적자료인 경우 질적자료인 경우
1) 가설의 형태 귀무가설 /대립가설 귀무가설 /대립가설
2) sample size계산을
위하여 필요한 요인
유의수준
power
평균차이/ 표준편차(표본)
유의수준
power
비율차이
3) sample size 계산식
4) 예제
A약을 먹은 환자들의 통증 평균 VAS
와 B약을 먹은 환자들의 통증평균
VAS가 15mm 차이가 나는지 보이고
싶다. 기존문헌에서 알려진 바로는 표
준편차의 값이 13.5mm로 추정가능하
다. drop rate는 15%로 설정한다.
기존의 항암제는 40% 정도의 response
rate가 있으며, 새로운 항암제 re-
sponse rate는 50%정도로 기대하며
임상연구를 실시하고자 한다 drop rate는
15%로 설정한다.
6)-1. 양적인 경우:
A약을 먹은 환자들의 통증 평균 VAS와 B약을 먹은 환자들의 통증 평균 VAS 15mm 차이가 나는 지 보
이고 싶다. 기존 문헌에서 알려진 바로는 표준편차의 값이 13.5mm로 추정 가능하다. drop rate는 15%로 설
정한다.
신임희 | Sample size calculation and statistical analysis plan
www.kasl.org 37
1) 가설
2) - 유의수준 / power
- 평균차이 / 표준편차
- drop rate
3) 계산식 :
4) EXCEL 에 값을 그대로 입력해보면..... ( ) 명
5) 전체 표본수 :
6)-2. 질적인 경우:
기존의 항암제는 40%정도의 response rate가 있으며, 새로운 항암제의 response rate는 50%정도로 기대하
며 임상연구를 실시하고자 한다 drop rate는 15%로 설정한다.
1) 가설
2) - 유의수준 / power
- 비율차이
- drop rate
3) 계산식 : n=
(Zα 2 p q + Zβ p cq c+p tq t )2
δA
2
제3회 임상연구방법론 워크숍
38 대한간학회
4) EXCEL 에 값을 그대로 입력해보면..... ( ) 명
5) 전체 표본수 :
□ 임상시험 : Statistical Analysis Plan
1) 임상시험 통계분석시 고려해야 할 부분
- ITT(Intention-to-treat) analysis / PP(Per Protocol) analysis
- 피험자의 일반적인 특성 및 집단간의 동질성검정
- 평가변수에 대한 분석 : 양적자료 / 질적 자료
기술통계(Descriptive analysis) : simple statistics, graphical analysis
추측통계(Inferential analysis) :
- 모수적/ 비모수적 접근법(parametric and nonparametirc approach)
- two sample t-test, -test, one way ANOVA,
repeated measures one factor(two facotr) analysis,
survival analysis, meta analysis
adverse effects/ side effects, efficacy
note) simple & clear analysis + conclusion
- 결측치(Missing Values) 및 이상치(Outliers) ?
자료변환(Data Transformation) ?
세부집단(Subgroups)에 대한 고려 ?
교호작용(Interactions)과 공변량(Covariates) ?
other effects? .......
신임희 | Sample size calculation and statistical analysis plan
www.kasl.org 39
2) 통계적 분석방법(SAP)의 구체적인 명시
note) 임상연구(시험)에서 통계분석을 해야 하는 부분
- 일목요연한 전개의 필요성
- ITT(Intention to treat ) analysis / PP(Per Protocol)분석
0) 이용되는 통계패키지및 유의수준
1) 기본적인 특성(Baseline characteristics)
1)-1. 전체자료에 대해서
- 인구통계학적 특성 / 임상적인 특성(vital sign, 기본 Lab....)
1)-2. 각 집단간의 동질성 검정
- 인구통계학적 특성 / 임상적인 특성(vital sign, 기본 Lab....)
2) 유효성 평가 변수
2)-1. 1차 유효성 평가변수(primary variable)
- 그룹간의차이, 시점간의 차이, 그룹과시점간의 interaction
2)-2. 2차 유효성 평가변수
- 그룹간의차이, 시점간의 차이, 그룹과시점간의 interaction
2)-3. 그 이외의 변수들
- 그룹간의차이, 시점간의 차이, 그룹과시점간의 interaction
3) 총괄적 유효성 평가
4) 이상반응에 대한 분석
- 총괄적 이상반응에 대한 분석
5) 그 이외....
3) 임상시험 : 통계분석방법
FOCUS : 자료의 속성파악/ 가정의 확인절차 !!!!!!!!
- 연구목적 및 data의 속성에 맞는 방법의 선택
ex) 양적자료 - mean, S.D. 독립 t-test, one way ANOVA,
pearson's correlation coefficient,
multiple linear regression
질적자료 - n(%), Chi-square test, logistic regression
- 분석방법의 이해
▶ 가정의 점검 - 정규성, 등분산성, 독립성...등등
제3회 임상연구방법론 워크숍
40 대한간학회
⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂⚂ 두(세) 집단의 비교 / 한 집단의 전 후비교
??????
initial finished
experimental
control
통계 분석 방법 data속성
두집단
모수적
two sample t-test
paired t-test
비모수적
Wilcoxon 순위합검정
Wilcoxon 부호순위 검정 양적
세집단이상one way ANOVA
two-way ANOVAKruskal-Wallis 검정
sample
size 40 ? Chi-square test
질적 sample
size 40 ? Fisher's exact test
note) 만약 baseline characteristics 에서 분석하고자 하는 평가변수에 영향을 줄 수 있는 특성의 차
이가 두 집단간에 통계적으로 유의 하였다면???
→ 공분산분석 ( ANCOVA : Analysis of Covariance)
⚂ 두(세) 집단의 시점에 따른 반복측정
??????
initial 시점1 시점k (finished)
experimental
control
신임희 | Sample size calculation and statistical analysis plan
www.kasl.org 41
→ 분석의 관점 : 그룹간의 차이 / 시점간의 차이/ 룹과 시점의 interaction
그래프의 형태: 분석의 관점과 함께 고려
time time
→ 반복측정요인 분석 (repeated measure one factor(two factor) analysis)
양적자료
- 반복측정일요인분석(repeated measure one factor analysis)
- 반복측정이요인분석(repeated measure two factor analysis)
note) 혼합모형의 이해..
일반적으로 반복측정 요인분석에서는....
반복측정의 더 복잡한 상황은 어떤 경우인가 ??....
ITT/PP
질적자료 ??
: Freedman test(지료의 속성 : 순위척도)
⚂ Correlation analysis
Pearson / Spearman / Partial/ Multiple / Canonical
⚂ Regression analysis
regression model
y=β0+β1x 1+⋯+βkx k+ε
- linear : simple / multiple
- logistic : simple - binary / mutinomial multiple - binary /multinomial
- nonlinear
제3회 임상연구방법론 워크숍
42 대한간학회
- 종속변수(반응변수)/ 독립변수(설명변수), covariate
- 종속변수 자료의 속성 - 양적, 질적
- optimal variable의 선택 : 상관관계(양적), Chi-square test(질적)
- 가정의 확인 : 자료의 속성 - 양적, 질적
- 최대값과 최소값의 비율?
- 이상점? /오차의 독립성?
- 독립변수간의 관계(다중공선성)
note) optimal variable 선택을 위해서....
>> univariate analysis의 필요함
/ 특히, logistic regression에서...
예를 들어....
어떤 질환유, 무에 영향을 미치는 요인의 파악을 위해서...
>> univariate analysis 실시
>> optimal vairable 선택 : optimal covariate
>> (binary) logistic regression
질환 유 질환 무 p-value
인구통계학적특성
age
sex
....
임상적특성
BMI
TG
LDL
...
- 모델의 유의성 /설명력
변수의 유의성 - 변수선택? : stepwise, forward, backward
- regressison model 제시
- logistic : odds ratio와 더불어 95% confidence interval 제시
신임희 | Sample size calculation and statistical analysis plan
www.kasl.org 43
⚂ Survival analysis
- Survival function : empirical / Kaplan-Meier / NA. SV...
survival analysis에서의 main focus
- 특정시점에서의 생존률
- 환자의 50%가 생존하는 시간(median survival time)
- 평균 생존 시간(mean survival time)
- 두(세)군의 생존시간 비교
- 예후인자(prognostic factor)
note) censoring의 개념
(loss to follow up / drop out / end study)
survival curve의 형태
time (months, years..)
survival curve의 비교
항상 log-rank test만 이용할 것인가?
→ 두(세)개의 survival curve가 적어도 꼬이지 않았을때
두(세)개의 survival curve가 꼬였을때 ???
survival curve에 영향을 주는 예측인자의 파악
→ Cox's proportional hazard model
exp′
where ⋯
- 예측인자의 설정 : univariate analysis에서 선택함...
제3회 임상연구방법론 워크숍
44 대한간학회
- 가정의 확인 : proportional? / nonproportional ?
log(-logs(t))의 확인?
- odds ratio? / hazard ratio?
⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂ ⚂
∴ Plan & Result : Clinically significant + Statistically significant