19
R RStudio ののの Analysis Of Variance (ANOVA) - Repeated measures designs - DARM ののの #1.2 2013.02.19 のののののののののの のののののの のの の

第1回DARM勉強会のANOVA補足(repeated measures designs)

Embed Size (px)

DESCRIPTION

第1回DARM勉強会のANOVA補足資料 統計学の専門家ではないため、内容に責任は持ちません。内容に間違いがあれば、指摘してくださると幸いです。できる限り訂正していきます。

Citation preview

Page 1: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入Analysis Of Variance (ANOVA)

- Repeated measures designs -

DARM 勉 強 会#1.2 2013.02.19

広島大学教育学研究科博士課程後期1年德岡 大

Page 2: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Klockars, 2008)

Lix, L. M., & Keselman H. J. (2008). Analysis of variance: repeated measures designs. In G. R., Hancock & R. O. Mueller (Eds.), The Reviewer’s Guide to Quantitative Methods in the Social Sciences. (pp. 15-27) New York: Routledge.

反復測定デザインの分散分析を行った論文を書くときには,次の 1 2項目を守りましょう !!

Page 3: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

a. 1要因の反復測定e.g., 1つのグループに対する 1つの従属変数を2回以上測定              2つ以上の実験条件の測定

i. 帰無仮説:全体的に従属変数が変化しないこと(包括的な仮説)ii. 帰無仮説の棄却後:水準間での多重比較iii. 水準間のアプリオリな対比が包括的な仮説の代わりにされることもある

b. 2要因(混合要因)の反復測定e.g., 2 ( 参加者間;性別:男性,女性 )× 3 ( 参加者内;表情:ポジティブ,ニュートラル,ネガティブ )

i. この場合,参加者はランダムサンプリングii. 混合要因では,基本的に交互作用に関心あり

c. 2要因(混合要因)の反復測定e.g., 2 ( 参加者間;介入:あり,なし )× 2 ( 参加者内;時間: time1 , time 2 )

i. この場合,参加者はランダム割り当て

1 . 反復測定デザインのタイプが明記されること。 ( i.e., 参加者内要因数と参加者間要因数および水準の数)

反復測定デザインのタイプ

Page 4: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

a)母集団の中に効果(有意差)がある場合に,効果があるとする確率a) Type Ⅱerror ( β ):実際には有意差があるのに,有意差なしとする確率

b)Cohen (1992) は「 1 – β≦0.80 」を推奨!

c) 基本的に有意水準( α ),効果量,検定力( 1– β ),サンプルサイズ( N )の 4 つは,他の3つが決まると決まる関係にある

8 . 検定力の問題が考慮され,サンプルサイズが報告されている。

検定力( 1 – β err prob )

Page 5: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

2.検定力の問題が考慮され,サンプルサイズが報告されている。

検定力とサンプルサイズの関係

Power (1-β err prob)

Tota

l sa

mp

le s

ize

F tests - ANOVA: Repeated measures, within-between interactionNumber of groups = 2, Number of measurements = 4,

Nonsphericity correction ε = 1, α err prob = 0.05

100

150

200

250

300

350

400

0.6 0.65 0.7 0.75 0.8 0.85 0.9 0.95

Effect size f(V)

= 0.2

= 0.25

= 0.3

Page 6: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

反復測定デザインで適切な検定力を持つサンプルサイズを算出するために必要となる情報

① ある要因の効果量② 測定回数③ グループの数④ 水準間の分散と共分散(相関)

※ N/K< 1の場合,反復測定の MANOVA は参加者内効果を検定するために使用できない

※ N/K の比率が小さい場合,共分散が安定しない

※ グループサイズが等価でなく,グループの共分散の等質性の仮定が維持できないなら反復測定 ANOVA や MANOVA は妥当性でない結果を導く可能性あり

2 . 検定力の問題が考慮され,サンプルサイズが報告されている。

サンプルサイズの決定

Page 7: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

多変量反復測定:従属変数が各測定時期に P 個あるものa) 個人内の変数内相関( i.e., 自己相関)b) 個人内の変数間相関

検定方法  ( 適用例は Filiz, Z. (2003) 参照 )DMM と MMM は ANOVA や MANOVA を拡張し,多変量の個人内主効果と交互作用効果を検定するために提唱されてきた解析モデル

a)Doubly Multivariate Model (DMM)適用条件: N/P< 1のデータセットに適用できない。また, N/P の比率が小さいとき,共分散の推定値が安定しない。

b)Multivariate Mixed Model (MMM)MMM は DMM よりも反復測定と従属変数の共分散構造について厳しい仮定をおく。仮定を満たさない場合, MMM の結果は妥当ではない推定値を導く

c)Multiple Regression Model (MRM)少数のパラメタで共分散行列を定義できる。反復測定の共分散行列はそれぞれの従属変数で等しいと仮定される分離可能な構造である。サンプルサイズが小さいとき,構造化しない共分散を仮定するよりも倹約的であり,推定が安定する。

3.従属( i.e., 反応)変数の数とタイプが明記されている

反復測定デザインの特徴と検定方法

Page 8: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

従属変数を離散的な尺度とした分析への適用一般化線形モデル (Generalized Linear Model: GLM) は離散データの分析のためにモデルの統合をしている。離散データに対する GLM 適用例

a)ロジスティック回帰 (logistic regression)2値の反復測定の際に用いられる。ベルヌーイ分布に従うことを仮定する。

b)ポアソン回帰 (poisson regression)従属変数が回数として数えられるデータや発生率の低いデータに対して用いられる。ポアソン分布に従うことを仮定する。

c) 多項回帰 (multinomial regression)順序データの反復測定

GLM の類型a)Marginal model: 分布の平均的な反応を推定する目的で使用

b)Random-effect model: 分布における個人の平均的な反応を推定する目的で使用

3.従属( i.e., 反応)変数の数とタイプが明記されている

反復測定デザインと一般化線形モデル

Page 9: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

反復測定 ANOVA , MANOVA , MRM は多変量正規分布

正規分布からの逸脱を検討する方法a) 歪度(対称性),多変量歪度  0 に近いことが左右対称性を意味し,正規性を示唆。  b) 尖度,多変量尖度   0 に近いことで正規性を示唆する。尖度がない状態を3としている文献やソフト ウェアもあるので注意c) 具体的な検定方法  以下の検定は逸脱に対して敏感である。

1) Shpiro-Wilk 検定:一変量正規分布2) Mardia’s 検定:多変量正規分布

多変量正規性からの逸脱に対して頑健な検定を選択することで,正規性を無視するのも1つの手段となりうる。

4.従属変数の分布についての仮定が評価され,適切な検定手続きが選択されている。

正規性の検討

各時点の測定値が正規分布することは,必ずしも多変量正規分布を意味しない。

Page 10: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

a)中心化傾向と変動性に頑健な測定を適用する。 トリム平均アプリオリに決定した割合について,分布の上位と下位から除外する。一般に推奨されるのは上位下位それぞれ20%の除外。トリム平均は最小二乗平均よりも標準誤差が小さくなる。 ウィンザライズド分散ウィンザライズド平均とウィンザライズド・スコアの偏差平方和に基づく分散。トリム平均の標準誤差は,ウィンザライズド分散の関数に従うため,トリム分散の代わりに使用される。

※ウィンザライズド・スコア:トリムした後のデータの中で,最も小さい値と最も大きい値を,それぞれ上位下位のトリムしたデータ箇所に代入した得点。※ウィンザライズド平均:ウィンザライズド・スコアを用いた平均値

4.従属変数の分布についての仮定が評価され,適切な検定手続きが選択されている。

非正規性に対するアプローチ

Page 11: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

b. 分析前にデータを順位化すること。 魅力

• 簡単に実践できる。• 正規分布からの逸脱に対して敏感でない。

注意• 順位はオリジナルの観測値の直線的な関数でないため,ケース

内の交互作用について適用できない。• 順位化することで,もともと存在しない効果を追加する可能性

もある。• 反復測定間の相関のパターンを変えるかもしれないため,反復

測定 ANOVA のように相関構造について特定の仮定を置く分析では,問題になりうる。

4.従属変数の分布についての仮定が評価され,適切な検定手続きが選択されている。

非正規性に対するアプローチ

Page 12: 第1回DARM勉強会のANOVA補足(repeated measures designs)

11

11

11

Reporting Guideline(Lix & Keselman)

c. ノンパラメトリック・ブートストラップ・リサンプリング法 (Berkovits, Hancock, & Nevitt, 2000)

B の数は,目的に依存する。信頼区間のためには, B≧1000 を推奨,推定値のためには, 300≦B≦1000 で十分である。

4.従属変数の分布についての仮定が評価され,適切な検定手続きが選択されている。

非正規性に対するアプローチ

オリジナルデータセット

1. オリジナルデータに基づいてリサンプリング2. 個人内効果の平均で中心化3. 個人内効果の検定

ブートストラップ・データセット B 個のブートストラッ

プ・データセット※1~3の手順を全てのデータセットで実施

検定統計量の小さい順に並べて, B×(1-α)番目の検定統計量を評価

Page 13: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

共分散行列構造の仮定で,反復測定データに用いる分析手続きが変わる 球面性の仮定

反復測定 ANOVA における仮定であり,反復測定水準間のペア間の差の分散の分布が等しくなければならない。

多標本球面性 (multisample sphericity) の仮定混合デザインにおける仮定であり,反復測定水準間のペア間の差の分

散の分布に加えて,参加者要因の水準においても反復測定のペア間の差の分散の分布も等しくなければならない。

※球面性の仮定は,社会,行動,健康科学の研究において満たされにくく,球面性の仮定の検定は多変量正規分布からの逸脱に敏感であるため,反復測定ANOVA は推奨できない。

5.反復測定の共分散構造についての仮定が評価され,検定手続きの選択を導くために使用される。

共分散構造の仮定

Page 14: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

a. 近似の自由度 (approximate df ) による ANOVAb. 反復測定 (repeated measure )MANOVA

反復した測定値の一般的な共分散行列構造を仮定しない しかし,参加者間の水準でグループの共分散行列の等質性を仮定する

参加者間の水準間で共分散の等質性から逸脱すると,特にグループサイズが等質でないときに,頑健でなくなる。

最も小さいグループサイズの共分散の変動性が,最も大きなグループサイズの変動よりも大きいならば,参加者内効果はタイプⅠエラーの確率が上昇。

最も小さいグループサイズの共分散の変動性が,最も大きなグループサイズの変動よりも小さいならば,参加者内効果はタイプⅡエラーの確率が上昇。

共分散が等質であると仮定する必要性がないとき,自由度の調整をして,共分散の等質性について無視することが推奨される (Keselman et al., 2008) 。サンプルサイズが小さすぎなければ,参加者内効果について妥当な結果が得られ

る。多変量正規分布の仮定が維持できないとき,トリム平均とウィンザライズド分散

を用いて,自由度調整をすべき。

5.反復測定の共分散構造についての仮定が評価され,検定手続きの選択を導くために使用される。

球面性の仮定を維持できない時

Page 15: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

共分散構造のモデル選択を補助する統計量の要約と図視可が必要。また,モデル適合度の計測や推定が使用されるa. ネストされたデータのモデル選択• 尤度比検定の使用

b. ネストされていないデータのモデル選択• 赤池情報基準( AIC )や Schwarz’s Bayesian

Information Criterion ( BIC )を用いて判断。• BIC は AIC よりも厳しくモデルを不利にするため, BIC

の使用を勧める。• 2つの情報基準は,同じ回帰パラメータを含む共分散構造

のモデルを比較するためだけに使用されるべき

5.反復測定の共分散構造についての仮定が評価され,検定手続きの選択を導くために使用される。

共分散構造の選択

Page 16: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入

Reporting Guideline(Lix & Keselman)

共分散構造のモデル選択を補助する統計量の要約と図視可が必要。また,モデル適合度の計測や推定が使用されるa. ネストされたデータのモデル選択• 尤度比検定の使用

b. ネストされていないデータのモデル選択• 赤池情報基準( AIC )や Schwarz’s Bayesian

Information Criterion ( BIC )を用いて判断。• BIC は AIC よりも厳しくモデルを不利にするため, BIC

の使用を勧める。• 2つの情報基準は,同じ回帰パラメータを含む共分散構造

のモデルを比較するためだけに使用されるべき

5.反復測定の共分散構造についての仮定が評価され,検定手続きの選択を導くために使用される。

共分散構造の選択

Page 17: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入欠損値のタイプと量の査定は反復測定の研究において必須! Monotone (drop-out) pattern :特定の時期に観測されるが,以降の

測定では観測されない。 Drop out は疲れや様々な理由で生じする

Intermitted pattern :ところどころに欠損値を含むもの。

反復測定 ANOVA ,自由度調整 ANOVA ,反復測定 MANOVA は完全なデー

タセットを仮定するため,不完全データの場合,以下の 3 つの選択がある。

① リストワイズ除去法: 1 つでも欠損値のある参加者を分析から除外する方

法。

② 最尤推定法:完全情報最尤推定法( full information maximum

likelihood estimation )などで欠損データを持つ参加者を削除しない方

法。

③ 代入法:単一代入法や多重代入法を使って欠損値の代入をする方法。

6.欠損値の割合とパタンが考慮されること。欠損値を扱うために適用した方法が同定される。

Reporting Guideline(Lix & Keselman)

欠損値の種類と対処

Page 18: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入a) 単一代入法:平均値や回帰などでデータを置き換える。特に,欠損率が高い

に,欠損値のランダムな可変性を考慮できず,標準誤差を過小評価する結果

をもたらすため,推奨されていない。

b) 多重代入法:推奨されるアプローチ。完全データセットを複数作成し,分析

後に統合する。 Shafer (1999) では,3~ 10 のデータセットの作成が推

奨される(※現在は, 20 程度作成することが推奨されている様子)。

6.欠損値の割合とパタンが考慮されること。欠損値を扱うために適用した方法が同定される。

Reporting Guideline(Lix & Keselman)

代入法 (imputation method)

Page 19: 第1回DARM勉強会のANOVA補足(repeated measures designs)

R ・ RStudioの導入a)Missing completely at random (MCAR)観測が欠損することは,観測値と欠損値のどちらとも独立である可能性が

あるもの。

b)Missing at random (MAR)観測が欠損することは,観測された反応のパターンにだけ依存するもの。

c)Missing not at random (MNAR)その他全ての欠損データのメカニズム。

欠損メカニズムにより,欠損値処理をしたときのバイアスの程度が異なる。

MNAR の場合, pattern selection model や pattern mixture

model によってバイアスが減少するため,推奨されている。

6.欠損値の割合とパタンが考慮されること。欠損値を扱うために適用した方法が同定される。

Reporting Guideline(Lix & Keselman)

欠損値のメカニズム