有意性と効果量についてしっかり考えてみよう

浦野　研　（北海学園大学）email: urano@hgu.jp / twitter: @uranoken

外国語教育メディア学会第53回全国研究大会2013.08.07.

本日の資料はこちらhttp://bit.ly/let2013ws

本日の資料はウェブで公開しています。

http://bit.ly/let2013ws

おことわり

•僕は数学が苦手です

•でもがんばります

•数式が少しだけ出てきます

•数学が苦手な方もがんばりましょう

さて本題

目　標

•効果量と有意性について、その関係と違いを理解すること

•効果量の種類と数値の意味について（なんとなく）把握すること

•効果量を計算できるようになること

手を挙げて教えてください

•効果量を学会発表や論文で報告したことがある人

•統計ソフトで η2, ω2 などの数値を見たことがある人

•「え？効果量？なにそれ？」な人

有意性と効果量

0! 2! 4! 6! 8! 10!0!

0! 3! 6! 9! 12! 15!

Figure 1. (N = 10) Figure 2. (N = 119)

r = .627 r = .184

p = .052 p = .045

>有意でない｜有意

「（統計的）有意」とは

•標本（サンプル）から母集団を推定する

•標本で観察される差・関係が、母集団には存在しない確率、つまり偶然の結果である確率（p 値）を計算する

•p 値が基準値（臨界値）以下であれば「有意」である（偶然でない）と判断する

母集団と標本

母集団標　本推定

データ解析

Σ, F, t, p...

標本誤差

•ある標本で得られた代表値（e.g., 平均）と母集団の代表値との差

母集団μ = 15.3

標本AM = 14.7

標本BM = 15.9

標本CM = 15.2

標本DM = 15.4

標本EM = 15.1

標本誤差

•標本のサイズが大きければ大きいほど、標本誤差は小さくなる

•つまり推定の精度が高くなる

相関係数（r）と臨界値*

N 3 4 5 10 20 30

臨界値(α = .05)

0.997 0.950 0.878 0.632 0.444 0.361

N 40 50 100 200 500 1000

臨界値(α = .05)

0.312 0.279 0.197 0.139 0.088 0.062

*これより大きい数値だったら偶然でないとみなす

相関係数（r）の意味

（吉田, 1998, p. 75）

0! 2! 4! 6! 8! 10!0!

0! 3! 6! 9! 12! 15!

Figure 1. (N = 10) Figure 2. (N = 119)

r = .627 r = .184

p = .052 p = .045

もう一度見てみよう

有意性検定と標本サイズ有意な差（または、有意な相関）が得られやすい研究をするためのきわめて有効な方法があります。それは、とにかく多くのデータを集めることです。なぜならば．．．統計的検定の結果はデータ数が多いほど有意になりやすいからです。そのため、データ数を増やしさえすれば、きわめて小さな差でも “（統計的には）有意である”

という結果になる可能性が高まります。例えば、N = 1000 の場合には、r = 0.062 というきわめて小さな相関係数（すなわち、非常に弱い関係）でも有意になります．．．。このように、統計的推定には、“データ数という、研究者が任意に決められる要因によって結果が左右されてしまう” という根本的な問題があります。（吉田,

1998, p. 232; 下線は浦野による）18

どうする？

•差や関係を表す、標本サイズに依存しない指標がほしい

•それが効果量

•実は相関係数 r も効果量の指標です（後述）

効果量の種類

大きく分けて2つ

•差の大きさを表す指標（d 族）

•関係の強さを表す指標（r 族）

差の大きさを表す指標

とあるテストの結果52 79

Group A Group B

どちらの方ができがよい？24

平均点

Group A Group B

52.1 57.1

Group B の方が優秀？

ちょっと待って！

もう少し見てみよう

分布を見てみよう

結構重なってる

0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100"

Group"A"

Group"B"

重なりの多さ、少なさ

（吉田, 1998, p. 173）29

差は同じ（吉田, 1998, p. 173）

重なりの量が違う31

言えそうなこと

重なりが少ない方が差が大きそう

もう一度見てみよう

0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100"

Group"A"

Group"B"

この重なりは多いの？少ないの？33

指標が欲しい

効果量Cohen’s d

Cohen’s d

pooledSD

21 −=

←　平均の差

←　標準偏差　　（分布の広がり）

計算してみよう

Group A 52.1 15.3

Group B 57.1 16.7

pooledSD

21 −=

| 52.1-57.1|= (15.3 + 16.7) / 2*

*n が異なるとき、SDpooled の計算はもう少し複雑になります37

pooledSD

21 −= = 0.31

5.0= 16.03

Group A 52.1 15.3

Group B 57.1 16.7

効果量 d と分布の重なり

d 0.0 0.1 0.2 0.3 0.4 0.5 0.6

重なり（％） 100 92.3 85.7 78.7 72.6 67 61.8

d 0.7 0.8 0.9 1.0 1.1 1.2 1.3

重なり（％） 57.0 52.6 48.4 44.6 41.1 37.8 34.7

再びこのグラフ

0,10" 11,20" 21,30" 31,40" 41,50" 51,60" 61,70" 71,80" 81,90" 91,100"

Group"A"

Group"B"

d = 0.31、つまり重なりは8割ほど40

つまり

Group AとGroup Bは平均点に5点差があるけど全体の8割は重なっている

効果量 d と重なりの関係

d 値が大きくなるには

pooledSD

21 −=

←　小さい方が良い

←　大きい方が良い

効果量の解釈

Cohen (1969)

•small: d = 0.2, overlap: 85.7%

•e.g., 15歳と16歳の女子の身長差

•medium: d = 0.5, overlap: 67.0%

•e.g., 14歳と18歳の女子の身長差

•large: d = 0.8, overlap: 52.6%

•e.g., 大学新入生とPhD取得者のIQ差

ただし

•このような指標はあくまで目安

•実際の解釈は研究者自身の責任で

効果量と有意性

重なりの多さはわかったけど、この差は偶然？

観察された差が偶然である可能性（確率）を計算しよう

t 検定

←　平均の差

←　標準偏差2の和

↑　標本サイズ（被験者数）

t 検定

これさっき見た？

Cohen’s d

pooledSD

21 −=

←　平均の差

←　標準偏差（分布の広がり）

これに n を足すと t っぽい！

pooledSD

21 −=

t 値が大きくなるには

←　大きい方が良い

←　小さい方が良い

↑　大きいほうが良い

t の臨界値*

n 1 2 3 4 5

臨界値両側検定5%

12.71 4.30 3.18 2.78 2.57

n 10 20 50 100 200

2.23 2.09 2.01 1.98 1.97

*これより大きい数値だったら偶然でないとみなす

Group A 52.1 15.3

Group B 57.1 16.7

*n が異なるときの計算はもう少し複雑になります

| 52.1-57.1|= √(15.32 + 16.72) / (30 - 1)

Group A 52.1 15.3

Group B 57.1 16.7

5= 4.21

*n が異なるときの計算はもう少し複雑になります

= 1.18

t の臨界値

n 1 2 3 4 5

12.71 4.30 3.18 2.78 2.57

n 10 20 50 100 200

2.23 2.09 2.01 1.98 1.97

t = 1.18 は有意でない61

ここまでのまとめ

•効果量 Cohen’s d

•2つのグループ間の差を標準化したもの

•t 検定

•効果量に標本誤差の影響を加味して、その差が偶然観察される確率を示したもの

•検定統計量 = 効果の大きさ x 標本の大きさ

（南風原, 2002, p. 163）

•Cohen’s d の仲間:

•Hedges’ g

•分母に母集団の標準偏差を使う

•Glass’ ⊿

•分母に統制群の標準偏差を使う

関係の強さを表す指標

•変数間の関係の大きさを表す

•最大: 1.0

•最小: 0

•ピアソンの積率相関係数 r

•r2 （分散説明率）

（大久保・岡田, 2012, p. 72）

r と r2 の関係

分散分析の場合

調べたい要因の分散η2 = 総分散

SS df MS F p η2

A 847.609 2 423.805 0.955 .389 .022

Error 37259.655 84 443.567

Total 38107.264

one-way ANOVA

MacR に付属のデータを使って MacR で計算

SS df MS F p η2

A 847.609 2 423.805 0.955 .389 .022

Error 37259.655 84 443.567

Total 38107.264

one-way ANOVA

↑　標本サイズが大きいと F 値が大きくなる

SS df MS F p η2

A 847.609 2 423.805 0.955 .389 .022

Error 37259.655 84 443.567

Total 38107.264

one-way ANOVA

η2 = SSA / SST = 847.609 / 38107.264 = .022

効果量の解釈

水本・竹内 (2008)

•small: η2 = .01

•medium: η2 = .06

•large: η2 = .14

•このような指標はあくまで目安

•実際の解釈は研究者自身の責任で

ただし

ここまでのまとめ

•r 族の効果量

•変数間の関係の強さを数値で示したもの

•最大で 1.0、最小で 0

•分散分析で使う η2 は r2 と似た感じ

•F と η2 の違いは標本サイズを考慮するかどうか

•検定統計量 = 効果の大きさ x 標本の大きさ

（南風原, 2002, p. 163）

•η2 の仲間:

•partial η2

•分母に SSA + SSE を使う

•ω2

•母分散推定のためのバイアスを取り除いたもの

さて

計算してみましょうか

効果量の計算のシートhttp://www.mizumot.com/stats/effectsize.xls

Language Education & Technology, 46, 41–60 (2009)

Cohen’s d を計算してみよう

Language Education & Technology, 42, 111–118 (2005)

η2 を計算してみよう

有意性と効果量についてしっかり考えてみよう

Education

「国語表現」におけるビブリオバトル導入の効果について · 2020. 7. 1. · 71 「国語表現」におけるビブリオバトル導入の効果について

「成果主義に関するアンケート」調査結果...3 2．結果のポイント＜成果主義の効果に対する認識＞ ※「成果主義の効果」の定義については、P27を参照

コンピュータネットワークを利用した効果的な授業について ...-211-コンピュータネットワークを利用した効果的な授業について－高等学校「理科総合A」の指導を通して－

ヘルスキーパーの効果的な導入について (方法論と事例)

費用対効果分析について - WAM NET（ワム ...€¦ · 費用対効果分析の基本的な考え方について増分効果がプラスかつ増分費用がマイナス

フィールドスタディの教育効果について - 明治大学...米国ビジネススクールにおけるマネジメント・フィールドスタディの教育効果について

ラウンドアバウトの効果・影響 - mlit.go.jp項目ラウンドアバウトの効果・影響国内外のガイドライン、研究成果等をもとにラウンドアバウトの効果影響を整理。ラウンドアバウトの効果・影響

国連安保理決議の法的効果 ――拘束的効果と許容的 …1 国連安保理決議の法的効果 ――拘束的効果と許容的効果に関する解釈論的試論――

効率的・効果的な図書館サービスのアクションプ …...1 効率的・効果的な図書館サービスのアクションプラン～まちに出よう。本を持って～

M&S技術の現状とその経済効果 - JEITAsemicon.jeita.or.jp/STRJ/STRJ/2002/4H.pdf · – 身近な有効例の経済効果 –M&S有効活用の要件など • 経済効果数値の記載者と非記載者に分けて分析

狭山池博物館の効果的・効率的な運営について（素案） · 2018-10-24 · 狭山池博物館の効果的・効率的な運営について（素案）平成30年9月26日（水）

持続的な抗菌効果を発揮 - SARAYAヒビスコールSHの特長持続的な抗菌効果を発揮カップ＆ノズル付広範囲の微生物に対して消毒効果を発揮

Renner Teller効果 b統一理解home.hiroshima-u.ac.jp/kyam/pages/results/monograph/Ref...16-1 16 1 cじめに Jahn−Teller 効果(以 W>*JT 効果)1 \Renner−Teller 効果(以

菌薬の効抗菌薬の効能・効果読替えに能効関するご案内抗菌薬の効能・効果読替えに関するご案内抗菌薬の効能・効果読替

第3章効果的な MFCA 適用に向けて

本当にあるの？花の癒し効果って · 千葉大学環境健康フィールド科学センター（自然セラピープロジェクト）花の癒し効果って本当にあるの？

3章テレワークの効果・効用 - MLIT16 3．テレワークの効果・効用 3 効果・効用テレワークの図表3-1 は、テレワークの試行・体験プロジェクトに参加した従業員が、仕事面での改

重力マイクロレンズ法による...重力レンズ効果‥Lens天体の重力場によってSource天体から来る光が曲げられる効果重力マイクロレンズ効果

1.8.2. 効能・効果およびその設定根拠...1.8.2. 効能・効果およびその設定根拠 1.8.2.1. 効能・効果重度の原発性腋窩多汗症 1.8.2.2. 設定根拠

果樹の樹体ジョイント仕立てを核とした省力、低コ …〔メリット〕〔デメリット〕：効果大：効果あり ±：差なし：マイナス効果

有意性と効果量について しっかり考えてみよう

有意性と効果量についてしっかり考えてみよう