Download pdf - データの平均値の差を検討する方法-1 - Sas Institute...Data Science Institute データの平均値の差を検討する方法-1 2018年8月3日データサイエンス研究所

Data Science Institute

データの平均値の差を検討する方法-1

2018年8月3日データサイエンス研究所

伊藤嘉朗

（ｔ検定、カイ二乗検定）


事例統計用語・統計手法ページ

A君の研修成績の評価標準偏差, Z値, 偏差値 3標準正規分布 8

食品の有効成分含有量における標本の平均と母集団の平均との比較

母集団と標本（有意確率、有意水準、Z検定） 10t分布のしくみと正規分布との違い 20(A)１標本t検定のしくみと解釈方法 22(B) 標本平均と母集団の平均の差が拡大した場合 34(C) 標本のバラツキ(標準偏差)が拡大した場合 38(D) 標本サイズが拡大した場合 461標本t検定のまとめ 50

商品パッケージデザインにおける男女別好感度の比較

(A) 2標本t検定のしくみと解釈方法 51(B) 平均値の差が拡大したとき 59(C) データのバラツキが拡大したとき 62(D) 標本サイズが拡大したとき 65

商品説明前後による理解度の比較データに対応のある場合におけるｔ検定 67各事例の分析結果の比較ｔ検定における効果量 79サッカーと野球選手のBMI比較

ｔ検定における分析手法の選択 83サッカー選手間の評価比較サイコロの出る目の妥当性カイ二乗検定のしくみ 85階層（一般層・富裕層）と商品選択の関連 2×2分割表の検定 95主力ブランド知名度の年度間比較比率の差の検定への応用 104資格保有者数の年齢階層別比較 m×n分割表の検定 108各事例の分析結果の比較カイ二乗検定における効果量 109

まとめ検定の考え方、ｔ検定、カイ二乗検定有意確率と効果量

110

本日の内容


A君の成績の評価

A君の得点全体の平均点得点-平均点研修前 70 58.3 +11.7研修後 72 58.3 +13.7

平均は評価基準？

英語の研修前後の成績（20人）

3


• ＜研修前＞70、56、89、27、69、57、69

50、33、67、37、49、98、69

68、25、65、67、33、68

• ＜研修後＞72、31、95、36、89、88、89

76、28、47、23、28、96、48

51、20、33、91、27、98

全員の成績

研修後はバラツキ（標準偏差）が大きくなった。4


◇平均を基準とした場合研修前（+11.7）＜研修後（+13.7）

成績の評価

・順位研修前（3番）＞研修後（9番）

・バラツキ（標準偏差）研修前＜研修後

バラツキ（標準偏差）の大きいデータの平均は信頼できない。

5


70-58.319.2

72-58.328.6

＞

研修前研修後

成績平均成績－平均標準偏差

研修前 70 58.3 11.7 19.2研修後 72 58.3 13.7 28.6

A君の成績の評価

＝ 0.609 ＝ 0.479

基準値（Z値）成績と平均値の差

標準偏差

6


偏差値

Ｚ値×10＋50

研修前の偏差値＝0.609×10＋50＝56.09研修後の偏差値＝0.479×10＋50＝54.79

Ｚ値の比較によりデータの評価・比較が可能

7


Z値 -3 - 2 -1 0 1 2 3

Z値偏差値上側確率

0 50 0.50001 60 0.15892 70 0.02283 80 0.0014

Z値と標準正規分布

偏差値 20 30 40 50 60 70 80

8


Ｚ値と標準正規分布

Z＝ 88-62.412.8

＝ 2

求める値－平均値

標準偏差

差（違い）

バラツキＺ値＝

■全国で10万人が参加したある模試A君の成績は、88点、平均点62.4点、標準偏差が12.8点Ａ君の成績は上位何％？

88点以上の割合は約2.28%

9


母集団

標本

ランダム抽出

平均値、分散標準偏差

平均、分散標準偏差

推定

10

母集団と標本


競合食品メーカー有効成分含有量平均＝60mg、標準偏差＝15mg

（1）市場から一つ購入した： 75mg母平均より多いのか？

違うと判定したときの危険率

検定の主目的有意確率を求める！

11

食品有効成分含有量における標本平均との比較



0 50 0.50001 60 0.15892 70 0.02283 80 0.0014Z値 -3 - 2 -1 0 1 2 3

偏差値 20 30 40 50 60 70 80

有意確率（危険率）＝15.89％

Ｚ＝15

＝ 175-60

12



0 50 0.50001 60 0.15892 70 0.02283 80 0.0014Z値 -3 - 2 -1 0 1 2 3

偏差値 20 30 40 50 60 70 80

有意確率（危険率）＝2.28％

Ｚ＝75-60

15 √4× ＝ 2

（2）市場から４つ購入した平均： 75mg母平均より多いのか？

標本数が増えるとＺ値は大きくなる 13


母集団の標準偏差（15）√4× ＝ 24つの標本の平均（75）－（60）

Ｚ値＝

母集団の標準偏差を推定する必要がある

母集団の標準偏差は分からないことが多い！

14


母集団の分散の推定

8 9 9 10 10 10 11 11 11 11 12 12 12 13 13 14

標本数：3 6回抽出

母集団（16個）

標本の分散から母分散を推定！

15


① ② ③ ④ ⑤ ⑥

8 10 10 11 11 9 9 10 11 12 12 12 13 11 13 13 12 13

分散A 4.67 0.22 1.56 0.67 0.22 2.89 分散B 7.00 0.33 2.33 1.00 0.33 4.33

平均 10.00 10.33 11.33 12.00 11.67 11.33

分散A：（データ－平均）2の合計÷（3）分散B：（データ－平均）2の合計÷（2）

平均

11.11

1.702.56

16


分散の計算

2乗8 － 10 ＝－2 49 － 10 ＝－1 1

13 － 10 ＝ 3 9

平均：（ 8 + 9 + 13 ）÷ 3 ＝ 10

計 0 14

分散Ａ： 14 ÷ 3 ＝ 4.67

分散B ： 14 ÷ （ 3 – 1 ）＝ 7.00

17


8 9 9 10 10 10 11 11 11 11 12 12 12 13 13 14

平均＝＝11.0

2 2 2

母集団の平均と分散

分散＝＝ 2.55

分散B（2.56）が母集団の分散（2.55）に近似！

18


データ数（ｎ）より（ｎ-1）で割って求めた分散Bの方が精度が良い。

n-1:自由度

母集団の分散推定

標本の平均―母集団の平均不偏標準偏差

Ｚ値＝ × √ n

分散Ｂ ⇒ 不偏分散（不偏標準偏差）

19


ｔ分布とは1908年、W.S.ゴセット（キネスビールの研究員）が考案。データが少ないときに精度を上げるためにｔ値を使う。

■全て（データの大小に関係なく）ｔ値を使う。■この検定方法をｔ検定という。

Ｚ値による検定正規分布

ｔ値による検定ｔ分布

Ｚ値による検定は標本数が少ないときに精度が良くない。

20


ｔ分布

自由度によって形が変わる。自由度が大きくなると正規分布と同じ形。

0

自由度1 自由度2

自由度4

自由度99

標準正規分布

21


ランダムに選んだ製品10個の有効成分含有量母平均：60ｍｇ違いはみられるか？

64 62 58 61 60 59 63 66 62 63

10個の平均値を求めると（64+62+・・・+60+63）÷10 ＝ 61.8

標本平均（61.8）と母平均（60.0）は異なる？

（A）1標本ｔ検定

22


（1）データを入力する。

平均と不偏標準偏差を求める（SAS EG )

23

EG


（2）「記述統計」-「要約統計量」をクリックする。

24

EG


（3）「変数リスト」をから「分析変数」を選択する。

25

EG


（4）「統計量」「基本」をクリックし、出力項目を確認する。

26

EG


（5）結果が表示される。

不偏標準偏差＝ 2.394平均＝ 61.8

27

EG


標本の平均－母集団の平均

不偏標準偏差ｔ値＝ × √ n

61.8 － 60.02.394

× √ 10

＝ 2.38

＝

28


（2）「分析」-「分散分析」-「ｔ検定」をクリックする。

1標本ｔ検定（SAS EG）


29

EG


（3）「1標本に対する検定」を選択する。

30

EG


（4）「分析変数」を指定する。

31

EG


（5）「分析」をクリックし、「母集団の平均」（帰無仮説）を入力する。

32

EG


有意確率＝ 0.0414ｔ値＝ 2.38

33

EG



64 62 58 61 60 59 63 66 62 63

10個の平均値を求めると（64+62+・・・+60+63）÷10 ＝ 61.8


（B）標本の平均と母集団の平均の差が拡大した場合

34



標本の不偏標準偏差ｔ値＝ × √ n

61.8 － 59.02.394 × √ 10

＝ 3.70 ＞ 2.38

＝

35


（5）「分析」をクリックし、「母集団の平均」（帰無仮説）に、59.0を入力する。

36


有意確率＝ 0.0049 ＜ 0.0414ｔ値＝ 3.70 ＞ 2.38

37

EG


ランダムに選んだ製品10個の有効成分含有量母平均：60mg 違いはみられるか？

64 62 55 61 60 59 63 66 65 63

10個の平均値を求めると（64+62+・・・+60+63）÷10 ＝ 61.8


64 62 58 61 60 59 63 66 62 63

（C）標本のバラツキ（標準偏差）が拡大した場合

38



平均と不偏標準偏差を求める（SAS EG )

39

EG


（2）「記述統計」-「要約統計量」をクリックする。

40

EG


（3）「変数リスト」をから「分析変数」を選択する。

41

EG


（4）「統計量」「基本」をクリックし、出力項目を確認する。

42

EG


不偏標準偏差＝ 3.225 ＞ 2.394平均＝ 61.8

43

EG




61.8 － 60.03.225 × √ 10

＝ 1.77 ＜ 2.38

＝

44


有意確率＝ 0.1114＞ 0.0414ｔ値＝ 1.77 ＜ 2.38

45

EG



64 62 58 61 60 59 63 66 62 6364 62 58 61 60 59 63 66 62 63

20個の平均値を求めると（64+62+・・・+60+63）÷10 ＝ 61.8


（D）標本サイズが拡大した場合

46


平均と不偏標準偏差を求める（SAS EG ）

不偏標準偏差＝ 2.331平均＝ 61.8

47

EG



不偏標準偏差ｔ値＝ × √ n

61.8 － 60.02.331 × √ 20

＝ 3.45 ＞ 2.38

＝

48


有意確率＝ 0.0027 ＜ 0.0414

ｔ値＝ 3.45 ＞ 2.38

49

EG


1標本ｔ検定のまとめ



（B）標本の平均と母集団の平均の差が大 ⇒ ｔ値は大（C）標本のバラツキ（不偏分散）が大 ⇒ ｔ値は小（D）標本サイズが大 ⇒ ｔ値は大

ｔ値が大＝有意確率（危険率）は小

ｔ値が小＝有意確率（危険率）は大

50


男女の平均値の差に違いは見られるか？

男性 6 4 5 5 6 5 6 6 4 6 5.3 女性 7 6 7 5 6 5 6 7 6 6 6.1

平均

2標本ｔ検定（2群の平均値の差の検定）

(Ａ) 商品のパッケージの好感度について、男女各10人に10点満点にて調査した。男女間に評価の差は見られるか。

51

商品パッケージの男女別好感度の比較


男性の平均-女性の平均√男性の不偏分散+女性の不偏分散

ｔ値＝

◇１標本ｔ検定

◇2標本ｔ検定



52

× √ n




53

EG



54

EG


（3）「2標本に対する検定」を選択する。

55

EG


（4）「分類変数」と「分析変数」を指定する。

56

EG


◇分散が違うとは言えないとき有意確率＝0.0344

◇分散が違うとき有意確率＝0.0346

57

EG


有意水準5％において、男女間の好感度に違いが見られる。（有意水準5％において、有意である。）

有意確率＝0.0346 ＜ 0.05(有意水準）

有意確率（危険率）の判定

＜男女別好感度調査 2標本ｔ検定の結果＞有意確率（危険率）＝0.0346

58


男性 6 4 5 5 6 5 6 6 4 6 5.3 女性 7 6 7 6 6 6 6 7 6 6 6.3

平均値


（B）平均値の差が拡大したとき

商品のパッケージの好感度について、男女各10人に10点満点にて調査した。男女間に評価の差は見られるか。

59


平均値(A) (B)

男性 5.3 5.3女性 6.1 6.3差 0.8 1.0

平均値の差は0.8から1.0に拡大

有意確率は小?ｔ値が大?

60


ｔ値＝3.31 ＞ 2.29

有意確率＝0.0049 ＜ 0.0346

61

EG


男性 7 3 8 3 7 2 2 6 6 9 5.3女性 7 4 9 3 8 3 5 8 7 9 6.3

平均値


（C）データのバラツキが拡大したとき


62


(B) (C)

男性 0.781 2.584

女性 0.458 2.359

（B） < （C）

不偏標準偏差

63


ｔ値＝ 0.90 ＜ 3.31

有意確率＝ 0.3782 ＞ 0.0049

64

EG




（D）標本サイズが拡大したとき

男女各10人から男女各20人に増加

7 3 8 3 7 2 2 6 6 97 3 8 3 7 2 2 6 6 97 4 9 3 8 3 5 8 7 97 4 9 3 8 3 5 8 7 9

5.3

6.3

男性

女性

65


ｔ値＝ 1.31 ＞ 0.90

有意確率＝ 0.1971 ＜ 0.3782

66

EG


説明前 7 3 8 3 7 2 2 6 6 9 5.3

説明後 7 4 9 3 8 3 5 8 7 9 6.3

平均値

商品の理解度について、10人に商品説明前後に、それぞれ10点満点にて調査した。説明前後による理解度に差は見られるか。

2標本ｔ検定？

対応のある２標本の検定

67

商品の説明前後による理解度の比較


データ数＝20回答者１０人のデータ

回答者が各自2回ずつ回答

対応のある2標本ｔ検定

68



対応のある2標本ｔ検定（SAS EG）

69

EG



70

EG


（3）「対応のある検定」を選択する。

71

EG


（4）「対応のある変数」を指定する。

72

EG


有意確率＝ 0.0085ｔ値＝ 3.35

73

EG


対応の有無による有意確率の比較

有意確率は「対応のある場合」の方が小さい！

(C)対応なし (D)対応ありｔ値 1.31 3.55

有意確率 0.3782 0.0085

74


平均値

説明前後の評価の差に着目

説明前 7 3 8 3 7 2 2 6 6 9 5.3 説明後 7 4 9 3 8 3 5 8 7 9 6.3 前後差 0 1 1 0 1 1 3 2 1 0 1.0

１標本ｔ検定75

商品の理解度について、10人に商品説明前後に、それぞれ10点満点にて調査した。説明前後による理解度に差は見られるか。




76

EG


（2）「分析」-「分散分析」-「ｔ検定」をクリックする。（3）「1標本に対する検定」を選択、「分析変数」を指定する。（4）「分析」をクリックし、「母平均」を入力する。

77

EG


対応のある2標本ｔ検定＝差に着目した1標本ｔ検定78

EG


◇１標本ｔ検定



＝効果量

効果量

× √ n

t値は標本サイズに影響を受ける

79


◇効果量（Cohen’s d）の大きさの評価

有意確率ｔ値ｎ効果量

（A） 0.0414 2.38 10 0.75

（D） 0.0027 3.45 20 0.77

1標本ｔ検定の効果量の比較

0.2 0.5 0.8小中大

80

(A) 22-33ページ食品有効成分含有量、ランダムに選んだ製品10個, (D) 46-49ページ、同20個


有意確率ｔ値ｎ効果量

（C） 0.3782 0.90 10 0.40

（D） 0.1971 1.31 20 0.41

◇2標本ｔ検定

男性の平均-女性の平均√男性の不偏分散+女性の不偏分散

ｔ値＝

＝効果量 × √ n/2

2標本ｔ検定の効果量の比較

81(C)商品パッケージ好感度 62-64ページ男女各10人, (D) 65-66ページ、同20人

× √ n


2)効果量の大きさ

１)有意確率（危険率）

有意確率が小さい差が大きい

有意確率と効果量について検討する。

標本数に比例して t値は大きくなる。＝標本数に比例して有意確率は小さくなる。

検定結果の検討

82


・サッカー選手と野球選手のBMIの比較

平均

サッカー 24.0 23.0 24.2 23.4 23.5 23.3 22.7 24.6 22.0 21.8 23.2 野球 21.4 23.3 22.0 26.3 27.4 24.4 24.8 28.7 26.5 31.1 25.6

対応のない2標本ｔ検定

83

EG


・サッカー選手ＨとＫの実績比較（過去10試合）平均

H 7.0 5.5 6.0 5.0 7.0 6.5 6.5 7.0 6.0 5.0 6.2 K 6.5 6.0 5.0 4.5 6.5 6.5 5.0 7.0 4.5 5.0 5.7

対応のある2標本ｔ検定

対応のない2標本ｔ検定

84

EG


カイ二乗検定サイコロを60回振ったところ次の様になった。このサイコロは正常に作られているでしょうか。

1の目が出た回数 82の目が出た回数 133の目が出た回数 84の目が出た回数 65の目が出た回数 146の目が出た回数 11合計 60

正常ではないと判断したときの危険率85

サイコロの出る目の妥当性


実現値期待値1の目が出た回数 8 102の目が出た回数 13 103の目が出た回数 8 104の目が出た回数 6 105の目が出た回数 14 106の目が出た回数 11 10

計 60 60

違いの大きさの計算方法

0

違いの合計＝0！

違い-23-2-441

86


実現値期待値1の目 8 102の目 13 103の目 8 104の目 6 105の目 14 106の目 11 10 計 60 60

食い違いの大きさの計算方法

食い違いの合計＝5.0

違い-23-2-4410

(違い)2

4941616150

(違い)2/100.40.30.41.61.61.05.0

87


期待値

食い違いの値をカイ2乗分布を利用して有意確率（危険率）を算出する

食い違い＝（実現値-期待値）2

の合計

88



カイ二乗検定（SAS EG）

89

EG


（2）「記述統計」-「一元度数表」をクリックする。

90

EG


（3）「サイコロの目」を「分析変数」、「出た回数」を「度数カウント」に指定する。

91

EG


（4）「統計量」をクリックし、「カイ二乗検定」-「漸近検定」を指定する。

92

EG


有意確率＝0.415993

EG


カイ2乗分布

94


主力商品Ａ、Ｂ2種類について、一般層と富裕層にＡ、Ｂどちらを選択するかについて調査した。違いは見られるか。

（人）

A B 計

一般層 60 40 100

富裕層 30 70 100

計 90 110 200

食い違い ⇒ カイ二乗検定

分割表の検定（カイ2乗検定）

95

階層（一般層・富裕層）と商品選択の関連


＜期待値＞

（人）

A B 計

一般層 45 55 100

富裕層 45 55 100

計 90 110 200

（人）

A B 計

一般層 50 50 100

富裕層 50 50 100

計 90 110 200

96


555540

454560 22

555570

454530 22

18.18 カイ２乗分布

食い違い＝（実現値-期待値）2

期待値の合計

97



分割表の検定（SAS EG）

98

EG


（2）「記述統計」－「分割表分析」をクリックする。

99

EG


（3）「層、商品」を「表変数」に、「Ｎ」を「度数カウント」に指定する。

100

EG


（4）「表」をクリックし、プレビューの表頭に「商品」、表側に「層」を指定する。

101

EG


（5）「表統計量」をクリックし、カイ二乗検定を選択し、実行する。

102

EG


有意確率：＜ 0.0001

103

EG


昨年今年計

知っている 210 234 444

知らない 390 366 756

計 600 600 1200

比率の比較は無意味。調査人数が重要！

比率の差の検定

（Ａ）当社の主力ブランドの知名度昨年度35％、今年は39％昨年度より向上したと言えるか？

104

主力ブランドの知名度における年度別比較


有意確率＝ 0.1513

105

EG


昨年今年計

知っている 420 468 888

知らない 780 732 1512

計 1200 1200 2400

調査対象者が600から1200に増加

（B）当社の主力ブランドの知名度昨年度35％、今年は39％昨年度より向上したと言えるか？

有意確率は減少？106


有意確率＝ 0.0424 ＜ 0.1513

107

EG


年代別資格保有者数年代によって異なるか？

20歳代 30歳代 40歳代 50歳代

有 5 11 9 18

無 13 8 5 8

108

EG


カイ二乗検定における効果量

・2×2分割表の場合 : ファイ係数

・2×2以外の分割表の場合 : Cramer’s V

0.1 0.3 0.5小中大

◇効果量の大きさの評価

109


まとめ

・統計的検定の考え方有意確率（危険率）、有意水準

・ｔ検定1標本ｔ検定2標本ｔ検定（対応の有無）

・カイ二乗検定（分割表の検定）実現値、期待値

・有意確率と効果量

110

Download pdf - データの平均値の差を検討する方法-1 - Sas Institute...Data Science Institute データの平均値の差を検討する方法-1 2018年8月3日 データサイエンス研究所

Download pdf - データの平均値の差を検討する方法-1 - Sas Institute...Data Science Institute データの平均値の差を検討する方法-1 2018年8月3日データサイエンス研究所