39
確確確確確 確確確確確 確確確確確確 確確確確確確 2011 2011 2011 2011 12 12 22 22 確確 () 確確 () こここここここここここここここ

確率と統計

  • Upload
    kipp

  • View
    55

  • Download
    0

Embed Size (px)

DESCRIPTION

確率と統計. メディア学部 2011 年 2011 年 12 月 22 日(木). この資料は数学的な話が中心です。. 確率分布. 検定を行う際、確率計算が必要になります。 そのためには、分析対象が従うそれぞれの確率値の在り様 ( 確率分布 ) を知り、その 性質・特徴を上手く利用することになります。. 例えば. 1つのサイコロを 500 回投げたとき、偶数の目が100回出る確率 P を求めるとき、 定義では  を計算しなければならない。うっそ!. 興味ある人は計算してみてください。. 参考情報. オープンソースのツールを使うことも考えてみよう - PowerPoint PPT Presentation

Citation preview

Page 1: 確率と統計

確率と統計確率と統計確率と統計確率と統計メディア学部メディア学部 20112011 年年

20112011 年年 1212 月月 2222 日(木)日(木)

この資料は数学的な話が中心です。

この資料は数学的な話が中心です。

Page 2: 確率と統計

確率分布• 検定を行う際、確率計算が必要になりま

す。• そのためには、分析対象が従うそれぞれ

の確率値の在り様 ( 確率分布 ) を知り、その性質・特徴を上手く利用することになります。

東京工科大学 確率と統計 2011 P.2

Page 3: 確率と統計

例えば• 1つのサイコロを 500 回投げたとき、

偶数の目が100回出る確率 P を求めるとき、定義では

 を計算しなければならない。うっそ!

東京工科大学 確率と統計 2011 P.3

400100

100500 2

1

2

1

CP

興味ある人は計算してみてください。

興味ある人は計算してみてください。

Page 4: 確率と統計

参考情報• オープンソースのツールを使うことも

考えてみよう– 数式計算ソフトウェア  Maxima– 数値計算ソフトウェア  Scilab– 統計計算ソフトウェア  R など

東京工科大学 確率と統計 2011 P.4

Page 5: 確率と統計

いろいろな確率分布1. 2項分布2. 正規分布3. ポアソン分布4. 一様分布5. χ 2分布(カイ自乗分布6. t分布(ティー分布)7. F 分布(エフ分布) などなど

P.5東京工科大学 確率と統計 2011

Page 6: 確率と統計

1. 2項分布• 1回の試行において、事象 A の起こる

確率が p 、起こらない確率が q とする。このとき、n回の反復試行で事象 A がk 回起こる確率は、次のようになる。

この分布を      と書く。

教科書 p.97 参照のこと

),,2,1,0()( nkqpCkXP knkkn    

),( pnB

P.6東京工科大学 確率と統計 2011

Page 7: 確率と統計

例• 1枚の硬貨をn回投げる。

P.7東京工科大学 確率と統計 2011

Page 8: 確率と統計

2項分布 B(n, p) の平均と分散

• 平均 = np• 分散 = npq

教科書 p.101 式 (2) 参照のこと

有名かつ便利な公式

P.8東京工科大学 確率と統計 2011

Page 9: 確率と統計

公式の利用例• サイコロを 500 回振る。3の倍数の目

が出る回数の平均(期待値)は、公式より

東京工科大学 確率と統計 2011 P.9

回3

500

6

2500

pn

Page 10: 確率と統計

2.正規分布• 測定誤差や身長のデータのヒストグラムを

作ると釣鐘型になる。このときのヒストグラムの形を近似的に表す曲線を正規分布曲線とい、このときの分布を正規分布という。

正規分布曲線は、平均 μ と分散 σ2 できまるので、 N(μ, σ2 ) と書くことがある。

P.10東京工科大学 確率と統計 2011

Page 11: 確率と統計

キーワード• 分布関数• 確率密度関数• 正規分布曲線(定義)• 正規分布の特徴• 標準化 など

P.11東京工科大学 確率と統計 2011

Page 12: 確率と統計

正規分布のグラフ

P.12東京工科大学 確率と統計 2011

Page 13: 確率と統計

正規分布のグラフ

変曲点

左右対称

ほとんどゼロ

教科書 p.102 図 3 参照のこと

P.13東京工科大学 確率と統計 2011

Page 14: 確率と統計

正規分布曲線の式

ex

xf

2)( 2

2

1)( 2

)( x

14東京工科大学 確率と統計 2011

Page 15: 確率と統計

正規分布曲線の式

ex

xf

2

2)(

2

1)( 2

)( x標準偏差

平均

15東京工科大学 確率と統計 2011

Page 16: 確率と統計

重要な性質• 左右対称• X =σ は変曲点(上凸と下凸の変わり

目)• 平均 = 中央値 = モード

P.16東京工科大学 確率と統計 2011

Page 17: 確率と統計

他の重要な性質• (次ページ以降を参照のこと)

P.17東京工科大学 確率と統計 2011

Page 18: 確率と統計

正規分布のグラフ

68%

P.18東京工科大学 確率と統計 2011

Page 19: 確率と統計

正規分布のグラフ

95%

P.19東京工科大学 確率と統計 2011

Page 20: 確率と統計

正規分布のグラフ

99.7%

P.20東京工科大学 確率と統計 2011

Page 21: 確率と統計

ちょっと一言• 図形の面積は定積分によりもとめられ

る。

東京工科大学 確率と統計 2011 P.21

b

adxxfS )(面積

Page 22: 確率と統計

標準化の公式

x

z

N(μ,σ2) N(0,1)P.22東京工科大学 確率と統計 2011

Page 23: 確率と統計

標準化の公式

x

z

N(0,1)N(μ,σ2)

平均ゼロ、分散1

(標準正規分布)

平均 μ 、分散 σ2

(正規分布)

P.23東京工科大学 確率と統計 2011

Page 24: 確率と統計

標準化の公式

x

z

N(0,1)N(μ,σ2)

平均ゼロ、分散1

(標準正規分布)

平均 μ 、分散 σ2

(正規分布)

P.24東京工科大学 確率と統計 2011

これについての情報が標準正規分布表として与えられている。

Page 25: 確率と統計

練習問題• 正しく作られたコインを 100 回投げ

るとき、表が 40 回から 60 回出る確率を求めよ。

P.25東京工科大学 確率と統計 2011

Page 26: 確率と統計

• ヒント:– コイン投げの繰り返しは2項分布 B(n,p) と

なるので、定義に従って計算しても良い。– 繰り返しの回数が多い場合は、平均が np 、

分散が npq の正規分布 N(np,npq) で近似できる。

– この事実を使うと比較的楽に確率が計算できる。

P.26東京工科大学 確率と統計 2011

Page 27: 確率と統計

• 答え:– μ= np = (100)×(1/2) = 50– σ2= npq = (100)×(1/2)×(1-1/2) = 25 = 52

– Z=(X-μ)/σ = (X – 50) / 5 とすると– Z1=(40-50)/5 = -2

– Z2=(60-50)/5 = +2

– 標準正規分布曲線の -2 ~ +2 の部分の面積が求める確率。

– 標準正規分布表 ( 教科書 p.295) より約 0.95 (= 0.4772×2)

P.27東京工科大学 確率と統計 2011

Page 28: 確率と統計

以上のことを別の言い方で表すと..

東京工科大学 確率と統計 2011 P.28

dxedze

dxe

C

XP

P

xzm

m

mx

k

kk

k

22

2

2

2

2

60

40

2

)(60

40

60

40

100

100

2

1

2

1

2

1

2

1

2

1

)6040(

)6040100(

回以下出る回以上回中表が確率

Page 29: 確率と統計

図で表すと...• (黒板で説明します)

東京工科大学 確率と統計 2011 P.29

Page 30: 確率と統計

確認問題• 正しく作られたコインを 400 回投げ

るとき、表が 150 回以上 230 回以下出る確率を求めよ。

東京工科大学 確率と統計 2011 P.30

Page 31: 確率と統計

発展問題• 両側検定と片側検定について

以下の問に答えよ。(1)両側検定とは何か。(2)片側検定とは何か。(3)コインを何回か投げた結果に基づいて、コインが正しく作られているかを調べたい。このときは、両側検定を使うべきか、片側検定を使うべきか。

P.31東京工科大学 確率と統計 2011

Page 32: 確率と統計

• 問題のヒント:教科書の p.163~ 167 をよく読むこと。両側検定、片側検定の区別、使い分けは重要なので、何かの機会に一度調べておくことを勧める。

P.32東京工科大学 確率と統計 2011

Page 33: 確率と統計

正規分布の話は今日はここまで

東京工科大学 確率と統計 2011 P.33

Page 34: 確率と統計

今日の挑戦問題• ある人種では4つの血液型が知られてお

り、各血液型を持つ人の割合は    0.16, 0.48, 0.20, 0.16であるという。一方、他の人種の人についても同様の調査をしたところ、それぞれの血液型を持つ人は   180, 360, 130, 100  人

だった。これら人種間で血液型の人数比は同じだろうか?

P.34東京工科大学 確率と統計 2011

Page 35: 確率と統計

挑戦問題問題のヒント• カイ2乗検定を利用する。• 教科書第 10章を参照のこと。• 教科書 p.229 の問題2と同じ。• 自由度の求め方を覚えると良い。• カイ2乗分布の表は教科書 p.298 。• (カイ2乗検定は利用価値が高いです

ので、是非覚えて使ってください。)

P.35東京工科大学 確率と統計 2011

Page 36: 確率と統計

練習問題• ある図書館での本の貸し出しを調べたら以下の

ようになった。「曜日により貸し出し冊数は変わらない」かどうか検定せよ。なお、有意水準を5%とせよ。

月曜 火曜 水曜 木曜 金曜貸し出し冊数

135

108

120

114 146

36東京工科大学 確率と統計 2011

Page 37: 確率と統計

練習問題のヒント

月曜 火曜 水曜 木曜 金曜 合計

観測値 135

108

120

114

146 T

理論値 T / 5 T / 5 T / 5 T/ 5 T / 5

T=135 + 108 + 120 + 114 + 146=623

37東京工科大学 確率と統計 2011

Page 38: 確率と統計

その他• カイ2乗検定の1つに、分割表 ( 教科書

p.225) があります。便利なのでマスターしてください。授業でもやりましたよね!

• カイ2乗検定は、分散分析の特殊な場合となっています。分散分析はさらに強力な手法ですので、是非勉強しましょう。

• 統計は慣れることが大切です。継続的に勉強してください。理論よりまず実践です。

P.38東京工科大学 確率と統計 2011

Page 39: 確率と統計

最後に• 統計を知っている人と知らない人とで

は、今後大きな差になってきます。統計をすべて勉強することは無理です。自分に関係のある分野で、必要なものから順次慣れていってください。

練習あるのみ次回4つ目のレポート課題を提示する予定です。

P.39東京工科大学 確率と統計 2011