16
[email protected] 物理実験学 ~測定誤差と最小二乗法~ 伊藤さんの代理:奥村曉(CR 研講師) 2019 年 12 月 13 日

物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

[email protected]

物理実験学 ~測定誤差と最小二乗法~

伊藤さんの代理:奥村曉(CR 研講師)

2019 年 12 月 13 日

Page 2: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

講義のスライド

https://www.isee.nagoya-u.ac.jp/~okumura/files/191213LeastSquare.pdf

2

Page 3: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

これまでに出てきた統計用語の復習 (1)

母集団:測定対象の数値や属性の集合全体例:鍋に入った味噌汁、日本人全体、超新星爆発から放出された全てのニュートリノ

標本:実際に測定した値の集合(母集団の部分集合)例:小さじ一杯の味見の味噌汁、無作為抽出の電話アンケート、カミオカンデで検出されたニュートリノ

母平均:母集団の平均 µ(真の平均)

標本平均:標本の平均 x̅(母平均の良い推定値)

3

x̄ =1n

n

∑i=1

xi =x1 + x2 + ⋯ + xn

n

Page 4: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

これまでに出てきた統計用語の復習 (2)

分散:値のばらつきの大きさの指標

母分散:母集団の分散 σ2

標本分散:標本の分散 s2

標準偏差:母分散や標本分散の平方根 σ もしくは s      次元が測定量と同じになる

4

σ2 =1n

n

∑i=1

(xi − μ)2※ n は有限とは限らない

s2 =1

n − 1

n

∑i=1

(xi − x̄)2 ※ 母平均を知らない場合 x̅ を使い  n - 1 で割る

Page 5: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

サイコロの例

サイコロの目は 1~6 の整数値しかとらないので母平均は

母分散は

標準偏差は

5

μ =16

6

∑i=1

i =72

σ2 =16

6

∑i=1

(i −72 )

2

=3512

σ =3512

≃ 1.7

Page 6: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

x10− 8− 6− 4− 2− 0 2 4 6 8 10

)x(f

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

= 1.0σ = 0.0, µ

= 3.0σ = 0.0, µ

= 0.5σ = 1.0, µ

= 2.0σ = -2.0, µ

正規分布 (ガウス分布)

統計学や自然界の様々な場所で現れる確率分布 平均値 µ と標準偏差 σ の 2 変数で特徴付けられる

6

P(x) =1

2πσexp (−

(x − μ)2

2σ2 )

∫∞

−∞P(x) = 1

興味のある人は実際に積分してみよ

Page 7: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

正規分布

±1σの範囲に 68.3% が収まる 2σ、3σの範囲だとそれぞれ 95.4%、99.7% 5σ (素粒子物理学などで発見とされる) は 5.7 × 10-7 (サイコロで 1 が 8 回連続)

7

https://ja.wikipedia.org/wiki/標準偏差

Page 8: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

Higgs 発見の例

8

©CERN/ATLAS

Page 9: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

k0 10 20 30 40 50

Prob

abili

ty

0

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

= 1)λPoisson ( ) 1 = s = 1, µGaussian ( = 3)λPoisson ( ) 3 = s = 3, µGaussian ( = 10)λPoisson ( )10 = s = 10, µGaussian ( = 20)λPoisson ( )20 = s = 20, µGaussian ( = 30)λPoisson ( )30 = s = 30, µGaussian (

ポアソン分布と正規分布

ポアソン分布や二項分布(先日の赤玉と白玉の例)は、数が増えると正規分布で近似できることが知られている

9

Page 10: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

大数の法則

繰り返し行うことが可能で、かつ各試行が互いに影響を及ぼさない測定があるとき、その測定を多数回繰り返した際に得られる測定値の平均は、その測定の期待値に近づく 単純な例:サイコロを何回も振ると、平均値は 3.5 に近づく

10

Page 11: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

中心極限定理

(分散の定義できる) どのような確率分布の母集団 (平均 µ、分散σ) でも、標本サイズ n が十分大きくなると、得られる標本平均 x̅ は平均 µ、分散 σ2/n のガウス分布に従う

つまり ‣ 多数回の測定で平均値 x̅ を算出すると、真の平均値 µ に近づく

‣ 平均値 x̅ の真の平均値 µ からのズレは、σ/√n 程度である

‣ 測定回数が多いほど誤差は小さくなる

11

Page 12: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

h0Entries 10000Mean 3.504Std Dev 1.699

Sample Mean0 1 2 3 4 5 6

Entri

es

0

200

400

600

800

1000

1200

1400

1600

1800

h0Entries 10000Mean 3.504Std Dev 1.699

= 1nh1

Entries 10000Mean 3.492Std Dev 0.5465

Sample Mean1.5 2 2.5 3 3.5 4 4.5 5

Entri

es

0

100

200

300

400

500

600

700

800

h1Entries 10000Mean 3.492Std Dev 0.5465

= 10nh2

Entries 10000Mean 3.5Std Dev 0.1699

Sample Mean2.8 3 3.2 3.4 3.6 3.8 4 4.2

Entri

es

0

100

200

300

400

500

h2Entries 10000Mean 3.5Std Dev 0.1699

= 100n

h3Entries 10000

Mean 3.5Std Dev 0.05414

Sample Mean3.3 3.35 3.4 3.45 3.5 3.55 3.6 3.65

Entri

es

0

50

100

150

200

250

300

350

400

h3Entries 10000

Mean 3.5Std Dev 0.05414

= 1000nh4

Entries 10000

Mean 3.5Std Dev 0.01692

Sample Mean3.42 3.44 3.46 3.48 3.5 3.52 3.54 3.56

Entri

es

0

100

200

300

400

500

h4Entries 10000

Mean 3.5Std Dev 0.01692

= 10000nh5

Entries 10000

Mean 3.5Std Dev 0.005416

Sample Mean3.48 3.485 3.49 3.495 3.5 3.505 3.51 3.515

Entri

es

0

50

100

150

200

250

300

350

400

h5Entries 10000

Mean 3.5Std Dev 0.005416

= 100000n

再びサイコロの例 (n 回の平均値の 10000 回の分布)

12

σ~ 1.7n = 1 n = 10 n = 100

n = 100000n = 10000n = 1000

σ~ 0.17

Page 13: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

測定値の誤差

我々は、多くの場合に「真の値」を知らない

物理量の測定は、様々なランダムな確率過程を経る場合が多い

測定値の誤差が正規分布になる・近似できる場合が頻繁に現れる ‣ 多数の電子の流れである電流値の測定

‣ 放射線の検出回数 (少数の場合はポアソン分布)

‣ 光電子増倍管で検出した光子の個数

13

x

y

x

y

測定値 yi (xi) に対して ±1σ の誤差棒をつける (場合が多い)

得られた測定点と誤差 から、データに最も適 合する理論曲線を決め ることがある

ガンマ線の回

Page 14: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

最尤法 (Maximum Likelihood)さいゆうほう

最も「尤もらしい」理論曲線を決定するやり方

簡単のため、測定点 yi(xi) の誤差が正規分布 (µi、σi) に従うとする (一般的には好きな確率密度分布)

14

x

y

L =n

∏i=1

1

2πσ2i

exp (−(yi − f(xi))2

2σ2i )

ある理論曲線 f(x) を考えた場合、各 xi に対して得られる測定値 yi の組み合わせは、xi における確率密度の積が大きいほど出やすいはずである

尤度 L を最大にする理論曲線が最も尤もらしい (一般的に手計算は困難)

Page 15: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

尤度 L を最大にする

L を最大にする → ln L を最大にすれば良い

15

ln L = lnn

∏i=1

1

2πσ2i

exp (−(yi − f(xi))2

2σ2i )

=n

∑i=1

ln1

2πσ2i

−(yi − f(xi))2

2σ2i

= −n

∑i=1

(yi − f(xi))2

2σ2i

+ const .

この項 (χ2/2) を最小化すれば良いχ2 ≡

n

∑i=1

(yi − f(xi))2

σ2i

残差二乗和

Page 16: 物理実験学 ~測定誤差と最小二乗法~okumura/files/191213...h0 Entries 10000 Mean 3.504 Std Dev 1.699 Sample Mean 0 1 2 3 4 5 6 Entries 0 200 400 600 800 1000 1200 1400

最小二乗法

さらに単純な場合を考える ‣ xi の誤差は無視する

‣ 誤差の大きさが各点で等しく、その真の値は不明

‣ 理論曲線が f(x) = a + bx で表される したがってを満たさなくてはいけない (χ2 の最小値を探す)

16

ln L = −n

∑i=1

(yi − a − bxi)2

2σ2+ const .

= − χ2/2 + const .

∂χ2

∂a= 0

∂χ2

∂b= 0

ここから板書…