150
A. Asano, Kansai Univ. 2014年度春学期 統計学 浅野 晃 関西大学総合情報学部 分布をまとめる平均・分散 第5回

2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

Embed Size (px)

DESCRIPTION

関西大学総合情報学部 「統計学」(担当:浅野晃)

Citation preview

Page 1: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

2014年度春学期 統計学

浅野 晃 関西大学総合情報学部

分布をまとめる̶平均・分散

第5回

Page 2: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

Page 3: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

5月12日は

Page 4: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

国際看護師の日・看護の日フローレンス・ナイチンゲールの

誕生日

Page 5: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

Page 6: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

代表値

Page 7: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

代表値とは統計学が相手にするのは,「分布」しているデータ

Page 8: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

代表値とは統計学が相手にするのは,「分布」しているデータ

データをこんなふうに読めればいいけれど…

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

(写真は著作権の制約により削除)大般若会

Page 9: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

代表値とはこんなことはできないので,

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

(写真は著作権の制約により削除)大般若会

Page 10: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

代表値とはこんなことはできないので,

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

•図示する(ヒストグラム)

(写真は著作権の制約により削除)大般若会

Page 11: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

代表値とはこんなことはできないので,

•ひとつの数にまとめる

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

•図示する(ヒストグラム)

(写真は著作権の制約により削除)大般若会

Page 12: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

代表値とはこんなことはできないので,

•ひとつの数にまとめる

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

[代表値]

•図示する(ヒストグラム)

(写真は著作権の制約により削除)大般若会

Page 13: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

代表値とはこんなことはできないので,

•ひとつの数にまとめる

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

[代表値]数字で表されていれば,計算ができる

•図示する(ヒストグラム)

(写真は著作権の制約により削除)大般若会

Page 14: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均

とくに[算術平均]は代表的な代表値

Page 15: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均

とくに[算術平均]は代表的な代表値

(算術)平均  =(データの合計)÷(データ数)

Page 16: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均

データ

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

総データ数

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

のとき

Page 17: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均

データ

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

総データ数

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

のとき

平均

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

Page 18: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均

データ

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

総データ数

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

のとき

平均

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

Page 19: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から平均を求める度数分布とは,これでした

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 20: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から平均を求める平均=(データの合計)/(データ数)   =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 21: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から平均を求める平均=(データの合計)/(データ数)   =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 22: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から平均を求める平均=(データの合計)/(データ数)   =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 23: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から平均を求める平均=(データの合計)/(データ数)   =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 24: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から平均を求める平均=(データの合計)/(データ数)   =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 25: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から平均を求める平均=(データの合計)/(データ数)   =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 26: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

Page 27: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

分散と標準偏差

Page 28: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「ばらつき」を数字で

分布は,大小ばらばらなデータの集まり

どのくらいばらばらかを,数字で表そう

Page 29: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「ばらつき」を数字で

分布は,大小ばらばらなデータの集まり

どのくらいばらばらかを,数字で表そう

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

Page 30: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「ばらつき」を数字で

分布は,大小ばらばらなデータの集まり

どのくらいばらばらかを,数字で表そう

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

どう違う?

Page 31: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「ばらつき」を数字で

分布は,大小ばらばらなデータの集まり

どのくらいばらばらかを,数字で表そう

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

どう違う?

平均はどれも5

Page 32: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

レンジとばらつき

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

Page 33: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

レンジとばらつき

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

Page 34: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

レンジとばらつき

Cは,最大と最小の差[レンジ]が違う

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

Page 35: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

レンジとばらつき

Cは,最大と最小の差[レンジ]が違う

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページA, Bはレンジは同じだが,

Page 36: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

レンジとばらつき

Cは,最大と最小の差[レンジ]が違う

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページA, Bはレンジは同じだが,Bのほうがばらついているように見える

Page 37: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

レンジとばらつき

Cは,最大と最小の差[レンジ]が違う

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページA, Bはレンジは同じだが,Bのほうがばらついているように見える

Page 38: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

レンジとばらつき

Cは,最大と最小の差[レンジ]が違う

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページA, Bはレンジは同じだが,Bのほうがばらついているように見える

Page 39: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

Page 40: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0

Page 41: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

00

Page 42: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 00

Page 43: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 0 00

Page 44: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +20 00

Page 45: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +20 00-2

Page 46: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +20 00-2 +2

Page 47: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2-2 0 00-2 +2

Page 48: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2 0 00-2 +2

Page 49: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5 0 00-2 +2

Page 50: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0

0 00-2 +2

Page 51: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0

0 00-2 +2

0

Page 52: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0

0 00-2 +2

0 +2

Page 53: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0

0 00-2 +2

0-2 +2

Page 54: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0

0 00-2 +2

0-2 +2+3

Page 55: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0

0 00-2 +2

0-3 -2 +2+3

Page 56: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0

0 00-2 +2

0-3 -2 +2+3+4

Page 57: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0-4

0 00-2 +2

0-3 -2 +2+3+4

Page 58: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-4

0 00-2 +2

0-3 -2 +2+3+4

Page 59: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

Page 60: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差

偏差を平均したら,AとBのばらつきの違いが表せる?

各データと平均との差を[偏差]という

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

Page 61: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差の平均?

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

Page 62: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差の平均?だめ。平均したらゼロ

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

Page 63: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差を2乗する偏差を2乗したら,全部正の数になるから,それから平均する

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

Page 64: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差を2乗する偏差を2乗したら,全部正の数になるから,それから平均する

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

25 4 4 0 0 0 0 4 4 25

Page 65: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

偏差を2乗する偏差を2乗したら,全部正の数になるから,それから平均する

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

25 4 4 0 0 0 0 4 4 25

25 16 9 4 0 0 4 9 16 25

Page 66: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

25 4 4 0 0 0 0 4 4 25

25 16 9 4 0 0 4 9 16 25

Page 67: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

25 4 4 0 0 0 0 4 4 25

25 16 9 4 0 0 4 9 16 25

平均 6.6

Page 68: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

25 4 4 0 0 0 0 4 4 25

25 16 9 4 0 0 4 9 16 25

平均 6.6

平均 10.8

Page 69: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散

2013年度秋学期 統計学 第5回分布をまとめる - 記述統計量(平均・分散など)

代表値

度数分布のヒストグラムによる表現は,視覚的にはよくわかる表現です。しかし,度数分布から取り出される情報を今後の処理に用いたり,比較したりするには,分布を1つの数字で表現する必要があります。これを,代表値といいます。ここでは,もっともよく使われる代表値である算術平均と,分布を表現するもうひとつの重要な指標である分散,さらに分散を発展させた「モーメント」の考えについて説明します。

算術平均

データを x1, x2, . . . , xn,総データ数を nとするとき,算術平均 (arithmetic mean, 相加平均ともいう) は次の式で定義されます。

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n!

i=1

xi (1)

つまり,算術平均 =(データの合計)/(データ数)です。ふつう,単に「平均」といえば算術平均のことをさします。

度数分布から算術平均を求める

データの度数分布がわかっているときに,その平均を求めるにはどうすればよいでしょうか? 平均とはデータの合計をデータの個数で割ったものです。一方,ある階級の度数は「その階級値をとるデータが,何個あるか」を表しています。そこで,

平均=(データの合計)/(データ数)  =([階級値×度数]の合計)/(データ数)  =[階級値×(度数/データ数)]の合計  =[階級値×相対度数]の合計ですから,「平均 =[階級値×相対度数]の合計」ということになります。

分散と標準偏差

分布をもっとも簡単に1つの数字で表したのが代表値ですが,代表値だけでは,その分布が「どのくらいばらついているか」は表現できません。その例を見てみましょう。つぎのようなデータの組 A, B,

C があるとします。

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  1/7 ページ

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2+3+4

25 4 4 0 0 0 0 4 4 25

25 16 9 4 0 0 4 9 16 25

平均 6.6

平均 10.8

[分散]=(偏差)2の平均

Page 70: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散と標準偏差[分散]=(偏差)2の平均 式で書くと

Page 71: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散と標準偏差[分散]=(偏差)2の平均 式で書くと

これらの平均はいずれも 5 で,平均値ではこれらの分布を区別して表現することはできません。これらの分布の違いは,ばらつきにあります。

AとBは分布の幅(レンジ)は違いませんが,分布の平均値への集まり具合がちがいます。レンジは分布の両端の値しか使っていないので分布の平均値への集まり具合を表現することはできませんが,次に述べる分散や標準偏差は,分布内のすべてのデータを使うので,集まり具合を表現できます。 各データと平均との差を偏差といい,各データが平均からどのくらい離れているかを表します。「偏差の平均」を求めれば,このデータ組の「データの平均からの散らばり具合」がわかりそうですが,平均値はデータ組のちょうど真ん中の値ですから,「偏差の平均」は0になってしまいます。

そこで,「偏差の平均」のかわりに「(偏差)2の平均」を用います。(偏差)2はすべて正ですから,「(偏差)2の平均」,すなわち「各データについての偏差の2乗の合計を総データ数で割ったもの」でばらつきの程度を表現できます。これが分散 (variance)です。式で書くと,各データを x1, x2, . . . , xn,総データ数を n,平均を x̄とするとき,分散 !2はつぎのようになります。

!2 =1

n

!(x1 ! x̄)2 + (x2 ! x̄)2 + · · ·+ (xn ! x̄)2

"

=1

n

n#

i=1

(xi ! x̄)2(2)

また,分散の平方根を標準偏差 (standard deviation, SD)といいます。データの単位がm(メートル)のとき,分散の単位はm2,すなわち平方メートルになってしまいますが,標準偏差の単位は同じm です。

分散を求めるとき,なぜ偏差の絶対値をとらずに偏差を2乗するのか?

確かに,偏差の絶対値を使って計算しても,「偏差を全部正の値にしてから平均する」という目的は達せられます。しかし,絶対値の計算は2乗よりも簡単そうですが,実はそうではありません。2乗の計算は,どんな数に対しても同じ手続きでできますが,絶対値の計算は,正の数と負の数とで別の手続きが必要です。みなさんも,高校の数学の時間に,「y = 2x+3のグラフを描け」といった問題で,ややこしい場合分けをやった記憶があると思います。こういう事情で,偏差の絶対値の平均は用いられず,偏差の2乗の平均である分散が用いられているのです。さらに,2乗を考えると,これを3乗,4乗,…に発展させることができます。これについては,すぐあとで説明します。

度数分布から分散を求める

上で,度数分布から平均を求める方法として「平均 =[階級値×相対度数]の合計」となることを示しました。分散は「(偏差)2 の平均」ですから,上の計算を利用すると,「分散=[(偏差)2" 相対度数]の合計」すなわち「分散=[(階級値 ! 平均)2" 相対度数]の合計」という計算で求められます。

モーメント

度数分布において,分布しているデータを変数X で代表し1,ある階級の階級値を xで表します。また,階級値が xである階級の相対度数を,f(x)で表すことにします。このとき,平均をE(X) で表すこ

1つまり,分布そのものをひとつの変数X であらわしていることになります。この考え方は,次回の講義で「確率変数」を説明するときに,もう一度出てきます。

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  2/7 ページ

Page 72: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散と標準偏差[分散]=(偏差)2の平均 式で書くと

これらの平均はいずれも 5 で,平均値ではこれらの分布を区別して表現することはできません。これらの分布の違いは,ばらつきにあります。

AとBは分布の幅(レンジ)は違いませんが,分布の平均値への集まり具合がちがいます。レンジは分布の両端の値しか使っていないので分布の平均値への集まり具合を表現することはできませんが,次に述べる分散や標準偏差は,分布内のすべてのデータを使うので,集まり具合を表現できます。 各データと平均との差を偏差といい,各データが平均からどのくらい離れているかを表します。「偏差の平均」を求めれば,このデータ組の「データの平均からの散らばり具合」がわかりそうですが,平均値はデータ組のちょうど真ん中の値ですから,「偏差の平均」は0になってしまいます。

そこで,「偏差の平均」のかわりに「(偏差)2の平均」を用います。(偏差)2はすべて正ですから,「(偏差)2の平均」,すなわち「各データについての偏差の2乗の合計を総データ数で割ったもの」でばらつきの程度を表現できます。これが分散 (variance)です。式で書くと,各データを x1, x2, . . . , xn,総データ数を n,平均を x̄とするとき,分散 !2はつぎのようになります。

!2 =1

n

!(x1 ! x̄)2 + (x2 ! x̄)2 + · · ·+ (xn ! x̄)2

"

=1

n

n#

i=1

(xi ! x̄)2(2)

また,分散の平方根を標準偏差 (standard deviation, SD)といいます。データの単位がm(メートル)のとき,分散の単位はm2,すなわち平方メートルになってしまいますが,標準偏差の単位は同じm です。

分散を求めるとき,なぜ偏差の絶対値をとらずに偏差を2乗するのか?

確かに,偏差の絶対値を使って計算しても,「偏差を全部正の値にしてから平均する」という目的は達せられます。しかし,絶対値の計算は2乗よりも簡単そうですが,実はそうではありません。2乗の計算は,どんな数に対しても同じ手続きでできますが,絶対値の計算は,正の数と負の数とで別の手続きが必要です。みなさんも,高校の数学の時間に,「y = 2x+3のグラフを描け」といった問題で,ややこしい場合分けをやった記憶があると思います。こういう事情で,偏差の絶対値の平均は用いられず,偏差の2乗の平均である分散が用いられているのです。さらに,2乗を考えると,これを3乗,4乗,…に発展させることができます。これについては,すぐあとで説明します。

度数分布から分散を求める

上で,度数分布から平均を求める方法として「平均 =[階級値×相対度数]の合計」となることを示しました。分散は「(偏差)2 の平均」ですから,上の計算を利用すると,「分散=[(偏差)2" 相対度数]の合計」すなわち「分散=[(階級値 ! 平均)2" 相対度数]の合計」という計算で求められます。

モーメント

度数分布において,分布しているデータを変数X で代表し1,ある階級の階級値を xで表します。また,階級値が xである階級の相対度数を,f(x)で表すことにします。このとき,平均をE(X) で表すこ

1つまり,分布そのものをひとつの変数X であらわしていることになります。この考え方は,次回の講義で「確率変数」を説明するときに,もう一度出てきます。

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  2/7 ページ

Page 73: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散と標準偏差[分散]=(偏差)2の平均 式で書くと

これらの平均はいずれも 5 で,平均値ではこれらの分布を区別して表現することはできません。これらの分布の違いは,ばらつきにあります。

AとBは分布の幅(レンジ)は違いませんが,分布の平均値への集まり具合がちがいます。レンジは分布の両端の値しか使っていないので分布の平均値への集まり具合を表現することはできませんが,次に述べる分散や標準偏差は,分布内のすべてのデータを使うので,集まり具合を表現できます。 各データと平均との差を偏差といい,各データが平均からどのくらい離れているかを表します。「偏差の平均」を求めれば,このデータ組の「データの平均からの散らばり具合」がわかりそうですが,平均値はデータ組のちょうど真ん中の値ですから,「偏差の平均」は0になってしまいます。

そこで,「偏差の平均」のかわりに「(偏差)2の平均」を用います。(偏差)2はすべて正ですから,「(偏差)2の平均」,すなわち「各データについての偏差の2乗の合計を総データ数で割ったもの」でばらつきの程度を表現できます。これが分散 (variance)です。式で書くと,各データを x1, x2, . . . , xn,総データ数を n,平均を x̄とするとき,分散 !2はつぎのようになります。

!2 =1

n

!(x1 ! x̄)2 + (x2 ! x̄)2 + · · ·+ (xn ! x̄)2

"

=1

n

n#

i=1

(xi ! x̄)2(2)

また,分散の平方根を標準偏差 (standard deviation, SD)といいます。データの単位がm(メートル)のとき,分散の単位はm2,すなわち平方メートルになってしまいますが,標準偏差の単位は同じm です。

分散を求めるとき,なぜ偏差の絶対値をとらずに偏差を2乗するのか?

確かに,偏差の絶対値を使って計算しても,「偏差を全部正の値にしてから平均する」という目的は達せられます。しかし,絶対値の計算は2乗よりも簡単そうですが,実はそうではありません。2乗の計算は,どんな数に対しても同じ手続きでできますが,絶対値の計算は,正の数と負の数とで別の手続きが必要です。みなさんも,高校の数学の時間に,「y = 2x+3のグラフを描け」といった問題で,ややこしい場合分けをやった記憶があると思います。こういう事情で,偏差の絶対値の平均は用いられず,偏差の2乗の平均である分散が用いられているのです。さらに,2乗を考えると,これを3乗,4乗,…に発展させることができます。これについては,すぐあとで説明します。

度数分布から分散を求める

上で,度数分布から平均を求める方法として「平均 =[階級値×相対度数]の合計」となることを示しました。分散は「(偏差)2 の平均」ですから,上の計算を利用すると,「分散=[(偏差)2" 相対度数]の合計」すなわち「分散=[(階級値 ! 平均)2" 相対度数]の合計」という計算で求められます。

モーメント

度数分布において,分布しているデータを変数X で代表し1,ある階級の階級値を xで表します。また,階級値が xである階級の相対度数を,f(x)で表すことにします。このとき,平均をE(X) で表すこ

1つまり,分布そのものをひとつの変数X であらわしていることになります。この考え方は,次回の講義で「確率変数」を説明するときに,もう一度出てきます。

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  2/7 ページ

1番のデータ

Page 74: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散と標準偏差[分散]=(偏差)2の平均 式で書くと

これらの平均はいずれも 5 で,平均値ではこれらの分布を区別して表現することはできません。これらの分布の違いは,ばらつきにあります。

AとBは分布の幅(レンジ)は違いませんが,分布の平均値への集まり具合がちがいます。レンジは分布の両端の値しか使っていないので分布の平均値への集まり具合を表現することはできませんが,次に述べる分散や標準偏差は,分布内のすべてのデータを使うので,集まり具合を表現できます。 各データと平均との差を偏差といい,各データが平均からどのくらい離れているかを表します。「偏差の平均」を求めれば,このデータ組の「データの平均からの散らばり具合」がわかりそうですが,平均値はデータ組のちょうど真ん中の値ですから,「偏差の平均」は0になってしまいます。

そこで,「偏差の平均」のかわりに「(偏差)2の平均」を用います。(偏差)2はすべて正ですから,「(偏差)2の平均」,すなわち「各データについての偏差の2乗の合計を総データ数で割ったもの」でばらつきの程度を表現できます。これが分散 (variance)です。式で書くと,各データを x1, x2, . . . , xn,総データ数を n,平均を x̄とするとき,分散 !2はつぎのようになります。

!2 =1

n

!(x1 ! x̄)2 + (x2 ! x̄)2 + · · ·+ (xn ! x̄)2

"

=1

n

n#

i=1

(xi ! x̄)2(2)

また,分散の平方根を標準偏差 (standard deviation, SD)といいます。データの単位がm(メートル)のとき,分散の単位はm2,すなわち平方メートルになってしまいますが,標準偏差の単位は同じm です。

分散を求めるとき,なぜ偏差の絶対値をとらずに偏差を2乗するのか?

確かに,偏差の絶対値を使って計算しても,「偏差を全部正の値にしてから平均する」という目的は達せられます。しかし,絶対値の計算は2乗よりも簡単そうですが,実はそうではありません。2乗の計算は,どんな数に対しても同じ手続きでできますが,絶対値の計算は,正の数と負の数とで別の手続きが必要です。みなさんも,高校の数学の時間に,「y = 2x+3のグラフを描け」といった問題で,ややこしい場合分けをやった記憶があると思います。こういう事情で,偏差の絶対値の平均は用いられず,偏差の2乗の平均である分散が用いられているのです。さらに,2乗を考えると,これを3乗,4乗,…に発展させることができます。これについては,すぐあとで説明します。

度数分布から分散を求める

上で,度数分布から平均を求める方法として「平均 =[階級値×相対度数]の合計」となることを示しました。分散は「(偏差)2 の平均」ですから,上の計算を利用すると,「分散=[(偏差)2" 相対度数]の合計」すなわち「分散=[(階級値 ! 平均)2" 相対度数]の合計」という計算で求められます。

モーメント

度数分布において,分布しているデータを変数X で代表し1,ある階級の階級値を xで表します。また,階級値が xである階級の相対度数を,f(x)で表すことにします。このとき,平均をE(X) で表すこ

1つまり,分布そのものをひとつの変数X であらわしていることになります。この考え方は,次回の講義で「確率変数」を説明するときに,もう一度出てきます。

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  2/7 ページ

1番のデータ

Page 75: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散と標準偏差[分散]=(偏差)2の平均 式で書くと

これらの平均はいずれも 5 で,平均値ではこれらの分布を区別して表現することはできません。これらの分布の違いは,ばらつきにあります。

AとBは分布の幅(レンジ)は違いませんが,分布の平均値への集まり具合がちがいます。レンジは分布の両端の値しか使っていないので分布の平均値への集まり具合を表現することはできませんが,次に述べる分散や標準偏差は,分布内のすべてのデータを使うので,集まり具合を表現できます。 各データと平均との差を偏差といい,各データが平均からどのくらい離れているかを表します。「偏差の平均」を求めれば,このデータ組の「データの平均からの散らばり具合」がわかりそうですが,平均値はデータ組のちょうど真ん中の値ですから,「偏差の平均」は0になってしまいます。

そこで,「偏差の平均」のかわりに「(偏差)2の平均」を用います。(偏差)2はすべて正ですから,「(偏差)2の平均」,すなわち「各データについての偏差の2乗の合計を総データ数で割ったもの」でばらつきの程度を表現できます。これが分散 (variance)です。式で書くと,各データを x1, x2, . . . , xn,総データ数を n,平均を x̄とするとき,分散 !2はつぎのようになります。

!2 =1

n

!(x1 ! x̄)2 + (x2 ! x̄)2 + · · ·+ (xn ! x̄)2

"

=1

n

n#

i=1

(xi ! x̄)2(2)

また,分散の平方根を標準偏差 (standard deviation, SD)といいます。データの単位がm(メートル)のとき,分散の単位はm2,すなわち平方メートルになってしまいますが,標準偏差の単位は同じm です。

分散を求めるとき,なぜ偏差の絶対値をとらずに偏差を2乗するのか?

確かに,偏差の絶対値を使って計算しても,「偏差を全部正の値にしてから平均する」という目的は達せられます。しかし,絶対値の計算は2乗よりも簡単そうですが,実はそうではありません。2乗の計算は,どんな数に対しても同じ手続きでできますが,絶対値の計算は,正の数と負の数とで別の手続きが必要です。みなさんも,高校の数学の時間に,「y = 2x+3のグラフを描け」といった問題で,ややこしい場合分けをやった記憶があると思います。こういう事情で,偏差の絶対値の平均は用いられず,偏差の2乗の平均である分散が用いられているのです。さらに,2乗を考えると,これを3乗,4乗,…に発展させることができます。これについては,すぐあとで説明します。

度数分布から分散を求める

上で,度数分布から平均を求める方法として「平均 =[階級値×相対度数]の合計」となることを示しました。分散は「(偏差)2 の平均」ですから,上の計算を利用すると,「分散=[(偏差)2" 相対度数]の合計」すなわち「分散=[(階級値 ! 平均)2" 相対度数]の合計」という計算で求められます。

モーメント

度数分布において,分布しているデータを変数X で代表し1,ある階級の階級値を xで表します。また,階級値が xである階級の相対度数を,f(x)で表すことにします。このとき,平均をE(X) で表すこ

1つまり,分布そのものをひとつの変数X であらわしていることになります。この考え方は,次回の講義で「確率変数」を説明するときに,もう一度出てきます。

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  2/7 ページ

1番のデータ データの平均

Page 76: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散と標準偏差[分散]=(偏差)2の平均 式で書くと

これらの平均はいずれも 5 で,平均値ではこれらの分布を区別して表現することはできません。これらの分布の違いは,ばらつきにあります。

AとBは分布の幅(レンジ)は違いませんが,分布の平均値への集まり具合がちがいます。レンジは分布の両端の値しか使っていないので分布の平均値への集まり具合を表現することはできませんが,次に述べる分散や標準偏差は,分布内のすべてのデータを使うので,集まり具合を表現できます。 各データと平均との差を偏差といい,各データが平均からどのくらい離れているかを表します。「偏差の平均」を求めれば,このデータ組の「データの平均からの散らばり具合」がわかりそうですが,平均値はデータ組のちょうど真ん中の値ですから,「偏差の平均」は0になってしまいます。

そこで,「偏差の平均」のかわりに「(偏差)2の平均」を用います。(偏差)2はすべて正ですから,「(偏差)2の平均」,すなわち「各データについての偏差の2乗の合計を総データ数で割ったもの」でばらつきの程度を表現できます。これが分散 (variance)です。式で書くと,各データを x1, x2, . . . , xn,総データ数を n,平均を x̄とするとき,分散 !2はつぎのようになります。

!2 =1

n

!(x1 ! x̄)2 + (x2 ! x̄)2 + · · ·+ (xn ! x̄)2

"

=1

n

n#

i=1

(xi ! x̄)2(2)

また,分散の平方根を標準偏差 (standard deviation, SD)といいます。データの単位がm(メートル)のとき,分散の単位はm2,すなわち平方メートルになってしまいますが,標準偏差の単位は同じm です。

分散を求めるとき,なぜ偏差の絶対値をとらずに偏差を2乗するのか?

確かに,偏差の絶対値を使って計算しても,「偏差を全部正の値にしてから平均する」という目的は達せられます。しかし,絶対値の計算は2乗よりも簡単そうですが,実はそうではありません。2乗の計算は,どんな数に対しても同じ手続きでできますが,絶対値の計算は,正の数と負の数とで別の手続きが必要です。みなさんも,高校の数学の時間に,「y = 2x+3のグラフを描け」といった問題で,ややこしい場合分けをやった記憶があると思います。こういう事情で,偏差の絶対値の平均は用いられず,偏差の2乗の平均である分散が用いられているのです。さらに,2乗を考えると,これを3乗,4乗,…に発展させることができます。これについては,すぐあとで説明します。

度数分布から分散を求める

上で,度数分布から平均を求める方法として「平均 =[階級値×相対度数]の合計」となることを示しました。分散は「(偏差)2 の平均」ですから,上の計算を利用すると,「分散=[(偏差)2" 相対度数]の合計」すなわち「分散=[(階級値 ! 平均)2" 相対度数]の合計」という計算で求められます。

モーメント

度数分布において,分布しているデータを変数X で代表し1,ある階級の階級値を xで表します。また,階級値が xである階級の相対度数を,f(x)で表すことにします。このとき,平均をE(X) で表すこ

1つまり,分布そのものをひとつの変数X であらわしていることになります。この考え方は,次回の講義で「確率変数」を説明するときに,もう一度出てきます。

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  2/7 ページ

1番のデータ データの平均

n個たしてnで割る

Page 77: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散と標準偏差[分散]=(偏差)2の平均 式で書くと

これらの平均はいずれも 5 で,平均値ではこれらの分布を区別して表現することはできません。これらの分布の違いは,ばらつきにあります。

AとBは分布の幅(レンジ)は違いませんが,分布の平均値への集まり具合がちがいます。レンジは分布の両端の値しか使っていないので分布の平均値への集まり具合を表現することはできませんが,次に述べる分散や標準偏差は,分布内のすべてのデータを使うので,集まり具合を表現できます。 各データと平均との差を偏差といい,各データが平均からどのくらい離れているかを表します。「偏差の平均」を求めれば,このデータ組の「データの平均からの散らばり具合」がわかりそうですが,平均値はデータ組のちょうど真ん中の値ですから,「偏差の平均」は0になってしまいます。

そこで,「偏差の平均」のかわりに「(偏差)2の平均」を用います。(偏差)2はすべて正ですから,「(偏差)2の平均」,すなわち「各データについての偏差の2乗の合計を総データ数で割ったもの」でばらつきの程度を表現できます。これが分散 (variance)です。式で書くと,各データを x1, x2, . . . , xn,総データ数を n,平均を x̄とするとき,分散 !2はつぎのようになります。

!2 =1

n

!(x1 ! x̄)2 + (x2 ! x̄)2 + · · ·+ (xn ! x̄)2

"

=1

n

n#

i=1

(xi ! x̄)2(2)

また,分散の平方根を標準偏差 (standard deviation, SD)といいます。データの単位がm(メートル)のとき,分散の単位はm2,すなわち平方メートルになってしまいますが,標準偏差の単位は同じm です。

分散を求めるとき,なぜ偏差の絶対値をとらずに偏差を2乗するのか?

確かに,偏差の絶対値を使って計算しても,「偏差を全部正の値にしてから平均する」という目的は達せられます。しかし,絶対値の計算は2乗よりも簡単そうですが,実はそうではありません。2乗の計算は,どんな数に対しても同じ手続きでできますが,絶対値の計算は,正の数と負の数とで別の手続きが必要です。みなさんも,高校の数学の時間に,「y = 2x+3のグラフを描け」といった問題で,ややこしい場合分けをやった記憶があると思います。こういう事情で,偏差の絶対値の平均は用いられず,偏差の2乗の平均である分散が用いられているのです。さらに,2乗を考えると,これを3乗,4乗,…に発展させることができます。これについては,すぐあとで説明します。

度数分布から分散を求める

上で,度数分布から平均を求める方法として「平均 =[階級値×相対度数]の合計」となることを示しました。分散は「(偏差)2 の平均」ですから,上の計算を利用すると,「分散=[(偏差)2" 相対度数]の合計」すなわち「分散=[(階級値 ! 平均)2" 相対度数]の合計」という計算で求められます。

モーメント

度数分布において,分布しているデータを変数X で代表し1,ある階級の階級値を xで表します。また,階級値が xである階級の相対度数を,f(x)で表すことにします。このとき,平均をE(X) で表すこ

1つまり,分布そのものをひとつの変数X であらわしていることになります。この考え方は,次回の講義で「確率変数」を説明するときに,もう一度出てきます。

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  2/7 ページ

1番のデータ データの平均

n個たしてnで割る

分散の平方根を[標準偏差]という

Page 78: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から分散を求めるデータの平均=[階級値×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 79: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から分散を求めるデータの平均=[階級値×相対度数]の合計分散=(偏差)2の平均  = [(偏差)2×相対度数]の合計  = [(階級値-データの平均)2×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 80: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から分散を求めるデータの平均=[階級値×相対度数]の合計分散=(偏差)2の平均  = [(偏差)2×相対度数]の合計  = [(階級値-データの平均)2×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 81: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から分散を求めるデータの平均=[階級値×相対度数]の合計分散=(偏差)2の平均  = [(偏差)2×相対度数]の合計  = [(階級値-データの平均)2×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 82: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から分散を求めるデータの平均=[階級値×相対度数]の合計分散=(偏差)2の平均  = [(偏差)2×相対度数]の合計  = [(階級値-データの平均)2×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 83: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

度数分布から分散を求めるデータの平均=[階級値×相対度数]の合計分散=(偏差)2の平均  = [(偏差)2×相対度数]の合計  = [(階級値-データの平均)2×相対度数]の合計

79  46  45  25  50  62  75  78  48  50  60  75  75  60  78  58  78 63  95  20  46  55  56  70  60  79  18  63  67  85  25  40  50

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

表 1: 度数分布表

度数分布表は表 1のようになります。表の左から3列目に階級値というのがあります。これは,各階級の上限下限の中間の値で,その階級に入ったデータ(すなわち試験の得点)は,どれも概略この値であると考えます。

ヒストグラム

度数分布を目に見えるようにするために,横軸に階級,縦軸に度数(相対度数)をとり,階級幅を底辺,度数を面積とする柱で各階級の度数を表したグラフを,ヒストグラムといいます。ヒストグラムは,図 1 のような棒グラフとは違い,図 2 のように柱の間隔を開けずに描きます。

このように,柱の間隔を開けず,また柱の「面積」で度数を表現するのは,階級の区切りかたを自由に変更できるようにするためです。ヒストグラムの横軸は本来連続した値を表しているものであり,柱どうしが分れているのは,連続した値を階級に分割したからです。分割のしかたは自由ですから,ヒストグラムでの階級の区切りかたも自由に変更できるはずです。柱の面積で度数を表現しておけば,柱を分割・結合することで,階級を変更することができます。

図 3 のように,例えば「となりあう2つの階級の度数の合計」は,となりあう2つの柱の面積の合計となります。同様に,「100~120の階級の度数が 10」ということを,「100~110の階級の度数が 5,110

~120の階級の度数が 5」と分割して考えることもできます。

また,階級の幅が途中で違っていると高さと度数は一致せず,同じ度数でも階級の幅が2倍ならば高さは半分になります。このように階級の幅が途中で違っている度数分布は,階級幅を一定にすると度数が極端に違ってしまう場合,同じ階級幅でも階級値によって意味が大きく違う場合に用いられます2。

2年収 300万円と 400万円は意味がかなり違いますが,年収 1億円と 1億 100万円はあまり差がないでしょう。

浅野 晃/統計学(2014 年度春学期) 第4回 (2014. 5. 1) http://racco.mikeneko.jp/  2/4 ページ

Page 84: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

なぜ2乗?偏差の2乗ではなく,偏差の「絶対値」ではいけないの?

Page 85: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

なぜ2乗?偏差の2乗ではなく,偏差の「絶対値」ではいけないの?

絶対値の関数は,途中に折れ目があってむずかしい

Page 86: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

なぜ2乗?偏差の2乗ではなく,偏差の「絶対値」ではいけないの?

絶対値の関数は,途中に折れ目があってむずかしい

放物線には折り目はない

Page 87: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

なぜ2乗?偏差の2乗ではなく,偏差の「絶対値」ではいけないの?

絶対値の関数は,途中に折れ目があってむずかしい

放物線には折り目はない

もうひとつ理由が…

Page 88: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

Page 89: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

モーメント

Page 90: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均を表す式平均=[階級値×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 91: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均を表す式平均=[階級値×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 92: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均を表す式平均=[階級値×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 93: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均を表す式平均=[階級値×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 94: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均を表す式平均=[階級値×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 95: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均を表す式平均=[階級値×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 96: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均を表す式平均=[階級値×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 97: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均を表す式

分布そのものを,ひとつの変数Xで表している

平均=[階級値×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 98: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

平均を表す式

分布そのものを,ひとつの変数Xで表している

平均=[階級値×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

E(X) を μで表すと

Page 99: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散を表す式分散=[(偏差)2×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 100: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散を表す式分散=[(偏差)2×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 101: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散を表す式分散=[(偏差)2×相対度数]の合計

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 102: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分散を表す式分散=[(偏差)2×相対度数]の合計

V(X) を σ2で表すことも多い

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 103: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 104: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 105: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 106: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 107: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 108: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

一般に

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 109: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

一般に

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 110: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

一般に

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

原点のまわりのk次モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

Page 111: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

一般に

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

原点のまわりのk次モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

平均は1次モーメント

Page 112: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

一般に

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

原点のまわりのk次モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

平均は1次モーメント

Page 113: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

一般に

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

原点のまわりのk次モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

平均は1次モーメント

Page 114: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

一般に

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

原点のまわりのk次モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

平均は1次モーメント

平均のまわりのk次モーメント

Page 115: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

一般に

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

原点のまわりのk次モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

平均は1次モーメント

平均のまわりのk次モーメント分散は2次モーメント

Page 116: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

モーメント

一般に

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

原点のまわりのk次モーメント

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

平均は1次モーメント

平均のまわりのk次モーメント分散は2次モーメント

3次・4次・…は?

Page 117: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

歪度平均のまわりの3次モーメント 歪度

f(x)

!3 > 0!3 < 0

図 1: 歪度(ヒストグラムの上辺を連続曲線で表示)

とにすると,上で示した,度数分布から平均を求める計算により

E(X) =!

x

xf(x) (3)

となります。E(X)すなわち平均を µで表すことにします。

分散は,(偏差)2,すなわち (X ! µ)2の平均ですから,(3)式と同様の書き方を用いれば

V (X) = E((X ! µ)2) =!

x

(x! µ)2f(x) (4)

と表すことができます。V (X),すなわち分散は,!2で表すこともよくあります。こうすると,標準偏差は ! ということになります。

これらを一般的に表して,「変数X の関数 g(X)の平均」E(g(X))を考えると,

E(g(X)) =!

x

g(x)f(x) (5)

となり,上の平均や分散は (5)式の特殊な場合と考えることができます。

E(g(X))の別の特殊な場合として,E(Xk)やE((X!µ)k)(kは自然数)を考えます。これらをXの k

次のモーメント(積率)とよびます。E(Xk)を原点のまわりのモーメントとよんでµ!kで表し,E((X!µ)k)

を平均のまわりのモーメントとよんで µk で表します。平均 µは,実は原点のまわりの1次モーメントµ!1 であり,分散 V (X)は平均のまわりの2次のモーメント µ2であるということになります。

「モーメント」という名前は,力学の用語からの類推から来ています。力学では,「物体中の各点の原点(あるいは重心)からの距離"その点にある質量(あるいは働く力)」を物体中の全ての点について合計したものを,「原点(重心)のまわりの1次のモーメント」といいます。E(X)を求める式で,x を距離,f(x)を質量(力)とすれば力学でのモーメントと同じになります。

平均や分散は,分布の特徴を記述するのにもっとも頻繁に使われる量です。さらに高次のモーメントを用いると,分布の特徴をより細かく記述できます。その中でよく使われるのは,"3 = µ3/!3で定義される歪度 (skewness)と,"4 = µ4/!4を用いて "4 ! 3で定義される尖度 (kurtosis)です2。

(X !µ)3は,x > µ,すなわちデータが平均より大きいときは正で,x < µのときは負になります。したがって,データが平均より大きい階級において相対度数 f(x)が大きければ,µ3は正になり,データ

2”3”は,正規分布モデル(第2部で説明します)の場合の !4 の値です

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  3/7 ページ

歪度>0歪度<0

(ヒストグラムを曲線であらわした)

ヒストグラムの偏り

Page 118: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

尖度平均のまわりの4次モーメント 尖度

尖度:大尖度:小

(ヒストグラムを曲線であらわした)

ヒストグラムの尖り具合f(x)

!4:大

!4:小

図 2: 尖度(同上)

が平均より小さい階級で相対度数 f(x)が大きければ µ3は負になりますから,歪度は,f(x)のヒストグラムの,正負の方向への偏り具合をあらわします。

また,(X ! µ)4は,データが平均に近いとき非常に小さくなりますから,単峰性分布(ヒストグラムの峰がひとつである分布)の場合に µ4の値が大きくなるためには,f(x)が x = µ付近で突出して大きくなる必要があります。すなわち,尖度が大きいことは,f(x)のヒストグラムが,µ付近で上にとがっていることを示しています。

標準得点

ある人が,数学の試験で 100点満点で 70点をとったとします。70点という点数そのものには,問題全体の 70%に正答したので,その試験についてはまあまあの出来,という意味はもちろんあります。しかし,大学などの受験においては,同じ試験を受けたすべての受験生の中で上位に入らなければ合格はできませんから,その 70点という点数が「同じ試験を受けた他の受験生に比べて,上位なのか下位なのか」を知ることが重要です。同じ 70点でも,他の受験生が皆 50点そこそこなら,70点をとった人は上位に位置するでしょうし,他の受験生が皆 90点以上なら,他の人より大幅に劣っていることになって,意味合いは全然違います。

このように,あるデータが分布の中でどのぐらいの位置にいるかを数値で表現するために,「そのデータが,分布の平均に比べて,標準偏差の何倍上回っているか(あるいは下回っているか)」を求めます。この値を標準得点といいます。たとえば,「あるデータを標準得点に換算すると 1.0である」ということは,そのデータが平均にくらべて標準偏差の 1.0倍上回っていることを意味しています。また,標準得点が!1.5なら,平均にくらべて標準偏差の 1.5倍下回ったであることを意味しています。

標準得点を求めるために,分布を平均 0・標準偏差が 1になるように「変換」することを考えます。「分布を変換する」とは,分布に含まれる各々のデータについて,一斉に同じ計算を施して,別の分布を作ることです。このような計算をしたとき,あるデータが変換の結果 1.0になったとすれば,それは平均0・標準偏差 1である分布においての 1.0という値ですから,これは平均よりも 1.0倍上回っていることを示しており,標準得点に変換されていることになります。

どういう計算をすれば,分布を平均 0・標準偏差が 1になるように「変換」することができるでしょうか? 例えば,分布に含まれる各データについて一斉に「10を引く」という計算をすると,どのデー

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  4/7 ページ

Page 119: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

Page 120: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

A. A

sano

, Kan

sai U

niv.

標準得点

Page 121: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「試験で70点」は優れているのか

試験で70点をとった。まわりより優れているのか?

一緒に受けた人たちの平均点が

50点なら 優れている

80点なら 劣っている

Page 122: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「試験で70点」は優れているのか

試験で70点をとった。まわりよりとても優れているのか?

一緒に受けた人たちの平均点が

50点なら まあ優れている

30点なら とても優れている …?

Page 123: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「試験で70点」は優れているのか

試験で70点をとった。まわりよりとても優れているのか?

一緒に受けた人たちの平均点が

50点なら まあ優れている

30点なら とても優れている …?

Page 124: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「試験で70点」は優れているのか一緒に受けた人たちが

平均60点で標準偏差5点

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

平均30点で標準偏差20点

30 70

7060

Page 125: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「試験で70点」は優れているのか

70点の「地位」は同じ。

一緒に受けた人たちが

平均60点で標準偏差5点

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

平均30点で標準偏差20点

30 70

7060

Page 126: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「地位」を数字で表す一緒に受けた人たちが

平均60点で標準偏差5点

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

7060

Page 127: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「地位」を数字で表す

70点の人は,平均を標準偏差の2倍上回っている

一緒に受けた人たちが

平均60点で標準偏差5点

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

7060

Page 128: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「地位」を数字で表す

70点の人は,平均を標準偏差の2倍上回っている

一緒に受けた人たちが

平均60点で標準偏差5点

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

平均30点で標準偏差20点

7060

Page 129: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

「地位」を数字で表す

70点の人は,平均を標準偏差の2倍上回っている

一緒に受けた人たちが

平均60点で標準偏差5点

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

平均30点で標準偏差20点

7060

70点の人は,平均を標準偏差の2倍上回っている

Page 130: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

標準得点70点の人は,平均を標準偏差の2倍上回っている

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

7060

Page 131: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

標準得点70点の人は,平均を標準偏差の2倍上回っている

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

7060[標準得点]が2点

Page 132: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

標準得点70点の人は,平均を標準偏差の2倍上回っている

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

平均を標準偏差の2倍下回っている

7060[標準得点]が2点

Page 133: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

標準得点70点の人は,平均を標準偏差の2倍上回っている

各データから!を引く

平均!0X

平均0X – !

各データを(1 / ")倍する

X – !"0

図 3: 度数分布の変換

今日の演習

1.下の度数分布表について,表の空欄を埋めて,平均・分散を求めてください.

階級 階級値 相対度数 階級値×相対度数 偏差 (偏差)2 (偏差)2 !相対度数0~9(点) 5 0.04

10~19 15 0.16

20~29 25 0.08

30~39 35 0.12

40~49 45 0.10

50~59 55 0.10

60~69 65 0.12

70~79 75 0.08

80~89 85 0.18

90~100 95 0.02

合計 1.0    =平均    =分散

表 1: 度数分布から平均・分散を求める

2.ある 10 人のクラスで数学の試験を行ったところ,その得点は 20, 45, 50, 50, 60, 60, 65, 70, 70,

100(点)でした.このとき,

1. 平均と標準偏差を求めてください.

2. 得点が 70 点の人の偏差値は何点ですか.

3. 偏差値 65 点は,試験の得点では何点に相当しますか.

浅野 晃/統計学(2013 年度秋学期) 第5回 (2013. 10. 24) http://racco.mikeneko.jp/  6/7 ページ

平均を標準偏差の2倍下回っている

7060[標準得点]が2点

標準得点が-2点

Page 134: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

標準得点への換算標準得点=分布中のあるデータが,平均を標準偏差の何倍上回って/下回っているか

Page 135: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

標準得点への換算標準得点=分布中のあるデータが,平均を標準偏差の何倍上回って/下回っているか

分布そのものを平均0,標準偏差1に「変換」したら?

Page 136: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

標準得点への換算標準得点=分布中のあるデータが,平均を標準偏差の何倍上回って/下回っているか

分布そのものを平均0,標準偏差1に「変換」したら?

そのデータの変換後の値が,そのまま標準得点になる

Page 137: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引く

各データから+を引く

平均+�X

平均�X – +

Page 138: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引く

平均μ標準偏差σ

各データから+を引く

平均+�X

平均�X – +

Page 139: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引く

平均μ標準偏差σ

各データから+を引く

平均+�X

平均�X – +

平均0標準偏差σ

Page 140: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引いて標準偏差で割る

平均0標準偏差σ

平均�X – +

各データを(1 / m)倍する

X – +m�

Page 141: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引いて標準偏差で割る

平均0標準偏差σ

平均�X – +

各データを(1 / m)倍する

X – +m�

各データを(1/σ)倍

Page 142: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引いて標準偏差で割る

平均0標準偏差σ

平均�X – +

各データを(1 / m)倍する

X – +m�

各データを(1/σ)倍

各データの偏差は

Page 143: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引いて標準偏差で割る

平均0標準偏差σ

平均�X – +

各データを(1 / m)倍する

X – +m�

各データを(1/σ)倍

各データの偏差は (1/σ)倍

Page 144: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引いて標準偏差で割る

平均0標準偏差σ

平均�X – +

各データを(1 / m)倍する

X – +m�

各データを(1/σ)倍

各データの偏差は (1/σ)倍分散は(偏差)2の平均

Page 145: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引いて標準偏差で割る

平均0標準偏差σ

平均�X – +

各データを(1 / m)倍する

X – +m�

各データを(1/σ)倍

各データの偏差は (1/σ)倍分散は(偏差)2の平均 (1/σ)2倍

Page 146: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引いて標準偏差で割る

平均0標準偏差σ

平均�X – +

各データを(1 / m)倍する

X – +m�

各データを(1/σ)倍

各データの偏差は (1/σ)倍分散は(偏差)2の平均 (1/σ)2倍標準偏差は分散の平方根

Page 147: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引いて標準偏差で割る

平均0標準偏差σ

平均�X – +

各データを(1 / m)倍する

X – +m�

各データを(1/σ)倍

各データの偏差は (1/σ)倍分散は(偏差)2の平均 (1/σ)2倍標準偏差は分散の平方根 (1/σ)倍

Page 148: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

分布の変換分布中の各データから,平均を引いて標準偏差で割る

平均0標準偏差σ

平均�X – +

各データを(1 / m)倍する

X – +m�

各データを(1/σ)倍

各データの偏差は (1/σ)倍分散は(偏差)2の平均 (1/σ)2倍標準偏差は分散の平方根 (1/σ)倍

平均0標準偏差1

Page 149: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

式で書くと

分布そのものをXとすると

Z = (X - μ) / σ

と変換すると,Zは平均0,標準偏差1

Page 150: 2014年度春学期 統計学 第5回 分布をまとめるー平均・分散 (2014. 5. 15)

2013年度春学期 画像情報処理

A. A

sano

, Kan

sai U

niv.

受験産業でいう「偏差値」平均0,標準偏差1の分布Zを,さらにW = 10Z + 50と変換すると,Wは平均50,標準偏差10

これが[偏差値]

偏差値70 平均よりも,標準偏差の2倍上回っている

偏差値40 平均よりも,標準偏差の1倍下回っている