77
1 3章 度数分布とヒストグラム データの中の分析(記述統計)であ れ、データの外への推論(推測統計) であれ、まず、データの持つ基本的 特性を把握することが重要である。

3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

1

3章 度数分布とヒストグラム

データの中の分析(記述統計)であれ、データの外への推論(推測統計)であれ、まず、データの持つ基本的特性を把握することが重要である。

Page 2: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

2

分析の流れ データの分布(散らばり)を、度数分布表にまとめ、グラフ化する。3章。

グラフに、平均値や分散など、分布の特徴を示す客観的な数値を加える。4・5・6章。

データが母集団からのランダムサンプルならば、母集団についての推測を行う。7章以降。

Page 3: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

3

度数分布とヒストグラムの作成 データを昇(降)順に並べ替える。 階級を設定し、各階級に属するデータの個数をカウントする。

各階級の相対度数、累積度数、及び、累積相対度数を計算する。

度数分布表をもとに、ヒストグラムを作成する。

Page 4: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

4

もとのデータと並べ替え もとのデータを, 𝑥1, 𝑥2, 𝑥3,⋯ , 𝑥𝑛 とする。それを昇順に並べ直したものを、 𝑥(1), 𝑥(2), 𝑥(3),⋯ , 𝑥 𝑛

と書くものとしよう。 データが与えられたら,それを昇順に並べ替えると都合がよい.

43,20,18,38,32,33,91,9,12,26,41,53,25,65,29,37,36,43,33,57

9,12,18,20,25,26,29,32,33,33,36,37,38,41,43,43,53,57,65,91

Page 5: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

5

エクセルを用いた並べ替え

昇順 降順

Page 6: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

数直線上にプロットする

6

これだけでも、データの分布の様子が見て取れる。

しかし、データ数が増えるに従い、分布の形を読み取ることは難しい。

Page 7: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

7

階級 度数 相対度数 累積度数 累積相対度数 0以上10未満 1

10~20 2 20~30 4 30~40 6 40~50 3 50~60 2

60~70 1 70~80 0 80~90 0 90~100 1 100~ 0

合計 20

表3-1 得点の度数分布表 を完成させよう

Page 8: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

8

階級 度数 相対度数 累積度数 累積相対度数 0以上10未満 1

10~20 2 20~30 4 30~40 6 40~50 3 50~60 2

60~70 1 70~80 0 80~90 0 90~100 1 100~ 0

合計 20

表3-1 得点の度数分布表 を完成させよう

05.0201 =÷

10.0202 =÷

Page 9: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

9

階級 度数 相対度数 累積度数 累積相対度数 0以上10未満 1 0.05

10~20 2 0.10 20~30 4 0.20 30~40 6 0.30 40~50 3 0.15 50~60 2 0.10 60~70 1 0.05 70~80 0 0.00 80~90 0 0.00 90~100 1 0.05 100~ 0 0.00

合計 20 1

表3-1 得点の度数分布表

137

1367 =+16313 =+

Page 10: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

10

階級 度数 相対度数 累積度数 累積相対度数 0以上10未満 1 0.05 1

10~20 2 0.10 3 20~30 4 0.20 7 30~40 6 0.30 13 40~50 3 0.15 16 50~60 2 0.10 18

60~70 1 0.05 19 70~80 0 0.00 19 80~90 0 0.00 19 90~100 1 0.05 20 100~ 0 0.00 20

合計 20 1

表3-1 得点の度数分布表

05.0201 =÷

15.0203 =÷35.0207 =÷65.02013 =÷

80.090.095.095.095.000.100.1

Page 11: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

11

階級 度数 相対度数 累積度数 累積相対度数 0以上10未満 𝑛1

10~20 𝑛2 20~30 𝑛3 30~40 𝑛4

40~50 𝑛5

50~60 𝑛6

60~70 𝑛7

70~80 𝑛8 80~90 𝑛9

90~100 𝑛10

合計

表3-1 得点の度数分布表

Page 12: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

12

階級 度数 相対度数 累積度数 累積相対度数 0以上10未満 𝑛1

10~20 𝑛2 20~30 𝑛3 30~40 𝑛4

40~50 𝑛5

50~60 𝑛6

60~70 𝑛7

70~80 𝑛8 80~90 𝑛9

90~100 𝑛10

合計

表3-1 得点の度数分布表

∑ ==

10

1i inn

p6 = n6 n

p1 = n1 n

p2 = n2 n

p7 = n7 n

p5 = n5 n

p9 = n9 n

p10 = n10 n

p8 = n8 n

p4 = n4 n

p3 = n3 n

11021 =+++ ppp

r1 = p1

r2 = p1 + p2

r3 = p1 + p2 + p3

r4 = r3 + p4

r5 = r4 + p5

r6 = r5 + p6

r7 = r6 + p7

r8 = r7 + p8

r9 = r8 + p9

110910 =+= prr

11 nR =

212 nnR +=

3213 nnnR ++=

434 nRR +=

545 nRR +=

656 nRR +=

767 nRR +=

878 nRR +=

989 nRR +=

10910 nRR +=

Page 13: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

表3-2を完成させよ

13

表3-2 サイコロを100回投げたときに出た目の度数分布表

サイコロの目 度数 相対度数 累積度数 累積相対度数

1 20

2 18

3 10

4 14

5 21

6 17

合計

注:度数は各目が出る確率が等しいという条件で,Excelの乱数の関数を用いて擬似的に発生させた

Page 14: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

表3-2を完成させよ(解答)

14

表3-2 サイコロを100回投げたときに出た目の度数分布表

サイコロの目 度数 相対度数 累積度数 累積相対度数

1 20 0.20 20 0.20

2 18 0.18 38 0.38

3 10 0.10 48 0.48

4 14 0.14 62 0.62

5 21 0.21 83 0.83

6 17 0.17 100 1.00

合計 100 1.00 - -

注:度数は各目が出る確率が等しいという条件で,Excelの乱数の関数を用いて擬似的に発生させた

Page 15: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

グラフの作成

15

度数

(a) 度数によるヒストグラム

10 20 30 40 50 60 70 80 90 100

相対度数

(b) 相対度数によるヒストグラム

10 20 30 40 50 60 70 80 90 100

人数を見たいなら

割合を見たいなら

Page 16: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

累積相対度数のグラフ

16

累積相対度数

図3-3 得点の累積相対度数 40点以下の割合を知りたいなら、

55点以下の割合を知りたいなら、

Page 17: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

累積相対度数のグラフ

17

累積相対度数

図3-3 得点の累積相対度数

40点以下の割合を知りたいなら、

65%

55点以下の割合を知りたいなら、

55

約85%

Page 18: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

18

Excel を使うとき =D4/D$15

コピー

コピー

=SUM(D4:D14)

=D4 =F4+D5

=F4/F$15

コピー

Page 19: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

ヒストグラムを作るとき 1. 階級を決める 2. 各階級の度数をカウントする 3. 相対度数、累積度数、累積相対度数を計算

する 4. グラフ化する 階級を決めることは、意外に難しい(教科書に

一般論はあるが、「グラフで何を示したいか」を考えるとよい)

19

Page 20: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

級の幅を2倍にすると、 表3-3.得点の度数分布表(階級幅20)

階級 度数 相対度

数 累積度数

累積相対度数

0点以上 ~ 20点未満 3 0.15 3 0.15 20 ~ 40 10 0.50 13 0.65 40 ~ 60 5 0.25 18 0.90 60 ~ 80 1 0.05 19 0.95 80 ~ 100 1 0.05 20 1.00

100 ~ 0 0.00 20 1.00 合計 20 20 - -

20

度数

点 20 40 60 80 100

Page 21: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

女子学生の身長の例

21

並べ替えにより、最大値、最小値、メディアン(中位数)が分かる。

最大値

最小値

メディアン

150172

1582

)26()25( =+ xx

Page 22: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

級の区間 代表値 度数 累積度数 相対度数 累積相対度数

149.5-152.5 151

152.5-155.5 154

155.5-158.5 157

158.5-161.5 160

161.5-164.5 163

164.5-167.5 166

167.5-170.5 169

170.5-173.5 172

合計

22

身長の度数分布表 を完成させよう

51395

10341

50

Page 23: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

級の区間 代表値 度数 累積度数 相対度数 累積相対度数

149.5-152.5 151

152.5-155.5 154

155.5-158.5 157

158.5-161.5 160

161.5-164.5 163

164.5-167.5 166

167.5-170.5 169

170.5-173.5 172

合計

23

身長の度数分布表 を完成させよう

51395

10341

5182732

50

42454950

Page 24: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

級の区間 代表値 度数 累積度数 相対度数 累積相対度数

149.5-152.5 151 5 5

152.5-155.5 154 13 18

155.5-158.5 157 9 27

158.5-161.5 160 5 32

161.5-164.5 163 10 42

164.5-167.5 166 3 45

167.5-170.5 169 4 49

170.5-173.5 172 1 50

合計 50

24

身長の度数分布表 を完成させよう

1.0505 =÷

26.05013 =÷54.05027 =÷

Page 25: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

級の区間 代表値 度数 累積度数 相対度数 累積相対度数

149.5-152.5 151 5 5 0.10 0.10

152.5-155.5 154 13 18 0.26 0.36

155.5-158.5 157 9 27 0.18 0.54

158.5-161.5 160 5 32 0.10 0.64

161.5-164.5 163 10 42 0.20 0.84

164.5-167.5 166 3 45 0.06 0.90

167.5-170.5 169 4 49 0.08 0.98

170.5-173.5 172 1 50 0.02 1.00

合計 50 1.00

25

身長の度数分布表 を完成させよう

Page 26: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

グラフの作成

26

人数を見たいなら

割合を見たいなら 0.00

0.05

0.10

0.15

0.20

0.25

0.30身長の相対度数

0

2

4

6

8

10

12

14身長の度数

Page 27: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

グラフの作成

27

人数を見たいなら

割合を見たいなら 0.00

0.05

0.10

0.15

0.20

0.25

0.30身長の相対度数

0

2

4

6

8

10

12

14身長の度数

Page 28: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

149.5

152.5

155.5

158.5

161.5

164.5

167.5

170.5

173.5

累積相対度数のグラフ

累積相対度数のグラフ

28

Page 29: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

149.5

152.5

155.5

158.5

161.5

164.5

167.5

170.5

173.5

累積相対度数のグラフ

累積相対度数のグラフ

29

164cm以下の割合を知りたいなら、

約80%

157cm以下の割合を知りたいなら、

約44%

Page 30: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

30

例題 3.1 年間収入の場合 経済データは、度数分布の形で提供される場合が多い。

収入データは、他の経済データと同様に、高額データの取り扱いが難しい。

試験データや身長データでは、さほど極端な値がないので、取り扱いが比較的楽である。

Page 31: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

31

2006年度 年間収入 (農林漁家を除く全世帯)

年間収入階級 階級値 度数 (世帯数)

200万円未満 157 239

200万円以上~ 250万円未満 225 368

250 ~ 300 275 537

300 ~ 350 323 792

350 ~ 400 373 880

・・・・・・・・・・・・ ・・ ・・

700 ~ 750 720 463

750 ~ 800 772 387

800 ~ 900 842 651

900 ~ 1000 945 520

1000 ~ 1250 1,104 700

1250 ~ 1500 1,359 282

1500万円以上 1,985 334

合計 10,000

年収1500万円超の世

帯が数多く存在していることが分かる最高額

は不明

239世帯の平均が157万円

階級幅が一定ではない

Page 32: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

~200 200~ 250

32

階級幅の差を考慮せずにグラフにすれば・・

階級幅が異なっている

Page 33: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

年間収入以上 未満

階級値

世帯数

階級幅

~200 157 239

200~250 225 368

33

表3−4の作成 1/2

50×階級幅

度数

Page 34: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

年間収入以上 未満

階級値

世帯数

階級幅

~200 157 239

200~250 225 368

34

表3−4の作成 1/2

1395086239

=×÷

最低収入が不明 1572200

=+x

86114200 =−

114=x

x

これをヒストグラムの棒の高さとする:級幅の違いを考慮に入れてやる。階級幅が広いほど,棒は低くなる。

50200250 =−368

5050368=

×÷

50×階級幅

度数

Page 35: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

35

表 3−4 の作成 2/2

年間収入以上 未満

階級値

世帯数

階級幅 世帯数÷階級幅×50=棒の高さ

1250~1500 1359 282

1500~ 1985 334

Page 36: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

36

表 3−4 の作成 2/2

年間収入以上 未満

階級値

世帯数

階級幅 世帯数÷階級幅×50=棒の高さ

1250~1500 1359 282

1500~ 1985 334

最高収入が不明

198521500

=+x

97015002470 =−

2470=x

x

25012501500 =−

棒の面積と世帯数とが比例する。

5650250282

=×÷

1750970334

=×÷

Page 37: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

37

階級幅を変えてグラフ化すると

度数(世帯数)

年間収入(万円)

図3-5 年間収入のヒストグラム

200 400 600 800 1000 1250 1500

表3-4より作成

柱の面積が世帯数と比例する

Page 38: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

クロス集計 (男女別に)分類するときもある。

38

表3-5 男女別の得点の度数分布表

階級

度数 相対度数

男 女 男 女

0点以上 ~ 10点未

満 1 0 0.09 0.00 10 ~ 20 2 0 0.18 0.00 20 ~ 30 2 2 0.18 0.22 30 ~ 40 3 3 0.27 0.33 40 ~ 50 2 1 0.18 0.11 50 ~ 60 0 2 0.00 0.22 60 ~ 70 0 1 0.00 0.11 70 ~ 80 0 0 0.00 0.00 80 ~ 90 0 0 0.00 0.00 90 ~ 100 1 0 0.09 0.00 100 ~ 0 0 0.00 0.00

合計 11 9 1.00 1.00 注:丸め誤差のため合計は1になっていない

Page 39: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

39

参考:階級数と階級幅の決め方 階級数は、データの数に応じて決める。 log2n + 1 に近い数で、データの性質を加味して決める。

階級の幅は、最初と最後を除いて、同じ幅にする。

階級の端点は出来るだけ簡単な数字にする。

Page 40: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

対数関数

40

2log

532log416log

38log24log12log

log

2

2

2

2

2

==

===

== ca abcb 言い換えれば 

データの数が32個なら、級の数を6くらい設定するとよい。

Page 41: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

プロ野球選手:身長の分布 2010年

Page 42: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

プロ野球選手:体重の分布 2010年

Page 43: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

対数関数

43

10log

5100000log410000log

31000log2100log

110loglog

10

10

10

10

10

==

==

=== c

a abcb 言い換えれば 

Page 44: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

プロ野球選手:年棒の分布 2010年

Page 45: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

プロ野球選手:対数年俸の分布 2010年

Page 46: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

46

2 累積相対度数分布とローレンツ曲線

累積相対度数の応用例として、格差を表すローレンツ曲線とジニ係数について学ぶ。

「2000年において,世界人口の貧しい方から50%の収入は、世界全体の富の1%に過ぎ

ない(国連調査)」といった表現を、より充実させるものである。

Page 47: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

47

遺産相続の例(分配1)

左表では,明らかに,相続額が不平等である.

最も平等な配分は?

最も不平等な配分は?

相続者 相続額

長男 1000

次男 800

3男 600

4男 400

5男 1200

Page 48: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

48

遺産相続の例(分配1) 並べ替えー貧しい方から金持ちへ

人数 金額 比率 累積比率

人数 金額 人数 金額

Page 49: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

49

遺産相続の例(分配1) 並べ替えー貧しい方から金持ちへ

人数 金額 比率 累積比率

人数 金額 人数 金額 4男 1 400

3男 1 600

次男 1 800

長男 1 1000

5男 1 1200

Σ 5 4000 ー ー

Page 50: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

50

遺産相続の例(分配1) 並べ替えー貧しい方から金持ちへ

人数 金額 比率 累積比率

人数 金額 人数 金額 4男 1 400

3男 1 600

次男 1 800

長男 1 1000

5男 1 1200

Σ 5 4000 ー ー

2.051 =÷

15.04000600 =÷

Page 51: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

51

遺産相続の例(分配1)

人数 金額 比率 累積比率

人数 金額 人数 金額 4男 1 400 0.2 0.10

3男 1 600 0.2 0.15

次男 1 800 0.2 0.20

長男 1 1000 0.2 0.25

5男 1 1200 0.2 0.30

Σ 5 4000 1.0 1.00

2.0 1.0

25.0

45.0

Page 52: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

52

遺産相続の例(分配1)

人数 金額 比率 累積比率

人数 金額 人数 金額 4男 1 400 0.2 0.10 0.2 0.10

3男 1 600 0.2 0.15 0.4 0.25

次男 1 800 0.2 0.20 0.6 0.45

長男 1 1000 0.2 0.25 0.8 0.70

5男 1 1200 0.2 0.30 1.0 1.00

Σ 5 4000 1.0 1.00 ー ー

Page 53: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

53

遺産相続の例 金額の累積比率

人数の累積比率

図3-7 遺産配分の例のローレンツ曲線

Page 54: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

54

遺産相続の例(分配1) 金額の累積比率

人数の累積比率

図3-7 遺産配分の例のローレンツ曲線

ローレンツ曲線

累積比率

人数 金額

4男 0.2 0.10

3男 0.4 0.25

次男 0.6 0.45

長男 0.8 0.70

5男 1.0 1.00

Σ ー ー

Page 55: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

55

遺産相続の例(分配2)

人数 金額 比率 累積比率

人数 金額 人数 金額

4男 1 600

3男 1 700

次男 1 800

長男 1 900

5男 1 1000

Σ 5 4000

Page 56: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

56

遺産相続の例(分配2) 金額の累積比

人数の累積比率

図3-8 2つの分配方法のローレンツ曲線

分配1

分配2

人数 金額

比率 累積比率

人数 金額 人数 金額

4男 1 600 0.2 0.15 0.2 0.15

3男 1 700 0.2 0.175 0.4 0.325

次男 1 800 0.2 0.20 0.6 0.525

長男 1 900 0.2 0.225 0.8 0.75

5男 1 1000 0.2 0.25 1.0 1.00

Σ 5 4000 1.0 1.00 ー ー

Page 57: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

人数 金額 比率 累積比率

人数 金額 人数 金額

4男 1 600 0.2 0.15 0.2 0.15

3男 1 700 0.2 0.175 0.4 0.325

次男 1 800 0.2 0.20 0.6 0.525

長男 1 900 0.2 0.225 0.8 0.75

5男 1 1000 0.2 0.25 1.0 1.00

Σ 5 4000 1.0 1.00 ー ー

57

遺産相続の例(分配2) (数式)

Page 58: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

人数 金額 比率 累積比率

人数 金額 人数 金額

4男 1 600 0.2 0.15 0.2 0.15

3男 1 700 0.2 0.175 0.4 0.325

次男 1 800 0.2 0.20 0.6 0.525

長男 1 900 0.2 0.225 0.8 0.75

5男 1 1000 0.2 0.25 1.0 1.00

Σ 5 4000 1.0 1.00 ー ー

58

遺産相続の例(分配2) (数式)

x1

x2

x3

x4

x5

xii=1

5∑

p1

p2

p3

p4

p5

pii=1

5∑

q1

q2

q3

q4

q5

qii=1

5∑

P1

P2

P3

P4

P5

Q1

Q2

Q3

Q4

Q5

P4 = p1 + p2 + p3 + p4 = P3 + p4

1n2n

3n

4n5n

∑ =

5

1i in

Page 59: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

59

遺産相続の例(均等分布)

人数 金額 比率 累積比率

人数 金額 人数 金額

4男 1 800

3男 1 800

次男 1 800

長男 1 800

5男 1 800

Σ 5 4000

Page 60: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

60

遺産相続の例(均等分布)

人数 金額 比率 累積比率

人数 金額 人数 金額

4男 1 800 0.2 0.2 0.2 0.2

3男 1 800 0.2 0.2 0.4 0.4

次男 1 800 0.2 0.2 0.6 0.6

長男 1 800 0.2 0.2 0.8 0.8

5男 1 800 0.2 0.2 1.0 1.0

Σ 5 4000 1.0 1.00 ー ー

金額の累積比率

人数の累積比率

図3-8 2つの分配方法のローレンツ曲線

分配1

均等分布線

分配2

Page 61: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

61

ジニ係数とは?

Page 62: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

62

ジニ係数とは?

右の図の、黒い線で囲まれた面積の2倍を、ジニ係数と呼ぶ。

ジニ係数は、0 と1 の間の数で、1 に近いとき不平等度が高くなります.

Page 63: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

63

ジニ係数とは?

Page 64: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

64

ジニ係数とは?

右の線で囲まれた面積のことをジニ係数と呼ぶ。

Page 65: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

65

ジニ係数:実際の計算方法 累積比率

ジニ係数計算欄 人数 金額

4男 0.2 0.10

3男 0.4 0.25

次男 0.6 0.45

長男 0.8 0.70

5男 1.0 1.00 ジニ係数

Page 66: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

累積比率 ジニ係数計算欄

人数 金額

4男 0.2 0.10

3男 0.4 0.25

次男 0.6 0.45

長男 0.8 0.70

5男 1.0 1.00 ジニ係数 66

ジニ係数:実際の計算方法

03.06.025.045.04.0 =×−×

06.08.045.070.06.0 =×−×

1.00.17.00.18.0 =×−×

01.04.010.025.02.0 =×−×

2.0

Page 67: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

67

ジニ係数の求め方

順位 累積人数比

累積金額比

1

2

3

4

5

P1

P2

P3

P4

P5

Q1

Q2

Q3

Q4

Q5

Page 68: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

68

ジニ係数の求め方

順位 累積人数比

累積金額比

1

2

3

4

5

P1

P2

P3

P4

P5

Q1

Q2

Q3

Q4

Q5

Page 69: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

69

ジニ係数の求め方(式) 累積人数

比 累積金額

比 三角形か台形の面積

P1 Q1

P2 Q2

P3 Q3

P4 Q4

P5 Q5

(∗)

1− (∗)× 2ジニ係数は

Page 70: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

70

ジニ係数の求め方(式) 累積人数

比 累積金額

比 三角形か台形の面積

P1 Q1

P2 Q2

P3 Q3

P4 Q4

P5 Q5

P1 Q1

2

(P2 − P1)(Q2 + Q1)2

(P3 − P2 )(Q3 + Q2 )2

(P4 − P3 )(Q4 + Q3 )2

(P5 − P4 )(Q5 + Q4 )2

(∗)

1− (∗)× 2ジニ係数は

Page 71: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

71

ジニ係数の公式を求める

)})(())(())(())(({1

54454334

3223211211

QQPPQQPPQQPPQQPPQP

+−++−++−++−+−

ジニ係数

Page 72: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

72

ジニ係数の公式を求める

)})(())(())(())(({1

54454334

3223211211

QQPPQQPPQQPPQQPPQP

+−++−++−++−+−

ジニ係数 )}

{1

54445545

43334434

32223323

2111221211

QPQPQPQPQPQPQPQPQPQPQPQP

QPQPQPQPQP

−−++−−++−−++

−−++−=

Page 73: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

73

ジニ係数の求め方( 公式) 累積人数比

累積金額比 三角形か楕円の面積

P1 Q1

P2 Q2

P3 Q3

P4 Q4

P5 Q5

ジニ係数

ジニ係数

Page 74: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

74

ジニ係数の求め方( 公式) 累積人数比

累積金額比 三角形か楕円の面積

P1 Q1

P2 Q2

P3 Q3

P4 Q4

P5 Q5

P1Q2 − P2Q1

)()()(

)(

4554

34432332

1221

QPQPQPQPQPQP

QPQP

−+−+−

+−

P2Q3 − P3Q2

P3Q4 − P4Q3

P4Q5 − P5Q4

ジニ係数

ジニ係数

Page 75: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

表3-7 世帯と年間収入の累積比率等 (2006年、農林漁家世帯を除く全世帯)

75

年間収入階級 階級値 度数 (世帯

数) 総収入(階級値×

度数)

比率 累積比率

世帯 収入 世帯 収入

200万円未満 157 239 37,523 0.0239 0.0059 0.0239 0.0059

200万円以上~ 250万円未満 225 368 82,800 0.0368 0.0129 0.0607 0.0188

250 ~ 300 275 537 147,675 0.0537 0.0231 0.1144 0.0419

300 ~ 350 323 792 255,816 0.0792 0.0400 0.1936 0.0819

350 ~ 400 373 880 328,240 0.0880 0.0513 0.2816 0.1332

400 ~ 450 423 811 343,053 0.0811 0.0536 0.3627 0.1868

450 ~ 500 473 707 334,411 0.0707 0.0523 0.4334 0.2391

500 ~ 550 522 700 365,400 0.0700 0.0571 0.5034 0.2962

550 ~ 600 572 531 303,732 0.0531 0.0475 0.5565 0.3437

600 ~ 650 621 606 376,326 0.0606 0.0588 0.6171 0.4025

650 ~ 700 673 492 331,116 0.0492 0.0518 0.6663 0.4543

700 ~ 750 720 463 333,360 0.0463 0.0521 0.7126 0.5064

750 ~ 800 772 387 298,764 0.0387 0.0467 0.7513 0.5531

800 ~ 900 842 651 548,142 0.0651 0.0857 0.8164 0.6388

900 ~ 1000 945 520 491,400 0.0520 0.0768 0.8684 0.7156

1000 ~ 1250 1,104 700 772,800 0.0700 0.1208 0.9384 0.8364

1250 ~ 1500 1,359 282 383,238 0.0282 0.0599 0.9666 0.8964

1500万円以上 1,985 334 662,990 0.0334 0.1036 1.0000 1.0000

合計 10,000 6,396,786 1.0000 1.0000

× = × =

Page 76: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

ローレンツ曲線と均等分布線

76

年間収入

の累積比率

世帯の累積比率

図3-9 年間収入のローレンツ曲線

ローレンツ曲線

均等分布線

表3-7より作成

年間収入階級 累積比率

世帯 収入

200万円未満 0.0239 0.0059

200万円以上~ 250万円未満 0.0607 0.0188

250 ~ 300 0.1144 0.0419

300 ~ 350 0.1936 0.0819

350 ~ 400 0.2816 0.1332

400 ~ 450 0.3627 0.1868

450 ~ 500 0.4334 0.2391

500 ~ 550 0.5034 0.2962

550 ~ 600 0.5565 0.3437

600 ~ 650 0.6171 0.4025

650 ~ 700 0.6663 0.4543

700 ~ 750 0.7126 0.5064

750 ~ 800 0.7513 0.5531

800 ~ 900 0.8164 0.6388

900 ~ 1000 0.8684 0.7156

1000 ~ 1250 0.9384 0.8364

1250 ~ 1500 0.9666 0.8964

1500万円以上 1.0000 1.0000

合計

Page 77: 3章 度数分布とヒストグラム - Kansai U · 2 分析の流れ データの分布(散らばり)を、度数分布表にま とめ、グラフ化する。3章。 グラフに、平均値や分散など、分布の特徴を

ジニ係数の計算

77

年間収入階級 累積比率

ジニ係数計算欄 世帯 収入

200万円未満 0.0239 0.0059

200万円以上~ 250万円未満 0.0607 0.0188 0.0001

250 ~ 300 0.1144 0.0419 0.0004

300 ~ 350 0.1936 0.0819 0.0013

350 ~ 400 0.2816 0.1332 0.0027

400 ~ 450 0.3627 0.1868 0.0043

450 ~ 500 0.4334 0.2391 0.0058

500 ~ 550 0.5034 0.2962 0.0080

550 ~ 600 0.5565 0.3437 0.0082

600 ~ 650 0.6171 0.4025 0.0119

650 ~ 700 0.6663 0.4543 0.0121

700 ~ 750 0.7126 0.5064 0.0137

750 ~ 800 0.7513 0.5531 0.0137

800 ~ 900 0.8164 0.6388 0.0284

900 ~ 1000 0.8684 0.7156 0.0295

1000 ~ 1250 0.9384 0.8364 0.0548

1250 ~ 1500 0.9666 0.8964 0.0326

1500万円以上 1.0000 1.0000 0.0702

合計 0.2977

0.0239×0.0188 - 0.0059×0.0607

計算不要

ジニ係数