10
A. Asano, Kansai Univ. 2018年度秋学期 統計学 浅野 関西大学総合情報学部 分布をまとめる平均・分散 第5回 A. Asano, Kansai Univ. 日本の大学生は 世界一? A. Asano, Kansai Univ. A. Asano, Kansai Univ.

2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

2018年度秋学期 統計学

浅野 晃 関西大学総合情報学部

分布をまとめる—平均・分散

第5回

A. A

sano

, Kan

sai U

niv.

日本の大学生は

世界一?🥇🥇

A. A

sano

, Kan

sai U

niv.

A. A

sano

, Kan

sai U

niv.

Page 2: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

いったいどこのデータ?

5

EducationEducation

Education at a Glance 2016OECD INDICATORS

 OECD

(経済協力開発機構)の

「教育概況」2016年版

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

いったいどこのデータ?

6

教育程度別 国際成人力調査読解力テストでレベル4,5の人の割合

Figure A1.2. Percentage of adults scoring at literacy proficiency Level 4 or 5, by educational attainment (2012 or 2015)Survey of Adult Skills, 25-64 year-old non-students

Note: Chile, Greece, Israel, Jakarta (Indonesia), Lithuania, New Zealand, Singapore, Slovenia, Turkey: Year of reference 2015. All other countries: Year of reference 2012.* See note on data for the Russian Federation in the Methodology section.Countries and subnational entities are ranked in descending order of the percentage of 25-64 year-olds with tertiary education and literacy proficiency Level 4 or 5.Source: OECD. Table A1.6 (L) available on line. See Annex 3 for notes (www.oecd.org/education/education-at-a-glance-19991487.htm).1 2 http://dx.doi.org/10.1787/888933396586

Below upper secondaryUpper secondary or post-secondary non-tertiaryTertiary

Japa

n

Finl

and

Net

herl

ands

Swed

en

Aus

tral

ia

Nor

way

Flan

ders

(Bel

gium

)

New

Zea

land

Engl

and

(UK

)

Uni

ted

Stat

es

Czec

h R

epub

lic

Pola

nd

Cana

da

Nor

ther

n Ir

elan

d (U

K)

Aus

tria

Aver

age

Ger

man

y

Irel

and

Fran

ce

Den

mar

k

Esto

nia

Sing

apor

e

Slov

ak R

epub

lic

Kor

ea

Slov

enia

Isra

el

Rus

sian

Fed

erat

ion*

Spai

n

Gre

ece

Lith

uani

a

Ital

y

Chi

le

Turk

ey

Jaka

rta

(Ind

ones

ia)

40

35

30

25

20

15

10

5

0

%

 

 

↙大卒レベル

↙高卒レベル

↙中卒レベル

※よく読むと,国どうしの比較は目的ではないと書いてある

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

国際成人力調査(PIAAC)とは

7

文部科学省のサイトに載っています

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

調査の問題例

8

11..55 図図書書検検索索にに関関すするる問問題題 【【習習熟熟度度レレベベルル::44,,難難易易度度::334488点点】】

○○状状 況況 教教育育・・訓訓練練○○形形 式式 複複数数��文文章章かかららななるる複複合合型型○○認認知知的的スストトララテテシジ゙ーー 情情報報��統統合合・・解解釈釈

図書検索結果を見てください。次�質問�答えとなる書名を選び、そ�横にある四角をクリックしてください。

遺伝子組み換え食品に賛成�主張と反対�主張�いずれも信頼できないと主張している��ど�本ですか。

図書検索結果を見てください。次�質問�答えとなる書名を選び、そ�横にある四角をクリックしてください。

遺伝子組み換え食品に賛成�主張と反対�主張�いずれも信頼できないと主張している��ど�本ですか。

Page 3: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

現在では, 「元データ」にあたることは

むずかしくありません💡💡

英語#は必要です

A. A

sano

, Kan

sai U

niv.

代表値🤔🤔

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

代表値とは

11

統計学が相手にするのは,

「分布」しているデータ

データをこんな

ふうに読めれば

いいけれど…

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

(大般若会の写真)

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

代表値とは

12

こんなことはできないので,

•ひとつの数にまとめる

http://www3.ic-net.or.jp/~yaguchi/houwa/daihannya.htm

[代表値]

数字で表されていれば,

計算ができる

•図示する(ヒストグラム)

(大般若会の写真)

Page 4: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

平均

13

とくに[算術平均]は

代表的な代表値

(算術)平均   =(データの総和)÷(数値の個数)

↑ ” / ”でも同じ意味

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

平均

14

データ

   

x1, x2, . . . , xn,

      

     

数値の個数 (データサイズ)

   

n

      

     

のとき

平均

   

x̄ =x1 + x2 + · · ·+ xn

n=

1

n

n∑

i=1

xi

      

     

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

データサイズ?

15

「データ」という言葉は,

数値の集まりをさす

(1つ1つの数値ではない)

データの中に含まれる数値の個数を

データの大きさ(サイズ)という

家族(family)という言葉に似ている2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

度数分布から平均を求める

16

度数分布とは,これでした

                                                              

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

     

Page 5: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

度数分布から平均を求める

17

平均=(データの合計)/(データサイズ)

  =([階級値×度数]の合計)/(データサイズ)

  =[階級値×(度数/データサイズ)]の合計

  =[階級値×相対度数]の合計

                                                              

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

     

A. A

sano

, Kan

sai U

niv.

分散と標準偏差🤔🤔

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「ばらつき」を数字で

19

分布は,

大小ばらばらな数値からなるデータ

どのくらいばらばらかを,

数字で表そう

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

     

どう違う?

平均は

どれも5

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

レンジとばらつき

20

Cは,最大と最小の差[レンジ]が

違う

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

C: 3, 4, 4, 5, 5, 5, 5, 6, 6, 7

     A, Bはレンジは同じだが,

Bのほうがばらついている

ように見える

Page 6: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

偏差

21

偏差を平均したら,AとBのばらつきの

違いが表せる?

各数値と平均との差を[偏差]という

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

     

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2 +3 +4

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

偏差の平均?

22

だめ。平均したらゼロ

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

     

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2 +3 +4

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

偏差を2乗する

23

偏差を2乗したら,全部正の数に なるから,それから平均する

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

     

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2 +3 +4

25 4 4 0 0 0 0 4 4 25

25 16 9 4 0 0 4 9 16 252018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

分散

24

   

      

A: 0, 3, 3, 5, 5, 5, 5, 7, 7, 10

B: 0, 1, 2, 3, 5, 5, 7, 8, 9, 10

     

0 +2 +5-2-5

0 +5-5 -4

0 00-2 +2

0-3 -2 +2 +3 +4

25 4 4 0 0 0 0 4 4 25

25 16 9 4 0 0 4 9 16 25

平均 6.6

平均 10.8[分散]=(偏差)2の平均

Page 7: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

分散と標準偏差

25

[分散]=(偏差)2の平均 式で書くと

 

σ2 =1

n

{(x1 − x̄)2 + (x2 − x̄)2 + · · ·+ (xn − x̄)2

}

=1

n

n∑

i=1

(xi − x̄)2

     

1番の数値 データの平均

n 個たして

n で割る

分散の平方根を[標準偏差]という

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

度数分布から分散を求める

26

データの平均=[階級値×相対度数]の合計

分散=(偏差)2の平均

  = [(偏差)2×相対度数]の合計

  = [(階級値−データの平均)2×相対度数]の合計

                                                              

以上 未満 階級値 度数 相対度数15 25 20 4 0.08 (8%)

25 35 30 3 0.06 (6%)

35 45 40 3 0.06 (6%)

45 55 50 8 0.16 (16%)

55 65 60 12 0.24 (24%)

65 75 70 8 0.16 (16%)

75 85 80 9 0.18 (18%)

85 95 90 3 0.06 (6%)

x x x 計 計50 1 (100%)

     

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

なぜ2乗?

27

偏差の2乗ではなく,

偏差の「絶対値」ではいけないの?

絶対値の関数は,途中に折れ目があっ

てむずかしい

2乗を表す関数のグラフ

(放物線)には折り目はない

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

マイナスかけるマイナス=プラス?

28

プラスとマイナスは,「向きが反対」

東に1km進むのが「+1km」なら 🚅🚅💨💨🚅🚅💨💨西に1km進むのは「–1km」

1時間後が「+1時間」なら

1時間前は「–1時間」

東西🚅🚅💨💨

+50km/h(東向き)

+1時間(後)

+50km/h × +1時間 = +50km(東にいる)

東西🚅🚅💨💨

–50km/h(西向き)

–1時間(前)

–50km/h × –1時間= +50km(東にいる)

Page 8: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

標準得点🤔🤔

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「試験で70点」は優れているのか

30

試験で70点をとった。

まわりより優れているのか?

一緒に受けた人たちの平均点が

50点なら 優れている

80点なら 劣っている

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「試験で70点」は優れているのか

31

試験で70点をとった。

まわりよりとても優れているのか?

一緒に受けた人たちの平均点が

50点なら まあ優れている

30点なら とても優れている …?

分散も考えないと,答えられない2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「試験で70点」は優れているのか

32

70点の

「地位」

は同じ。

一緒に受けた人たちが

平均60点で

標準偏差5点

0

       

     

平均0

       

     

平均30点で

標準偏差20点30 70

7060

Page 9: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

「地位」を数字で表す

33

70点の人は,平均を

標準偏差の2倍上回っている

一緒に受けた人たちが

平均60点で標準偏差5点なら

0

       

     

平均30点で標準偏差20点なら

7060

70点の人は,やはり平均を

標準偏差の2倍上回っている

70点の「地位」は同じ

平均0

       

     

30 70

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

標準得点

34

平均を

標準偏差の2倍上回っている

0

       

     

平均を標準偏差の2倍

下回っているなら

7060

[標準得点]が2点

標準得点が-2点

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

標準得点への換算

35

標準得点=

 分布中のある数値が,

 平均を標準偏差の何倍

 上回って/下回っているか

分布そのものを

平均0,標準偏差1に「変換」したら?

その数値の変換後の値が,

そのまま標準得点になる2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

分布の変換

36

分布中の各数値から,平均を引く

平均μ

標準偏差σ

平均0

標準偏差σ

各数値からμを引く

平均μ0X

平均0X – μ

Page 10: 2018年度秋学期 統計学 第5回 平均・分散 日本の大学生は 世界一?racco.mikeneko.jp/Kougi/2018a/STAT/2018a_stat05_slide_ho.pdf · 2018年度秋学期 統計学

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

分布の変換(続き)

37

分布中の各数値から,平均を引いて

標準偏差で割る

平均0

標準偏差σ 各数値を

(1/σ)倍

各数値の偏差は (1/σ)倍

分散は(偏差)2の平均 (1/σ)2倍

標準偏差は分散の平方根 (1/σ)倍

平均0

標準偏差1

平均0X – μ

各数値を(1 / σ)倍する

X – μσ0

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

式で書くと

38

分布そのものをXとすると

Z = (X – μ) / σ

と変換すると,Zは平均0,標準偏差1

2018年度秋学期 統計学

A. A

sano

, Kan

sai U

niv.

39 –

受験産業でいう「偏差値」

39

平均0,標準偏差1の分布Zを,さらに

W = 10Z + 50

と変換すると,Wは平均50,標準偏差10

これが[偏差値]

偏差値70 平均よりも,標準偏差の2倍

上回っている

偏差値40 平均よりも,標準偏差の1倍

下回っている