63
111/06/09 政政政政政政政政 1 主主主 主主主主主主 主主主 主主主 主主主主主主主主 主主主主主主主主主主 主主主 主主主主主主主 西

主題三 機率分佈簡介

  • Upload
    blythe

  • View
    85

  • Download
    7

Embed Size (px)

DESCRIPTION

主題三 機率分佈簡介. 主講人 陳陸輝 特聘研究員兼主任 政治大學選舉研究中心 美國密西根州立大學博士. 講授主題. 壹 幾個基本概念 貳 機率模型 參 複合事件 肆 條件機率 伍 獨立事件 陸 貝氏定理 柒 間斷與連續事件的機率分佈 捌 常態分佈 玖 樣本平均數的抽樣分佈 拾 母體、樣本資料與樣本分佈. 2008 年選舉結果. 馬約得 765.9 萬票 / 謝約得 544.5 萬票 馬勝 221 萬票 馬得票率佔有效票 58.45 % 投票率 76.33 % 如果用 出口名調 ,得到比例會是多少?. 壹 幾個基本概念. - PowerPoint PPT Presentation

Citation preview

Page 1: 主題三 機率分佈簡介

112/04/20 政治學研究方法班1

主題三 機率分佈簡介主講人 陳陸輝 特聘研究員兼主任政治大學選舉研究中心美國密西根州立大學博士

Page 2: 主題三 機率分佈簡介

112/04/20政治學研究方法班2

講授主題

壹 幾個基本概念 貳 機率模型參 複合事件肆 條件機率伍 獨立事件 陸 貝氏定理柒 間斷與連續事件的機率分佈捌 常態分佈玖 樣本平均數的抽樣分佈拾 母體、樣本資料與樣本分佈

Page 3: 主題三 機率分佈簡介

112/04/20政治學研究方法班3

2008 年選舉結果

馬約得 765.9 萬票 / 謝約得 544.5 萬票馬勝 221 萬票馬得票率佔有效票 58.45 %投票率 76.33 %

如果用出口名調,得到比例會是多少?

Page 4: 主題三 機率分佈簡介

112/04/20政治學研究方法班4

壹 幾個基本概念

A. 隨機實驗 ( Random Experiment )B. 基本結果( Elementary Outcome )C. 樣本空間( Sample Space )D. 事件( Event Set )

Page 5: 主題三 機率分佈簡介

112/04/20政治學研究方法班5

A. 隨機實驗 ( Random Experiment )

這是一種過程,你會知道有幾種特定的結果會出現,不過,不能確定哪一個結果會出現,也無法精確預測。

隨機實驗可以重複進行,經過累積一定的觀察數量後,可以找出一些統計規則。

例如,你擲一個骰子,你不確定會出現幾點,但是,你知道其中一些基本原則。同理,可以推論到擲兩顆骰子或是抽一張撲克牌。

Page 6: 主題三 機率分佈簡介

112/04/20政治學研究方法班6

B. 基本結果( Elementary Outcome )

隨機實驗可能出現的結果。例如,擲一個骰子的基本結果是從 1到 6 。

Page 7: 主題三 機率分佈簡介

112/04/20政治學研究方法班7

C. 樣本空間( Sample Space )

列出隨機實驗中的所有可能結果。例如,擲一個骰子的樣本空間是

S={1, 2, 3, 4, 5, 6}

通常用 S 來表示之。

Page 8: 主題三 機率分佈簡介

112/04/20政治學研究方法班8

D. 事件( Event Set )

樣本空間的部分集合稱之為事件。

事件可以只包括一個基本結果(簡單事件 simple event )或是兩個或兩個以上的基本結果 ( 混合事件 composite event) 。

Page 9: 主題三 機率分佈簡介

112/04/20政治學研究方法班9

貳 機率模型

家中小孩男女的組合:

生男生女是一個很平常卻很有趣的問題。當一個家庭有三個小孩,你會猜他們的男女組合是 ?GBG?BBB?GGB?BGB?

G-Girl

B-Boy

Page 10: 主題三 機率分佈簡介

112/04/20政治學研究方法班10

例題 4.1-4.2

4.1 一對夫妻有三個小孩,他們都是男的,機率是多少?

4.2. 都是女的機率是多少?

Page 11: 主題三 機率分佈簡介

112/04/20政治學研究方法班11

樹狀圖

第一個 第二個 第三個 基本結果 出現機率 結果 SET

G GGG 1/8 e1

G

B GGB 1/8 e2

G G GBG 1/8 e3

B

B GBB 1/8 e4

G BGG 1/8 e5

G

B BGB 1/8 e6

B G BBG 1/8 e7

B

B BBB 1/8 e8

Page 12: 主題三 機率分佈簡介

112/04/20政治學研究方法班12

各種男女組合出現機率

事件 機率

E=至少兩個女兒

F=兩位小的是女的

G=少於兩個女兒

H=青一色性別

K=少於兩個兒子

I=沒有女兒

I1=剛好一個女兒

I2=剛好兩個女兒

I3=三個全是女兒

Page 13: 主題三 機率分佈簡介

112/04/20政治學研究方法班13

各種男女組合出現機率(解答)事件 機率

E=至少兩個女兒 {e1,e2,e3,e5} P(E)=4/8=0.5

F=兩位小的是女的 {e1,e5} P(F)=2/8=0.25

G=少於兩個女兒 {e4,e6,e7,e8} P(G)=4/8=0.5

H=青一色性別 {e1,e8} P(H)=2/8=0.25

K=少於兩個兒子 {e1,e2,e3,e5} P(K)=4/8=0.5

I=沒有女兒 {e8} P(I)=1/8=0.125

I1=剛好一個女兒 {e4,e6,e7} P(I1)=3/8=0.375

I2=剛好兩個女兒 {e2,e3,e5} P(I2)=3/8=0.375

I3=三個全是女兒 {e1} P(I3)=1/8=0.125

Page 14: 主題三 機率分佈簡介

112/04/20政治學研究方法班14

參、複合事件 (Compound Event)

(1) 交集與聯集

(2) 互斥事件

(3) 互補事件

Page 15: 主題三 機率分佈簡介

112/04/20政治學研究方法班15

複合事件例題 4.3

一個三個小孩家庭中的女生至少兩個且全部性別都相同的機率是多少 ?

這是交集 ? 還是聯集 ?/ 包含哪些結果 (outcome)?/機率是多少 ?

Page 16: 主題三 機率分佈簡介

112/04/20政治學研究方法班16

複合事件例題 4.3 解答

一個三個小孩家庭中的女生至少兩個且全部性別都相同的機率是多少 ?

至少二女 P(E): {e1,e2,e3,e5} 相同性別 P(H): {e1,e8}

是交集

125.08/1)( HEP

Page 17: 主題三 機率分佈簡介

112/04/20政治學研究方法班17

複合事件例題 4.4

一個三個小孩家庭中的女生至少兩個或是全部性別都相同的機率是多少 ?

這是交集 ? 還是聯集 ?/ 包含哪些結果 (outcome)?/機率是多少 ?

Page 18: 主題三 機率分佈簡介

112/04/20政治學研究方法班18

複合事件例題 4.4 解答

一個三個小孩家庭中的女生至少兩個或是全部性別都相同的機率是多少 ?

至少二女: {e1,e2,e3,e5} 相同性別: {e1,e8}

是聯集

)()()()( HEPHPEPHEP 625.0125.025.05.0

Page 19: 主題三 機率分佈簡介

112/04/20政治學研究方法班19

互斥事件

就是兩個事件基本上是沒有交集的例如 :

沒有女兒 P( I ) {e8}

至少兩個女兒 P( E ) {e1,e2,e3,e5}

0)( IEP

Page 20: 主題三 機率分佈簡介

112/04/20政治學研究方法班20

互補事件

彼此戶斥卻又窮盡所有結果( outcome ): P(G) 少於二女: {e4,e6,e7,e8} P(K) 少於二子: {e1,e2,e3,e5}

0)( KGP 且 1)( KGP

Page 21: 主題三 機率分佈簡介

112/04/20政治學研究方法班21

肆 條件機率

設定條件之後,再看機率發生情況: 你快樂嗎?

Page 22: 主題三 機率分佈簡介

112/04/20政治學研究方法班22

婚姻與快樂

很快樂 H 不很快樂 N 小計

已婚M 22 34 56

未婚 U 34 10 44

小計 56 44 100

Page 23: 主題三 機率分佈簡介

112/04/20政治學研究方法班23

各種機率

P(未婚 )

P( 很快樂 )+P( 不很快樂 )

P(已婚且很快樂 )=P(已婚 )*P(已婚中很快樂 )

P(M )= 1-P(M )P( H N∪ ) = P(H)+P(N) 如果兩個事件獨立P(M∩H) = P(M)* P(H|M)

Page 24: 主題三 機率分佈簡介

112/04/20政治學研究方法班24

各種比例:總比例

Page 25: 主題三 機率分佈簡介

112/04/20政治學研究方法班25

直欄百分比

很快樂 H 不很快樂 N 直欄%

已婚M 39.3 77.3 56.0

未婚 U 60.7 22.7 44.0

橫列% 56.0 44.0 100.0

)|( HMP )|( HUP

)|( NMP )|( NUP

Page 26: 主題三 機率分佈簡介

112/04/20政治學研究方法班26

橫列百分比

很快樂 H 不很快樂 N 直欄%

已婚M 39.3 60.7 56.0

未婚 U 77.3 22.7 44.0

橫列% 56.0 44.0 100.0

)|( MHP )|( MNP

)|( UHP )|( UNP

Page 27: 主題三 機率分佈簡介

112/04/20政治學研究方法班27

各種概念

交集: P( A∩B ) 聯集: P( A B∪ ) 條件機率: P( A| B )

Page 28: 主題三 機率分佈簡介

112/04/20政治學研究方法班28

伍、獨立事件

對人工流產立場 總計

贊成(F) 反對(O)

白人W 45.9% 44.1% 90.0%

非裔 B 5.1% 4.9% 10.0%

總計 51.0% 49.0% 100.0%

Page 29: 主題三 機率分佈簡介

112/04/20政治學研究方法班29

獨立事件例題

如果我們隨機選一個受訪者,他支持人工流產的機率是多少 ? P(F)

如果我們選中一位白人,則他支持人工流產的機率是多少 ?P(F|W)?

Page 30: 主題三 機率分佈簡介

112/04/20政治學研究方法班30

統計上的獨立事件

如果事件 A 統計上獨立於事件 B 之外,則 P(A|B)=P(A)

上述的例子告訴我們,受訪者的族裔背景,會不會影響他們對人工流產的態度 ?

Page 31: 主題三 機率分佈簡介

112/04/20政治學研究方法班31

統計上獨立的兩個事件之間的機率關係 :

統計上獨立的兩個事件之間的機率關係 :

P(A∩B) = P(B) * P(A|B)

因為 A與 B 是獨立事件,所以P(A∩B) = P(B) * P(A)

兩邊同時除以 P(A)

這表示P(B|A) = P(B)

)(

)(

AP

BAP = P(B)

Page 32: 主題三 機率分佈簡介

112/04/20政治學研究方法班32

兩事件互為獨立時的關係

當事件 A 是獨立於事件 B 之外時,則事件 B 一定獨立於事件 A 之外 .

Page 33: 主題三 機率分佈簡介

112/04/20政治學研究方法班33

幾個重要公式

P(A∪ B) P(A∩ B)

一般公式 =P(A)+P(B) - P(A∩ B) =P(A)*P(B|A)

特例 =P(A)+P(B)

事件 A與 B是互斥

亦即

P(A∩ B) = 0

=P(A)* P(B)

事件 A與 B獨立

亦即

P(B|A)=P(B)

Page 34: 主題三 機率分佈簡介

112/04/20政治學研究方法班34

陸、貝氏定理

貝氏定理是估計一個事件發生的條件機率的方式,它使用事前機率導出事後機率。我們可以看一下以下的例子。公式是 :

)|()()|()(

)|()()|(

ERPEPERPEP

ERPEPREP

(4-4)

Page 35: 主題三 機率分佈簡介

112/04/20政治學研究方法班35

一群人不相同生日機率

大家生日皆不同的機率: Pn=exp((-n*(n-1))/730)

N 機率

10 0.884

20 0.594

30 0.304

40 0.118

50 0.035

60 0.008

Page 36: 主題三 機率分佈簡介

112/04/20政治學研究方法班36

柒、間斷與連續變數的機率分佈

間斷變數與連續變數之區別

Page 37: 主題三 機率分佈簡介

112/04/20政治學研究方法班37

一、間斷變數的機率分佈

表 4.1 家中理想子女數目的分佈

y P(y)

0 0.01

1 0.03

2 0.60

3 0.23

4 0.12

5 0.01

總計 1.00

P( 4) =?

Page 38: 主題三 機率分佈簡介

112/04/20政治學研究方法班38

二、連續機率分佈圖

4. 2 圖 通勤時間的機率分佈

0 15 30 45 60 75 90 105

通勤時間(分)

%

Page 39: 主題三 機率分佈簡介

112/04/20政治學研究方法班39

二、連續機率分佈

P( y<10) =?

P(30<y<60)=?

Page 40: 主題三 機率分佈簡介

112/04/20政治學研究方法班40

機率分佈的母數 (parameter)

如果表 4.1 的機率分佈是母體值(母數),我們反覆抽樣的結果,會知道

家中理想子女數為 1 的機率是: P(y=1)=?

對機率的兩個重要的描述母數(參數)為1. 平均數2. 標準差

Page 41: 主題三 機率分佈簡介

112/04/20政治學研究方法班41

間斷變數的平均數計算方式

此一數值又稱為期望值,以 E(y) 表示

變異數計算公式

))()(()( 2 yPyyV

))(( yPy

Page 42: 主題三 機率分佈簡介

112/04/20政治學研究方法班42

捌、常態機率分佈

4. 3 圖 常態分佈圖

μ -3σ μ -2σ μ -σ μ μ +σ μ +2σ μ +3σ

Page 43: 主題三 機率分佈簡介

112/04/20政治學研究方法班43

常態分佈的幾個特性

1.平均數、中位數與眾數是同值,而將常態曲線分成對稱的兩個部分,各佔總分布的一半。

2.分布是對稱的,一旦將本分布從中間對折,兩邊會彼此重疊。

3.分布的兩端 ( 尾巴 ) ,離平均數愈遠,會接近 X-軸,不過,不會接觸到 X-軸 ---總是會有發生的機率,不過,機率很低就是了。

Page 44: 主題三 機率分佈簡介

112/04/20政治學研究方法班44

常態分佈的幾個特性

當觀察值為常態分佈時,在平均數1. 正負一個標準差的區間之內,涵蓋了 68% 的所

有觀察值2. 正負兩個標準差的區間之內,包括了 95% 的所

有觀察值,3. 正負三個標準差的區間之內,包括了 99.7% 的

所有觀察值。

Page 45: 主題三 機率分佈簡介

112/04/20政治學研究方法班45

兩個常態分佈圖

圖4.4 男女身高常態分佈圖

50 55 60 65 70 75 80 85

英吋

Page 46: 主題三 機率分佈簡介

112/04/20政治學研究方法班46

運用常態分配表 (p.592)

Second Decimal Place of z

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09

0.0 .5000 .4960 .4920 .4880 .4840 .4801 .4761 .4721 .4681 .4641

1.0 .1587 .1562 .1539 .1515 .1492 .1469 .1446 .1423 .1401 .1379

1.6 .0548 .0537 .0526 .0516 .0505 .0495 .0485 .0475 .0465 .0455

1.9 .0287 .0281 .0274 .0268 .0262 .0256 .0250 .0244 .0239 .0233

2.0 .0228 .0222 .0217 .0212 .0207 .0202 .0197 .0192 .0188 .0183

3.0 .00135

Page 47: 主題三 機率分佈簡介

112/04/20政治學研究方法班47

運用常態分配表 (區域 C 的比例 )

Page 48: 主題三 機率分佈簡介

112/04/20政治學研究方法班48

運用常態分配表 (區域 C 的比例 )

Page 49: 主題三 機率分佈簡介

112/04/20政治學研究方法班49

找出以下區域的百分比

P( -1.96<Z<1.96 )

P ( Z<1.645 )

P( -3>Z )

Page 50: 主題三 機率分佈簡介

112/04/20政治學研究方法班50

標準常態分佈

所有常態分佈,都可以轉換成標準常態分數。他的平均數是 0 ,標準差是 1 。我們可以先知道標準分數,然後找出比這個分數高 /低者,佔所有分布的比例另外一個是,我們知道一定的比例後,要找出這個標準化分數我們將標準常態分布的整個區域,定為 1 或是

100% ,一半就是 0.5 或是 50%

Page 51: 主題三 機率分佈簡介

112/04/20政治學研究方法班51

標準常態分佈圖

標準常態分布曲線圖

-4 -3 -2 -1 0 1 2 3 4

Page 52: 主題三 機率分佈簡介

112/04/20政治學研究方法班52

玖、樣本平均數的抽樣分佈

我們想知道每年家庭食品支出花費

Page 53: 主題三 機率分佈簡介

112/04/20政治學研究方法班53

食品支出的實例

Page 54: 主題三 機率分佈簡介

112/04/20政治學研究方法班54

食品支出的實例( N=25)

MEAN25

MEAN25

次數

12

10

8

6

4

2

0

= 12501.24 標準差

= 130324.4平均數

N = 100.00

Page 55: 主題三 機率分佈簡介

112/04/20政治學研究方法班55

食品支出的實例( N=100)

Page 56: 主題三 機率分佈簡介

112/04/20政治學研究方法班56

樣本數對抽樣分佈與精確度的影響一

4. 13 100 2705圖 樣本數為 與 時的抽樣比例之抽樣分佈

0.35 0.4 0.45 0.5 0.55 0.6 0.65

n=2705

n=100

Page 57: 主題三 機率分佈簡介

112/04/20政治學研究方法班57

樣本數對抽樣分佈與精確度的影響二

N=30

N=50

N=100

N=1,000

Page 58: 主題三 機率分佈簡介

112/04/20政治學研究方法班58

標準誤 (standard error)

平均數抽樣分佈的標準差稱之

ny /

Page 59: 主題三 機率分佈簡介

112/04/20政治學研究方法班59

抽樣分佈:常態分佈與中央極限定理

在統計上有個中央極限定理,它的內容是:在樣本數足夠大的情況下,如果把這K個平均數排起來,它們會形成常態分布,而這些樣本平均數的平均數會等於 μ,這些樣本平均數的標準差會等於

nyyyyy n /)...( 321

n/

Page 60: 主題三 機率分佈簡介

112/04/20政治學研究方法班60

不同母體分佈的抽樣分佈

不論母體的原始分佈如何,當樣本數趨近無限大,樣本平均數的平均數分佈會趨近常態分佈。

樣本平均數抽樣分佈的標準誤母體平均數的左右三個標準誤內包含樣本平均數

Page 61: 主題三 機率分佈簡介

112/04/20政治學研究方法班61

拾、母體、樣本資料與樣本分佈 母體分佈:據以抽樣的對象,通常是未知 樣本分佈:可觀察的抽樣結果 可計算樣本平均數與標準差 樣本愈大,樣本平均數會愈接近母體平均數 抽樣分佈:描述固定樣本數下,反覆抽樣下的樣本分佈情況

樣本數大小: n 30≧ 統計推論中抽樣分佈的關鍵角色

Page 62: 主題三 機率分佈簡介

112/04/20政治學研究方法班62

本章小結機率分佈:區間、總和、符號機率分佈的平均數、標準差常態分佈與標準常態分佈標準化分數抽樣分佈抽樣平均數的平均數分佈,也有標準差中央極限定理

Page 63: 主題三 機率分佈簡介

112/04/20政治學研究方法班63

提問時間

電子郵件

[email protected]

[email protected]