Upload
evangelina-zaro
View
57
Download
1
Embed Size (px)
DESCRIPTION
機率 (Probability). 機率與統計的關係 樣本空間及事件 機率基本概念及性質 計數技巧 條件機率、獨立事件及貝氏定理. 機率與統計的關係. 機率是推論統計的理論基礎。使用民意調查做簡單的說明 想 知道全台灣成年民眾對承認大陸學歷的看法。 訊息可以如何取得? 藉由抽樣做民意調查,因為母體太大了,不可能問得到每一個人的意見。 一般民調要訪問多少人? 可以把一千多個人的意見,當作一千多萬人意見的估計,又如何知道估計得好不好呢 ? 關鍵在於抽樣方式。 使用正確的方式抽樣,不僅能得到相當可靠的結果,還能評估誤差大小。所謂正確的抽樣方式,就是指隨機抽樣。 - PowerPoint PPT Presentation
Citation preview
機率與統計的關係• 機率是推論統計的理論基礎。使用民意調查做簡單的說明
– 想知道全台灣成年民眾對承認大陸學歷的看法。– 訊息可以如何取得?– 藉由抽樣做民意調查,因為母體太大了,不可能問得到每一個人的意見。– 一般民調要訪問多少人?– 可以把一千多個人的意見,當作一千多萬人意見的估計,又如何知道估計得好不好呢 ?關鍵在於抽樣方式。
– 使用正確的方式抽樣,不僅能得到相當可靠的結果,還能評估誤差大小。所謂正確的抽樣方式,就是指隨機抽樣。
• 隨機抽樣的結果背後會有一個架構。– 如果用相同的隨機抽樣方式重複不斷地抽樣 (樣本大小固定 ),雖然每次抽樣的結果會有所變化,且事前無法預測,但若把所有可能的結果放在一起考慮,必定會符合某種機率模型;這個模型描述了樣本結果和母體之間的關係,我們就可以據以評估樣本結果的好壞,而且還可以利用機率式子把誤差大小表示出來。
– 推論統計的根本就是隨機抽樣,其理論基礎就是機率。如果胡亂抽樣,因為不可能找得出樣本和母體之間的關聯,也就無法評估誤差,所做出的結果則和瞎猜沒兩樣。
隨機實驗任何一個不能事先確定結果的過程,我們把它統稱為「試驗」。隨機實驗 (random experiment) 是一種過程 (process),是一種不能確定預知會發生何種結果的實驗方式。在實驗前已知所有可能出現的結果,而實驗後的結果為所有可能的結果之一,但實驗前並未能正確的、肯定的預知它是何種結果。隨機實驗可重複進行,而經過長期重複實驗,出現的結果會遵循某一些統計規則。一個實驗若具有下列四種特性,就被稱為隨機實驗 (random experiment) 。(1)此實驗之全部可能結果,均可事先預知。(2)正在執行此實驗時,無法預測將會出現何種結果。(3)此實驗在相同條件下,可重複執行。(4)若此實驗重複執行許多次,則會出現一些可預測之統計規則。
樣本空間定義 (樣本空間, sample space)一項試驗所有可能發生的結果所構成的集合,叫做該試驗的樣本空間,常用符號 S 或 Ω表示,且該集合中的元素稱為樣本點。例:擲一顆骰子,骰子丟擲之後出現的點數,必定是 1 、 2 、3 、 4 、 5 、 6的其中之一,這些可能點數所構成的集合
S={1,2,3,4,5,6}
例:想知道某企業生產 LED燈管的壽命,則S={t|t0}
例 3.2-1連續丟擲一枚硬幣三次,觀察哪一面朝上,寫出樣本空間。解:每一次的結果都可能是正面 (head) 或反面 (tail),如果用 H代表正面, T 代表反面,則樣本空間為
S1 = {HHH, HHT, HTH, THH, HTT, THT, TTH, TTT}
例 3.2-2連續擲一枚硬幣三次,觀察正面出現的次數,試寫出樣本空間。解:將一枚硬幣連擲三次的正面總數,可能是 0 、 1 、 2 或 3,所以樣本空間為
S2= {0,1,2,3}
註:如果所擲的是平衡的硬幣,即正、反面機率完全一樣,例3.2-1樣本空間中八個樣本點的發生機率都會相同。
事件定義 (事件, event)樣本空間的任一子集均稱為事件,當試驗結果為該事件當中任一樣本點時,我們稱該事件發生了。
連續擲一枚硬幣三次之後,我們想知道,正面是否至少出現兩次。
A= { HHH,HHT,HTH,THH },則明顯可見 A是例 3.2-1樣本空間 S1的子集 (也稱部份集合 ),這叫做一個事件 (event)。
事件表達方法
一、描述方式令 A 代表「正面至少出現兩次的事件」
二、用集合表示A = { HHH, HHT, HTH, THH}
假設我們連續擲一枚硬幣三次,並關心正面是否至少出現兩次這件事,可以用兩種方式表達:
試驗結果是 HHH, HHT, HTH, THH當中的任意一個,我們就說「事件 A發生了」。
若試驗結果落在 A集合外面時 (例如擲出 TTH的結果 ),則我們說 A沒有發生;但是結果若落在 A的外面,就必定落在 A的補集裡,所以我們可以做出結論:
『若 A沒發生,則 A的補集 Ac必有發生』
補集定義 ( 補集, complement)
A的補集 Ac 代表「 A沒發生」的事件。
例 3.2-3擲一顆骰子,觀察朝上一面的點數,則樣本空間
S= {1, 2, 3, 4, 5,6}
令 A = {1,2},即擲出點數小於 3的事件。如果 A沒有發生,表示擲出的點數大於或等於 3,也就是
Ac= {3, 4, 5, 6}發生了。
註:補集的符號有 Ac 、 A 或 。A
集合表示「 A 和 B 都發生了」代表試驗結果既落在 A集合、也落在 B集合,所以必定落在 A 和 B的交集 (intersection) 裡。
A∩B 代表「 A 和 B 都發生」的事件。
「 A 和 B事件中至少有一件發生」代表試驗結果不是在 A就是在 B( 或同時在 A 和 B) 裡,所以必在 A 和 B的聯集 (union)裡。
A∪B 代表「 A 和 B 至少有一件發生」的事件。當 A 和 B事件中沒有共同元素,即 A∩∪B =時,我們稱 A和 B為互斥 (mutually exclusive)事件,此時 A 和 B不可能同時發生。
A∩B =時,稱 A 和 B為互斥事件。
註:互斥的條件不需要透過機率來定義。
文氏圖 (Vann Diagram)是說明事件關係很有用的工具,矩形代表全部事件的集合、矩形中的圓圈代表某一事件的集合 (也就是一個子集合 )。以下三個圖中深色部份分別代表交集、聯集、及補集。
兩事件的文氏圖
例 3.2-4連續擲一枚硬幣三次,令 A 代表「正面至少出現兩次」的事件, B 代表「三次結果都相同」的事件,試寫出「 A 和 B 都發生」的事件和「 A 和 B 至少有一件發生」的事件。
解:
令 H 代表正面、 T 代表反面,則A = {HHH, HHT, HTH, THH}B = {HHH, TTT}
A 和 B 都發生的事件即A∩B= {HHH}
A 和 B 至少有一件發生的事件即A∪B ={HHH, HHT, HTH, THH, TTT}
機率的定義方式• 古典機率 (classical probability,也稱傳統機率 )
• 相對次數機率 (relative frequency probability)
• 主觀機率 (subjective probability,也稱個人機率 )
古典機率(classical probability,傳統機率 )
假設某一試驗的可能結果有 n種,其中每一種發生的機率都相同,若事件 A中包含了 n種結果中的 k個,則事件 A的機率等於 k 除以 n,記為
其中符號 n( . )中的 n 代表總數 (number) , n(A)就代表事件A中的結果總數。
( )( )
( )n A k
P An S n
各種撲克牌和擲骰子遊戲都適用這種機率。例如,擲一顆骰子時,通常都可假設骰子很均勻,因此出現每種點數的機率都相同,都等於六分之一。
例 3.3-1便利商店因週年慶而提供折扣優惠,只要消費滿 88元就可參加抽獎,即從紙盒中抽號碼球來決定折扣比例。假設號碼球共有12顆,其中 6 折和 7 折的各有 1顆、 8 折 2顆、 9 折 3顆、 95折 5顆,小胖買了 100元的東西,試求他頂多只需要付 80元的機率。解:
小胖抽中 12顆球當中任一顆的機率都相同,而頂多需要付80元代表必須抽中 6 折、 7 折或 8 折的球,總共有 4顆,所以機率等於
4 112 3
相對次數機率(relative frequency probability)
假設在 n次試驗當中,事件 A發生了 k次,則事件 A的相對次數機率為
用這種方式定義機率時,應該要試驗很多次才恰當。例如,上述不夠平衡的骰子,若想要知道各點數出現的機率,應該要將它擲非常多次,所得到的機率才比較準確。當然,所謂「非常多次」也沒有一定的標準,在可能的情況下盡量多擲幾次就對了。
( )k
P An
主觀機率(subjective probability,個人機率 )個人主觀認定的機率,就叫做主觀機率。
阿佑根據考試成績、上課出席率,和統計學老師以往的當人比例判斷:經過老師調整分數之後,自己應有一半機率會通過;這完全是主觀認定。如果去間他的統計學老師,說不定老師認為他八成會當;也就是說,依據老師的主觀機率判斷,他會通過的機率只有兩成。
根據主觀機率的定義,明顯可知這種機率很不可靠;但有時我們需要做判斷,面對的狀況又不適合用第一種或第二種機率描述時,還是會用到主觀機率,這時應盡量多蒐集資訊之後才來決定機率。
機率性質設 S為一試驗之樣本空間,則以下性質必成立
1. P(S)=1。
2. 對任一事件 A,必有 0P(A) l。
3. 若事件 A1 , A2,…, Ak兩兩之間都互斥,則P(A1∪A2 …∪ ∪Ak) =P(A1)+P(A2)+…+P(Ak)
4. P(Ac)=1- P(A)
有了上述的三項基礎性質,很容易可以導出其他常用性質。
例 3.3-2同時擲兩顆均勻骰子,試求出現點數的和 10之機率。
解:
擲兩顆均勻骰子,每一顆都可能出現 1 到 6點,所以樣本空間包括 36個可能結果,機率都相同。
令 A 代表點數和 10的事件,
則 Ac 代表點數和 >10的事件。因此 Ac ={(5,6),(6,5),(6,6)},可得
( ) ( )3 33 11
1 136 36 12
cP A P A
5. 對任兩事件 A 及 B , P(A∪B)=P(A)+P(B)-P(A∩B)。
例 3.3-4若箱子中有七個材質及大小相同的球,分別標以 1 、 2 、 3 、4 、 5 、 6 、 7 等號碼。今自箱子中取出一球,試求其號碼為偶數或大於 4的機率。
解:
令 A 代表號碼為偶數之事件, B 代表號碼大於 4之事件,則
( ) ( ) ( ) ( )
3 3 17 7 757
P A B P A P B P A B
乘法原理 (multiplication principle)假設一事件要分 k個階段完成,第一階段有 n1種做法,第二階段有 n2種做法,…,第 k 階段有 nk種做法,則整件事共有n1 . n2 .…. nk種方法可以完成。
設有三名男生 ( 甲、乙、丙 )及四名女生 (A 、 B 、 C 、 D)參加聯誼活動 , 某遊戲需男女配對一同進行 , 試問共有幾種不同的配對方式 ?
解:
第一個步驟:先從 3 名男生中選一名 , 共有 3種選法,第二個步驟:由 4 名女生中選一名 , 也有 4種選法。因第一個步驟中每選一名男生,都有 4 名女生可供選擇 , 故共有 3×4=12種選法。
加法原理如果完成某件事的方法可區分成 k個類別 , 而第 j(j=1,2, …,k)個類別有 mj種方法 , 且每個 類別互不相干 , 那麼完成這件事的方法共有 m1+m2+…+mk 種。
從甲地到乙地有飛機、火車與巴士等三種交通工具可到達,其中飛機每天有 3 班,火車每天有 15 班,巴士每天 25 班,若 A先生欲從甲地至乙地,很明顯地,可看出此問題的 A先生只能選擇一種交通工具的某個班次,故共有 3+15+25=43個交通班次可選擇。
階乘 (factorial)一個正整數的階乘是所有小於或等於該數的正整數的積,並且有 0的階乘為 1。自然數 n的階乘寫作 n!。 1808年,基斯頓 · 卡曼 (Christian Kramp)引進這個表示法。亦即
n!=1×2×3×...×n0!=1
階乘亦可以遞迴方式定義:1!=1n!=(n-1)!×n
1751年,歐拉以大寫字母M表示m 階乘M=1 . 2 . 3 . ... . m
1799年,魯非尼在他出版的方程論著 述中,則以小寫字母 π表示m 階乘,而在 1813年,高斯則以 Π(n)來表示 n 階乘。而 用來表示 n 階乘的方法起源於英國,但仍未能確定始創人是誰。直至 1827年,由於 雅萊特的建議而得到流行,現在有時也會 以這個符號作為階乘符號。 而最先提出階乘符號 n!的人是克拉姆 ( 1808 ),後來經過歐姆等人的提倡而流 行,直至現在仍然通用。
2!=1×2=23!=1×2×3=64!=1×2×3×4=245!=1×2×3×4×5=120
直線排列 (permutation)從 n件不同的物品中抽出 k 件 (kn) 排成一列,其排列數等於 。
當 k=n時,
!( )!
nk
nP
n k
! ! !!
( )! !0 1n
n
n n nP n
n n
例 3.4-1老師有兩張別人送的偶像團體演唱會門票想轉送給同學,一張在最貴的 A 區,一張在最便宜的 C 區。為公平起見,採用抽籤方式決定。若全班共有 45 位同學,則總共有多少種可能結果?
解:
假設老師先抽出一人給 1 區門票,再抽一人給 C 區門票 ( 或者順序顛倒 ),當然掉換順序會使得結果不同,所以是排列問題。可能結果有
!( )!
452
4545 44 1980
45 2P
如果題目改成兩張票都在同一區,且位置差別不大,這時只要從 45人中抽出 2人,不需再排列,就變成組合問題了。
條件機率在考慮機率的時候,有時會有相關資訊可供參考。像這樣把已知資訊納入考慮後計算的機率,就叫做條件機率 (conditional probability)。
定義 (條件機率 )假設 A 、 B為雨事件, P(B)>0,已知事件 B發生條件下、事件 A發生的機率等於
( )( | )
( )P A B
P A BP B
例 3.5-1同時擲兩顆平衡骰子,觀察所出現的點數。試求以下條件機率:(a)已知兩顆骰子點數相同,求點數和小於 4的機率。(b)已知點數和小於 4,求兩顆骰子點數相同的機率。解:令 A 代表點數和小於 4的事件, B 代表兩顆骰子點數相同的事件,則A ={(1,1),(1,2),(2,1)}B ={(1,1),(2,2),(3,3),(4,4),(5,5),(6,6)}A∩B= {(1,1)}
(a) 所求機率為 ( )( | )
( )
1 1366 6
36
P A BP A B
P B
(b) 所求機率為 ( )( | )
( )
1 1363 3
36
P A BP B A
P A
獨立事件定義 (獨立事件 ,independent)當事件 A 和 B符合以下機率條件時,稱 A 和 B為獨立事件
P(A∩B)=P(A)P(B)如果改寫上面的等式,可得
即 P(B|A)= P(B)
兩種方式的差別在於:若要使用 P(B|A)= P(B)的定義,因為P(A)出現在 P(B|A)的分母,所以必須限制 P(A)> 0,而使用P(A∩B)=P(A)P(B)當作定義則不必加任何限制。
( )( )
( )P A B
P BP A
例 3.5-4擲一顆均勻骰子兩次,令 A 代表點數和為偶數的事件、 B 代表兩個點數相等的事件,試判斷事件 A 和 B是否獨立。解:方法一:若同為奇數,表示第一次擲出 1 、 3 或 5點,第二次也是,共有 3×3=9種可能;同為偶數也是有 9種可能,因此
( )18 136 2
P A
兩個點數相等共有 6種可能,所以 ( )6 136 6
P B
A B 代表點數和為偶數且兩個點數相等的事件,所以
( ) ( ) ( )6 136 6
P A B P A P B
事件 A 和 B並不獨立。
例 3.5-5假設一容器中裝著 3白球、 2紅球。現在從容器中依序取出 2 球( 第一球取出後不放回 ),試求取出的第一球為白球、第二球為紅球的機率。解:令 A 代表第一次取出白球的事件, B 代表第二次取出紅球的事件,則所求機率為
( ) ( ) ( | )3 2 35 4 10
P A B P A P B A
例 3.5-6考慮例 3.5-5的相同問題。容器中裝著 3白球、 2紅球,只是現在要依序取出 3 球,每一階段取出的球都不放回,求取出的第一球為白球、第二球及第三球均為紅球的機率。解:令 A 代表第一次取出白球的事件, B 代表第二次取出紅球的事件, C 代表第三次取出紅球的事件,則所求機率為
( ) ( ) ( | ) ( | )3 2 1 15 4 3 10
P A B C P A P B A P C A B
分割定義 (樣本空間 S的分割 ,partition)
如果事件 A1 、 A2、…、 Ak雨兩均互斥,且 A1∪A2 …∪
∪Ak=S,則稱 {A1 、 A2、…、 Ak}為樣本空間 S的一組分割。
全機率法則 (total probability rule)某事件的邊際機率若無法直接獲得,經常可透過全機率法則(運用條件機率與另一特質的所有事件的機率 )來獲得。首先我們必須要有一組完全且互斥的事件,以 表示這組事件,註 : 完全指的是在 A1,A2, …,Ak 完全切割母群體,即構成所有可能發生情況, P(A1)+P(A2)+…+P(Ak)=1;互斥則指其間兩兩事件的交集為 0,即 P(Ai∩Aj)=0 。則根據全機率法則
P(B)=P(B∩A1)+P(B∩A2)+…+P(B∩Ak)
=P(B|A1)P(A1)+P(B|A2)P(A2)+…+P(B|Ak)P(Ak)1A 2A 3A nA
B