31

10.1 隨機抽樣

Embed Size (px)

DESCRIPTION

10.1 隨機抽樣. 母體: 有限母體 無限母體 --- 元素的數量在理論上是無限多個. (a) (b). 解答:. 隨機抽樣. 方法: 由電腦或計算機產生亂數. 利用計算機產生四位數的亂數,我們只取前三位。略去 000 、大於 138 的數字,以及已經被選到的數字,假設我們得到了 041 、 021 、 079 、 084 、 012 、 108 、 029 、 003 、 100 、 046 、 126 、與 075 。這 12 個編號就是我們要挖掘的地點。. 解答:. 略去 000 以及大於 138 的數字,並確保已經被選到的數字 不會被重複選取 - PowerPoint PPT Presentation

Citation preview

Page 1: 10.1   隨機抽樣
Page 2: 10.1   隨機抽樣

10.1 隨機抽樣

母體:有限母體無限母體  ---元素的數量在理論上是無限多個

Page 3: 10.1   隨機抽樣

(a)

(b)

Page 4: 10.1   隨機抽樣

隨機抽樣

方法:由電腦或計算機產生亂數

Page 5: 10.1   隨機抽樣

    利用計算機產生四位數的亂數,我們只取前三位。略去 000、大於 138的數字,以及已經被選到的數字,假設我們得到了 041、 021、 079、 084、012、 108、 029、 003、 100、 046、 126、與075。這 12個編號就是我們要挖掘的地點。  

Page 6: 10.1   隨機抽樣

略去 000以及大於 138的數字,並確保已經被選到的數字不會被重複選取得到的樣本為 007、 012、 031、 135、 114、 120、

047、 124、 070、 009、 118,與 094。要挖掘的考古地點為編號 7、 12、 31、 135、 114、

120、 47、 124、 70、 9、 118,與 94。  

Page 7: 10.1   隨機抽樣
Page 8: 10.1   隨機抽樣

隨機抽樣

定義  ( 無限母體 ):      從無限母體中抽選出樣本數為 n 的樣本時,若該樣本是由獨立隨機變數的值所組成,且這些獨立隨機變數服從相同的機率分配,則稱為隨機樣本。

投擲一個骰子 12次,得到     2 、 5、 1、 3、 6、 4、 4、 5、 2、 4、 1、 2八個學生測量某矽化合物的沸點:    136 、 153、 170、 148、 157、 152、 143、 150。  

Page 9: 10.1   隨機抽樣

*10.2 抽樣設計

比隨機抽樣更好的抽樣方法     更容易取得樣本資料、成本更低、或是能獲得更多的資訊 

抽樣設計是個相當明確的計畫,在開始抽樣或收集資料之前就必須定案。 

Page 10: 10.1   隨機抽樣

*10.3 系統抽樣

每隔幾個項目抽一個 的方法稱為系統抽樣 最實際的抽樣方式系統抽樣所涵蓋的範圍可能比較平均。 不利因素:母體當中可能有未知的週期性。  

Page 11: 10.1   隨機抽樣

*10.4 分層抽樣

分層(簡單)隨機抽樣  1. 把母體區分成幾個彼此不重複的子區域,稱為層 2. 從每一層中採取隨機的方法抽樣叫做分層抽樣

樣本數的決定      比例分配、最佳分配

Page 12: 10.1   隨機抽樣

比例分配

各層所抽選的樣本數,與該層的大小成正比。 

Page 13: 10.1   隨機抽樣
Page 14: 10.1   隨機抽樣

最佳分配

考量到各層內部各自的變異性 

Page 15: 10.1   隨機抽樣

交叉分層:根據母體的不同特徵,採用多面向分層

配額抽樣:分層抽樣中,採訪具備哪幾種特徵的人、每種的人數。

Page 16: 10.1   隨機抽樣

*10.5 叢聚抽樣

定義:    1. 將整個母體細分成幾個更小的子群體 2. 從這些子群體中隨機選出幾個做為樣本。

子群體是根據地理區域來劃分的話,稱為地

區抽樣。  

Page 17: 10.1   隨機抽樣

10.6 抽樣分配

樣本平均數、樣本中位數,以及樣本標準差的數     值會隨著樣本不同而出現差異,都是隨機變數。

它們的分配稱為抽樣分配 (sampling distribution)

Page 18: 10.1   隨機抽樣

N = 5 的母體中,選出兩個當樣本

Page 19: 10.1   隨機抽樣

抽樣分配中平均數與標準差

         是         的抽樣分配的平均數,其值等於母體平均數         ;  

是         的抽樣分配的標準差,其值小於母體標準差          。 

Page 20: 10.1   隨機抽樣

電腦模擬

Page 21: 10.1   隨機抽樣

10.7 平均數的標準誤

樣本平均數的抽樣分配的平均數:  

樣本平均數的抽樣分配的標準差: 

        稱為平均數的標準誤 

Page 22: 10.1   隨機抽樣

(a) 兩個標準誤的比率為   1/2

  樣本數變成原來的四倍,標準誤變小一半。  

(b) 兩個標準誤的比率為 3 

      樣本數變成原來的九分之一,標準誤變大三倍。  

Page 23: 10.1   隨機抽樣

有限母體修正項

除非樣本數超過母體大小的百分之五,不然這個修正項通常是忽略不計的 

有限母體修正項

Page 24: 10.1   隨機抽樣

    N= 10000 , n= 100 代入,得到 0.995    這個值非常接近 1,所以在實際應用上,可以忽略不計。  

Page 25: 10.1   隨機抽樣

將 N= 5、 n= 2 , σ代入的第二個公式

Page 26: 10.1   隨機抽樣

    將 N = 1,000、 n= 15、 σ= 288.67代入 的第二個公式,得到 

Page 27: 10.1   隨機抽樣

10.8 中央極限定理

將 n= 64 與 σ= 20 代入平均數的標準誤的公式中, 

  , 1-1/22 = 0.75

至少有  75%  的機率,誤差會小於 5。 

Page 28: 10.1   隨機抽樣

中央極限定理

從平均數為μ且標準差為σ的無限母體中選出一個樣本數為 n 的隨機樣本,則 z 近似於標準常態分配。

Page 29: 10.1   隨機抽樣

機率值介於 -2以及  2之間的面積表  I 得知, z= 2 時的對應值為 0.4772

機率值為 0.4772 + 0.4772= 0.9544。

Page 30: 10.1   隨機抽樣

10.9 其他方面的問題

中位數的標準誤大約是

當我們要估計某左右對稱的母體平均值時,     很明顯樣本平均數要比樣本中位數可靠多了 ,因為樣本平均數所可能產生的誤差比較小。

Page 31: 10.1   隨機抽樣

    把上述兩個標準誤的公式以等號連接,並在中位數標準誤那邊代入 n= 200,解得 n= 128。

n= 128 的樣本平均數和 n= 200的樣本中位數一樣的「好」。