38
Ch 12 點點點點點點點點

Ch 12 點估計與抽樣分配. 本章大綱 抽樣的概念 抽樣的專有名詞 抽樣的原則 影響樣本推論的因素 選擇樣本的目標 抽樣的類型 隨機 / 機率抽樣設計

  • View
    297

  • Download
    5

Embed Size (px)

Citation preview

Ch 12

點估計與抽樣分配

本章大綱 抽樣的概念 抽樣的專有名詞 抽樣的原則 影響樣本推論的因素 選擇樣本的目標 抽樣的類型

隨機 / 機率抽樣設計 非隨機 / 非機率抽樣設計 混合抽樣設計

樣本大小的計算

抽樣的概念

優點:節省時間、財力、及人力資源。 缺點:只能估計或預測,有誤差的存在。

抽樣的專有名詞 母群體 (Population) 或研究母群體 (Study population)

樣本 (Sample)

樣本大小 (Sample size)

抽樣設計或策略 (Sampling design or strategy)

抽樣單位 (Sampling unit)

抽樣架構 (Sampling frame)

樣本的統計量 (Sample statistics)

母數 (Population parameters)

抽樣的原則 : 原則一 在樣本的統計量與母群體的真實母數間通常都有差異存在,

而其主要的原因是由於樣本中所選擇的個體不同所造成。 例 :A=18 , B=20 , C=23 , D=25 。 ( 樣本大小 =2)

樣本 樣本平均數(1) ( 樣本統計

量 )

母群體平均數(2) ( 母數 )

(1) 與 (2)間的差

AB 19.0 21.5 -2.5

AC 20.5 21.5 -1.5

AD 21.5 21.5 0.0

BC 21.5 21.5 0.0

BD 22.5 21.5 +1.0

CD 24.0 21.5 +2.5

抽樣的原則 : 原則二 樣本的大小越大,則所估計的母群體母數便越正確。 例 :A=18 , B=20 , C=23 , D=25 。 ( 樣本大小 =3)

樣本 樣本平均數(1) ( 樣本統計

量 )

母群體平均數(2) ( 母數 )

(1) 與 (2)間的差

ABC 20.67 21.5 -0.83

ABD 21.00 21.5 -0.5

ACD 22.00 21.5 +0.5

BCD 22.67 21.5 +1.17 樣本大小 =2 ,樣本統計量與母數間的差在 -2.5 到 +2.5 。 樣本大小 =3 ,樣本統計量與母數間的差在 -0.83 到 +1.17 。

抽樣的原則 : 原則三 所欲研究的母群體變項其差異越大,則樣本統計量與母群體平均數

間的差異越大。 例 :A=18 , B=26 , C=32 , D=40 。 ( 樣本大小 =3)

樣本 樣本平均數(1) ( 樣本統計

量 )

母群體平均數(2) ( 母數 )

(1) 與 (2)間的差

ABC 25.33 29.0 -3.67

ABD 28.0 29.0 -1.0

ACD 30.0 29.0 +1.0

BCD 32.67 29.0 +3.67 A=18 , B=20 , C=23 , D=25 , (1) 與 (2) 間的差在 -0.83 到 +1.17 。 A=18 , B=26 , C=32 , D=40 , (1) 與 (2) 間的差在 -3.67 到 +3.67 。

影響樣本推論的因素 樣本大小﹔

抽樣母群體變異的範圍。

選擇樣本的目標 選擇樣本的目標:

一定的樣本大小,增加估計的精確性﹔ 樣本選擇時能避免偏誤。

樣本選擇時可能發生偏誤的情形: 以非隨機的方法抽樣﹔ 抽樣架構未正確且完整的涵蓋所有抽樣母體﹔ 抽樣母群體的某一部分無法掌握。

歷史故事

民主黨 共和黨

有電話且 (或 )有汽車且(或 )為該雜誌讀者的人

偏差樣本

母體

樣本從整個母體隨機選出

好的抽樣過程

母體

樣本

抽樣分配 固定母體並且固定樣本數的條件下,統計量

的抽樣分配 (sampling distribution) 是該統計量所有可能值的機率分配。

樣本數固定在 n ,而且每一個樣本元素都來自某個固定的母體, 的抽樣分配是隨機變數 所有可能值的機率分配。

X

X

中央極限定理 從一個平均 μ 與標準差 σ 的母體抽樣。如果

樣本數持續增加,樣本平均的抽樣分配會接近一個有著平均等於 μ 跟標準差 等於的常態分配。

對夠大的樣本數 n

n/

)n/,(N~x 2

常態分配母體不同樣本數之樣本平均的抽樣分配

常態母體

0.4

0.3

0.2

0.1

0.0

f(X)

μ

抽樣分配 : n = 2

抽樣分配 : n =16

抽樣分配 : n = 4

當樣本數遞增下的抽樣分配

X

n = 5

X

n = 20

X-

Large n

0.00

0.05

0.10

0.15

0.20

0.25

0.00

0.10

0.20

P(x

)P

(x)

P(x

)

0.0

0.1

0.2

0.3

0.4

中央極限定理 中央極限定理說明樣本平均 的抽樣分配會

接近常態分配,無論樣本來自的母體是何種分配。

此定理讓我們有能力產生樣本平均可能存在區域的機率陳述,同時計算 與它所估計的母體平均離多遠的機率。

X

X

中央極限定理的效果:各種不同母體與各種不同樣本數之 的分配

常態 均勻 右偏

母體

n = 2

n = 30

XXXX

不規則

X

中央極限定理的三個面向 如果樣本數夠大, 的抽樣分配是常態

的。 的期望值等於 μ 。 的標準差等於 。

X

X n/

X

抽樣的類型抽樣的型態

隨機 /機率抽樣

簡單隨機抽樣

分層隨機抽樣

分層比例抽樣

分層非比例抽樣

混合抽樣非隨機 /機率抽樣

叢集抽樣

單一階段

雙階段

多階段

定額抽樣

偶遇抽樣

立意抽樣

滾雪球抽樣

系統抽樣

隨機 / 機率抽樣設計 隨機 / 機率樣本須符合下列兩要件:

相等:被抽取的機率相同﹔ 獨立:不受其他因素影響。

隨機 / 機率樣本主要的優點: 可代表抽樣的母群體﹔ 可作為機率理論統計的資料。

抽選隨機樣本的方法 抽選隨機樣本的方法

籤筒﹔ 電腦程式抽樣﹔ 亂數表抽樣。

抽選隨機樣本的不同系統 不置回抽樣﹔ 置回抽樣。

亂數表抽樣程序確認母群體中所有抽樣單位的數量。

將每一個抽樣單位予以編號,從 1 號開始。

隨機選一個行與列的交會點為起始點。

步驟一

步驟二

步驟三

從亂數表中隨機選相同位數的數字。步驟四

決定樣本大小。

從亂數表中抽選所需數量的抽樣單位。

步驟五

步驟六

隨機 / 機率抽樣設計的種類 簡單隨機抽樣 (Simple random sampling)

分層隨機抽樣 (Stratified random sampling)

叢集抽樣 (Cluster sampling)

簡單隨機抽樣的步驟確認母群體中的每一個抽樣單位,並予以編號。

決定樣本大小 (n) 。

以籤筒、亂數表、或電腦程式來抽選樣本。

步驟一

步驟二

步驟三

分層隨機抽樣的步驟確認母群體中的每一個抽樣單位。

決定母群體的分層數 (K) 。

每個個體分到適當的分層中。

步驟一

步驟二

步驟三

將每個分層內的個體予以編號。步驟四

決定樣本大小。

決定使用比例或非比例分層抽樣。

步驟五

步驟六

分層隨機抽樣的步驟 ( 續 )

分層非比例抽樣 分層比例抽樣步驟七 決定每一層要抽出的個數。

)k(

)n(

分層數樣本大小個數

步驟八 以簡單隨機抽樣抽出每一層所需的個數。

步驟七 決定每一層佔母體的比率 (p)。

母體個數總數每一層的個數

比率)(#

)( p

步驟八

以簡單隨機抽樣抽出每一層所需的個數。

決定每一層需抽出的個數( 樣本大小 ) × (p)。

步驟九

叢集抽樣 將抽樣母體分成若干團體,稱為“叢集”。 對每個叢集使用簡單隨機抽樣,抽出所需個數。 範例:

非隨機 / 非機率抽樣設計 定額抽樣 (quota sampling)﹔ 偶遇抽樣 (accidental sampling)﹔ 立意抽樣 (judgemental or purpose samplin

g)﹔ 滾雪球抽樣 (snowball sampling) 。

定額抽樣 主要考量:

很容易接近母群體的便利性﹔ 研究者受母群體一些顯而易見的特質所引導。

優點: 花費最少的抽樣方法﹔ 不需要母群體的相關資訊﹔ 保證所抽選的人確為研究所需的人。

缺點: 樣本非隨機樣本﹔ 抽選個體具有某特質,無法代表母體。

偶遇抽樣 主要考量:

很容易接近母群體的便利性。 優、缺點與定額抽樣相似。但是較無法獲得所想要的資訊。

應用面: 市場調查﹔ 新聞報導。

立意抽樣 研究者僅選擇具有所需資訊的人來訪問。 應用面:

建構歷史真相﹔ 描述現象﹔ 發展鮮為人知的事實。

滾雪球抽樣 使用網絡來選擇樣本的過程。 應用面:

溝通型態﹔ 決策﹔ 團體中知識的傳播。

缺點: 整體樣本的選擇依賴第一次所接觸的人。 母群體很大不適用。

混合抽樣設計 ( 系統抽樣設計 ) 第一個體以簡單隨機抽樣產生,其餘個體以等距方式抽出。 範例:

抽樣架構1 14 26 392 15 27 403 16 28 414 17 29 425 18 30 436 19 31 447 20 32 458 21 33 469 22 34 47

10 23 35 4811 24 36 4912 25 37 5013 38

Inte

rval

(k)

38

1318232833384348

抽選出樣本In

terv

al (

k)

Inte

rval

(k)

系統抽樣的步驟

準備所有抽樣單位 (N) 的名冊。

決定樣本大小 (n) 。

決定等距的寬度=       = (K) 。

步驟一

步驟二

步驟三

以簡單隨機抽樣抽選第一個個體。步驟四

相隔等距依序抽出其餘個體。步驟五

)(

)(

n

N

樣本大小所有母群體

決定樣本大小的考慮因素 信心水準的範圍? 估計母群體參數的正確程度? 估計研究變項的變異程度? 研究預算?

公式:  =母群體平均數的估計值  =樣本平均數  = 95% 的信心水準  =標準誤  =標準差  =樣本大小

決定信心範圍的公式

05.tXX

X

X

05.t

假設決定容忍 0.5 的誤差,表示:

換句話說,希望      或

範例

5.005. XtX

5.005.

t 5.096.1

信心水準 0.20 0.10 0.05 0.02 0.01 0.001

t 值 1.282 1.645 1.96 2.326 2.576 3.291

5.0

96.1

  σ 值的獲得方式 猜測﹔ 諮詢專家﹔ 由先前相似的研究中獲得﹔ 先以試測 (pilot study) 來計算。