44
12 12 第第第第第 第第第第第 12-1

第 12 章  變異數分析

  • Upload
    mikaia

  • View
    87

  • Download
    0

Embed Size (px)

DESCRIPTION

第 12 章  變異數分析. 目標. 列出 F 分配 的特徵。 進行 兩組母體變異數是否相等 的假設檢定。 討論變異數分析的一般觀念。 將資料組織、整理成 單因子變異數 分析表。 進行 3 個或 3 個以上 處理的 平均數 間之假設檢定。 建構處理 平均數間差異的信賴區間 。. F 分配的特徵. F 分配是 一個家族 。 家族特定成員是由 兩個參數 所決定: 分子的自由度 與 分母的自由度 。注意到,隨著 自由度改變 , 曲線形狀 也隨之改變。. F 分配的特徵. F 分配是連續的。 F 分配不可能為負值。 F 分配是正偏分配。 - PowerPoint PPT Presentation

Citation preview

Page 1: 第  12  章  變異數分析

第 第 12 12 章 章 變異數分析變異數分析

12-1

Page 2: 第  12  章  變異數分析

12-2

目標目標

1.列出 F 分配的特徵。2.進行兩組母體變異數是否相等的假設檢定。 3.討論變異數分析的一般觀念。4.將資料組織、整理成單因子變異數分析表。 5.進行 3 個或 3 個以上處理的平均數間之假設檢

定。6.建構處理平均數間差異的信賴區間。

Page 3: 第  12  章  變異數分析

F F 分配的特徵分配的特徵

F 分配是一個家族。 家族特定成員是由兩個參數所決定:分子的自由度與分母的自由度。注意到,隨著自由度改變,曲線形狀也隨之改變。

12-3

Page 4: 第  12  章  變異數分析

F F 分配的特徵分配的特徵

F 分配是連續的。

F 分配不可能為負值。

F 分配是正偏分配。

F 分配是漸近線。

12-4

Page 5: 第  12  章  變異數分析

比較兩組母體變異數比較兩組母體變異數 F 分配使用於進行一個常態母體之變異數是否等於另一個

常態母體變異數的假設檢定,以下例子說明之: 兩布條行裁剪機專門產長度相同之鋼條,此二部機器所生

產之鋼條平均長度應該相等。吾輩想確認此二部機器所生產鋼條平均長度是否相等,及其變異程度是否相等。

兩種股票之平均投資報酬率可能相同,但也許其中一個報酬率之變異程度很大。隨機選取十支網路股與十支能源股,其中此兩類股票平均報酬率相等,不過網路股變異程度較大。

根據大型報社行銷部門研究發現,男性與女性每天閱讀報紙的平均時間相同,但指出男性每天閱讀報紙的平均時間之變異程度是女性的兩倍。

12-5

Page 6: 第  12  章  變異數分析

比較兩組母體變異數比較兩組母體變異數對於雙尾檢定。檢定統計量為:

與 分別代表 兩組樣本的變異數。較大變異數放在分母 。分子的自由度為 n1 - 1

分母的自由度為 n2 - 1

21s

12-6

22

21

s

sF

22s

Page 7: 第  12  章  變異數分析

比較兩組母體變異數比較兩組母體變異數

若檢定統計量的值大於臨界值,則拒絕虛無假設。

12-7

Page 8: 第  12  章  變異數分析

範例範例

Lammers Limos 提供從俄亥俄州 Toledo 市中心至底特律 Metro 機場的小巴士接送服務。公司總裁正在考慮兩條路線:一條路線是經由 U.S. 25 號公路,另一條路線是經由 I-75 號公路。他想要比較此兩條路徑開車至機場所花費的時間,於是蒐集了下列資料(以分鐘為單位)。使用 0.1 顯著水準,比較開車經由這兩條路線到機場的時間變異是否不同?

12-8

Page 9: 第  12  章  變異數分析

範例 範例 continuedcontinued

12-9

Page 10: 第  12  章  變異數分析

範例 範例 continuedcontinued

U.S. 25 號公路

12-10

Page 11: 第  12  章  變異數分析

範例 範例 continuedcontinued

I-75 號公路

12-11

Page 12: 第  12  章  變異數分析

範例 範例 continuedcontinued

步驟 1 :我們從建立虛無假設與對立假設開始。由於想要了解這兩條路徑之變異程度的差異,而非找出哪一條路徑的變異程度較高,可知這個檢定是雙尾檢定。

步驟 2 :我們選擇 0.1 顯著水準。12-12

Page 13: 第  12  章  變異數分析

範例 範例 continuedcontinued

步驟 3 :此題的檢定統計量服從 F 分配。 步驟 4 :臨界值可以從附錄 B.4 (p. 549) 中獲得,將部分機率表格整理成表 12-1 。因為這個檢定屬於雙尾檢定,所以單尾內的顯著水準為 α/2 = 0.1/2 = 0.05 。此外分子的自由度為 n1 - 1 = 7 - 1 = 6 ,分母的自由度為 n2 - 1 = 8 - 1 = 7 。為了找出臨界值,自水平往表格中(表 12-1 或是附錄 B.4 )最上一列找出 0.05 顯著水準與分子自由度為 6 的那一行,接著往下找到分母自由度為 7 的那一列,其交叉點的臨界值是 3.87 。因此,決策法則是:如果樣本變異數的比例超過 3.87 ,則拒絕 虛 無 假 設 。

12-13

Page 14: 第  12  章  變異數分析

範例 範例 continuedcontinued

表 12-1 F 分配的臨界值,其中 α = 0.05

12-14

Page 15: 第  12  章  變異數分析

範例 範例 continuedcontinued

步驟 5 :最後一個步驟是計算兩樣本變異數的比例、檢定統計量的值,並做出關於虛無假設的決策。

最後決策是拒絕虛無假設,因為檢定統計量 F值是 4.23 ,大於臨界值 3.87 。我們的結論是,這兩條路徑在駕駛時間上的變異數有差異變異數有差異。

23.4)3753.4(

)9947.8(2

2

22

21

S

SF

12-15

Page 16: 第  12  章  變異數分析

檢定兩組母體變異數檢定兩組母體變異數– – Excel Excel ExampleExample

12-16

Page 17: 第  12  章  變異數分析

比較三個或三個以上母體平均數比較三個或三個以上母體平均數

F 分配尚可運用於變異數分析 (ANOVA) 上,亦就是比較三組或三組以上母體平均數是否相等。但必須有幾點假設:1.所有母體皆服從常態分配2.所有母體之標準差均相等3.所有母體相互獨立

12-17

Page 18: 第  12  章  變異數分析

比較三個或三個以上母體平均數比較三個或三個以上母體平均數 虛無假設為母體平均數相等,對立假設為至少有一個平均數不同。

檢定統計量為 F 分配。 決策法則為:若 F 統計量大於 F 分配的臨界值,則拒絕 H0 。

假設與決策法則:H0: µ1 = µ2 =…= µk

H1: 母體平均數並非全相等拒絕 H0 ,若 F > F ,k-1,n-k

12-18

Page 19: 第  12  章  變異數分析

母體平均數的 母體平均數的 ANOVA ANOVA 檢定檢定

F 分配可運用在變異數分析( ANOVA )的技巧上,亦即比較三組或三組以上的母體平均數是否相等。

12-19

Page 20: 第  12  章  變異數分析

變異數分析的步驟變異數分析的步驟

虛無假設為所有的母體平均數均相等。 對立假設為至少有一個平均數不同。 檢定統計量為 F 分配。 決策法則為若檢定統計量的值大於 F 值,則拒絕虛無假設。

12-20

Page 21: 第  12  章  變異數分析

變異數分析的步驟變異數分析的步驟 若從 k 組母體抽取樣本,則分子自由度為

k-1 。 若總共有 n 個觀測資料,則分母的自由度為 n-k 。

檢定統計量的計算公式為:

12-21

knSSE

kSSTF

1

為每一個處理的平均數與總平均數間差異平方的總和

每個觀測值與處理平均數間差異平方的總和

Page 22: 第  12  章  變異數分析

變異數分析的步驟變異數分析的步驟

SS Total :每個觀測值與總平均數間差異平方的總和。

12-22

n

XX

22 )(

totalSS

Page 23: 第  12  章  變異數分析

變異數分析的步驟變異數分析的步驟

SST 為每一個處理的平均數與總平均數間差異平方的總和。

其中 Tc 為行總和, nc 為每一行的觀測資料總和, X 為所有觀測資料總和,以及 n 為觀測資料的組數。

12-23

n

X

n

TSST

c

c22

Page 24: 第  12  章  變異數分析

變異數分析的步驟變異數分析的步驟

SSE 每個觀測值與處理平均數間差異平方的總和。

SST = SS total - SSE

12-24

Page 25: 第  12  章  變異數分析

範例範例

Joyce Kuhlman 為某區域金融中心經理。她希望比較三位員工的生產率,也就是衡量他們服務客戶的數量。現在分別隨機選取 4 天,這三位員工服務的客戶數量的資料,如下表所示:

這三位員工服務客戶的平均數量是否有差異?當處理間的平均數有差異時,圖 12-1 描繪了其母體的形態。請注意母體服從常態分配,且每組母體的變異數皆相同,但是平均數不相同。

12-25

Page 26: 第  12  章  變異數分析

範例範例 continuedcontinued

圖 12-1 各處理間平均數有差異的情況

12-26

Page 27: 第  12  章  變異數分析

範例 範例 continuedcontinued

圖 12-2 各處理間平均數相同的情況

12-27

Page 28: 第  12  章  變異數分析

範例範例

最近航空公司改變某些服務,例如班機內餐點及零食,對過重行李也開始收取費用。 Brunner 行銷調查公司針對四家航空公司的乘客滿意度做調查, 25 道問題的評等皆分為:極佳,好,普通,差。而以上的等級用分數表示為 4 , 3 , 2 , 1 。再把這 25 道問題的分數加總,就得到乘客滿意度的指標。分數越高,乘客滿意度就越高。滿分為 100 分。 Brunner 行銷調查公司對四家航空公司的乘客做調查,下頁表是樣本資料。在這四家航空公司中,乘客的平均滿意度是否有差異?請使用 0.01 的顯著水準。

12-28

Page 29: 第  12  章  變異數分析

範例範例 continuedcontinued

12-29

Page 30: 第  12  章  變異數分析

範例 範例 continuecontinuedd

步驟 1 :建立虛無假設與對立假設 H0 : μ1 = μ2 = μ3 = μ4

H1:這四家航空公司的平均分數不全相等 步驟 2 :選擇信賴水準。我們使用 0.01 顯著水準。

步驟 3 :判斷檢定統計量。檢定統計量服從 F 分配。

12-30

Page 31: 第  12  章  變異數分析

範例範例 continuedcontinued

步驟 4 :制定決策法則。首先必須找出臨界值,查閱附錄 B.4 找出 F 分配的臨界值。為了使用這個表格,必須先求得分子與分母的自由度。分子的自由度等於處理的數量 k ,減去 1;分母的自由度等於觀測資料的總數量 n ,減去處理的數量 k 。本題中,共有 4 個處理及 22 個觀測資料。

分子的自由度 = k - 1 = 4 - 1 = 3

分母的自由度 = n - k = 22 - 4 = 18

查閱附錄 B.4 與 0.01 顯著水準。水平移動找到分子自由度為 3 的那一行,再往下移動找出分母自由度 18 的那一列,得交叉點 5.09 為臨界值。如果檢定統計量 F 的值超過 5.09 ,則拒絕 H0。

12-31

Page 32: 第  12  章  變異數分析

範例 範例 continuedcontinued

步驟 5 :選擇樣本,進行計算,並做出決策。

12-32

Page 33: 第  12  章  變異數分析

範例範例 continuedcontinued

接下來是 SS total 與 SSE 的詳細計算。

12-33

Page 34: 第  12  章  變異數分析

範例 範例 continuedcontinued

接著,求每個觀測資料與總平均的差異,把差異平方再加總。

12-34

Page 35: 第  12  章  變異數分析

範例範例 continuecontinuedd

最後,把上頁表這些差異做平方再加總,例如,第一個乘客:

仿照公式 [12-2] 把差異平方再加總,得到 SS total 的值。

12-35

Page 36: 第  12  章  變異數分析

範例 範例 continuedcontinued

計算 SSE ,先求每個觀測資料與其處理平均的差異。

12-36

Page 37: 第  12  章  變異數分析

範例 範例 continuedcontinued

將上頁表的每個值平方再加總,所得到的值如下表:

所以, SSE 的值是 12-37

41.594)( 2 cXX

Page 38: 第  12  章  變異數分析

範例 範例 continuedcontinued

由於不同處理所產生的差異平方和。公式如下:

SST = SS total - SSE

所以,這個範例 SST 的值是 SS total - SSE = 1,485.09 - 594.41 = 890.68

12-38

Page 39: 第  12  章  變異數分析

範例範例 continuedcontinued

處理的均方和( mean square for treatments )為 SST 除以其自由度,記為 MST ;誤差均方和( mean square for error )等於 SSE 除以其自由度,記為 MSE 。而 F 值等於 MST 除以 MSE 。

計算出 F 值,並代入 ANOVA 表格,如下表:

12-39

Page 40: 第  12  章  變異數分析

範例 範例 continuedcontinued

計算出的 F 值為 8.99 ,比臨界值 5.09 大,所以拒絕虛無假設。結論是母體平均數不全相等,也就是這四家航空公司的平均分數不全相同。然而,在此只能說處理的平均數有差異,但無法判定哪幾個處理間的平均數有差異或是多少個處理有差異。

12-40

Page 41: 第  12  章  變異數分析

處理平均數的推論處理平均數的推論

當拒絕平均數均相同的虛無假設時,也許想要了解處理間平均數的差異。

使用信賴區間是最簡單的一種方式。

12-41

Page 42: 第  12  章  變異數分析

有關成對處理平均數的推論有關成對處理平均數的推論

其中 t 為自由度 n - k

MSE = [SSE/(n - k)] 下的 t 值。

X X t MSEn n1 2

1 2

1 1

12-42

Page 43: 第  12  章  變異數分析

Confidence Interval for the Confidence Interval for the Difference Between Two Means - ExampleDifference Between Two Means - Example

12-43

承襲上一個範例,請發展一個針對 Eastern and Ozark滿意度調查之 95%信賴區間。吾輩可以結論其顧客滿意度具有差異嗎?

95%信賴區間自 10.46 至 26.04 ,兩個極限點皆為正數,因此可以結論這些處理(航空公司)有極大差異,亦就是Eastern 與 Ozark 的旅客之服務滿意度評價迥異。

Page 44: 第  12  章  變異數分析

Excel ExampleExcel Example

12-44