第 14 章迴歸分析與複迴歸分析

企業研究方法第企業研究方法第 14 14 章章 11

第第 1414 章迴歸分析與複迴歸分析章迴歸分析與複迴歸分析

　　　　 1.1. 使用迴歸分析的時機使用迴歸分析的時機

　　　　 2.2. 最小平方法在迴歸分析上的意義最小平方法在迴歸分析上的意義

　　　　 3.3. 迴歸分析的假設迴歸分析的假設

　　　　 4.4. 各種各種 R²R² 與偏判定與偏判定

　　　　 5.5. 報表的分析與管理上的意涵報表的分析與管理上的意涵

　　　　 6.6. 逐步迴歸逐步迴歸

本章的學習主題


一般來說，我們利用迴歸分析是想瞭解：一般來說，我們利用迴歸分析是想瞭解：1.1.能否找出一個線性方程式，用來說明一組預測變能否找出一個線性方程式，用來說明一組預測變數數 ( ( Xi Xi )) 與效標變數與效標變數 ( ( Y Y )) 的關係。的關係。

2.2.瞭解這個方程式的預測能力如何？即其關係強度瞭解這個方程式的預測能力如何？即其關係強度有多大。有多大。

3.3.整體關係是否達到顯著水準？整體關係是否達到顯著水準？4.4.在解釋效標變數的變異時，是否只採用某些預測在解釋效標變數的變異時，是否只採用某些預測變數即具有足夠的預測力。變數即具有足夠的預測力。

14.1 14.1 迴歸分析的基本統計概念迴歸分析的基本統計概念


一般而言，迴歸模式的型態為：一般而言，迴歸模式的型態為：Y=α + βY=α + β11XX11 + β + β22XX22 + …… .+ β + …… .+ βmmXXmm + ε + ε

其中，其中， αα 與與 ββ 為迴歸母數為迴歸母數 (j(j ＝＝ 1, 2, ……, m)1, 2, ……, m) ，， εε 為誤差項。為誤差項。而在迴歸分析中，如果預測變數而在迴歸分析中，如果預測變數 (X(Xii)) 只有一個，則稱之為簡只有一個，則稱之為簡單迴歸分析。如果預測變數有二個以上，則稱為多元迴歸或單迴歸分析。如果預測變數有二個以上，則稱為多元迴歸或複迴歸分析。複迴歸分析。

YY = = a a + + bb11XX11………..(………..( 簡單迴歸簡單迴歸 ))

YY = = aa + + bb11XX1 +1 +bb22XX22+……++……+bbmmXXm (m ( 複迴歸複迴歸 ))

14.2 14.2 簡單迴歸與複迴歸簡單迴歸與複迴歸


14.3 14.3 迴歸分析的基本假定迴歸分析的基本假定

1. 1. 常態性與變異同質性常態性與變異同質性(normality and equality of variance)(normality and equality of variance)

2. 2. 殘差獨立性殘差獨立性 (independence)(independence)

每個殘差彼此之間是統計獨立的，觀察值每個殘差彼此之間是統計獨立的，觀察值之間彼此不會互相影響，若違反此假設，估之間彼此不會互相影響，若違反此假設，估計量會缺乏效率性。計量會缺乏效率性。



3. 3. 直線性直線性 (linearity)(linearity)

即所有抽樣樣本分配的平均數即所有抽樣樣本分配的平均數 ((μμY/Y/

XX) ) 均落在母群迴歸線上均落在母群迴歸線上 4. e4. eii ～～ NN 〔〔 0 ,1 0 ,1 〕〕誤差其分配服從平均數為誤差其分配服從平均數為 00 ，變異數，變異數

為為 11 的常態分配，且各誤差項間彼此獨的常態分配，且各誤差項間彼此獨立立



迴歸方程式滿足迴歸的基本假設，則此迴歸方程式具有線性特性，並稱為線性迴歸。

圖 14 - 1 線性迴歸模型


14.4 14.4 最小平方法最小平方法

求取最適合迴歸線的方法即為最小平方法，而最求取最適合迴歸線的方法即為最小平方法，而最小平方法即是使各點至此線之平行於Ｙ軸的距離小平方法即是使各點至此線之平行於Ｙ軸的距離的平方和變為最小的求解方法，即：的平方和變為最小的求解方法，即：

或或2)ˆ( YYMin

2)( bXaYMin


　根據現有的資料建立一個迴歸模式時，　根據現有的資料建立一個迴歸模式時，必須檢定此模式與資料的符合程度，稱必須檢定此模式與資料的符合程度，稱為適合度為適合度 (goodness of fit)(goodness of fit) 。檢定適。檢定適合度最常用的量數是合度最常用的量數是 R² (R- square)R² (R- square) ，，或稱判定係數或稱判定係數 (coefficient of determi(coefficient of determi

nation)nation) 。　。　

14. 5 14. 5 迴歸模式之適合度及判定係數迴歸模式之適合度及判定係數


　樣本的　樣本的 R² R² 是估計模式適合度的一個最佳是估計模式適合度的一個最佳估計值，但卻非母群估計值，但卻非母群 R² R² 的不偏估計值。的不偏估計值。因此要估計母群的因此要估計母群的 R²R² 時，須加以調整。因時，須加以調整。因此應改用修正後的此應改用修正後的 R² (Adj-R²) R² (Adj-R²) 會比較正會比較正確。確。

14. 5 14. 5 迴歸模式之適合度及判定係數迴歸模式之適合度及判定係數


14.6 14.6 偏判定偏判定

上式Ｆ檢定，分子代表模型加入變數後，解釋能力上式Ｆ檢定，分子代表模型加入變數後，解釋能力提高的部份，而分母則代表加入變數後，仍無法解提高的部份，而分母則代表加入變數後，仍無法解釋的部份。若Ｆ值顯著則代表變數確實有明顯的解釋的部份。若Ｆ值顯著則代表變數確實有明顯的解釋效果，可加入迴歸模型中。釋效果，可加入迴歸模型中。

4,,

1),|(

321

213

nXXXSSE

XXXSSRF


14.7 14.7 共線性共線性

若迴歸式若迴歸式 Y=a+bY=a+b11XX11+b+b22XX22++ ．．．．．． +b+bmmXX

mm ，則其共線性是指當某一個自變數與其，則其共線性是指當某一個自變數與其他的自變數之具有高度相關他的自變數之具有高度相關 (( 例如例如 X1 X1 與與 X2)X2) 。。

共線性分析可讓我們檢查共線性資料是否共線性分析可讓我們檢查共線性資料是否存在並評估共線性是否影響參數的建立。存在並評估共線性是否影響參數的建立。　　　　


14.7 14.7 共線性共線性

共線性的後果：共線性的後果：

(1) (1) 即使變數不斷的增加，判定係數大小還是難以增加。即使變數不斷的增加，判定係數大小還是難以增加。(2) (2) 難以分辨個別解釋變數的解釋能力。難以分辨個別解釋變數的解釋能力。

(3) (3) 以最小平方法以最小平方法 (OLS)(OLS) 求出的估計量雖仍是最佳線性求出的估計量雖仍是最佳線性不不

偏估計量偏估計量 (BLUE)(BLUE) ，但估計數的變異變大，但估計數的變異變大 (VIF(VIF 增增加加 )) ，，

會使得估計不準。會使得估計不準。

(4) (4) 由於變數間之相關性，迴歸係數符號有時會錯誤。由於變數間之相關性，迴歸係數符號有時會錯誤。


14.7 14.7 共線性共線性2.2. 共線程度的判斷：共線程度的判斷： (1) (1) 看相關係數矩陣，若相關係數大於看相關係數矩陣，若相關係數大於 0.90.9 ，此兩個變數便，此兩個變數便

有有

共線性的嫌疑。共線性的嫌疑。

(2) (2) 允差允差 (Tolerance value)(Tolerance value) ：把單一解釋變數當被解釋變：把單一解釋變數當被解釋變數，把其他解釋變數當做依變數進行迴歸，允差值越數，把其他解釋變數當做依變數進行迴歸，允差值越

小，代表越有共線性的可能，一般最低要求為允差必小，代表越有共線性的可能，一般最低要求為允差必須須

大於大於 0.50.5 。。

(3) VIF (variance inflation factor)(3) VIF (variance inflation factor) ：允差的倒數，即：允差的倒數，即 VIF=1/VIF=1/ 允差，因此若允差，因此若 VIFVIF 大於大於 22 代表有共線性的可能，代表有共線性的可能，

一一

般要求般要求 VIFVIF 要小於要小於 22 。。


14.7 14.7 共線性共線性

3.3. 共線性之解決方法：共線性之解決方法：

(1) (1) 刪去有共線性可能的解釋變數，進行迴歸分析。刪去有共線性可能的解釋變數，進行迴歸分析。

(2) (2) 就整體模式，將模式直接引用作為預測值計算就整體模式，將模式直接引用作為預測值計算

之用，而不要去解釋個別變數之迴歸係數。之用，而不要去解釋個別變數之迴歸係數。

(3) (3) 直接探討每個解釋變數與被解釋變數之間的相直接探討每個解釋變數與被解釋變數之間的相

關係數，而不做整體模式之解釋。關係數，而不做整體模式之解釋。


14.8 14.8 迴歸的殘差分析迴歸的殘差分析

在在 Y=Y=αα + + βXβXi + i + εεii 式中，式中， εεii 稱為誤差稱為誤差 (( 殘差殘差 )) ，而，而誤差項間彼此是否獨立不僅影響了迴歸的基本假誤差項間彼此是否獨立不僅影響了迴歸的基本假設，也影響了迴歸式的好壞。設，也影響了迴歸式的好壞。

為了鑑定誤差項是否獨立，可計算杜賓－瓦特森統為了鑑定誤差項是否獨立，可計算杜賓－瓦特森統計值計值 (( 簡稱簡稱 DWDW 值值 )) ，或者觀察誤差值的分佈型，或者觀察誤差值的分佈型態，或檢查誤差值的正負符號。態，或檢查誤差值的正負符號。

實務上，ＤＷ值如果介於實務上，ＤＷ值如果介於 1.51.5 到到 2.52.5 之間，即表示之間，即表示誤差項之間並無自我相關現象存在。誤差項之間並無自我相關現象存在。


ε 與 X呈隨機分佈，表示迴歸模式與其基本假設並無明顯的違背。

迴歸方程式非線性，即 Y＝ α＋ βＸ不存在，此時我們可用取、或補救。

圖 14-2 迴歸殘差分析


+

－

0

+

－

0


ε ｉ非獨立，與Ｘ有關。

變異數非齊一。


圖 14-2 迴歸殘差分析

+

－

0

+

－

0


14.9 14.9 迴歸模式的調整迴歸模式的調整

圖中虛線代表一般無偏誤的觀察值，而實線則代表偏誤值。虛線部份代表實際上應產生的迴歸線，但因偏誤值的原因，而產生實線部份斜率改變的錯誤結果。

若偏誤值的數值太大，更有可能產生如左圖般整條迴歸線完全被扭曲的不良情形。

圖 12-4 極端偏誤值影響模型之預測

x

y

y

圖 14-3 極端偏誤值影響模型之探討


14.10 14.10 複迴歸分析之決定過程複迴歸分析之決定過程

步驟一：複迴歸分析之目的步驟一：複迴歸分析之目的(1)(1) 最大化解釋變數的預測能力。最大化解釋變數的預測能力。(2)(2) 比較兩組以上解釋變數的預測能力。比較兩組以上解釋變數的預測能力。

步驟二：複迴歸分析之研究設計步驟二：複迴歸分析之研究設計(1) (1) 檢定力與樣本大小檢定力與樣本大小 (2) (2) 解釋變數的固定與隨機效果解釋變數的固定與隨機效果 (3) (3) 創造額外的變數創造額外的變數



步驟三：複迴歸分析之假設步驟三：複迴歸分析之假設在進行複迴歸分析時，最基本的假設包括在進行複迴歸分析時，最基本的假設包括(1)(1) 常態性與變異同質性，常態性與變異同質性， (2)(2) 殘差獨立殘差獨立性，性， (3)(3) 直線性。直線性。

步驟四：估計迴歸模式與評量模式適合度步驟四：估計迴歸模式與評量模式適合度在推估迴歸模式時，首先要檢視迴歸變量在推估迴歸模式時，首先要檢視迴歸變量是否符合迴歸假設是否符合迴歸假設



步驟五：解釋迴歸變量步驟五：解釋迴歸變量迴歸變量之解釋通常利用迴歸變量之解釋通常利用 BetaBeta 係數來解釋，一般係數來解釋，一般

是將解釋變數在估計之前先做標準化的動作，是將解釋變數在估計之前先做標準化的動作，以避以避

免每個變數使用不同衡量單位的問題。免每個變數使用不同衡量單位的問題。

步驟六：結果的確認步驟六：結果的確認在利用迴歸模型進行預測時，誤差除了原本樣本的在利用迴歸模型進行預測時，誤差除了原本樣本的

誤差外，抽樣誤差也可能影響模型之解釋力。誤差外，抽樣誤差也可能影響模型之解釋力。



在多元迴歸中，我們必須決定預測變數進在多元迴歸中，我們必須決定預測變數進入迴歸模型之順序，通常有以下幾種方法入迴歸模型之順序，通常有以下幾種方法可供選擇：可供選擇：

(1) (1) 強迫進入法強迫進入法 (enter)(enter)

(2) (2) 強迫去除法強迫去除法 (remove)(remove)

(3) (3) 順向選擇法順向選擇法 (forward)(forward)

(4) (4) 反向淘汰法反向淘汰法 (backward)(backward)

(5) (5) 逐步選擇法逐步選擇法 (stepwise)(stepwise)



1.1. 用順向選擇法時，第一個進入迴歸方程式的變數用順向選擇法時，第一個進入迴歸方程式的變數是與依變數有最大相關的變數，第一個變數進入是與依變數有最大相關的變數，第一個變數進入模型之後，再以判定係數值模型之後，再以判定係數值 (F) (F) 檢查第二個變數檢查第二個變數該誰進入，依此類推，直到沒有其他的變數符合該誰進入，依此類推，直到沒有其他的變數符合選取的標準為止。選取的標準為止。

2.2. 用反向淘汰法時，先將所有的變數放入迴歸方程用反向淘汰法時，先將所有的變數放入迴歸方程式中，然後根據淘汰標準一一將不符合標準的變式中，然後根據淘汰標準一一將不符合標準的變數加以淘汰。數加以淘汰。


14.11 14.11 選擇預測變數的程序選擇預測變數的程序

3.3. 逐步選擇法是結合順向選擇法與反向淘汰法二逐步選擇法是結合順向選擇法與反向淘汰法二種程序。首先採用順向選擇法，選進與依變數種程序。首先採用順向選擇法，選進與依變數有最大相關的變數，接下來以反向淘汰法檢查有最大相關的變數，接下來以反向淘汰法檢查此變數是否須加以排除。此變數是否須加以排除。

為了避免相同的變數重複地被選進或排除，選為了避免相同的變數重複地被選進或排除，選進的標準必須小於淘汰的標準，或者我們可以進的標準必須小於淘汰的標準，或者我們可以說選進變數的Ｆ值大於淘汰變數的Ｆ值。說選進變數的Ｆ值大於淘汰變數的Ｆ值。


圖 14 - 4 選擇預測變數之進入程序

X5

X3

Y

在單純使用 X3 變數來解釋 Y 時，因為不能完全解釋，因此我們加入 X5

變數來增加模型的解釋效果。但因為 X3 與 X5 有重複解釋的部份，因此我們得先確定兩個變數的效果，來決定由何變數先進入模型。


14.12 14.12 迴歸模型範例（簡單迴歸）迴歸模型範例（簡單迴歸）

YY（組織知識管理績效（組織知識管理績效）＝）＝ 1.481 1.481 ＋＋ 0.680 × 0.680 × 顧客顧客資本資本

模式模式未標準化係數未標準化係數B B 之估計值之估計值標準誤標準誤標準化係數標準化係數

Beta Beta 分配分配 tt 顯著性顯著性

(( 常數常數 )) 1.4811.481 0.2630.263 —— 5.6275.627 0.0000.000

顧客資本顧客資本 ICIC_CF_CF 0.6800.680 0.0510.051 0.6490.649 13.42813.428 0.0000.000

RR 0.6490.649

RR22 0.4210.421

Adj- RAdj- R22 0.4190.419

FF 180.311180.311

D-WD-W 2.0632.063


14.12 14.12 迴歸模型範例（複迴歸）迴歸模型範例（複迴歸）YY＝＝ 0.9680.968 ＋＋ 0.155×0.155× 顧客資本顧客資本 +0.605×+0.605× 人力資本－人力資本－ 0.026×0.026× 結構資結構資本本 (1)(1)

＋＋ 0.091×0.091× 結構資本結構資本 (2)(2)依變數依變數 == 知識管理績效知識管理績效未標準化係數未標準化係數

之之 BB 之估計值之估計值標準化係數標準化係數之之 Beta Beta 分配分配 tt 顯著性顯著性

(( 常數常數 )) 0.9680.968 －－ 4.5224.522 0.0000.000

顧客資本顧客資本 (IC_CF)(IC_CF) 0.1550.155 0.1480.148 2.5892.589 0.0100.010

人力資本人力資本 (IC_HF)(IC_HF) 0.6050.605 0.6310.631 9.7539.753 0.0000.000

結構資本之交易成本導向結構資本之交易成本導向(IC_SF1)(IC_SF1) -0.026-0.026 -0.029-0.029 -0.630-0.630 0.5290.529

結構資本之創新運作導向結構資本之創新運作導向(IC_SF2)(IC_SF2) 0.0910.091 0.1030.103 1.5441.544 0.1240.124

RR22 0.6610.661

FF 117.482117.482

PP 0.0000.000

Adj RAdj R22 0.6550.655

D-WD-W 2.1542.154

Documents

第 14 章 迴歸分析與複迴歸分析

第 14 章迴歸分析與複迴歸分析