卡方考驗

  • View
    43.147

  • Download
    0

  • Category

    Business

Preview:

DESCRIPTION

卡方考驗

Citation preview

卡方考驗 -百分比考驗

指導教授:荊溪昱 教授學 生:許惠珍 M9671107學 生:謝宗良 M9671114

日常生活中使用的 χ2 統計方法

• 水果日報想瞭解台北市民的政黨傾向,他隨機抽樣了台北市滿二十歲以上的公民 1100 位,其中省籍的部份:外省籍 355 位、本省籍 730 位、其它 15 位;政黨傾向的部份:泛藍 581 位、泛綠 511 位、無黨或不表態 8 位。

• 如果想瞭解省籍與政黨傾向之間的關係,即可利用卡方分析來解釋,當跑出來的 P 值小於 .05 (即兩者間的差異已達顯著的標準了),即表示政黨傾向會因為省籍而有所差異。

• 隨機抽樣:無母數• 省籍人次、政黨傾向人次:名義變項

壹、使用場合

• 1. 研究者探討的變項是兩個間斷變項 (名義變項或次序變項)的問題。• 2. 無需對母數進行假設考驗,僅對母體 分配做一個或 N 個假定。• 3. 此時採用統計方法即為 χ2 檢定(卡方 檢定)

註: χ2 的發音是 { kai square}

壹、使用場合

例如:• 1. 教師性別(男女教師)對行政人員(男女行 政人員)之偏好度是否有所不同?• 2. 不同社經地位(高、中、低社經)的家庭對 政府施政滿意度(非常滿意、滿意、無意 見、不滿意、非常不滿意)是否有所不同※ 以上涉及有關名義變項或次序變項的資料採用

卡方統計來進行推論統計之檢定。

名詞解釋• 名義變項:數字是用來命名或分類。如 Lexus RX300 代 表車名。• 次序變項:數值本身即具有大小之分,如第一名、第 二名、第三名。• 等距變項:數值本身具大小之分,但其間的比率不具 意義。如攝氏 30 度並非比攝氏 15 度熱兩倍。• 比率變項:數值具有大小之分,其間比率具有數學意義。如十秒 是五秒的兩倍長。• 間斷變項:以數值代表任何事件。(如名義變項或次序變項都是 一種間斷變項)• 連續變項:數值與數值之間都具有意義。(如等距變項或比率變 項都是一種連續變項)

貳、使用目的• 卡方考驗的定義公式

• fo :是觀察次數 也就是實際次數(指調查研究 中實際獲得的有效樣本的人次或次數)• fe :是期望次數也稱為理論次數(指根據統計理論所 推估出來的人數或次數)

e

e

f

ffx

202

參、常見的四種卡方考驗

卡方檢定常見的應用可分為下列四種

• 1. 適合度考驗( good-of-fit test)• 2.百分比同質性考驗( test of homogeneity)• 3.獨立性考驗( test of independence )• 4.改變的顯著性考驗( test of significance of change )

參 -1 、適合度考驗( good-of-fit test)

一、適合度考驗( good-of-fit test)• 定義:研究者關心某一個變項是否與某個理論分配或

母群分配相符合之時,所進行之卡方考驗。

• 公式: χ2=

• 因為只根據樣本在某一名義或次序變項上的反應所進行的分析,又稱為「單因子考驗」。

K

i fe

fefo

1

2)(

參 -1 、適合度考驗( good-of-fit test)

• 例題: 某位校長想了解教師對運動會服裝的五種款式看

法是否有所差異,此校長隨機訪談該校六十位老師… .. 。

*理論上每種服裝款式被選擇的人數為: 60÷5=12 , 12 稱為期望次數。*但實際調查結果是否與期望次數相符合,則需加

以考驗,稱之為適合度考驗。

參 -1 、適合度考驗( good-of-fit test)

此研究問題的假設:• 虛無假設 H0 為:「教師對五種服裝款式的喜

好程度沒有不同」• 對立假設 H1 為:「教師對五種服裝款式的喜

好程度有所不同」• 若計算出 p值小於 .05 的顯著水準,則拒絕虛

無假設,接受對立假設。反之若p值大於 .05 的顯著水準,則接受虛無假設。

參 -2 百分比同質性檢定( test of homogeneit

y) 二、百分比同質性檢定( test of homogeneity)• 定義:主要目的在檢定由二個間斷變項所交叉構成的列聯表中各細格的百分比是否有所差異。

• 列聯表通常都由 I個列變數及 J個行變數所構成 I×J個細表格(或交叉表)。

(行變數 J)社經地位高社經地位 中社經地位 低社經地位

(列變數 I)教養方式

民主式 細格 細格 細格

權威式 細格 細格 細格

放任式 細格 細格 細格

參 -2 百分比同質性檢定( test of homogeneity)

二、百分比同質性檢定( test of homogeneity)• 例題:如不同社經地位的家庭(分為高社經地位、中

社經地位、低社經地為),其家庭的教養方式(分為民主、權威、放任)是否有所差異?

• 在上述的問題中有兩個間斷變項中有一個變項是研究者事先所進行操弄得自變項或比較的類別變項,此一變項稱為「設計變項」(如社經地位)

• 另一變項是研究者想要分析或探討的變項稱為「反應變項」。

參 -2 百分比同質性檢定( test of homogeneity)

二、百分比同質性檢定( test of homogeneity)• 續上題• 設計變項(社經地位 J=3 ,表示三個母群或組別) J個類別的邊緣總次

數或總人數是固定的,即在研究計畫前已事先決定。(紅色部分)• 細格內的資料需視實際調查得到的次數或人數而定。• 自由度等於( I-1 )×(J-1)

  (行變數 J)社經地位

高社經地位 中社經地位 低社經地位 樣本人數

(列變數I)教養方式

民主式 37 24 19 80

權威式 17 33 20 70

放任式 16 13 11 40

總計 70 70 50190(總人數)

參 -2 百分比同質性檢定( test of homogeneity)

二、百分比同質性檢定( test of homogeneity)• 續上題• 假設樣本在 I變項反應的百分比因 J變項群體的不同

而有顯著差異,若卡方檢定結果達顯著,則要進行「事後比較」( a posteriori comparisons )以找出是哪兩組的百分比有顯著差異。

參 -3 獨立性檢定( test of independence )

三、獨立性檢定( test of independence )• 定義:同一個樣本的兩個變項之關聯情形的考驗。• 在 I×J的交叉表中,當兩個變項都是反應變項時,研究者所關心

的是自母群中取樣而來的一組樣本,在此樣本數中的這兩個變項間是否互為獨立。

• 進行獨立考驗時,只有總人數 N 事先知道,其他細格人數或邊緣人數均由調查決定

  (行變數 J)社經地位

高社經地位 中社經地位 低社經地位 樣本人數

(列變數I)教養方式

民主式 37 24 19 80

權威式 17 33 20 70

放任式 16 13 11 40

總計 70 70 50 190(總人數)

參 -3 獨立性檢定( test of independence )

三、獨立性檢定( test of independence )

• 公式: χ2=

• 例題:研究者隨機抽取 420 名學生,探究學生的七大休閒活動類型是否與學生的社經地位有所關聯?

• 樣本數 N= 420• X 變項:七大休閒活動類型• Y變項:社經地位• 檢視兩個反應變項( X 與 Y)是否互為獨立。

c

j

r

i fo

fefo

1

2

1

)(

參 -3 獨立性檢定( test of independence )

三、獨立性檢定( test of independence )• 獨立性考驗的結果如果二個變項間的關係達到

顯著後,則需要進行二個變項關聯性強度與性質的檢定

• 其分析目的在於檢定二個變項間之相關,而非探討自變項在依變項上的差異。(因為沒有操弄的變項?)因此獨立性考驗不用像百分比同質性一樣進行事後比較。

參 -3 獨立性檢定( test of independence )

三、獨立性檢定( test of independence )• 關聯性強度檢定可分為下列三種:• 1.Phi ( φ)係數 :適用於 2×2列聯表

公式: N :樣本數

※注意事項:當兩個類別變項有任何一個超過二個水準, 卡方值可能會比樣本數還大, φ值可能超出 0~1 的範圍,若採用列聯係數則可以改善此 問題。

N

x 2

參 -3 獨立性檢定( test of independence )

2.列聯係數( Contingency Coefficient): • 使用時機:用於 3×3 、 4×4、 5×5..列聯表。

公式:

※注意事項:當樣本數愈大時,列聯係數值會減少,則Cramer’s V 係數可以修正此問題

Nx

xC

2

2

參 -3 獨立性檢定( test of independence )

3.克瑞瑪V( Cramer’s V)係數:• 使用時機:適用於 2×3 、 3×2 、 2×4、 3×4...列聯

表。

• 公式: m:行數與列數中取較小者

• 關聯係數介於 0~1 之間,當二變項關聯性係數檢定值愈接近 1 ,表示二變項的關聯性愈強 ;反之其值愈接近 0 ,表示兩關聯性愈弱。

• 兩變項間關聯性質檢定可採用「預測關聯性指標」 Lambda ( λ)係數 來檢核。

12

mN

xV

參 -3 獨立性檢定( test of independence )

• Lambda ( λ)係數:• 原理:當兩變項間有關聯存在時,則知道樣本在某一變項訊息,將有助於預測樣本在另一變項的訊息。(可藉此找出另一個)

• Lambda ( λ)係數以「削減誤差比 ,PRE 」來計算關聯係數。 E1=不知 X 變數去預測 Y所產生的誤差

• 公式: E2= 知道 X 變數直接預測 Y所產生的誤差

• Lambda ( λ)值介於 0~1 間,當 λ值愈高,表示以某一變項去解釋另一個變項時有效預測的正確比例便高。

• 當 λ = 0 ,表示自變項在預測依變項時沒幫助。• 當 λ = 1 ,表示自變數能完全解釋依變數。

1

2

2

21 1E

E

E

EEPRE

參 -3 獨立性檢定( test of independence )

• λ係數的原理係基於當兩個變項有關聯存在時,知道樣本在某一變項的訊息,將有助於預測在另一變項的訊息

問題研究:• 師範院校生畢業生的分發係根據在校生四年成績而定。有一研究者發現師院女生的成績似乎比男生較優因此他想了解師院結業生

參 -3 獨立性檢定( test of independence )

• 在選擇服務學校時,性別與分發學校所在地(分城市、鄉鎮及偏遠三類 )間的關係如何?他隨機抽取 120 學生進行調查結果如下表

城市 鄉鎮 偏 遠 ROW

男 3 41 19 6352.5%

女 16 38 3 5747.5%

COLUMN

1915.8%

7965.8%

2218.3%

120100.0%

參 -3 獨立性檢定( test of independence )

• 在本例中,當知道樣本服務所在地時, λ係數為 .22807 ,表示『當知道樣本服務所在地時,可增加預測樣本性別之正確性達 22.81%』。

• 也就是說,如果我們不知道樣本的服務所在地為何,而要預測樣本的性別時,最好預測男性(因為此類的邊際次數達 63 次,佔全部 52.5%) ,但是當我們知道樣本服務學校所在時,則我們的預測正確性會提高。亦即,樣本若服務於城市學校,我們會預測其為女性 (因細格次數 16是該縱行最高 )

參 -3 獨立性檢定( test of independence )

• λ 係數的計算原理• 當要預測橫列變項 (本例為性別 )時,系將各縱行細格

次數最多的相加,減去橫列邊際次數最高者,在除以總樣本數減橫列邊際次數最高者。

• λ=﹝(16+41+19)-63﹞/(120-63)=.22807• 反之,要預測縱行變項 ( 服務學校所在地 ) ,則將各橫列細格次數最多的相加,減去縱行邊際次數最高,再除以總樣本減縱行邊際次數最高。

• λ=﹝(41+38)-79﹞/(120-79)=0• 所以就算我們知道樣本的性別,也無法提高預測其服務學校所在地的正確性。

參 -3 獨立性檢定( test of independence )

• Tau(Tau-y)係數• 定義:適用於當 X 與 Y兩變項可以區分為何種為自變項、

何種為依變項(非對稱式變項)時使用。• Kendall’s tau-b值 P :一致的配對組總數

Q:不一致的配對組總數 τb= • • 在 R×C列聯表中,當 R=C且沒有一個邊緣次數等於

0 ,則 τb 值可能介於 -1~1 之間。• Kendall’s tau-c值• τc=

))(( TyQPTxQP

QP

)1(

)(22

m

QPm

N

參 -4 改變的顯著性檢定( test of significance of chang

e )

四、改變的顯著性檢定( test of significance of change )

• 定義:主要用於考驗同一群受試者對一件事情前後二 次反應之間的差異情形。• 因同一群受試者均需前後被重複測量二次,類似於「重複量數」的設計。

• 研究者唯一知道的訊息只有調查研究的總人數或總次數。

參 -4 改變的顯著性檢定( test of significance of change )

四、改變的顯著性檢定( test of significance of change )

• 例題:某位教師想了解學生對他所任教的科目,在學期初和學期中的喜愛情形是否有所改變。

• 類似此種於前後兩次測量中,態度或反應發生改變的次數或百分比是否有所差異皆可用改變的顯著考驗進行。

參 -4 改變的顯著性檢定( test of significance of change )

四、改變的顯著性檢定( test of significance of change )

• 常用於改變的顯著考驗法有兩種:

• 麥氏考驗(McNemar ) :適用於 2×2列聯表資料。

• 包卡爾對稱性考驗( Bowker’s test of symmetry): 適用於 R×C列聯表。

肆、使用 χ2 考驗的注意事項 • 當計算出的期望值< 5 時,就不適合用 χ2 考驗,因為計算出的 χ2

值將偏高而失真。• 例如:當某細格之觀察值 =6、期望值= 2 時,則 χ2= =8.0 →偏高 • 解決方式:• 1.細格合併法:若一格或數格的期望次數小於 5 ,在配合研究目的 下,可將細格合併。 例如:在學歷變項中,研究者原先分為四個水準(高中職、專 科、大學、研究所以上),隨機抽樣調查結果發現研究所以上 人數過少,分析時可將大學與研究所以上合併,統稱為「大學 以上」以提高細格的期望次數。• 2.增加樣本數 :如無法進行改變變項的分類方式,可以增加樣本

來提高期望次數。

2

)26( 2

肆、使用 χ2 考驗的注意事項• 3. 使用 Yate’s校正公式: 2×2 的列聯表檢定時,細格次數低

於 10 高於 5 使用。

校正原理: 當觀察次數大於理論次數時:觀察次數減 0.5 當觀察次數小於理論次數時:觀察次數加 0.5

• 4.費雪正確機率考驗: 2×2 的列聯表檢定時,期望次數低於 5 ,或樣本總人數低於 20 時使用。

伍、其他• eta 係數:適用於依變數為等距變數而自變數為名義變數或次序

變 數的情況。• Risk 估計:用於觀察某變數與某一特殊事件發生情況的關係。例 如:抽煙的人得到心臟病的比 例與不抽煙的人得到心 臟病的比例(或比值)• Cohen’s Kappa 係數:適用於比較兩個觀察對同一組受試者評

分的 一致性。值介於 0~1 ,直愈大一致性愈高。

• 公式:)(1

)()(

EP

EPAPK

你累了嗎?為何在公堂只打屁股,不打別的地方?

在電視上每次看見官老爺大喝一聲:「打!」公差們棒子總是朝著犯人的屁股上落下,為何在公堂只打屁股,不打別的地方?原來,從前罰打犯人,沒有明確的部位,以致很多犯人都被活活打死。

到了唐朝李世民時,有一次他在太醫處看到一幅「明堂針灸圖」,得知人體的重要器官的穴位多在胸背部,這些部位被撞擊拍打會有生命危險,他再看圖中屁股部的重要穴位就少得多了。

這對他很有啟發,後來他對刑罰中的罰打作了規定,對犯人不許鞭打胸背部,而規定屁股作為罰打的部位。從此在公堂上打屁股就傳了下來。

你累了嗎?

陸、 SPSS 分析適合度考驗一(期望次數相等)

• 適合度考驗• 藉著比較觀察次數分配和理論次數分配是否接近或相差很大(達顯著水準)。

• 適用時機:單因子分類資料

• 檢定的虛無假設( H0 )為母體屬於某種分配

陸、 SPSS 分析適合度考驗一(期望次數相等)

一、適合度考驗(期望次數相等)• 問題研究:• 某教育學習者想了解教師對「學校實施校務評鑑制度」的看法,其選項共有五個:「很不重要」、「不重要」、「無意見」、「重要」、「很重要」,共調查 242 位教師,請問教師在五個選項間的勾選次數是否有顯著的不同?

選項 很不重要1

不重要 2 無意見 3 重要 4 很重要 5

人次 45 60 20 35 82

陸、 SPSS 分析適合度考驗一(期望次數相等)

1. 期望值=總人數×每種結果的機率= 242× (1/5)=48.4

2. 卡方值 = =46.7193.自由度為 5-1=4, α= .05 顯著水準(預設值)

4. 查表(課本 498 頁)得卡方分配臨界值= 9.4885. 計算卡方統計量 46.719大於卡方分配臨界值 9.488 ,故拒絕虛無假設 H0 ,表示教師對「學校實施校務評鑑制度」的看法,在五個選項間的勾 選次數有顯著不同。

e

e

f

ffx

202

4.48

)4.4882(

4.48

)4.4835(

4.48

)4.4820(

4.48

)4.4860(

4.48

)4.4845( 22222

陸、 SPSS 分析適合度考驗一(期望次數相等)

Ans:答案Freq:次數

陸、 SPSS 分析適合度考驗一(期望次數相等)

陸、 SPSS 分析適合度考驗一(期望次數相等)

陸、 SPSS 分析適合度考驗一(期望次數相等)

陸、 SPSS 分析適合度考驗一(期望次數相等)

陸、 SPSS 分析適合度考驗一(期望次數相等)

答案

45 48.4 -3.4

60 48.4 11.6

20 48.4 -28.4

35 48.4 -13.4

82 48.4 33.6

242

很不重要不重要無意見重要很重要總和

觀察個數 期望個數 殘差

陸、 SPSS 分析適合度考驗一(期望次數相等)

描述性統計量

242 3.20 1.569 1 5答案個數 平均數 標準差 最小值 最大值

NPar 檢定

卡方檢定次數分配表

殘差=觀察個數 - 期望個數

242/5

檢定統計量

46.719

4

.000

卡方a

自由度漸近顯著性

答案

0 (.0%) 5個格 的期望次數少於 48.4。最小的期望格次數為 。

a.

陸、 SPSS 分析適合度考驗一(期望次數相等)

結論:※ 卡方值等於 46.719, P= .000<.05 ,自由度= 4。

※P 值小於 .05 的顯著水準,應拒絕虛無假設。表示教師對「學校實施校務評鑑制度」的看法,在五個選項中,勾選次數有顯著不同。

陸、 SPSS 分析適合度考驗一(期望次數相等)

• 對數模式分析在適合度考驗方面也可採用「對數模式分析」的方式,但利用對數模式分析要

新增一個變數 -「期望值」,並設定期望值的比值。

陸、 SPSS 分析適合度考驗一(期望次數相等)

陸、 SPSS 分析適合度考驗一(期望次數相等)

陸、 SPSS 分析適合度考驗一(期望次數相等)

陸、 SPSS 分析適合度考驗一(期望次數相等)

陸、 SPSS 分析適合度考驗一(期望次數相等)

資料資訊

5

0

242

5

0

0

5

有效遺漏加權有效

觀察值

定義細格結構零取樣零

細格

答案類別

個數

一般 Loglinear

收斂資訊a,b

20

.00100

.00000

.00000

0c

疊代數目的最大值收斂允差最終最大絕對差異最終最大相對差異疊代數

Poisson模式:a. \ + expect設計 : 常數b.

因為最初的估計值是根據「僅常數」模式,此模式是是目前的模式,因此不需要疊代。

c.

類別變數

陸、 SPSS 分析適合度考驗一(期望次數相等)

適合度檢定a,b

47.649 4 .000

46.719 4 .000

概似比Pearson 卡方

數值 df Sig。

Poisson模式:a. \ + expect設計 : 常數b.

細格計數和殘差a,b

45 18.6% 48.400 20.0% -3.400 -.489 -.546 -.495

60 24.8% 48.400 20.0% 11.600 1.667 1.864 1.607

20 8.3% 48.400 20.0% -28.400 -4.082 -4.564 -4.631

35 14.5% 48.400 20.0% -13.400 -1.926 -2.153 -2.027

82 33.9% 48.400 20.0% 33.600 4.830 5.400 4.389

答案很不重要不重要無意見重要很重要

個數 %觀察

個數 %期望

殘差 標準化殘差 調整殘差 離差

Poisson模式:a. \ + expect設計 : 常數b.

適合度檢定之結果, df=4的情況下卡方值等於 46.719, p=.000<.05 ,因此卡方值達顯著水準,拒絕虛無假設,接受對立假設。(結果與無母數卡方分配程序之卡方值相同)

上述一般化對數線性分析結果與採用無母數統計法分析之結果完全相同。

你累了嗎!(幽默類)

• 概率

春嬌去參觀氣象站,看到許多預測天氣的最新儀器。參觀完畢,春嬌問站長:

「你說有百分之七十五的下雨機率,是怎樣計算出來的?」

站長不必多想便答道:「那就是說,我們這裏有四個人,其中三個認為會下雨。」

陸、 SPSS 分析適合度考驗二(期望次數不相等)

• 適合度考驗(期望次數不相等)問題研究:某位教育學者想了解國小學生家長對國小校務評鑑的看法是否與三年前有所差異。研究方式:從國小家長母群體中隨機抽取 500 位家長的意見,作為分析的依 據。三年前的調查數據:在三年前的調查結果,發現國小學生家長對國小實施校 務評鑑的看法中有 30%表示非常重要、 15%表示重要、 40%表示 不重要、 15%表示非常不重要。三年後的調查數據:三年後的調查中發現有 250 位受試者表示非常重要、 125 位表示重要、 100 位表示不重要、 25 位表示非常不重要。請問 此教育學者如何解釋此結果?

陸、 SPSS 分析適合度考驗二(期望次數不相等)

非常重要 1 重要 2 不重要 3 非常不重要 4 總數三年前 150(0.3) 75(0.15) 200(0.4) 75(0.15) 500

三年後 250 125 100 25 500

製表:

陸、 SPSS 分析適合度考驗二(期望次數不相等)

陸、 SPSS 分析適合度考驗二(期望次數不相等)

陸、 SPSS 分析適合度考驗二(期望次數不相等)

輸入理論期望值

非常重要 1 重要 2 不重要 3 非常不重要 4 總數三年前 150(0.3) 75(0.15) 200(0.4) 75(0.15) 500

三年後 250 125 100 25 500

檢定統計量

183.333

3

.000

卡方a

自由度漸近顯著性

選項

0 (.0%) 5個格 的期望次數少於 75.0。最小的期望格次數為 。

a.

陸、 SPSS 分析適合度考驗二(期望次數不相等)

選項

250 150.0 100.0

125 75.0 50.0

100 200.0 -100.0

25 75.0 -50.0

500

非常重要重要不重要非常不重要總和

觀察個數 期望個數 殘差

卡方檢定次數分配表

1.自由度= 3 時,卡方值等於 183.333 , P=.000<.05,達顯著水準,應拒絕虛無假設。2. 表示此次國小學生家長對國小校務評鑑重要性的態度與三年前有顯著不同。其中非常重要的比例由 30%增加為 50%,而非常不重要的比例由 15%遞減至 5%。

陸、 SPSS 分析(百分比同質性檢定)

• 二、百分比同質性檢定1. 考驗 J個群體在 I個反應方面的百分比是否一致(同質)。2.若卡方值達顯著水準,需拒絕虛無假設,表示 J個群體的百分比之

間有顯著差異存在(至少有兩個組別),至於是那兩個群體間有差異,需進行百分比同質性的事後比較。

3. 事後比較最好採「同時信賴區間」估計法。比較組數為 K×( K-1 )÷2 ,其中 K為組別數,如果 K= 3 ,則要進行三組的同時信賴區間考驗,如果= 4,則要進行六組。

其公式為

4.自由度等於( I-1 )×( J-1 ), α 值設定為 .05 。

返回

j

jj

j

jjJIij n

qp

n

qpPP

2)1)(1(,1

百分比差值 臨界值 標準誤假設學生人數 30 人pj 贊成: 14人,占總人數的 14/30qj反對: 16人,占總人數的 16/30

陸、 SPSS 分析(百分比同質性檢定)

• 續上頁結論: 如果同時信賴區間的值包括 0在內,必須接受虛無假設,表示兩個群體之百分比的差異值未達顯著(因為兩個群體百分比的差異值可能為 0 ,即 p1-p2 可能為 0 。 ) ; 若結果未包括 0在內,必須拒絕虛無假設,表示兩個群體之百分比差異值達到顯著水準。

陸、 SPSS 分析(百分比同質性檢定)

• 問題研究1. 學校想要了解學生、教師、家長對辦理營養早餐的意見(贊成

或反對)。 由學校裡隨機抽選 30 位學生、 30 位老師、及 40位家長,共計 100 人做問卷調查,結果如表所示。

學生 教師 家長 總計贊成 14 10 30 54

反對 16 20 10 46

總數 30 30 40 100

※紅色數字為設計變項(研究者所操弄得變項)

陸、 SPSS 分析(百分比同質性檢定)

陸、 SPSS 分析(百分比同質性檢定)

陸、 SPSS 分析(百分比同質性檢定)

陸、 SPSS 分析(百分比同質性檢定)

陸、 SPSS 分析(百分比同質性檢定)

陸、 SPSS 分析(百分比同質性檢定)

陸、 SPSS 分析(百分比同質性檢定)交叉表

觀察值處理摘要

100 100.0% 0 .0% 100 100.0% * 意見 對象個數 百分比 個數 百分比 個數 百分比

有效的 遺漏值 總和觀察值

※ 有效觀察次數為 100 ,遺漏值為 0

陸、 SPSS 分析(百分比同質性檢定) * 意見 對象 交叉表

14 10 30 54

25.9% 18.5% 55.6% 100.0%

46.7% 33.3% 75.0% 54.0%

14.0% 10.0% 30.0% 54.0%

16 20 10 46

34.8% 43.5% 21.7% 100.0%

53.3% 66.7% 25.0% 46.0%

16.0% 20.0% 10.0% 46.0%

30 30 40 100

30.0% 30.0% 40.0% 100.0%

100.0% 100.0% 100.0% 100.0%

30.0% 30.0% 40.0% 100.0%

個數 %意見內的 %對象內的

%總和的個數

%意見內的 %對象內的

%總和的個數

%意見內的 %對象內的

%總和的

贊成

反對

意見

總和

學生 教師 家長對象

總和

14位學生所占的百分比= 14÷54=25.9%14位贊成的學生數占總學生數的 14÷30=46.7%14位學生數占總樣本數的 14÷100=14.0%

陸、 SPSS 分析(百分比同質性檢定)卡方檢定

12.909a

2 .002

13.356 2 .001

6.490 1 .011

100

Pearson卡方概似比線性對線性的關連有效觀察值的個數

數值 自由度漸近顯著

( )性 雙尾

0 (.0%) 5 13.80格 的預期個數少於 。 最小的預期個數為 。a.

1. 卡方考驗結果, df=2 時,卡方值= 12.909, p= .002<.05 ,拒絕虛無假設 ,表示三組受試者對學校營養早餐的設置的看法,持贊成意見的百分比有 顯著不同。2.另一個於對數線性模式中,被使用於卡方檢定的統計量數稱為「概似比卡 方檢定」量數。當樣本數很大的時後,概似比跟皮爾遜卡方檢定量會十分接近。3. 如果變項是量化變項,則「線性對線性的關連卡方值」是皮爾遜相關係數 的一個函數,此分析中由於兩個變項為類別變項,故可忽略此量數。

陸、 SPSS 分析(百分比同質性檢定)

對稱性量數

.359 .002

.359 .002

.338 .002

100

Phi值Cramer's V 值列聯係數

以名義量數為主

有效觀察值的個數

數值 顯著性近似值

未假定虛無假設為真。a. 使用假定虛無假設為真時之 漸近標準誤。b.

上表顯示 ψ 值與 Cramer’s V值為 .359, p=.002<.05 ,列聯係數 =.338P=.002<.05 ,均達到顯著水準,表示三組受試者與意見反應變項兩者間有某種關聯程度存在,因此需要考慮百分比同質性事後比較。

關聯強度係數值均在 0 至 1 之間,其值越接近 1 ,表示二個變項間的關聯性越強。

陸、 SPSS 分析(百分比同質性檢定)百分比同質性事後比較

學生 教師 家長 總計贊成 14 10 30 54

反對 16 20 10 46

總數 30 30 40 100

(贊成)佔該項人數的百分比% .467 .333 .750

(反對)佔該項人數的百分比% .533 .667 .250

學生 - 教師 (0.467-0.333)±(2.448)×30

667.0*333.0

30

533.0*467.0

=.134±.307=( .441~-.173)

( p>.05 ,所以這兩組間的差異沒有達顯著) 公式請按

α=.95df=2查表得卡方值= 5.9915.991 開根號= 2.448

陸、 SPSS 分析(百分比同質性檢定)

• 教師 - 家長

( p<.05 ,兩組間的差異達到顯著)• 學生 - 家長

( p<.05 ,兩組間的差異達到顯著)

(.333-.075)±(2.448)×40

250.0*750.0

30

667.0*333.0 =-0.417±.269=( -.686~-.148)

(.467-.750)±(2.448)×40

250.0*750.0

30

533.0*467.0 =-.283±.279=( -.562~-.004)

陸、 SPSS 分析(百分比同質性檢定)

• 結論:1. 從百分比同質性事後比較得知,教師 - 家長、學生 - 家

長間贊同學校辦理營養早餐的百分比有顯著差異。2. 有 75%的家長贊同學校辦理營養早餐、高於教師的 3

3.3%及學生的 46.7%3. 教師與學生兩個群體間贊同學校辦理營養早餐的看法沒有顯著差異存在。

你累了嗎?(笑點比較高了)

• 數學家的幽默一名統計學家遇到一位數學家,統計學家調侃數學家說道:

你們不是說若X=Y且Y=Z,則X=Z嗎!那麼想必你若是喜• 歡一個女孩,那麼那個女孩喜歡的男生你也會喜歡羅!?”

數學家想了一下反問道:

那麼你把左手放到一鍋一百度的開水中,右手放到一鍋零度的冰• 水裏想來也沒事吧!因為它們平均不過是五十度而已!”

陸、 SPSS 分析(獨立性考驗)

• 分析兩個不同變數的分類次數分配,以決定該兩變數間是否獨立。例如:研究候選人的得票數是否會受到選民省籍的影響等,這些探討兩變數間是否獨立的問題。

• 適用時機:二因子設計類別變項資料(二者皆為設計變項)。

陸、 SPSS 分析(獨立性考驗)

• 一、問題研究某位教育學者想探討國小退休教師社會參與頻率與其退休後生活滿意度的關係。從退休教師母群體中隨機抽取 107

7位教師,試問退休教師的社會參與頻率與其退休後生活滿意度是否有顯著的關係?

陸、 SPSS 分析(獨立性考驗)

• 1.在上述變項中,共有兩個變項,一為社會參與頻率、一為生活滿 意度。• 2. 兩變項各有三個水準組成一 3×3列聯表。• 3.獨立性檢定之目的在了解自母群體中取樣而來的一組受試者(退 休教師)的兩個反應變項(社會參與頻率與生活滿意度)之間 是否互為獨立?如果不是互為獨立,則進一步探討二者關聯性的 性質與關聯程度。(關聯係數)

社會參與時常參加 偶爾參加 很少參加

生活滿意很滿意 350 150 48

無意見 120 102 88

不滿意 30 87 102

陸、 SPSS 分析(獨立性考驗)

生活滿意度1. 很滿意2. 無意見3. 不滿意

社會參與1. 時常參加2. 偶爾參加3. 很少參加

次數

陸、 SPSS 分析(獨立性考驗)

陸、 SPSS 分析(獨立性考驗)

陸、 SPSS 分析(獨立性考驗)

陸、 SPSS 分析(獨立性考驗)

陸、 SPSS 分析(獨立性考驗)

陸、 SPSS 分析(獨立性考驗)

1. 本表為「生活滿意」與「社會參與頻率」兩個變項的 3×3細格交叉表。

2. 生活滿意度「很滿意」的細格中,實際觀察次數有 350 位,期望值= 254.4

(548/1077) ×(500/1077) ×1077=254.4

期望值公式=(橫列總計 / 總計)×(縱列總計 / 總計)×總計

3. 社會參與內的%= 350/500=70.0%4.總和的%= 350/1077=32.5%

* 生活滿意 社會參與 交叉表

350 150 48 548

254.4 172.5 121.1 548.0

63.9% 27.4% 8.8% 100.0%

70.0% 44.2% 20.2% 50.9%

32.5% 13.9% 4.5% 50.9%

120 102 88 310

143.9 97.6 68.5 310.0

38.7% 32.9% 28.4% 100.0%

24.0% 30.1% 37.0% 28.8%

11.1% 9.5% 8.2% 28.8%

30 87 102 219

101.7 68.9 48.4 219.0

13.7% 39.7% 46.6% 100.0%

6.0% 25.7% 42.9% 20.3%

2.8% 8.1% 9.5% 20.3%

500 339 238 1077

500.0 339.0 238.0 1077.0

46.4% 31.5% 22.1% 100.0%

100.0% 100.0% 100.0% 100.0%

46.4% 31.5% 22.1% 100.0%

個數期望個數

%生活滿意內的 %社會參與內的

%總和的個數期望個數

%生活滿意內的 %社會參與內的

%總和的個數期望個數

%生活滿意內的 %社會參與內的

%總和的個數期望個數

%生活滿意內的 %社會參與內的

%總和的

很滿意

無意見

不滿意

生活滿意

總和

時常參加 偶爾參加 很少參加社會參與

總和

陸、 SPSS 分析(獨立性考驗)

1.在本列題中卡方值等於 207.329, df=4, p=.000<.05 ,達顯著水準,故拒絕虛無假設。表示國小退休教師的「社會參與頻率」與「生活滿意度」二變項間並非互為獨立。(有顯著關係)

2. 當兩個變項有相關存在時,可繼續探討兩個變項之間關聯性的程度與性質。因為是 3×3列聯表,故選擇列聯係數分析

3.除了使用列聯係數來表關聯性程度以外,另外也可使用 λ係數來說明兩個變項間的關聯強度。

卡方檢定

207.329a

4 .000

221.401 4 .000

206.907 1 .000

1077

Pearson卡方概似比線性對線性的關連有效觀察值的個數

數值 自由度漸近顯著

( )性 雙尾

0 (.0%) 5 48.40格 的預期個數少於 。 最小的預期個數為 。a.

陸、 SPSS 分析(獨立性考驗)方向性量數

.114 .019 5.804 .000

.102 .022 4.449 .000

.125 .019 6.384 .000

.103 .013 .000c

.100 .012 .000c

對稱性量數生活滿意依變數社會參與依變數生活滿意依變數社會參與依變數

Lambda 值

Goodman與Kruskal Tau 測量

以名義量數為主

數值 漸近標準誤a T 近似 分配b 顯著性近似值

未假定虛無假設為真。a. 使用假定虛無假設為真時之 漸近標準誤。b.

以卡方近似法為準c.

1.在生活滿意列的 λ值等於 .102 ,表示「當知道樣本的社會參與與頻率的訊息下,可增加預測樣本生活滿意度之正確性達 10.2%之多」。

2. 如果不知道國小退休教師社會參與頻率的訊息,而要預測國小退休教師生活滿意度知覺,最好預測其為「很滿意」。(因為該項的邊緣次數總和為 548 ,占全部觀察值的 50.9%)

3.若知道樣本裡社會參與頻率為「時常參加」的訊息時,則預測準度就會增加。(即可以生活滿意度為「很滿意」為最好預測樣本。)

4.若得知樣本社會參與頻率為「很少參加」,則最好預測樣本之生活滿意度為「不滿意」。

5.相對的,若研究者知道樣本的生活滿意度的訊息,可增加預測樣本社會參與頻率之正確性為 12.5%。

 社會參與

時常參加

偶爾參加

很少參加 總和

生活滿意

很滿意 350 150 48 548

無意見 120 102 88 310

不滿意 30 87 102 219

總和 500 339 238 1077

陸、 SPSS 分析(獨立性考驗)

• λ係數的計算當要預測「生活滿意度」時,將各縱行細格次數最多的相加後,減去橫列邊際次數最高者,在除以總樣本數減橫列邊際次數最高者之值。以本題為例:

1. 當知道社會參與頻率,要預測其生活滿意度之 λ值計算公式:λ值= [(350+150+102)-548] ÷(1077-548)=.102

2. 當知道生活滿意度,要預測其社會參與頻率之 λ值計算公式:λ值= [(350+120+102)-500] ÷(1077-500)=.125

陸、 SPSS 分析(獨立性考驗)對稱性量數

.402 .000

1077

列聯係數以名義量數為主有效觀察值的個數

數值 顯著性近似值

未假定虛無假設為真。a. 使用假定虛無假設為真時之 漸近標準誤。b.

關聯強度表r值 強度

0.80以上 0.60~0.800.40~0.600.20~0.400.20以下

非常高 (強 )相關 高度強 )相關中等相關低 (弱 )相關非常低 (弱 )相關

1. 上表為列聯相關係數及顯著性檢定結果,列聯係數= .402 , p=.000<.05 達顯著水準。

2.在「社會參與頻率」與「生活滿意度」二個變項間之關聯性屬於中度相關。

3.在獨立性檢定中,如果卡方值達到顯著,則可根據交叉表屬性選擇適合的 關聯係數,因上表為 3×3列聯表,故採用「列聯係數」作為「社會參與頻率」 與「生活滿意度」兩個變項間關聯性之強度統計量。

陸、 SPSS 分析(改變的顯著性檢定)

• 一、問題研究某位補習班教師想要了解其任教班級的學生,在開學時和學期末對其任教之物理科目的喜愛態度是否有所改變,他隨機抽取 200 名其任教班級學生,調查數據如下:

1. 上述整理為一 2×2列聯表,所以採用「McNemar」考驗,以檢定受試者在前後二次測量間的改變情形。

2.若列聯表大於 2×2 以上時,則應採用「包卡爾對稱性檢定」( Bowker’s test of symmetry)

學期末 end開學時 begin

喜歡 不喜歡喜歡 40 120

不喜歡 15 25

陸、 SPSS 分析(改變的顯著性檢定)

• 將問題研究整理如下表所示:開學初

總數喜歡 不喜歡

學期末

喜歡40

( A)

120( C

)160

不喜歡15

( B)

25( D

)40

總數 55 145 2001. 上表中,開學初與學期末對物理課態度均沒有改變者共 40 + 25=65 位。2. 學期初與學期末對物理的喜愛有改變者共 15 + 120=135 位。3. 研究者所關心的對象為學期初與學期末對物理喜愛有改變者( B、 C),所以是 B+ C的和,如果沒有顯著改變,則B應等於 C,故虛無假設 H0 : B=C,理論上有 (B+C)/2 的人由學期初的喜歡變成不喜歡態度,也有 (B+C)/2 的人由不喜歡變成喜歡,所以期望值都為 (B+C)/2

陸、 SPSS 分析(改變的顯著性檢定)

• 根據卡方之公式

• 所以

• 在 SPSS視窗操作中,如果 B+ C>25 ,則使用校正之卡方值

e

e

f

ffx

202

χ2= 667.8115120

)12015()(

2

)2

(

2

)2

( 2222

CB

CBCB

CBC

CB

CBB

119.8015120

)115120()1()5.0( 222

CB

CB

fe

fefoχ2=

陸、 SPSS 分析(改變的顯著性檢定)

陸、 SPSS 分析(改變的顯著性檢定)

陸、 SPSS 分析(改變的顯著性檢定)

陸、 SPSS 分析(改變的顯著性檢定)

陸、 SPSS 分析(改變的顯著性檢定)

& 學期初 學期末

40 15

120 25

學期初喜歡不喜歡

喜歡 不喜歡學期末

檢定統計量b

200

80.119

.000

個數卡方a

漸近顯著性

& 學期初學期末

連續修正a. McNemar 檢定b.

1. 經McNema 考驗結果,卡方值為 80.119, p=.000<.05 達顯著水準,故拒絕 虛無假設。表示學生在開學初及學期末對物理課喜愛態度有顯著改變。

2.在學期初不喜歡物理課,但在學期末喜愛物理課的樣本有 120 名 ; 在學期初 喜愛物理課,但在學期末不喜愛物理課的樣本只有 15 名。

快結束了!再忍耐一下• 邏輯學的用處

有個學生請教愛因斯坦邏輯學有什麼用。

愛因斯坦問他:“兩個人從煙囪 裏爬出去,一個滿臉煙灰,一個乾乾淨淨,你認為哪一個該去洗澡?”

“當然 是髒的那個。”學生說。

“ 不對。髒的那個看見對方乾乾淨淨,以為自己也不會髒, 哪里會去洗澡?”

陸、 SPSS 分析(費雪爾正確概率檢定)

• 一、在 2×2列聯表中(自由度等於 1 )計算卡方係數值,若發現任 何一細格內的期望次數小於 5 時,則必須進行「 Yate’s校 正」 ;當樣本數很小時, Yate’s校正仍不一定非常精確,因此 需採用「費雪爾正確概率檢定」將更為適當。• 二、以下為三種針對 2×2列聯表所採用的檢驗分析法: ( 1 ) .若有效樣本總數小於 20 時,最好採用「費雪爾正確概 率檢定」法來考驗假設。 ( 2 ) .若有效樣本總數在 20~40 之間,如未出現細格期望次數小於 5 的 情形,則使用「卡方百分比同質性考驗」 ;假設有出現細格期望 次數小於 5 的情形,則應使用「費雪爾正確概率檢定」進行假設考 驗。 ( 3 ) .若有效樣本總數在 40 以上,則不論細格是否出現期望次數小於 5 ,

一 律使用校正後的卡方值。

陸、 SPSS 分析(費雪爾正確概率檢定)

• 問題研究 1 ( 2×2列聯表內無 0 之細格)1. 為調查 12 名學生對課外活動喜歡程度的情形如表所示:

2.P 值等於 = = =.04419

變項性別

總數男生 女生

喜愛 4(A) 1(B) 5(A+B)

不喜愛 1(C) 6(D) 7(C+D)

總數 5(A+C) 7(B+D) 12

!!!!!

)!()!()!()!(

DCBAN

DBCADCBA

!6!1!1!4!12

!7!5!7!5

720*24*479001600

5040*120*5040*120

陸、 SPSS 分析(費雪爾正確概率檢定)

• 問題研究 2 ( 2×2列聯表內有 0 之細格)

P 值等於 = =.00126

變項性別

總數男生 女生

喜愛 5 0 5

不喜愛 0 7 7

總數 5 7 12

!7!0!0!5!12

!7!5!7!55040*1*1*120*479001600

5040*120*5040*120

費雪爾正確概率檢定值: p=.04419+.00126=.04545

陸、 SPSS 分析(費雪爾正確概率檢定)

• 問題研究三• 某教育學者想了解國小三年級男女學生對早上讀經的喜愛程度是否有

所差異,在訪問了 10 位男生、 12 位女生、男生回答喜歡的有 2 人、不喜歡的有 8 人 ;女生回答喜歡的有 8 人,不喜歡的有 4人,請問學生性別對讀經喜愛與否的知覺感受是否有所差異?

變項性別

總數男生 女生

喜歡 2 8 10

不喜歡 8 4 12

總數 10 12 22

陸、 SPSS 分析(費雪爾正確概率檢定)

Atti:感受( 1.喜歡 2. 不喜歡)Sex:性別( 1. 男生 2. 女生)Freq:次數

陸、 SPSS 分析(費雪爾正確概率檢定)

陸、 SPSS 分析(費雪爾正確概率檢定)

陸、 SPSS 分析(費雪爾正確概率檢定)

陸、 SPSS 分析(費雪爾正確概率檢定)

陸、 SPSS 分析(費雪爾正確概率檢定)

觀察值處理摘要

22 100.0% 0 .0% 22 100.0% * 性別 態度個數 百分比 個數 百分比 個數 百分比

有效的 遺漏值 總和觀察值

交叉表

* 性別 態度 交叉表

2 8 10

4.5 5.5 10.0

9.1% 36.4% 45.5%

8 4 12

5.5 6.5 12.0

36.4% 18.2% 54.5%

10 12 22

10.0 12.0 22.0

45.5% 54.5% 100.0%

個數期望個數

%總和的個數期望個數

%總和的個數期望個數

%總和的

男生

女生

性別

總和

喜歡 不喜歡態度

總和

若有效樣本總數在 20~40 之間,如未出現細格期望次數小於 5 的情形,則使用「卡方百分比同質性考驗」 ;假設有出現細格期望次數小於 5 的情形,則應使用「費雪爾正確概率檢定」進行假設考驗。

陸、 SPSS 分析(費雪爾正確概率檢定)卡方檢定

4.791b

1 .029

3.094 1 .079

5.032 1 .025

.043 .038

4.573 1 .032

22

Pearson卡方連續性校正a

概似比Fisher's精確檢定線性對線性的關連有效觀察值的個數

數值 自由度漸近顯著

( )性 雙尾精確顯著

( )性 雙尾精確顯著

( )性 單尾

2x2 只能計算 表格a. 1 (25.0%) 5 4.55格 的預期個數少於 。 最小的預期個數為 。b.

1. 本研究的對立假設為:「學生性別對讀經喜愛與否的知覺感受有所差異」,屬雙測考驗。 p=.043<.05 ,達顯著水準,拒絕虛無假設,接受對立假設,表示學生性別對讀經喜愛與否的知覺感受有顯著的不同(國小三年級女生較愛讀經的百分比明顯高於男生)。2. 未校正卡方值等於 4.791 , p=.029<.05 ,拒絕虛無假設,結果同 (1.)3. 有一細格期望值小於 5 ,呈現 Yate校正後的卡方值 3.094, p=.079>.05接受虛 無假設。4.由以上得知當 2×2列聯表中,如是小樣本且有細格期望值小於 5 的狀況,採用不同的方法進行假設檢定,常會出現結論不一致,因此對小樣本的資料分析要格外謹慎。

本組報告完畢

感謝教授的指導 感謝大家的聆聽

睡覺的請起立

Recommended