24
Workshop on Workshop on Statistical Statistical Analysis Analysis Chih-Chiang Yang Chih-Chiang Yang [email protected] [email protected] 27016855x2151 27016855x2151

Workshop on Statistical Analysis

  • Upload
    cicely

  • View
    32

  • Download
    3

Embed Size (px)

DESCRIPTION

Workshop on Statistical Analysis. Chih-Chiang Yang [email protected] 27016855x2151. Quiz. 衛生署公佈台灣地區約有 5000 人是屬單腳肢體殘障。 已知台灣地區約有 2,300 萬人口。 求台灣地區人民的平均腳數?. Answer. 所以,根據統計: 我們發現台灣地區多數人腳的數目超過平均值的!. Quiz. 回教國家 的 1 名男子可與 4 名女子結婚。 已知男生與女生的人數比例約為 1 :1 。 喜歡一夫多妻的台灣男人,應移居回教國家,坐享齊人之福?. Answer. - PowerPoint PPT Presentation

Citation preview

Page 1: Workshop on  Statistical Analysis

Workshop on Workshop on Statistical AnalysisStatistical Analysis

Chih-Chiang YangChih-Chiang Yang

[email protected]@ocit.edu.tw

27016855x215127016855x2151

Page 2: Workshop on  Statistical Analysis

衛生署公佈台灣地區約有衛生署公佈台灣地區約有 50005000 人是人是屬單腳肢體殘障。屬單腳肢體殘障。

已知台灣地區約有已知台灣地區約有 2,3002,300 萬人口。萬人口。 求台灣地區人民的平均腳數?求台灣地區人民的平均腳數?

QuizQuiz

Page 3: Workshop on  Statistical Analysis

AnswerAnswer

9997826.1000,000,23

)2000,995,22()1000,5(

所以,根據統計:我們發現台灣地區多數人腳的數目超過平均值的!

Page 4: Workshop on  Statistical Analysis

回教國家的回教國家的 11 名男子可與名男子可與 44 名女子結婚。名女子結婚。 已知男生與女生的人數比例約為已知男生與女生的人數比例約為 11:1:1 。。 喜歡一夫多妻的台灣男人,應移居回教喜歡一夫多妻的台灣男人,應移居回教國家,坐享齊人之福?國家,坐享齊人之福?

QuizQuiz

Page 5: Workshop on  Statistical Analysis

AnswerAnswer

平均四個男生中,就有三個男生是娶不到老婆的!

從機率與統計的角度來看

Page 6: Workshop on  Statistical Analysis

QuizQuiz

下圖是否有某種明顯的特殊趨勢嗎?

Page 7: Workshop on  Statistical Analysis

AnswerAnswer當 X 軸與 Y 軸互換,並拉長 X 軸的座標尺度時

我們發現:

Page 8: Workshop on  Statistical Analysis

聖詩聖詩 129129 節節

走向前並尋求,再更深入走向前並尋求,再更深入一點,你會找到榮耀的一點,你會找到榮耀的 !!!!

Page 9: Workshop on  Statistical Analysis

Introduction to Introduction to Basic StatisticsBasic Statistics

Page 10: Workshop on  Statistical Analysis

統計學(統計學( StatisticsStatistics ) :在不確定的情) :在不確定的情況下,透過資料的蒐集、整理、陳示與分析,況下,透過資料的蒐集、整理、陳示與分析,再加以解釋與推論,而獲得合理的研判或結再加以解釋與推論,而獲得合理的研判或結論。論。

母體(母體( PopulationPopulation ):研究者所欲研究):研究者所欲研究的全部對象所集合而成的集合。的全部對象所集合而成的集合。 有限母體有限母體(( Finite PopulationFinite Population )) 無限母體(無限母體( Infinite PopulationInfinite Population ))

TermsTerms

Page 11: Workshop on  Statistical Analysis

樣本(樣本( SampleSample ):母群體的部分集合。):母群體的部分集合。

母數母數 // 參數(參數( ParameterParameter ):描述母):描述母群體特徵的量。群體特徵的量。

統計量(統計量( StatisticStatistic ):描述樣本特):描述樣本特徵的量。徵的量。

•Worksheet01Worksheet01

Page 12: Workshop on  Statistical Analysis

敘述統計敘述統計 (Descriptive (Descriptive Statistics):Statistics): 僅就統計資料本身特性僅就統計資料本身特性的描述。的描述。

推論統計(推論統計( Inferential Inferential StatisticsStatistics )) :: 根據樣本資料的分析根據樣本資料的分析結果,推論母體的特性。結果,推論母體的特性。

Statistical MethodsStatistical Methods

Page 13: Workshop on  Statistical Analysis

Descriptive StatisticsDescriptive Statistics

Page 14: Workshop on  Statistical Analysis

圖示統計圖示統計 (Graphical Statistics)(Graphical Statistics)質化資料質化資料 :: 橫條圖、縱條圖、圓形圖等橫條圖、縱條圖、圓形圖等量化資料量化資料 :: 直方圖、多邊形圖、點圖、枝葉圖等直方圖、多邊形圖、點圖、枝葉圖等

統計量數統計量數 (Statistical Measures)(Statistical Measures)集中趨勢量數集中趨勢量數 :: 平均數、中位數、眾數等平均數、中位數、眾數等變異量數變異量數 :: 全距、變異數、標準差等全距、變異數、標準差等

•QuizQuiz

Page 15: Workshop on  Statistical Analysis

Inferential StatisticsInferential Statistics

Page 16: Workshop on  Statistical Analysis

簡單隨機取樣(簡單隨機取樣( Simple Random Simple Random SamplingSampling ):母體內的任一樣本單位被):母體內的任一樣本單位被抽出的機率皆相同。抽出的機率皆相同。

分層取樣(分層取樣( Stratified SamplingStratified Sampling ):):將母體分成幾個互斥的層(將母體分成幾個互斥的層( stratastrata ),),再於層內進行簡單隨機取樣。層內的樣本再於層內進行簡單隨機取樣。層內的樣本單位同質性高;層與層之間異質性高。單位同質性高;層與層之間異質性高。

SamplingSampling MethodsMethods

Page 17: Workshop on  Statistical Analysis

集群取樣(集群取樣( Cluster SamplingCluster Sampling ):將):將母體分成幾個相似的集群(母體分成幾個相似的集群( clustercluster ),),再於集群內進行簡單隨機取樣。集群內的再於集群內進行簡單隨機取樣。集群內的樣本單位異質性高;集群與集群之間同質樣本單位異質性高;集群與集群之間同質性高。性高。

系統取樣(系統取樣( Systematic SamplingSystematic Sampling ):):將母體所有的樣本單位依序排列,然後分將母體所有的樣本單位依序排列,然後分成許多間隔,每隔若干單位即取一個樣本。成許多間隔,每隔若干單位即取一個樣本。

•Worksheet02Worksheet02

Page 18: Workshop on  Statistical Analysis

抽樣分配抽樣分配 (Sampling Distribution):(Sampling Distribution): 統計量的機率分佈。統計量的機率分佈。 樣本平均數的抽樣分配樣本平均數的抽樣分配 (( 母體變異數已知母體變異數已知 ):Z):Z 分配分配

(( 常態分配常態分配 )) 。。 中央極限定理中央極限定理 (Central Limit Theorem):(Central Limit Theorem): 當樣本數很大當樣本數很大

時,不論母群體是何種機率分配,樣本平均數的抽時,不論母群體是何種機率分配,樣本平均數的抽樣分配為近似常態分配。樣分配為近似常態分配。

樣本平均數的抽樣分配樣本平均數的抽樣分配 (( 母體變異數未知母體變異數未知 ):t):t 分配。分配。 樣本變異數的抽樣分配樣本變異數的抽樣分配 :χ:χ22 分配。分配。 兩個樣本變異數比例的抽樣分配兩個樣本變異數比例的抽樣分配 :F :F 分配。分配。

SamplingSampling DistributionDistribution

•Worksheet03Worksheet03

Page 19: Workshop on  Statistical Analysis

點估計(點估計( Point EstimationPoint Estimation )) :: 根據根據樣本資料所求得之單一個估計值,以推估樣本資料所求得之單一個估計值,以推估未知的母群體參數。未知的母群體參數。

區間估計(區間估計( Interval EstimationInterval Estimation ):):根據所求得之點估計量的抽樣分配特質,根據所求得之點估計量的抽樣分配特質,求出兩個數值以構成一區間,並利用此一求出兩個數值以構成一區間,並利用此一區間推估未知的母群體參數範圍。區間推估未知的母群體參數範圍。

EstimationEstimation

Page 20: Workshop on  Statistical Analysis

先對母群體特性作一描述,然後利用抽出來先對母群體特性作一描述,然後利用抽出來的隨機樣本來推論該描述的真或偽。的隨機樣本來推論該描述的真或偽。

假設種類假設種類 :: 虛無假設虛無假設 (H(H00)) 與對立假設與對立假設 (H(H11)) 。。 假設檢定的基本邏輯假設檢定的基本邏輯 ::

• 在樣本資料中,找足夠的證據來拒絕在樣本資料中,找足夠的證據來拒絕 HH00 ;否則只好接;否則只好接受受 HH00 。。

• 接受接受 HH00並不表示並不表示 HH00為真,只是表示樣本資料並沒有充分為真,只是表示樣本資料並沒有充分證據可以拒絕證據可以拒絕 HH00 。。

• 若是拒絕若是拒絕 HH00 ,此檢定稱為顯著性檢定,此檢定稱為顯著性檢定(( Significant TestingSignificant Testing )。)。

Hypothesis TestingHypothesis Testing

Page 21: Workshop on  Statistical Analysis

建立假設的基本精神:若是錯誤拒絕建立假設的基本精神:若是錯誤拒絕 HH00,,所所承受的後果會比較嚴重。承受的後果會比較嚴重。

建立假設的實際做法:建立假設的實際做法: 把某人的宣稱或主張當為把某人的宣稱或主張當為 HH0 0 。。 將「是否顯著的『小』、『重』、『優』、將「是否顯著的『小』、『重』、『優』、『多』…」的敘述當為『多』…」的敘述當為 HH11 。。

任何任何 HH00的反面敘述為的反面敘述為 HH11 。。

等號一定在等號一定在 HH00 。。

•Worksheet04Worksheet04

Page 22: Workshop on  Statistical Analysis

假設檢定的種類:假設檢定的種類: 雙尾檢定(雙尾檢定( Two-tailed TestTwo-tailed Test ) ) 單尾檢定(單尾檢定( One-tailed TestOne-tailed Test ))

右尾檢定(右尾檢定( Upper-tailed TestUpper-tailed Test )) 左尾檢定(左尾檢定( Lower-tailed TestLower-tailed Test ) )

Page 23: Workshop on  Statistical Analysis

假設檢定的步驟:假設檢定的步驟: 設立假設(設立假設( HypothesisHypothesis )) 設定信心水準(設定信心水準( Set αSet α ))

型型 II 誤差(誤差( α riskα risk ):拒絕):拒絕 HH00,但為,但為 HH00真。真。 型型 IIII誤差(誤差( β riskβ risk ):接受):接受 HH00,但為,但為 HH00假。假。

決定拒絕域與接受域(決定拒絕域與接受域( Reject & Accept Reject & Accept RegionRegion ))

檢定統計量(檢定統計量( Test StatisticTest Statistic )) 結論(結論( ConclusionsConclusions ))

Page 24: Workshop on  Statistical Analysis

實例說明實例說明 :: 單一樣本平均數的假設檢定單一樣本平均數的假設檢定 當母體變異數當母體變異數 ((σσ22) ) 已知已知 ::

ZZ 檢定檢定 (Z test)(Z test) p value p value 檢定檢定 (p-value test)(p-value test)

當母體變異數未知當母體變異數未知 : : tt 檢定檢定 (t test)(t test) p value p value 檢定檢定

•Worksheet05Worksheet05