62
第 5 第 第第第第 会会会 2011 会 会会 会会会

第 5 章 假设检验

  • Upload
    jerica

  • View
    99

  • Download
    3

Embed Size (px)

DESCRIPTION

第 5 章 假设检验. 会计学 2011 级 主讲:王红娜. 本章内容. 假设检验 的基本思想 5.1 假设检验 的基本问题 5.2 一 个总体参数的检验 讨论:假设检验与 区间估计. 假设检验 的基本 思想 —— 引 例. 某 企业生产一种零件,过去资料表明其平均长度为 4 厘米,标准差为 0.1 厘米。改革工艺后 ,随机抽查 了 100 个零件,测得样本平均长度为 3.95 厘米。问:工艺改革前后零件的长度是否发生了显著 变化? 改革后零件的平均长度事先 并不知道。 可 先 假设为 4 厘米 ,然后利用样本的平均长度来检验假设是否正确 。 - PowerPoint PPT Presentation

Citation preview

Page 1: 第 5 章  假设检验

第 5 章 假设检验

会计学 2011 级主讲:王红娜

Page 2: 第 5 章  假设检验

本章内容 假设检验的基本思想5.1 假设检验的基本问题 5.2 一个总体参数的检验 讨论:假设检验与区间估计

Page 3: 第 5 章  假设检验

假设检验的基本思想——引例 某企业生产一种零件,过去资料表明其平均长度为4 厘米,标准差为 0.1 厘米。改革工艺后,随机抽查了 100 个零件,测得样本平均长度为 3.95

厘米。问:工艺改革前后零件的长度是否发生了显著变化?– 改革后零件的平均长度事先并不知道。可先假设为4 厘米,然后利用样本的平均长度来检验假设是否正确。

– 这就是一个假设检验问题。

Page 4: 第 5 章  假设检验

分析引例,原假设 若原假设成立,即工艺改革后零件长度没有显著变

化,则样本均值服从正态分布,且样本均值为3.95 。如果二者有显著差异,我们有理由认为样本不是取自均值为的总体,即认为工艺改革后零件长度不是。

Page 5: 第 5 章  假设检验

换言之,应当确定一个区间,如,如果样本取自均值为的总体,则只要是简单随机抽样,样本均值都应该以很大的概率落入此区间内。即落入此区间外的概率应该很小。一旦这个小概率事件发生,人们必然怀疑原假设的真实性。

Page 6: 第 5 章  假设检验

在解决实际问题时,人们事先指定一个小概率,如取 0.10 , 0.05 , 0.025 等,使得当实际正确时否定的概率。可由概率等式来确定常数,即误差范围。

基本思路:– 首先假设成立,然后进行统计推断,如果导致一个

不合理的现象发生,即小概率事件在一次抽样中发生了,则否定原假设,这里运用的是“小概率事件在一次实验中几乎是不可能发生的”这一原则。

Page 7: 第 5 章  假设检验

若取置信度为 0.99 ,则, 也就是说,如果原假设为真,则样本均值的标准化

值发生了,即小概率事件发生了,则拒绝。 本例计算结果:

– 说明小概率事件发生了,这是不合理的,应拒绝原假设。

Page 8: 第 5 章  假设检验

小结

对未知总体作某种假设

样本观察结果

抽样检验

小概率事件发生

小概率事件未发生

拒绝原假设

不拒绝原假设

Page 9: 第 5 章  假设检验

可见,假设检验的基本思想是——带有概率性质的反证法!

假设检验的两个特点:1. 其逻辑推理方法是反证法2. 判断结果合理与否,是基于“小概率事件不易发

生”这一原理

Page 10: 第 5 章  假设检验

5.1 教学要求 能熟练陈述问题的假设 理解两类错误与显著性水平,理解两类错误之间的

关系 理解检验统计量的构造方法,理解拒绝域的含义 理解值的含义,会用值进行决策判断

Page 11: 第 5 章  假设检验

5.1 假设检验的基本问题

假设的陈述

两类错误与显著性水平

检验统计量与拒绝域

利用值进行决策

转到 5.2

Page 12: 第 5 章  假设检验

一、假设的陈述 什么是假设?– 对总体参数的具体数值所作的陈述– 总体参数包括总体均值、比率、方差等– 分析之前必须陈述

我认为该企业生产的零件的平均长度为 4 厘米 !

Page 13: 第 5 章  假设检验

假设检验就是先对总体的参数 ( 或分布形式 ) 提出某种假设,然后利用样本信息判断假设是否成立的过程。

假设检验包括参数检验和非参数检验两种方法。 假设检验逻辑上运用反证法,统计上依据小概率原

理。

Page 14: 第 5 章  假设检验

一个简单的例子 一名被告正在受法庭的审判,根据英国法律,先假

设被告是无罪的,于是证明他有罪的责任就落在原告律师身上。用假设检验的术语就是要建立一个假设,记为:被告是无罪的,称为原假设或零假设。另一个可供选择的假设记作:被告是有罪的,称为备择假设或替代假设。法庭陪审团要审查各种证据,以确定原告律师是否证实了这些证据与“无罪”这一原假设不一致。如果陪审团员们认为证据与不一致,他们就拒绝该原假设而接受其备择假设,即认为被告有罪。

Page 15: 第 5 章  假设检验

反证法 如果一个人说他从来没有骂过人。他能够证明吗?– 要证明他没有骂过人,他必须出示他从小到大每一

时刻的录音录像,所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。即使他找到一些证人,比如他的同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,他没有被听到骂人。反过来,如果要证明这个人骂过人很容易,只要有一次被抓住就足够了。

看来,企图肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。

科学往往是在否定中发展。

Page 16: 第 5 章  假设检验

在假设检验中,一般要设立一个原假设(上面的“从来没骂过人”就是一个原假设);

而设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出假设与现实之间的矛盾,从而否定这个假设。

Page 17: 第 5 章  假设检验

在多数统计教科书中(除理论探讨外),假设检验都是以否定原假设为目标。如否定不了,说明证据不足,无法否定原假设。但这并不等于原假设正确,而是“没有足够证据拒绝原假设”,因此“不能接受原假设”。– 就像一两次没有听过他骂人还远不能证明他从来没

有骂过人。

Page 18: 第 5 章  假设检验

假设检验的过程:提出假设→抽取样本→作出决策

Page 19: 第 5 章  假设检验

原假设 (null hypothesis)

研究者想收集证据予以反对的假设,又称“ 0 假设”,总是有符号“”,“”或“”,表示为– 如::– 例如::

Page 20: 第 5 章  假设检验

备择假设 (alternative hypothesis)

研究者想收集证据予以支持的假设,也称“研究假设”,总是有符号“”,“”或“”,表示为– :某一数值 或 某一数值– 例如:: 或

Page 21: 第 5 章  假设检验

提出假设 ( 例题分析 )

例 1 :一种零件的生产标准是直径应为,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和备择假设。– 研究者想收集证据予以证明的假设应该是“生产过程不正常”。

– 建立的原假设和备择假设为:

Page 22: 第 5 章  假设检验

例 2 :某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于 500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设。– 研究者抽检的意图是倾向于证实这种洗涤剂的平均净含量并不符合说明书中的陈述。

– 建立的原假设和备择假设为:

Page 23: 第 5 章  假设检验

例 3 :一家研究机构估计,某城市中家庭拥有汽车的比率超过 30% 。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设。– 研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比率超过 30%” 。

– 建立的原假设和备择假设为:

Page 24: 第 5 章  假设检验

提出假设 ( 结论与建议 )

1. 原假设和备择假设是一个完备事件组,而且相互对立– 在一项假设检验中,原假设和备择假设必有一个成

立,且只有一个成立

2. 先确定备择假设,再确定原假设 3. 等号“”总是放在原假设上– 原假设的符号是“”,“”或“”

4. 因研究目的不同,对同一问题可能提出不同的假设 ( 也可能得出不同的结论 )

Page 25: 第 5 章  假设检验

双侧检验与单侧检验备择假设没有特定的方向性,并含有符号“”的假

设检验,称为双侧检验或双尾检验 (two-tailed

test)

备择假设具有特定的方向性,并含有符号“”或“”的假设检验,称为单侧检验或单尾检验(one-tailed test)

– 备择假设的方向为“”,称为左侧检验 – 备择假设的方向为“”,称为右侧检验

Page 26: 第 5 章  假设检验

双侧检验与单侧检验 ——假设的形式

假设 双侧检验单侧检验

左侧检验 右侧检验

原假设

备择假设

返回 5.1目录

Page 27: 第 5 章  假设检验

二、两类错误与显著性水平

1. 第Ⅰ类错误 (弃真错误 )

– 原假设为真时拒绝原假设(原假设为真,但由于样本的随机性,样本统计量落入拒绝域,使我们做出错误决策)。

– 小概率事件只是发生的概率很小,但并非绝对不发生。犯这类错误的概率就是小概率事件发生的概率,称为显著性水平,记为。

Page 28: 第 5 章  假设检验

2. 第Ⅱ类错误 ( 取伪错误 )

– 原假设为假时未拒绝原假设(原假设为假,但由于样本的随机性,样本统计量落入接受域,使我们做出错误决策)。

– 第Ⅱ类错误的概率记为。

Page 29: 第 5 章  假设检验

假设检验中的两类错误—决策结果

陪审团审判

裁决实际情况

无罪 有罪

无罪 正确 错误

有罪 错误 正确

检验

裁决实际情况

为真 为假

未拒绝 正确决策 第Ⅱ错误

拒绝 第Ⅰ错误 正确决策

假 设 检 验 就好像一场审判 过程,:无罪 统计检验过程

Page 30: 第 5 章  假设检验

错误与错误的关系

Page 31: 第 5 章  假设检验
Page 32: 第 5 章  假设检验

小结

1. 错误与错误此消彼长,但;2. 要同时减少与,须增大样本容量;3. 通常先控制犯错误的概率;4. 发生第Ⅰ类错误的概率被称为显著性水平,记为,

是人们事先指定的犯第Ⅰ类错误的概率的最大允许值;

5. 错误的概率不好控制,将“接受原假设”更倾向于说成“不拒绝原假设”。

Page 33: 第 5 章  假设检验

显著性水平 (significant level)

1. 显著性水平是一个概率值– 原假设为真时,检验统计量落在拒绝域的概率

2. 表示为– 常用的值有 0.01, 0.05, 0.10

3. 值由研究者事先确定。

Page 34: 第 5 章  假设检验

假设检验中的小概率原理 什么小概率?– 在一次试验中,一个几乎不可能发生的事件发生的

概率;– 在一次试验中小概率事件一旦发生,我们就有理由

拒绝原假设;– 小概率的值由研究者事先确定。

Page 35: 第 5 章  假设检验

专家视野 著名的英国统计学家 Ronald Fisher 在他的研究中常常使用的小概率标准为 0.05 。

作为一个普遍适用的原则,后来人们通常选择显著性水平为 0.05 ,当然也可比它大一些或小一些。

较常用的显著性水平有:– ,,

返回 5.1目录

Page 36: 第 5 章  假设检验

三、检验统计量与拒绝域根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量,称为检验统计量。

检验统计量实际上是总体参数的点估计量。 标准化的检验统计量:

对样本统计量进行标准化的依据– 原假设为真– 点估计量的抽样分布

Page 37: 第 5 章  假设检验

拒绝域与临界值 能够拒绝原假设的统计量的所有可能取值的集合称

为拒绝域。在图上表现为由显著性水平所围成的区域。

拒绝域的大小与事先选定的显著性水平有一定关系:当样本量固定时,拒绝域的面积随的减小而减小。

根据给定的显著性水平确定的拒绝域的边界值,称为临界值( Critical Value)。

Page 38: 第 5 章  假设检验

显著性水平和拒绝域——双侧检验

Page 39: 第 5 章  假设检验
Page 40: 第 5 章  假设检验

显著性水平和拒绝域——单侧检验

Page 41: 第 5 章  假设检验

显著性水平和拒绝域——左侧检验

Page 42: 第 5 章  假设检验

显著性水平和拒绝域——右侧检验

Page 43: 第 5 章  假设检验

假设检验的结论是在给定的显著性水平下作出的。显著水平不同,对同一问题所下的结论可能完全相反。上图中的蓝点:

• 在 0.1 的显著性水平下,拒绝原假设;• 在 0.05 的显著性水平下,不拒绝原假设。

Page 44: 第 5 章  假设检验

即使在同一显著性水平下,由于临界值是固定的,拒绝域也就固定了。

讨论:和谁拒绝原假设的理由更充分?也就是说谁犯拒真错误的概率更小?

Page 45: 第 5 章  假设检验

由显著性水平的含义可知:

由图可以观察到:

由于,显然,拒绝原假设的理由更充分,即犯拒真错误的概率更小。

Page 46: 第 5 章  假设检验

思考题 生产耐高温玻璃,至少要能抗住 500℃高温而玻璃不变形,这时对产品质量检验所设立的假设为( )A  : B   :C   : D :

加工零件所使用的毛坯如果过短,加工出来的零件则达不到规定的标准长度 μ0 ,对生产毛坯的模框进行检验,所采用的原假设应当为( )A              B 

C             D 

Page 47: 第 5 章  假设检验

思考题 在假设检验中,原假设,备择假设,则称( )为犯第二类错误。A   为真,接受 B 为真,拒绝C  不真,接受 D  不真,拒绝

Page 48: 第 5 章  假设检验

思考题 在一次假设检验,当显著性水平为 0.01 时,原假

设被拒绝,若用 0.05 的显著性水平去检验,则( )A   一定会被拒绝 B 一定不会被拒绝C   有可能拒绝原假设 D 需要重新检

Page 49: 第 5 章  假设检验

思考题 设是显著性水平,是置信水平,若是统计量的临界

值,则,;若、是统计量的临界值,且,则,。

Page 50: 第 5 章  假设检验

决策规则

1. 给定显著性水平,查表得出相应的临界值或,或2. 将检验统计量的值与水平的临界值进行比较3. 作出决策– 双侧检验:,拒绝– 左侧检验:,拒绝– 右侧检验:,拒绝

返回 5.1目录

Page 51: 第 5 章  假设检验

四、利用值进行决策 在原假设下,检验统计量沿着备择假设的方向取其

实现值及更加极端值的概率称为值( -value)。 值反映实际数据与原假设之间不一致的程度。 如果得到很小的值,就意味着在原假设下小概率事

件发生了。 如果小概率事件发生,是相信原假设,还是相信数据呢?– 当然多半是相信数据,拒绝原假设。

Page 52: 第 5 章  假设检验

到底值是多小的时候才能够拒绝原假设呢?也就是说,需要有什么是小概率的标准。– 这要看具体应用的需要。但在一般的统计书和统计软件中,使用最多的标准是在原假设下(或原假设正确时),根据样本所得的数据来拒绝原假设的概率应小于 0.05 ,当然也可能是 0.01 , 0.005 ,0.001 等等。

这种事先规定的概率即为显著性水平。

Page 53: 第 5 章  假设检验

值的计算 一般地,用表示检验统计量,当为真时,可由样本

数据计算出该统计量的样本统计值,根据检验统计量的具体分布,可求出值。具体地说:– 左侧检验的值:– 右侧检验的值:– 双侧检验的值: ( 当位于分布曲线的右端时 ) 或( 当位于分布曲线的左端时 ) 。若服从正态分布和分布,其分布曲线是关于纵轴对称的,故其值可表示为

Page 54: 第 5 章  假设检验

再次理解值 值是在原假设下,所有比当前观测事件更极端的事

件发生的概率。 值就是拒绝原假设所需的最低显著性水平。注意:这里的值是一种概率。

Page 55: 第 5 章  假设检验

对值的陈述 值是在原假设为真的条件下,检验统计量的观察值

大于或等于其计算值的概率。也称为实际观察到的显著性水平。

实际检验时拒绝所犯错误的概率不一定有事先确定的那么大。以右侧检验为例,真正犯错误的概率是检验统计量落点以右的概率,这是实际观测到的显著性水平,将其称为假设检验的值。

根据数据信息来展示更为精确的显著性水平是有益处的。

Page 56: 第 5 章  假设检验

总结:– 值越小,拒绝原假设的理由越充分。

值决策规则:– 时,拒绝原假设;– 时,不拒绝原假设;– 时,重新抽样。

Page 57: 第 5 章  假设检验

双侧检验的值

Page 58: 第 5 章  假设检验

左侧检验的值

Page 59: 第 5 章  假设检验

右侧检验的值

Page 60: 第 5 章  假设检验

总结:假设检验的步骤

1. 陈述原假设和备择假设;2. 从所研究的总体中抽出一个随机样本,确定一个适当的检验统计量,并利用样本数据算出其具体数值;

3. 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域;

4. 将统计量的值与临界值进行比较,作出决策。– 统计量的值落在拒绝域,拒绝,否则不拒绝;– 也可以直接利用值作出决策。

Page 61: 第 5 章  假设检验

假设检验的步骤(图示)提出假设,

抽样获取样本值 选择统计量,确定为真时的抽样分布

根据决策要求确定

计算检验统计量的数值

确定分布上的临界值和检验规则

比较并做出检验判断 返回 5.1目

Page 62: 第 5 章  假设检验

5.2 教学要求 熟练掌握一个总体的总体均值均值、总体比率的假

设检验方法掌握一个总体的总体方差的假设检验方法 会用 Excel 进行假设检验