40
四四 四四四 () (standard deviation) 四四四四四四四四四四四四四四四四四四四四四四四四四四四四 四四四 四四四四四四四四四 四四四四四四四四 四四 四四四四四四四四四四 四四四四四 ,, 四四四四四四四四四四四四四x

(四)标准差( standard deviation) 方差是用取平方后的单位来表示的, 如果原始数据用毫米汞柱表示,则方差 就是毫米汞柱的平方。在统计分析中为了

  • Upload
    yetty

  • View
    125

  • Download
    7

Embed Size (px)

DESCRIPTION

(四)标准差( standard deviation) 方差是用取平方后的单位来表示的, 如果原始数据用毫米汞柱表示,则方差 就是毫米汞柱的平方。在统计分析中为了 方便,通常将方差取平方根,还原成与原 始观察值单位相同的变异量度。. 计算公式 (1)总体标准差: (2)样本标准差: 直接法: 或. - PowerPoint PPT Presentation

Citation preview

(四)标准差 (standard deviation)

方差是用取平方后的单位来表示的,如果原始数据用毫米汞柱表示,则方差就是毫米汞柱的平方。在统计分析中为了方便,通常将方差取平方根,还原成与原始观察值单位相同的变异量度。

x

计算公式 ( 1 )总体标准差:( 2 )样本标准差:

直接法: 或

N

X

2)(

1

)(2

n

XXS

1

)( 22

n

nXXS

加权法(频数表资料)

1

/)( 22

n

nfxfxS

性质:一组观察值的标准差愈大说明其变异程度愈大;应用:适合于正态分布或近似正态分布的资料。标准差与正态分布有明确的关系,它与均数结合能够完整地概括一个正态分布。

式中 x 和 f 分别为各组段的组中值及出现的频数。

变异系数 (coefficient of variation ,简

记 为 CV) , 又 称 为 离 散 系 数

(coefficient of dispersion)

计算方法: %100X

SCV

三、变异系数

应用 :

a. 比较度量衡单位不同的多组资料的

变异程度。

b. 比较均数相差悬殊的多组 资料 的变

异程度 ( 如舒张压和收缩压 ; 儿童

身高与成人身高 ) 。

计算器(统计功能)的使用计算器(统计功能)的使用

Casio fx-570w 型

开机: 进入统计状态:

清除内存: SHIFT

AC/ON

MODE 1

SD

Scl

MODE

=AC/ON

实例 1 :求 1 , 3 , 5 的算术平均数,

标准差和方差。

M+

M+

M+

SHIFT

5

X

1

3

1 = 求出 x=3

SHIFT

3

Xσn-1

求出 s=2

若接着按 x2

则可求出 s2=4

=

=

实例实例 22 :加权法求算术:加权法求算术平均数,标准差和方差。

组段 组中值 X 频数 f0 ~2 ~4 ~ 6

1 3 5

5 6 7

合计 18

求出x=3.2222

M+

M+

M+5

1

3

1

7

5

6

SHIFT =

SHIFT

,

SHIFT

,

SHIFTSHIFT

,

X

2

Xσn-1

求出 s=1.6647

若接着按 x2

则可求出s2=2.7712

SHIFT

3 =

=

实例实例 33 :加权法求几何:加权法求几何均数抗体滴度 滴度倒数 x 频数 f1 : 4

1 : 8

1 : 16

1 : 32

1 : 64

1 : 128

1 : 256

4

8

16

32

64

128

256

4

9

21

20

12

5

4

合计 75

M+

M+

M+

log 4 4

… … …

log 256 4

SHIFT

,

SHIFTSHIFT

,

1

SHIFT

=

X

显示 1.4369

若接着按log

SHIFT 10x

=

得到

第四节 正态分布及应用第四节 正态分布及应用

一、正态分布 简记为 N(μ,σ2)

1. 正态分布的概率密度函数 :

2

2

2

)(

2

1)(

X

eXf

X

2. 正态分布函数 : 与 f(x) 相对应的曲线下面积分布函数为 F ( x ) , 为曲线下自-∞到 x 面积,表达式为:

X

X

dXeXF2

2

2

)(

2

1)(

3 .正态分布特征: 正态密度函数曲线在横轴上方均数处

最高。 正态分布以均数为中心,左右对称。 正态分布中的 X 取值范围理论上没有

边界。

正态分布有两个参数,即位置参数 μ和变异参数 σ 。

当 σ 固定后, μ 增大,曲线沿横轴向右

移动。 μ 减小,曲线沿横轴向左 移动。

当 μ 固定后, σ 越大,曲线的形状越“矮胖”,表示数据分布越分散;

σ 越小,曲线的形状越“瘦高”, 表示数据分布越集中。

正态分布曲线下的面积分布有

一定的规律。

在( μ-σ , μ+σ )内的面积约为 68.27% ;

在( μ-1.96σ , μ+1.96σ )内约为 95.00% ;

在( μ-2.58σ , μ+2.58σ )内约为 99.00% . 。

二、标准正态分布 标 准 正 态 分 布 (standard normal

distribution) 是总体均数为 0 、标准差为 1 的正态分布。简记为 N(0,1)

1. 标准正态分布的概率密度函数 :

2

2

2

1)(

u

eu

u

2. 标准正态分布函数 : 与 φ(u) 相对应的曲线下面积分布函数为 Φ ( u ) , 为曲线下自-∞到 u 的面积,表达式为:

且有 Φ ( u ) =1- Φ ( -u )

uu

dueu 2

2

2

1)(

标准正态分布曲线下面积查表时注意事项:

( 1 ) ( μ 和 σ 已知)

( 2 ) ( μ 和 σ 未知)

以 0 为中心,左右两侧曲线下对称于 0的区间面积相等。

x

u

s

xxu

x

u

u 0.00 0.05 0.06 0.07-2.0-1.7-1.6-1.2-1.0-0.3-0.2

0.0228

0.05480.1151

0.1469

0.4013

0.0392

0.3557

三、正态分布的应用

(一)估计频率分布(二)确定医学参考值范围 医学参考值范围 (reference value

range )传统上称正常值范 (normal range) ,指正常人(或动物)的解剖、生理、生化、免疫等各种数据的波动范围。

所谓的“正常人”不同于“健康人”,绝对健康是不存在的,而是指排除了影响被研究指标的疾病和有关因素的同质人群。

1.选择足够数量的正常人(或动物)作为参照样本。

一般认为至少应在 120 例以上。例数过少,确定的参考值范围往往不够准确。

所谓正常不是指机体任何器官、组织的形态和机能都正常的人,而是指符合特定健康水平的人,它必须要考虑可能影响所要制定参考值范围指标的各种疾病及干扰因素,将这些人排除在外。

2. 对选定的正常人进行准确的测量

3.决定取单侧范围还是双侧范围值。 例:肺活量 〉下限 甘油三酯,尿糖,尿铅 〈上限 血清总胆固醇 ,红 (白 )细胞数下限 < X< 上限

4.选择适当的百分范围。 所谓的“绝大多数”究竟是多少,取决于

资料的性质和研究的目的所规定的百分界限。最常用的百分界限是 95%

若主要目的在减少假阳性(如用于确诊病人),参考值范围的百分数范围要取大一些(如 95% 或 99% );反之, 若主要目的 在 减少假阴性(如用于初筛病人),百分数范围可以小一些(如 90% 或 80% )。

5.估计参考值范围的界限(1)百分位数法 应用:适用于任何分布,特别是偏态分布的资料。 公式:双侧1-α参考值范围 P100α/2 ~P100-100α/2

单侧1-α参考值范围 >P100α 或 <P100-100α

表表 2.5 2.5 参考值范围所对应的百分位数参考值范围所对应的百分位数百分范围%

单侧 双侧

只有下限

只有上限

下限 上限

95 P5 P95 P 2.5 P 97.5

99 P1 P99 P 0.5 P 99.5

( 2 )正态分布法 应用:正态分布或近似正态分布或经变量变换服从正态分布。 公式:双侧 1-α参考值范围 单侧 1-α参考值范围 〉 或 〈

sux

sux sux

表表 2.5 2.5 参考值范围所对应的正态分布区间参考值范围所对应的正态分布区间百分范围 %

单 侧 双侧 (对称 )

只有下限

只有上限

下限 上限

95

99

x

u

(三)质量控制(三)质量控制 上、下警戒线

上、下控制线

(四)正态分布是很多统计方法的(四)正态分布是很多统计方法的 理论基础理论基础