42
E-mail:lohqscrtvu.net 第第第 第第第第 第第第第 第第第第 () 第第第第 第第第第 () 第第第

统计学原理(第六讲)

Embed Size (px)

DESCRIPTION

统计学原理(第六讲). 罗洪群. 本章教学目的与要求 : 相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法。本章详细讲述了相关分析的概念、相关关系的确定、回归方程的建立和应用等内容。通过本章的学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。. 本 章 主 要 内 容. 第一节 相关的意义和种类. 第二节 相关系数. 第三节 回归分析. 第一节 相关的意义和种类. 一、相关分析的含义: P259. 二、相关关系的概念. - PowerPoint PPT Presentation

Citation preview

Page 1: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

统计学原理(第六讲)罗洪群

Page 2: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

本章教学目的与要求 : 相关分析是研究变量之间相互关系的密切程度和相互联系方式的重要方法。本章详细讲述了相关分析的概念、相关关系的确定、回归方程的建立和应用等内容。通过本章的学习,要理解相关分析的有关概念,掌握计算相关系数和配合回归方程的方法,并能够结合实际资料对变量进行相关分析。

Page 3: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

本 章 主 要 内 容

第一节 相关的意义和种类

第二节 相关系数

第三节 回归分析

Page 4: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

第一节 相关的意义和种类一、相关分析的含义: P259

二、相关关系的概念

函数关系是一种严格的依存关系,这种关系可以用 y = f ( x )的方程来表现。

相关关系是一种不完全确定的随机关系。

函数关系与相关关系的联系:对具有相关关系的现象进行分析时,必须利用相应的函数关系的数学表达式来表明现象之间的相关方程式。

Page 5: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

第二节 相关图表和相关系数

一、相 关 图 表 相关图表是相关分析的重要方法。通过相关图表可以直观地判断现象之间呈现的相关的形态和方向。

相关表

简单相关表( P264 表 7-3 )

分组相关表单变量分组相关表( P265表 7-4)

双变量分组相关表( P266表 7-5)

相关图 利用直角坐标系第一象限,把自变量置于横轴上,因变量置于纵轴上,在将两变量相对应的变量值用坐标点形式描绘出来即可。( p268 图 7-1 )

Page 6: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

二、相 关 系 数相关系数是测定变量之间相关密切程度的统计指标。1 、相关系数的计算方法:

相关系数按“积差法”计算。该方法是通过两变量与各自平均值的离差的乘积来反映两变量之间的相关程度。

积差法公式在教材第 271 页

计算相关系数的简化式:

2222

yynxxn

yxxyn

Page 7: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

2 、相关系数的性质

( 2 )相关系数的取值范围在绝对值的 之间。 其值大小反映两变量之间相关的密切程度, 具体判断方法见教材 P275 。

( 1 )相关系数有正负号,分别表示正相关和负相关。

( 3 )相关系数 1 表明两变量完全相关; 0

10

表明两变量完全不相关;

Page 8: 统计学原理(第六讲)

相关系数计算分析例题

880 36.4∑

62

86

80

110

115

132

135

160

1.2

2.0

3.1

3.8

5.0

6.1

7.2

8.0

1

2

3

4

5

6

7

8

生产费用

月产量序

号 x y2x 2y xy

1.444.00

9.6114.44

25.00

17.21

51.84

64.00

207.54

3844

739664001210013225

17424

18225

25600

104214

74.4

172.0248.0418.0575.0

805.2

972.0

1280.0

4544.6

统计学原理(第六讲)

Page 9: 统计学原理(第六讲)

,54.207,8,880,4.36 2 xnyx

6.4544,1042142 xyy

根据计算结果可知:

则相关系数为:

2222

yynxxn

yxxyn

97.0

说明产量和生产费用之间存在高度正相关。统计学原理(第六讲)

Page 10: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

第三节 回 归 分 析一、回 归 分 析 的 意 义

回归分析是对具有相关关系的两个或两个以上变量之间的数量变化的一般关系进行测定,确立一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估算预测提供一个重要的方法。

二、回 归 的 种 类

按自变量的个数分一 元 回 归

多 元 回 归

按回归线的形态分 线 性 回 归

非线性回归

Page 11: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

三、简单线性回归方程简单线性方程式的一般形式: bxay

(当两变量的增长比率为常数时,它们之间就呈 现为一种简单线性关系。)

利用简单线性回归方程进行回归分析的前提:

所分析的两个变量之间必须存在相关关系,且相关程度在显著相关以上。

对两变量进行简单线性回归分析的任务:

设法在分散的、具有线性关系的相关点之间配合一条最优的直线,以表明两变量之间具体的变动关系。

Page 12: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

在两变量相关的散点图中,引出一条最优的直线,这条直线就是估计回归线。它表明了两变量数量变动的一般关系。

估 计 回 归 线:

配合估计回归线的方程称为回归方程bxayc 方程式为:

自变量归系数:直线的斜率,又称回

直线的起点值,

:因变量的估计值

:

:

,

x

b

a

yc

回归系数 b的经济涵义:

当自变量变动一个单位时,因变量的平均变动值。

Page 13: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

配合直线回归方程的方法

配合直线回归方程的过程就是求解方程系数 a 、 b

的过程,求解 a 、 b 的方法一般采用最小平方法。用最小平方法配合回归直线的基本思想是:

在所有的相关点中,通过数学方法配合一条较为理想的直线,这条直线必须满足两点:

2 、原数列与趋势线的离差平方和为最小值。即最小值 2)( cyy

1 、原数列与趋势线的离差之和为零。即:

0)( cyy

Page 14: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

解联立方程得到:

2222 )(

xxn

yxxyn

xx

yxxyb

n

xb

n

yxbya

Page 15: 统计学原理(第六讲)

4544.6

74.4

172.0

248.0

418.0

575.0

805.2

972.0

1280.0

104214

3844

7396

6400

12100

13225

17424

18225

25600

207.54

1.44

4.00

9.61

14.44

25.00

37.21

51.84

64.00

880 36.4∑

62

86

80

110

115

132

135

160

1.2

2.0

3.1

3.8

5.0

6.1

7.2

8.0

1

2

3

4

5

6

7

8

生产费用

月产量序

号2xx y

2y xy

根据前面例题资料配合生产费用依产量变化的回归方程:

统计学原理(第六讲)

Page 16: 统计学原理(第六讲)

,54.207,8,880,4.36 2 xnyx

6.4544,1042142 xyy

22 )(

xxn

yxxynb

9.124.3654.2078

8804.366.454482

n

xb

n

ya 3.51

8

4.369.12

8

880

则回归方程为 : xyc 9.123.51

回归系数 b的涵义 :月产量每增加 1000 吨 ,生产费用平均增加 12.9 万元。

计算得到:

统计学原理(第六讲)

Page 17: 统计学原理(第六讲)

670

82

90

100

114

140

144

耐用消费品销售额(万元)

2820

340

380

450

470

560

620

人均年收入(元)

合计

1990

1991

1992

1993

1994

1995

时间

要求:分析两变量相关密切程度,若为显著相关以上,则对两变量进行回归分析。

有某地区人均年收入与耐用消费品销售额资料如下:

统计学原理(第六讲)

Page 18: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

答案:相关系数 r = 0.98 b = 0.24

a = -1.13

yc = -1.13+0.24x

回归系数 b 的涵义 : 人均年收入每增加一元 , 耐用消费品销售额平均增加 0.24 万元。

Page 19: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

四 回归系数与相关系数的关系因为:

2222

yynxxn

yxxyn

22 )(

xxn

yxxynb

yx

xy

2

2

2

x

xyb

y

xb 所以:

x

yrb

即:

Page 20: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

五 回归分析与相关分析的特点

1 、回归分析必须区分自变量和因变量,而相关 分析不必区分。

2 、回归分析的两个变量一个是自变量,一个是 因变量,通过给定自变量的值来推算因变量 的可能值;而相关分析的两个变量都是随机 变量。

3 、回归分析中对于因果关系不甚明确的两个变量, 可以建立两个回归方程;而相关分析只能计算 出一个相关系数。

4 、一种回归方程只能做一种推算,即只能给出自 变量的值来推算因变量的值,不能逆推。

Page 21: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

六 估 计 标 准 误

1 、估计标准误的涵义:教材 P289

2 、估计标准误的计算公式:教材 P289

简化公式:教材 P291

2

)( 2

n

yyS cyx

2

2

n

xybyayS yx

Page 22: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

本章作业

Page 23: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

判断题 1. 正相关就是指因素标志和结果标志的数

量变动方向都是上升的。( )×

Page 24: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

2. 只有当相关系数接近于 +1 时,才能说明两个变量之间存在高度相关关系。

( )×

Page 25: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

3. 若变量 x 的值减少时变量 y 的值也减少,说明变量 x 与 y 之间存在正的相关关系。

( )√

Page 26: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

4. 回归系数 b 和相关系数 r 都可用来判断现象之间相关的密切程度。 ( )

 

×

Page 27: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

5. 若直线回归方程 y=170-2.5x, 则变量 x 和 y 之间存在着负的相关关系。 ( )

Page 28: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

单项选择

1. 当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( B )

A. 相关关系

B. 函数关系

C. 回归关系

D. 随机关系

Page 29: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

2. 现象之间的相互关系可以归纳出两种类型 ,即( A)

A. 相关关系和函数关系 .

B. 相关关系和因果关系

C. 相关关系和随机关系

D. 函数关系和因果关系

Page 30: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

3. 相关系数的取值范围是( C ) A.0≤r≤1

B.-1<r<1

C.-1≤r≤1

D.-1≤r≤0

 

Page 31: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

4. 变量之间的相关程度越低,则相关系数的数值( B )

A. 越小

B. 越接近于 0

C. 越接近于 -1

D. 越接近于 +1

Page 32: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

5. 回归分析中的两个变量( D )

A . 都是随机变量

B . 关系是对等的

C . 都是给定的量

D . 一个是自变量 , 一个是因变量

Page 33: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

6. 估计标准误说明回归直线的代表性.因此( B )

A . 估计标准误数值越大,说明回归方程代表性越大

B . 估计标准误数值越大,说明回归方程代表性越小

C . 估计标准误数值越小,说明回归方程代表性越小

D . 估计标准误数值越小,说明回归方程的实用价值小.

 

Page 34: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

多项选择

1. 下列属于正相关的现象是( ABE )

A . 家庭收入越多,其消费支出也越多

B . 产量随工人劳动生产率的提高而增加

C . 流通费用率随销售额的增加而减少

D . 生产单位产品所耗的工时随劳动生产率的提高而减少

E . 产品产量随生产用固定资产价值减少而减少

Page 35: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

2. 估计标准误是反映( ABDE )

A . 回归方程代表性大小的指标

B . 估计值与实际值误差程度的指标

C . 自变量与因变量离散程度的指标

D . 因变量估计值的可靠程度的指标

E . 回归方程实用价值大小的指标

Page 36: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

填空题 1. 现象之间的相关关系按相关的程度分为完全相关、

不完全 相关和 不 相关;按相关的方向分为 正 相关和 负 相关;按相关的形式分为 线性 和 非线性 相关;按影响因素的多少分为 单 相关和 复相关。

Page 37: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

2. 完全相关即是 函数 相关,其相关系数为 +1 或 -1 。

Page 38: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

3. 相关系数是在 线性 相关的条件下用来说明两个变量相关 关系密切程度 的统计分析指标。

Page 39: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

4. 一个回归方程只能作一种推算,即给出 自变量 的数字,估计 因变量 的可能值。

Page 40: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

5. 用来说明回归方程代表性大小的统计分析指标是 估计标准误 指标。

Page 41: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

计算题:检查五位同学的统计学学习时间与成绩分数如下表所示 :

学习时数 ( 小时 ) 学习成绩 ( 分 )

4 40

6  60

7 50

10 70

13 90

Page 42: 统计学原理(第六讲)

E-mail:lohqscrtvu.net

第七章 相关分析

统计学原理(第六讲)

要求:

(1) 计算相关系数

(2) 建立学习成绩与学习时间的直线回归方程