666
主主 主主主

应 用 统 计

Embed Size (px)

DESCRIPTION

应 用 统 计. 主讲:王红梅. 《 应用统计 》 课程介绍. 《 应用统计 》 是全国高校经济 管理类各专业的一门专业基础课 程,是其课程体系的一个重要组 成部分。. 本课程教学要求. 教学内容 考试要求. 统计学 是什么?. ☆ 统计学是一门研究社会经济和自然现象的数量方面的方法论科学。 ☆ 是一门关于如何搜集、表现、分析、解释数据,从而认识现象数量特征和数量规律的方法论科学。. ☆ 统计学是一门关于数据的科学,只要研究和分析数据,就要用到统计学;统计又是一种重要的分类手段,只要有分类的问题,就要用到统计学。 - PowerPoint PPT Presentation

Citation preview

Page 1: 应 用 统 计

主讲:王红梅

Page 2: 应 用 统 计

《应用统计》课程介绍

《应用统计》是全国高校经济管理类各专业的一门专业基础课程,是其课程体系的一个重要组成部分。

《应用统计》是全国高校经济管理类各专业的一门专业基础课程,是其课程体系的一个重要组成部分。

Page 3: 应 用 统 计

本课程教学要求

教学内容

考试要求

Page 4: 应 用 统 计

统计学统计学 是什么?是什么?

Page 5: 应 用 统 计

☆☆ 统计学是一门研统计学是一门研究社会经济和自然究社会经济和自然现象的数量方面的现象的数量方面的方法论科学。方法论科学。

☆☆ 是一门关于如何是一门关于如何搜集、表现、分析、搜集、表现、分析、解释数据,从而认解释数据,从而认识现象数量特征和识现象数量特征和数量规律的方法论数量规律的方法论科学。科学。

Page 6: 应 用 统 计
Page 7: 应 用 统 计
Page 8: 应 用 统 计

☆☆ 统计学是一门关于数据的科学,只要统计学是一门关于数据的科学,只要研究和分析数据,就要用到统计学;统计研究和分析数据,就要用到统计学;统计又是一种重要的分类手段,只要有分类的又是一种重要的分类手段,只要有分类的问题,就要用到统计学。问题,就要用到统计学。

☆☆ 统计学几乎可以用于一切领域,各种统计学几乎可以用于一切领域,各种事物所具有的内在数量规律性都可以借助事物所具有的内在数量规律性都可以借助统计方法加以探索。统计方法加以探索。

Page 9: 应 用 统 计

鉴别文章作者鉴别文章作者

““ 红楼梦”后红楼梦”后 4040 回是否为曹雪芹所写,回是否为曹雪芹所写,“水浒传”有“水浒传”有 7070 回本、回本、 100100 回本、回本、 120120回本,后几十回是否出自施耐庵一人之手?回本,后几十回是否出自施耐庵一人之手?

弄清这些问题当然是文学家和史学家弄清这些问题当然是文学家和史学家的事,但统计可助一臂之力,提出有说服的事,但统计可助一臂之力,提出有说服力的数据。力的数据。

19851985 、、 19861986 复旦大学李贤平教授带领他复旦大学李贤平教授带领他的学生作了这项有意义的工作。的学生作了这项有意义的工作。

Page 10: 应 用 统 计

他们创造性的想法是将他们创造性的想法是将 120120 回看成是回看成是 120120 个样本,然后个样本,然后

确定与情节无关的虚词作为变量确定与情节无关的虚词作为变量 (( 所以要抛开情节,是所以要抛开情节,是

因为在一般情况下,同一情节大家描述的都差不多,但因为在一般情况下,同一情节大家描述的都差不多,但

由于个人写作特点和习惯的不同,所用的虚词是不会一由于个人写作特点和习惯的不同,所用的虚词是不会一

样的样的 )) ,数出每一回里变量出现的次数,作为数据,用,数出每一回里变量出现的次数,作为数据,用

多元分析中的聚类分析法进行分类。多元分析中的聚类分析法进行分类。

Page 11: 应 用 统 计

分析结果果然表明分析结果果然表明 120120 回分属两类,回分属两类,

即前即前 8080 回为一类,后回为一类,后 4040 回为一类,有回为一类,有

说服力地证实了全书不是出自同一人的说服力地证实了全书不是出自同一人的

手笔。手笔。

Page 12: 应 用 统 计
Page 13: 应 用 统 计

第一章 总论 基本概念

统计分析的方法

第八章 抽样调查第七章 统计指数第六章 动态数列第五章 平均指标和变异指标第四章 总量指标和相对指标

第九章 相关与回归分析

统计工作中两个环节第三章 统计整理第二章 统计设计与统计调查

第十章 统计预测

第十一章 统计综合分析 综合应用

Page 14: 应 用 统 计

考试要求 考试内容 第一章——第九章 考试分数比例

笔试成绩占 40%其他综合占 60%

笔试考试题型单项选择题、多项选择题、判断题、综合分析题

笔试考试题型单项选择题、多项选择题、判断题、综合分析题

Page 15: 应 用 统 计

第一章 总 论

§1 统计研究的对象、特点和作用

§2 统计研究的基本方法与过程

§3 统计学中的几个基本概念

§4 统计工作的基本任务

★ 思考与练习

Page 16: 应 用 统 计

1 、了解统计的含义、研究对象、特点及作用;2、掌握统计活动的基本方法、过程和组织;3、重点掌握统计学中的基本概念。

学习目的及要求

Page 17: 应 用 统 计

§1 统计研究的对象、特点和作用 统计学源于实践,是对实践的理统计学源于实践,是对实践的理论概论概

括和总结,又用于指导实践。括和总结,又用于指导实践。 在统计学的产生过程中,有三个在统计学的产生过程中,有三个源源

头,并形成了著名的三个学派:头,并形成了著名的三个学派: 国 势 学 派国 势 学 派

政治算术学派政治算术学派

数理统计学数理统计学派派

Page 18: 应 用 统 计

统 计

统计工作 统计资料 统计学

Page 19: 应 用 统 计

统计工作是对社会经济现象数量方面进行搜集、整理和分析工作的总称。统计资料是统计部门或单位进行工作搜集、整理、编制的各种统计数据资料的总称。统计学是关于统计过程的理论和方法的科学。

Page 20: 应 用 统 计

统计工作与统计资料是统计过程与统计成果的关系,统计工作与统计学则是统计实践与统计理论的关系。

Page 21: 应 用 统 计

二、统计研究的对象和特点

1 、社会经济统计的研究对象是大量社会经

济现象总体的数量方面,其根本特征是在质与量的辨证统一中研究大量社会经济现象总体的数量方面。 统计既可研究自然现象,也可研究社会经济现象,本书侧重于研究社会经济现象的数量方面。

Page 22: 应 用 统 计

统计学的特点

总体性

数量性

广泛性

具体性

社会性

Page 23: 应 用 统 计

三、统计的作用

1 、统计是社会认识的一种有力武器2 、统计是制定计划、实行宏观调控的基础3 、统计是制定政策的依据4 、统计是实行管理的手段5 、统计是认识世界、开展国际交流和科学研究的工具

Page 24: 应 用 统 计

四、统计学的理论基础

马列主义哲学 唯物辩证法 经济学 数学等

Page 25: 应 用 统 计

§2 统计研究的基本方法与过程一、统计研究的基本方法

二、统计工作过程

大量观察法大量观察法 分组法分组法

统计分析统计整理

统计调查统计设计

综合指标法 综合指标法

Page 26: 应 用 统 计

§3 统计学中的几个基本概念

一、统计总体与总体单位1、统计总体是由客观存在的,在同一性质基础上结合起来的许多个别单位构成的整体。(确定统计总体的前提)

2、总体单位是指构成总体的个体单位,它是总体的基本单位。(又称个体)

Page 27: 应 用 统 计

总总体体单单位位

总总体体

总体

总体单位

Page 28: 应 用 统 计

3 、统计总体的特征:大量性、同质性、差异性(变异性)4、统计总体的分类按包含单位的数量:有限总体和无限总体按单位标志的属性:数量总体和属性总体5、总体和总体单位是互为存在条件地连接在一起;总体和总体单位的概念并不是固定不变的

Page 29: 应 用 统 计

如:研究一个企业的职工基本情况,则该企业的全部职工构成总体,每一个职工是总体单位 ;

若研究一个城市的企业情况时,则该市所有企业是总体,每一个企业又成为总体单位,而企业的职工人数只是单位的标志。

Page 30: 应 用 统 计

二、标志和指标

(一)标志1、标志是说明总体单位属性和特征的名称2、标志表现是标志特征在各单位的具体表现3、标志的分类:

品 质 标 志 数 量 标 志

标志

Page 31: 应 用 统 计

品质标志表示事物质的特征,不能用数值表示。如:性别、民族、工种 性别: 女品质标志 标志的具体表现

Page 32: 应 用 统 计

数量标志表示事物的量的特征,可以用

数值表示。如:工资、年龄、体重等。

年龄: 18数量标志 标志值

Page 33: 应 用 统 计

数量标志又分常量、变量 按具体表现是否存在差异分:1、不变标志:当某一标志的具体表现在各个总体单位上都相同时,则为不变标志。

不变标志是许多个体结成总体的前提,体现总体的同质性

Page 34: 应 用 统 计

2 、可变标志:当某一标志的具体表现在各个总体单位上都不相同时,则为可变标志。

例:拟调查财经系职称为副教授的教师工资情况

Page 35: 应 用 统 计

(二)指标1、统计指标是说明现象总体量的特征的概

念或范畴,及通过统计实践活动可得到指标的具体数值的总称。

Page 36: 应 用 统 计

我国 2003年 GDP为 116 694亿元

2 、统计指标的特点: 统计指标都能用数字表示。 统计指标是反映一定社会经济范畴的数量 统计指标是说明总体综合特征的。

指标名称 指标数值

Page 37: 应 用 统 计

(三)标志与指标的关系⑴区别 :①指标是说明总体数量特征的概念,而标志是说明总体单位特征的概念。前者范围大些,后者的范围小些。②指标都是用数值表示的,而标志有的是用数字表示,有的是用文字表示。③指标值是由数量标志值汇总得出来的,而标志值则不一定通过汇总。

Page 38: 应 用 统 计

⑵联系 : 许多统计指标是由各总体单位的数量标志值汇总而来的 ;

指标和标志之间存在转化关系 .

Page 39: 应 用 统 计

三、变异、变量和变量值

(一)变异:可变标志在总体各个单位具体表现上的差别就是变异。包括质的变异和量的变异。 变异是普遍存在的,是统计的前提。

Page 40: 应 用 统 计

(二)变量:可变的数量标志。

年龄: 18

变量 变量值

变量按是否连续分为:连续变量和离散变量

Page 41: 应 用 统 计

提问:请同学举例辨析 有些变量其性质是属于连续变量,但实际工作中却把它们当作离散变量处理,其尾数采用“四舍五入”,以利于统计资料的

整理,如成绩、年龄………,取其整数或小数点后保留 1-2 位,但并不改变其变量值的连续性质。

Page 42: 应 用 统 计

四、统计指标与统计指标体系

1 、统计指标的分类 按所反映的总体内容不同分为 数量指标(绝对数) 质量指标(相对数、平均数)。 按其作用和表现形式不同分为 总量指标——绝对数 相对指标——相对数 平均指标——平均数

Page 43: 应 用 统 计

①数量指标 : 它说明总体规模大小和数量多少。一般用绝对数表示,其数值随总体范围大小而变化。

②质量指标 : 它说明总体内部数量对比关系和一般水平。反映现象发展程度和经济效果,其数值大小与总体范围大小无直接关系。

Page 44: 应 用 统 计

2 、统计指标体系 由若干个相互联系的统计指标组成的一个整体称为统计指标体系。 例:各地区城市设施水平指标体系:人均房屋使用面积、城市人口用水普及率、城市煤气普及率、每万人拥有公共汽 (电 )车、人均拥有铺装道路面积、人均公共绿地面积、每万人拥有公共厕所

Page 45: 应 用 统 计

对辽宁对外经贸学院的学生状况进行调查 辽宁对外经贸学院的所有学生是总体 辽宁对外经贸学院的每一位学生是总体单位 性别、民族是品质标志 年龄、体重、身高是数量标志,也称变量 辽宁对外经贸学院学生人数是数量指标 辽宁对外经贸学院学生平均年龄、四级通过率是质量指标

Page 46: 应 用 统 计

五、存量与流量

1 、流量是指一定时期测算的量。 存量是指一定时点测算的量。2、流量与存量相会依存,缺一不可。 存量是流量的前提和基础,而流量在一定程度上取决于存量的大小。

Page 47: 应 用 统 计

§4 我国统计的任务和组织

一、统计的任务二、统计组织

分散型 集中型

统计管理体制

统一领导、分集负责

Page 48: 应 用 统 计

Thank you very Thank you very muchmuch!!Thank you very Thank you very muchmuch!!

Page 49: 应 用 统 计

第二章 统计设计与统计调查

§1 统计设计的概念和内容 §2 统计指标和指标体系的设计 §3 统计表及其设计 §4 统计调查的概念和种类 §5 统计调查方案 §6 统计调查的组织方式

★ 思考与练习

Page 50: 应 用 统 计

学习目的及要求

1.认识统计设计、统计调查的意义;2. 明确统计设计、统计调查概念、类别;3.理解统计指标设计的原则;4.掌握各种调查方法的特点、应用条件,调查方案的制定,并能根据实际情况采用适当的调查方法搜集资料。

Page 51: 应 用 统 计

§1 统计设计的概念和内容

一、统计设计的概念和意义二、统计设计的种类三、统计设计的内容

Page 52: 应 用 统 计

一、统计设计的概念和意义

统计设计:根据统计研究对象的性质和研究目的,对统计工作各个方面和各个环节通盘考虑和安排,制定各种设计方案的过程。

Page 53: 应 用 统 计

研究对象的范围研究对象的范围

中期设计中期设计短期设计短期设计长期设计长期设计

单阶段设计单阶段设计全过程设计全过程设计

专项设计专项设计整体设计整体设计

工作阶段工作阶段

时 期时 期

二、统计设计的种类

Page 54: 应 用 统 计

三、统计设计的内容

明确规定统计研究的目的和任务 确定统计指标和统计指标体系 确定统计分类和分组 研究设计统计表 确定统计分析研究的内容 制定统计调查方案

Page 55: 应 用 统 计

制定统计整理方案 规定各个阶段的工作进度和时间安排 考虑各部门和各阶段的配合与协调 统计力量的组织与安排

Page 56: 应 用 统 计

§2 统计指标和指标体系的设计

一、统计指标的概念和特点二、统计指标的种类三、统计指标体系的概念和种类四、统计指标体系的设计原则

科学性科学性 目的性目的性 联系性联系性 统一性统一性 可比性可比性

Page 57: 应 用 统 计

§3 统计表及其设计

一、统计表的意义和构成二、统计表的种类三、统计表的设计

Page 58: 应 用 统 计

一、统计表的作用

统计表是把统计调查得来得数字资料,经过汇总整理后,得出一些系统化的统计资料,将其按一定顺序填列在一定的表格内,这个表格就是统计表。

Page 59: 应 用 统 计

二、统计表的结构

从形式上看,统计表是由总标题,横行标题、纵栏标题和数字资料四部分组成 见表 从内容上看,统计表是由主词和宾词两部分构成。

主词是统计表要说明的总体、总体各个组及各单位的名称,

宾词是说明主词的统计指标。 见表

Page 60: 应 用 统 计

总标题 2001年全国 工业增加值

纵栏标题 项目 产值 (亿元 ) 比重 (%)

横行标题

轻工业重工业

10 64916 301

39.560.5 指

标数值合计 26 950 100

主词 宾词

Page 61: 应 用 统 计

二、统计表的种类 按用途不同分: 调查表、汇总表和分析表

(1)调查表:用来搜集资料。(2)汇总表:用来加工和汇总统计资料,一般带有合计栏。 (3)分析表:用来进行统计分析,一般带有分析指标栏和计算栏。

Page 62: 应 用 统 计

年末职工家庭就业人口调查表(单一表)

姓名 与户主关系 性别年龄

工作单位 职业 职务

职称 备注

家庭人口 人 就业人口 人

Page 63: 应 用 统 计

某年甲、乙两地工业企业从业人数汇总表

按地区分组 从业人数(万人)

甲地 11.47

乙地 35.99

全地区 47.46

Page 64: 应 用 统 计

分析表

营业额(万元 )

企业个数( 个 )

流通费用率 (%)

50 以下50~ 100

100~ 200200~ 400400~ 600

600 以上

20421253862

13.411.810.59.78.36.5

Page 65: 应 用 统 计

根据分组情况分: 简单表、分组表和复合表(1)简单表:主词不经过任何分组的统计表。 (2)分组表:主词按某一标志进行分组的统计表。 (3)复合表:主词按两个或两个以上标志进行复合分组的统计表

Page 66: 应 用 统 计

按统计数列的性质分:1. 空间数列表2. 时间数列表3. 时空数列结合表

Page 67: 应 用 统 计

三、统计表的设计

平行配置 平行配置是对宾词栏中的分组指标按分组标志做平行排列。

见表 层叠配置 层叠配置就是将宾词栏中的分组指标按分组标志进行层叠排列。

见表

Page 68: 应 用 统 计

1.平行配置某专业课程期末考试成绩

成绩

班级 性别合计

1班 2班 男 女

50~ 6060~ 7070~ 8080~ 9090以上

271182

4613101

4710111

261472

61324183

合计 30 34 33 31 64

Page 69: 应 用 统 计

2.层叠配置

某专业课程期末考试成绩

成绩1班 2班

总计男 女 合计 男 女 合计

50~ 60

60~ 70

70~ 80

80~ 90

90以上

24831

03351

271182

23280

231121

4613101

61324183

合计 18 12 30 15 19 34 64

Page 70: 应 用 统 计

统计图

第一季度第二季度第三季度第四季度

90.080.070.060.050.0

14

12

10

8

6

4

2

0

Page 71: 应 用 统 计

§4 统计调查的概念和种类

一、统计调查的概念、地位和种类

统计调查是按照统计任务的要求,运用科学的调查方法,有组织地向社会实际搜集各项原始资料的过程。

Page 72: 应 用 统 计

意义:统计调查是人们认识社会的基本方式;是统计工作中的基础环节;其理论和方法在统计学原理中占有重要地位。

统计整理统计调查 统计分析

Page 73: 应 用 统 计

(一)按调查对象包括的范围分类

1 、全面调查:指对研究现象总体的所有单位

进行调查。

2 、非全面调查:指对研究现象总体的一部分

单位进行调查

二、统计调查的种类

Page 74: 应 用 统 计

(二)按调查组织形式分类 统计报表 专门调查(三)按调查登记时间是否连续 经常性调查 一次性调查

Page 75: 应 用 统 计

⑴经常性调查:就是随着调查对象在时间上的变化而进行连续不断地登记或观察。如工业产品产量调查、燃料和材料消耗调查等。 ⑵一次性调查:就是对被调查对象在某一时刻的状况进行一次性登记,以反映事物在一定时点上的发展水平。是不连续的调查。如人口可隔一段时间进行一次普查。

Page 76: 应 用 统 计

(四)搜集资料的方法不同

直接观察法 访问调查法 报告报表法 问卷调查法 卫星遥感法 网上调查法

Page 77: 应 用 统 计

§5 统计调查方案

(一)确定调查目的和任务(二)确定调查对象和单位(三)确定调查项目、设计调查表(四)确定调查时间、空间和方法(五)制定调查工作组织实施计划

Page 78: 应 用 统 计

一、确定调查目的和任务为什么要调查,通过调查

要解决什么样的问题。应该搜集什么样的资料以及怎么样去搜集所需资料。

Page 79: 应 用 统 计

调查目的决定着调查对象、调查内容和方法。

例: 2000年全国人口普查的目的:“为了

科学地制定国民经济和社会发展战略与规划,

制定人口政策,统筹安排人民的物质和文化生

活,实现人口与资源、环境的协调发展。”

Page 80: 应 用 统 计

二、确定调查对象和调查单位

调查对象是根据调查目的和任务而确定所要调查研究的现象总体。调查单位是构成调查对象的每一个具体单位,即总体单位。 调查单位调查单位

调查对象调查对象

Page 81: 应 用 统 计

举例: 2000年人口普查规定:“人口普查对象是具有中华人民共和国国籍并在中华人民共和国境内常住的人”。

Page 82: 应 用 统 计

2. 调查单位:构成调查对象的每一个单位 , 即总体单位。填报单位(报告单位):是指负责向上级汇报调查内容、提交统计资料的单位。 填报单位一般在行政上、经济上具有一定独立性的单位,而调查单位可以是人、单位、也可以是物。

两者有时一致 , 有时不一致。如:工业企业普查,每个工业企业既是调查单位又是填报单位。

Page 83: 应 用 统 计

QQ1 …………1 …………

QQ2 …………2 …………

QQ3 …………3 …………

QQ4 …………4 …………

三、确定调查项目、设计调查表三、确定调查项目、设计调查表 调查项目调查项目是调查的具体内容。需要了解调查是调查的具体内容。需要了解调查单位的哪些属性或特征(又称为调查标志),是单位的哪些属性或特征(又称为调查标志),是调查方案设计的核心内容。调查方案设计的核心内容。

调查表是调查表是表现调查项目的表格或问卷。表现调查项目的表格或问卷。

Page 84: 应 用 统 计

举例: 2000年人口普查中,分为短表和长表,长表为抽样 10% 的人填报,短表为其余人填报。短表按人填报的项目有 9 项,按户填报的项目有 10 项。长表按人填报的项目有 26项,按户填报的项目有 23 项。

Page 85: 应 用 统 计

调查表—将调查项目按一定顺序、一定结构排列所形成的表格。调查表一般由表头、表体和表脚三个部分组成调查表一般分为单一表和一览表 调查表还可以表现为问卷的形式,其主体

部分由一系列问题及其备选答案组成,由被调查者自愿回答。这样的调查称为问卷调查。

Page 86: 应 用 统 计

问卷:是为了达到调研项目目的和搜集必要的数据而设计好的一系列问题(以问题的形式系统地记载调查内容的一种印件)。

问卷提供了标准化和统一化的数据搜集程序,使问题的用语和提问的程序标准化。

Page 87: 应 用 统 计

问卷调查的方法 传统的问卷调查方法:入户访问、街头拦截、电话调查、厅堂调查、留置问卷调查、邮寄调查、固定样本组连续调查等

建立在现代信息技术上的新型调查方法:计算机辅助个人访问( CAPI)、计算机辅助电话访问( CATI)、传真( FAX)调查、电子邮件 (E-mail) 调查、自动语音电话调查、网上 (online) 调查等。

Page 88: 应 用 统 计

1. 调查时间:调查资料所属的时间 (时期或时点) 如是时期现象,就要明确规定资料所反映的调查对象从何年月日至何年月日止的资料。如调查的是时点现象,就要规定统一的标准时间。例如2000年第五次人口普查的标准时间是11月 1日 0时。         

四、确定调查时间、空间和方法

Page 89: 应 用 统 计

2. 调查期限:进行调查工作的时间 , 包括搜集资料和报送资料的整个工作所需要的时间。

人口普查登记工作的期限从 2000年 11月 1日开始,11月 10日前结束。  

Page 90: 应 用 统 计

五、制定调查工作组织实施计划

统计过程的总方案:包括明确调查的组织机构、宣传、调查人员的选择和培训、调查表或问卷及调查工具的准备、经费预算、是否需要试点等。

调查步骤 日程安排: 登记: 2000.11.1--11.10 复查: 2000.11.15 质量抽查: 11.30 快速汇总资料上报: 2000.12.31 全部汇总资料上报: 2001.9.30 完成全部工作: 2001.12.31                   

Page 91: 应 用 统 计

统计调查的组织形式

统计报表

抽样调查

典型调查

重点调查

全面调查全面调查 非全面调查非全面调查

Page 92: 应 用 统 计

1 、普查

1 )普查的概念 普查 : 专门组织的一次性全面调查。 它主要用来搜集那些不宜用经常调查能搜集的全面、准确的统计资料。

总体总体

Page 93: 应 用 统 计

⒉普查的方式方法⑴自上而下对调查单位进行登记⑵颁发调查表,由调查单位填报 主要有:人口普查、工业普查、第三产业普查、基本单位普查等。

Page 94: 应 用 统 计

3. 普查的组织原则 规定标准时点 正确选择普查时期 同时进行调查 调查项目不能任意改变

Page 95: 应 用 统 计

2 、统计报表制度

统计报表是按照国家或上级部门统一规定的表式、统一的指标、统一的报送程序和报送时间,自下而上逐级提供基本统计资料的一种调查方式。

作用:宏观和微观

Page 96: 应 用 统 计

统计报表的种类

按主管系统分:基本与专业 按调查范围分:全面与非全面 按报送周期分:定期和年报 按填报单位分:基层和综合 按报送方式分:电讯和书面

Page 97: 应 用 统 计

统计报表制度

我国统计报表制度近年来进行了一系列的改革,主要分为: 7 种基层一套表和 9套综合报表制度。

基层一套表: A 农林牧渔企业报表 B 工业企业报表 C 建筑工企业报表 D 交通运输企业报表 E 批发零售贸易及餐饮业企业报表 F 服务业企业报表 G 行政事业单位报表

Page 98: 应 用 统 计

3 、重点调查

重点调查就是在调查对象中,只选择一部分重点单位而进行的非全面调查。

Page 99: 应 用 统 计

所谓重点单位:就是指在总体中举足轻重的那些单位,这些单位在总体中虽然不多, 所占比重不大 , 但就调查的标志值言,其在总体标志总量中占有很大比重。

Page 100: 应 用 统 计

4 、典型调查

1 )涵义:就是在对调查对象有一定了解的基础上有意识地选择若干具有代表性的单位进行的非全面调查。 2 )典型调查的特点 : ⑴调查单位是根据调查目的有意识选择出来的 , 机动灵活 ,省时、省力。 ⑵是一种深入、细致的调查。

Page 101: 应 用 统 计

典型调查作为一种定性的调查研究方法,是各种社会调查的主要方法,有着广泛应用。

Page 102: 应 用 统 计

5 、抽样调查

抽样调查:就是按照随机原则从调查对象中抽取一部分单位作为样本进行调查,根据调查结果推断总体的一种调查方法。

总体总体

随机样本随机样本

Page 103: 应 用 统 计

抽样调查目的:以样本数值推算总体数值。2.抽样调查的特点: ( 1) 按随机原则来进行。 ( 2)以样本数值推算总体数值。 ( 3)抽样误差可以估计和控制,使推断结果具有一定的可靠性和准确性。

抽样调查和全面调查相比,具有经济性、时效性、准确性和灵活性等优越性。

Page 104: 应 用 统 计

3.应用范围 : ⑴在实际工作中不可能进行全面调查而又需要了

解其全面资料的事物时。 ⑵有些资料虽可进行全面调查,但比较困难或并

不必要。如:居民家庭收支情况调查。 ⑶对普查或全面调查统计资料的质量进行检查和修正。如:人口普查资料的正确性复查、验证等。

Page 105: 应 用 统 计

使用统计资料时必须注意:不应在非随机抽样情况下,随意把结论扩大到总体。 严格的推断必须事先框定一个总体,形成抽样框,随机抽取样本;由样本信息也只能推断到这个框定的总体,而非随意的抽样,任意的推断。 随机抽样不是随便抽样。

Page 106: 应 用 统 计

八、统计调查误差及其防止

登记性误差—调查误差 代表性误差—抽样调查中产生

Page 107: 应 用 统 计

Thank you Thank you very much!very much!

Page 108: 应 用 统 计

第三章 统计整理

§1 统计整理的意义和步骤§2 统计分组§3 次数分布§4 统计汇总的组织、技术与现代化

Page 109: 应 用 统 计

学习目的及要求

1.了解统计整理的基本概念和意义2.掌握统计分组的方法 3.掌握分配数列的编制方法以及统计图的绘制方法4.掌握统计表的编制。

Page 110: 应 用 统 计

§1 统计整理的意义和步骤

统计整理根据统计研究的任务与要求,对统计调查所搜集到的数据资料进行分组、汇总,使其条理化、系统化的工作过程称统计整理。 统计整理包括对原始资料和次级资料的整理。

Page 111: 应 用 统 计

(二)统计整理的意义

作用:是统计调查的继续,是统计分析的前提和基础,在整个统计工作中发挥着承上启下的作用。

统计调查 统计整理 统计分析

统计工作

Page 112: 应 用 统 计

二、统计整理的原则和步骤

1 .设计和编制统计资料整理方案

4 .制作统计表或统计图制作统计表或统计图

3 .统计分组和统计汇总统计分组和统计汇总

2 .对原始资料进行审核对原始资料进行审核

Page 113: 应 用 统 计

§2 统计分组

统计分组是根据研究事物的特点和统计研究的目的,按照一标志将统计总体划分为若干个组成部分的一种统计方法。 它是在总体内进行的一种定性分类,把总体划分为一个个性质不同的范围更小的总体。

Page 114: 应 用 统 计

二、统计分组的作用

区分现象质的差别 反映现象总体的内部结构 分析现象之间的相互依存关系。

Page 115: 应 用 统 计

三、统计分组的方法

统计分组的关键是分组标志的选择和划分分组组限。分组标志的选择:

要根据研究问题的目的来选择 要选择反映现象本质特征的标志作为分组

标志。 要结合现象所处的具体历史条件或经济条件来选择

Page 116: 应 用 统 计

(一)按其任务和作用不同分

统 计 分 组 的 种 类

类型分组

结构分组

分析分组

Page 117: 应 用 统 计

1.类型分组

按大中小型分2000年 2001年

产值(亿元 )

比重(%)

产值(亿元 )

比重(%)

大型工业企业中二型工业企业小型工业企业

38303.21

10689.81

36680.64

0.450.120.43

44815.9912542.4138090.58

0.470.130.40

全国总计 85673.66

100.00 95448.98 100.00

一般认为:现象总体按主要的品质分组,多属于类型分组。类型分组的目的是划分现象的类型。

如:工业企业按大中小型分组

Page 118: 应 用 统 计

2.结构分组 一般认为:

按数量标志分组为结构分组。结构分类的目的是揭示现象内部结构。

如:按年龄分组、考试成绩按分数分组 (如右表 ) 。

成绩(分)

人数(人)

60以下 2

60~ 70 10

70~ 80 18

80~ 90 12

90以上 3

合计 45

Page 119: 应 用 统 计

3.分析分组分析分组的目的

是研究现象之间的依存关系。如商业企业按营

业额分组后,再计算各组商业企业的平均商品流通费用率,就可以分析商品营业额和流通费用率之间的关系。

营业额(万元 )

企业个数( 个 )

流通费用率 (%)

50 以下50~ 100100~ 20

0200~ 40

0400~ 60

0600 以上

20421253862

13.411.810.59.78.36.5

Page 120: 应 用 统 计

(一)按其任务和作用不同分

(二)按分组标志的多少分

二、统 计 分 组 的 种 类

类型分组

结构分组

分析分组

简单分组

复合分组

Page 121: 应 用 统 计

1.简单分组

简单分组是根据现象的复杂程度和分析研究的任务,将总体按一个标志进行分组。

如:人口按年龄分组

Page 122: 应 用 统 计

2.复合分组复合分组是根据

现象的复杂程度和分析研究的任务,将总体按两个或两个以上标志进行层叠分组。

如:工人按技术等级和性别进行层叠分组(见右表)

技术等级 人数(人)高级 男 女中级 男 女初级 男 女

862

64481614710245

合计 219

Page 123: 应 用 统 计

(一)按其任务和作用不同分

(二)按分组标志的多少分

(三)按分组标志的性质分

品质分组

变量分组

二、统 计 分 组 的 种 类

类型分组

结构分组

分析分组

简单分组

复合分组

Page 124: 应 用 统 计

1.品质分组

品质分组是按品质标志进行的分组

如企业按经济成份、地理位置分组,职工按性别、文化程度分组等

企业按经济类型分组

企业数(个)

国有企业集体企业个体企业其它企业合 计

Page 125: 应 用 统 计

2.变量分组

变量分组是按数量标志进行的分组

如企业按职工人数、劳动生产率分组,职工按工龄、工资分组等。

居民家庭按子女数分组

户数(户)

0123

合 计

Page 126: 应 用 统 计

分组体系

分组体系: 对现象总体运用多个有联系的分组标志进行分组,形成相互联系、相互补充的组所组成的整体称为分组体系。 分组体系在形式上有平行分组体系和复合分组体系

Page 127: 应 用 统 计

平行分组体系

平行分组体系是选择两个或两个以上的标志对总体进行简单分组后所形成的体系。某企业技术人员按技术等级和性别的平行分组,如右表。

分组标志 人数(人)

1.按技术等级分

高级 中级 初级2.按性别分 男 女

864147

15663

Page 128: 应 用 统 计

复合分组体系

某企业技术人员按技术等级和性别的平行分组,如右表。

技术等级 人数(人)高级 男 女中级 男 女初级 男 女

86264481614710245

合计 219

Page 129: 应 用 统 计

§3 次数分布

一、次数分布的概念二、变量数列的种类三、变量数列的编制四、次数分布的主要类型

Page 130: 应 用 统 计

在统计分组的基础上,将总体的所有单位按组归类整理,并按一定的顺序排列,形成总体单位数在各个组间的分布,称次数分配,这样的数列称为次数分配数列(或分布数列)。

分配数列根据分组标志的不同可分为品质分配数列和变量分配数列

一、次数分布的概念

Page 131: 应 用 统 计

单项数列

等距数列

不等距数列

组距数列

变变量量数数列列

Page 132: 应 用 统 计

1.单项数列 对于变量值变动范围较小的离散变量可把每一变量值作为一组,这种分组称为单项式分组。

如居民家庭按家庭成员数、儿童数分组,均可采用单项式分组。

右表为居民家庭按家庭成员数量分组。

家庭成员(人)

家庭(户)

123456

7以上

43391235182719

合计 625

Page 133: 应 用 统 计

概念:以一段数值距离作为一组所形成的变量数列。适用条件: 对于连续型变量和变量值变动范围较大且项数又较多的离散变量要采用组距式分组。

2.组距数列

Page 134: 应 用 统 计

1.等距分组一般在标志值变动比较均匀的情况下采用。

2.不等距分组一般在标志值变动很不均匀时采用。

成绩 人数(人 )

60以下60~ 7070~ 8080~ 9090以上

21218132

合计 47

年龄 人数(人 )

15下15~ 3435~ 6060以上

21283210

合计 101

某村人口按年龄的不等距分组某村人口按年龄的不等距分组学生考试成绩的等距分组学生考试成绩的等距分组

Page 135: 应 用 统 计

在分配数列中,各组单位数称为次数或频数

各组次数占总次数的比重称为频率。 各组的频率大于 0; 各组的频率总和等于 1

频数与频率

Page 136: 应 用 统 计

成 绩 人数( 人 )

比重(%)

50—6060—7070—8080—9090—100

27

1182

6.67 23.33 36.67 26.67 6.67

合计 30 100.0

变量值变量值次 数次 数

(频数)(频数) 频 率频 率

Page 137: 应 用 统 计

三、变量数列的编制

(一)组距和组数组距:是指分组条件下每组变量值的变化范围,即每组变量区间的距离 组距 = 本组上限 – 前组上限 (通用公式) 组距 = 本组上限 – 本组下限 (重叠式组限)

Page 138: 应 用 统 计

组数:是指将全体变量值分成多少组。 组数 =全距 /组距 全距=变量值最大值—最小值 等距式分组,指各组组距相同 不等距分组,指各组组距不相等的分组

Page 139: 应 用 统 计

(三)组限和组中值1 、组限 组限是指各组变量值变动的两端界限,是每组的起点和终点。每组的起点称为下限,每组的终端为上限。 由于变量有离散型和连续型两种。因此,其组限的划分也有所不同。

Page 140: 应 用 统 计

重叠组限

不重叠

组 限

适用于离散型变量分组

适用离散型变量及连续型变量分组

Page 141: 应 用 统 计

例如:企业按工人工资对工人进行分组如下: 500—600元

600---700元700---800元

如果某工人工资为 700元,应将他归并到哪一组?

Page 142: 应 用 统 计

“上组限不计入”原则:遇到某单位的标志值刚好等于相邻两组上下限时,一般把次值归并到作为下限的那一组。

Page 143: 应 用 统 计

应在分组之后对变量值的高低分布情况进行仔细审查,在分布比较集中的变量值中确定组距的中心位置,然后根据组距大小定出上下限,做到最小组的下限不大于最小变量值,最大组的上限不小于最大变量值,尽可能使各组的变量值在组内分布比较均匀

Page 144: 应 用 统 计

组中值:上下限之间的中点值称为组中值。 组中值 = (下限 + 上限) /2 开口组组中值: 向下开口组组中值 = 上限 -邻组组距 /2 向上开口组组中值 =下限 +邻组组距 /2

Page 145: 应 用 统 计

例如: 第一组: 50 人以下 第二组: 50—200 人 按公式

(不合理)组中值 252

5020050

252/500 )(组中值

Page 146: 应 用 统 计

变量数列编制(一)将原始资料按数值大小依次排列(二)确定组数和组距(三)确定组限和组限的表示方法(四)编制变量数列

Page 147: 应 用 统 计

例:某班 50 名学生,调查其考分资料如下:77 65 83 56 68 70 99 65 73 72 88 66 74 71 84 62 52 80 78 84 79 81 64 58 82 62 73 75 89 79 61 65 54 92 86 73 68 51 69 64 78 63 76 68 72 77 81 76

Page 148: 应 用 统 计

某班学生成绩统计表

成绩(分) 学生人数(人)60 以下60 ~ 7070 ~ 8080 ~ 9090 ~ 100

51518102

合 计 50

Page 149: 应 用 统 计

(一)钟型分布 (二)U型分布 (三) J型分布 (四)洛伦兹分布

四、次数分布的主要类型

Page 150: 应 用 统 计

特征:”两头大,中间小”,即靠近中间的变量值分布的次数多,靠近两边的变量分布次数少,形若古钟。

根据其偏斜情况分为对称钟型分布、左偏钟型分布和右偏钟型分布。

(一)钟型分布

Page 151: 应 用 统 计

对称钟型分布,也叫正态分布,以中心变量值为对称轴呈对称分布。

Page 152: 应 用 统 计

左偏钟型分布,也叫正偏钟型分布,变量值小的次数较变量值大的次数多。

Page 153: 应 用 统 计

右偏钟型分布,也叫负偏钟型分布,变量值大的次数较变量值小的次数多。

Page 154: 应 用 统 计

特征:靠近中间的变量值分布的次数少,靠近两端的变量值分布次数多,形成“两头大,中间小”的U字型分布。

如人口死亡率按年龄分组。

(二)U型分布

人数( 人 )

年龄

Page 155: 应 用 统 计

正 J型分布:其特征是随着变量值的增大,分布次数也随之增多,若根据变量数列绘成线图,形若英文字母“ J” 。

如老年人口按年龄分组的死亡人数分布曲线多呈正 J型。

(三) J 型分布

人数( 人 )

年龄

Page 156: 应 用 统 计

反 J型分布:其特征是随着变量值的增大,分布次数也随之减少,若根据变量数列绘成线图,形若反写的英文字母“ J” ,

如按年龄分组的人口总体的次数分布曲线多呈反 J型。

人数( 人)

年龄

Page 157: 应 用 统 计

洛伦兹曲线又称集中曲线,用以检验社会收入分配的平等程度。可拓展用于研究总体各单位标志分布集中状况或平均性的其他社会经济现象。

(四)洛伦兹分布

Page 158: 应 用 统 计

洛伦兹曲线以累计频率为横轴,以标志值累计比重为纵轴。

若曲线偏离对角线,则说明均匀程度。

标志值累计比重(%) 累计频

率 (%)

ba

Page 159: 应 用 统 计

§4 统计汇总的组织、技术与现代化

一、统计汇总的组织形式二、统计汇总的审核三、统计汇总的技术与现代化四、宾词指标的设计五、编统计表应注意的问题

Page 160: 应 用 统 计

Thank you very Thank you very muchmuch!!Thank you very Thank you very muchmuch!!

Page 161: 应 用 统 计

第四章 总量指标

§1 总量指标§2 相对指标§3 计算和运用总量指标、相对指标的原则

Page 162: 应 用 统 计

学习目的及要求

1.理解总量指标的概念、作用以及分类2.掌握总量指标的计算3.理解相对指标的概念作用,掌握六种相对指标的基本概念及计算

4.理解平均指标的概念和作用,掌握五种平均数的概念和计算方法,理解各种平均数之间的关系

5.了解正确应用平均数的原则;了解标志变动度的意义和作用,掌握测定标志变动度的主要方法。

Page 163: 应 用 统 计

概 述

用统计指标去概括和分析现象总体的数量特征和数量关系的方法,成为综合指标法。可概括为三类:

总量指标 相对指标 平均指标

Page 164: 应 用 统 计

§1 总量指标

一、总量指标的概念和作用 二、总量指标的种类

Page 165: 应 用 统 计

一、总量指标的概念和作用

总量指标是反映一定时间、地点、条件下某种现象总体规模或总水平的统计指标。

表现形式:绝对数,有名数。 例: 2000年我国国内生产总值 GDP为 8964亿元 财政收入 2004.8亿元 粮食产量 37911万吨

Page 166: 应 用 统 计

作用:1. 可以用来反映一个国家、地区、部门或单位的基本状况。

2. 是制定政策、编制计划、进行科学管理的重要依据。

3. 是计算相对指标与平均指标的基础

Page 167: 应 用 统 计

二、总量指标的种类

劳动量指标价值指标实物指标

按其采用计量单位不同

时点指标时期指标

按其反映时间状况不同

总体标志总量总体单位总量

按其反映总体内容不同总量指标的种类

Page 168: 应 用 统 计

⒈按反映内容分: ⑴总体单位总量:表明总体中单位数目多少的总量指标

⑵总体标志总量:总体单位数量标志值之和的总量指标

注:一个特定总体内,只能存在一个单位总量,而可以同时存在注:一个特定总体内,只能存在一个单位总量,而可以同时存在多个标志总量,从而构成一个总量指标体系。多个标志总量,从而构成一个总量指标体系。

两者的关系:两者的位置随研究目的的不同而变化。两者的关系:两者的位置随研究目的的不同而变化。

Page 169: 应 用 统 计

⒉按反映时间状况不同分: ⑴时期指标:在某一段时间内发展变化结果的总量指标。

⑵时点指标:在某一时刻上状态的总量指标。

Page 170: 应 用 统 计

时期指标和时点指标的区别

⑴从登记与计算的特点看:时期指标连续登记与计算,时点指标间断登记。⑵ 从指标值能否相加看:时期指标具有累加性,时点指标不具有累加性。⑶从指标值大小与时间长短关系看:时期指标受时期长短影响(成正比),时点指标一般与时点间隔长短无直接影响。

Page 171: 应 用 统 计

三、总量指标的计算

⒈总量指标计算应注意的问题 ⑴同类现象才能加总 ⑵明确总量指标的含义 ⑶在统计汇总时,必须有统一的计量单位

Page 172: 应 用 统 计

2. 计量单位 ⑴实物单位   ①自然单位:人、辆   ②度量衡单位:千克、吨   ③双重单位或多重单位:千瓦 /台   ④复合单位:吨公里 ⑵货币单位   ①现行价   ②不变价 ⑶劳动单位:工时、工日

Page 173: 应 用 统 计

我国国民经济的主要总量指标

⒈总产值:生产资料转移价值加劳动者新创造的价值

⒉增加值:企业或部门在一定时期内从事生产经 营活动所增加的价值。

增加值 = 总产值 - 中间投入⒊国内生产总值 (GDP):一个国家常住单位在一定时期内生产活动的最终成果。⒋国民生产总值 ( 国民总收入, GNP) : 国民总收入 = 国内生产总值 + 国外要素收入净额

Page 174: 应 用 统 计

§2 相对指标

一、相对指标的概念和表现形式二、相对指标的作用三、相对指标的种类和计算方法

Page 175: 应 用 统 计

一、相对指标的概念和表现形式

相对指标是说明现象之间的数量对比关系的指标,用两个或两个以上有联系的指标数值对比来求得,其结果表现为相对数。

Page 176: 应 用 统 计

⒊相对指标的表现形式⑴有名数:以分子、分母的双重单位表示例:人口密度(人 / 平方公里) 人均国民生产总值(元 / 人)⑵无名数:一种抽象化的数值 ①系数 ②倍数 ③成数: 1 成 =10% ④百分数:% 1/100 ⑤千分数: ‰  1/1000

Page 177: 应 用 统 计

二、相对指标的作用

⑴综合反映社会经济现象之间的比例关系⑵使不能直接对比的事物进行比较⑶便于记忆

Page 178: 应 用 统 计

又称计划完成率、计划完成百分比(数)。它是以现象在某一段时间内实际完成数与计划任务数对比,借以观察计划完成程度。

⒈计划完成相对数的一般公式

分子—分母:表明计划执行的绝对效果

%100计划数

实际完成数计划完成相对数

(一)计划完成程度相对指标(一)计划完成程度相对指标

三、相对指标的种类和计算方法

Page 179: 应 用 统 计

⒉计划完成相对数的计算

⑴根据总量指标计算 某厂计划完成工业增加值 200万元,实际完成220万元,则:

%110%100200

220计划完成相对数

Page 180: 应 用 统 计

⑵根据相对指标计算计划完成程度

本年计划水平本年实际水平

上年实际水平本年计划水平上年实际水平本年实际水平

计划完成程度

Page 181: 应 用 统 计

例 1:某厂计划 2000年劳动生产率要比上年提高 4% ,实际提高 5% ,则

%96.100%100%4%100

%5%100

计划完成相对数

即:超额 0.96% 完成计划。

Page 182: 应 用 统 计

例 2:某企业计划产品单位成本比上年降低 5% ,实际降低 6% ,则

%95.98%100%5%100

%6%100

计划完成相对数

即:成本降低率比计划多完成 1.05% 。

Page 183: 应 用 统 计

⑶根据平均指标计算计划完成程度

公式:实际平均水平 / 计划平均水平 *100% 例:甲地区 2007年计划国内生产总值为 120亿元,年平均人口为 600万人, 2007年国内生产总值第一、二、三产业情况如下表:

项目 计划数 实际数 计划完成(%)

GDP 120 132 110

第一产业 10 12 120

第二产业 65 73 112.3

第三产业 45 47 104

Page 184: 应 用 统 计

3 、计划执行进度的考核

全期计划数累计至本期实际完成数计划完成程度

Page 185: 应 用 统 计

例:某企业计划 2005 年产值达到 2000万元,从 1月份累计到 8月份的产值达到 1800万元,则:

905%1002000

1800计划执行进度

Page 186: 应 用 统 计

累计法 水平法

4 、长期计划的检查(五年计划)

Page 187: 应 用 统 计

累计法:

凡是计划指标是按计划期内各年的总和规定任务时,或者说是按计划期(如五年)提出累计完成量任务时,就要求按累计法计算。

五年计划规定的累计数数五年计划期间累计完成

计划完成程度指标

Page 188: 应 用 统 计

提前完成计划时间:将计划全部时间减自计划执行之日起累计实际数量已达到计划任务时间。累计法例题:

Page 189: 应 用 统 计

某企业“十五”计划规定:基本建设投资 427.4亿,而实际五年计划期间累计投资为 493亿元,则计划完成程度 = 493/427.4 =115.3%

Page 190: 应 用 统 计

水平法:

水平法:计划指标是以计划期末应达到的水平来下达的。

水平计划规定期末应达到的平计划期末实际达到的水

计划完成程度

Page 191: 应 用 统 计

提前完成计划的时间是根据连续一年时间(不论是否在一个日历年度,只要连续十二个月即可)的产量计划规定最后一年的产量相比较来确定。

Page 192: 应 用 统 计

某企业“十五”计划规定末期( 2005年)工

业总产值为 8050亿元,而 2005年工业总产值实际达到 11682亿元,则:

计划完成程度 = 11682/8050 = 145.12%

Page 193: 应 用 统 计

某厂五年计划规定,某种产品第五年应达到 975吨,实际在第四年 6月至第五年 5月这十二个月就达到了975吨,则该产品计划提前完成时间为 5*12-(4*12+5) =7 提前完成计划时间为7个月。

Page 194: 应 用 统 计

练习某产品五年计划规定,最后一年产量应达到 45万吨,计划执行情况如下:

时间

第三年 第四年 第五年

上半年

下半年

产量

30

30 17 19 10 10 1112

12

1315

16

Page 195: 应 用 统 计

计划完成程度

=

=124.44%

12 + 13 + 15+16

45

提前多少时间?

Page 196: 应 用 统 计

5 、计划完成相对数的作用 可以说明各项计划指标的完成程度,为管理提供依据。

可以反映计划执行进度,推动经济建设发展。

可以反映经济计划执行中的薄弱环节,为组织新的平衡提供依据。

Page 197: 应 用 统 计

在统计分组基础上,以总体总量为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标,也称比重。

(二)结构相对指标—同一总体

形式:计算结果用百分数或成数表示,各组比重综合等于 100% 或 1 。

Page 198: 应 用 统 计

公式

%100总体全部数值总体部分数值

结构相对数

性别 人数 比重 (%)

男 30 75

女 10 25

合计 40 100

某班学生性别构成情况

Page 199: 应 用 统 计

结构相对指标的分子与分母之比,可以是部分的总体单位数与全部总体单位数之比,也可以是部分单位的标志总量与全部单位的标志总量之比。

Page 200: 应 用 统 计

作用

可以反映总体内部结构的特征 可以看出事物的变化过程及其发展趋势 能反映对人、财、物的利用及生产经营效果的好坏。

可在平均数的计算中应用。

Page 201: 应 用 统 计

(三)比例相对指标—同一总体

⒈定义 同一总体中不同部分数量对比的相对指标,用以反映

总体内各部分之间的比例关系和协调平衡状态。

⒉计算: 在上例中某班男女生比例为 3: 1 。

%100总体中另一部分数值总体中某部分数值

比例相对数

Page 202: 应 用 统 计

形式:计算结果通常以百分比来表示,还有以比较基数单位为 1、 100 、1000时被比较单位数是多少的形式来表示。

Page 203: 应 用 统 计

(四)比较相对指标—不同总体、同类指标

⒈定义 由不同单位(国家、地区、企业、个人等)的同类指标对比而确定的相对数,用以说明同类现象在同一时间内不同条件下的数量对比关系。

%100值另一条件下同类指标数

某条件下某类指标数值比较相对数

Page 204: 应 用 统 计

⒉计算: 中国国土面积为 960万平方公里,美国为 937万平方公里,两者之比为

%45.102%100937

960

Page 205: 应 用 统 计

(五)强度相对指标—不同总体

⒈定义 两个性质不同而有联系的总量指标之间的对比,用来表明某一现象在另一现象中发展的强度、密度、普遍程度。

%100的总量指标数值另一有联系而性质不同

某一总量指标数值强度相对数

Page 206: 应 用 统 计

正逆强度相对指标⒉计算: 1998年末我国人口密度

平方公里人万平方公里

万人/130

960

124810

Page 207: 应 用 统 计

例: 2006年我国钢产量为 41 914.85万吨,全国平均人口为 13.1亿人,则平均每人的钢产量为 319.96千克。 正指标:相对指标的数值大小与现象的发展程度或密度成正比。

逆指标:相对指标的数值大小与现象的发展程度或密度成反比

Page 208: 应 用 统 计

(六)动态相对指标 ⒈定义 也称发展速度,指同类现象(同一指标)在不同时间上对比,表明现象在时间上发展变化的方向和程度的综合指标。

%100基期水平报告期水平

动态相对数

Page 209: 应 用 统 计

§3 计算和运用总量指标、相对指标的原则

计算和运用总量指标的原则 现象的同类性 明确统计含义和合理的统计方法 统一计量单位

Page 210: 应 用 统 计

计算和运用相对指标的原则 ⒈注意可比性 ⒉总量指标和相对指标结合起来使用 ⒊多种相对指标结合使用 4. 在比较时,注意分子、分母是否适宜相除

Page 211: 应 用 统 计

Thank you very Thank you very muchmuch!!Thank you very Thank you very muchmuch!!

Page 212: 应 用 统 计

第五章 平均指标和变异指标

§1 平均指标的概念和作用§2 算术平均数§3 调和平均数§4 几何平均数§6 正确计算和运用平均指标的原则§7 标志变异指标

Page 213: 应 用 统 计

§1 平均指标的概念和作用

一、平均指标的概念

平均指标是同类社会经济现象总体内各单

位某一数量标志在一定时间、地点条件

下数量差异抽象化的代表性水平指标。

Page 214: 应 用 统 计

特点:

1 . 平均指标是一个代表值

2 . 抽象了各变量值之间的差异

3 .必须具有同质性

4 .反映总体变量值的集中趋势

Page 215: 应 用 统 计

二、作用⒈可以了解总体次数分布的集中趋势。⒉可以对若干同类现象在不同单位、地区间进行比较研究。⒊可以说明总体的发展过程和趋势。⒋可以分析现象之间的依存关系。5.可以作为依据。

Page 216: 应 用 统 计

§2 算术平均数

(一)基本公式

总体单位总量总体标志总量

算术平均数

Page 217: 应 用 统 计

(二)简单算术平均数

使用条件: 1.只掌握总体各单位的标志值,而未掌握总体 标志总量 2.在变量分配数列中,各组次数都相等

n

xx

Page 218: 应 用 统 计

1 用统计功能计算例:某工厂某生产班组有 11名工人,各人日产量为 15 、 17 、 19 、

20 、 22 、 22 、 23 、 23 、 25 、 26 、 30件,求平均日产量。 解:

=( 15+17+19+20+22+22+23+23+25+26+30) /11=22件 开机, 2ndF,ON, 在 0 的上方出现 STAT 15,M+,17,M+,19,M+,20,M+,22,M+,22 M+ ,23 M+ ,23 M+ ,25

M+ ,26 M+ ,30 M+ ,x→M 出现结果 22

n

xx

Page 219: 应 用 统 计

例: 5名工人日产零件数为 12 , 13 , 14 , 14 , 15件,计算平均每人日产量。

12,M+,13,M+,14,M+,14,M+,15,M+,RM,,5,=

计算结果 13.6, 注意:每次开机后按 x→M键,清内存。

2. 用存储功能算

Page 220: 应 用 统 计

(三)加权算术平均数

适用条件:在分配数列中,各变量值的次数不等

f

xfx

Page 221: 应 用 统 计

影响加权算术平均数的因素

由加权算术平均数的计算公式可见:加权算术平均数的大小受两个因素的影响,其一是受各组标志值( x )大小的影响;其二是受各组单位数( f )或各组单位数比重 f /∑f 大小的影响。

Page 222: 应 用 统 计

例 1

日产零件分组 x 工人人数 f20 1

21 4

22 6

23 8

24 12

25 10

26 7

27 2

合计 50

Page 223: 应 用 统 计

2ndF,ON, 20,M+,21,,4,M+,22,,6,M+, 23,,8,M+,2

4,,12,M+,25,10,M+,26,,7,M+, 27, 2,M+,x→M

结果为 23.88 在分组资料时, x 用组中值代替。

Page 224: 应 用 统 计

例 :某厂工人各级别工资额和相应工人数资料如表 : 试计算工人平均工资。

工资额(元) 工人数(人)

460520600700850

51518102

合 计 50

Page 225: 应 用 统 计

各组标志值 × 各组单位数 = 各组标志总量

工资额(元)x

工人数(人)f

工资总额(元)x f

460520600700850

51518102

23007800

1080070001700

合 计 50 29600

Page 226: 应 用 统 计

)()(

)(各组工人数各组工资总额

各组工资额x

xfx

/(元 人)

工资为:平均

59221018155

28501070018600155205460

f

xfx

Page 227: 应 用 统 计

甲乙两企业生产同种产品, 1月份各批产量和单位产品成本资料如下:

第一批第二批第三批 

单位产品成本(元)

产量比重( % )

甲企业 乙企业 单位产品成本(元)

产量比重( % )

1.0 10 1.2 30

1.1 20 1.1 30

1.2 70 1.0 40

怎么做?

Page 228: 应 用 统 计

f

fxx

Page 229: 应 用 统 计

(四)算术平均数的数学性质

1. 算术平均数与总体单位总量的乘积等于总体标志总量。

2. 各变量值与算术平均数的离差之和等于零。

3. 各变量值与算术平均数的离差平方和为最小值。

Page 230: 应 用 统 计

算术平均数与强度指标的联系

①两者都是两个总量指标的对比关系②算术平均数是在一个同质总体内标志总量和单位总量的比例关系,强度指标的分子分母是两个不同总体现象总量。

Page 231: 应 用 统 计

练习:判断下列指标哪些属于平均指标,哪些属于强度相对指标:A 、人均粮食产量 B 、人均教育经费

C 、单位产品成本 D 、人均粮食

Page 232: 应 用 统 计

§3 调和平均数

(一)概念 标志值倒数的算术平均数的倒数。又称倒数平均数。 公式:

X

mm

Xh

Page 233: 应 用 统 计

调和平均数是各个变量值倒数的算术平均数的倒数,是算术平均数的一种变形。

在已知分母、未知分子时,求平均指标用加权算术平均数。

在已知分子、未知分母时,求平均指标用加权调和平均数。

f

xfx

X

mm

Xh

Page 234: 应 用 统 计

行驶速度x

行驶里程m

行驶时间M/x

75 225 3

80 160 2

合计 385 5

Page 235: 应 用 统 计

即行使速度为 77公里 /小时

775

385

Xmm

Xh

Page 236: 应 用 统 计

§4 几何平均数

几何平均数是 n 个变量值连乘积的 n 次方根。 使用条件:变量是相对数,而且这些变量值连乘积有意义。 ㈠简单几何平均数

nnG XXXX ...

21

例 1 : 2001-2005 年我国工业品的产量分别是上年的107.6% 、 102.5% 、 100.6% 、 102.7% 、 102.2% ,计算这 5 年的平均发展速度。

Page 237: 应 用 统 计

%1.103031.1

022.1027.1006.1025.1076.1

...

5

21

nnG XXXX

1.067,1.067,,1.025, ,1.025, ,1.006, ,1.006, ,1.027, ,1.027, ,1.022,=,2ndF,,1.022,=,2ndF,x y , 5,=, 5,=

出现结果:出现结果: 1.03091.0309

即即 103.1%103.1%

Page 238: 应 用 统 计

例 2 :某企业生产某一产品,要经过铸造、金加工、电镀三道工序,各工序产品合格率分别为 98% 、85% 、 90% ,求三道工序的平均合格率。

=

=90.8%

nnG XXXX ...

213 9.0*85.0*98.0

Page 239: 应 用 统 计

f

nG xxxXfff

n...21

21

例:某投资银行 25 年的年利率分别是:1 年 3% , 4 年 5% , 8 年 8% , 10 年 10

% , 2 年 15% ,求平均年利率。

(二 ) 加权几何平均数

Page 240: 应 用 统 计

1.03,1.03,,(,1.05,y,(,1.05,yx,4,),,(,1.08,y,(,1.08,yx,8,),

,(,1.1,y,(,1.1,yx,10,),,(,1.15,y,(,1.15,yx,2,), =,2ndF, =,2ndF,x y , 25,=, 25,=

出现结果:出现结果: 1.0861.086

即即 108.6%108.6%

%6.108086.115.1 21.1 1008.1 805.1 403.1

...2211

25

fx f nnx fx fX G

Page 241: 应 用 统 计

各种平均数之间的关系

算术平均数、几何平均数和调和平均数之间的关系

可以证明:

XXX Gh

Page 242: 应 用 统 计

正确应用平均指标的原则

平均指标只能运用于同质总体 用组平均数补充说明总平均数 用分配数列补充说明平均数

Page 243: 应 用 统 计

§7 标志变异指标

• 一、标志变异指标的概念和作用• 二、全距• 四、平均差• 五、标准差• 六、离散系数

Page 244: 应 用 统 计

一、标志变异指标的概念和作用

㈠标志变异指标的概念 标志变异指标是综合反映总体各单位

标志值差异程度的指标。反映分配数列中各标志值的变动范围或离散程度,又称离散指标或标志变动度。

Page 245: 应 用 统 计

标志变异指标与平均指标的区别 ( 1)两者都是一个代表值 ( 2)说明问题不同( 3)反映总体分布状态

Page 246: 应 用 统 计

例 :某车间两个生产小组各人日产量如下: 甲组: 20 40 60 70 80 100 120 乙组: 67 68 69 70 71 72 73从下图可以看出甲组离散程度大,乙组离散程度小。

Page 247: 应 用 统 计

7070

7070

Page 248: 应 用 统 计

⒈标志变动度是测定算术平均数代表性的依据。 平均指标作为总体各单位标志值一般水平的代表,其代表性的高低取决于各变量值之间差异程度。

㈡标志变动度的作用

Page 249: 应 用 统 计

例:某车间有两个班组,每组五人,按日产量(件)排序如下:甲 5 20 45 85 95乙 48 49 50 51 52

)(50 件乙甲

xx

Page 250: 应 用 统 计

结论: 标志变异指标值越大,算术平均数代表性越低;

标志变异指标值越小,算术平均数代表性越高。

Page 251: 应 用 统 计

⒉标志变动度反映社会经济活动过程的均衡性或协调性,以及产品质量的稳定性。

Page 252: 应 用 统 计

二、全距

㈠全距的概念与计算 全距是总体各单位标志的最大值和最小值之差。也称极差。 R=Xmax-Xmin

例:某班学生外语成绩中,最低分为 48 分,最高分为 96 分。 全距 =96-48=48(分)

在组距数列中: R=最高组上限—最低组下限㈡全距的特点: 计算方便、易于理解 指标粗糙

Page 253: 应 用 统 计

四、平均差

㈠平均差的概念与计算 平均差是各总体单位标志值与其算术平均数离差绝对值的算术平均数。或各变量值与其算术平均数的平均离差。

计算公式

f

fXXDA

n

XXDA

.:

.:

分组资料

未分组资料

㈡平均差的特点:

Page 254: 应 用 统 计

例: 工人日产量分组资料如下例: 工人日产量分组资料如下

日产量(公斤))

工人人数(人) f

组中值(公斤)

x

xf X-

20-30 10 25 250 -17 17 170

30-40 70 35 2450 -7 7 490

40-50 90 45 4050 +3 3 270

50-60 30 55 1650 +13

13 390

合计 200 — 8400 — 40 1320

x xx fxx

Page 255: 应 用 统 计

f

fxxDA.

解:解:

)(42200

8400 公斤

f

xfx

f

fxxDA. )(6.6

200

1320公斤

Page 256: 应 用 统 计

五、标准差

㈠标准差的概念与计算 标准差是总体各单位标志值与其算术平均数离差平方和的算术平均数的平方根。

计算公式

f

f

n

XX

XX

2

2

:

:

分组资料

未分组资料

Page 257: 应 用 统 计

)(94.8)(

2

f

fxx

例: 班级同学成绩分布例: 班级同学成绩分布

成绩(分) 组中值(x)

学生数(f)

总成绩(xf)

离差 离差平方 离差平方和

50-60 55 1 55 -30 900 90060-70 65 2 130 -20 400 80070-80 75 8 600 -10 100 80080-90 85 24 2040 0 0 0

90-100 95 15 1425 10 100 1500— 50 4250 — — 4000

)( xx )(2

xx fxx )(2

Page 258: 应 用 统 计

六、离散系数

变异指标与算术平均数的比值。 标志变动度的数值大小,不仅受离散程度影响,而且还受平均水平高低的影响,因此,在平均数不相等时,不能简单根据标准差或平均差大小来比较离散程度。

分全距系数、平均差系数、标准差系数。

Page 259: 应 用 统 计

例:有两组工人日产量 甲组: 60 、 65 、 70 、 75 、 80 乙组: 2 、 5 、 7 、 9 、 12不能简单断言甲组离散程度大于乙组离散程度

70X甲

7X乙

07.7甲

41.3乙

Page 260: 应 用 统 计

可以计算离散系数

本例中

%100X

标准差系数

%7.48%1007

41.3

%1.10%10070

07.7

V

V

即乙组的离散程度大于甲组。由此可见,当我们比较两组数据的离散程度时,如两组平均数相等,可以直接比较标准差;如两组平均数不等,则需比较两组的离散系数。

Page 261: 应 用 统 计

标准差与标准差系数的不同应用条件:

在比较两个不同数列(总体)标志变异程度大小(或说明其平均数代表性大小)时,当其平均水平相同时,可直接计算标准差进行比较;当其平均水平不相同(或其计量单位不同)时,需消除平均水平不同或计量单位不同的影响,计算标准差系数进行比较。

Page 262: 应 用 统 计

练 习 题1 、人均粮食消费量是一个( )

A 、强度相对指标 B 、结构相对指标

C 、比较相对指标 D 、平均指标

D

Page 263: 应 用 统 计

2 、权数对算术平均数的影响作用,实质上取决于( )。

A 、各组标志值占总体标志总量比重的大小

B 、作为权数的各组单位数占总体单位数比重的大小

C 、标志值本身的大小D 、各组单位数的多少

B

Page 264: 应 用 统 计

3 、已知两个同类型企业的职工工资水平的标准差分别为 5元 / 人、 6元 / 人,则甲、乙两个企业职工平均工资的代表性是( )。

A 、一样的 B 、甲企业>乙企业C 、甲企业>乙企业 D 、无法判断

D

Page 265: 应 用 统 计

4 、在什么条件下,加权算术平均数等于简单算术平均数( )。

A 、各组次数相等 B 、各组变量值不等 C 、变量数列为组距数列 D 、各组次数都为 1E 、各组次数占总次数的比重相等

ADE

Page 266: 应 用 统 计

5 、权数对平均数的影响作用表现在( )。

A 、当标志值较大的组次数较多时,平均数接近于标志值较大的一方

B 、当标志值较小的组次数较少时,平均数接近于标志值较小的一方

C 、当标志值较大的组次数较少时,平均数接近于标志值较大的一方

D 、当标志值较小的组次数较多时,平均数接近于标志值较小的一方

E 、当各组次数相同时,对平均数没有作用

ADE

Page 267: 应 用 统 计

6 、已知甲企业的工人工资资料如下表

( x-x

工资额(元) 工人数 ( 人) 工资总额(元)625 4 2500

675 10 6750

850 16 13600

925 20 18500

975 7 6825

1075 3 3225

合计 60 51400

Page 268: 应 用 统 计

要求 : 计算甲企业工人的平均工资和标准差。若已知乙企业工人的平均工资为 874.96元,标准差为 122.32元,问:甲乙两企业工人平均工资的代表性哪一个更高些?能否用标准差直接比较?

Page 269: 应 用 统 计

( x-x

工资额(元) x

工人数(人) f

工资总额(元) xf

625 4 2500214683.9

6

675 10 6750330039.8

9850 16 13600 711.82925 20 18500 93379.78975 7 6825 98013.92

1075 3 3225143003.9

7合计 60 51400 87933.02

fxx 2)(

Page 270: 应 用 统 计

)(09.12160

02.87933

)(67.85660

51400

2

元)(

f

fxx

f

xfx

Page 271: 应 用 统 计

因为:

所以:计算标准差系数,再进行比较。

乙甲 xx

%98.13%10096.874

32.122%100

%13.14%10067.856

09.121%100

xV

xV

Page 272: 应 用 统 计

由于变异指标数值的大小与平均数的代表性高低成反比,所以上述计算结果表明,乙企业工人平均工资的代表性高于甲企业。如果不计算标准差系数,直接用标准差比较就会得出相反的错误结论。

Page 273: 应 用 统 计

Thank you very much!Thank you very much!

Page 274: 应 用 统 计

是非标志的总体平均数和标准差

一、是非标志(属性)总体的成数在属性总体中,当所研究的标志,其表现只有两种属性,即“是”或“非”时,将该属性总体称

为是非标志总体

Page 275: 应 用 统 计

女生(非)生(是)男学生按性别分组

(非)其他企业个体企业集体企业国有企业(是)

企业按经济类型分组

Page 276: 应 用 统 计

在是非标志(属性)总体中,设总体有N 个单位,其中有 N1个单位具有某种性质或属性(是的属性),有 N0个单位不具有某种性质或属性(非的属性),即:

N1 + N0 = N 则,

Page 277: 应 用 统 计

即总体中具有某种性质或属性单位数在总体中所占的比重

N

NP

1 成数

Page 278: 应 用 统 计

即总体中具有某种性质或属性单位数在总体中所占的比重

N

N 0Q 成数

Page 279: 应 用 统 计

P P 11 QQ

Page 280: 应 用 统 计

二、是非标志(属性)总体的平均数

由于品质标志(是非标志)的表现不能用数值表示,为了研究问题方便,我们可以将品质标志(是非标志)数量化。即用1 表示单位标志为“是”的标志值(即具有某种性质的单位的标志值);用 0 表示单位标志为“非”的标志值(即不具有某种性质的单位的标志值)。

Page 281: 应 用 统 计

性别 标志值x

单位数f

频率(概率)

f /∑ f

男(是)女(非)

10

N1N0

PQ

合 计 — N 1

Page 282: 应 用 统 计

是非标志(属性)总体的平均数为

PN

Nxp

1

Page 283: 应 用 统 计

三、是非标志(属性)总体的标准差

是非标志(属性)总体的标准差为:

QP PPp )(1

Page 284: 应 用 统 计

当 P 时, 成数 5.0

是非标志(属性)总体的方差(即成数的方差)最大,即:

25.05.05.012 )( PPp

Page 285: 应 用 统 计

Thank you very much!Thank you very much!

Page 286: 应 用 统 计

第六章 动态数列

§1 动态数列的一般问题

§2 动态数列水平指标

§3 动态数列速度指标

§4 长期趋势和季节变动

Page 287: 应 用 统 计

学习目的及要求

1.理解动态数列的概念及种类2.掌握动态数列的编制原则3.理解发展水平、平均发展水平、增长量、平均增长量的概念及计算方法 4.掌握发展速度、增长速度、平均发展速度和平均增长速度的概念及计算方法5.了解长期趋势测定的意义及各种测度方法,了解季节变动的测定与预测

Page 288: 应 用 统 计

§1 动态数列的一般问题

时间数列是将某种现象在时间上变化发展的一系列同类的统计指标,按时间先后顺序排列,所形成的动态数列。 时 间 ……

指 标 值 ……

1t 2t nt

1ana2a

一、动态数列的概念一、动态数列的概念

Page 289: 应 用 统 计

任何一个时间数列,都具备两个基本要素:一是现象所属的时间,称为时间要素

(常用 t表示);

一是反映现象在不同时间上数量表现的统计数据,称为数据要素(常用 y或 a 表示)。

时间要素的单位,可以是年、季、月、周、日,也可以是小时、分钟等;数据要素的表现,可以是绝对量数据(包括表示现象总水平的总量数据和表示现象平均水平的平均数据),也可以是相对量数据。

Page 290: 应 用 统 计

年 份

2000年 2001年 2002年

我国年钢产量(万吨) 我国年末人口数(万人)我国人口自然增长率(‰)某厂职工年平均工资(元 /人)

12850

126783

7.89

12000

15266

127627

6.95

13000

18155

128453

6.45

15000

Page 291: 应 用 统 计

二、动态数列的种类

时间数列时间数列

平均数数列平均数数列绝对数数列绝对数数列 相对数数列相对数数列

时期数列时期数列 时点数列时点数列

Page 292: 应 用 统 计

 

年序年序年末人年末人

口数口数(万(万人) 人)

(( 11 ))

年人口年人口自然增自然增

长率长率(‰)(‰)(( 22 ))

国内生国内生产总值产总值

(亿(亿元) 元)

(( 33 ))

人均国人均国内生产内生产

总值总值((元)元)(( 44 ))

职工工职工工资总额资总额(( 亿元亿元 ) ) (( 55)

年末职年末职工人数工人数

(万(万人) 人)

(( 66 ))

职工平职工平均工资均工资(元)(元)

  (( 77 ))

19921992 117171 11.60 26651.9 2287 3939.2 14792 2711

19931993 118517 11.45 34560.5 2939 4916.2 14849 3371

19941994 119850 11.21 46670.0 3923 6656.4 14849 4538

19951995 121121 10.55 57494.9 4854 8100.0 14908 5500

19961996 122389 10.42 66850.5 5576 9080.0 14845 6210

……. ……. ……. ……. ……. ……. ……. …….

表中数据引自《中国统计年鉴》。

Page 293: 应 用 统 计

(一)绝对数动态数列:把总量指标在不同时间上的数值按时间先后顺序排列形成总量指标动态数列。

Page 294: 应 用 统 计

时期数列和时点数列的不同特点时期数列和时点数列的不同特点:

11 、时期数列:时期数据反映现象在一段、时期数列:时期数据反映现象在一段

时期内所达到的总数量、总水平(通常由经常时期内所达到的总数量、总水平(通常由经常

性调查获取资料);不同时期的时期数值可以性调查获取资料);不同时期的时期数值可以

相加,相加后的结果有独立意义(表示更长时相加,相加后的结果有独立意义(表示更长时

期内现象的总量);时期数值的大小与时期的期内现象的总量);时期数值的大小与时期的

长短有直接关系;时期越长,数值越大。长短有直接关系;时期越长,数值越大。

Page 295: 应 用 统 计

22 、、时点数列:时点数据反映现象在某一时间时点数列:时点数据反映现象在某一时间

点上所达到的总数量、总水平(通常由一次性点上所达到的总数量、总水平(通常由一次性

调查获取资料);不同时点上的数据具有不可调查获取资料);不同时点上的数据具有不可

加性,即相加后的结果没有意义;时点数值的加性,即相加后的结果没有意义;时点数值的

大小与相邻两时点间的间隔长短没有必然联系大小与相邻两时点间的间隔长短没有必然联系

。。

Page 296: 应 用 统 计

2 、相对指标动态数列:把一系列同类相对指标按时间先后顺序排列而形成的时间数列

3 、平均指标动态数列:把一系列平均指标按时间先后顺序排列形成的动态数列

平均数数列和相对数数列是否具有可加性?平均数数列和相对数数列是否具有可加性?

Page 297: 应 用 统 计

三、动态数列的编制原则 ---- 基本原则是保证可比性

1 总体范围可比

2 指标内容可比

3 时间可比

4 计算口径可比

Page 298: 应 用 统 计

时间数列分析指标时间数列分析指标 ::

现象发展的水平分析 现象发展的速度分析时间数列的构成因素时间数列的构成因素 :: 长期趋势、长期趋势、 季节周期、季节周期、 循环周期和不规则变动循环周期和不规则变动

Page 299: 应 用 统 计

§2 动态数列的水平指标

一、发展水平和平均发展水平发展水平是动态数列中的每一项具体指标数值,又称发展量,它反映社会经济现象在各个时期所达到的规模和发展的速度。 可以是总量指标,也可以是相对指标或平均指标

Page 300: 应 用 统 计

最初水平—动态数列中第一项指标值 用 a0表示最末水平—动态数列中最后一项指标值 用 an表示报告期水平和基期水平用符号表示: a0、 a1、 a2……an

Page 301: 应 用 统 计

国内生产总值等时间数列

年 份 国内生产总值 (亿元 )

年末总人口 (万人 )

人口自然增长率 (‰)

居民消费水平 (元 )

199019911992199319941995199619971998

18547.921617.826638.134634.446759.458478.167884.674772.479552.8

114333115823117171118517119850121121122389123626124810

14.3912.9811.6011.4511.2110.5510.4210.069.53

803896

1070133117812311272629443094

Page 302: 应 用 统 计

• 总量发展水平通常用总量发展水平通常用 aa 或或 bb 表示,表示,•相对或平均发展水平通常用相对或平均发展水平通常用 cc 表示。表示。 按在时间数列分析中所处的位置和作用不按在时间数列分析中所处的位置和作用不同,发展水平分为最初水平、最末水平、中同,发展水平分为最初水平、最末水平、中间水平或报告期水平、基期水平等。间水平或报告期水平、基期水平等。 最初水平 中间水平 最末水平最初水平 中间水平 最末水平

naaaa 、、、、 .......210

Page 303: 应 用 统 计

概念 平均发展水平是不同时间上发展水平的平均数。统计上习惯称为序时平均数(或动态平均数)。作用 消除不同时间上的数量差异,综合说明现象在一段时间的一般水平。 与一般平均数(静态平均数)的异同动态平均数是同一现象不同时间上数值的平均,消除的是该现象在不同时间上的数量差异;静态平均数是同一现象在同一时间上各数值的平均,消除的是该现象在不同总体单位上数量表现的差异。。

(二)平均发展水平(二)平均发展水平

Page 304: 应 用 统 计

1 、总量数列平均发展水平的计算 1 )时期数列计算平均发展水平

1 2 na a a aa

n n

例,由前表第 1 栏数据可得 1986—1999年期间我国国内生产总值年平均数为:

= 40234.37 (亿元)a

n

a

14

2.563281

Page 305: 应 用 统 计

2 )时点数列计算平均发展水平( 1 )连续时点的时点数列计算平均发展水平

例,某商业银行某年 1月 13日— 17日的存款余额(万元)分别为: 766 、 664 、 843 、 578 、 639 ,则这 5天的平均余额为:

= ( 766 + 664 + 843 + 578 + 639 ) / 5 = 698 (万元)

1 2 na a a aa

n n

a

Page 306: 应 用 统 计

( 2)间断时点的时点数列计算平均发展水平 时点数列—间隔相等时点数列—间隔相等

A A 11A A 11 A A 22A A 22 A A 33A A 33 A A nnA A nn

YY11YY11 YY22YY22 YY33YY33 YYnnYYnnYY44YY44 YYn-1n-1YYn-1n-1

TT11TT11 TT22TT22 TT33TT33 TTn-1n-1TTn-1n-1

AAn-1n-1

时点数列— 间隔不相等时点数列— 间隔不相等

TT33TT22TT11 TTn-1n-1

Page 307: 应 用 统 计

某商业企业某年第二季度某种商品的库存量如下表,求该商品第二季度月平均库存量 月份 3月末 4月末 5月

末 6月末

库存量

(百件) 66 72 64 68

69 68 66

66 72

2

72 64

2

64 68

2

Page 308: 应 用 统 计

4月平均库存 =( 66+72) / 2 = 69

5月平均库存 =( 72+64) / 2 = 68

6月平均库存 = ( 64+68) / 2 = 66

第二季度月平均库存 =

( 69+68+66) / 3=67.67(百件)

Page 309: 应 用 统 计

1222

13221

n

aaaaaa

a

nn

122 12

1

n

aaa

a nn

Page 310: 应 用 统 计

n

aaa

an

aaaaaa

a

nn

nn

2......

2

2......

22

110

12110

Page 311: 应 用 统 计

该公式形式上表现为首末两项数值折半,故该公式形式上表现为首末两项数值折半,故称为“首末折半法”,显然,首末折半法称为“首末折半法”,显然,首末折半法适用于适用于对对间隔相等的时点数列间隔相等的时点数列求其平均发展水平。求其平均发展水平。 其假设条件是:假设上期期末时点数据即为本其假设条件是:假设上期期末时点数据即为本期期初时点数据,并假定相邻两时点间现象的数期期初时点数据,并假定相邻两时点间现象的数量变动是均匀的。量变动是均匀的。

间隔相等的间断时点数列的序时平均数间隔相等的间断时点数列的序时平均数

Page 312: 应 用 统 计

计算第 2 年到第 6 年 5 年间的年平均职工人数 .

年序年序年末人年末人

口数口数(万(万人)人)

年人口年人口自然增自然增

长率长率(‰)(‰)

国内生国内生产总值产总值

(亿(亿元)元)

 

人均国人均国内生产内生产

总值总值(元)(元)

职工 工职工 工资总额资总额(( 亿元亿元 ))

年末职年末职工人数工人数

(万(万人人)

 

职工平职工平均工资均工资(元)(元)

 

11 117171 11.60 26651.9 2287 3939.2 1479214792 2711

22 118517 11.45 34560.5 2939 4916.2 1484914849 3371

33 119850 11.21 46670.0 3923 6656.4 1484914849 4538

44 121121 10.55 57494.9 4854 8100.0 1490814908 5500

55 122389 10.42 66850.5 5576 9080.0 1484514845 6210

66 123626 10.06 73452.5 6079 9405.3 1466814668 6470

Page 313: 应 用 统 计

解:年末职工人数数列是时间间隔相等解:年末职工人数数列是时间间隔相等的时点数列,假定第的时点数列,假定第 11 年年末人数就是第年年末人数就是第 22 年年年年初人数,利用首末折半法,有初人数,利用首末折半法,有

122 12

1

n

aaa

a

a

nn

162

1466814845149081484914849

214792

万人)(2.148365

74181

Page 314: 应 用 统 计

例:例:某地区某地区 20012001 年商业从业人数资料如下,年商业从业人数资料如下,计算该地区计算该地区 20012001 年月平均商业从业人员数。年月平均商业从业人员数。

某地区商业从业人员数 单位:万人某地区商业从业人员数 单位:万人

    

日期 1月 1日

4月 30日

10月 31日

12月 31日

商业从业人数 231 216 268 247

Page 315: 应 用 统 计

解:根据资料可知其时间间隔分别为 4 个月、6 个月和 2 个月。

231 216 216 268 268 2474 6 2

2 2 24 6 2

a

42.23812

2861 (万人)

Page 316: 应 用 统 计

某种股票 1999年各统计时点的收盘价

统计时点 1月 1日

3月 1日

7月 1日

10月 1日

12月 31日

收盘价(元 ) 15.2 14.2 17.6 16.3 15.8

(元)0.163342

32

8.153.163

23.166.17

42

6.172.142

22.142.15

a

(元)0.163342

32

8.153.163

23.166.17

42

6.172.142

22.142.15

a

【例】【例】设某种股票设某种股票 19991999 年各统计时点的收盘价年各统计时点的收盘价如下表,计算该股票如下表,计算该股票 19991999 年的年平均价格年的年平均价格

Page 317: 应 用 统 计

对于对于间隔不等的时点数列间隔不等的时点数列,两相邻时点间的间,两相邻时点间的间

隔期数不尽相同,在利用上述公式求平均发展隔期数不尽相同,在利用上述公式求平均发展水平时,应以间隔期数(以 表示)为其权数加水平时,应以间隔期数(以 表示)为其权数加权平均,即: 权平均,即:

f

n

ii

nnn

f

faa

faa

faa

a

1

12

211

10

2......

22

Page 318: 应 用 统 计

该公式称为以该公式称为以间隔为权数的加权平均公式间隔为权数的加权平均公式,,适用适用

于于对对间隔不等的时点数列间隔不等的时点数列求平均发展水平。求平均发展水平。

““ 首末折半”公式和“间隔加权”公式并没有实首末折半”公式和“间隔加权”公式并没有实

质上的不同,前者不过是后者的特例而已。质上的不同,前者不过是后者的特例而已。

间隔不等的间断时点数列的序时平均数间隔不等的间断时点数列的序时平均数

Page 319: 应 用 统 计

122 12

1

n

aaa

a

a

nn

间隔相等的间断时点数列的序时平均数间隔相等的间断时点数列的序时平均数

间隔不等的间断时点数列的序时平均数间隔不等的间断时点数列的序时平均数

n

ii

nnn

f

faa

faa

faa

a

1

12

211

10

2......

22

Page 320: 应 用 统 计

22 、相对数数列或平均数数列平均发展水、相对数数列或平均数数列平均发展水平的计算平的计算 相对数 (这里仅指静态相对数)或平均数数相对数 (这里仅指静态相对数)或平均数数列中的各项数值(以列中的各项数值(以 cc表示)是根据两个有联表示)是根据两个有联系的总量数据(分别用系的总量数据(分别用 aa 和和 bb表示)对比而求表示)对比而求得,用符号表示即 得,用符号表示即 c = a/bc = a/b。因此,由相对数。因此,由相对数或平均数数列计算平均发展水平,应当符合该或平均数数列计算平均发展水平,应当符合该相对数或平均数本身的计算公式,即由 而得相对数或平均数本身的计算公式,即由 而得到,而不应当由 得到。到,而不应当由 得到。

n

c b

a

Page 321: 应 用 统 计

由相对数或平均数数列计算平均发展水由相对数或平均数数列计算平均发展水平,作为一种平均数,也有权数的影响问平,作为一种平均数,也有权数的影响问题。若以题。若以

简单平均的方式求(即 ),实际上就简单平均的方式求(即 ),实际上就忽略了权数的影响忽略了权数的影响

而用 的公式计算,权数包含其中,其而用 的公式计算,权数包含其中,其

结果才是正确的。结果才是正确的。

n

cc

b

ac

Page 322: 应 用 统 计

例例,某公司最近三年销售额计划完成情况如下,某公司最近三年销售额计划完成情况如下:

年度序号

计划销售额(百万元)

实际销售额(百万元)

销售额计划完成

( % )

1 100 105 105

2 400 380 95

3 200 200 100

合计 700 685 97.86

Page 323: 应 用 统 计

该例中,公司销售额三年总的计划完成该例中,公司销售额三年总的计划完成(也就是三年的平均计划完成)如果用(也就是三年的平均计划完成)如果用简单平均公式 ,显见应当等于简单平均公式 ,显见应当等于 100100%% ,,

但实际上为但实际上为 97.86%97.86% 。这主要是由于销。这主要是由于销售额所占比重较大的第二年没有完成计售额所占比重较大的第二年没有完成计划所至。可见,各年度的销售额(准确划所至。可见,各年度的销售额(准确说是各年度销售额在全部销售额中的比说是各年度销售额在全部销售额中的比重)在三年总的销售额计划完成(或称重)在三年总的销售额计划完成(或称为三年的平均计划完成)中起着权衡轻为三年的平均计划完成)中起着权衡轻重的作用。重的作用。

n

cc

Page 324: 应 用 统 计

现若假设表中已知各年度计划销售额(设现若假设表中已知各年度计划销售额(设为为 bb)和销售额计划完成百分数(设为)和销售额计划完成百分数(设为cc ),而未知实际销售额,要求三年总的),而未知实际销售额,要求三年总的(平均的)计划完成百分数((平均的)计划完成百分数( %% ),则根),则根据计划完成百分数的公式有:据计划完成百分数的公式有:

%100

%100 %

计划数计划数)(计划完成百分数计划数之和实际数之和

总计划完成百分数

Page 325: 应 用 统 计

用符号表示即为:用符号表示即为:

可见这是一个加权算术平均公式,各年度的可见这是一个加权算术平均公式,各年度的计划销售额在这里充当了权数,对三年总的计计划销售额在这里充当了权数,对三年总的计划完成百分数的计算起着权衡轻重的作用;从划完成百分数的计算起着权衡轻重的作用;从该式也可以理解为什么说三年总的计划完成百该式也可以理解为什么说三年总的计划完成百分数也就是各年度平均的计划完成百分数分数也就是各年度平均的计划完成百分数。。

%100%

b

cbc

%86.97

%100200400100

200140095.010005.1

Page 326: 应 用 统 计

又若假设已知各年度实际销售额(设为又若假设已知各年度实际销售额(设为aa )和计划完成百分数()和计划完成百分数( cc )而未知计划销)而未知计划销售额,则有:售额,则有:

这是一个加权调和平均公式,各年度的实这是一个加权调和平均公式,各年度的实际销售额在这里充当了权数,对三年的计划际销售额在这里充当了权数,对三年的计划完成起着权衡轻重的作用。完成起着权衡轻重的作用。

%86.97

%1001/20095.0/38005.1/105

200380105

%100%

c

aa

c

Page 327: 应 用 统 计

正是由于各年度的实际数或计划数在三年正是由于各年度的实际数或计划数在三年总的(或平均的)计划完成百分数中所起作总的(或平均的)计划完成百分数中所起作用不同,用简单平均公式计算就是不正确的用不同,用简单平均公式计算就是不正确的。实际上,无论是时间范围扩大还是空间范。实际上,无论是时间范围扩大还是空间范围扩大,我们只要严格按照相对数或平均数围扩大,我们只要严格按照相对数或平均数本身的计算公式,权数问题自然解决,计算本身的计算公式,权数问题自然解决,计算结果就是正确的。结果就是正确的。

Page 328: 应 用 统 计

【【例例】】已知已知 1994~19981994~1998 年我国的国内生产总值年我国的国内生产总值及构成数据如下表。计算及构成数据如下表。计算 1994~19981994~1998 年间我国年间我国第三产业国内生产总值占全部国内生产总值的第三产业国内生产总值占全部国内生产总值的平均比重平均比重

表 6—7 我国国内生产总值及其构成数据年 份 1994 1995 1996 1997 1998

国内生产总值 (亿元 ) 其中∶第三产业 ( 亿元 ) 比重 (%)

46759.414930.0

31.9

58478.1

17947.2

30.7

67884.620427.5

30.1

74772.4

24033.3

32.1

79552.826104.3

32.8

Page 329: 应 用 统 计

解解::第三产业国内生产总值的平均数第三产业国内生产总值的平均数

全部国内生产总值的平均数全部国内生产总值的平均数

第三产业国内生产总值所占平均比重第三产业国内生产总值所占平均比重

(亿元)46.206885

3.1034421

n

aa

n

ii

(亿元)46.206885

3.1034421

n

aa

n

ii

(亿元)46.654895

3.3274471

n

bb

n

ii

(亿元)46.654895

3.3274471

n

bb

n

ii

%59.31%10046.65489

46.20688

b

a%59.31%100

46.65489

46.20688

b

a

Page 330: 应 用 统 计

表中数据是我国表中数据是我国 19901990 年到年到 19971997 年年末全国从业年年末全国从业人员资料。计算 人员资料。计算 19911991 年到年到 19971997 年的年平均第三次年的年平均第三次产业从业人员在全国从业人员中所占比重。产业从业人员在全国从业人员中所占比重。

年 份 90 91 92 93 94 95 96 97

年末从业人数(万人)年末第三次产业从业人数(万人)第三次产业从业人数比重( % )

63909 64799 65554 66373 6960067119 67947

11828 12979 12979 15456 16851 17901 1837512247

19.818.5

68858

18.9 21.2 23.0 24.08 26.0 26.4

Page 331: 应 用 统 计

第三次产业从业人数占总从业人数的比重第三次产业从业人数占总从业人数的比重是相对数时间数列,它由两个时点数列产生,是相对数时间数列,它由两个时点数列产生,且时间间隔相同,故应用首末折半法分别求出且时间间隔相同,故应用首末折半法分别求出总从业人数的年平均数 和第三次产业从业人总从业人数的年平均数 和第三次产业从业人数的年平均数 ,再将二者对比。数的年平均数 ,再将二者对比。

ab

122 12

1

n

aaa

a

a

nn

182

18375179011685115456140711297912247

211828

79.149437

5.104605

Page 332: 应 用 统 计

122 12

1

n

bbb

b

b

nn

182

69600688506794767199663736555464799

263909

34.667827

5.467476

ba

c %38.2234.6678279.14943

Page 333: 应 用 统 计

1a 2a 3a 4a

1b 2b3b 4b

1c 2c 3c 4c

 

一一月月份份

二二月月份份

三三月月份份

四四月月份份

总产出总产出(万元)(万元)

月初职工月初职工人数人数(人)(人)

劳动生产劳动生产率率(万元(万元 //

人)人)

Page 334: 应 用 统 计

分子、分母均为时期数列:分子、分母均为时期数列:分子、分分子、分母分别用相同的时期公式)母分别用相同的时期公式)

分子是时期数列,分母是时点数列分子是时期数列,分母是时点数列::分别用不同的公式,分母项数比分子项分别用不同的公式,分母项数比分子项数多一项数多一项

分子、分母均为时点数列分子、分母均为时点数列(间隔相(间隔相等和间隔不等两种情况):分子、分母等和间隔不等两种情况):分子、分母分别用相同的时点公式分别用相同的时点公式

分子是时期数列,分母是序时平均分子是时期数列,分母是序时平均数数列:数数列:分子、分母分别用相同的时期分子、分母分别用相同的时期公式公式

Page 335: 应 用 统 计

二、增减量和平均增减量

(一)增减量 增减量是报告期水平与基期水平之差,用以说明现象在一定时期内增减的绝对数量。 由于计算时所采用的基期不同,增减量可分为逐期增减量和累计增减量。

Page 336: 应 用 统 计

逐期增减量是报告期水平与报告期前期水平之差,说明现象逐期增减的数量。即 )21(1 niaa ii ,,

累计增减量是报告期水平与某一固定基期水平之差,说明一段时期内总的增减绝对数量,表示为:

),,2,1(0 niaai

Page 337: 应 用 统 计

逐期增减量与累计增减量之间存在逐期增减量与累计增减量之间存在

一定的数量关系一定的数量关系:各逐期增减量的和等于:各逐期增减量的和等于

相应时期的累计增减量,两相邻时期累计相应时期的累计增减量,两相邻时期累计

增减量之差等于相应时期的逐期增减量。增减量之差等于相应时期的逐期增减量。

011201 )()()( aaaaaaaa nnn

Page 338: 应 用 统 计

年份 1996 1997 1998 1999 2000 2001

GDP(亿元) 800 1020 912 1100 1300 1450

逐期增减量 —— 220 -108 188 200 150

累计增减量 —— 220 112 300 500 650

环比发展速度%

—— 127.50 89.41 120.6

1118.18

111.54

定基发展速度% 100 127.5

0114.00

137.50

162.50

181.25

环比增减速度% —— 27.50 -

10.59 20.61

18.18 11.54

定基增减速度% —— 27.50 14.00 37.50 62.50 81.25

增长 1% 的绝对值 —— 8 10.20 9.12 11.00 13.00

Page 339: 应 用 统 计

实际工作中,为了消除季节因素的影实际工作中,为了消除季节因素的影响,对于月度或季度数据,也可以本月响,对于月度或季度数据,也可以本月(季)发展水平与上年同月(季)发展(季)发展水平与上年同月(季)发展水平相减,表示本月(季)较之上年同水平相减,表示本月(季)较之上年同月(季)增减的绝对数量,称为月(季)增减的绝对数量,称为 年距增年距增减量减量。用符号表示为:。用符号表示为:

= – = –

(( L=12L=12 或或 44; ; =1=1 ,, 22 ,…,,…, n–Ln–L))

Lia iaL ia

i

Page 340: 应 用 统 计

(二)平均增减量 逐期增减量的序时平均数,用以说明现象在一段时期内平均每期的绝对增减数量。

n

aa

n

aan

n

iii

011)(

1

观察值个数累积增长量

逐期增长量个数逐期增长量之和平均增长量

1

观察值个数累积增长量

逐期增长量个数逐期增长量之和平均增长量

Page 341: 应 用 统 计

§3 动态数列速度指标

一、发展速度和增减速度(一)发展速度 报告期水平与基期水平之比,用以说明现象报告期较基期水平的相对发展程度。 由所选择的基期不同,发展速度分为环比发展速度和定基发展速度

Page 342: 应 用 统 计

环比发展速度环比发展速度 报告期水平与报告期前一期报告期水平与报告期前一期水平之比,反映现象逐期发展变化的相对程度水平之比,反映现象逐期发展变化的相对程度

1

( 1,2, , )i

i

ai n

a

定基发展速度(总速度)定基发展速度(总速度) 报告期水平与某一固定基期水平(通常为最初水平)之比,表明现象在一段时期内的发展相对程度

0

( 1,2, , )iai n

a

Page 343: 应 用 统 计

两种速度的关系:

( 1 ) 某段时期内各环比发展速度的连乘积

等于该时期内的定基发展速度

( 2 ) 相邻的两个定基发展速度之商,等于

相应的环比发展速度 = =

( = 2 , 3 ,…, n )

n

i i

i

a

a

1 1 0a

an

0a

ai 0

1

a

ai

1i

i

a

a

i

Page 344: 应 用 统 计

为了消除季节因素的影响,实际工作为了消除季节因素的影响,实际工作中,也可以本期(月或季)发展水平与中,也可以本期(月或季)发展水平与上年同期(月或季)发展水平相比,表上年同期(月或季)发展水平相比,表示本期较上年同期发展的相对程度(称示本期较上年同期发展的相对程度(称为为年距发展速度年距发展速度)。用公式表示为:)。用公式表示为:

(( L=12L=12 或或 44 ;; =1=1 , , 22 ,…,,…, n – n – LL ))

iaL ia

i

年距发展速度年距发展速度

Page 345: 应 用 统 计

(二) 增减速度

增减速度是增减量与基期水平之比,用以说明

报告期水平较基期水平增减变化的相对程度

1

发展速度基期水平

基期水平报告期水平基期水平增减量

增减速度

环比增减速度 = 环比发展速度 -1

定基增减速度 = 定基发展速度 -1

Page 346: 应 用 统 计

注意注意::环比增减速度的连乘积并不等于相环比增减速度的连乘积并不等于相应时期的定基增减速度;两相邻定基增减速度应时期的定基增减速度;两相邻定基增减速度之商也不等于相应时期的环比增减速度。之商也不等于相应时期的环比增减速度。 增减速度不能直接进行计算,若给的条件为增减速度不能直接进行计算,若给的条件为增减速度,必须将增减速度加增减速度,必须将增减速度加 11 变成发展速度变成发展速度才能进行计算;若求增减速度,必须先求发展才能进行计算;若求增减速度,必须先求发展速度,再通过发展速度减速度,再通过发展速度减 11 而求得。而求得。

Page 347: 应 用 统 计

二、平均发展速度和平均增减速度

平均增减速度 = 平均发展速度 -1

求平均增减速度,应先求平均发展速

度,再由平均发展速度减 1而得。

平均发展速度 各期环比发展速度的序时

平均数,表明现象在一段时期内逐期发

展变化的平均程度。

Page 348: 应 用 统 计

平均发展速度大于平均发展速度大于 11 ,则平均增减速度为,则平均增减速度为正值,表明现象在这段时期内平均说来是逐正值,表明现象在这段时期内平均说来是逐期递增的,因而也称为平均递增率;期递增的,因而也称为平均递增率; 平均发展速度小于平均发展速度小于 11 ,则平均增减速度为,则平均增减速度为负值,表明现象在这段时期内平均说来是逐负值,表明现象在这段时期内平均说来是逐期递减的,因而也称为平均递减率。期递减的,因而也称为平均递减率。 平均递增(递减)率反映出现象在某段时平均递增(递减)率反映出现象在某段时期内平均逐期递增(递减)的程度。期内平均逐期递增(递减)的程度。

Page 349: 应 用 统 计

(一)计算平均发展速度的几何平均法 (水平法)

假设 xi 为 n个逐年的环比发展速度,根据定基发展速度和环比发展速度的关系:

定基发展速度常称为总速度(用 R表示),所以上式也可以写为:

定基发展速度等于期末水平除以期初水平

nnxxxx 21

n Rx

nn aax 0

Page 350: 应 用 统 计

三个公式的实质是一致的,应视不同条三个公式的实质是一致的,应视不同条件灵活运用。其中件灵活运用。其中 nn都是指环比发展速都是指环比发展速度的个数,也即时间数列项数减度的个数,也即时间数列项数减 11 。 。

例:我国例:我国 20002000 年欲在年欲在 19801980 年国内生产总年国内生产总

值的基础上翻值的基础上翻 22番。问年平均增长速度至少番。问年平均增长速度至少

为多少才能达此目标?为多少才能达此目标?

%177.7141 20 n Rx

Page 351: 应 用 统 计

例: 1982年末我国人口是 10.15亿

人,人口净增长率 14.49‰ ,如果按此速

度增长, 2000年末将有多少亿人?若 200

0年要将人口控制在 12亿人以内,人口年

均净增长率应控制在多少?

%9345.0115.10/121

15.1301449.115.1018

181819822000

x

xaa

Page 352: 应 用 统 计

几何平均法计算的平均发展速度具有如几何平均法计算的平均发展速度具有如下特点:下特点:若将各期环比发展速度换成平均发展速若将各期环比发展速度换成平均发展速

度 依次推算各期发展水平(称为各期计度 依次推算各期发展水平(称为各期计算水平) ,算水平) ,

则各期计算水平与各期实际水平则各期计算水平与各期实际水平

并不相等,但并不相等,但最末一期的计算水平 最末一期的计算水平 与最末一期的实际水平 相等。与最末一期的实际水平 相等。

x),,2,1(0 nixa i

nxa0

ia

na

Page 353: 应 用 统 计

这体现了几何平均法的重要这体现了几何平均法的重要理论性质理论性质,即从最,即从最初水平 出发,每期都按平均发展速度 发展,初水平 出发,每期都按平均发展速度 发展,则则 nn 期后一定达到末期水平 ,用公式表示为:期后一定达到末期水平 ,用公式表示为: 由该公式也可派生出: 由该公式也可派生出:

或直接写为:或直接写为:

即计算所得的即计算所得的最末一期定基发展速度等于最最末一期定基发展速度等于最末一期实际的定基发展速度末一期实际的定基发展速度。由于几何平均法着。由于几何平均法着眼于末期水平,因而又常将其称为“水平法”。眼于末期水平,因而又常将其称为“水平法”。

0a x

000 // aaaxa nn

0/ aax nn

nn axa 0

na

Page 354: 应 用 统 计

(二)计算平均发展速度的方程式法(二)计算平均发展速度的方程式法

要求满足的条件是:从最初水平 出发,要求满足的条件是:从最初水平 出发,每期都按平均发展速度 发展每期都按平均发展速度 发展 ,, 则各期则各期计算水平 (计算水平 ( i=1,2,…i=1,2,… ,, nn ))

的总和应等于各期实际水平 ( 的总和应等于各期实际水平 ( =1=1 ,,22 ,…,,…, nn )的总和。)的总和。

*xixa *

0

ia i

0a

n

ii

n axaxaxa1

*0

2*0

*0 ......

Page 355: 应 用 统 计

实际上,各期实际水平的总和为:实际上,各期实际水平的总和为:

用各期的环比发展速度和 表示各期实际水平,则上用各期的环比发展速度和 表示各期实际水平,则上式可表示为:式可表示为:

再用平均发展速度替换各期的环比发展速度,则有:再用平均发展速度替换各期的环比发展速度,则有:

n

iin aaaa

121

n

iin axxxaxxaxa

121021010

0a

n

ii

n axaxaxa1

*0

2*0

*0 ......

Page 356: 应 用 统 计

等式两边都除以 后有:等式两边都除以 后有:

解此高次方程所得的正根,就是按方程式法所解此高次方程所得的正根,就是按方程式法所求得的平均发展速度。由于方程式法着眼于累计求得的平均发展速度。由于方程式法着眼于累计和,因此又常将此法称为“累计法”。和,因此又常将此法称为“累计法”。

01

*2** /...... aaxxxn

ii

n

*

n

ii

n aaaxaaxaaxa1

00*

002*

00*

0 //......//

0a

Page 357: 应 用 统 计

方程式法的特点:方程式法的特点:各期计算水平的总和等于各期实各期计算水平的总和等于各期实际水平的总和,即:际水平的总和,即:

  

各期计算的定基发展速度的总和等于各期实际定各期计算的定基发展速度的总和等于各期实际定基发展速度的总和,即:基发展速度的总和,即:

n

ii

n axaxaxa1

*0

2*0

*0 ......

n

ii

n aaaxaaxaaxa1

00*

002*

00*

0 //......//

01

*2** /...... aaxxxn

ii

n

Page 358: 应 用 统 计

表 6- 13 第三产业国内生产总值速度计算表年 份 序 号 1 2 3 4 5

国内生产总值 (亿元 ) 14930.0 17947.2 20427.5 24033.3 26104. 3

发展速度(%)

环比定基

—100

120.2120.2

113.8136.8

117.7161.0

108.6174.8

增长速度(%)

环比定基

——

20.220.2

13.836.8

17.761.0

8.674.8

【【例例】】 根据下表中第三产业国内生产总值数列,根据下表中第三产业国内生产总值数列,计算各年的环比发展速度和增长速度,及以第计算各年的环比发展速度和增长速度,及以第 11 年年为基期的定基发展速度和增长速度为基期的定基发展速度和增长速度

Page 359: 应 用 统 计

平均发展速度平均发展速度

平均增长速度平均增长速度

【【例例】】 根据上表中的有关数据,计算这根据上表中的有关数据,计算这 55 年间我国年间我国第三产业国内生产总值的年平均发展速度和年平均第三产业国内生产总值的年平均发展速度和年平均增长率增长率

%99.1140.14930

3.26104

%6.108%7.117%8.113%2.120

4

4

1

n

i

i

Y

YR

%99.1140.14930

3.26104

%6.108%7.117%8.113%2.120

4

4

1

n

i

i

Y

YR

%99.141%99.114 %99.141%99.114

Page 360: 应 用 统 计

(三)应用平均发展速度指标应注意的问题(三)应用平均发展速度指标应注意的问题

11 、平均发展速度应与各环比发展速度结合分析、平均发展速度应与各环比发展速度结合分析22 、总平均发展速度和分段平均发展速度结合分、总平均发展速度和分段平均发展速度结合分

析析33 、平均发展速度要联系基期水平进行分析、平均发展速度要联系基期水平进行分析 注意每增长注意每增长 1%1% 所包含的绝对数量所包含的绝对数量

= = ( ( =1=1 ,, 22 ,…,,…, nn ))100)1/( 1

1

ii

ii

aa

aa

1001ia

i

Page 361: 应 用 统 计

§4 长期趋势和季节变动 影响动态趋势的因素分析

长期趋势变动T

指现象在一个相当长时期内持续发展变化的总趋势。

季节变动S

由于季节的更换而引起现象按一定的时间间隔周期性的明显变化。

循环变动C

社会经济现象变动中发生周期比较长的涨落起伏的波动变化。

不规则变动I

由于临时性、偶然性的因素引起的非周期性或趋势性的随机变动。

Page 362: 应 用 统 计

现象变化的影响因素:

一类:基本因素—促使某现象不断增长或不断下降另一类:偶然因素例:影响农产量因素

Page 363: 应 用 统 计

动态数列上述四种变动按一定方式组合,成为一种模型,称为动态数列因素构成模型。按对四种变动因素相互关系的不同假设,可形成乘法模型、加法模型和乘加模型等。1 、乘法模型: Y= T×S×C×I2 、加法模型: Y= T+ S+ C+

I

Page 364: 应 用 统 计

式中 Y为动态数列各发展水平,如果 T 、 S 、C 、 I 四种变动因素之间存在着相互交错影响关系,宜选乘法模型;如果四种变动因素是相互独立的,宜选用加法模型;如果存在其他情况,则需具体分析。在现实中普遍运用的是乘法模型,所以我们在学习中主要使用乘法模型。

Page 365: 应 用 统 计

一、长期趋势的分析(一)长期趋势的概念(二)长期趋势分析法 测定长期趋势的主要方法有:时距扩大法、移动平均法、数学模型法等

Page 366: 应 用 统 计

1 、时距扩大法时距扩大法是长期趋势最原始最简便的方法。它是对原来时距较短的动态数列,加工整理为时距较长的动态数列,以消除原数列因时距过短受偶然因素和季节变动影响所引起的波动,使现象的发展趋势和规律性明显地表现出来。如表:

Page 367: 应 用 统 计
Page 368: 应 用 统 计

应用时距扩大法时需要注意以下几个问题第一,扩大的时距多大为宜取决于现象自身的特点。对于呈现周期波动的动态数列,扩大的时距应与波动的周期相吻合;对于一般的动态数列,则要逐步扩大时距,以能够显示趋势变动的方向为宜。时距扩大太大,将造成信息的损失。

Page 369: 应 用 统 计

第二,扩大的时距要一致,相应的发展水平才具有可比性。2 、序时平均法—对时点数列计算序时平均数3 、移动平均法

Page 370: 应 用 统 计

移动平均法是将时间数列的时距扩大,在数列中按一定项数逐项移动计算平均数,达到对原始数列进行修匀的目的。从而形成一个趋势值时间数列。在这个趋势值数列中,消除了偶然因素的影响,显示出现象发展的趋势。

Page 371: 应 用 统 计
Page 372: 应 用 统 计

4 、最小平方法最小平方法,也叫最小二乘法,是分析和预测现象长期趋势常用的方法之一。它的基本原理是:要通过对原始数列的数字处理,拟合一条比较理想的趋势直线或趋势曲线,使原数列各

Page 373: 应 用 统 计

数据点与趋势线垂直距离的离差平方和为最小,即 为最小值。能够满足 为最小值的直线趋势方程,其参数 a, b可以通过求解下面的联立方程求得

2 cyy

2 cyy

Page 374: 应 用 统 计

22 1

1

tn

t

ytn

tyb

tbyn

tb

n

ya

Page 375: 应 用 统 计

xx

yy((xxn n , , yynn))

((xx1 1 , , yy11))

((xx2 2 , , yy22))

((xxi i , , yyii))

}}eei i = = yyii--yyii^^

xy 10ˆˆˆ xy 10ˆˆˆ

Page 376: 应 用 统 计

•下面就介绍直线趋势的测定。如以时间因素作为自变量( t),把数列水平作为因变量( y),拟合的直线趋势方程为

参数 a, b的求法用最小平方法。

btayc

式中: a是截距; b是直线的斜率,它表示xx每变动一个单位, y y 的平均变动值。

Page 377: 应 用 统 计

产量(万吨)ytty2t

年份 产量(万) y t ty t2

1991199219931994199519961997199819992000

230236241246252257262276281286

123456789

10

230472723984

126015421834220825292860

149

162536496481

100

合计 2567 551464

2385

Page 378: 应 用 统 计

试用最小平方法配合直线趋势方程,并预测 2002年的粮食产量。

解: yc=a+bt ∵n = 10 ∑t = 55

∑y = 2567 ∑ty = 14642

3852 t

Page 379: 应 用 统 计

8122110

553456

10

2567

34565538510

256755146421022

..n

tb

n

ytbya

.ttn

yttynb

2

Page 380: 应 用 统 计

yc = 221.81 + 6.345 t2002年的粮食产量为:yc = 221.81 + 6.345×12=297.95 (万吨 )

Page 381: 应 用 统 计

练习:某地区 1996—2000年粮食产量资料如表

年 份 1996 1997 1998 1999 2000

某种产品产量(万吨)

220 232 240 256 280

Page 382: 应 用 统 计

要求:( 1)试运用最小平方法配合直线方

程;( 2)预测 2002年该地区粮食产量。

Page 383: 应 用 统 计

三、季节变动的分析

(一)季节变动的概念季节变动,是指某些现象由于受自然因素和社会条件的影响,在一年之内比较有规律地变动。

Page 384: 应 用 统 计

季节变动具有三个特点:一、季节变动每年重复进行;二、季节变动按照一定的周期进行;

三、每个周期变化强度大体相同。

Page 385: 应 用 统 计

(二)季节变动的测定

测定季节变动的主要指标是季节指数,也称季节比率。它是若干年同月(或季)平均数与总的月(或季)平均数之比,以测定各月 (或季 )的季节指数(比率),说明季节变动的一般规律。

Page 386: 应 用 统 计

计算公式:

这里,按季计算的四个季节比率之和应等于400%(使用月份资料时,十二个月的季节比率之和应等于 1200%) 。 有时,因舍入误差使季节比率之和不等于400%(1200%) ,就需要把差额分摊到各季(月 ) 的季节比率上。

%100总的月(或季)平均数同月(或季)平均数

季节指数(比率)

Page 387: 应 用 统 计

季节变动的测定方法有两种: 一种是不考虑长期趋势影响的同月(或季)平均法; 一种是考虑长期趋势影响的移动平均趋势剔除法。

Page 388: 应 用 统 计

同月(或季)平均法

1 、根据时间序列资料计算各年同月(或季)的平均数。

2 、计算各年所有月(或季)的总平均数3 、将各年同月 (或季 ) 的平均数与总的月(或季 ) 平均数对比,计算季节比率

Page 389: 应 用 统 计
Page 390: 应 用 统 计

第一步:计算同月份平均水平。 一月份平均数 =第二步:求总平均月份水平。 总平均月份水平 = 或: 总平均月份水平 =

总平均月份水平 =

(件)5.1874

28024015080

(台)5.11348

5447

(台)5.11312

9.1361

(台)5.1134

9.453

Page 391: 应 用 统 计

第三步:计算季节比率。 如一月份的季节比率 =

%2.1655.113

5.187

Page 392: 应 用 统 计

4 、用季节比率进行预测。为了预测以后各年不同月(或季)发展趋势和状况,通常假定按过去资料测定的季节变动模型能够适用于未来。因此,按月(或季)平均预测法的计算公式为:各月(或季)预测值= 上年各月(或季)的平均值×各月(或季)的季节比率

Page 393: 应 用 统 计

如对 2003年销售量进行预测: 5月份的销售量 =153.3×10.6%=16 (件) 10月份的销售量 =153.3×93.7%=144 (件) 通过上面计算的由各月份季节比率组成的数列,可以看出毛衫销售量的季节变动趋势,自 1月份期季节比率逐月减少, 6月份减少到最低点, 7月份开始上升,到 12月份上升到最高点

Page 394: 应 用 统 计

练 习

例:某服装公司 1998-2002年各月销售额资料如表。试计算其季节比率。

Page 395: 应 用 统 计

月份

销售额(万元) 5年同月销售额

平均季节比率 %1998

年1999年

2000年

2001年

2002年

(1) (2) (3) (4) (5)

(6)(7)

123456789101112

1.11.21.93.64.214.224.09.53.81.81.20.9

1.11.52.23.96.416.428.012.03.91.91.31.0

1.42.13.15.26.818.831.014.04.82.41.21.1

1.42.13.15.06.619.531.514.54.92.51.41.2

1.32.23.34.97.020.031.815.35.12.61.41.1

年总计

Page 396: 应 用 统 计

月份

销售额(万元)5年同月销售额平均

季节比率 %1998

年1999年

2000年

2001年

2002年

(1) (2) (3) (4) (5) (6) (7)

123456789

101112

1.11.21.93.64.2

14.224.09.53.81.81.20.9

1.11.52.23.96.4

16.428.012.03.91.91.31.0

1.42.13.15.26.8

18.831.014.04.82.41.21.1

1.42.13.15.06.6

19.531.514.54.92.51.41.2

1.32.23.34.97.0

20.031.815.35.12.61.41.1

1.261.822.724.526.20

17.7829.2613.064.502.221.301.06

17.625.538.163.386.8

249.0409.8182.963.031.118.214.8

年总计 67.4 79.5 91.9 93.7 96.0 7.14 1199.3

Page 397: 应 用 统 计

Thank you very Thank you very muchmuch!!Thank you very Thank you very muchmuch!!

Page 398: 应 用 统 计

第七章 统计指数§1 统计指数的概述§2 综合指数法 §3 平均指数法§4 指数体系和因素分析

Page 399: 应 用 统 计

学习目的及要求

1.掌握统计指数的概念和作用2.掌握数量指标指数和质量指标指数编制3.掌握平均指标指数4.掌握平均指标对比指数的公式,会进行两因素的因素分析5.掌握指数体系的含义并会进行两因素的因素分析

Page 400: 应 用 统 计

§1 统计指数的概述

一、统计指数的概念与作用 二、统计指数的分类

Page 401: 应 用 统 计

指数

Page 402: 应 用 统 计

指数起源于人们对价格动态的关注。

今天的面包价格昨天的面包价格 个体价格指数

今天的面包、鸡蛋、香肠等等价格昨天的面包、鸡蛋、香肠等等价格

综合价格指数

Page 403: 应 用 统 计

指数是解决多种不能直接相加的事物动态对比的分析方法

Page 404: 应 用 统 计

一、统计指数的概念与作用(一)统计指数的概念 广义:指反映社会经济现象总体数量变动的相对数。 狭义:是指反映复杂社会经济现象总体数量综合变动 的相对数。(二)指数的特点 1. 综合性 2. 平均性 3. 相对性

Page 405: 应 用 统 计

(三)指数的作用( 1)综合反映事物变动方向和变动程度。( 2)分析现象总体变动中受各个因素变动的影响程度。( 3)反映同类现象变动趋势。

Page 406: 应 用 统 计

二、统计指数的种类

⒈⒈按说明现象的范围不同分为按说明现象的范围不同分为

⒉⒉按所反映指标的性质不同分为按所反映指标的性质不同分为 数量指标指数质量指标指数

个体指数总指数考察简单现象总

体的数量对比关系的指数

考察复杂现象总体的数量对比关系的指数

指数化指标具有质量指

标的特征指数化指标具有数量指标的特征

数量指标指数质量指标指数

Page 407: 应 用 统 计

⒊⒊按总指数的编制方式不同分为: 按总指数的编制方式不同分为:

4.4. 按编制指数的方法论原理不同分为按编制指数的方法论原理不同分为 简单指数加权指数

综合指数

平均指标指数

先综合后对比

先对比后综合

平均指标对比指数

Page 408: 应 用 统 计

5.5. 按反映的时态状态不同分为 按反映的时态状态不同分为 动态指数

静态指数

Page 409: 应 用 统 计

§2 综合指数法

一、数量指标综合指数的编制 二、质量指标综合指数的编制 三、综合指数法的特点

Page 410: 应 用 统 计

总指数的计算形式有两种

综合指数是总指数的编制方法之一,其编制方法是“先综合、后对比”。也就是首先加总个别现象的指数化指标,再通过综合对比得到总指数。

综合指数

平均指数

Page 411: 应 用 统 计

由于复杂现象总体的由于复杂现象总体的指数化指标指数化指标是不能直是不能直接相加的,因此,编制综合指数需要解决接相加的,因此,编制综合指数需要解决两个问题:两个问题:同度量因素同度量因素问题和问题和同度量因素同度量因素的固定的固定问题。问题。指数化指标:指在指数分析中被研究的指标指数化指标:指在指数分析中被研究的指标

Page 412: 应 用 统 计

同度量因素:指把不同度量的现象过渡成同度量因素:指把不同度量的现象过渡成

可以同度量的媒介因素,同时起到可以同度量的媒介因素,同时起到同度量同度量 和和权数权数 的作用的作用

Page 413: 应 用 统 计

举例:

25.05.0

300.0

20.04.0

290.0

1001200100

120100060

件支台

甲乙丙

报告期基期报告期基期价格(元)销售量计量

单位商品名称

0Q1P0P1Q

反映各种商品销售量的变动:反映各种商品销售量的变动:﹪﹪﹪ 丙乙甲 67.16612033.83 QQQ KKK

Page 414: 应 用 统 计

反映三种商品销售量的综合变动:反映三种商品销售量的综合变动:

﹪﹪﹪﹪

33.1233

67.16612033.83

QK

﹪64.118601000120

1001200100

QK

0

1

Q

QKQ

0P

0P √指数化指标

同度量因素

Page 415: 应 用 统 计

综合指数的编制原理(1)(1) 根据客观现象间的内在联系,引入同度根据客观现象间的内在联系,引入同度量因素;量因素;

(2)(2) 将同度量因素固定,以消除同度量因素将同度量因素固定,以消除同度量因素变动的影响;变动的影响;(3)(3) 将两个不同时期的总量指标对比,以测将两个不同时期的总量指标对比,以测定指数化指标的数量变动程度。定指数化指标的数量变动程度。

Page 416: 应 用 统 计

综合指数的一般编制原则

⒈⒈数量指标综合指数的编制:数量指标综合指数的编制:一般采用基期的质量指标作为同度量因素。

00

01

PQ

PQKQ

⒉⒉质量指标综合指数的编制质量指标综合指数的编制::一般采用报告期的数量指标作为同度量因素

10

11

QP

QPK P

Page 417: 应 用 统 计

商品名称

计量单位

销售量 价格(元) 销售额(元)基期 报告期 基期 报告期

甲 件 120 100 20 25 2400 2500 2000

乙 支 1000 1200 4 5 4000 6000 4800

丙 台 60 100 290 300 17400 30000 29000

合计 — — — — — 23800 38500 35800

计算:计算:三种商品销售量综合指数和销售价三种商品销售量综合指数和销售价格综合指数。格综合指数。

0p 1p0q 1q 00 pq 11 pq 01 pq

资料栏资料栏 计算栏计算栏

Page 418: 应 用 统 计

解:解:销售量综合指数为销售量综合指数为::

%42.15023800

35800

00

01

pq

pqK q %42.150

23800

35800

00

01

pq

pqK q

由于销售量的增加而增加的销售额为:由于销售量的增加而增加的销售额为:

)(1200023800358000001 元pqpq )(1200023800358000001 元pqpq

Page 419: 应 用 统 计

价格综合指数为价格综合指数为 ::

%54.10735800

38500

10

11

qp

qpK p %54.107

35800

38500

10

11

qp

qpK p

由于价格上涨而增加的销售额为:由于价格上涨而增加的销售额为:

)(270035800385001011 元qpqp )(270035800385001011 元qpqp

Page 420: 应 用 统 计

综合指数的其它编制方法

⒈⒈拉氏指数拉氏指数 :: 同度量因素均固定在基期的综合指数。同度量因素均固定在基期的综合指数。

00

01

00

01

PQ

PQK

QP

QPK LQLP

Page 421: 应 用 统 计

⒉⒉派氏指数派氏指数 :: 同度量因素均固定在报告期的综合指数同度量因素均固定在报告期的综合指数。

10

11

10

11

PQ

PQK

QP

QPK PQPP

Page 422: 应 用 统 计

可见: 数量指标指数一般采用拉氏指数公式。 质量指标指数一般采用派氏指数公式。

Page 423: 应 用 统 计

练习:根据上述资料要求:计算全部商品销售量总指数和全部商品价格总指数。

商品名称

计量单位

商品销售量 商品价格

基期 报告 基期 报告

甲乙丙

件支个

1208001000

10010001200

2.000.4015.0

0.400.6015.0

合计 — — — —

Page 424: 应 用 统 计

商品名称

计量单位

商品销售量 商品价格 商品销售额(万元)

基期 q0

报告期 q1

基期p0

报告期 p1

基期p0q0

报告期 p1q1

假定p0q1

甲乙丙

件支个

1208001000

10010001200

2.000.4015.0

0.400.6015.0

240320

15000

400600

18000

200400

18000

合计 - — — — 15560 19000 18600

Page 425: 应 用 统 计

( 1)

即三种商品销售量报告期比基期总的(平均)增长了 19.54%。

即由于商品销售量的变动而使商品销售额增加的绝对额为 3040 元。

%54.11915560

1860001

00 pq

pq量综合指数:商品销售

(元)304015560186000001 pqpq

Page 426: 应 用 统 计

即三种商品价格报告期比基期总的(平均)增长了 2.15%。

即由于商品价格的变动而使商品销售额增加的绝对额为 400 元。

%15.10218600

19000

10

11

qp

qp综合指数:商品价格

(元)40018600190001011 qpqp

Page 427: 应 用 统 计

三、综合指数法的特点

借助于同度量因素进行综合对比 同度量因素的时期要固定 用综合指数法编制总指数,使用的是全面资料,没有代表性误差。

Page 428: 应 用 统 计

§3 平均指数法

一、加权算术平均法二、加权调和平均法三、固定权数加权平均法四、统计指数法应用实例

Page 429: 应 用 统 计

平均指数平均指数是是首先首先通过计算个别现通过计算个别现象的个体指数,象的个体指数,然后然后以相应的总值指标以相应的总值指标作为权数对个体指数加权平均得到的总作为权数对个体指数加权平均得到的总指数。指数。

Page 430: 应 用 统 计

平均指数的分类

综合指数变形综合指数变形权数平均指数权数平均指数综合指数变形综合指数变形权数平均指数权数平均指数

固定权数固定权数平均指数平均指数固定权数固定权数平均指数平均指数

2.按平均指数的权数不同分

1.按平均指数的型式不同分

加权算术加权算术平均指数平均指数加权算术加权算术平均指数平均指数加权调和加权调和平均指数平均指数加权调和加权调和平均指数平均指数

Page 431: 应 用 统 计

一、加权算术平均数指加权算术平均数指数数

——适用于数量指标综合指数的变形

00

00

pq

pqkK q

q

式中, kq 为数量指标个体指数。

Page 432: 应 用 统 计

【例】【例】设某企业生产三种产品的有关资料如表。设某企业生产三种产品的有关资料如表。试计算三种产品的产量总指数。试计算三种产品的产量总指数。

商品名称

计量单位

基期总成本(万元 )(p0q0)

个体产量指数(q1/q0)

甲 件 200 1.03

乙 台 50 0.98

丙 箱 120 1.10

Page 433: 应 用 统 计

解:解: 产量总指数为

%59.104370387

1205020012010.15098.020003.1

00

00

0

1

qp

qpqq

Kq

%59.104370387

1205020012010.15098.020003.1

00

00

0

1

qp

qpqq

Kq

Page 434: 应 用 统 计

————适用于质量指标综合指数的变形适用于质量指标综合指数的变形

二、加权的调和平均指数二、加权的调和平均指数

11

11

1pq

k

pqK

p

p

式中, kp 为数量指标个体指数。

Page 435: 应 用 统 计

【例】【例】设某企业生产三种产品的有关资料如表。试计设某企业生产三种产品的有关资料如表。试计算三种产品的单位成本总指数。算三种产品的单位成本总指数。

商品名称

计量单位

基期总成本(万元 )(p1q1)

个体成本指数(p1/p0)

甲 件 220 1.14

乙 台 50 1.05

丙 箱 150 1.20

Page 436: 应 用 统 计

解:解: 单位成本指数为单位成本指数为

%88.11460.365

42020.1

15005.1

5014.1

22015050220

111

01

11

qppp

qpK

p

%88.11460.365

42020.1

15005.1

5014.1

22015050220

111

01

11

qppp

qpK

p

Page 437: 应 用 统 计

三、固定权数的加权平均法三、固定权数的加权平均法

w

kwK

固定权数(可根据有关的普查、抽样调查或全面统计报表资料调整计算确定),∑ w=100

个体指数或类指数

Page 438: 应 用 统 计

固定权数的应用:

我国的商品零售价格指数、农副产品我国的商品零售价格指数、农副产品收购价格指数、职工生活费指数(居民收购价格指数、职工生活费指数(居民消费指数)及西方的工业生产指数、消消费指数)及西方的工业生产指数、消费品价格指数等等,均采用了固定权数费品价格指数等等,均采用了固定权数的平均指数的编制方法。的平均指数的编制方法。

Page 439: 应 用 统 计

以以商品零售价格指数商品零售价格指数的编制为例的编制为例将全部商品划分为大类、中类、小类、品种、规格;确定各品种的代表规格品及权数w ;按照小类、中类、大类、总指数的顺序逐级计算各级指数。

w

wkK p

p

个别商品或类商品的价格指数

确定的居民消费构成固定权数,∑ w=100

Page 440: 应 用 统 计

商品类别及名称 代表规格品

计算单位

平均价格(元)权数(w)(﹪)

指数(﹪)

总指数一、食品类 ⒈粮食 ⑴细粮 面粉 大米 ⑵粗粮 ⒉副食品 ⒊烟酒茶 ⒋其他食品二、衣着类三、日用品类四、文化娱乐用品类五、书报杂志类六、药及医疗用品类七、建筑装潢材料类八、燃料类

标准粳米

千克千克

2.403.50

2.523.71

10051356540603545119201152623

115.1117.5105.3105.6105.0106.0104.8125.4126.0114.8115.2109.5110.4108.6116.4114.5105.6

1P0P

Page 441: 应 用 统 计

四、几种主要价格指数的编制股票价格指数是衡量整个股票市场价格变动的基本趋势的指数。人们形象地称之为市场经济的“晴雨表”。股票价格指数的编制方法多种多样,各有所长,综合指数是其中的一种重要编制方法。综制方法是,记入编指数的各种股票价格p,相应股票的发行量(或交易量)为 q,则综合形式的股价格指标数为:

qP

qPKP

0

1

q可以固定在基期水平 (即采用拉氏公式 ) ,也可以固定在计算期水平上(即采用派氏公式)。

Page 442: 应 用 统 计

世界主要证券交易所的股票价格指数世界主要证券交易所的股票价格指数 道道 ·· 琼斯股票价格指数和标准普尔股票价格指琼斯股票价格指数和标准普尔股票价格指

数;伦敦金融时报数;伦敦金融时报 FTSEFTSE 指数;法兰克福指数;法兰克福 DAXDAX指数;巴黎指数;巴黎 CACCAC 指数;瑞士的苏黎士指数;瑞士的苏黎士 SMISMI 指指数;日本的日京指数;香港的恒生指数数;日本的日京指数;香港的恒生指数

我国上海和深圳两个证券交易所我国上海和深圳两个证券交易所• 上交所的综合指数和上交所的综合指数和 180180 指数指数• 深交所的成分股指数和综合指数深交所的成分股指数和综合指数

Page 443: 应 用 统 计

综合指数和平均指数的关系联系: 在一定权数条件下,二者具有变形关系。

00

00

00

01

pq

pqk

pq

pqK q

q

11

11

01

11

1pq

k

pq

pq

pqK

p

p

Page 444: 应 用 统 计

区别:

⒈⒈解决复杂总体不能直接同度量问题的思想不同解决复杂总体不能直接同度量问题的思想不同

⒉⒉运用资料的条件不同运用资料的条件不同

在经济分析中,平均指数有其独立的使用价值在经济分析中,平均指数有其独立的使用价值。。

综合指数:综合指数:先综合后对比先综合后对比

平均指数:平均指数:先对比后综合先对比后综合

综合指数:综合指数:需具备研究总体的全面资料需具备研究总体的全面资料平均指数:平均指数:既适用于全面、也适用于非全面资料。既适用于全面、也适用于非全面资料。

Page 445: 应 用 统 计

§4 指数体系和因素分析

一、指数体系 二、因素分析 三、总量指标的因素分析

Page 446: 应 用 统 计

一、指数体系(一)指数体系的概念 指数体系:指几个指数之间在一定的经济联系基础上所结成的严密的关系式。

对象指数 指数

价格指数销售量

指数销售额

因素指数

Page 447: 应 用 统 计

构成指数体系的指数必须满足两个条件构成指数体系的指数必须满足两个条件第一,各因素指数的乘积等于总变动指数第一,各因素指数的乘积等于总变动指数第二,各因素指数分子与分母差额的总和第二,各因素指数分子与分母差额的总和等于总量指数实际发生的总差额。等于总量指数实际发生的总差额。

Page 448: 应 用 统 计

商品销售额指数商品销售额指数 ==商品销售量指数商品销售量指数 ××商品价格指数商品价格指数工业总产值指数工业总产值指数 ==产品产量指数产品产量指数 ××产品价格指数产品价格指数原材料支出额指数原材料支出额指数 ==产量指数产量指数 ×× 单位产品原材料消耗量指数单位产品原材料消耗量指数 ××单位原材料价格指数单位原材料价格指数销售额实际增加(减少)额销售额实际增加(减少)额 ==销售量的变动对销售额的影响额销售量的变动对销售额的影响额++商品价格的变动对销售额的影响额商品价格的变动对销售额的影响额

Page 449: 应 用 统 计

(二)指数体系的基本形式

⑴ ⑴ 相对数形式:相对数形式:

⑵ ⑵ 绝对数形式:绝对数形式:

10

11

00

10

00

11

qp

qp

qp

qp

qp

qp

10

11

00

10

00

11

qp

qp

qp

qp

qp

qp

101100100011 qpqpqpqpqpqp 101100100011 qpqpqpqpqpqp

Page 450: 应 用 统 计

(三)指数体系的作用

1. 进行因素分析:即根据指数体系分析现象的总变动中各有关因素的影响程度。(因素分析的内容包括相对数分析和绝对数分析)

2. 进行指数推算:即根据已知指数推算未知指数。

Page 451: 应 用 统 计

二、因素分析 因素分析就是借助于指数体系从数量方面分析现象总变动中,受各个因素变动的影响程度和影响绝对额。1 、因素分析的是复杂现象2 、因素分析中的指数体系以等式形式出现

3 、因素分析的结果有相对数和绝对数

Page 452: 应 用 统 计

利用指数体系进行因素分析,一般是采用连锁替代法。

Page 453: 应 用 统 计

所谓连锁替代法,就是在被分析指标的因素结合式中,根据各因素的性质和相互联系的数量关系,将各个因素的基期数字顺次以报告期的数字替代,有多少因素就替代多少次;每次替代后的结果与替代前的结果进行对比,就是被替代因素的变动对被分析指标变动的影响程度;两者之差就是被替代因素的变动对被分析指标变动的影响绝对额。即从相对数和绝对数两方面分析各因素对现象总体的影响。

Page 454: 应 用 统 计

进行因素分析时应注意以下问题:

1 、各因素的排列顺序。 根据各因素之间的相乘关系,确定各因素的合理排列顺序。即先数量指标因素后质量指标因素,先基础因素后派生因素,先内涵因素后外延因素。

2 、注意相邻因素相乘后的经济涵义

Page 455: 应 用 统 计

1 )相对数关系式被分析指标总变动程度等于各因素变动影响程度的连乘积,即:

011

111

001

011

000

001

000

111

cba

cba

cba

cba

cba

cba

cba

cba

Page 456: 应 用 统 计

绝对数关系式:被分析指标总变动绝对额等于各因素变动影响绝对额的总和,即:

)(

)()(

011111

001011000001000111 )(

cbacba

cbacbacbacbacbacba

Page 457: 应 用 统 计

1 、总量指标的因素分析

由于总量指标可以用来表明简单现象,也可以用来表明复杂现象。因此总量指标的因素分析又可分为两因素分析法和多因素分析。

Page 458: 应 用 统 计

(一)两因素分析

两因素的分析,是把现象总量指标变动的指数分解为两个因素个体指数的乘积,分别计算两个因素指标对总量指标影响的相对数和绝对数,从而说明现象变动的方向和程度

Page 459: 应 用 统 计

价值指数 (数量指标) (质量指标)

10

11

00

01

00

11

qp

qp

pq

pq

qp

qp

总变动指数 = 各因素指数的乘积

)()( 101100010011 qpqppqpqqpqp

Page 460: 应 用 统 计

某企业各种商品销售量和价格资料如下商品名称

计量单位

商品销售量 商品价格

基期 报告期 基期 报告期

甲乙丙

件支个

1208001000

10010001200

2.000.4015.0

0.400.6015.0

合计 - — — —

Page 461: 应 用 统 计

商品名称

单位

商品销售量 商品价格 商品销售额(万元)

基期 q0

报告期 q1

基期p0

报告期p1

基期 p0q0

报告期

p1q1

假定

p0q1

甲乙丙

件支个

1208001000

10010001200

2.000.4015.0

0.400.6015.0

240320

15000

400600

18000

200400

18000

合计 — — — — 15560 190001860

0

Page 462: 应 用 统 计

试分析商品销售量的变动和商品价格的变动对商品销售额变动影响的程度和影响的绝对额。(要求:从相对数和绝对数两个方面进行分析)

Page 463: 应 用 统 计

第一步,计算被分析指标总变动指数及分子与分母差额

%qp

qp11.122

15560

19000

00

11 指数:额商品销售

(元)34401556019000011 qpqp

Page 464: 应 用 统 计

第二步,计算各因素指数及分子与分母的差额;

%.pq

pq54119

15560

18600

00

01 商品销售量综合指数:

(元)304015560186000001 pqpq

Page 465: 应 用 统 计

%.qp

qp15102

18600

19000

00

11 综合指数:价格商品销售

(元)40015560186000001 pqpq

Page 466: 应 用 统 计

第三步,影响因素的综合分析

销售额指数 = 销售量指数 ×价格指数

10

11

00

01

00

11

qp

qp

pq

pq

qp

qp

122.11% = 119.54% × 102.15%

Page 467: 应 用 统 计

)()( 101100010011 qpqppqpqqpqp

3440 元 = 3040 元 + 400 元

Page 468: 应 用 统 计

上述计算结果表明:商品销售额报告期比基期增长了 22.11%,增加的绝对额为 3440 元,这是由于商品销售量的变动使商品销售额增长了 19.54%,增加的绝对额为 3040 元;由于商品价格的变动使商品销售额增长了 2.15%,增加的绝对额为 400 元。

Page 469: 应 用 统 计

练习:

Page 470: 应 用 统 计
Page 471: 应 用 统 计
Page 472: 应 用 统 计
Page 473: 应 用 统 计
Page 474: 应 用 统 计

(二)多因素分析

下指数体系,就是三个因素的变动分析 工业净产值指数 = 职工人数指数×劳动生产率指数×净产值占总产值的比重指数

工业产品原材料支出总额指数 = 产量指数 × 单位产品原材料消耗量指数×单位原材料价格指数

产值指数 = 职工人数指数×工人占职工人数比重指数×工人劳动生产率指数

Page 475: 应 用 统 计

对多因素现象的变动分析,应注意以下两个方面的问题:

第一,在因素变动分析中,为了分析某一因素指数的变动影响,需要使其他两个或两个以上的因素同度量固定不变。被固定的因素应固定在哪个时期,必须依据综合指数的编制原则来选定。即在测定数量指标因素的变动影响时应以基期质量指标作为固定因素;而在测定质量指标因素变动时,应以报告期数量指标作为同度量因素。

Page 476: 应 用 统 计

第二,根据现象各因素相互之间的内在联系,正确地确定各因素的替换程序。一般可用下列原则来加以检验:l 、数量指标在前,质量指标在后的原则。如果相邻的两个指标同时都是数量指标或质量指标,则把相对看来属于数量指标的因素放在前面。

Page 477: 应 用 统 计

2 、两个相邻指标相乘,必须具有实际经济意义。例如对工业企业原材料支出总额的因素分析,就要按产量( q)、单位产品原材料消耗量(m)、单位原材料的价格( p)

的顺序排列。只有这样排列,才能保持它们之间彼此适应和相互结合,具有实际经济意义。从下列分析中明显体现出来:

Page 478: 应 用 统 计

原材料支出额=产量 ×单位产品原材料消耗量 ×单位原材料价格上式用字母表示为:

pmqqmp

Page 479: 应 用 统 计

综上所述,根据以上原则,将构成所要分析的总量指标的各个因素按顺序排列,数量指标在前,质量指标在后。分析第一个因素变动对总量指标影响的时候,将后面的各个因素固定在基期;分析第二个因素变动对总量指标影响的时候,则在第一个因素已经替换为报告期的基础上进行,即将分析过的因素固定在报告期,将后面的因素仍然固定在基期;以此类推,直到分析完为止。例如,原材料指出额指数体系为:

Page 480: 应 用 统 计

011

111

001

011

000

001

000

111

pmq

pmq

pmq

pmq

pmq

pmq

pmq

pmq

Page 481: 应 用 统 计

其绝对水平变动存在下列等式关系:

以上是复杂现象总量指标多因素的分析方法,对简单现象总量指标多因素的分析同样适用,只需在此指数体系公式的基础上去掉加总符号(∑)就行了,分析步骤完全相同。

)()()( 011111001011000001

000111

pmqpmqpmqpmqpmqpmq

pmqpmq

Page 482: 应 用 统 计
Page 483: 应 用 统 计
Page 484: 应 用 统 计
Page 485: 应 用 统 计
Page 486: 应 用 统 计

计算结果表明:该企业原材料支出额报告期比基期增长 12.8% ,净增支出额为 11600元。其中由于产品产量增长 18.5% ,使支出额增加 16800元;由于单位产品原材料消耗量增长 0.8% ,使支出额增加 850元;由于原材料价格下跌 5.6% ,使支出额节约 6050元。由此可见,该企业原材料支出额的增长主要是产品产量增加的结果。

Page 487: 应 用 统 计

【练习】【练习】 给出某市场上四种蔬菜销售资料如下:

品种销售额(元)

个体价格指数 (%)基期 计算期

白 菜 880.0 1008 112.5

黄 瓜 448 475 95.0

萝 卜 308 288 90.0

西红柿 403.2 510 125.0

合 计 2039.2 2281 ——

1. 计算四种蔬菜的价格总指数。2. 计算四种蔬菜的销售量总指数。3. 计算销售额总指数,并对其进行因素分析。

00 pq 11 pq 01 pp

Page 488: 应 用 统 计

四、平均指标对比指数

一、平均指标对比指数的分解 (一般了解)

二、平均指标对比指数分解的一般公式 (理解、熟记)

三、对平均指标对比指数的分析 (掌握)

Page 489: 应 用 统 计

预备知识

数量指标编制原则 质量指标编制原则 加权算术平均数表现形式

Page 490: 应 用 统 计

⒈⒈数量指标综合指数的编制:数量指标综合指数的编制:一般采用基期的质量指标作为同度量因素。

00

01

PQ

PQKQ

⒉⒉质量指标综合指数的编制质量指标综合指数的编制::一般采用报告期的数量指标作为同度量因素

10

11

QP

QPK P

Page 491: 应 用 统 计

f

xfx

f

fxx

Page 492: 应 用 统 计

•平均指标对比指数的分解平均指标变动的影响因素

f

fX

f

XfX

各组水平

各组结构

即:总体平均水平同时受各组水平即:总体平均水平同时受各组水平和各组结构两个因素的影响和各组结构两个因素的影响

Page 493: 应 用 统 计

2.平均指标变动因素分析的指数体系 平均指标指数是两个不同时期的加权算术平均数之比。

平均指标变动的因素分析要编制三种平均指标指数:

(数量指标))(各组单位数比重

(质量指标))(各组平均指标)总平均指标

f

f

x

x(

比重又称结构相对数。应是质量指标

Page 494: 应 用 统 计

0

0

0

1

1

1

0

1

fff

f

x

x

x

xK可变

可变构成指数

0

0

0

1

1

1

0

1

fff

f

x

x

x

xK可变

可变构成指数

1

1

0

1

1

1

ffx

ffx

K固定

固定构成指数

1

1

0

1

1

1

ffx

ffx

K固定

固定构成指数

0

0

0

1

1

0

ffx

ffx

K结构

结构变动影响指数

0

0

0

1

1

0

ffx

ffx

K结构

结构变动影响指数

总变动指数

因素

指数 因素指数

Page 495: 应 用 统 计

平均指标变动因素分析的指数体系如下:

0

0

0

1

1

0

1

1

0

1

1

1

0

0

0

1

1

1

ff

x

ff

x

ff

x

ff

x

ff

x

ff

x

0

0

0

1

1

0

1

1

0

1

1

1

0

0

0

1

1

1

ff

x

ff

x

ff

x

ff

x

ff

x

ff

x

相对数形式:

绝对数形式:

0

0

0

1

1

0

1

1

0

1

1

1

0

0

0

1

1

1

ff

xf

fx

ff

xf

fx

ff

xf

fx ___

0

0

0

1

1

0

1

1

0

1

1

1

0

0

0

1

1

1

ff

xf

fx

ff

xf

fx

ff

xf

fx ___

Page 496: 应 用 统 计

【例】【例】根据下述资料,试对总平均工资的变动进行因素分析。根据下述资料,试对总平均工资的变动进行因素分析。

(要求从相对数和绝对数两个方面进行(要求从相对数和绝对数两个方面进行 )

工人类别

工人人数 平均工资(元/人) 商品销售额(万元)

基期f0

报告期f1

基期x0

报告期x1

基期x0 f0

报告期x1 f1

假定 x

0f1

技工

徒工

600

400

630

870

800

400

850

450

48.00

16.00

53.55

39.15

50.4

34.8

合计 1000 1500 — — 64.00 92.70 85.2

Page 497: 应 用 统 计

解:解: 由表中资料计算可得:

报告期报告期总平均工资总平均工资

基期基期总平均工资总平均工资

人)(元 /6181500

7.92

1

11

1

11

1

f

fx

f

fxx

人)(元 /6401000

640

0

00

0

00

0

f

fxf

fxx

人)(元 /5681000

2.85

1

10

1

10

f

fxf

fxxn

Page 498: 应 用 统 计

企业劳动生产率变动影响因素分析指数体系为:

1

1

0

1

1

1

0

0

0

1

1

0

0

0

0

1

1

1

f

fx

f

fx

f

fx

f

fx

f

fx

f

fx

总平均指标的 总平均指标的 总平均指标的可变构成指数 结构影响指数 固定构成指数

Page 499: 应 用 统 计

)()(

)(

0

1

1

0

1

1

1

0

0

1

1

0

0

0

0

1

1

1

f

fx

f

fx

f

fx

f

fx

f

fx

f

fx

Page 500: 应 用 统 计

即:

9656.0640

618

0

00

1

11

0

1

f

fx

f

fx

x

x总平均指标可变指数:

人)(元 /22640618

0

00

1

1101

f

fx

f

fxxx

计算结果表明该企业总平均工资报告期比基期下降了 3.44% ,绝对值减少了 -22元/人。

Page 501: 应 用 统 计

088.1568

618

1

10

1

11

f

fx

f

fx

数:总平均指标固定结构指

人)(元 /50568618

1

10

1

11

f

fx

f

fx

计算结果表明,(假如排除工人数结构的变动影响)由于两类工人工资水平变动影响使该企业总的平均工资报告期比基期提高 8.8% ,绝对值增加 50元/人。

Page 502: 应 用 统 计

8875.0640

568

0

00

1

10

f

fx

f

fx

响指数:总平均指标结构变动影

人)(元 /72640568

0

00

1

10

f

fx

f

fx

计算结果表明,由于工人数结构的变动影响,使该企业总的平均工资报告期比基期下降 11.25% ,绝对值减少 -72元/人。

Page 503: 应 用 统 计

相对数形式:

96.56% = 88.75% × 108.8%

绝对数形式:

-22 (元/人) = 50 (元/人)- 72 (元/人)

Page 504: 应 用 统 计

编制平均指标对比指数时易出现的问题

公式的选择 同度量因素的选择与确认

Page 505: 应 用 统 计

某企业职工人数和劳动生产率资料

车间

职工人数( 人 )

劳动生产率(万元 / 人 )

总产值 (万元 )

1998f0

1999

f1

1998

x0

1999

x1

1998

x0f0

1999

x1f1

X0f1

一车间二车间三车间

200

160

150

240

180

120

4.4

6.2

9.0

4.5

6.4

9.2

880

992

1350

1080

1152

1104

1056

1116

1080

合计 510 540 6.32 6.18 3222 3336 3252

Page 506: 应 用 统 计

解题步骤:1)可变构成指数

2)结构影响指数

3)固定构成指数

4)三指数之间的关系(表达式)文字说明:

相对数

绝对数

相对数

绝对数

相对数

绝对数

Page 507: 应 用 统 计

Thank you very Thank you very muchmuch!!Thank you very Thank you very muchmuch!!

Page 508: 应 用 统 计

第八章 抽样调查

§1 抽样调查的一般问题§2 抽样误差§3 总体指标的推断§4 必要抽样单位数的确定

Page 509: 应 用 统 计

学习目的及要求

1.理解抽样调查的概念、特点作用和几个基本概念2.掌握影响抽样误差的主要因素3.掌握抽样平均误差的计算4.掌握区间估计5.掌握必要抽样数目的确定

Page 510: 应 用 统 计

§1 抽样调查的一般问题

一、抽样调查的概念与作用二、抽样调查的几个基本概念三、抽样调查的组织方式

Page 511: 应 用 统 计

一、抽样调查的概念与作用

抽样调查是根据随机原则从总体中抽取一部分单位进行观察, ,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。

随机原则是指在抽样调查中,使每一个单位被抽中的概率都相等且不等于 0 。

随机抽样的目的是使样本与总体同分布

Page 512: 应 用 统 计

抽样推断的特点

(一)按随机原则抽取样本; (二)由部分推断总体(三)抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制

Page 513: 应 用 统 计

抽样调查的作用

有些事物在测量或试验时有破坏性,不可能进行全面调查。 有些总体从理论上讲可以进行全面调查,但实际上办不到。 和全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活。 在有些情况下,抽样调查的结果比全面调查要准确。

Page 514: 应 用 统 计

用抽样调查的资料修正和补充全面调查资料 抽样调查方法可以用于工业生产过程中的质量控制。 利用抽样推断的方法,可以对于某种总体的假设进行检验,来判断这种假设的真伪,以决定取舍。

Page 515: 应 用 统 计

抽样推断的内容

(一)抽样估计 抽样估计是通过以样本数据对总体某一未知数量特征进行估计的一种统计分析方法。 (二)假设检验 假设检验是根据研究的目的和要求,先对总体某一未知的数量特征作某种假设,然后根据样本数据对这一假设进行检验,以判断假设的真伪的一种统计分析方法。

Page 516: 应 用 统 计

二二二二二二二二二二二二二

(一)全及总体和抽样总体(二)全及指标和抽样指标

Page 517: 应 用 统 计

(一)全及总体和抽样总体

1.全及总体 全及总体又称母体或总体,它是指所要认识的,具有某种共同性质的许多单位的集合体,也就是研究对象的全体。总体单位数一般用“ N”表示

Page 518: 应 用 统 计

变量总体变量总体变量总体变量总体

属性总体属性总体属性总体属性总体

有限总体有限总体有限总体有限总体

有限总体有限总体有限总体有限总体全全及及总总体体

全全及及总总体体

Page 519: 应 用 统 计

2.样本 样本又称子样或总体样本,是从全及总体中抽取并进行观察,代表全及总体的那部分单位的集合体。样本单位数一般用“ n”表示。

n>30 大样本 n<30 小样本

Page 520: 应 用 统 计

样本容量和样本个数1.样本容量 样本容量是指样本所包含的单位数。

2.样本个数 样本个数又称样本可能数目,也就是从一个总体中可能抽取的样本个数。

对于一次抽样调查,总体是唯一确定的,而样本却是不确定的,一个全及总体可能抽出很多个样本总体。

Page 521: 应 用 统 计

(二)全及指标和抽样指标

1. 全及指标:根据总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标称为全及指标。全及指标是总体变量的函数,其数值是确定的、惟一的,因此称为参数。

Page 522: 应 用 统 计

2.抽样指标 : 根据样本各单位标志值或标志属性计算的,反映样本数量特征的综合指标称为抽样指标。样本指标是样本变量的函数,用来估计总体参数,因此也称统计量,其值随着样本的不同而不同,因此统计量是个随机变量。

Page 523: 应 用 统 计

f

fx

n

xx

Pxp

( 1)常用的参数 ( 2)常用统计量

a. 平均数:

成数:

b. 方差:

成数方差:

f

fX

N

XX

f

f

N

XXXX22

2

PX p

)1(2 PPp

f

f

n

xxxx22

2

)1(2 PPp

2.常用的参数和统计量

Page 524: 应 用 统 计

(三)抽样方法和样本可能数目 1. 重复抽样 从 N个单位中每次抽取 1 个,抽取后将其号码记下,再放回,一直抽取 n个单位组成一个样本,这样的抽样方法称为重复抽样。

2. 不重复抽样 从 N个单位中每次抽取 1 个,抽取后不放回,一直抽取 n个单位组成一个样本这样的抽样方法称为不重复抽样。

Page 525: 应 用 统 计

)!(!nN

NAn

N (一)考虑顺序的不重复抽样数目(一)考虑顺序的不重复抽样数目

(二)考虑顺序的重复抽样数目(二)考虑顺序的重复抽样数目

(三)不考虑顺序的不重复抽样数目(三)不考虑顺序的不重复抽样数目

(四)不考虑顺序的重复抽样数目(四)不考虑顺序的重复抽样数目

nn

NNB

)!(!!

nNnN

C n

N

n

nN

n

NCD

1

Page 526: 应 用 统 计

三、几种常用的抽样组织形式

(一)简单随机抽样

(二)等距抽样

(三)类型抽样 (四)整群抽样

Page 527: 应 用 统 计

(一)简单随机抽样1· 1· 简单随机抽样(纯随机抽样)简单随机抽样(纯随机抽样)———— 对总体单位逐一编号,然后按随机原对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本则直接从总体中抽出若干单位构成样本

应用应用 仅适用于规模不大、内部各单位仅适用于规模不大、内部各单位标志值差异较小的总体标志值差异较小的总体

是最简单、最基本、最符合随机原则, 但同时也是抽样误差最大的抽样组织形式 是最简单、最基本、最符合随机原则, 但同时也是抽样误差最大的抽样组织形式

Page 528: 应 用 统 计

(( 二二 ) ) 等距抽样(机械抽样或系统抽样)等距抽样(机械抽样或系统抽样)————将总体单位按某一标志排序,而后按一将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。定的间隔抽取样本单位。

······

随机起点随机起点 半距起点半距起点 对称起点对称起点

(总体单位按某一标志排序)

按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于简单随机抽样简单随机抽样;;按有关标志排队,其抽样效果相当于按有关标志排队,其抽样效果相当于类型抽样类型抽样。。按无关标志排队,其抽样效果相当于按无关标志排队,其抽样效果相当于简单随机抽样简单随机抽样;;按有关标志排队,其抽样效果相当于按有关标志排队,其抽样效果相当于类型抽样类型抽样。。

Page 529: 应 用 统 计

(( 三三 ) ) 类型抽样(分层抽样)类型抽样(分层抽样)

————将总体全部单位分类,形成若干个类型组,将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。然后从各类型中分别抽取样本单位组成样本。

总体N

样本n

等额抽取

等比例抽取

最优抽取

2N2N

kNkN

1N1N

1n1n

2n2n

knkn··· ···能使样本结构更接近于总体结构,提高样本的能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标代表性;能同时推断总体指标和各子总体的指标能使样本结构更接近于总体结构,提高样本的能使样本结构更接近于总体结构,提高样本的代表性;能同时推断总体指标和各子总体的指标代表性;能同时推断总体指标和各子总体的指标

Page 530: 应 用 统 计

((四四 ) ) 整群抽样(集团抽样)整群抽样(集团抽样)—— —— 将总体全部单位分为若干“群”,然后随将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位机抽取一部分“群”,被抽中群体的所有单位构成样本,即对抽中“群”中的所有单位都进构成样本,即对抽中“群”中的所有单位都进行调查。行调查。例:总体群数例:总体群数 R=16 R=16 样本群数样本群数 r=4r=4

hlpd nnnnn

ABC

D

EF

G H I

JK

L

MN

OP

L

H

P

D

样本容量

简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差简单、方便,能节省人力、物力、财简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差力和时间,但其样本代表性可能较差

Page 531: 应 用 统 计

§2 抽样误差

一、抽样误差的概念 二、影响抽样平均误差的因素 三、抽样平均误差

Page 532: 应 用 统 计

一、抽样误差的概念

抽样误差是样本指标和总体指标之间数量上的差别。以数学符号表示:

Xx Pp

Page 533: 应 用 统 计

理解抽样误差可以从两方面着手:

抽样误差是指由于抽样的随机性而产生的那一部分代表性误差,不包括登记性误差。也不包括可能发生的偏差。

Page 534: 应 用 统 计

误差误差

登记性误差登记性误差

代表性误差代表性误差

在调查过程中由于主客观原因引起的登记、在调查过程中由于主客观原因引起的登记、汇总或计算等方面的差错而造成的误差汇总或计算等方面的差错而造成的误差

由于样本结构由于样本结构和总体结构不和总体结构不同,样本总体同,样本总体不能完全代表不能完全代表总体而产成的总体而产成的样本指标与总样本指标与总体指标的误差体指标的误差

偏差偏差

随机误差随机误差

破坏了抽样的随机原则而产破坏了抽样的随机原则而产生的误差生的误差

实际误差实际误差

抽样平均误差抽样平均误差

是样本指标与总体指标的差别是样本指标与总体指标的差别

所有可能出现的样本指标的标准差所有可能出现的样本指标的标准差

遵守随机原遵守随机原则但可能抽则但可能抽到各种不同到各种不同的样本而产的样本而产

生的误差生的误差

Page 535: 应 用 统 计

二、影响抽样平均误差的因素1.总体各单位标志值的差异程度;2.样本的单位数;3.抽样的方法;4.抽样调查的组织形式。

差异越大,抽样误差越大

单位数越多,抽样误差越小

重复抽样的抽样误差比不重复抽样的大

简单随机抽样的抽样误差最大

Page 536: 应 用 统 计

抽样平均误差是反映抽样误差一般水平的指标,其实质是指抽样平均数的标准差,它反映了是指抽样指标与总体指标的平均离差程度,也就是样本指标与总体指标的标准差,通常用 来表示。 x

三、抽样平均误差

Page 537: 应 用 统 计

可以作为衡量抽样指标对于全及指标代表性程度的一个尺度。

是计算抽样指标与全及指标之间变异范围的一个根据。

在组织抽样调查中,也是确定抽样单位数多少的计算依据之一。

Page 538: 应 用 统 计

1. 重复抽样的条件下

nX

x

:抽样平均误差

式中, n为样本容量; 为总体标准差一般况下是末知,可用样本标准差替代 。

x

x

Page 539: 应 用 统 计

np

p

:成数的抽样平均误差

式中, n 为样本容量; 为总体成数标准差一般情

况下是末知,可用样本成数标准差替代 。

p

p

Page 540: 应 用 统 计

2.不重复抽样的条件下

)1()1(

)(:

22

N

n

nN

Nn

nN Xx

Xx

很大时近似为;当抽样平均误差

式中, N 为总体单位数; n 为样本容量;σX2

为总体方差一般情况下是末知,可用样本方差替代σx

2。

;成数的抽样平均误差nP

p

:

式中, N 为总体单位数; n 为样本容量;σP2

为总体成数方差一般情况下是末知,可用样本成数方差替代σp2

)1(2

N

n

nN P

p 很大时近似为当

Page 541: 应 用 统 计

抽样平均数的平均误差例题:

某工厂有 1500 个工人,用简单随机重复抽样的方法抽出 50 个工人作为样本,调查其工资水平资料如下

月平均工资 524

534

540 550 560 580

600 660

工人数 4 6 9 10 8 6 4 3

计算样本平均数和抽样平均误差

Page 542: 应 用 统 计

解:先列表

x f xf524 4 2096 1296 5184

534 6 3204 676 4056

540 9 4860 400 3600

550 10 5500 100 1000

560 8 4480 0 0

580 6 3480 400 2400

600 4 2400 1600 6400

660 3 1980 10000 30000

50 28000 52640

2)( xx fxx 2)(

Page 543: 应 用 统 计

计算平均数即平均工资:

元)(56050

28000

f

xfx

元)(

样本方差 (45.3250

52640)2

f

fxx

元)抽样平均误差 (59.450

45.32

nx

Page 544: 应 用 统 计

抽样成数的平均误差例题:某钢铁厂生产某种钢管,现从该厂某月生产的 500 根产品中抽取一个容量为 100 根的样本。已知一级品率为 60% ,试求样本一级品率的抽样平均误差。解:已知 p=60% 、 n=100 、 N=500

%9.4

100

%601%60)1(

n

ppp

重复抽样下:

%4.4)500

1001(

100

%)601(%60

11

N

n

n

ppp

不重复抽样下:

Page 545: 应 用 统 计

练习:要估计某高校 10000名在校生的近视率,现随机从中抽取 400名,检查有近视眼的学生 320名,试计算样本近视率的抽样平均误差。

解:根据已知条件:% .

nn

p 8080400

3201

1)在重复抽样条件下,样本近视率的抽样平均误差:

%...

nn

PP ppp 2020

400

2080)1( )1(

Page 546: 应 用 统 计

2)在不重复抽样条件下,样本近视率的抽样平均误差:

%96.1)10000

4001

400

2080)1(

1 )(

(

..

N

n

n

ppp

计算结果表明,用样本的近视率来估计总体的近视率其抽样平均误差为 2%左右(即用样本的近视率来估计总体的近视率其误差的绝对值平均说来在 2%左右)。

Page 547: 应 用 统 计

四、抽样极限误差

抽样极限误差是指用绝对值形式表示的样本指标与总体指标偏差可允许的最大范围。即:

Xxx Ppp

。P;p

X;x,为总体成数为样本成数

为总体平均指标为样本平均指标式中

Page 548: 应 用 统 计

上面两式可改写成以下两个不等式,即:

xx xXx )( xx xx ,

为总体平均数的估计区间(置信区间)

pp pPp )( pp pp ,

为总体成数的估计区间(置信区间)

Page 549: 应 用 统 计

例:要估计某乡粮食亩产量和总产量,从该乡 2万亩粮食作物中抽取 400亩,求得其平均亩产量为 400公斤。如果确定抽样极限误差为 5公斤,试估计该乡粮食亩产量和总产量所在的置信区间。

即该乡粮食亩产量的区间落在 400±5公斤的范围内,即在 395~ 405公斤之间。

粮食总产量在 20000×( 400±5)公斤,即在 790~ 810万公斤之间

5400 xx

Page 550: 应 用 统 计

例:要估计某高校 10000名在校生的近视率,现随机从中抽取 400名,计算的近视率为 80%,如果确定允许误差范围为 4%,试估计该高校在校生近视率所在的置信区间。

该校学生近视率的区间落在 80%±4%的范围内,即在 76%~ 84%之间。

%%p x 480

Page 551: 应 用 统 计

五、抽样误差的概率度

基于概率估计要求,抽样极限误差△ x或△p 通常需要以抽样平均误差 μx或 μp为标准单位来衡量。 把抽样极限误差△ x或△ p分别除以 μx或μp得相对数 t,表示误差范围为抽样平均误差的 t 倍。 t是测量抽样估计可靠程度的一个参数,称为抽样误差的概率度。

Page 552: 应 用 统 计

;x

xt

;p

pt

;xx t ;pp t

即,抽样极限误差是抽样平均误差的多少倍。我们把倍数 t称为

抽样误差的概率度

Page 553: 应 用 统 计

六、抽样估计的置信度

抽样估计的置信度就是表明样本指标与总体指标的误差不超过一定范围的概率保证程度,它一般用 F(t) 表示。又称抽样估计的概率保证程度。

Page 554: 应 用 统 计

置信度与概率度的之间关系:

1)(tF

可以通过《正态分布概率表》获得可以通过《正态分布概率表》获得

Page 555: 应 用 统 计

1 、总体平均数抽样估计的置信度

2 、总体成数抽样估计的置信度

)()( tFtXxP xx

)()( tFtxXtxP xx

)()( tFtPpP pp

)()( tFtpPtpP pp

Page 556: 应 用 统 计

§3 全及指标的推断

一、总体参数的点估计二、总体参数的区间估计

Page 557: 应 用 统 计

一、总体参数的点估计

(一)参数点估计的基本特点(二)抽样估计的优良标准

Page 558: 应 用 统 计

(一)参数点估计的基本特点

基本特点: 根据总体指标的结构形式设计样本指标作为总体参数的估计量,并以样本指标的实际值直接作为相应总体参数的估计值。

例如,样本平均值代表总体平均数;以抽样调查所获得的人口结构代表总体的人口结构等。

Page 559: 应 用 统 计

(二)抽样估计的优良标准

1.无偏性 作为总体参数估计量的样本统计量,要求其期望值(平均数)等于被估计的总体参数。这样的估计量称为无偏估计量。 2.有效性 以抽样指标估计总体指标要求作为优良估计量的方差应比其它估计量的方差小。 3.一致性 作为优良估计量的样本容量充分大时,抽样指标也应充分地靠近总体指标。

即方差越小的估计量就越有效

一般情况下均可满足

Page 560: 应 用 统 计

二、总体参数的区间估计

(一)区间估计的基本特点及要素(二)总体平均数 ( 成数 ) 的区间估计

Page 561: 应 用 统 计

(一)区间估计的基本特点及要素

1.区间估计的基本特点 根据给定的概率保证度,利用实际抽样资料,指出总体参数可能存在的区间范围。这个区间称为置信区间。

2.区间估计必须具备的三个要素 ( 1)估计值 ( 2)抽样误差范围 ( 3)概率保证程度

Page 562: 应 用 统 计

(二)总体平均数 (成数 )的区间估计

xx

xx

xxX

xXx

,或

,表表达达式式

表表达达式式 其中, 为极限误差xx tμΔ

成成数数成成数数

pp

pp

ppP

pPp

,或

其中, 为极限误差pp t

Page 563: 应 用 统 计

(二)总体平均数 ( 成数 ) 的区间估计

1. 计算抽样平均数和标准差:

或抽样成数平均数和成数标准差:

简单随机抽样下的一般步骤

2 . 计算平均误差:

5 . 结果

3 . 计算极限误差:

4 . 计算区间的上下限:

如:可以在如:可以在 1-α1-α 的概率的概率保证程度下,估计保证程度下,估计 ************** 在在 ****~~ ****之间。之间。

如果给定的是概率度,如果给定的是概率度,则可查《正态分布概则可查《正态分布概

率表》获得。率表》获得。

这是上面所计这是上面所计算的上下限算的上下限

Page 564: 应 用 统 计

练习:某制造厂的产品重量服从正态分布,其总体标准差 σ= 15千克,平均重量未知。现随机抽取一个 n=250 的样本,计算结果是 = 65千克。以 95%的置信度估计总体平均重量的置信区间。 解:本题已知条件为:样本容量 n=250 , X~

N(65 , 15) ;置信水平为 95%;查正态概率双侧临界值表有: t=1.96

x

Page 565: 应 用 统 计

9487.08114.15

152

nx

Δx= tμx=1.96×0.9487=1.86则, 65- 1.86≤ X ≤65+1.86

即 95% 的估计区间为: 63.14≤ X ≤66.86

计算结果说明,我们有 95%的把握程度认为总体平均数介于 63.14千克到 66.86千克之间。

Page 566: 应 用 统 计

从某厂生产的 5000只灯泡中,随机重复抽取 100只,对其使用寿命进行调查,调查结果如表

使用寿命(小时)

组中值x

产品数量

fx f

3000以下3000 — 40004000 — 5000

5000以上

2500350045005500

2305018

500010500022500099000

-1480-8401601160

6771200211680001280000

24220800

合 计 — 100 434000 — 53440000

)( xx fxx 2)(

Page 567: 应 用 统 计

又该厂质量规定使用寿命在 3000小时以下为

不合格品。( 1)按重复抽样方法,以 95 、 45% 的概率保证程度估计该批灯泡的平均使用寿命;( 2)按重复抽样方法,以 68 、 27% 的置信度估计该批灯泡的合格率。

Page 568: 应 用 统 计

练习 2:对某批成品按重复抽样方法抽选200件检查,其中废品 8件,又知样本容量为成品总量的 (1/ 20) 。以 95%的把握程度估计该批成品的废品率范围。 练习 3:从全校近万名学生中,随机抽取 100名学生测得其平均身高 160厘米。根据以往经验学生身高的标准差为 3厘米,现要求以最大不超过 0.6厘米的允许误差,来推断全体学生的平均身高。

Page 569: 应 用 统 计

§4 必要抽样数目的确定一、确定适当样本容量的意义

1.1. 在一定的误差允许下,样本在一定的误差允许下,样本容量太大,则会增大工作量,容量太大,则会增大工作量,造成人力、财力和时间的浪费。造成人力、财力和时间的浪费。

2.2.如查改变了对误差的要求,如查改变了对误差的要求,则可以通过增减样本容量来控则可以通过增减样本容量来控

制抽样误差的大小。制抽样误差的大小。

Page 570: 应 用 统 计

确定抽样单位数的依据:1 、决定于调查者对一项抽样推断的可靠程度和精确程度的要求。

2 、决定于总体标志的变异程度。3 、决定于不同的抽样组织方法。4 、还要结合调查的人、财、物的许可情况加以适当调整,然后作出最后的确定。

Page 571: 应 用 统 计

(二)简单随机抽样下样本容量的确定

1.1. 对于重复抽样:对于重复抽样:

n

2.2. 对于不重复抽样:对于不重复抽样:

2

22

tn

由于由于 222

22

tN

Ntn

x )1(

2

N

n

nx

由于由于

Page 572: 应 用 统 计

Thank you very Thank you very muchmuch!!Thank you very Thank you very muchmuch!!

Page 573: 应 用 统 计

第九章 相关与回归分析

§1 相关分析的一般问题§2 相关关系的判断§3 回归分析的一般问题§4 回归模型的建立与检测

Page 574: 应 用 统 计

学习目的及要求

1.了解相关关系的概念与特点、种类及测定方法2.了解回归分析的概念与特点3.掌握直线回归方程的求解及估计标准误的计算

Page 575: 应 用 统 计

§1 相关分析的一般问题

一、相关关系的概念与特点二、相关关系的种类三、相关分析的内容

Page 576: 应 用 统 计

一、相关关系的概念与特点

客观现象之间的数量联系存在着两种不同的类型:函数关系和相关关系。

函数关系:变量之间存在着确定的严格依存的关系,即当一个或一组变量每取一个值时,相应的另一个变量必然有一个确定值与之对应 。

Page 577: 应 用 统 计

(( 11 ) 某种商品的销售额) 某种商品的销售额 ((yy)) 与销售与销售量量 ((xx)) 之间的关系可表示为之间的关系可表示为

y y = = p x p x ((p p 为单价为单价 ))(( 22 )圆的面积)圆的面积 (S)(S) 与半径之间的关系与半径之间的关系可表示为可表示为 S S = = R R22

例如例如

Page 578: 应 用 统 计

相关关系:变量之间存在有依存关系,但这种关系是不完全确定的随机关系,即当一个或一组变量每取一个值时,相应的另一个变量可能有多个不同值与之对应 。

Page 579: 应 用 统 计

商品的消费量商品的消费量 ((yy)) 与居民收入与居民收入 ((xx))之间的关系之间的关系商品销售额商品销售额 ((yy)) 与广告费支出与广告费支出 ((xx))之间的关系之间的关系粮食亩产量粮食亩产量 ((yy)) 与施肥量与施肥量 ((xx11) ) 、降雨量、降雨量 ((xx22) ) 、温度、温度 ((xx33))之间的关系之间的关系收入水平收入水平 ((yy)) 与受教育程度与受教育程度 ((xx))之间的关系之间的关系父亲身高父亲身高 ((yy)) 与子女身高与子女身高 ((xx))之间的关系之间的关系

例:例:

Page 580: 应 用 统 计

相关关系的主要特点

相关关系表现为数量相互依存关系。 相关关系在数量上表现为非确定性的相互依存关系。

Page 581: 应 用 统 计

二、 相关关系的种类

1.按相关的程度分:完全相关

不完全相关不相关

2. 按相关的方向分: 正相关负相关

3. 按相关的形式分:线性相关

非线性相关

1.按相关的程度分:完全相关

不完全相关不相关

2. 按相关的方向分: 正相关负相关

3. 按相关的形式分:线性相关

非线性相关

1.按相关的程度分:完全相关

不完全相关不相关

2. 按相关的方向分: 正相关负相关

3. 按相关的形式分:线性相关

非线性相关

Page 582: 应 用 统 计

不相关不相关不相关不相关

负线性相关负线性相关负线性相关负线性相关

正线性相关正线性相关正线性相关正线性相关

非线性相关非线性相关非线性相关非线性相关

完全负线性相关完全负线性相关完全负线性相关完全负线性相关完全正线性相关完全正线性相关完全正线性相关完全正线性相关

图示

Page 583: 应 用 统 计

三、相关分析的内容

确定现象之间有无关系,以及相关关系的表现形式。

确定相关关系的密切程度 选择合适的数学模型 测定变量估计值的可靠程度 对计算出的相关系数,进行显著检验

Page 584: 应 用 统 计

§2 相关关系的判断

一、相关关系的一般判断 二、相关系数

Page 585: 应 用 统 计

一、相关关系的一般判断

定性分析 相关表和相关图是研究相关关系的直观工具,在进行详细的定量分析之前,可以先利用它们对现象之间存在的相关关系的方向、形式、和密切程度作大致的判断。

Page 586: 应 用 统 计

相关表:将变量各样本值按从小到大的顺序一一对应的列在一个表格里,就构成了一个简单相关表。

消费支出y

15 20 30

40 42 53 60 65 78 70

可支配收入x

18 25 45

60 62 75 88 92 98 99

居民消费和收入的相关表 单位:百元

Page 587: 应 用 统 计

相关图:又称散点图,它是将两个变量相对应的变量值用坐标点的形式,在直角坐标上描绘出来,以反映二者之间相关关系的图形。

0

20

40

60

80

0 20 40 60 80 100

X

Y

相关图

Page 588: 应 用 统 计

二、相关系数

(一)相关系数的含义 相关系数:是度量两个变量之间线性相关密切程度和相关方向的统计指标。 相关系数又称 Pearson 相关系数,或积差相关系数。 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为 若是根据样本数据计算的,则称为样本相关系数,记为 r

Page 589: 应 用 统 计

样本相关系数的计算公式

yyxx

xy

LL

L

yyxx

yyxxr

22 )()(

))((

yyxx

xy

LL

L

yyxx

yyxxr

22 )()(

))((

(二)相关系数的计算公式(二)相关系数的计算公式

yxn

xyyyxxL

yn

yyyL

xn

xxxL

xy

yy

xx

1

1

1

222

222式中:

( 1 )

Page 590: 应 用 统 计

(( 11 )式可化简为如下公式:)式可化简为如下公式:

2222

yynxxn

yxxynr

2222

yynxxn

yxxynr

Page 591: 应 用 统 计

1. r 的取值范围是 [-1,1]

|r|=1 ,为完全相关r =1 ,为完全正相关r =-1 ,为完全负相关

相关系数的密切程度相关系数的密切程度

Page 592: 应 用 统 计

2. r = 0 ,不存在线性关系

3. -1r<0 ,为负相关

4. 0<r1 ,为正相关

5. |r|越趋于 1 表示关系越密切; |r|越趋于 0 表示关系越不密切

Page 593: 应 用 统 计

-1.0-1.0 +1.0+1.000-0.5-0.5 +0.5+0.5

完全负相关完全负相关 无线性相关无线性相关 完全正相关完全正相关

负相关程度增加负相关程度增加rr正相关程度增加正相关程度增加

Page 594: 应 用 统 计

例:例:计算前例中人均可支配收入和消费支出之间计算前例中人均可支配收入和消费支出之间的简单相关系数。的简单相关系数。

消费支出(百元)y

人均可支配收入(百元)x

y2 x2 xy

15 18 225 324 27020 25 400 625 50030 45 900 2025 135040 60 1600 3600 240042 62 1764 3844 260453 75 2809 5625 397560 88 3600 7744 528065 92 4225 8464 598078 98 6084 9604 764470 99 4900 9801 6930473 662 26507 51656 36933

Page 595: 应 用 统 计

解:由表中数据得:

∑y = 473 , ∑ x = 662 , ∑ y2 = 26507 ,∑x2 = 51656 ,∑ xy = 36933 , n=10

计算得人均可支配收入和消费支出间的简单相关系数为:

9878.0

47326507106625165610

473662369331022

2222

yynxxn

yxxynr

9878.0

47326507106625165610

473662369331022

2222

yynxxn

yxxynr

Page 596: 应 用 统 计

§3 回归分析的一般问题

一、回归分析的概念与特点二、回归分析的内容三、相关分析与回归分析的区别与联系

Page 597: 应 用 统 计

一、回归分析的概念与特点

回归分析就是根据一组样本数据,确定一个数学关系式,以反映变量之间的相关关系。

利用所求的关系式,可以根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。

Page 598: 应 用 统 计

回归分析的特点

1 、用于回归分析的两个变量不是对等的关系,必须依据研究目的,确定哪个是自变量x ,哪个是因变量 y;2 、用于回归分析的两个变量中,自变量 x是

可控制变量(即它是非随机变量),因变量y

是随机变量;

Page 599: 应 用 统 计

3 、回归分析的作用在于给出自变量 x 的数值来估计因变量 y的可能值;

4 、对于没有明显因果关系的两个变量 x与 y,可求出两个回归方程,计算出两个回归系数;

5 、直线回归方程的回归系数有正负号,说明变量变动的方向。

Page 600: 应 用 统 计

确定现象之间相关关系的数学模型 测定数学模型的拟合精度

二、回归分析的内容

Page 601: 应 用 统 计

回归分析和相关分析的区别:

1. 相关分析中,变量 x 变量 y 处于平等的地位;回

归分析中,变量 y 称为因变量,处在被解释的地位, x 称为自变量,用于预测因变量的变化。2. 相关分析中所涉及的变量 x 和 y 都是随机变量;回归分析中,因变量 y 是随机变量,自变量 x 可

以是随机变量,也可以是非随机的确定变量。

Page 602: 应 用 统 计

3. 相关分析主要是描述两个变量之间线性关系的密切程度;回归分析不仅可以揭示变量 x 对变量 y 的影响大小,还可以由

回归方程进行预测和控制。

Page 603: 应 用 统 计

§4 回归模型的建立与检测

一、一元线性回归模型二、估计标准误差三、应用相关分析与回归分析应注意的问题

Page 604: 应 用 统 计

回归分析的种类:

1. 按自变量的个数的个数分:一元回归多元回归

2. 按回归方程的形式分: 线性回归非线性回归

本节主要介绍一元线性回归

Page 605: 应 用 统 计

一、一元线性回归模型

对于具有线性相关关系的两个变量,可以用一个线性方程来表示它们之间的关系,这个线性方程称回归模型。

Page 606: 应 用 统 计

配合直线方程的前提条件

1 、两个变量之间确实存在数量上的相互依存关系2 、两种变量之间确实存在着直线相关关系3 、具备一定数量的变量观测值

Page 607: 应 用 统 计

(二)确定直线回归方程

当两变量 x 、 y 之间存在直线相关关系时,可以用直线方程近似代替 x 与y的关系:

bxayc

Page 608: 应 用 统 计

方程中的参数 a 是回归直线的起点值,表现为当时回归直线的 y坐标,即 y轴上的一个点,数学上叫截距。

参数 b 是回归直线的斜率,即回归系数。它代表自变量 x 每增加一个单位时,因变量 y的平均增加值。

Page 609: 应 用 统 计

a 和 b 数值确定了,直线回归方程也就确定了。确定 a 、 b的数值可用最小平方法,原理如下:

Page 610: 应 用 统 计
Page 611: 应 用 统 计
Page 612: 应 用 统 计
Page 613: 应 用 统 计

回归方程的作用根据回归方程可以推算出已知值的估计值,以便估计误差。例如利用回归方程推求,工龄为 8年时,其日产量为

(件)

即约为 73件。不仅可以推出已知的估计值。而且可以利用回归方程预测未知的值,如当工龄为 3年时,其日产量估计值约为 50件。

763.728763.4659.34

Page 614: 应 用 统 计

二、估计标准误差 回归直线是在直线相关条件下,反映两个变量之间一般数量关系的平均线。根据直线回归方程,我们知道了自变量的数值,就可以推算出因变量的数值。但是,推算出来的因变量数值并不是精确的数值,它是一个估计值和实际值有出入。

Page 615: 应 用 统 计

(一)估计标准误差的概念与计算估计标准误差是用来说明回归直线方程代表性大小的统计分析指标。计算公式

n

yyS c

y

2

Page 616: 应 用 统 计

从计算公式可以看出,计算的结果实际上也是个平均误差。但不是简单平均的,而是经过乘方、平均、再开方的过程,这和标准差的计算过程一样。它的作用是说明估计的准确程度,所以叫做估计标准误差,也叫做估计标准差或回归标准差。

Page 617: 应 用 统 计

首先要设计一张计算表,形式如表计算表左边三列是原始资料, 是根据直线回归方程推算出来的因变量估计值。根据 y和 可以计算出后两栏材料并加以合计。

cy

cy

Page 618: 应 用 统 计

将计算结果代入公式即得:

)(89.1

212

87.35

2

2

n

yyS c

y

Page 619: 应 用 统 计
Page 620: 应 用 统 计

如果已经有了直线回归方程的参数值,可用一个比较简单的计算公式,即:

30

302

2

2

nn

xybyayS

nn

xybyayS

y

y

Page 621: 应 用 统 计

将表中的相应数据和所得 a、 b的值代入公式,则 :

89.110

897.35

212

5893763.4816659.3456386

2

2

n

xybyayS y

Page 622: 应 用 统 计

估计标准误差的作用(一)说明以回归直线为中心的所有相关点的离散程度。

(二)说明回归直线的代表性大小。 (三)估计标准误差的第三个作用是在抽样调查条件下,是计算回归抽样误差的一个根据。

Page 623: 应 用 统 计

回归误差与相关系数的关系

回归误差与相关系数,都具有说明现象之间的相关关系密切程度的作用。

相关关系与说明的现象之间的密切程度成正比关系,而回归误差概念比较明确,回归误差用绝对数表示,它所说明的密切程度并不那么明显,也不能说明是正相关还是负相关。

Page 624: 应 用 统 计
Page 625: 应 用 统 计
Page 626: 应 用 统 计

相关系数和估计标准差在数值的大小上表现为相反的关系。

(一) r值越大, 越小。 r 值越大,说明相关程度越密切,这时 越小,也就是相关点距离回归直线比较近。当 r 值大到时,即完全相关时,则 ,即估计标准误差等于 0 。从相关图上看,就是说所有的相关点全在回归直线上,这也就是完全相关。

yS

yS

0111 2 yyy rS

Page 627: 应 用 统 计

(二) r值越小,则 值越大。 r值越小,说明相关程度不密切,这时 值越大。从相关图上看,也就是相关点距离回归直线比较远。当 r=0时,即不相关时,则估计标准差 ,即估计标准差等于 y数列标准差,这说明相关点与回归直线的距离和相关点与 y数列的平均线的距离一样,也就是回归直线和 y数列的平均线是同一条直线。

yS

yS

yyy rS 1

Page 628: 应 用 统 计

三、应用相关分析与回归分析应注意的问题

注意定性分析与定量分析的结合 注意客观现象值的规定性 注意社会经济现象的复杂性 注意对相关系数和回归直线方程有效性进行检验

Page 629: 应 用 统 计

已知回归方程 n=40 , , , 试计算估计标准误差。

计算及说明:估计标准误差的计算公式为:

将已知数据代入公式有:

460y 7800xy

86522y

2

2

n

xybyayS y

2240

78005.0460108652

yS

Page 630: 应 用 统 计

练习 当所有的观察值都落在直线上时,则与之间的相关系数为( )。

A 、 r=0 B 、 r=1 C 、 -1<r<1 D 、 0<r<1 已知:工资(元)倚劳动生产率(千元)的回归方程为,因此,当劳动生率每增长 1千元,工资就平均增加 元。

xyc 8010

Page 631: 应 用 统 计

Thank you very Thank you very muchmuch!!Thank you very Thank you very muchmuch!!

Page 632: 应 用 统 计

第十章 统计预测

§1 统计预测概述§2 几种常用的简单模型预测§3 长期趋势模型预测§4 回归模型预测§5 统计预测误差分析

Page 633: 应 用 统 计

学习目的及要求

1.了解统计预测的概念、特点和种类2.了解一些常用的预测方法3.掌握长期趋势模型预测法中的参数估计

Page 634: 应 用 统 计

§1 统计预测概述

所谓预测就是根据过去和现在的已知信息及现象之间的相互联系,对所研究事物的未来状态做出的科学预计和推测。 统计预测是根据有关的统计理论,利用统计方法,对尚未发生或已经发生而不为人们所知的社会经济现象的特征和表现做出判断和预见。

Page 635: 应 用 统 计

统计预测的特点

1 、统计预测属于一种定量预测。2 、统计预测的基本特征是运用统计方法,建立数学模型。3 、统计预测的准确性可以通过预测误差来进行检验和控制。

Page 636: 应 用 统 计

二、统计预测的种类

1.按预测方法分:定性预测

定量预测

2. 按预测对象分:宏观预测

微观预测

3. 按预测的性质分: 趋势预测

回归预测

Page 637: 应 用 统 计

连续性原则 类比性原则 概率性原则

三、统计预测的基本原则

Page 638: 应 用 统 计

确定预测目标 搜集统计资料 加工整理资料 构建预测模型 估计模型参数,进行预测 分析预测误差,改进预测

四、统计预测的基本程序

Page 639: 应 用 统 计

§2 几种常用的简单模型预测

一、进度预测法二、比例预测法三、简单序时平均预测法四、移动平均数预测法五、增长量和平均增长量预测法六、增长速度和平均增长速度预测法

Page 640: 应 用 统 计

§3 长期趋势模型预测

一、最小平方法二、取点法

Page 641: 应 用 统 计

§4 回归模型预测

一、一元线性回归模型预测二、多元回归预测三、回归预测应注意的问题

Page 642: 应 用 统 计

§5 统计预测误差分析

一、分析预测误差的意义二、影响预测准确度的主要因素三、预测准确度的测量四、统计预测误差的计算

Page 643: 应 用 统 计

一、分析预测误差的意义

可以认识预测结果的准确性,为编制计划、进行决策提供可靠的依据

有利于改进预测工作,发展和完善预测理论

Page 644: 应 用 统 计

二、影响预测准确度的主要因素

模型的科学性 数据资料的可靠性 统计方法的正确性 主观判断的准确性

Page 645: 应 用 统 计

Thank you very Thank you very muchmuch!!Thank you very Thank you very muchmuch!!

Page 646: 应 用 统 计

第十一章 统计综合分析

§1 统计综合分析的概念、任务和形式§2 统计综合分析的一般原则、程序和方法§3 统计比较§4 综合评价§5 统计分析报告

Page 647: 应 用 统 计

学习目的及要求

1.了解统计综合分析的概念、特点2.理解统计综合分析的原理3.了解统计比较、综合评价的基本方法4.掌握统计分析报告的编写

Page 648: 应 用 统 计

§1统计综合分析的概念、任务和形式

统计综合分析是根据分析研究目的,在相关科学理论的正确指导下运用统计方法、以统计资料为依据、结合具体情况、定性与定量分析相结合,对客观事物进行科学分析和综合研究。

Page 649: 应 用 统 计

统计综合分析的特点

1 、以统计数据为基础,定量与定性分析相结合2 、统计综合分析的目的在于提出办法解决问题3 、综合运用多种分析方法

Page 650: 应 用 统 计

二、统计综合分析的任务

综合分析研究国民经济和社会发展的现状 综合分析研究社会经济发展的历史资料,研究其规律性问题 在国民经济和社会经济现状与发展变化规律性问题分析的基础上,进行预测分析 综合分析研究社会经济发展及其他某些专门问题

Page 651: 应 用 统 计

专题性分析 总结性分析 进度性分析 预测决策性分析

三、统计综合分析的形式

Page 652: 应 用 统 计

§2统计综合分析的一般原则、程序和方法

一、统计综合分析的一般原则 必须坚持四项基本原则 必须坚持从实际出发,以全面、发展的观点进行分析研究

必须坚持定性和定量相结合 必须在一般与具体的结合中进行分析研究

Page 653: 应 用 统 计

二、统计综合分析的一般程序

选择并确定研究课题 设计研究的课题 采集、积累与鉴别资料 运用各种方法进行系统周密的分析 得出结论,提出建议 根据分析结果形成分析报告

Page 654: 应 用 统 计

三、统计综合分析一般方法概述

多层次、多方法的综合运用 问题与方法的交错性质与量的结合

Page 655: 应 用 统 计

§3 统计比较

一、统计比较的概念和作用 所谓统计比较是将统计指标所反映的实际数量状况与有关标准进行对照,计算出数量上的差别和变化,进而作出评价和判断的思维过程。

Page 656: 应 用 统 计

可以更深入、更明确地认识事物 可以进行监督查检,深入分析原因,找出解决办法

可以发挥更大、更广泛的促进作用

统计比较的特点

Page 657: 应 用 统 计

二、统计比较的种类

静态比较和动态比较 相比比较和相差比较 单项比较和综合比较

Page 658: 应 用 统 计

三、统计比较标准

经验数据标准 理论数据标准时间数据标准空间数据标准 计划或政策规定数据标准

Page 659: 应 用 统 计

四、统计比较具体规则

统计比较事物的联系性 统计比较指标含义的一致性 统计比较时间限制的一致性 统计比较空间范围的一致性 统计比较指标的计算方法的一致性 统计比较指标的计量单位的一致性

Page 660: 应 用 统 计

五、统计比较主要指标

相比比较指标 相差比较指标

Page 661: 应 用 统 计

§4 综合评价

一、综合评价概述二、综合评价的步骤三、评价指标体系的确定四、综合评价的主要方法

Page 662: 应 用 统 计

§5 统计分析报告

统计分析报告就是对统计分析成果进行科学表述的文章 。 特点1. 以统计数据为主体2. 以科学的指标体系和统计方法来研究3. 具有独特的表达方式和结构特点

Page 663: 应 用 统 计

二、统计分析报告的质量要求

四性

1. 准确性2. 针对性3. 时效性4. 逻辑性

三求

1. 求实2. 求新3. 求深

Page 664: 应 用 统 计

三、统计分析报告编写格式及要求

标题要确切、简明、有吸引力 开头要简短、精悍、形式新 主题要突出、正确、鲜明、集中正文要严谨、分明、清晰 结尾要自然完满、简短有力

Page 665: 应 用 统 计

四、统计分析报告的表达

表达方式 -叙述、说明、议论语言运用 数字表达

Page 666: 应 用 统 计

Thank you very Thank you very muchmuch!!Thank you very Thank you very muchmuch!!