28
第 15 第 第第第第 15.1 第第第第第第第第第第第第第第第 15.2 第第第第第第第第第第第第第第第

第 15 章 综合应用

  • Upload
    carina

  • View
    83

  • Download
    0

Embed Size (px)

DESCRIPTION

第 15 章 综合应用. 15.1 回归分析在钢铁质量管理中的应用 15.2 时间序列分析在股票市场中的应用. 15.1 回归分析在钢铁质量管理中的应用. - PowerPoint PPT Presentation

Citation preview

Page 1: 第 15 章 综合应用

第 15 章 综合应用

15.1 回归分析在钢铁质量管理中的应用

15.2 时间序列分析在股票市场中的应用

Page 2: 第 15 章 综合应用

从某钢铁集团公司钢研所获得一些钢铁冶炼的实测数据( Fedata.sav )。影响合金钢力学性能的因素很多 , 如果将所有的影响都加以考虑 , 则不仅使得计算工作量极为庞大 , 而且也使得回归模型极为复杂 , 算法可能也会难以运行。因此 , 必须对这些因素进行分析处理 , 突出其中的主要因素 , 忽略次要因素 ,以尽量得到较优的回归模型。这里,研究 C 、 Si 、Mn 、 P 、 S 、 Al 、 Ni 、 Cr 、 Cu 、 Mo 、 As11中元素对钢铁厚度、屈服、抗拉和延伸性能的影响。

15.1 回归分析在钢铁质量管理中的应用

CC

Page 3: 第 15 章 综合应用

15.1.1 数据预处理● 处理缺失数据如果样本量比较大,针对 X 缺失较多, Y 缺失较少的情况,删除缺失 Y 的行,对缺失 X 的地方用该列的均值填补。● 剔除异常值 在多种剔除异常值的方法中,这里选择的是常用的 3sigma 原理对异常值进行了剔除。最后,编程载入数据。通过比较,发现数据不作处理会有更好的实际意义。● 数据变换对以上处理后的数据进行正态性检验,并对没有通过检验的数据进行 BOX-COX 变换,以满足利用数据进行回归建模的要求。● 工艺制度的影响 根据炼钢工艺、轧钢工艺的不同,对数据进行分组处理,如炼钢工艺中的断面、轧钢工艺中所采用的不同热处理工艺。区分后的数据组采用用于程序处理。

Page 4: 第 15 章 综合应用

15.1.2 逐步回归这里,仅对抗拉性能针对 11 种元素做逐步回归,其余三种性能的做法和此方法类似。 SPSS 演示步骤如下:1. 启动 SPSS 软件,打开选用数据,如图 15.1 ;

Page 5: 第 15 章 综合应用

2. 单击【分析】、【回归】、【线性】得到如图 15.2 所示的“线性回归”窗口;

图 15.2 线性回归

Page 6: 第 15 章 综合应用

3. 将因变量和自变量分别选入,见图 15.3 ;

图 15.3 选入变量图

Page 7: 第 15 章 综合应用

4. 分别点击“统计量”、“绘制”、“选项”选项卡,按图 15.4 、 15.5 、 15.6 所示选中选项;

图 15.5 统计量选项卡

Page 8: 第 15 章 综合应用

图 15.5 统计量选项卡

Page 9: 第 15 章 综合应用

图 15.6 选项选项卡

Page 10: 第 15 章 综合应用

所得结果如下:

表 15-1输入/移去的变量 a

模型 输入的变量 移去的变量 方法

1 C . 步进(准则 : F-to-enter 的概率 <= .050, F-to-remove 的概 率 >= .100)。

2 SI . 步进(准则 : F-to-enter 的概率 <= .050, F-to-remove 的概 率 >= .100)。

3 CR . 步进(准则 : F-to-enter 的概率 <= .050, F-to-remove 的概 率 >= .100)。

a. 因变量 : 抗拉

Page 11: 第 15 章 综合应用

表 15-2模型汇总 d

模型 R R 方 调整 R 方 标准估计的误差

1 .792a .627 .618 32.134

2 .762b .581 .579 29.984

3 .796c .581 .579 28.819

a. 预测变量 : (常量 ), C。b. 预测变量 : (常量 ), C, SI。c. 预测变量 : (常量 ), C, SI, CR。d. 因变量 : 抗拉

Page 12: 第 15 章 综合应用

表 15-3 方差分析表 d

模型 平方和 df 均方 F Sig.

1 回归 85620.349 1 85620.349 82.918 .000a

残差 159018.593 154 1032.588

总计 244638.942 155

2 回归 107089.718 2 53544.859 59.560 .000b

残差 137549.224 153 899.015

总计 244638.942 155

3 回归 118396.703 3 39465.568 47.518 .000c

残差 126242.239 152 830.541

总计 244638.942 155

a. 预测变量 : (常量 ), C。b. 预测变量 : (常量 ), C, SI。c. 预测变量 : (常量 ), C, SI, CR。d. 因变量 : 抗拉

Page 13: 第 15 章 综合应用

表 15-5 案例诊断 a

案例数目 标准残差 抗拉 预测值 残差

39 4.227 655 533.17 121.829

143 4.094 695 577.01 117.987

a. 因变量 : 抗拉

表 15-5 残差统计量 a

极小值 极大值 均值 标准偏差 N

预测值 457.44 577.01 510.48 27.638 156

残差 -57.236 121.829 .000 28.539 156

标准预测值 -1.919 2.407 .000 1.000 156

标准残差 -1.986 4.227 .000 .990 156

a. 因变量 : 抗拉

Page 14: 第 15 章 综合应用

图 15.7 抗拉回归标准化残差直方图

图 15.8 标准化残差 P-P图

Page 15: 第 15 章 综合应用

图 15.9 抗拉预计值散点图

Page 16: 第 15 章 综合应用

经过对上述结果的分析,剔除了对抗拉影响不显著的 Mn 、 P 、 S 等 8 中元素的影响,得到如下的回归方程:.

从回归方程可知, C 、 Si 、 Cr 对抗拉都存在正向的影响,其中对抗拉的影响程度较大,影响系数是 12.505 ,对抗拉的影响较小,为 0.207 。

55.177 2.022 0.821 0.05631.701 12.505 4.256 0.207C Si Cr 抗拉

Page 17: 第 15 章 综合应用

15.2 时间序列分析在股票市场中的应用

本节使用 SPSS 软件对股市加以研究。首先,可以获取上证指数 1998 年 1 月至 2011 年 12 月的周度数据 (http://finance.sina.com.cn/) ,见股市数据 .xls 。

1. 画出序列趋势图: ⅰ 启动 SPSS 软件,在数据编辑器中输入数据; ⅱ 在工具栏中分别点击【分析】、【预测】、【序

列图】,得到时间序列图窗口,如图 15.1 所示;

Page 18: 第 15 章 综合应用

图 15.1 序列趋势图操作演示图

Page 19: 第 15 章 综合应用

ⅲ 将时间序列图窗口中两个变量日期、收盘价格分别选入自变量、因变量,单击确定,即可得到序列趋势图 15.2 。

图 15.2 收盘价格序列趋势图

Page 20: 第 15 章 综合应用

从图 15.2 中,可以看出,序列没有明显的季节成分,但存在一个明显的变化,因此没有必要做季节分解。

Page 21: 第 15 章 综合应用

2. 绘制序列的自相关图和偏自相关图首先画出股票序列的自相关图和偏自相关图,如图

15.3 所示。

图 15.3 股票序列的自相关图和偏自相关图

Page 22: 第 15 章 综合应用

从图中不难看出,序列的 acf 和 pacf 图都是拖尾的,说明序列是非平稳的。众所周知,股票数据序列通常都不是平稳序列,但其一阶差分数据是平稳的,因此可以做进一步分析。

Page 23: 第 15 章 综合应用

3. 建立合适的模型首先画出差分序列的趋势图 15.3 :

图 15.3 差分序列的趋势图

Page 24: 第 15 章 综合应用

从图中可以看出,差分序列的值均匀分布在平衡位置两侧,序列是平稳的。从而,差分序列的 acf和 pacf 图也可得到,见图 15.4 。

图 15.4 差分序列的 acf 和 pacf 条图

Page 25: 第 15 章 综合应用

从图 15.4 可知,差分序列的 acf 和 pacf 都是拖尾的,因此,可对原始序列建立模型,经过反复试验,可得到如下结果:

模型统计量

模型 预测变量数

模型拟合统计量 Ljung-Box Q(18)

离群值数R 方 正态化的 BIC 统计量 DF Sig.

收盘 -模型 1 .961 13.566 51.250 16 .000 0

模型描述

模型类型

模型 ID 收盘 模型 _1 ARIMA(1,1,1)

Page 26: 第 15 章 综合应用

ARIMA 模型参数

估计 SE t Sig.

收盘 -模型 收盘 无转换 AR 滞后 1 .789 .189 4.173 .000

差分 1

MA 滞后 1 .666 .229 2.915 .004

日期 无转换 分子 滞后 0 .001 .003 .207 .836

确定模型为,其残差的 acf 和 pacf 如图 15.5 所示。

Page 27: 第 15 章 综合应用

图 15.5 残差序列的 acf 和 pacf

由图 15.5 的可知,残差的 acf 和 pacf 都是平稳的,从 而所确定的模型是合理的,即

1 10.789 0.666t t t tX X

1 10.789 0.666t t t tX X

Page 28: 第 15 章 综合应用

4. 拟合预测 根据第 3 步得出的模型,可以根据原始数据序列对

模型进行拟合,结果如图 15.6 。

图 15.6 序列拟合图