统计预测与决策
- 格式:doc
- 大小:184.50 KB
- 文档页数:15
统计预测与决策
统计预测与决策课程设计
课题一简单线性回归分析
1.1建立模型
研究变量间的函数关系一般使用分析法,回归模型为:Y=,式中fX(),,Y为回归模型的目标变量,也称因变量;X是Y的影响因子,称为自变量。
fX()描述了对Y 的影响方式和程度。
是一个随机变量,即因变量的随机误差项,它, 反映了除X变量外其它因素对Y的影响。
回归分析就是通过样本观测数据对模型进行估计,用最小二乘法分析随机误差项的分布特征,估计出回归系数,再使用该模型进行预测。
,
如果在回归模型中只有一个自变量,且是线性的,即。
fX()YX,,,,,,此为简单线性回归模型,其中、是线性回归系数。
,,
在实际应用中,任何复杂形式的回归分析,一般都是从简单线性模型出发加以逐步深入。
简单线性回归模型是一种理想化的形式,但通过简单线性模型的求解,对掌握回归分析的基本思想和方法特别有用。
1.2参数和回归检验
要将一元线性回归用于预测,就需要估计出参数α、β的值。
线性回归模型参数的估计通常有两种,即最小普通二乘法和最大似然估计法。
通常用的是最小普通二乘法。
1.2.1散点图和线性趋势线
在进行简单线性回归分析前,先绘制散点图很重要,如果是散点图上的点大致分布于一条直线上,则可使用线性回归方法,否则应重新考虑非线性回归等方法。
例:如图所示为某种商品的需求量与人均月收入的关系资料。
一般认为商品的
需求量数据在很大程度上取决于人均月收入,所以商品的需求量为因变量而人均月收入为自变量。
首先用散点图检查商品需求量和人均月收入之间的关系。
在安排数据时,用
- 1 -
统计预测与决策课程设计
于分类轴(水平轴)的X变量在右边列中,用于数值轴(垂直轴)的Y变数在左边
列中,如图a所示。
图a
1.2.2插入线性趋势线
考察图a所示的散点图,其数据点大致沿直线性线分布,故可以插入线性趋势
线进行分析。
Excel用最小二乘法确定线性趋势线的截距和斜率,并自动插入到图
表中,下面具体讲述插入趋势线的步骤:
a、单击图表中某数据点选取数据系列,该系列的所有数据点将放大以突出显示;
b、从“图表”菜单中选择“添加趋势线”命令,系统显示“趋势线”对话框;
c、单击“趋势线”对话框上部的“类型”卷标,在对话框中单击选择:线性“图标;
d、单击“趋势线”对话框上部的“选项”卷标,在“趋势线名称”框中选择“自
动设置”选项,清除“设置截距”复选框,单击选定“显示公式”和“显示R平方”复选框; 单击“确定”按钮,则可得到如图b所示:
图b
由插入趋势线的散点图可知,人均月收入和商品需求量间的函数关系为: - 2 -
统计预测与决策课程设计
商品需求量=0.0089*人均月收入+2.5466;
公式中截距为2.5466,单位与需求量相同(万元);斜率为0.0089,表示人均月收入每增加一元,就会引起需求量变化0.0089万元。
2模型的拟合优度可由加以检验,改值称为决定系数,表明因变量的变化R 2中有多大比例可由自变量加以解释。
本例中值为0.9904,表明需求量的变动R
中有99.04%可由人均月收入通过线性回归模型加以解释,剩余的0.96%则由其余因素引起,两个变量间的线性关系显著。
1.3 回归分析和模型预测
1.3.1 回归分析
散点图和线性趋势线可以帮助我们快速判断两个变量间的关系,如果其线性关系显著,则可以进一步计算回归系数并进行检验和预测。
在EXCEL表格中选中工具栏中的“工具”选项,点击数据分析,出现数据分析对话框,再点击“回归”选项,出现回归对话框,输入X、Y值,并选中残差拟合图和置信度选项,最后点击确定。
显著性检验结果如下:
- 3 -
统计预测与决策课程设计
从回归分析结果可以看出在显著性水平为0.05时参数α、β的检验值分别为6.721142和24.86317,所以是显著的。
在显著性水平为0.05时的置信区间。
1.3.2 模型预测
如果估计下月的人均月收入为1400元,则商品需求量
为:0.0089*1400+2.5466=15.0066万元。
- 4 -
统计预测与决策课程设计
课题二非线性回归分析
2.1模型简介
在实际预测中,常常遇到非线性情况,即一组数据的分布与直线偏差较大。
这时,采用线性回归预测法会导致较大的误差。
如实验一中的数据采用直线回归,还不能得到非常满意的结果。
本节将讨论非线性回归分析方法,包括幂函数法、指数法、对数法和多项式法。
这几种方法均可以在散点图中插入相应的趋势线而得到分析结果。
在进行回归分析前,用散点图检查模型的形式非常重要,根据散点图的形状选择合适的回归模型,可以得到较好的拟合和预测效果。
一般具有某种内在联系的数据在图表上总能表现出一定的规律,常见的有单凸起和双凸起图形。
图1显示了散点图中可能表现出的四种单凸起非线性图形,凸起的方向可以判断适当的非线性形式。
图(1)所示的图形适用于幂函数(x>1)和对数函数形式;图(2)和图(4)所示的图形则可以用幂函数、对数函数或指数函数进行表示;此外,可以看出这四个图形合起来为一个圆形,因此,他们都可以用二次函数进行拟合。
如果散点图所示图形不是单凸起形状,则需用其他函数形式。
例如,对于双凸起(S形)图形,用三次多项式拟合就更为合适。
在选择非线性形式进行分析之2前,通过建立散点图,插入趋势线并在图形上显示公式和R值,有助于我们大致了解各种模型的优劣,从而得到正确的候选模型,避免分析过程中多走弯路。
- 5 -
统计预测与决策课程设计
图 1 各种单凸起非线性图形
2.2模型的参数估计和回归分析
2.2.1模型举例
某年某市各百货商店的商品年销售额和商品流通费率满足一下方程
式:Y=α+β/X,令χ=1/X,则模型可化为一元线性模型为:Y=α+β*χ。
可得出如下散点图:
在所得到的散点图中添加趋势线(方法同一元线性回归)。
可得到如下图:
由插入趋势线的散点图可知,商品流通率和商品年销售额1/X之间的函数关系为:Y=7.6213χ+2.2254。
.2254,斜率为7.6231,表示商品年销售额每增加单位一,就公式中截距为2 会引起商品流通率变化7.6231单位。
2模型的拟合优度可由加以检验,改值称为决定系数,表明因变量的变化R 2中有多大比例可由自变量加以解释。
本例中值为0.9357,表明商品流通率的R
变动中有93.57%可由人均月收入通过线性回归模型加以解释,剩余的6.43%则由其余因素引起,两个变量间的线性关系显著。
2.2.2回归分析
- 6 -
统计预测与决策课程设计
对以上所得到的数据进行回归分析得:
2由以上结果可以得出:R=0.9357,模型拟合的较好。
截距项与斜率项的t检验值12.0797和10.0955均大于5%相助水平下的临界值。
进一步得到Y的每一期的预测值,如下图:。
- 7 -
统计预测与决策课程设计
课题三马尔可夫预测法
3.1马尔科夫模型简介
马尔科夫是俄国伟大的数学家。
马尔科夫链是人类历史上第一个从理论上提出并加以研究的随机过程模型。
马尔科夫预测法是应用马尔科夫链的基本原理和基本
方法研究分析时间序列的变化规律,并预测其未来变化趋势的一种方法。
这种方法在经济预测与经济经营决策等方面有着广泛的应用。
(一)、随机过程
在自然界和人类社会中,事物的变化过程可分为两类:一类是确定性变化过程;另一类是不确定性变化过程。
确定性变化过程是指事物的变化是由时间唯一确定的,或者说,对给定的时间,人们事先能够确切地知道事物变化的结果。
因此,变化过程可用时间的函数来描述。
不确定性变化过程是指对给定的时间,事物变化的结果不止一个,事先人们不能肯定哪个结果一定发生,即事物的变化具有随机性。
这样的变化过程称为随机过程。
由于随机变量与时间参数都有连续与离散之分,所以随机过程又可分为4类:
1、连续型随机过程:随机变量与时间都是连续的。
2、离散型随机过程:随机变量是离散的,时间是连续的。
(过程中时间是连续的-------随机过程,连续与离散针对随机变量)
3、连续随机序列------随机变量是连续的,时间是离散的。
4、离散随机序列------随机变量与时间都是离散的。
(过程中时间是离散的-------随机序列,连续与离散针对随机变量)
离散随机序列也称时间序列。
即随机变量与时间都是离散的。
随机变量(状态空间)个数n是有限的,一般地,2?n,10,不妨设定其为一个集合。
时间的离散,如第一天,第二天……或第一期,第二期…. 一般地,时间是整数,或说是序数。
马尔科夫链是指具有无后效性的时间序列。
所谓无后效性是指序列将来处于什么状态只与它现在所处的状态有关,而与它过去处于什么状态无关。
简单说,现在影响将来。
时间序列中t时刻的状态i影响到t+1时刻出现的状态j,确切- 8 -
统计预测与决策课程设计
地说,t时刻的状态,在t+1时刻可以转移到状态空间中其中某一状态,包括
自身,(,,,或,?,),因此,就必须考虑t时刻的状态,向状态空间中各个状态转移
的可能性,即状态转移概率问题。
与,时刻之前所处的状态无关。
t时刻到t+1时刻,是,的下一个时刻,状态变化表现为状态一步转移,之前之
后时间的形式是离散的。
且随机变量(状态空间)也是离散的。
从概率论,随机变量(随机事件)n个是有限。
t+1时刻这事件组有一个且只有
一个能够出现。
即事件组的概率向量p p…p;p p… p;…… p 11121n21222nn1p… p每
个事件概率向量之和等于1。
用p表示t时刻z处于状态i的条件n2nnijt 下,t+1时刻z处于状态j条件概率。
事件组的概率向量所构成n阶方阵,为
t+1
一步转移概率矩阵,P=(p)。
有限事件的马尔科夫链。
马尔科夫链,描述了
tijn×n
时刻i状态,向t+1时刻系统内各个状态转移的可能性。
(二)、K步转移矩阵
由全概率公式及矩阵的乘法,可以得到转移矩阵P和K步转移矩阵P(K)的关系: K K=1,2,,3…… P(K)=P
2 一般地,运用二步转移矩阵P=P×P,在时间序列中可以得到状态转移矩阵
(一步转移矩阵P)。
(三)、模糊综合评定模型
在状态时间序列中,一定量的样本,所得到其状态转移矩阵。
统计量(样本数)
与状态的个数有关,一般地,状态有n个,样本数为2n。
比如状态有5个,2样本数为10 。
得到一步转移矩阵P,运用二步转移矩阵P=P×P,得到t时
刻的状态转移向量(t时刻的状态向其他状态转移的概率)。
考虑到受不确定性因素
的影响,特别是统计量的因素,造成偏差。
因此采用多级统计就有n级统计量量的方法去消除。
有n个状态,就有n级统计量,级统计量为(n+1)n。
比如状态有5个,就有5级统计量。
样本数分别为10,15,20,25,30。
2得到一步转移矩阵P,运用二步转移矩阵P=P×P,取X状态一列(向量)。
因此分别得到t时刻的状态X转移向量A1,A2,A3,A4,A5。
则5个向量构成的矩阵XP,就是状态X转移模糊综合模型。
- 9 -
统计预测与决策课程设计
在状态研究时,已知各个状态的比例关系,也就是各个状态的权重,构成权X重向量W。
模糊综合评定模型A=W×P。
为此,得出X状态向其他状态转移的概率,确定转移的状态是概率值最大(max)的状态。
基于极端情况也需考虑概率最小(min)的状态。
马尔柯夫预测法是应用概率论来研究经济现象中“无后效性”随机时间序列并加以预测的方法。
常用的有市场占有率预测。
3.2 市场占有率预测
用马尔科夫法预测市场占有率的基本原理是:本期市场占有率仅取决于上期市场占有率及转移概率。
例如,有甲、乙、丙三种产品,在市场上销售。
由于服务态度、产品质量及广告宣传等因素的不同和变化,已知上一期各产品的市场占有率为,,,
0.1,0.2,0.7
0.50.30.2,,,,且已知转移概率矩阵为,试分析本期的市场占有率并预测下
p,0.30.40.3,,
,,0.20.20.6,,
一期的市场占有率和预测长期的市场占有率。
3.2.1建立转移概率矩阵
输入7月1日市场占有率和转移概率矩阵数据到工作表中,如表3-1所示: 表3-1
产品名转移概率矩阵
甲乙丙 0.5 0.3 0.2
上一期市场占有率 0.3 0.4 0.3
0.1 0.2 0.7 0.2 0.2 0.6
3.2.2计算本期市场占有率
选择区域A6:C6,输入公式=MMULT(A4:C4,E2:G4),按Ctrl+Shift+Enter确认,得本期预测市场占有率,如表3-2所示:
- 10 -
统计预测与决策课程设计
表3-2
产品名转移概率矩阵
乙丙 0.5 0.3 0.2 甲
上一期市场占有率 0.3 0.4 0.3
0.5 0.3 0.2 0.2 0.6 0.2
本期市场占有率
0.25 0.25 0.50
3.2.3求出转移概率矩阵的平衡状态,即稳定状态
设终极市场占有率为,则,又。
,,,,xxxx,x,x,1,p,,123123
将初始市场占有率数据,输入到区域A10:C10中。
假如A10:C10,,
0.2,0.5,0.3
区域为终极市场占有率数据,在D10输入公式=SUM(A10:C10),则D10单元应等于1。
选择区域A11:C11,输入公式=MMULT(A10:C10,E2:G4),按
Ctrl+Shift+Enter确定认后,则A11:C11中的数据应与A10:C10中的数据相等。
现在可以调用Excel的规划求解工具进行计算。
如果在“工具”菜单中没有“规划求解”选项,则从“工具”菜单中执行“加载宏”命令,加载“规划求解”工具。
从“工具”菜单中选择“规划求解”命令,在对话框中输入以下数据,如图3-3所示。
图3-3 规划求解对话框
目标单元格:$D$10
等于:“值为”1(即) x,x,x,1123
- 11 -
统计预测与决策课程设计
可变单元格:$A$10:$C$10
单击约束框中的“添加”按钮,在“单元格引用位置”中输入$A$10:$C$10,在条件框中选“=”符合,在“约束值”框中输入$A$11:$C$11,然后按确定按钮。
则图3-3所示对话框中添加了一个约束条件:$A$10:$C$10=$A$11:$C$11(即)。
,p,,
在单击“求解”按钮,则Excel自动计算出了终极市场占有率: ,,0.2,0.3,0.5
在使用规划求解工具时,注意可变单元格应输入一定的初始值,以保证Excel 能计算出正确的结果。
表3-4
产品名转移概率矩阵
甲乙丙 0.5 0.3 0.2
上一期市场占有率 0.3 0.4 0.3
0.2 0.5 0.3 0.2 0.2 0.6
本期市场占有率
0.31 0.32 0.37
终极市场占有率
0.35 0.25 0.4
- 12 -
统计预测与决策课程设计
参考文献
1(徐国详主编:《统计预测与决策》第三版,上海财经大学出版社出版发行。
2(邱东等译:《金融与经济预测》,中国统计出版社1998年版。
3(白雪梅、赵松山:《关于对时序模型定价方法的研究》,载《统计研究》,1999 年第1期,第31~36页。
4(华柏泉编著:《经济预测的统计方法》,中国统计出版社1988年版。
5(张汉亚编著:《工业企业经营预测》,中国发明创造者基金会、中国预测研究会1984年版。
6(华光彦、王慎之编著:《市场调查、预测与决策》,黑龙江省财贸经济研究所
财贸经济研究编辑部1982年版。
7(张正西编著:《决策理论与方法》,中国发明创造者基金会、中国预测研究会
1984年版。
- 13 -。