- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
标
X
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
1982 13.60 11.50 13.76 12.21 2.48 85 55 65 12.80 15.30 12.71 14.78 7.64 120 80 4"20 13"10
1983 14.01 13.00 16.36 12.70 2.49 85 65 70 15.30 18.40 14.50 15.54 7.56 125 85 4"25 13"42
1986 15.69 15.02 17.30 13.46 2.59 105 80 90 17.05 19.30 15.70 17.82 7.70 140 95 3"99 12"56
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
X
我们对表中的 16 个数列进行初始化处理。 注意, 对于前 14 个数列,随着时间的增加,数值的增加意 味着运动水平的进步,而对后两个数列来讲, 随着时 间的增加,数值(秒数)的减少意味着运动水平的进 步。因此,在对数列 X 15=(4"20,4"25,4"10,4"06, 3"99)及数列 X 16=(13"10,13"42,12"85,12"72, 12"56)进行初始化处理时,采用以下公式
X 1:固定资产投资
Y 1:国民收入
Y 2:工业收入
X 2:工业投资 X 3:农业投资 X 4:科技投资 X 5:交通投资
Y 3:农业收入 Y 4:商业收入 Y 5:交通收入 Y 6:建筑业收入
其数据列于下表。
1979 1980 310 189.4 21 25.6 19 174 70.74 70 13.28 4.26 15.6 1981 295 187.2 12.2 23.3 22.3 197 76.8 85.38 16.82 4.34 13.77 1982 346 205 15.1 29.2 23.5 216.4 80.7 99.83 18.9 5.06 11.98 1983 367 222.7 14.57 30 27.66 235.8 89.85 103.4 22.8 5.78 13.95
基本思想:
根据序列曲线几何形状的相似程度来判断其联 系是否紧密,曲线越接近,相应序列之间的关 联度就越大,反之就越小。
100 90 80 70 60 50
90 80
85 80 75 60
總成績 考試成績 出席率
周阿舍 劉阿華 蕭阿薔 圖一 某老師給學生的評分表曲線圖
灰色关联度的计算
确定参考数列
从关联矩阵 R 可以看出
1、第 4 行元素几乎最小,表明各种投资对商业收入影 响不大,即商业是一个不太需要依赖外资而能自行发 展的行业。从消耗投资上看,这是劣势,但从少投资 多收入的观点看,这是优势; 2、 r 15=0.920 最大,表明交通投资的多少对国民收入 的影响最大; 3、 r 55=0.875 仅次于 r 15,表明交通收入主要取决于交 通投资,这是很自然的;
1984 14.54 15.15 16.90 13.96 2.56 90 75 75 16.24 18.75 14.66 16.03 7.76 130 90 4"10 12"85
1985 15.64 15.30 16.56 14.04 2.64 100 80 85 16.40 17.95 15.88 16.87 7.54 140 90 4"06 12"72
X
1 2 3 4 5 1 2 3 4 5 6
308.58 195.4 24.6 20 18.89 170 57.55 88.56 11.19 4.03 13.7
X
X X X
Y Y Y Y Y Y
根据表中的数据,易计算出各个子因素对母因素的关联 度,从而得到关联矩阵为
0.811 0.641 0.839 R 0.563 ቤተ መጻሕፍቲ ባይዱ.819 0.795 0.770 0.648 0.743 0.920 0.624 0.578 0.809 0.680 0.828 0.720 0.588 0.735 0.552 0.542 0.616 0.535 0.780 0.649 0.707 0.875 0.812 0.714 0.584 0.613
三、优势分析 当参考数列不止一个,被比较的因素也不止一个 时,则需要进行优势分析。 假设有 m 个参考因素, 记为 Y1 , Y2 ,, Ym , 再设有 n 个 比较数列, 记为 X 1 , X 2 ,, X n 。 显然, 每个参考数列对 n 个 比较数列有 n 个关联度, 设 rij 表示比较数列 X j 对参考数 列 Yi 的关联度,可构造关联矩阵 R (rij ) mn 。根据矩阵 R 的各个元素的大小,可分析判断出哪些因素起主要影 响,哪些因素起次要影响。 起主要影响的因素称之为 优势因素。
处理原始数据 计算关联系数 关联度的计算与比较
确定参考数列
对一个抽象系统或现象进行分析,首先要选准反映系统
行为特征的数据序列(参考序列)。我们称之为找系统行
为的映射量,用映射量来间接地表征系统行为。比如: 国民平均受教育的年限 刑事案件的发案率 教育的发达程度 社会治安面貌和社会秩序
原始数据的处理
关联度的计算与比较
由于每个比较数列与参考数列的关联程度是通过n 个关联系数来反映的, 关联信息分散,不便于从整体上进行比较。因此,有必要对关联信息作集 中处理。而求平均值便是一种信息集中的方式。即用比较数列与参考数列 各个时期的关联系数之平均值来定量反映这两个数列的关联程度,其计算 公式为:
灰色关联度分析的运用
for i=1:15 x(i,:)=x(i,:)/x(i,1); %标准化数据 end for i=16:17 x(i,:)=x(i,1)./x(i,:); %标准化数据 end data=x; n=size(data,1); ck=data(1,:);m1=size(ck,1); bj=data(2:n,:);m2=size(bj,1); for i=1:m1 for j=1:m2 t(j,:)=bj(j,:)-ck(i,:); end jc1=min(min(abs(t'))); jc2=max(max(abs(t'))); rho=0.5; ksi=(jc1+rho*jc2)./(abs(t)+rho*jc2); rt=sum(ksi')/size(ksi,2); r(i,:)=rt; end r
均值化
一般说来,均值化方法比较适合于没有明显升降趋势现象的数据处理。 区间化
一般地,三种方法不宜混合、重叠作用,在进行系统因素分析时, 可根据实际情况选用其中一个。
若系统 因素 X i 与系统主行为 X 0 可以将其逆化或倒数化后进行计算。
逆化
呈负相关关系,我们
倒数化
关联系数的计算
设经过数据处理后的参考数列为:
由于各因素各有不同的计量单位,因而原始数据存在量纲和数量级上的 差异,不同的量纲和数量级不便于比较,或者比较时难以得出正确结论。 因此,在计算关联度之前,通常要对原始数据进行无量纲化处理。
设
X i ( xi (1), xi (2),, xn (n))
为因素
Xi
的行为序列
初值化
一般地,初值化方法适用于较稳定的社会经济现象的无量纲化,因 为这样的数列多数呈稳定增长趋势,通过初值化处理,可使增长趋 势更加明显。
灰色关联度分析
何为灰色关联度分析?
如何计算? 有何应用?
灰色关联度分析
灰色系统
是指部分信息已知而部分信息未知的系统,灰色系 统理论所要考察和研究的是对信息不完备的系统,通过 已知信息来研究和预测未知领域从而达到了解整个系统 的目的。
关联度
关联度是事物之间、因素之间关联性大小的量度。它 定量地描述了事物或因素之间相互变化的情况,即变 化的大小、方向与速度等的相对性。如果事物或因素 变化的态势基本一致,则可以认为它们之间的关联度 较大,反之,关联度较小。
n=size(data,1); for i=1:n data(i,:)=data(i,:)/data(i,1); %标准化数据 end ck=data(6:n,:);m1=size(ck,1); bj=data(1:5,:);m2=size(bj,1); for i=1:m1 for j=1:m2 t(j,:)=bj(j,:)-ck(i,:); end jc1=min(min(abs(t')));jc2=max(max(abs(t'))); rho=0.5; ksi=(jc1+rho*jc2)./(abs(t)+rho*jc2); rt=sum(ksi')/size(ksi,2); r(i,:)=rt; end r
4、在第 4 列中 r 24=0.809 最大,表明科技对工业影响 最大,而 r 34=0.588 比较小,表明从全面来衡量,还没 有使科技投资与农村经济挂上钩,即科技投资针对的 不是农村需要的科技,r 64=0.584 更小, 表明科技对建 筑业的作用比农业还差; 5、第 3 列的元素普遍比较大,表明农业是个综合性行 业,需要其它方面的配合,例如: r 32=0.828 表明工业 发展能够较大地促进农业的发展。另外,r 35=0.735 表 明农业发展与交通发展也是密切相关的。
因 素 分 析 优 势 分 析 综 合 评 价
二、铅球运动员专项成绩的因素分析 通过对某健将级女子铅球运动员的跟踪调查,获 得其 1982~1986 年每年最好成绩及 16 项专项素质和 身体素质的时间序列资料,见下表。
指 铅球专项成绩 4 公斤前抛 4 公斤后抛 4 公斤原地 立定跳远 高翻 抓举 卧推 3 公斤前抛 3 公斤后抛 3 公斤原地 3 公斤滑步 立定三级跳远 全蹲 挺举 30 米起跑 100 米
比较数列为:
从几何角度看,关联程度实质上是参考数列与比较数列曲线形状的相似程度。凡 比较数列与参考数列的曲线形状接近,则两者间的关联度较大;反之,如果曲线 形状相差较大,则两者间的关联度较小。因此,可用曲线间的差值大小作为关联 度的衡量标准。 则:
两极最大差与最小差:
关联系数:
式中 为分辩系数,用来削弱Δ(max)过大而使关联系数失真的影响。 人为引入这个系数是为了提高关联系数之间的差异显著性。
X i (1) X i (1) X i (1) X i (1) Xi 1, X (2) , X (3) , X (4) , X (5) i 15,16 i i i i
依照问题的要求,我们自然选取铅球运动员专项 成绩作为参考数列,将上表中的各个数列的初始化数 列代入(1) 、 (2) ,易计算出各数列的关联度,如下表 所示。
综合评价
基本思路是: 从样本中确定一个理想化的最优样本,以此为参考数列,通过计 算各样本序列与该参考序列的关联度,对被评价对象做出综合比 较和排序。
设有n 个被评价对象,每个被评价对象有p 个评价指标。这 样,第i 个被评价对象可描述为
步骤:
确定参考序列 根据各评价指标的经济含义,在n 个被评价对象中选出各项指 标的最优值组成参考序列
再进一步,当某一列元素大于其他列元素时,称 此列所对应的子因素为优势子因素;当某一行元素均 大于其他行元素时,称此行所对应的母元素为优势母 元素。如果矩阵 R 的某个元素达到最大,则此行所对 应的母元素被认为是所有母子因素中影响最大的。
下面我们考虑一个实际问题。某地区有 6 个母因 素 Yi 、5 个子因素 X j 为
r
1
r
2
r
3
r
4
r
5
r
6
r
7
r
8
0.588 0.633 0.854 0.776 0.855 0.502 0.659 0.582
r
9
r
10
r
11
r
12
r
13
r
14
r
15
r
16
0.683 0.695 0.895 0.705 0.933 0.847 0.745 0.726
由上表易看出,影响铅球运动员专项成绩的前八 项主要因素依次为全蹲、3 公斤滑步、高翻、4 公斤原 地、挺举、立定跳远、30 米起跑、100 米成绩。因此, 在训练中应着重考虑安排这八项指标的练习。减少训 练的盲目性。