多元统计分析课后练习答案

  • 格式:docx
  • 大小:44.20 KB
  • 文档页数:11

下载文档原格式

  / 11
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

第1章多元正态分布

1、在数据处理时,为什么通常要进行标准化处理?

数据的标准化是将数据按比例缩放,使之落入一个小的特定区间。在某些比较和评价的指标处理中经常会用到,去除数据的单位限制,将其转化为无量纲的纯数值,便于不同单位或量级的指标能够进行比较和加权。其中最典型的就是0-1标准化和Z标准化。

2、欧氏距离与马氏距离的优缺点是什么?

欧氏距离也称欧几里得度量、欧几里得度量,是一个通常采用的距离定义,它是在m维空间中两个点之间的真实距离。在二维和三维空间中的欧氏距离的就是两点之间的距离。

缺点:就大部分统计问题而言,欧氏距离是不能令人满意的。每个坐标对欧氏距离的贡献是同等的。当坐标表示测量值时,它们往往带有大小不等的随机波动,在这种情况下,合理的方法是对坐标加权,使变化较大的坐标比变化较小的坐标有较小的权系数,这就产生了各种距离。当各个分量为不同性质的量时,“距离”的大小与指标的单位有关。它将样品的不同属性之间的差别等同看待,这一点有时不能满足实际要求。没有考虑到总体变异对距离远近的影响。

马氏距离表示数据的协方差距离。为两个服从同一分布并且其协方差矩阵为工的随机变量与的差异程度:如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧氏距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。

优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。由标准化数据和中心化数据计算出的二点之间的马氏距离相同。马氏距离还可以

排除变量之间的相关性的干扰。

缺点:夸大了变化微小的变量的作用。受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。

3、当变量X1和X2方向上的变差相等,且与互相独立时,采用欧氏距离与统计距离是否一致?

统计距离区别于欧式距离,此距离要依赖样本的方差和协方差,能够体现各变量在变差大小上的不同,以及优势存在的相关性,还要求距离与各变量所用的单位无关。如果各变量之间相互独立,即观测变量的协方差矩阵是对角矩阵,则马氏距离就退化为用各个观测指标的标准差的倒数作为权数的加权欧氏距离。

4、如果正态随机向量X (X n X2丄X p)的协方差阵为对角阵,证明X的分量是相互独立的随机变量。

解:因为X(X1,X2,L X p)的密度函数为

f (X1,...,X p)

p

1 1/

2 1 1

-2工exp 2(x 0 工(x 以

2 1

2

又由于艺

2

O

2 P

1

~2 1

1

~2 2

O

1

~2 P

f (X 1,…,X p )

2 1

1/2

exp

1 (x 口)

2

1

~2 1

1

~2 2

(X 小

O 1

~2 p

1 p exp 1(X 1

2 1)2 2

1 1 (X

2 3)

2 1 (X p 2 苜

exp (X i

i )2 2 ■ 则其分量是相互独立 5. y 1和y 2是相互独立的随机变量,且 y 〜N (0,1),讨2 〜N (3,4) (a )求y ;的分布 (b )如果y y 1

(y 2 3) / 2 ,写出yy 关于y 1与y ?的表达式,并写出

y y 的分

(c)如果y y i且y〜N (,),写出y 1 y关于y i与y的表达式,并y2

1

写出y y的分布。

解:(a)由于y i〜N (0,1),所以y i〜(1) 0

(b)由于y i 〜N (0,1) , y2 〜N (3,4);

所以勺卫〜N (0,1);

故yy y:(y223)2,且yy 〜(2)

第2章均值向量和协方差阵的检验

1、略

2、试谈Wilks统计量在多元方差分析中的重要意义。

答:威尔克斯统计量在梦元方差分析中是用于检验均值的统计量,

' 矢至少存在心丿使円工円

|F| |£|

用佩熱比原贝>1崗咸豹检验统计量沟A = H = i LI〜人(f 一&卫一1)给走检鲨水

It |A+E|

平。,査Wilks分布表.确走:腋界值,然后怔出统计判断。

3、题目此略

多元均值检验,从题意知道,容量为9的样本,总体协方差未知

假设H0: °,H1 : o (n=9 p=5)

检验统计量

T 2 n (X o ) S 1(X o )服从 P , n-1 的T 2分布

统计量T 2实际上是样本均值与已知总体均值之间的马氏距离再乘以 n* (n-1)

这个值越大,相等的可能性越小,备择假设成立时, T 2有变大的趋势,所以拒

绝域选择T 2值较大的右侧部分,也可以转变为

F 统计量

零假设的拒绝区域{ (n-p ) /[(n-1)*p]}* T 2 >F p 』p ()

1/10*T 2 >F5,4(5)

卩 0= ( 6212.01 32.87 2972 9.5 15.78)' 样本均值(4208.78 35.12 1965.89 12.21 27.79)'

(样本均值-卩 0)'(-2003.23 2.25

-1006.11 2.71 12.01)

协方差矩阵(降维一一因子分析一一抽取)

如)

协方差的逆矩阵

1.88034E-05 -0.00044037 -6.0978E-05

-0.000440368 0.207023949

-0.000210374 -6.09781E-05 -0.000210374 0.00022733 0.00279921

-0.0237044 -0.0105019

-0.000625893 -0.06044981 0.003047474