练习一多元正态分布的参数估计(精)
- 格式:doc
- 大小:138.50 KB
- 文档页数:2
第一章 多元正态分布的参数估计一、填空题1.设X 、Y 为两个随机向量,对一切的u 、v ,有)v (p )u (p )uv (p =,则称X 与Y 相互独立。
2.多元分析处理的数据一般都属于 横截面 数据。
3.多元正态向量()'=X X X p ,,1 的协方差阵∑是 对角阵 ,则X 的各分量是相互独立的随机变量。
4.一个p 元函数()p x x x f ,,,21 能作为p R 中某个随机向量的密度函数的主要条 件是 p 'p 21p 21R )x ,,x ,x (,0)x ,,x ,x (f ∈∀≥和1dx dx dx )x ,,x ,x (f p 21-p 21-=⎰⎰+∞∞+∞∞ 。
5.若()∑,~i p i n W S ,k i ,,1 =,且相互独立,则~21k S S S S +++= ),n (W k1i i p ∑∑=。
二、判断题1.多元分布函数()x F 是单调不减函数,而且是右连续的。
正确2.设X 是p 维随机向量,则X 服从多元正态分布的充要条件是:它的任何组合()p R X ∈'αα都是一元正态分布。
错误3.μ是一个P 维的均值向量,当A 、B 为常数矩阵时,具有如下性质:(1)E (AX )=AE (X ) (2)E (AXB )=AE (X )B 正确4.若P 个随机变量X 1,…X P 的联合分布等于各自边缘分布的乘积,则称X 1,… X P 是相互独立的。
正确5.一般情况下,对任何随机向量()'=X X X p ,,1 ,协差阵∑是对称阵,也是正定阵。
错误6.多元正态向量()'=X X X p ,,1 的任意线性变换仍然服从多元正态分布。
正确7.多元正态分布的任何边缘分布为正态分布,反之一样。
错误8.多元样本中,不同样品之间的观测值一定是相互独立的。
正确9.多元正态总体参数均值μ的估计量X 具有无偏性、有效性和一致性。
第一章、多元正态分布的参数估计二、判断题1.多元分布函数是单调不减函数,而且是右连续的。
(√ )()x F 2.设是维随机向量,则服从多元正态分布的充要条件是:它的任何组合X p X 都是一元正态分布。
(X )()p R X ∈'αα3.是一个P 维的均值向量,当A 、B 为常数矩阵时,具有如下性质:μ(1)E (AX )=AE (X ) (2)E (AXB )=AE (X )B (√ )4.若P 个随机变量X1,…XP 的联合分布等于各自边缘分布的乘积,则称X1,…XP 是相互独立的。
(√ )5.一般情况下,对任何随机向量,协差阵是对称阵,也()'=p X X X ,,1 ∑是正定阵。
(X )6.多元正态向量的任意线性变换仍然服从多元正态分布。
()'=p X X X ,,1 (√)7.多元正态分布的任何边缘分布为正态分布,反之一样。
( X )8.多元样本中,不同样品之间的观测值一定是相互独立的。
(√)9.多元正态总体参数均值的估计量具有无偏性、有效性和一致性。
(√)μX 10.是的无偏估计。
( X )S n 1∑11.Wishart 分布是分布在维正态情况下的推广。
(√)2χp 12.若,,且相互独立,则样本离差阵()()∑,~μαp N X n ,,1 =α。
(√)()()()()()∑-'--=∑=,1~1n W X X X X S n p ααα13.若,为奇异矩阵,则。
( X )()∑,~n W X p C ()c c n W C CX p '∑',~第二章 多元正态分布均值向量和协差阵的检验二、判断题1.设,,,则称统计量的分布为()∑,~μp N X ()∑,~n W S p p n ≥X S X n T 12-'=非中心分布,记为。
( X )2HotellingT ()μ,,~22n p T T 2.在协差阵未知的情况下对均值向量进行检验,需要用样本协差阵去代∑S n1替。
厦门大学《应用多元统计分析》第02章_多元正态分布的参数估计第一节引言多元统计分析涉及到的都是随机向量或多个随机向量放在一起组成的随机矩阵。
例如在研究公司的运营情况时,要考虑公司的获利能力、资金周转能力、竞争能力以及偿债能力等财务指标;又如在研究国家财政收入时,税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等都是需要同时考察的指标。
显然,如果我们只研究一个指标或是将这些指标割裂开分别研究,是不能从整体上把握研究问题的实质的,解决这些问题就需要多元统计分析方法。
为了更好的探讨这些问题,本章我们首先论述有关随机向量的基本概念和性质。
在实用中遇到的随机向量常常是服从正态分布或近似正态分布,或虽本身不是正态分布,但它的样本均值近似于正态分布。
因此现实世界中许多实际问题的解决办法都是以总体服从正态分布或近似正态分布为前提的。
在多元统计分析中,多元正态分布占有很重要地位,本书所介绍的方法大都假定数据来之多元正态分布。
为此,本章将要介绍多元正态分布的定义和有关性质。
然而在实际问题中,多元正态分布中均值向量和协差阵通常是未知的,一般的做法是由样本来估计。
这是本章讨论的重要内容之一,在此我们介绍最常见的最大似然估计法对参数进行估计,并讨论其有关的性质。
第二节基本概念一、随机向量我们所讨论的是多个变量的总体,所研究的数据是同时p个指标(变量),又进行了n次观测得到的,我们把这个p指标表示为X1,X2,…,Xp,常用向量X=(X1,X2,…,XP)''表示对同一个体观测的p个变量。
这里我们应该强调,在多元统计分析中,仍然将所研究对象的全体称为总体,它是由许多(有限和无限)的个体构成的集合,如果构成总体的个体是具有p个需要观测指标的个体,我们称这样的总体为p维总体(或p元总体)。
上面的表示便于人们用数学方法去研究p维总体的特性。
这里“维”(或“元”)的概念,表示共有几个分量。
第二章多元正态分布的参数估计实验目的:熟练应用计算机软件进行均值向量、协差阵的估计,提高计算机分析应用能力。
频数分析SPSS操作方法1. 选择菜单Analyze→Descriptive Statistics→Frequencies,打开Frequencies 对话框,如图2-1。
将欲进行频数分析的变量a1移入Variable列表框中。
Display frequency tables复选框询问是否输出频数分布表。
由于频数分析基本就是通过频数分布表来表现的,所以一般情况下都要选择这个选项。
图2-1 Frequencies对话框2. 单击Statistics按钮,调出Statistics子对话框,如图2-2,选择输出的描述性统计量。
该对话框包含以下选项:Percentile Values选项栏:输出各种百分位数。
该选项栏共有三个可选项。
其中,Quartiles输出四分位数;Cut points for n equal groups输出n分位数,n为用户定义的2-100之间的整数;Percentile可以有选择地输出百分位数,方法是在后面的输入框中输入2-100之间的整数,并点击Add按钮确认添加。
Central Tendency选项栏:输出各种集中趋势指标,包括算术平均数、中位数、众数和总和。
◆Dispersion选项栏:输出各种离散程度指标。
◆Distribution选项栏:输出峰度和偏度指标。
所以在本节中我们仅选择输出Descriptives命令的Options子对话框(图2-7)中所没有的分位数指标。
这里选择Quartiles,输出四分位数。
图2-2 Statistics子对话框2. 单击Charts按钮,打开Charts子对话框,设置生成的统计图,如图2-3。
对话框中有两个选项栏:◆Chart Type选项栏:设置生成统计图的类型。
共四个选项,None表示不生成任何统计图,Bar charts生成条形图,Pie charts生成饼图,Histograms生成直方图。
多元统计期末复习题多元数据分析练习题第二章多元正态的参数估计一. 判断题若X?(X1,X2,?,Xp)T~Np(?,?),?是对角矩阵,则X1,X2,?,Xp相互独立。
多元正态分布的任何边缘分布为正态分布,反之也成立。
对任意的随机向量X?(X1,X2,?,Xp)来说,其协方差矩阵?是对称矩阵,并且总是半正定的。
对标准化的随机向量来说,它的协方差矩阵与原来变量的相关系数阵相同。
若X?(X1,X2,?,Xp)X,1nTT~Np(?,?),X,S分别为样本均值和样本协差阵,则S 分别为?,?的无偏估计。
二.计算题?16?T1. 假设随机向量X?(X1,X2,X3)的协方差矩阵为???4???3??1?1数矩阵R。
R????2?1???4?1?13121?4??1?? ?3?1 ???T?44?23??2,试求相关系?9??2. 假设随机向量x?(x1,x2)的协方差矩阵为???T?9?1??20?1,令y1?2x1?x2,y2?x1?x2,试求y?(y1,y2)的协方差矩阵。
?60?????3?327?? ??????3.假设12?1?~N3(?,?),A????,其中??(1,2,?1)T,?2???1???11???2??4 ?2???1,试求y?Ax的分布。
N2(??0??,???22??) ?????4??三.证明题1.设X(1),X(2),?,X(n)是来自Np(?,?)的随机样本,X为样本均值。
试证明:E(X)??,D(X)?1n?。
1n?12.设X(1),X(2),?,X(n)是来自Np(?,?)的随机样本,E(1n?1S)??。
试证明:S 为样本协差阵。
3.证明:若p维正态随机向量X?(X1,X2,?,Xp)?的协差阵为对角矩阵,则X的各分量是相互独立的随机变量。
第四章判别分析一.判断题 1.从某种意义上讲,距离判别是Bayes判别的一种特例。
2.距离判别的思想是分别计算样本到各个总体的欧几里得距离,根据距离的大小判别样本属于哪个总体。
练习一 多元正态分布的参数估计
1.试叙述多元联合分布和边际分布之间的关系。
2.设二维随机向量12()X X '服从二元正态分布,写出其联合分布。
3.已知随机向量1
2()X X '的联合密度函数为
12121222
2[()()()()2()()]
(,)()()d c x a b a x c x a x c f x x b a d c --+-----=
--
其中1a x b ≤≤,2c x d ≤≤。
求
(1)随机变量1X 和2X 的边缘密度函数、均值和方差; (2)随机变量1X 和2X 的协方差和相关系数; (3)判断1X 和2X 是否相互独立。
4.设12(,,)p X X X X '=服从正态分布,已知其协方差矩阵∑为对角阵,证明其分量是相互独立
的随机变量。
5. 影响粮食产量的因素很多, 大致可分为三个层次:第一层次是宏观因素。
主要有三种,一是制度创新, 如20世纪50年代初的土地改革、60年代初的“ 三自一包”和 80年代初的联产承包责任制和现行的粮食直补及税费改革等。
二是政策导向, 如收购政策及价格、市场政策结构调整、储备政策、财政投人、政府抓粮食生产的力度等。
三是科技进步,如良种的培育、播种技术的改进、机械化程度的提高等等, 特别是杂交水稻的发明, 是粮食生产的一次绿色革命, 大大地提高了粮食单位面积产量。
第二层次是中观因素。
主要有粮食播种面积、单位面积产量、受灾面积等等, 这些因素是影响粮食产量的直接因素。
第三层次是微观因素, 主要有有效灌溉面积、化肥施用量、农业机械化程度、财政三项投入等。
为了分析粮食产量的影响因素及其影响程度,将用1978一2007年的统计数据进行分析。
其中:Y 是粮食产量(万吨),X1是农业化肥试用量(万吨),X2是粮食播种面积(千公顷),X3是成灾面积(千公顷),X4是农业劳动力(万人),X5是农业机械总动力(万千瓦)。
假定变量服从,根据样本资料求出均值向量和协方差矩阵的似然估计。
6.均值向量和协方差矩阵的极大似然估计具有哪些优良性质? 7.证明多元正态分布~(,)p N X μΣ样本均值向量~(,/)p N n X μΣ。
8.试证多元正态分布~(,)p N X μΣ的样本协方差矩阵
1
n -S
为Σ的无偏估计。
9.设(1)(2)()n X ,X ,...,X 是从多元正态分布~(,)p N X μΣ抽出的一个简单随机样本,试求
1
n -S
的分布。
10.设()i i X n p ⨯是来自(,)p i i N μΣ的简单随机样本,1,2,3,
,i k =,
(1)已知2...k ====1μμμμ且2...k ====1ΣΣΣΣ,求μ和Σ的估计。
(2)已知2...k ====1ΣΣΣΣ求2,,...,,k 1μμμ和Σ的估计。