《概率论与数理统计》第六章 数理统计
- 格式:ppt
- 大小:1.43 MB
- 文档页数:40
第六章 数理统计的基本概念第一节 基本概念1、概念网络图正态总体下的四大分布统计量样本函数样本个体总体数理统计的基本概念→⎪⎪⎪⎭⎪⎪⎪⎬⎫⎪⎪⎪⎩⎪⎪⎪⎨⎧ 2、重要公式和结论例6.1:从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间(1.4, 5.4)内的概率不小于0.95,问样本容量n 至少应取多大?第二节 重点考核点统计量的分布第三节 常见题型1、统计量的性质例6.2:设),,,(721X X X 取自总体)5.0,0(~2N X ,则=⎪⎭⎫⎝⎛>∑=7124i i X P。
例6.3:设总体X 服从正态分布),(21σμN ,总体Y 服从正态分布),(22σμN ,1,,21n X X X 和 2,,21n Y Y Y 分别是来自总体X 和Y 的简单随机样本, 则=⎥⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21212121n n Y Y X X E n j j n i i .2、统计量的分布例6.4:设),,,(21n X X X 是来自正态总体),(2σμN 的简单随机样本,X 是样本均值,记,)(111221∑=--=ni i X X n S,)(11222∑=-=ni i X X n S,)(111223∑=--=ni i X n S μ,)(11224∑=-=ni i X n S μ则服从自由度为n-1的t 分布的随机变量是 (A ).1/1--=n S X t μ(B ).1/2--=n S X t μ(C )./3nS X t μ-=(D )./4nS X t μ-=[ ]例6.5:设总体X ~N (0,12),从总体中取一个容量为6的样本),,,(621X X X ,设26542321)()(X X X X X X Y +++++=,试确定常数C ,使随机变量CY 服从2χ分布。
第四节 历年真题数学一:1(98,4分) 从正态总体)6,4.3(2N 中抽取容量为n 的样本,如果要求其样本均值位于区间(1.4, 5.4)内的概率不小于0.95,问样本容量n 至少应取多大? [附表]:dt eZ t Z2221)(-∞-⎰=Φπ990.0975.0950.0900.0)(33.296.1645.128.1Z Z Φ2(01,7分) 设总体)0)(,(~2>σσμN X ,从该总体中抽取简单随机样本)2(,,,221≥n X X X n ,其样本的均值∑==ni i X n X 21,21求统计量∑=+-+=ni i n i X X X Y 12)2(的数学期望E (Y )。
概率论与数理统计第六章总结概率论与数理统计是数理学科中的重要分支,其应用广泛,涉及到许多领域,如工程、物理、自然科学、医学、经济学等等。
第六章主要讲述了离散型随机变量的概率分布、期望值、方差及其应用。
首先我们了解到离散型随机变量是指取值有限或者可以无限但是可以和自然数一一对应的随机变量,即不连续的随机变量。
其中概率分布的概念是很重要的,它告诉我们每种随机变量取值的可能性大小,从而可以计算一些重要的数值。
比如期望值,期望值是随机变量取值的平均值,它可以用概率分布函数计算得到。
期望值可以给我们一个随机变量所处于某个状态的平均位置,或者它对某个事件发生的平均贡献。
方差也是一个非常重要的概念,它是随机变量值与其期望值之差的平方的期望值。
方差表示了随机变量的分布范围,也就是它们取值的变化程度。
方差越大,代表随机变量距离其期望值越远,该随机变量取值的范围也相应较大。
求期望值和方差的过程中有一些公式会显著提高计算效率,比如线性变换的公式、缩放变换的公式、Chebyshev不等式等等。
这些公式的应用有助于简化计算,并且能帮助我们更容易地理解问题。
我们还讨论了一些常见离散型随机变量的概率分布,比如伯努利分布、二项分布、泊松分布等等。
这些分布的出现在实际问题中都有着很重要的意义,比如伯努利分布描述了实验只有两种可能结果的概率分布,比如是/否、头/尾等等。
而二项分布则描述了实验中成功的概率和试验次数的关系,给我们解决实际问题提供了基础。
除了离散型随机变量,我们还可以研究连续型随机变量的概率分布以及相应的数学理论。
这些知识在实际应用中也具有重要意义。
比如在统计财务账目时,需要研究一些连续型随机变量的概率分布,以便预测下一期客户付款时间的分布情况。
又比如在流量预测中,需要研究一些连续型随机变量的概率分布,以便预测某个时间段内的网络流量。
总之,离散型随机变量理论是概率论的核心内容,对于理解整个概率论课程和进行实际应用都有着重要的意义。
概率论与数理统计第六章总结一、概述在概率论与数理统计的第六章中,主要介绍了随机变量的概率分布以及常见的概率分布模型。
本章内容是概率论与数理统计的重点和难点之一,对于理解和应用概率统计的基本理论和方法具有重要意义。
二、随机变量的概率分布1. 随机变量及其概率分布的概念•随机变量是对随机试验结果的数值化描述,它的取值不仅依赖于随机试验的结果,还受到机会因素的影响。
•概率分布描述了随机变量可能取值的概率大小。
常用的概率分布有离散型和连续型两种。
2. 离散型随机变量及其概率分布•离散型随机变量的取值是有限或可列的,它的概率分布可以用概率质量函数来描述。
•常见的离散型随机变量包括伯努利随机变量、二项分布、泊松分布等。
3. 连续型随机变量及其概率分布•连续型随机变量的取值是无限的,它的概率分布可以用概率密度函数来描述。
•常见的连续型随机变量包括均匀分布、正态分布等。
三、常见概率分布模型1. 二项分布•二项分布是指在 n 重伯努利试验中,成功的次数服从的概率分布。
其概率质量函数为二项式系数与成功概率的乘积。
•二项分布在实际应用中常用于描述成功次数的分布情况,如抽样调查中的样本中某一特征出现的次数。
2. 泊松分布•泊松分布是定义在非负整数集上的概率分布,它描述了在一段时间或空间内事件发生的次数。
其概率质量函数为事件发生率与时间(或空间)长度的乘积。
•泊松分布常用于描述罕见事件发生的次数,如单位时间内电话呼叫次数、一段时间内事故发生次数等。
3. 正态分布•正态分布是最重要的连续型概率分布模型之一,也称为高斯分布。
它的概率密度函数呈钟形曲线,对称于均值。
•正态分布在实际应用中广泛存在,如身高体重、测量误差、考试成绩等符合正态分布的情况较多。
4. 指数分布•指数分布是定义在非负实数集上的连续型概率分布,它描述了连续时间间隔或空间间隔内事件发生的情况。
其概率密度函数呈指数下降曲线。
•指数分布在实际应用中常用于描述无记忆性随机事件的发生情况,如设备失效时间、极端天气事件的间隔等。
第六章数理统计的基本概念一、内容提要数理统计学是数学的一个分支,它的任务是研究怎样用有效的方法去收集和使用带有随机性的数据,建立数学方法,去揭示所研究问题的统计规律性。
它的主要内容是由样本来推断总体。
(一)基本概率1. 总体、个体与样本:研究对象的全体称为总体,用X、Y等表示。
组成总体的每个元素称为个体或单元。
从总体中按一定的规律抽出一些个体就称为抽样,所抽及的个体称为样本,用X1,X2,…,X n表示。
一般样本容量小于50的样本称为小样本,样本容量大于等于50的样本称为大样本,但在样本不易实现时,样本容量大于30的样本可看作大样本。
包含有限个个体的总体称为有限总体,包含无限个个体的总体称为无限总体。
2. 简单随机抽样与简单随机样本:如果总体中各个个体被抽到的机会是均等的,并且在抽取一个个体后总体的成分不变,那么,抽得的一些个体就能很好地反映总体的情况,基于这种想法抽取个体的方法称为简单随机抽样。
抽得的这些个体构成一个样本,用(X1,X2,…,X n)表示,n为样本容量,X1,X2,…,X n应是n个相互独立的且与总体X同分布的随机变量,并将这种样本称为简单随机样本,简称样本。
本书所讨论的样本,如无特别声明,均指简单随机样本。
样本(X1,X2,…,X n)是n个相互独立的且与总体同分布的随机变量,而一次抽取之后,12(X 1,X 2,…,X n )又是n 个具体的数据x 1,x 2…,x n ,即样本的一组观测值,在不致引起混淆的情况下,样本和样本值都用(X 1,X 2,…,X n )表示,这就是样本的二重性。
3. 样本分布函数(或经验分布函数):设样本(X 1,X 2,…,X n )的观测值按由小到大次序排列后为:**2*1n x x x ≤≤≤Λ定义()()*1**1*0,,,,1,2,,11,.n k k n x x kF x x x x k n n x x +⎧⎪⎪=≤<=-⎨⎪⎪≥⎩p L ,为样本分布函数对于样本的不同观测值(x 1,x 2…,x n ),我们将得到不同的F n (x ),所以F n (x )是一个随机变量。
第六章数理统计的基本概念前面五章我们讲述了概率论的基本内容,随后的五章将讲述数理统计.数理统计是以概率论为理论基础的一个数学分支.它是从实际观测的数据出发研究随机现象的规律性.在科学研究中,数理统计占据一个十分重要的位置,是多种试验数据处理的理论基础.数理统计的内容很丰富,本书只介绍参数估计、假设检验、方差分析及回归分析的部分内容.本章中首先讨论总体、随机样本及统计量等基本概念,然后着重介绍几个常用的统计量及抽样分布.第一节随机样本假如我们要研究某厂所生产的一批电视机显像管的平均寿命.由于测试显像管寿命具有破坏性,所以我们只能从这批产品中抽取一部分进行寿命测试,并且根据这部分产品的寿命数据对整批产品的平均寿命作一统计推断.在数理统计中,我们将研究对象的某项数量指标值的全体称为总体(Population),总体中的每个元素称为个体(Individual).例如上述的一批显像管寿命值的全体就组成一个总体,其中每一只显像管的寿命就是一个个体.要将一个总体的性质了解得十分清楚,初看起来,最理想的办法是对每个个体逐个进行观察,但实际上这样做往往是不现实的.例如,要研究显像管的寿命,由于寿命试验是破坏性的,一旦我们获得实验的所有结果,实用文档这批显像管也全烧毁了,我们只能从整批显像管中抽取一部份显像管做寿命试验,并记录其结果,然后根据这部份数据来推断整批显像管的寿命情况.由于显像管的寿命在随机抽样中是随机变量,为了便于数学上处理,我们将总体定义为随机变量.随机变量的分布称为总体分布.一般地,我们都是从总体中抽取一部分个体进行观察,然后根据所得的数据来推断总体的性质.被抽出的部分个体,叫做总体的一个样本.所谓从总体抽取一个个体,就是对总体X进行一次观察(即进行一次试验),并记录其结果.我们在相同的条件下对总体X进行n次重复的、独立的观察,将n次观察结果按试验的次序记为X1,X2,…,X n.由于X1,X2,…,X n是对随机变量X观察的结果,且各次观察是在相同的条件下独立进行的,于是我们引出以下的样本定义.定义6.1设总体X是具有分布函数F的随机变量,若X1,X2,…,X n是与X具有同一分布F(x),且相互独立的随机变量,则称X1,X2,…,X n为从总体X得到的容量为n的简单随机样本(Random sample),简称为样本.当n次观察一经完成,我们就得到一组实数x1,x2,…,x n.它们依次是随机变量X1,X2,…,X n的观察值,称为样本值.对于有限总体,采用放回抽样就能得到简单样本,当总体中个体的总数N比要得N≥10时),在实际中可将不放回抽样近似地当作到的样本的容量n大得多时(一般当n放回抽样来处理.实用文档实用文档若X 1,X 2,…,X n 为总体X 的一个样本,X 的分布函数为F (x ),则X 1,X 2,…,X n 的联合分布函数为F *(x 1,x 2,…,x n )=∏=ni i x F 1)(.又若X 具有概率密度f ,则X 1,X 2,…,X n 的联合概率密度为f *(x 1,x 2,…,x n )=∏=ni i x f 1)(.我们在搜集资料时,如果未经组织和整理,通常是没有什么价值的,为了把这些有差异的资料组织成有用的形式,我们应该编制频数表(即频数分布表).例6.1 某工厂的劳资部门为了研究该厂工人的收入情况,首先收集了工人的工资资料,表6-1记录了该厂30名工人未经整理的工资数值:表6-1以下,我们以例6.1为例介绍频数分布表的制作方法.表6-1是30个工人月工资的原始资料,这些数据可以记为x1,x2,…,x30,对于这些观测数据,第一步确定最大值x max和最小值x min,根据表6-1,有x max=640,x min=420.第二步分组,即确定每一收入组的界限和组数,在实际工作中,第一组下限一般取一个小于x min的数,例如,我们取400,最后一组上限取一个大于x max的数,例如取650,然后从400元到650元分成相等的若干段,比如分成5段,每一段就对应于一个收入组.表6-1资料的频数分布表如表6-2所示.表6-2实用文档600~650230图6-1为了研究频数分布,我们可用图示法表示.直方图直方图是垂直条形图,条与条之间无间隔,用横轴上的点表示组限,纵轴上的单位数表示频数.与一个组对应的频数,用以组距为底的矩形(长条)的高度表示,表6-2资料的直方图如图6-1所示.上述方法我们对抽取数据加以整理,编制频数分布表,作直方图,画出频率分布曲线,这就可以直观地看到数据分布的情况,在什么范围,较大较小的各有多少,在哪些地方分布得比较集中,以及分布图形是否对称等等,所以,样本的频率分布是总体概率分布的近似.样本是总体的反映,但是样本所含的信息不能直接用于解决我们所要研究的问题,而需要把样本所含的信息进行数学上的加工使其浓缩起来,从而解决我们的问题.针对不同的问题构造样本的适当函数,利用这些样本的函数进行统计推断.定义6.2设X1,X2,…,X n是来自总体X的一个样本,g(X1,X2,…,X n)是X1,X2…,X n的函数,若g中不含任何未知参数,则称g(X1,X2,…,X n)是一个统计量(Statistic).实用文档实用文档设x 1,x 2,…,x n 是相应于样本X 1,X 2,…,X n 的样本值,则称g (x 1,x 2,…,x n )是g (X 1,X 2,…,X n )的观察值.下面我们定义一些常用的统计量.设X 1,X 2,…,X n 是来自总体X 的一个样本,x 1,x 2,…,x n 是这一样本的观察值.定义样本平均值∑==ni i X n X 11;样本方差S 2=2221111()11n ni i i i X X X nX n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑; 样本标准差S =∑=--=n i iX X n S 122)(11; 样本k 阶(原点)矩A k =∑=n i ki X n 11,k =1,2,…;样本k 阶中心矩B k =∑=-ni k i X X n 1)(1,k =1,2,….它们的观察值分别为∑==ni i x n x 11;实用文档s 2=2221111()11n n i i i i x x x nx n n ==⎡⎤-=-⎢⎥--⎣⎦∑∑ s =∑=--ni i x x n 12)(11; a k =∑=n i ki x n 11, k =1,2,…;b k =11()nk i i x x n =-∑, k =1,2,….这些观察值仍分别称为样本均值、样本方差、样本标准差、样本k 阶矩、样本k 阶中心矩.第二节 抽样分布统计量是样本的函数,它是一个随机变量.统计量的分布称为抽样分布.在使用统计量进行统计推断时常需知道它的分布.当总体的分布函数已知时,抽样分布是确定的,然而要求出统计量的精确分布,一般来说是困难的.本节介绍来自正态总体的几个常用的统计量的分布.1.χ2分布设X 1,X 2,…,X n 是来自总体N (0,1)的样本,则统计量2χ=X 12+X 22+…+X n 2所服从的分布称为自由度为n 的2χ分布(2χdistribution ),记为2χ~)(2n χ.实用文档)(2n χ分布的概率密度函数为f (y )=⎪⎩⎪⎨⎧>--.,0,0,)2(212122其他y y n y n n e Γf (y )的图形如图62所示.图622χ分布具有以下性质:(1) 如果21χ~)(12n χ,22χ~)(22n χ,且它们相互独立,则有)(~2122221n n ++χχχ.这一性质称为2χ分布的可加性. (2) 如果2χ~)(2n χ,则有E (2χ)=n ,D (2χ)=2n .证 只证(2)因为X i ~N (0,1)故E (X i 2)=D (X i )=1,D (X i 2)=E (X i 4)E (X i 2)]2=31=2,i =1,2,…,n .于是,)()()(12122n X E X E E ni i ni i ===∑∑==χ图63.2)()()(12122n X D X D D ni i n i i ===∑∑==χ对于给定的正数α,0<α<1,称满足条件实用文档{}⎰∞==>)(222)()(n y y f n P αχααχχd的点)(2n αχ为)(2n χ分布的上α分位点(Percentile of α),如图63所示,对于不同的α,n ,上α分位点的值已制成表格,可以查用(见附表),例如对于α=0.05,n =16,查附表得)16(205.0χ=26.296.但该表只详列到n =45为止.当n >45时,近似地有)(2n αχ≈2)12(21-+n z α,其中z α是标准正态分布的上α分位点.例如)50(205.0χ≈12(1.645+99)2=67.221.2.t 分布设X ~N (0,1),Y ~2()n χ,并且X ,Y 独立,则称随机变量t =nYX服从自由度为n 的t 分布(t distribution ),记为t ~t (n ).t (n )分布的概率密度函数为h (t )=[]2/)1(21)2/(2/)1(+-⎪⎪⎭⎫⎝⎛++n n t n n n ΓΓπ, ∞<t <∞.(证略). 图64中画出了当n =1,10时h (t )的图形.h (t )的图形关于t =0对称,当n充分大时其图形类似于标准正态变量概率密度的图形.但对于较小的n ,t 分布与N (0,1)分布相差很大(见附表).实用文档图6 4 图65对于给定的α,0<α<1,称满足条件P (t >t α(n ))=⎰∞)()(n t t t h αd =α的点t α(n )为t (n )分布的上α分位点(见图65).由t 分布的上α分位点的定义及h (t )图形的对称性知t 1α(n )=t α(n ).t 分布的上α分位点可从附表查得.在n >45时,就用正态分布近似:t α(n )≈z α.3.F 分布设U ~)(12n χ,V ~)(22n χ,且U ,V 独立,则称随机变量F =21//n V n U 服从自由度为(n 1,n 2)的F 分布(F distribution ),记F ~F (n 1,n 2).F (n 1,n 2)分布的概率密度为[][]⎪⎩⎪⎨⎧>++=+-.,0,0,)/(1)2/()2/()/(2/)()(2/)(21211)2/(2/21212111其他y n y n n n y n n n n y n n n n ΓΓΓψ (证略).实用文档)(y ψ的图形如图66所示.图6 6 图67F 分布经常被用来对两个样本方差进行比较.它是方差分析的一个基本分布,也被用于回归分析中的显著性检验.对于给定的α,0<α<1,称满足条件P {F >F α(n 1,n 2)}=⎰∞),(21)(n n F y y αψd =α的点F α(n 1,n 2)为F (n 1,n 2)分布的上α分位点(图67).F 分布的上α分位点有表格可查(见附表).F 分布的上α分位点有如下的性质:F 1α(n 1,n 2)=),(112n n F α.这个性质常用来求F 分布表中没有包括的数值.例如由附表查得F 0.05(9,12)=2.80,则可利用上述性质求得F 0.95(12,9)=1/F 0.05(9,12)=12.80=0.357. 4.正态总体的样本均值与样本方差的分布设正态总体的均值为μ,方差为σ2,X 1,X 2,…,X n 是来自正态总体X 的一个简单实用文档样本,则总有E (X )=μ, D (X )=σ2/n ,X ~N (μ,σ2/n ).对于正态总体N (μ,σ2)的样本方差S 2, 我们有以下的性质.定理6.1 设X 1,X 2,…,X n 是总体N (μ,σ2)的样本,X ,S 2分别是样本均值和样本方差,则有(1))1(~)1(222--n S n χσ;(2)X 与S 2独立. (证略).定理6.2 设X 1,X 2,…,X n 是总体N (μ,σ2)的样本,X ,S 2分别是样本均值和样本方差,则有)1(~/--n t nS X μ.证 因为)1,0(~/N nX σμ-,)1(~)1(222--n S n χσ且两者独立,由t 分布的定义知实用文档)1(~)1()1(//22----n t n S n nX σσμ. 化简上式左边,即得)1(~/--n t nS X μ.定理6.3 设X 1,X 2,…,1n X 与Y 1,Y 2,…,2n X 分别是来自具有相同方差的两正态总体N (μ1,σ2),N (μ2,σ2)的样本,且这两个样本相互独立.设∑==1111n i i X n X ,∑==2121n i i Y n Y 分别是这两个样本的均值.S 12=∑=--1121)(11n i i X X n ,S 22=∑=--2122)(11n i i Y Y n 分别是这两个样本的样本方差,则有:)2(~/1/1)()(212121-++---n n t n n S Y X W μμ,其中 S W 2=)2()1()1(21222211-+-+-n n S n S n .(证略).本节所介绍的三个分布以及三个定理,在下面各章中都起着重要的作用.应注意,它们都是在总体为正态总体这一基本假定下得到的.例6.2 设总体X 服从正态分布N (62,100),为使样本均值大于60的概率不小于0.95,问样本容量n 至少应取多大?解 设需要样本容量为n ,则)1,0(~/N n X nX ⋅-=-σμσμ,实用文档P (X >60)=⎭⎬⎫⎩⎨⎧⋅->⋅-n n X P 1062601062.查标准正态分布表,得Φ(1.64)≈0.95.所以0.2n ≥1.64,n ≥67.24.故样本容量至少应取68.小 结在数理统计中往往研究有关对象的某一项数量指标,对这一数量指标进行试验和观察,将试验的全部可能的观察值称为总体,每个观察值称为个体.总体中的每一个个体是某一随机变量X 的值,因此一个总体对应于一个随机变量X ,我们笼统称为总体X .随机变量X 服从什么分布就称总体服从什么分布.若X 1,X 2,…,X n 是相同条件下,对总体X 进行n 次重复独立的观察所得到的n 个结果,称随机变量X 1,X 2,…,X n 为来自总体X 的简单随机样本,它具有两条性质.1.X 1,X 2,…,X n 都与总体具有相同的分布;2.X 1,X 2,…,X n 相互独立.我们就是利用来自样本的信息推断总体,得到有关总体分布的种种结论.完全由样本X 1,X 2,…,X n 所确定的函数g =g (X 1,X 2,…,X n )称为统计量,统计量是一个随机变量.它是统计推断的一个重要工具.在数理统计中的地位相当重要,相当于随机变量在概率论中的地位.实用文档样本均值 ∑==ni i X n X 11和样本方差 S 2=∑=--n k k X X n 12)(11是两个最重要的统计量,统计量的分布称为抽样分布,读者需要掌握统计学中三大抽样分布:2χ分布,t 分布,F 分布.读者学习后续内容还需要掌握以下重要结果:1.设总体X 的一个样本为X 1,X 2,…,X n .且X 的均值和方差存在. 记μ=EX ,σ2=DX .则E (X )=μ, D (X )=σ2/n , ES 2=σ2.2.设总体X~N (μ,σ2),X1,X2,…,Xn 是X 的一个样本,则 (1) X ~N (μ,σ2/n ); (2))1(~)1(222--n S n χσ;(3) X 和S 2相互独立; (4))1(~/--n t nS X μ.3.定理6.3的结果. 重要术语及主题总体 样本 统计量实用文档2χ分布、t 分布、F 分布的定义及它们的密度函数图形上的α分位点.习 题 六1.设总体X ~N (60,152),从总体X 中抽取一个容量为100的样本,求样本均值与总体均值之差的绝对值大于3的概率.2.从正态总体N (4.2,52)中抽取容量为n 的样本,若要求其样本均值位于区间(2.2,6.2)内的概率不小于0.95,则样本容量n 至少取多大?3.设某厂生产的灯泡的使用寿命X ~N (1000,σ2)(单位:小时),随机抽取一容量为9的样本,并测得样本均值及样本方差.但是由于工作上的失误,事后失去了此试验的结果,只记得样本方差为S 2=1002,试求P (X >1062).4.从一正态总体中抽取容量为10的样本,假定有2%的样本均值与总体均值之差的绝对值在4以上,求总体的标准差.5.设总体X ~N (μ,16),X 1,X 2,…,X 10是来自总体X 的一个容量为10的简单随机样本,S 2为其样本方差,且P (S 2>a )=0.1,求a 之值.6.设总体X 服从标准正态分布,X 1,X 2,…,X n 是来自总体X 的一个简单随机样本,试问统计量Y =∑∑==-ni ii i XX n 62512)15(,n >5实用文档服从何种分布?7.求总体X ~N (20,3)的容量分别为10,15的两个独立随机样本平均值差的绝对值大于0.3的概率.8.设总体X ~N (0,σ2),X 1,…,X 10,…,X 15为总体的一个样本.则Y =()21521221121022212X X X X X X ++++++ 服从 分布,参数为 . (2001研考)9.设总体X ~N (μ1,σ2),总体Y ~N (μ2,σ2),X 1,X 2,…,1n X 和Y 1,Y 2,…,2n X 分别来自总体X 和Y 的简单随机样本,则⎥⎥⎥⎥⎦⎤⎢⎢⎢⎢⎣⎡-+-+-∑∑==2)()(21121221n n Y Y X X E n j j n i i = . (2004研考) 10.设总体X ~N (μ,σ2),X 1,X 2,…,X 2n (n ≥2)是总体X 的一个样本,∑==ni i X n X 2121,令Y =∑=+-+ni i n iX X X12)2(,求EY . (2001研考)11. 设总体X 的概率密度为f (x )=x-e21 (-∞<x <+∞),X 1,X 2,…,X n 为总体X 的简单随机样本,其样本方差为S 2,求ES 2. (2006研考)。
Ch 6 数理统计的基本概念§6.1 基本概念 一、总体与样本1、总体——研究对象的全体,记为X 。
2、个体——构成总体的每一个对象,记为i X 。
3、总体容量——总体中包含的个体的个数。
有限总体——容量有限;无限总体——容量无限。
为推断总体X 的分布,从总体中抽取n 个个体,则对应n 个r.v.n X X X .....2,1——来自于总体X 的一个样本。
n X X X ......,21的取值((n x x x ,.....,21)--观测结果)称为样本的观测值,简称为样本值,整个抽取过程称之为抽样。
抽取的目的是根据样本的取值情况推断总体情况,因此应尽可能的使抽取的样本能反映总体的状况,故要求抽取的样本具有以下性质:文档收集自网络,仅用于个人学习⑴ 代表性:样本中每个r.v.i X 与总体X 具有相同的分布。
文档收集自网络,仅用于个人学习⑵ 独立性:n X X X ......,21相互独立。
——简单的随机抽样所得的样本称为简单的随机样本;若总体X 的分布函数为F (x ),则样本n X X X .....2,1的联合分布函数)().....,(121*i ni n x F x x x F =∏=。
文档收集自网络,仅用于个人学习若X 为连续型,且d.f 为f(x),且联合p.d.f 为:)()....,(121*i ni n x f x x x f =∏= 若X 为离散型,且分布律为:....2,1,)(===k p x X P k k 则联合分布律:in i i in n i i p p p x X x X x X P ....).....,(212211⋅⋅====。
...2,1.....3,2,1=in i i i 二、统计量Def:不含有任何未知数的关于样本空本空间的函数称为统计量。
e.g.1 设总体X~),(2σμN ,其中2,σμ未知,(n X X X .....2,1)为取自总体X 的一个样本,则:∑∑==--==n i i n i i X X n S X n X 1221)(11,1均为统计量。