概率论与数理统计第二章笔记
- 格式:pdf
- 大小:144.70 KB
- 文档页数:8
高等教育自学考试《概率论与数理统计》重难点笔记资料 课程代码:04183第一章 随机事件与概率一.随机事件关系与运算1!0,)!(!!!,)!(!0===-==-=C C C A A n n n r n nn rn r n r n :,n r n n 组合排列二.概率P(A) 1.P(A)概率特征)()31)(,0)()21)(0)111∑∞=∞===Ω=≤≤K KK kA A P ,P(P P A P 事件互不相容时φ2. 古典概型3.概率加法公式P(A+B)=P(A)+P(B)- P(AB)当A 、B 互斥时, P(A+B)=P(A)+P(B) 事件的独立性:定义:P(AB)=P(A)P(B)性质:.P(A)>0,,则P(B)=P(B/A); P(B)>0则P(A)=P(A/B) P(B —A)=P(B)--P(AB)P (A--B )==P (AB )=P (A--AB )=P (A )--P (AB )基本事件总数所包含的基本事件数A A P =)(P(A+B+C)=1--P(A+B+C)=1--P(A)P(B)P(C) P(AB)=P(AUB)=1-P(AUB)=1-(P(A)+P(B)) P(A)=1-P(A4.条件概率公式5.概率的乘法公式6.全概率公式:从原因计算结果7.Bayes 公式:从结果找原因)()()|(B P AB P B A P =)|()()(B A P B P AB P =)|()(A B P A P =∑==nk k k B A P B P A P 1)|()()(∑==nk kki i k B A P B P B A P B P A B P 1)|()()|()()|()()()|(A P AB P A B P =)/()/()()(AB C P A B P A P ABC P =第二章随机变量及其概率分布4/ 13分布函数对离散型随机变量对连续型随机变量分布函数与密度函数的重要关系:“一般正态分布函数F(x)”转换为“标准正态分布函数)(x Φ”的关系 设X~N (δμ2,)则1.2.3.连续型随机变量函数的概率分布定理:记x=h(y)为y=g(x)的反函数,则Y=g(X)的概率密度:⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧<<'=其他y y h y h y f f X Y ,0),())(()(βα1) 设X~U(-2,2ππ),令Y=tanX,求Y 的概率密度柯西分布:+∞<<-∞+='=y y h y h y y f f X Y ,111)())(()(2π 2)设X~N(σμ2,),求eX的概率密度对数正态分布:⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤>-=⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤>•=-0,00,2)(ln 210,0,0,1)(ln )(,22y y y y y y y y y e f fX Yσμσπ ∑≤==≤=xk k X P x X P x F )()()(⎰∞-=≤=x dtt f x X P x F )()()(⎰∞-=≤=xdt t f x X P x F )()()()()('x f x F =3直接变换法:[])()(21)()(y y yy y ff F fXXY Y-+='=e e yx x 的的反函数为y y 的反函数为反y 2ln 2,,,,,ln -=-===第三章多维随机变量及其概率分布 二元随机变量及其边缘分布 分布规律的描述方法联合密度函数联合分布函数离散联合分布函数的概率:{}0),(),(),(),(,112112222121≥+--=≤<≤<y x y x y x y x y y x x F F F F Y X P性质1),(,0),(),(),(=+∞+∞=-∞-∞=-∞=-∞F F x F y F 离散边缘分布律:{}{}∑∑===⋅===⋅ijji pijY P j p pij X P pi y x1...2,1,,0,0=⋅=⋅=≥⋅≥⋅∑∑jij p pi j i j p pi联合密度二维边缘密度二维连续随机变量的分布 1.均匀分布(X,Y)~U D1)设D 为平面上的有界区域,S 表面积⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤+−−→−⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤≤≤--−−→−⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧∈=其他,其他o d x c b x a c d a b 其他D y x S y x f R yx R 圆形矩形,01,,,))((1,0),(,1),(2222π),(y x f ),(y x F 0),(≥y x f 1),(=⎰⎰+∞∞-+∞∞-dxdy y x f 1),(0≤≤y x F },{),(y Y x X P y x F ≤≤=+∞<<∞-=⎰+∞∞-x ,,dy y x f x f ),()(+∞<<-∞=⎰+∞∞-y dx y x f y f Y ,,),()(}{}{},{j Y P i X P j Y i X P =====2.正态分布),,,,(~),(222121ρσσμμN Y Xey y x f y x x ⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧+--------=σμσσσρρσπσμμρμ222212121212)2(121),())((2)()1(21221离散型随机变量的独立性)()(),(y FY x Fx y x F =连续型随机变量的独立性第四章 随机变量的数字特征数学期望离散型随机变量,数学期望定义连续型随机变量,数学期望定义期望性质:● E(a)=a ,其中a 为常数● E(a+bX)=a+bE(X),其中a 、b 为常数 , ● E(CX)=CE(X),其中C 为常数● E(X+Y)=E(X)+E(Y),X 、Y 为任意随机变量 ● E(XY)=E(X)E(Y),X,Y 相互独立 方差的性质D(a)=0,其中a 为常数D(a+bX)=b 2(X),其中a 、b 为常数D(X+Y)=D(X)+D(Y) 当X 、Y 相互独立时随机变量g(X)的数学期望常用公式:二维随机变量的期望 离散)()(),(y f x f y x f Y X =∑+∞-∞=⋅=k kkP xX E )(⎰+∞∞-⋅=dxx f x X E )()(⎰∑+∞∞-=⇔=dx x fx x g X g E p x g X g E k k k )()()]([)())((ijji Jii i j ij i i i py j p y Y E p x pi x X E ∑∑∑∑∑∑=⋅==⋅=)()()()()(Y E X E Y X E +=+∑∑=i j ij j i p y x XY E )()()()(,Y E X E XY E Y X =独立时与当连续 g(X)∑⎰⎰∑=⇔=jij jiidxdy y x f y x g Y X G E p yx g Y X g E ,),(),()],([),()],([方差 定义式 离散:⋅-=∑=Pi X E xX D ni i21))(()(连续常用计算式常用公式协方差与相关系数⎰⎰--=dxdy y x f Y E Y X E x Y X Cov ),())())(((),(协方差Cov(X,Y)的性质当X 与Y 相互独立时,则Cov(X,Y)=0相关系数XY ρ的性质⎰⎰⎰⎰==dxdyy x yf Y E dxdy y x xf X E ),()(),()(dxdyy x xyf XY E ⎰⎰=),()(()⎰+∞∞-⋅-=dx x f X E x X D )()()(2[]22)()()(X E X E X D -=))}())(({(2)()()(Y E Y X E X E Y D X D Y X D --++=+)()()(Y D X D Y X D +=+)()()(),(Y E X E XY E Y X Cov -=)()(),(Y D X D Y X Cov XY=ρ[][]{})()()()()(Y E X E XY E Y E Y X E X E -=--())()()(),(22X D X E X E X X Cov =-=),(),(Y X abCov bY aX Cov =),(),(),(Z Y Cov Z X Cov Z Y X Cov +=+独立与相关独立必定不相关 相关必定不独立 不相关不一定独立标准正态分布的概率计算公式)()()(a a Z P a Z P Φ=<=≤)(1)()(a a Z P a Z P Φ-=>=≥)()()(a b b Z a P Φ-Φ=≤≤1)(2)()()(-Φ=-Φ-Φ=≤≤-a a a a Z a P一般正态分布的概率计算一般正态分布的概率计算公式第五章 大数定律及中心极限定理1.切比雪夫不等式:设随机变量X 的期望E(X)及方差D (X )存在,则对任意小正数a>0,{}{}22)(1)()()(aX D a X E X P a X D a X E X P -≥<-↔≤≥- 2.独立同分布序列的中心极限定理{})(21)(212lim lim lim x dt x n n X P x Y P x xt n i i n n n n n eF Φ==⎪⎪⎭⎪⎪⎬⎫⎪⎪⎩⎪⎪⎨⎧≤-=≤=⎰∑∞---∞→∞→∞→πσμ3.棣莫费-拉普拉斯中心极限定理)1,0(~),(~2N X Z N X σμσμ-=⇔()()(σμ-Φ=<=≤a a X P a X P )(1)()(σμ-Φ-=>=≥a a X P a X P )()()(σμσμ-Φ--Φ=≤≤a b b X a P)(2122lim x dt x mpq np Z p e t x n n Φ==⎪⎭⎪⎬⎫⎪⎩⎪⎨⎧≤--∞-∞→⎰ 第六章 统计量及其抽样分布 样本方差,)(11212∑=--=ni i x x n s样本标准差2s s = 统计量样本K样本K卡方分布t 分布F 分布正态总体条件下样本均值的分布:样本方差的分布:两个正态总体的方差之比)(~)1,0(~212n X N X ni i χ∑=,则若())(~1),,(~21222n Y N Y ni iχμσσμ∑=-则若),(~//),(~),(~21212212n n F n V n U n V n U 则若χχ),(~2n N X σμ)1,0(~/N nX σμ-)1(~)1(222--n S n χσ)1(~/--n t ns X μ则若),(~),1,0(~2n Y N X χ)(~/n t nY X第七章 参数估计点估计:参数的估计值为一个常数最大似然估计P147似然函数单个正态总体参数的置信区间第八章 假设检验假设检验的步骤① 根据具体问题提出原假设H0和备择假设H1② 根据假设选择检验统计量,并计算检验统计值③ 看检验统计值是否落在拒绝域,若落在拒绝域则拒绝原假设,否则就不拒绝原假设。
概率论与数理统计第二章笔记一、引言概率论与数理统计是数学中的一个重要分支,它研究的是随机现象的规律性和统计规律性。
在第二章中,我们将深入探讨随机变量及其分布,以及随机变量的数字特征。
二、随机变量及其分布1. 随机变量的定义及分类在概率论与数理统计中,随机变量是描述随机现象数值特征的变量。
根据随机变量可取的值的性质,可以分为离散随机变量和连续随机变量。
离散随机变量只取有限个或无限可数个值,而连续随机变量则可以取在一定范围内的任意一个值。
2. 随机变量的分布及特征随机变量的分布是描述其取值的概率规律。
对于离散随机变量,常见的分布包括二项分布、泊松分布等;对于连续随机变量,则有均匀分布、正态分布等。
通过对随机变量的分布进行分析,可以推导出其数字特征,如均值、方差等。
三、随机变量数字特征1. 随机变量数字特征的意义随机变量的数字特征是对其分布的定量描述,包括均值、方差、标准差等。
这些数字特征可以帮助我们更直观地理解随机变量的分布规律,从而作出合理的推断和决策。
2. 随机变量数字特征的计算对于离散随机变量,其均值、方差的计算可通过对其分布进行加权平均;对于连续随机变量,则需要进行积分计算。
这些计算方法在实际问题中起着重要作用,例如在风险评估、市场预测等方面的应用。
四、总结和回顾概率论与数理统计第二章主要介绍了随机变量及其分布,以及随机变量的数字特征。
通过对离散和连续随机变量的分类和分布进行深入讨论,我们对随机现象的规律性有了更清晰的认识。
通过数字特征的计算,我们可以更准确地描述和解释随机现象的规律,为实际问题的分析和决策提供了有力工具。
个人观点和理解在学习概率论与数理统计第二章的过程中,我深刻认识到随机变量和其分布对于随机现象的定量分析至关重要。
通过对数字特征的计算,我们可以更准确地描述和解释随机现象的规律,这对于我在日常生活和工作中的决策和分析将有着实质性的帮助。
结论概率论与数理统计第二章所介绍的内容为我们提供了深入了解随机现象规律性的基础,并且为日后的学习和实践奠定了坚实的基础。
第二章 随机变量及其分布上一章研究内容: 事件(集合A )→ 概率(数).本章将用函数研究概率,函数是数与数的关系,即需要用数反映事件——随机变量.事件(数)→ 概率(数).§2.1 随机变量及其分布2.1.1.随机变量的概念随机试验的样本点有些是定量的:如掷骰子掷出的点数,电子元件使用寿命的小时数.有些是定性的:如掷硬币正面或反面,检查产品合格或不合格.对于定性的结果也可以规定其数量性质:如掷硬币,正面记为1,反面记为0;检查产品,合格记为1,不合格记为0.随机试验中,可将每一个样本点ω 都对应于一个实数X (ω),称为随机变量(Random Variable ),常用大写英文字母X , Y , Z 等表示随机变量,而随机变量的具体取值通常记为小写英文字母x , y , z .对于随机变量首先应掌握它的全部可能取值:如掷硬币,⎩⎨⎧=反面正面,0,1X ,X 的全部可能取值为0, 1;掷两枚骰子,X 表示掷出的点数之和,X 的全部可能取值为2, 3, 4, … , 12 ;观察某商店一小时内的进店人数X ,X 的全部可能取值为0, 1, 2, … ;电子元件使用寿命,用X 表示使用的小时数,X 的全部可能取值为 ),0[∞+; 一场足球比赛(90分钟),用X 表示首次进球时间(分钟),若为0:0,记X = 100,X 的全部可能取值为 (0, 90 )∪{100};注意:1. 每个样本点都必须对应于一个实数,2.不同样本点可以对应于同一个实数,3.随机变量的每一取值或取值范围都表示一个事件.应掌握将随机变量的取值或取值范围描述为事件,又能将事件用随机变量表达的方法. 例 掷一枚骰子,用X 表示出现的点数,则 X = 1表示出现1点;X > 4表示点数大于4,即出现5点或6点;X ≤ 0为不可能事件.又出现奇数点,即X = 1, 3, 5;点数不超过3,即X ≤ 3. 例 X 表示商店一天中某商品的销售件数(顾客的需求件数), 则 X = 0表示没有销售;X ≤ 10表示销售不超过10件.又销售5件以上(不含5件)即X > 5;若该商店准备了a 件该商品,事件“能满足顾客需要”,即X ≤ a . 例 X 表示一只电子元件的使用寿命(小时), 则 X = 1000表示该元件恰好使用了1000小时,X ≥ 800表示该元件使用寿命在800小时以上. 例 90分钟足球比赛,X 表示首次进球时间(分钟),且0:0时,记X = 100, 则 X = 10表示上半场第10分钟首次进球.又上半场不进球即X > 45;开场1分钟内进球即X ≤ 1.如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.(注:可列个即可以排成一列,一个一个往下数,如非负整数0, 1, 2, 3, … )离散型随机变量的全部可能取值是实数轴上一些离散的点,而连续型随机变量的全部可能取值是实数轴上一个区间或多个区间的并,如电子元件使用寿命X (小时),全部可能取值是),0[∞+.下面按离散型和连续型分别进行讨论.2.1.2. 离散随机变量的概率分布列对于随机变量还应该掌握它的每一取值或取值范围表示事件的概率.定义 如果随机变量X 的全部可能取值是有限个或可列个,则称为离散型随机变量.设离散型随机变量X 的全部可能取值为x 1, x 2, …, x k , …,则X 取值x k 的概率p k = p (x k ) = P {X = x k }, k = 1, 2, …… 称为离散型随机变量的概率分布函数(Probability Distribution Function ,PDF ),简称概率分布或概率函数.直观上,又写为L LLL)()()(2121k kx p x p x p Px x x X 或 ⎟⎟⎠⎞⎜⎜⎝⎛L L L L)()()(~2121k k x p x p x p x x x X , 称为X 的概率分布列.如掷一枚骰子,X 表示出现的点数,X 的分布列为616161616161654321PX . 概率函数基本性质:(1)非负性 p (x k ) ≥ 0 , k = 1, 2, ……; (2)正则性1)(1=∑∞=k kxp .这是因为事件X = x 1 , X = x 2 , … , X = x k , … 是一个完备事件组, 故P {X = x 1} + P {X = x 2} + … + P {X = x k } + … = P (Ω) = 1,即p (x 1) + p (x 2) + … + p (x k ) + … = 1. 例 设盒中有2个红球3个白球,从中任取3球,以X 表示取得的红球数.求X 的分布列. 解:X 的全部可能取值0, 1, 2 ,样本点总数为1035=⎟⎟⎠⎞⎜⎜⎝⎛=n ,X = 0表示“取到3个白球”,所含样本点个数为1330=⎟⎟⎠⎞⎜⎜⎝⎛=k ,有1.0101)0(==p , X = 1表示“取到1个红球2个白球”,所含样本点个数为612231=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有6.0106)1(==p , X = 2表示“取到2个红球1个白球”,所含样本点个数为322132=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=k ,有3.0103)2(==p . 故X 的分布列为3.06.01.0210P X.求离散型随机变量X 的概率分布步骤: (1)找出X 的全部可能取值,(2)将X 的每一取值表示为事件, (3)求出X 的每一取值的概率.例 现有10件产品,其中有3件不合格.若不放回抽取,每次取一件,直到取得合格品为止.用X 表示抽取次数,求X 的概率分布. 解:X 的全部可能取值1, 2, 3, 4 ,X = 1表示“第1次就取得合格品”,有107)1(=p , X = 2表示“第2次取得合格品且第1次是不合格品”,有30797103)2(=⋅=p , X = 3表示“第3次取得合格品且前两次是不合格品”,有12078792103)3(=⋅⋅=p , X = 4表示“第4次取得合格品且前三次是不合格品”,有1201778192103)4(=⋅⋅⋅=p , 故X 的分布列为120112073071074321PX . 例 上例若改为有放回地抽取,又如何? 解:X 的全部可能取值1 , 2 , … , n , … ,7.0107)1(==p ,21.0107103)2(=⋅=p ,7.03.0)3(2×=p ,…,7.03.0)(1×=−k k p ,…, 故X 的概率函数为L ,2,1,7.03.0)(1=×=−k k p k ;X 的分布列为LL L L 7.03.07.03.021.07.032112××−k PkX .例 若离散型随机变量的概率函数为kCk p =)(,k = 1, 2, 3, 4,且C 为常数. 求:(1)C 的值,(2)P {X = 3},(3)P {X < 3}.解:(1)由正则性知:1432)4()3()2()1(=+++=+++CC C C p p p p ,即11225=C ,故2512=C .(2)254)3(}3{===p X P , (3)25182562512)2()1(}3{=+=+=<p p X P . 2.1.3.随机变量的分布函数连续型随机变量在单个点取值概率为零,如电子元件使用寿命恰好为1000小时这个事件的概率就等于零,因此连续型随机变量不能考虑概率函数.为了用单独一个变量表示一个区间,特别地取区间 (−∞, x ].定义 随机变量X 与任意实数x ,称F (x ) = P {X ≤ x },−∞ < x < +∞为X 的累积分布函数(Cumulative Distribution Function ,CDF ),简称分布函数.P {a < X ≤ b } = P {X ≤ b } − P {X ≤ a } = F (b ) − F (a ),P {X > a } = 1 − P {X ≤ a } = 1 − F (a ),由概率的连续性知)0()(lim }{lim }{−==≤=<−−→→a F x F x X P a X P ax ax ,且P {X = a } = P {X ≤ a } − P {X < a } = F (a ) − F (a – 0),可见X 在任一区间上或任一点取值的概率都可用分布函数表示. 例 已知随机变量X 的分布列为3.05.02.0210PX ,求X 的分布函数.解:X 的全部可能取值为0, 1, 2,当x < 0时,F (x ) = P {X ≤ x } = P (∅) = 0, 当0 ≤ x < 1时,F (x ) = P {X ≤ x } = p (0) = 0.2,当1 ≤ x < 2时,F (x ) = P {X ≤ x } = p (0) + p (1) = 0.7, 当x ≥ 2时,F (x ) = P {X ≤ x } = P (Ω ) = 1,故⎪⎪⎩⎪⎪⎨⎧≥<≤<≤<=.2,1,21,7.0,10,2.0,0,0)(x x x x x F若离散型随机变量的全部可能取值为x 1, x 2, ……,概率函数p (x k ) = p k ,k = 1, 2, ……,则分布函数∑≤=≤=xx kk xp x X P x F )(}{)(.且离散型随机变量的分布函数F (x )是单调不减的阶梯形函数,X 的每一可能取值x k 是F (x )的跳跃点,跳跃高度是相应概率p (x k ).例 已知某离散型随机变量X 的分布函数为⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤<≤<≤−−<=,5,1,52,6.0,20,4.0,01,3.01,0)(x x x x x x F 求X 的分布列. 解:X 的全部可能取值是F (x )的跳跃点,即 −1, 0, 2, 5,跳跃高度依次为:p (−1) = 0.3 − 0 = 0.3; p (0) = 0.4 − 0.3 = 0.1; p (2) = 0.6 − 0.4 = 0.2; p (5) = 1 − 0.6 = 0.4.故X 的分布列为4.02.01.03.05201PX −.分布函数的基本性质:(1)单调性,F (x ) 单调不减,即x 1 < x 2时,F (x 1) ≤ F (x 2); (2)正则性,F (−∞) = 0,F (+∞) = 1;(3)连续性,F (x ) 右连续,即)()(lim 00x F x F x x =+→. 证:(1)当x 1 < x 2时,{X ≤ x 1} ⊂ {X ≤ x 2},有F (x 1) ≤ F (x 2);(2)F (−∞) = P {X < −∞} = P (∅) = 0,F (+∞) = P {X < +∞} = P (Ω ) = 1;(3)任取单调下降且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n ≤=≤=≤∞=∞→I ,根据概率的连续性知}{}{}{lim 01x X P x X P x X P n n n n ≤=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→I ,即)()(lim 00x F x F x x =+→. 但F (x )不一定左连续,任取单调增加且趋于x 0的数列{x n },有}{}{}{lim 01x X x X x X n n n n <=≤=≤∞=∞→U ,得}{}{}{lim 01x X P x X P x X P n n n n <=⎟⎟⎠⎞⎜⎜⎝⎛≤=≤∞=∞→U , 故}{)(}{)(lim 0000x X P x F x X P x F x x =−=<=−→.2.1.4. 连续随机变量的概率密度函数离散型随机变量的全部可能取值是有限或可列个点,连续型随机变量的全部可能取值是实数区间.但连续型随机变量在单独一个点取值的概率为0,其概率函数无实际意义,对于连续随机变量通常考虑其在某个区间上取值的概率,这就需要讨论分布函数.连续型随机变量的分布函数是连续函数. 注意:概率为0的事件不一定是不可能事件.定义 随机变量X 的分布函数F (x ),若存在函数p (x ),使 ∫∞−=xdu u p x F )()(,则称X 为连续型随机变量,p(x )为X 的概率密度函数(可以理解为:p (u )为概率密度,p (u )du 为X 在该小区间内取值的概率,∫∞−x 为从−∞ 到x 无限求和.几何意义:在平面上作出密度函数p (x )的图形,则阴影部分的面积即为F (x )的值.密度函数基本性质:(1)非负性 p (x ) ≥ 0;(2)正则性 1)(=∫∞+∞−dx x p .因)()(x F du u p x =∫∞−,有1)()(=+∞=∫∞+∞−F dx x p .连续型随机变量的性质:设连续型随机变量X 的概率密度函数为p (x ),分布函数为F (x ),则有 (1)∫=−=≤<21)()()(}{1221x x dx x p x F x F x X x P ;(2)当p (x ) 连续时,p (x ) = F ′(x ); 因∫∞−=x du u p x F )()(,当p (x ) 连续时,有)(])([)(x p du u p x F x=′=′∫∞−(3)X 在单独一个点取值的概率为0,其分布函数为连续函数;(4)P {x 1 < X ≤ x 2} = P {x 1 ≤ X ≤ x 2} = P {x 1 < X < x 2} = P {x 1 ≤ X < x 2},即连续型...随机变量在某区间内的概率与区间开闭无关,离散型则不成立;(5)只在有限个点上取值不相同的密度函数对应于同一个分布函数,一般,只在概率为0的数集上取值不相同的密度函数都对应于同一个分布函数.例 设F (x ) = A + B arctan x 为某连续型随机变量X 的分布函数. 求:(1)A , B ; (2)}31{≤≤−X P ; (3)密度函数p (x ). 解:(1)由正则性 F (−∞) = 0,F (+∞) = 1,得:02π)arctan (lim =−=+−∞→B A x B A x ,12π)arctan (lim =+=++∞→B A x B A x ,故21=A ,π1=B ;(2)x x F arctan π121)(+=,得1274ππ1213ππ121)1()3(}31{=⎥⎦⎤⎢⎣⎡⎟⎠⎞⎜⎝⎛−⋅+−⎟⎠⎞⎜⎝⎛⋅+=−−=≤≤−F F X P . (3)密度函数)1π(1)()(2x x F x p +=′=.例 已知⎩⎨⎧<<−=,,0,10),()(32其它x x x C x p是某连续型随机变量X 的密度函数,求:(1)C , (2)}211{<<−X P , (3)分布函数F (x ).解:(1)由正则性:1)(=∫∞+∞−dx x p ,得1120)4131()43()(10431032==−−=−=−∫C C x x C dx x x C ,故C = 12;(2)165)641241(12)43(12)(12)(}211{2104321032211=−=−=−==<<−∫∫−x x dx x x dx x p X P ;(3)X 的全部可能取值为 [0, 1],分段点0, 1,当x < 0时,0)()(==∫∞−xdu u p x F ,当0 ≤ x < 1时,4304303234)43(12)(12)()(x x u u du u u du u p x F xxx−=−=−==∫∫∞−,当x ≥ 1时, 1)(12)()(132=−==∫∫∞−du u u du u p x F x,故⎪⎩⎪⎨⎧≥<≤−<=.1,1,10,34,0,0)(43x x x x x x F例 已知⎩⎨⎧<<−=,,0,11|,|)(其它x x x p是某连续型随机变量X 的密度函数,求分布函数F (x ).解:分段点−1, 0, 1,当x < −1时,0)()(==∫∞−xdu u p x F ;当−1 ≤ x < 0时, 212122)()()(22121x x u du u du u p x F xxx−=+−=−=−==−−∞−∫∫; 当0 ≤ x < 1时,21221022)()()(220212001x x u u udu du u du u p x F xxx+=++=+−=+−==−−∞−∫∫∫;当x ≥ 1时, 1)()()(101=+−==∫∫∫−∞−udu du u du u p x F x.故⎪⎪⎪⎩⎪⎪⎪⎨⎧≥<≤+<≤−−<=.1,1,10,21,01,21,0,0)(22x x x x xx x F§2.2 随机变量的数学期望对于随机变量,还应当掌握反映其平均值、分散程度等的指标,这就需要引入数学期望和方差等概念. 2.2.1.数学期望的概念例 甲、乙两个射击选手,在射击训练中甲射了10次,其中3次10环,1次9环,4次8环,2次7环;乙射了15次,其中2次10环,9次9环,2次8环,2次7环.问谁的表现更好? 分析:比较他们射中的平均环数甲共射中3 × 10 + 1 × 9 + 4 × 8 + 2 × 7 = 85环,平均每次射中5.81085=环; 乙共射中2 × 10 + 9 × 9 + 2 × 8 + 2 × 7 = 131环,平均每次射中73.815131=&环. 故乙的表现更好.一般地,若在n 次试验中,出现了m 1次x 1,m 2次x 2,…,m k 次x k ,(其中m 1 + m 2 + … + m k = n ),则平均值为∑==+++ki i i k k n mx n x m x m x m 12211L ,即平均值等于取值与频率乘积之和.因n 很大时,频率稳定在概率附近,即平均值将稳定在取值与概率乘积之和附近. 2.2.2.数学期望的定义定义 设离散型随机变量X 的分布列是⎟⎟⎠⎞⎜⎜⎝⎛L L L L )()()(~2121k kx p x p x p x x x X ,如果级数∑∞=1)(k k k x p x 绝对收敛,则称之为X 的数学期望(Expectation ),记为E (X ). 数学期望的实际意义是反映随机变量的平均取值,是其全部可能取值以相应概率为权数的加权平均.如X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−2.04.01.03.04102,则E (X) = (−2) × 0.3 + 0 × 0.1 + 1 × 0.4 + 4 × 0.2 = 0.6. 例 某人有4发子弹,现在他向某一目标射击,若命中目标就停止射击,否则直到子弹用完为止.设每发子弹命中率为0.4,以X 表示射击次数,求E (X ). 解:先求X 的分布列,X 的全部可能取值为1, 2, 3, 4,X = 1,第一枪就命中, p (1) = 0.4;X = 2,第一枪没有命中,第二枪命中,p (2) = 0.6 × 0.4 = 0.24; X = 3,前两枪没有命中,第三枪命中,p (3) = 0.6 2 × 0.4 = 0.144; X = 4,前三枪没有命中, p (4) = 0.6 3 = 0.216.则X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛216.0144.024.04.04321,故E (X ) = 1 × 0.4 + 2 × 0.24 + 3 × 0.144 + 4 × 0.216 = 2.176.例 若X 的概率函数为L ,2,1,21)2(==⎟⎟⎠⎞⎜⎜⎝⎛−k kp k k,求E (X ). 解:因∑∑∞=∞=−=⋅−11)1(21)2(k kk k k k k 收敛但不是绝对收敛,故E (X ) 不存在.离散型随机变量的数学期望是取值乘概率求和:∑∞=1)(k k k x p x ,类似可定义连续型随机变量的数学期望是取值乘密度积分:∫+∞∞−dx x xp )(.定义 设连续型随机变量X 的密度函数为p (x ).如果广义积分∫+∞∞−dx x xp )(绝对收敛,则称之为X 的数学期望,记为E (X ).例 已知连续型随机变量X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其它x x x p 求E (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xp X E . 例 已知X 的密度函数为⎩⎨⎧<<+=.,0,20,)(其它x bx a x p 且32)(=X E ,求a , b . 解:由正则性得122)2()()(2220=+=⋅+=+=∫∫∞+∞−b a x b ax dx bx a dx x p ,又32382)32()()()(20322=+=⋅+⋅=+==∫∫∞+∞−b a x b x a dx bx a x dx x xp X E ,故21,1−==b a . 例 已知X 的密度函数为+∞<<∞−+=x x x p ,)1π(1)(2,求E (X ).解:因+∞∞−+∞∞−+∞∞−+∞∞−+=⋅+=+=∫∫∫)1ln(π21)(21)1π(1)1π()(2222x x d x dx x x dx x xp 发散, 故E (X )不存在. 2.2.3.数学期望的性质设X 为随机变量,g (x ) 为函数,则称Y = g (X ) 为随机变量函数,Y 也是一个随机变量.下面不加证明地给出随机变量函数的数学期望计算公式.定理 设X 为随机变量,Y = g (X ) 为随机变量函数,则(1)若X 为离散型随机变量,概率函数为p(x k ), k = 1, 2, …,则∑∞===1)()()]([)(k k k x p x g X g E Y E ;(2)若X 为连续型随机变量,密度函数为p (x ),则∫+∞∞−==dx x p x g X g E Y E )()()]([)(.数学期望具有以下性质:(1)常数的期望等于其自身,即E (c ) = c ;(2)常数因子可移到期望符号外,即E (aX ) = a E (X );(3)随机变量和的期望等于期望的和,即E [g 1 (X ) + g 2 (X )] = E [g 1 (X )] + E [g 2 (X )]. 证明:(1)将常数c 看作是单点分布p (c ) = 1,故E (c ) = c p (c ) = c ;(2)以连续型为例加以证明,)()()()(X aE dx x xp a dx x axp aX E ===∫∫+∞∞−+∞∞−;(3)以连续型为例加以证明,∫∫∫+∞∞−+∞∞−+∞∞−+=+=+dx x p x g dx x p x g dx x p x g x g X g X g E )()()()()()]()([)]()([212121= E [g 1 (X )] + E [g 2 (X )].由性质(2)、(3)知随机变量线性组合的期望等于期望的线性组合,可见数学期望具有线性性质. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛−3.04.01.02.02101, 求E (2X +1),E (X 2).解:E (2X +1) = −1 × 0.2 + 1 × 0.1 + 3 × 0.4 + 5 × 0.3 = 2.6;E (X 2) = 1 × 0.2 + 0 × 0.1 + 1 × 0.4 + 4 × 0.3 = 1.8. 例 已知圆的半径X 是一个随机变量,密度函数为⎪⎩⎪⎨⎧<<=.,0,31,21)(其他x x p 求圆面积Y 的数学期望. 解:圆面积Y = π X 2,故3π1332π21π)(π)(3133122=⋅=⋅==∫∫∞+∞−xdx x dx x p x Y E . 例 设国际市场对我国某种出口商品的需求量X (吨)的密度函数为⎪⎩⎪⎨⎧<<=.,0,40002000,20001)(其他x x p 设每售出一吨,可获利3万美元,但若销售不出,每积压一吨将亏损1万美元,问如何计划年出口量,能使国家获利的期望最大.解:设计划年出口量为a 吨,每年获利Y 万美元.当X ≥ a 时,销售a 吨,获利3a 万美元;当X < a 时,销售X 吨,积压a − X 吨,获利3X − (a − X ) = 4X − a 万美元;即⎩⎨⎧<≤−≤≤==.2000,4,4000,3)(a X a X X a a X g Y则4000200024000200020003)2(2000120001320001)4()()()(aa a a x a ax x dx a dx a x dx x p x g Y E +−=⋅+⋅−==∫∫∫+∞∞− 8250)3500(10001400071000122+−−=−+−=a a a , 故计划年出口量为3500吨时,使国家获利的期望最大.§2.3 随机变量的方差与标准差数学期望反映平均值,方差反映波动程度.如甲、乙两台包装机,要求包装重量为每袋500克,现各取5袋,重量为甲:498,499,500,501,502; 乙:490,495,500,505,510.二者平均值相同都是500克,但显然甲比乙好.此时比较的是它们的偏差(即取值与平均值之差).偏差:甲:−2,−1,0,1,2;乙:−10,−5,0,5,10. 2.3.1.方差的定义定义 随机变量X 与其数学期望E (X ) 之差X − E (X ) 称为偏差.偏差有大有小,可正可负,比较时需要去掉符号,但绝对值函数进行微积分处理不方便,因此考虑偏差平方的数学期望.定义 随机变量X ,若E [X − E (X )]2存在,则称之为X 的方差(Variance ),记为Var (X ) 或D (X ).即Var (X ) = E [X − E (X )]2.显然方差Var (X ) ≥ 0,称)Var(X 为X 的标准差(Standard Deviation ).在实际问题中,标准差与随机变量有相同的量纲.方差与标准差反映波动程度.方差越大,取值越分散;方差越小,取值越集中. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求E (X ), Var (X ).解:E (X ) = 1 × 0.2 + 2 × 0.4 + 3 × 0.4 = 2.2;Var (X ) = (−1.2)2 × 0.2 + (−0.2)2 × 0.4 + 0.82 × 0.4 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p求E (X ), Var (X ).解:32322)()(1310=⋅=⋅==∫∫∞+∞−x xdx x dx x xf X E ; 181949821949842)98382()()32()Var(1023410232=+−=⎟⎠⎞⎜⎝⎛+−=+−=−=∫∫∞+∞−x x x dx x x x dx x p x X .例 已知X 的全部可能取值为0, 1, 2,且E (X ) = 1.3,Var (X ) = 0.81.求X 的分布列.解:设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛c b a 210,由正则性得:a + b + c = 1,且E (X ) = 0 × a + 1 × b + 2 × c = b + 2c = 1.3,Var (X ) = (−1.3)2 × a + (−0.3)2 × b + 0.72 × c = 1.69a + 0.09b + 0.49c = 0.81, 解得a = 0.3,b = 0.1,c = 0.6,故X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛6.01.03.0210.2.3.2. 方差的性质方差具有以下性质:(1)方差计算公式:Var (X ) = E (X 2) − [E (X )]2; (2)常数的方差等于零,即Var (c ) = 0;(3)设a , b 为常数,则Var (a X + b ) = a 2 Var (X ). 证:(1)Var (X ) = E [X − E (X )]2 = E [X 2 − 2X ⋅ E (X ) + E (X )2] = E (X 2 ) − 2E (X ) ⋅ E (X ) + [E (X )]2.= E (X 2) − [E (X )]2;(2)Var (c ) = E [c − E (c )]2 = E (c − c )2 = E (0) = 0;(3)Var (a X + b ) = E [(a X + b ) − E (a X + b )]2 = E [a X + b − a E (X ) − b ]2 = a 2 E [X − E (X )]2 = a 2 Var (X ). 由性质(1),显然有以下推论:推论 对于随机变量X ,如果E (X 2) 存在,则E (X 2) ≥ [E (X )]2.以后常利用方差计算公式Var (X ) = E (X 2) − [E (X )]2计算随机变量的方差.通常用公式计算比直接用定义计算方差要方便. 例 设X 的分布列为⎟⎟⎠⎞⎜⎜⎝⎛4.04.02.0321, 求Var (X ).解:前面已求得E (X ) = 2.2,因E (X 2) = 1 2 × 0.2 + 2 2 × 0.4 + 3 2 × 0.4 = 5.4, 故Var (X ) = E (X 2) − [E (X )]2 = 5.4 − 2.22 = 0.56. 例 已知X 的密度函数为⎩⎨⎧<<=.,0,10,2)(其他x x x p 求Var (X ).解:前面已求得32)(=X E , 因21422)(141022=⋅=⋅=∫x xdx x X E , 故1813221)]([)()Var(222=⎟⎠⎞⎜⎝⎛−=−=X E X E X . 对于随机变量X ,若方差Var (X ) 存在,且Var (X ) > 0.令)Var()(*X X E X X −=,有0)]()([)Var(1)]([)Var(1)Var()(*)(=−=−=⎟⎟⎠⎞⎜⎜⎝⎛−=X E X E X X E X E X X X E X E X E ; 1)Var()Var(1)](Var[)Var(1)Var()(Var *)Var(==−=⎟⎟⎠⎞⎜⎜⎝⎛−=X X X E X X X X E X X .称X *为X 的标准化随机变量.2.3.3. 切比雪夫不等式方差反映随机变量的分散程度,切比雪夫不等式给出其定量标准.切比雪夫不等式表明大偏差概率的上限与方差成正比.定理 设X 为随机变量,且方差Var (X ) 存在,则对于任何正数ε ,都有2)Var(}|)({|εεX X E X P ≤≥−.证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫≥−=≥−εε|)(|)(}|)({|X E x dx x p X E X P ,且∫∞+∞−−=−=dx x p X E x X E X E X )()]([)]([1)Var(22222εεε,故222|)(|22)Var()()]([)()]([}|)({|εεεεεX dx x p X E x dx x p X E x X E X P X E x =−≤−≤≥−∫∫∞+∞−≥−,得证.注:切比雪夫不等式的等价形式2)Var(1}|)({|εεX X E X P −≥<−.如随机变量X 的数学期望为E (X ) = 10,方差Var (X ) = 1,则由切比雪夫不等式可得43211}2|10{|}128{2=−≥<−=<<X P X P . 例 设随机变量X 的全部可能取值为),0[∞+,且数学期望E (X ) 存在,试证:对任何正数a ,都有)(1}{X E aa X P ≤≥. 证明:以连续型随机变量为例证明,设X 的密度函数为p (x ),有∫+∞=≥a dx x p a X P )(}{,且∫∫+∞+∞∞−==0)()(1)(1dx x p a x dx x xp a X E a ,故)(1)()(}{0X E adx x p a x dx x p a x a X P a =≤≤≥∫∫+∞+∞,得证.定理 设随机变量X 的方差存在,则Var (X ) = 0的充分必要条件是存在常数b ,使得X 几乎处处收敛于b ,即P {X = b } = 1.证:充分性,设存在常数b ,使得P {X = b } = 1,有P {X ≠ b } = 0,即E (X ) = b P {X = b } = b ,故Var (X ) = E [X − E (X )]2 = E (X − b )2 = 0 × P {X = b } = 0; 必要性,设X 的方差Var (X ) = 0,因事件U +∞=+∞→⎭⎫⎩⎨⎧≥−=⎭⎬⎫⎩⎨⎧≥−=>−11|)(|lim 1|)(|}0|)({|n n n X E X n X E X X E X ,则01)Var(lim 1|)(|lim 1|)(|}0|)({|21=⎟⎠⎞⎜⎝⎛≤⎭⎬⎫⎩⎨⎧≥−=⎟⎟⎠⎞⎜⎜⎝⎛⎭⎬⎫⎩⎨⎧≥−=>−+∞→+∞→+∞=n X n X E X P n X E X P X E X P n n n U , 可得P {| X − E (X )| > 0} = 0,即P {| X − E (X )| = 0} = 1,取b = E (X ),有b 为常数, 故P {X = b } = 1.注:如果P {X = b } = 1,记为X = b , a.e.(或a.s.),称为X = b 几乎处处成立(或几乎必然成立).这里,a.e.就是almost everywhere 的缩写,a.s.就是almost surely 的缩写.意味着不成立的情况是一个测度(或概率)等于零的集合(或事件).§2.4 常用离散分布对于一个给定的函数,只要满足概率函数的两条基本性质:非负性、正则性,都可以成为某个离散随机变量的概率函数.但绝大多数在实际工作中并不常见,下面是几种常用的概率函数. 2.4.1.两点分布与二项分布一.两点分布两点分布只可能在两个点取值,通常就是0或1.定义 随机变量的可能取值只有两个:0或1,且概率函数为p (0) = 1 − p ,p (1) = p , 其中0 < p < 1,称X 服从两点分布(Two-point Distribution )或0-1分布,记为X ~ (0-1).分布列为⎟⎟⎠⎞⎜⎜⎝⎛−p p110. 两点分布实际背景是一次伯努利试验.通常描述为:X 表示一次伯努利试验中事件A 发生的次数.非负性:p (0) = 1 − p > 0,p (1) = p > 0; 正则性:(1 − p ) + p = 1. 两点分布的数学期望为E (X ) = 0 × (1 − p ) + 1 × p = p .又因E (X 2 ) = 02 × (1 − p ) + 12 × p = p ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = p − p 2 = p (1 − p ).二.二项分布在n 重伯努利试验中,以X 表示事件A 的发生次数,则X 的全部可能取值为0, 1, 2, …, n ,且kn k p p k n k X P −−⎟⎟⎠⎞⎜⎜⎝⎛==)1(}{. 定义 若离散型随机变量X 的概率函数为kn k p p k n k p −−⎟⎟⎠⎞⎜⎜⎝⎛=)1()(, k = 0, 1, 2, …, n ;0 < p < 1, 则称X 服从二项分布(Binomial Distribution ),记为X ~ b (n , p ).二项分布的实际背景是n 重伯努利试验. 当n = 1时,二项分布就是两点分布.非负性:0)1()(>−⎟⎟⎠⎞⎜⎜⎝⎛=−kn k p p k n k p ; 正则性:1)]1([)1()(11=−+=−⎟⎟⎠⎞⎜⎜⎝⎛=∑∑=−=nnk k n k nk p p p p k n k p . 例 掷三枚硬币,X 表示正面朝上的次数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3 ,将掷每一枚硬币看作一次试验.每次试验两种结果:正面A ,反面A ;每次试验相互独立;每次试验概率5.0)(=A P . 即n 重伯努利试验,n = 3,5.0=p ,有X ~ b (3, 0.5),p (0) = 0.5 3 = 0.125,375.05.05.013)1(21=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 375.05.05.023)2(12=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (3) = 0.5 3 = 0.125.例 现有5台机床,每台机床一小时内平均开动18分钟,且是否开动相互独立,以X 表示同一时刻开动的机床数,求X 的概率分布.解:X 的全部可能取值为0, 1, 2, 3, 4, 5 ,将每台机床是否开动看作一次试验.每次试验两种结果:开动A ,不开动A ;每次试验相互独立;每次试验概率P (A ) = 0.3. 即n 重伯努利试验,n = 5,p = 0.3,有X ~ b (5, 0.3).p (0) = 0.7 5 = 0.16807,36015.07.03.015)1(41=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 3087.07.03.025)2(32=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 1323.07.03.035)3(23=××⎟⎟⎠⎞⎜⎜⎝⎛=p , 02835.07.03.045)4(14=××⎟⎟⎠⎞⎜⎜⎝⎛=p , p (5) = 0.3 5 = 0.00243 .一般地,如果随机变量X 服从二项分布,概率函数值p (k ) 将随着k 的增加,先逐渐增加,达到最大值后,又逐渐减少.通常,一个随机变量X 的概率函数或密度函数的最大值点称为X 的最可能值.二项分布b (n , p )的最可能值为⎩⎨⎧+−++++=.)1(,1)1()1(,)1(],)1[(0是正整数时当或不是正整数时当p n p n p n p n p n k 这里[x ]表示不超过x 的最大整数.如[2.3] = 2,[3.14] = 3,[−1.2] = −2.证:若X ~ b (n , p ),有n k p p k n k n p p k n k p k n k kn k ≤≤−−=−⎟⎟⎠⎞⎜⎜⎝⎛=−−0,)1()!(!!)1()(, 则11)1()!1()!1(!)1()!(!!)1()(+−−−−+−−−−−=−−k n k k n k p p k n k n p p k n k n k p k p ⎟⎠⎞⎜⎝⎛+−−−⋅−−−=−−11)1()!()!1(!1k n p k pp p k n k n k n k)1()1()1()!()!1(!1+−−+⋅−−−=−−k n k k p n p p k n k n k n k , 当k < (n + 1) p 时,有p (k ) > p (k − 1);当k > (n + 1) p 时,有p (k ) < p (k − 1).如果(n + 1) p 不是正整数,取k 0 = [(n + 1) p ],有k 0 < (n + 1) p ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > (n + 1) p ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果(n + 1) p 是正整数,取k 0 = (n + 1) p ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值.如X ~ B (3, 0.5),有(n + 1) p = 4 × 0.5 = 2是正整数,最可能值k 0 = 2或1;X ~ B (5, 0.3),有(n + 1) p = 6 × 0.3 = 1.8不是正整数,最可能值k 0 = [1.8] = 1.三.二项分布的数学期望和方差组合数公式⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=−⋅−−⋅=−⋅=⎟⎟⎠⎞⎜⎜⎝⎛11)!()!1()!1()!(!!k n k n k n k n k n k n k n k n , (n ≥ k > 0). 二项分布b (n , p )的数学期望为∑∑∑=−−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅⋅=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k kn k nk k n k p p k n np p p k n k n k p p k n k X E 1110)1(11)1(11)1()( = np [ p + (1 − p )]n − 1 = np .又因∑∑∑=−=−=−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−=−⎟⎟⎠⎞⎜⎜⎝⎛⋅=nk k n k n k k n k nk k n k p p k n k p p k n k k p p k n k X E 002022)1()1(11)()1()( )()1(22)1()1()(22X E p p k n k k n n k k nk k n k+−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=∑=− np p p k n pn n nk kn k +−⎟⎟⎠⎞⎜⎜⎝⎛−−−=∑=−−222)1(22)1( = n (n − 1) p 2 [ p + (1 − p )]n − 2 + np = (n 2 − n ) p 2 + np ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = (n 2 − n ) p 2 + np − (np )2 = − np 2 + np = np (1 − p ).2.4.2.泊松分布一.泊松分布泊松分布是一种理论推导的极限分布(成立的条件和推导过程见附录). 定义 若随机变量X 的概率函数为λλ−=e !)(k k p k, k = 0, 1, 2, …… ;λ > 0,则称X 服从参数为 λ 的泊松分布(Poisson’s Distribution ),记为X ~ P (λ).泊松分布的实际背景是已知平均发生次数为常数λ ,实际发生次数的概率分布.如足球比赛进球数,商店进店人数,电话接听次数等.非负性:λ > 0时,0e !>−λλk k;正则性:1e e e !=⋅=⋅−∞=−∑λλλλk kk .例 已知一场足球比赛的进球数X 服从参数λ = 2.3的泊松分布,求比分为0:0, 1:0以及总进球数超过5个的概率.解:因X ~ P(2.5),则3.2e !3.2)(−=k k p k , k = 0, 1, 2, …….比分0:0,即X = 0,100.0e e !03.2)0(3.23.20===−−p (查表);比分1:0,即X = 1,231.0100.0331.0e 3.2e !13.2)1(3.23.21=−===−−p (查表);总进球数超过5个,即X > 5,030.0970.01e !3.21e!3.2}5{53.263.2=−=−==>∑∑=−∞=−k k k k k k X P (查表). 例 已知某公用电话每小时内打电话的人数X 服从参数为λ = 8的泊松分布.求某一小时内无人打电话的概率,恰有10人打电话的概率,至少有10人打电话的概率.解:因X ~ P(8),有8e !8}{−==k k X P k . 无人打电话的概率0003.0e e !08}0{880====−−X P ,恰有10人打电话的概率099.0717.0816.0e !108}10{810=−===−X P (查表),至少有10人打电话的概率283.0717.01}9{1e !8}10{108=−=≤−==≥∑∞=−X P k X P k k (查表). 例 已知某商店一天中某种贵重商品的销售件数X 服从泊松分布P (7),问该商店每天应该准备多少件该商品才能以99.9%以上的概率满足顾客需要?解:设准备了a 件该商品,X ~ P(7),则7e !7)(−=k k p k .事件“满足顾客需要”,即X ≤ a ,有P {X ≤ a } ≥ 0.999,故查表可得a = 16. 泊松分布P (λ )的最可能值为⎩⎨⎧−=.,1,],[0是正整数时当或不是正整数时当λλλλλk 证:若X ~ P(λ),有L ,2,1,0,e !)(==−k k k p kλλ,故k k k k k k k k p k p k k k k−⋅−=⎟⎠⎞⎜⎝⎛−⋅−=−−=−−−−−−−−−λλλλλλλλλλe )!1(1e )!1(e)!1(e !)1()(111,当k < λ 时,有p (k ) > p (k − 1);当k > λ 时,有p (k ) < p (k − 1).如果λ 不是正整数,取k 0 = [λ ] ,有k 0 < λ ,即p (k 0) > p (k 0 − 1);且k 0 + 1 > λ ,即p (k 0 + 1) < p (k 0). 故p (k 0) 为最大值.如果λ 是正整数,取k 0 = λ ,即p (k 0) = p (k 0 − 1), 故p (k 0) 和p (k 0 − 1) 都是最大值. 二.泊松分布的数学期望和方差泊松分布P (λ )的数学期望为λλλλλλλλλλλ=⋅=−⋅=−=⋅=−∞=−−∞=−∞=−∑∑∑e e )!1(e e)!1(e!)(111k k k kk kk k k k X E ,即泊松分布的参数 λ 反映平均发生次数.又因)()!2(e e!e!)(e!)(222222X E k k k k k k k k X E k k k kk kk k+−⋅=⋅+⋅−=⋅=∑∑∑∑∞=−−∞=−∞=−∞=−λλλλλλλλλ= λ 2 e −λ ⋅ e λ + λ = λ 2 + λ ,故方差为Var (X ) = E (X 2 ) − [E (X )]2 = λ 2 + λ − (λ )2 = λ .三.二项分布的泊松近似二项分布与泊松分布的实际背景都是反映发生次数问题.下面的定理说明了二者之间的联系,泊松分布是二项分布的一种极限分布. 定理 (泊松定理)在n 重伯努利试验中,记事件A 在每次试验中发生的概率为与试验次数n 有关的数p n ,如果当n → +∞ 时,有n p n → λ ,则λλ−−+∞→=−⎟⎟⎠⎞⎜⎜⎝⎛e !)1(lim k p p k n k k n n k n n . 证:记λ n = n p n ,有λλ=+∞→n n lim ,因nk n n n kn n k n n n n n n p )(11)1(−−⋅−−−⎟⎠⎞⎜⎝⎛−+=⎟⎠⎞⎜⎝⎛−=−λλλλ,且e 1lim =⎟⎠⎞⎜⎝⎛−+−+∞→nnn n n λλ,λλ−=−−+∞→n k n n n )(lim , 则λλλλ−−−⋅−+∞→−+∞→=⎟⎠⎞⎜⎝⎛−+=−e 1lim )1(lim )(n k n n n n k n n n n n n p ,又因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛n k n k n k k n n n k n k 1111!!)1()1(L L ,且11111lim =⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−+∞→n k n n L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−−=−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→−+∞→n k n p p k n p p k n k n nk n k n k n n k n n 1111)1(!lim )1(lim L λλ−+∞→−+∞→+∞→=⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅=e !1111lim )1(lim !)(lim k n k n p k np k n k n n n k n n L . 此定理表明对于二项分布b (n , p ),当n 很大,p 很小时,可用泊松分布P (λ ) 近似,其中λ = n p .例 某地区每年人口意外死亡率为0.0001,现有60000人投保人身意外保险,求一年内因投保人意外死亡恰好赔付8人的概率以及赔付不超过5人的概率.解:设X 表示“一年内因投保人意外死亡而赔付的人数”,X ~ B (60000, 0.0001).则5999289999.00001.0860000}8{××⎟⎟⎠⎞⎜⎜⎝⎛==X P ,∑=−××⎟⎟⎠⎞⎜⎜⎝⎛=≤50600009999.00001.060000}5{k kk k X P , 但显然计算很繁琐,为便于计算,用泊松分布近似.因n = 60000很大,p = 0.0001很小,λ = np = 6,有)6(~P X &,故103.0744.0847.0e !86}8{68=−=≈=−X P ,446.0e !6}5{506=≈≤∑=−k k k X P .2.4.3. 超几何分布一.超几何分布在N 件产品中,有M 件次品,从中不放回地取n 件,以X 表示取得的次品数.设X 取值为k ,一方面,显然有k ≤ n 且k ≤ M ,即k ≤ min{n , M },另一方面,有k ≥ 0且n − k ≤ N − M ,可得k ≥ M + n − N ,即k ≥ max{0, M + n − N }.这样X 的全部可能取值为l , l + 1, …, L ,其中l = max{0, M + n − N },L = min{n , M },且⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛==n N k n M N k M k X P }{.定义 若随机变量X 的概率函数为⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=n N k n M N k M k p )(,k = l , l + 1, …, L ,l = max(0, n + M − N ),L = min(M , n ),M < N ,n < N , 则称X 服从超几何分布(Hypergeometric Distribution ),记为X ~ h (n , N , M ).超几何分布的实际背景是古典概型中的不放回抽样检验问题. 注:有放回检验抽样问题对应的是二项分布.非负性:0>⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛n N k n M N k M ;正则性:10=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑∑==n N n N n N k n M N k M n N k n M N k M Ll k L k .注:比较(1 + x )M(1 + x )N − M与(1 + x )N中x n的系数可以证明⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛∑=n N k n M N k M Ll k .例 一袋中有3个红球,2个白球,不放回地取出3个球,X 表示取得的红球数.求X 的概率分布.解:不放回抽样,N = 3,M = 2,n = 3,则X ~ h (3, 5, 3).故X 的全部可能取值为1, 2, 3, (l = max (0, n + M − N ) = 1,L = min(n , M ) = 3),3.0352213}1{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,6.0351223}2{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P ,1.0350233}3{=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛==X P . 超几何分布h (n , N , M )的最可能值为⎪⎩⎪⎨⎧+++−++++++++++++=.21)1(,121)1(21)1(,21)1(],21)1[(0是正整数时当或不是正整数时当N M n N M n N M n N M n N M n k证:若X ~ h (n , N , M),有)!()!()!()!(!!1)(k n M N k n M N k M k M n N n N k n M N k M k p +−−−−⋅−⋅⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛=, 故p (k ) − p (k − 1))!1()!1()!1()!1()!(!)!()!()!(!)!(!−+−−+−+−−⎟⎟⎠⎞⎜⎜⎝⎛−−+−−−−⎟⎟⎠⎞⎜⎜⎝⎛−=k n M N k n k M k n N M N M k n M N k n k M k n N M N M)]()1)(1[()!()!1()!1(!)!(!k n M N k k n k M k n M N k n k M k n N M N M +−−−+−+−+−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=)]2()1)(1[()!()!1()!1(!)!(!+−+++−−+−+−⎟⎟⎠⎞⎜⎜⎝⎛−=N k n M k n M N k n k M k n N M N M .当21)1(+++<N M n k 时,有p (k ) > p (k − 1);当21)1(+++>N M n k 时,有p (k ) < p (k − 1). 如果21)1(+++N M n 不是正整数,取21)1[(0+++=N M n k ,有21)1(0+++<N M n k ,即p (k 0) > p (k 0 − 1);且21)1(10+++>+N M n k ,即p (k 0 + 1) < p (k 0).故p (k 0) 为最大值.如果21)1(+++N M n 是正整数,取21)1(0+++=N M n k ,即p (k 0) = p (k 0 − 1),故p (k 0) 和p (k 0 − 1) 都是最大值. 二.超几何分布的数学期望和方差超几何分布h (n , N , M )的数学期望为N nM n N k n M N k M N nM n N n N k n M N k M k M k n N k n M N k M k X E Ll k L lk L l k =⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=∑∑∑===11111111)(, 又因∑∑∑===⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅+⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛⋅=L lk L l k Ll k n N k n M N k M k n N k n M N k M k k n N k n M N k M k X E )()(222 ∑=+⎟⎟⎠⎞⎜⎜⎝⎛−−−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−−−⋅−=Llk X E n N n n N N k n M N k M k k M M k k )(22)1()1(22)1()1()(2N nM N N M M n n N nM n N k n M N k M N N M M n n Ll k +−−−=+⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−−⋅−−−=∑=)1()1()1(2222)1()1()1(, 故方差为)1())(()1()1)(1()]([)()Var(222222−−−=−+−−−=−=N N n N M N nM N M n N nM N N M n nM X E X E X . 为了便于记忆,可将超几何分布与二项分布的数学期望和方差进行比较.二项分布b (n , p ):数学期望E (X ) = np ,方差Var (X ) = np (1 − p );超几何分布h (n , N , M ):数学期望N M nX E =)(,方差11)Var(−−⎟⎠⎞⎜⎝⎛−=N n N N M N M n X ; 可见分布h (n , N , M )中的N M 相当于二项分布b (n , p )中的p ,方差修正因子为1−−N nN . 三.超几何分布的二项近似直观上,当抽样个数n 远小于M 及N − M 时,不放回抽样问题可近似看作有放回抽样问题,也就是此时超几何分布可用二项分布近似.定理 如果当N → +∞ 时,p NM→, (0 < p < 1),则k n k N p p k n n N k n M N k M −+∞→−⎟⎟⎠⎞⎜⎜⎝⎛=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛)1(lim . 证:因⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=+−−=⎟⎟⎠⎞⎜⎜⎝⎛N n N n N n n N N N n N n 1111!!)1()1(L L , 且⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛M k M k M k M k 1111!L ,⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−=⎟⎟⎠⎞⎜⎜⎝⎛−−−M N k n M N k n M N k n M N kn 1111)!()(L , 故⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−=⎟⎟⎠⎞⎜⎜⎝⎛⎟⎟⎠⎞⎜⎜⎝⎛−−⎟⎟⎠⎞⎜⎜⎝⎛−+∞→+∞→N n N n N M N k n M N k n M N M k M k M n N k n M N k M n k n k N N 1111!1111)!()(1111!lim lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅−⋅−=−+∞→N n N M N k n M N M k M N M N M k n k n nk n k N 111111111111)()!(!!lim L L L ⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛−−−−⎟⎠⎞⎜⎝⎛−−⋅⎟⎠⎞⎜⎝⎛−−⎟⎠⎞⎜⎝⎛−⋅⎟⎠⎞⎜⎝⎛−⎟⎠⎞⎜⎝⎛⋅⎟⎟⎠⎞⎜⎜⎝⎛=+∞→−+∞→N n N M N k n M N M k M N M N M k n N kn k N 111111111111lim 1lim L L L。
第二章知识点:1.离散型随机变量:设X 是一个随机变量,如果它全部可能的取值只有有限个或可数无穷个,则称X 为一个离散随机变量。
2.常用离散型分布:(1)两点分布(0-1分布):若一个随机变量X 只有两个可能取值,且其分布为12{},{}1(01)P X x p P X x pp ====-<<则称X 服从12,x x 处参数为p 的两点分布。
两点分布的概率分布:12{},{}1(01)P X x p P X x pp ====-<<两点分布的期望:()E X p =两点分布的方差:()(1)D X p p =-(2)二项分布: 若一个随机变量X 的概率分布由式{}(1),0,1,...,.k k n k n P x k C p p k n -==-=给出,则称X 服从参数为n,p 的二项分布。
记为X~b(n,p)(或B(n,p)). 两点分布的概率分布:{}(1),0,1,...,.k kn k n P x k C p p k n -==-=二项分布的期望:()E X np =二项分布的方差:()(1)D X np p =-(3)泊松分布:若一个随机变量X 的概率分布为{},0,0,1,2,...!kP X k e k k λλλ-==>=则称X 服从参数为λ的泊松分布,记为X~P (λ)泊松分布的概率分布:{},0,0,1,2,...!kP X k e k k λλλ-==>=泊松分布的期望:()E X λ=泊松分布的方差:()D X λ=4.连续型随机变量:如果对随机变量X 的分布函数F(x),存在非负可积函数()f x ,使得对于任意实数x ,有(){}()xF x P X x f t dt -∞=≤=⎰,则称X 为连续型随机变量,称()f x 为X 的概率密度函数,简称为概率密度函数。
5.常用的连续型分布: (1)均匀分布:若连续型随机变量X 的概率密度为则称X 在区间(a,b )上服从均匀分布,记为X~U(a,b)均匀分布的概率密度: 均匀分布的期望:()2a bE X +=均匀分布的方差:2()()12b a D X -=(2)指数分布:若连续型随机变量X 的概率密度为00()0xe xf x λλλ-⎧>>=⎨⎩则称X 服从参数为λ的指数分布,记为 X~e (λ)指数分布的概率密度:00()0xe xf x λλλ-⎧>>=⎨⎩⎪⎩⎪⎨⎧<<-=其它,0,1)(b x a ab x f ⎪⎩⎪⎨⎧<<-=其它,0,1)(bx a ab x f指数分布的期望:1()E X λ=指数分布的方差:21()D X λ=(3)正态分布:若连续型随机变量X 的概率密度为22()21()x f x ex μσ--=-∞<<+∞则称X 服从参数为μ和2σ的正态分布,记为X~N(μ,2σ)正态分布的概率密度:22()21()x f x ex μσ--=-∞<<+∞正态分布的期望:()E X μ=正态分布的方差:2()D X σ=(4)标准正态分布:20,1μσ==2222()()x t xx ex e dt ϕφ---∞=⎰标准正态分布表的使用: (1)0()1()x x x φφ<=--(2)~(0,1){}{}{}{}()()X N P a x b P a x b P a x b P a x b b a φφ<≤=≤≤=≤<=<<=-(3)2~(,),~(0,1),X X N Y N μμσσ-=故(){}{}()X x x F x P X x P μμμφσσσ---=≤=≤={}{}()()a b b a P a X b P Y μμμμφφσσσσ----<≤=≤≤=-定理1: 设X~N(μ,2σ),则~(0,1)X Y N μσ-=6.随机变量的分布函数:设X 是一个随机变量,称(){}F x P X x =≤为X 的分布函数。
第二章 随机变量及其概率分布1. 离散型随机变量()01k K K KP X x p p ==≥⎧⎪⎨=⎪⎩∑ 例1 设 ,则3.02.05.01=--=c------------------------------------------------------------------------------------------------ 8.知识点:离散型随机变量的分布律性质下列各表中可作为某随机变量分布律的是( ) A . B .C .D .答案:C解:A 事件概率不可能为负值 B ,D1i iP ≠∑返回:第二章 随机变量及其概率分布------------------------------------------------------------------------------------------------2.常见离散型随机变量(1)0—1分布:设X ~),1(p B ,则应用背景:一次抽样中,某事件A 发生的次数X ~),1(p B ,其中EX X P A P p ====)1()(例2 设某射手的命中率为p ,X 为其一次射击中击中目标的次数,则X ~),1(p B(2)二项分布:设X ~),(p n B ,则()(1),0,1,2,,k k n kn P X k C p p k n -==-=应用背景:n 次独立重复抽样中某事件A 发生的次数X ~),(p n B ,其中()p P A =为事件A 在一次抽样中发生的概率。
例3 某射手的命中率为0.8,X 为其5次射击中命中目标的次数,则X 取的可能值为5,,1,0 ,52()0.80.2k k k P X k C -==,即X ~)8.0,5(B记住:若X ~),(p n B ,则np EX =,)1(p np DX -=------------------------------------------------------------------------------------------------ 9.知识点:事件的关系及二项分布设每次试验成功的概率为)10(<<p p ,则在3次独立重复试验中至少成功一次的概率为( ) A .3)1(1p -- B .2)1(p p - C .213)1(p p C -D .32pp p ++答案:A解: 利用对立事件求解。
第二章 随机变量及其分布第一节 离散型随机变量离散型随机变量:若随机变量的取的值是有限个或可列无限多个,就叫做离散型随机变量 离散型随机变量的分布律:1)等式形式{},1,2,===k k P X x p k 且11∞==∑kk p2)表格形式:分布律性质:1. 0,1,2.....≥=k p k 2. 11∞==∑kk p步骤:1.找到所有可能取值2.算出每种取值的概率3.概率相加为1 方法:1.定取值:取值点就是分断点.2.概率:挨着减.3.三种重要的离散型随机变量: 1.(0-1)分布{}1(1),0,1(01)-==-=<<k k P X k p p k p2.二项分布(,)XB n p1)背景:独立地重复进行n 次实验,成功的次数服从二项分布. 2)若(,)XB n p ,则1(,1)--XB n p定义:若随机变量X 的可能有取值为0.1.2…n,而X 的分布律为()(1),0,1,2,...-==-=k kn k n P X k C p p k n其中01,1<<+=P p q 则称X 服从参数为n,p 的二项分布,记为(,)X B n pn 重伯努利试验伯努利试验:设试验E 只有两个可能结果:A 及A ,则称E 为伯努利试验,设P(A)=p(0<p<1),此时P(A )=1-p. 二项分布的应用:产品的合格与不合格,机器故障等 3.泊松定理:当X 服从二项分布,(,)XB n p ,若:lim 0(为常数),λλ→+∞=>n n np 则有:2lim ()(1),0,1,2,...!()λ--→+∞==-==k kk n knn e P X k C p p k n k泊松分布X ~P(λ)设随机变量X 所以可能取的值为0,1,2,…,而取各个值的概率为{}!λλ-===k k e p P X k k ,k=0,1,2,……其中λ>0是常数,则称X 服从参数为λ的泊松分布,记为X ~P(λ) 泊松分布的应用:某一时段时段内某一事件所发生的次数 第二节 非离散型随机变量:非离散型随机变量取任一指定点的实数值的概率都等于01.分布函数:设X 是一个随机变量,x 是任意实数,函数F(x)=P{X ≤x},(,)∈-∞+∞x 称为X 的分布函数 对于任意实数1x ,2x (1x <2x ),有122121{}{}{}()()<≤=≤-<=-P x X x P X x P X x F x F x随机变量的分布函数:定义:设X 是一个随机变量,对于任意实数x,令{}(),=≤-∞<<+∞F x P X x x 称()F x 为随机变量的概率分布函数,简称分布函数.利用分布函数()=X f x 求各种随机事件的概率: 1.{}()≤=P X a F a2.{}{}11()>=-≤=-P X a P X a F a3. {}(0)lim ()-→<=-=x aP X a F a F a 4. {}{}11(0)≥=-<=--P X a P X a F a5. {}{}{}()(0)==≤-<=--P X a P X a P X a F a F a6. {}{}{}()()<≤=≤-≤=-P a X b P X b P X a F b F a7. {}{}{}(0)(0)≤<=<-<=---P a X b P X b P X a F b F a8. {}{}{}(0)()<<=<-≤=--P a X b P X b P X a F b F a 9.{}{}{}()(0)≤≤=≤-<=--P a X b P X b P X a F b F a2. 分布函数的基本性质: 1) 非负性:0()1≤≤F x2) 规范性:()lim ()0,()lim ()1→-∞→+∞-∞==+∞==x x F F x F F x3) 单调不减性:对任意1212,()()<≤x x F x F x (函的的单调性判断可通过求导:导数大0,增,小于0,减) 4) 右连续性:()(0)lim ()()+→=+=+=x F x F x F x x F x性质2.4可用来确定分布函数中的未知参数.(只要分布函数含有未知参数,就用这两条来推得) 1.2.3.4是一个函数能够成为某一随机变量分布函数的充要条件.(4条共用以判定是否为分布函数)已知X 的分布函数F(x),可求出:{}{}{}()()()1()≤=<≤=->=-P X b F b P a X b F b F a P X b F b第三节 连续型随机变量1. 连续型随机变量及其概率密度定义:若对于随机变量X 的分布函数F(x),存在非负函数f(x),使对于任意实数x 有()()-∞=⎰xF x f t dt,则称X 为连续型随机变量, 概率密度的性质:1.f(x)≥0,(-∞≤≤+∞x )(非负性)2.()1∞-∞=⎰f x dx (规范性)(作用:可用来定义未知参数)(介于()=y f x 与X 轴之间在面积等G .)(1.2是判断一个函数是否是密度函数的充要条件) 3.{}()()(),<≤=-=≤⎰ba P a Xb F b F a f x dx a b(作用:求概率)(落在区间(a.b ]的概率是曲边梯形的积) (不论区间开闭,都一样,离散型无这性质) 4.分布函数()()-∞=⎰x F x f t dt是连续函数.5.连续型随机变量在任意点0x 取值概率0{}0==P X x6.若f(x)在点x 处连续,则有F ′(x)=f(x)(结合变上限积分的求导法则()*()()()-∞'==⎰xf x f t dtF x )(可用于已知分段函数求概率密度) 注意: 1.()()-∞=⎰x F t f t dt()F t 一定连续,但()f t 不一定连续.2. 0()1≤≤F x ()f x 不是概率,概率密度.()∆f x x 是概率.3. ()f x 大小可以反映概率的大小.当()f x 为分段函数时,F(x)也是分段函数,二者有相同的分段点. 均匀分布~(a,b)X U密度函数 1,,()0,其它⎧≤≤⎪-⎨⎪⎩a xb f x b a~(a,b)X U ,≤<≤a c d b ,则()-<<=-d c P c x d b a分布函数0,F(),,0,其它<⎧⎪-⎪≤≤⎨-⎪⎪⎩x a x a x a x b b a指数分布~()λX E密度函数 ,0(),0,0λλ-⎧>=⎨≤⎩x e x f x x分布函数1,0(),0,0λ-⎧->=⎨≤⎩x e x F x x正态分布2~(,)μσX N )密度函数22()21(),,2μσπσ--=-∞<<∞x f x ex标准正态~(0,1)X N概率密度 ()ϕx =2212πx e ,(-∞<<∞x )分布函数()Φx =2212π-∞⎰t xe dt (-∞<<∞x )正态分布曲线的性质:a) 曲线关于直线=x u 对称.对于任何0>h ,有:{}{},-<≤=≤<+P u h X u P u X u hb) 当=x u 取到最大值的时候,1(),2πσ=f u 在σ=±x u 处,曲线有拐点,曲线以x 轴为渐近线.c) 当σ取定,12<u u 时,212222()21()221()21()2μσμσπσπσ----==x x f x ef x e两条曲线可互相沿着X 轴平行移动而得,不改变形状,可见正太分布典线的位置完全由u 决定.d) 当u 取定,12σσ<时,221222()231()2421()21()2μσμσπσπσ----==x x f x ef x e可见,当σ越小,图形越尖锐.σ越大,图形越平缓,可见σ值刻画了正态随机变量取值的分散程度,σ越小分散程度越小,σ越大分散程度越大.其分布函数为:22()21()2μσπσ--=-∞⎰t x F x e dt()ϕx 的图形关于Y 轴对称.()ϕx 在x =0时取得最大值12π.特例:2()-∞=-∞⎰x F x e dx (2=tx )222()()22()212212πππ---∞∞⇒⇒-∞-∞∞⇒⇒-∞⎰⎰⎰t t t ted e dte dt标准正态分布函数的性质: a) ()1()Φ-=-Φx x b) ()()ϕϕ-=x x c)1(0)2Φ=d) {}2()1≤=Φ-P X a a 解决正态分布的步骤:1) 正态标准化. 一般分布:X ~N(μ,2σ)通过线性变换:σ-=x uz 化成标准正态.2) 利用标准正态的对称性 3) 查表计算引理:若X ~N(μ,2σ),其分布函数为F(x),则: 1.{}()()σ-=≤=Φx uF x P X x (从一般正态到标准正态)2.{}{}{}{}()()σσ<≤=≤≤=≤<--=<<=Φ-ΦP a X b P a X b P a X b b ua uP a X b3. {}{}1()σ->=≥=-Φa uP X a P X a第四节 随机变量函数的概率分布1. 离散型随机变量函数的概率分布概率对应 顺序重排2. 连续型随机变量函数的概率分布其概率密度为 '[()](),(),0,其他αβ⎧<<⎪=⎨⎪⎩X Y f h y h y y f y()h y 是根据()=Y g x 所求得的反函数()=x h y()'h y 是对反函数求导。
第二章 随机变量及其分布 §1.随机变量与分布函数一、随机变量的概念定义:假设Ω为试验E 的样本空间,对任意的ω∈Ω都赋予一个实数X (ω)与之对应,则实值函数X ()称为随机变量,一般用X ,Y ,Z 或者,ξη 注:1、Z (ω)由ω唯一确定2、随机变量X 与实数x 的区别3、对实数x ,事件{X ≤x}有一定的概率,P{X ≤x} 二、分布函数定义:设(Ω, ,P )为概率空间,还为定义在Ω上的随机变量,对任意x ∈R ,一元实值函数F (x )= P{X ≤x},称为r ,v ,X 的概率分布函数,简称分布函数 注:1、F (x )= P{X ≤x},x ∈R2、分布函数是指描述随机变量分布的根本方法3、分布函数的性质性质1、(单调性)对任意的12X X ≤,有F (1X )≤F (2X ) 注:P (a X b <≤)=F (b )-F (a )P (a X b ≤≤)= F (b )-F (a )+P (X=a )P (a X b ≤<)= F (b )-F (a )+P (X=a )-P (X=b ) P (a X b <<)= F (b )-F (a )-P (X=b ) P (X a ≤)= F (a ) P (a X <)=1- F (a ) 性质2、(有界性):0≤F (x )1≤ 性质3、()lim ()1x F F x →+∞+∞==()lim ()0x F F x →-∞-∞==性质4、(右连续性) 对任意x ∈R ,有F (x+0)=F (x ) 证明:设x A ={X ≤x+1n} 则123......A A A ⊇⊇⊇且n ={}n A X x +∞=-∞⋂≤所以F(x)=P{X ≤x}=P(1n n A ∞=⋂)=lim ()n n P A →+∞=n +11lim (x+)=lim ()nn P X F x n→+∞→∞≤+由F(x)的单调性 F(x)=F(x+0)例:设r.v.X 的分布函数为F(x)=A+Barctanx x ∈R 求待定系数A.B 由F(+∞)=1 F(-∞)=0 得到lim (arctan )12x A B x A B π→+∞+=+=lim (arctan x )=a-02x A B B π→∞+= 所以A=12B=1π第二节 离散型r .v .及其分布一.基本概念定义:设X 为样本空间Ω的随机变量,若存在一个有限或可列无限集B ,使得P{X ∈B}=1则称X 为离散型r . v . 设其所有可列取值为{k X } K=1.2.3……n …则k P =P(X=k X ) K=1.2.3…..n …则称为X 的概率分布列[注]:1.概率分布列是描述离散型随机变量的概率分布的方法之一分布矩阵1212........................n n x x x p p p ⎛⎫⎪⎝⎭3.非负性:k P >0.k=1.2….. 归一性:K kP ∑=14.求离散型r . v . 分布列的步骤Step1:列出r . v . X 的所有可能取值 Step2:计算几个取值对应的概率例:甲乙两队进行比赛,规定谁先赢三局获胜。
《概率论与数理统计》第二章基础知识小结第二章、基础知识小结一、 离散型分布变量分布函数及其分布律 1. 定义:),3,2,1(}{ ===i p x X P i iX1x 2x 3x … k x …P1p 2p 3p … k p …2.分布律}{k p 的性质: (1);,2,1,0 =≥k p k (2)11=∑∞=k k p3.离散型随机变量的分布函数:∑≤=≤=xx kk px X P x F }{)(4.分布函数F (X )的性质: (1)1)(0≤≤x F(2))(x F 是不减函数,0)()(}{1221≥-=≤<x F x F x X x P(3)1)(,0)(=+∞=-∞F F ,即1)(lim ,0)(lim ==+∞→-∞→x f x f x x (4))(x F 右连续,即)()(lim )0(0x F x x F x F x =∆+=+→∆(5))()(}{}{}{a F b F a X P b X P b X a P -=≤-≤=≤<)(1}{1}{a F a X P a X P -=≤-=>5.三种常见的离散型随机变量的概率分布(1)0-1分布(),1(~p B X )X 0 1 Pp q(2)二项分布(),(~p n B X )n k q p C k X P p kn k k n k ,,2,1,0,}{ ====-(3)泊松分布()(~λP X ),,,2,1,0,!}{n k e k k X P p kk ====-λλ二、连续型随机变量分布函数及其概率密度 1.连续型随机变量的分布函数即概率密度定义:dt t f x X P x F x⎰∞-=<=)(}{)(其中,)(x F 为X 的分布函数,)(x f 为X 的概率密度。
2.概率密度的性质 (1)0)(≥x f (2)1)(=⎰+∞∞-dx x f(3)dx x f a F b F b X a P ba ⎰=-=≤<)()()(}{ (4))()(x f x F ='3.三种常见的连续型随机变量 (1)均匀分布(),(~b a U X )⎪⎩⎪⎨⎧≤≤-=其他,0,1)(b x a a b x f(2)指数分布()(~λE X )⎩⎨⎧≤>=-0,00,)(x x e x f x λλ(3)正态分布(),(~2σμN X )+∞<<-∞=--x ex f x ,21)(222)(σμσπ(4)标准正态分布()1,0(~N X )及其性质+∞<<-∞=-x ex f x ,21)(22π性质:A.)(1)(x x ΦΦ-=-B.21)0(=Φ(5)非标准正态分布标准化 设),(~2σμN X ,则z =x −μσ~N(0,1)三、随机变量函数的概率分布 1.离散型随机变量函数的概率分布 设离散型随机变量X 的分布律为:X1x 2x 3x …k x …P1p 2p 3p …k p …则X 的函数)(X g Y =的分布律为:X)(1x g )(2x g )(3x g … )(k x g …P1p 2p 3p …k p …2.连续型随机变量函数的分布设X 的连续型随机变量,其概率密度为)(x f X 。
概率论与数理统计复习 第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现. 样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果. 随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(?):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A∪B (和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A-B(差事件)事件A 发生而B 不发生.5. AB=? (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=?且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德?摩根律 B A B A I Y = B A B A Y I = 三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率. (1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+… 2.性质(1) P(?) = 0 , 注意: A 为不可能事件 P(A)=0 . (2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理) (3)若A ⊂B, 则P(A)≤P(B), P(B-A)=P(B)-P(A) . (4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) . 对于任意n 个事件A 1,A 2,…,A n…+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数. 五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0). P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则当P(B i )>0时,有全概率公式 P(A)=()()i ni i B A P B P ∑=1当P(A)>0, P(B i )>0时,有贝叶斯公式P (B i |A)=()()()()()()∑==ni i i i i i B A P B P B A P B P A P AB P 1. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件. (1)两个事件A,B 相互独立? P(B)= P (B|A) .(2)若A 与B,A 与B ,A 与B, ,A 与B 中有一对相互独立,则另外三对也相互独立.2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()kki i i i i i A P A P A P A A A P ΛΛ2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2). (3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1). 二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为: (1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()kn k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1) (3))X~?(?)参数为?的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (?>0)三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 . 3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << .(2)X 服从参数为?的指数分布.()⎩⎨⎧=-0/1θθx ex f 00≤>x x 若若 (?>0).(3)X~N (?,?2)参数为?,?的正态分布 222)(21)(σμσπ--=x e x f -?<x<?, ?>0.特别, ?=0, ?2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--xt dt e x 2221)(π, ?(-x)=1-Φ(x) .若X ~N ((?,?2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z ?}= P{Z<-z ?}= P{|Z|>z ?/2}= ?,则点z ?,-z ?, ?z ?/ 2分别称为标准正态分布的上,下,双侧?分位点. 注意:?(z ?)=1-? , z 1- ?= -z ?. 四.随机变量X 的函数Y= g (X)的分布 1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律. 2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法: (1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f ky X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y其中h(y)是g(x)的反函数 , ?= min (g (-?),g (?)) ?= max (g (-?),g (?)) .如果 f (x)在有限区间[a,b]以外等于零,则 ?= min (g (a),g (b)) ?= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数. 2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ?)=0, F(-?,y)=0, F(-?,-?)=0, F(?,?)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) . (4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 . (2)归一性 ∑∑=i jij p 1 . 3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x yy ij i j p三.二维连续型随机变量及其联合概率密度1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-yxdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度. 2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f .(3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2(4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<?}= F (x , ?) . (X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<?, Y ≤y}= F (?,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X 关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立. 六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称,}{},{jj i j j i p p y Y P y Y x X P •=====P{X=x i |Y=y j }为在Y= y j 条件下随机变量X 的条件分布律. 同样,对于固定的i,若P{X=x i }>0,则称P{Y=y j |X=x i } 为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X 离散型随机变量 连续型随机变量分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛) ⎰∞∞-dx x xf )((积分绝对收敛)方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2=E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) 函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差?(X)=√D(X) . 二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X) 1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p) 2.X~ b (n,p) (0<p<1) n p n p (1- p) 3.X~ ?(?) ? ?,}{},{•=====i ji i j i p p x X P y Y x X P4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为?的指数分布 ? ?26.X~ N (?,?2) ? ?2 四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,… 随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如:样本均值∑==n i i X n X 11 样本方差()∑--==n i iX X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==ni k i k X X n B 1)(1( k=1,2,…)二.抽样分布 即统计量的分布1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (?,?2 ) ,则 X ~ N (?, ?2 /n) .2.?2分布 (1)定义 若X ~N (0,1) ,则Y =∑=ni i X 12~ ?2(n)自由度为n 的?2分布.(2)性质 ①若Y~ ?2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ ?2(n 1) Y 2~ ?2(n 2) ,则Y 1+Y 2~ ?2(n 1 + n 2). ③若X~ N (?,?2 ), 则22)1(σS n -~ ?2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ ?2(n),0< ? <1 ,则满足的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为?2分布的上、下、双侧?分位点. 3. t 分布(1)定义 若X~N (0,1),Y~ ?2(n),且X,Y 相互独立,则t=nY X ~t(n)自由度为n 的t 分布.(2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (?,?2 )时, nS X μ-~ t (n-1) . ③两个正态总体相互独立的样本 样本均值 样本方差X~ N (?1,?12 ) 且?12=?22=?2 X 1 ,X 2 ,…,X n1 X S 12 Y~ N (?2,?22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < ?<1 , 则满足的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧?分位点. 注意: t 1- ? (n) = - t ? (n).4.F 分布 (1)定义 若U~?2(n 1), V~ ?2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③)22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< ? <1,则满足的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧?分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数?1, ?2,…, ?k .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμΛΛΛ解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k μμμθθμμμθθμμμθθΛΛΛ,以样本矩A l 取代总体矩? l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A ΛΛΛθθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, ?1, ?2,…, ?k ),称样本X 1 ,X 2 ,…,X n的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθΛΛ为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21Λ,称为参数?1, ?2,…,?k 的最大似然估计值,代入样本得到最大似然估计量.若L(?1, ?2,…, ?k )关于?1, ?2,…, ?k 可微,则一般可由 似然方程组0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=?,则估计量∧θ称为参数?的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=?k =E(X k ),即样本均值X ,样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩?k 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= ?, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP→∧,则称估计量∧θ是参数?的相合估计量. 二.区间估计1.求参数?的置信水平为1-?的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,?),其中只有一个待估参数?未知,且其分布完全确定.(2)利用双侧?分位点找出W 的区间(a,b),使P{a<W <b}=1-?.(3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求.2.单个正态总体待估参数 其它参数 W 及其分布 置信区间? ?2已知 n X σμ-~N (0,1) (2/ασz n X ±) ? ?2未知n S X μ-~ t (n-1) )1((2/-±n t n S X α ?2 ?未知22)1(σS n -~ ?2(n-1) ))1()1(,)1()1((22/1222/2-----n S n n S n ααχχ 3.两个正态总体(1)均值差? 1-? 2 其它参数 W 及其分布 置信区间已知2221,σσ 22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±- 未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w +-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③. (2) ? 1,? 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比?12/?22的置信区间为 注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标?/2改为?,另外的下(上)限取为-? (?)即可.。
概率论与数理统计(二)笔记经济数学基础二(概率论与数理统计)课程教学大纲一、课程教学目的与基本要求概率论与数理统计是高等学校(专科)经济、管理类及计算机类专业最重要的基础理论课之一。
本课程是我院经济、管理类及计算机类专业继微积分课程之后的一门基础课。
通过本课程的学习,使学生获得概率论与数理统计的基本知识和基本运算技能。
教学中要贯彻“以应用为目的,以必需、够用为度”的原则,教学重点放在掌握概念,强化应用,培养技能上。
通过各教学环节逐渐培养学生具有比较熟练的分析问题和解决问题的能力,并为专业课程的定量分析打下基础。
1.要正确理解以下概念:随机试验,随机事件、概率的古典定义、事件的独立性、一元随机变量、分布函数、二元随机变量、联合分布及边缘分布、随机变量相互独立性、随机变量的数字特征、总体与样本、统计量、两类错误、回归的基本概念2. 要掌握下列基本理论、基本定理和公式:概率的基本性质。
概率加法定理、乘法定理、全概率公式和贝叶斯公式、贝努里概型。
切比雪夫大数定律与贝努里大数定律、中心极限定理。
常用的统计量的分布。
参数估计的基本思想。
小概率原理。
3.熟练掌握下列运算法则和方法:事件的关系与运算。
古典概型的概率计算。
一元随机变量的分布函数、二元随机变量的边缘分布计算。
标准正态分布表的查法。
随机变量的数学期望、方差、协方差计算。
4.应用方面:用数学期望、方差的概念及性质解决具体问题的计算。
利用正态分布的理论解决具体问题。
用区间估计正确解决实际问题,并能解释其结果。
运用小概率原理,对具体问题做假设检验。
用一元线性回归方程及相关性检验解决实际问题。
二、课程主要内容第一章随机事件及其概率(10学时)1. 理解随机试验、随机事件的概念,了解样本空间的概念,掌握事件的关系与运算并会能灵活表达。
2. 了解概率的统计定义,理解概率的古典定义,会计算简单的古典概率。
3. 了解概率的公理化定义。
掌握概率的基本性质及概率加法定理。