统计学课后答案第七八章之欧阳理创编
- 格式:doc
- 大小:939.51 KB
- 文档页数:28
第一章统计学及基本概念 3第二章数据的收集与整理10第三章统计表与统计图19第四章数据的描述性分析25第五章参数估计 37第六章假设检验 49第七章方差分析 62第八章非参数检验70第九章相关与回归分析78第十章多元统计分析89第十一章时间序列分析101第十二章指数108第十二章指数108第十三章统计决策120第十四章统计质量管理128第一章统计学及基本概念1.1 统计的涵义(统计工作、统计资料和统计学)1.2 统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学)1.3 统计学的发展史(学派与主要代表人物)1.4 数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数)1.5 变量:连续与离散;确定与随机1.6 总体、样本与个体1.7 标志、指标及指标体系1.8 统计计算工具习题一、单项选择题1. 推断统计学研究()。
(知识点:1.2 答案:D)A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。
(知识点:1.3 答案:D)A.数理统计学派 B.政治算术学派 C.社会统计学派 D.国势学派3. 下列数据中哪个是定比尺度衡量的数据()。
(知识点:1.4 答案:B)A.性别 B.年龄 C.籍贯 D.民族4. 统计对现象总体数量特征的认识是()。
(知识点:1.6 答案:C)A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体5. 调查10个企业职工的工资水平情况,则统计总体是()。
(知识点:1.6 答案:C)A.10个企业B.10个企业职工的全部工资C.10个企业的全部职工D.10个企业每个职工的工资6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().(知识点:1.6 答案:A)A. 样本B. 总体单位C. 个体D. 全及总体7. 三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。
统计学复习笔记第七章第八章参数估计一、思考题1.解释估计量和估计值在参数估计中,用来估计总体参数的统计量称为估计量。
估计量也是随机变量。
如样本均值,样本比例、样本方差等。
根据一个具体的样本计算出来的估计量的数值称为估计值。
2.简述评价估计量好坏的标准(1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。
(2)有效性:是指估计量的方差尽可能小。
对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。
(3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。
3.怎样理解置信区间在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。
置信区间的论述是由区间和置信度两部分组成。
有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。
因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。
在公布调查结果时给出被调查人数是负责任的表现。
这样则可以由此推算出置信度(由后面给出的公式),反之亦然。
4.解释95%的置信区间的含义是什么置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。
也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。
不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以0.95的概率覆盖总体参数。
5.简述样本量与置信水平、总体方差、估计误差的关系。
1.估计总体均值时样本量n为其中:2.样本量n与置信水平1-α、总体方差、估计误差E之间的关系为▪与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需要的样本量越大;▪与总体方差成正比,总体的差异越大,所要求的样本量也越大;▪与与总体方差成正比,样本量与估计误差的平方成反比,即可以接受的估计误差的平方越大,所需的样本量越小。
二、练习题1.从一个标准差为5的总体中采用重复抽样方法抽出一个样本量为40的样本,样本均值为25。
各章思考与练习参考答案第一章导论(一)单项选择题1.D 2.C 3.B 4.D 5.D 6.D 7.B 8.A 9.B 10.A (二)多项选择题:1.ABCD 2.CD 3.AD 4.BCDE 5.ABDE(三)判断题:1.×2.×3.×4.√5.×(四)简答题:答案略(五)综合题答案略第二章统计调查(一)单项选择题:1.C 2.C 3.B 4.C 5.C 6.A 7.B 8.C 9.C 10.B (二)多项选择题:1.ACD 2.ABC 3.ABCD 4.ABC 5.ACD6.ABCD 7.ABDE 8.BCE 9.ABE 10.CD(三)判断题:1.×2.×3.×4.√5.×(四)名词解释:答案略㈤(五)简答题:答案略第三章统计整理(一)单项选择题:1.C 2.B 3.C 4.B 5.B 6.A 7.B 8.C 9.B 10.B (二)多项选择题:1.AB 2.BD 3.ACD 4.AD 5.BCD6.BD 7.ABC 8.AC 9.ABC 10.CD(三)判断题:1.×2.√3.×4.×5.×(四)名词解释:答案略(五)简答题:答案略(六)计算题:1.解:2可见,组距1000元的分布数列,更为合理。
(2)对选中的分布数列,计算频率、较小制累计次数、较大制累计次数、组中值:(3)略第四章总量指标与相对指标(一)单项选择题:1.C 2.B 3.A 4.B 5.C 6.B 7.B 8.C 9.B 10.D(二)多项选择题:1.ABCD 2.CE 3.ABCDE 4.BCE 5.ABCD(三)判断题:1.X 2.X 3.X 4.√5.X(四)名词解释:答案略(五)简答题:答案略(六)计算题:1.解:该企业集团实现利润比去年增长百分比 =110%/(1+7%)-1=2.80%2.解:(1)2011年的进出口贸易差额=12178-9559=2619(亿元)(顺差)2011年进出口总额的发展速度=21737/17607×100%=123.46%(2)2011年进出口额比例相对数=9559/12178×100%=78.49%2011年出口额结构相对数=12178/21737×100%=56.02%(3)该地区进出口贸易发展速度较快,出现贸易顺差。
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从()2,N n σμ的正态分布,由正态分布,标准化得到标准正态分布:x ~()0,1N ,因此,样本均值不超过总体均值的概率P为:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159 因此,()0.3P x μ-≤=0.63186.2在练习题6.1中,我们希望样本均值与总体均值μ的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=210.95Φ-≥0.975⇒Φ≥1.96⇒≥42.6828843n n ⇒≥⇒≥6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使得 6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑ 解:由于卡方分布是由标准正态分布的平方和构成的: 设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量222212χ=+++n Z Z Z服从自由度为n 的χ2分布,记为χ2~ χ2(n ) 因此,令6221ii Z χ==∑,则()622216ii Zχχ==∑,那么由概率6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑,可知:b=()210.956χ-,查概率表得:b=12.596.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差22211(())1n i i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得 212()0.90p b S b ≤≤=解:更加样本方差的抽样分布知识可知,样本统计量:222(1)~(1)n s n χσ--此处,n=10,21σ=,所以统计量22222(1)(101)9~(1)1n s s s n χσ--==-根据卡方分布的可知:()()2212129990.90P b S b P b S b ≤≤=≤≤=又因为:()()()2221221911P n S n ααχχα--≤≤-=-因此:()()()()22221212299919110.90P b S b P n S n ααχχα-≤≤=-≤≤-=-= ()()()()222212122999191P b S b P n S n ααχχ-⇒≤≤=-≤≤- ()()()2220.950.059990.90P S χχ=≤≤=则: ()()2210.9520.0599,99b b χχ⇒==()()220.950.051299,99b b χχ⇒==查概率表:()20.959χ=3.325,()20.059χ=19.919,则()20.95199b χ==0.369,()20.05299b χ==1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0σ=盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从()2,N nσμ的正态分布,由正态分布,标准化得到标准正态分布:x()0,1N ,因此,样本均值不超过总体均值的概率P 为:()0.3P x μ-≤=P⎫≤=x P ⎛⎫≤≤=()0.90.9P z -≤≤=2()0.9φ-1,查标准正态分布表得()0.9φ=0.8159因此,()0.3P x μ-≤=0.63186.2在练习题6.1中,我们希望样本均值与总体均值μ的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:()0.3P x μ-≤=P ⎫≤=x P ⎛⎫≤≤=210.95Φ-≥0.975⇒Φ≥6.3 1Z ,2Z ,……,6Z 表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b ,使得解:由于卡方分布是由标准正态分布的平方和构成的: 设Z 1,Z 2,……,Z n 是来自总体N (0,1)的样本,则统计量服从自由度为n 的χ2分布,记为χ2~ χ2(n ) 因此,令6221ii Zχ==∑,则()622216i i Z χχ==∑,那么由概率6210.95i i P Z b =⎛⎫≤= ⎪⎝⎭∑,可知: b=()210.956χ-,查概率表得:b=12.596.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21σ=的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差22211(())1ni i S S Y Y n ==--∑,确定一个合适的范围使得有较大的概率保证S 2落入其中是有用的,试求b 1,b 2,使得解:更加样本方差的抽样分布知识可知,样本统计量: 此处,n=10,21σ=,所以统计量根据卡方分布的可知: 又因为: 因此: 则:查概率表:()20.959χ=3.325,()20.059χ=19.919,则()20.95199b χ==0.369,()20.05299b χ==1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。
第四章统计数据的概括性度量4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:StatisticsMissing0Mean9.60Median10.00Mode10Std. Deviation 4.169Percentiles25 6.255010.007512.504.2 随机抽取25个网络用户,得到他们的年龄数据如下:单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 最小值)÷ 组数=(4115)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的均值与方差:分组后的直方图:4.3 某银行为缩短顾客到银行办理业务等待的时间。
第四章统计数据的概括性度量欧阳歌谷(2021.02.01)4.1 一家汽车零售店的10名销售人员5月份销售的汽车数量(单位:台)排序后如下:2 4 7 10 10 10 12 12 14 15要求:(1)计算汽车销售量的众数、中位数和平均数。
(2)根据定义公式计算四分位数。
(3)计算销售量的标准差。
(4)说明汽车销售量分布的特征。
解:Statistics10Missing 0Mean 9.60Median 10.00Mode 10Std. Deviation 4.169Percentiles 25 6.2550 10.00754.2 随机抽取单位:周岁19 15 29 25 2423 21 38 22 1830 20 19 19 1623 27 22 34 2441 20 31 17 23要求;(1)计算众数、中位数:排序形成单变量分值的频数分布和累计频数分布:网络用户的年龄从频数看出,众数Mo 有两个:19、23;从累计频数看,中位数Me=23。
(2)根据定义公式计算四分位数。
Q1位置=25/4=6.25,因此Q1=19,Q3位置=3×25/4=18.75,因此Q3=27,或者,由于25和27都只有一个,因此Q3也可等于25+0.75×2=26.5。
(3)计算平均数和标准差;Mean=24.00;Std. Deviation=6.652 (4)计算偏态系数和峰态系数: Skewness=1.080;Kurtosis=0.773(5)对网民年龄的分布特征进行综合分析:分布,均值=24、标准差=6.652、呈右偏分布。
如需看清楚分布形态,需要进行分组。
为分组情况下的直方图:为分组情况下的概率密度曲线: 分组:1、确定组数:()lg 25lg() 1.398111 5.64lg(2)lg 20.30103n K =+=+=+=,取k=62、确定组距:组距=( 最大值 - 最小值)÷ 组数=(41-15)÷6=4.3,取53、分组频数表网络用户的年龄 (Binned)分组后的直方图:4.3 某银行为缩短顾客到银行办理业务等待的时间。
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
灯泡的使用寿命频数分布表3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
解:(1)频数分布表(2)茎叶图第三章、练习题及解答1. 已知下表资料:试根据频数和频率资料,分别计算工人平均日产量。
解:根据频数计算工人平均日产量:687034.35200xf x f===∑∑(件) 根据频率计算工人平均日产量:34.35fx xf==∑∑(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
6.1 调理一个装瓶机使其对每个瓶子的灌装量均值为盎司,经过察看这台装瓶机对每个瓶子的灌装量听从标准差 1.0 盎司的正态散布。
随机抽取由这台机器灌装的9 个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确立样本均值偏离整体均值不超出0.3 盎司的概率。
解:整体方差知道的状况下,均值的抽样散布听从N , 2的正态散布,由正态散布,n标准化获得标准正态散布:z= x~ N 0,1 ,所以,样本均值不超出整体均值的概率P n为:P x 0.3 =P x 0.3= P0.3 x 0.3n n 1 9 n 1 9= P 0.9 z 0.9 =2 0.9 -1,查标准正态散布表得0.9 =0.8159所以, P x 0.3 =0.63186.2 在练习题 6.1 中,我们希望样本均值与整体均值的偏差在 0.3 盎司以内的概率达到0.95,应该抽取多大的样本?解: P xx 0.3= P0.3 x 0.30.3 =Pn n 1 n n 1 n= 2 (0.3 n) 1 0.95 (0.3 n) 0.9750.3 n 1.96 n 42.68288 n 436.3 Z1,Z2 ,,Z6表示从标准正态整体中随机抽取的容量,n=6 的一个样本,试确立常数b,使得6P Z i2b0.95i 1解:因为卡方散布是由标准正态散布的平方和构成的:设 Z1, Z2,,Z n是来自整体N(0,1)的样本,则统计量2 Z12 Z 22 Z n2听从自由度为2 2~ 2n 的χ散布,记为χχ( n)6 6 62所以,令2Z i2,则 2 Z i2 2 6 ,那么由概率 P Z i b0.95 ,可知:i 1 i 1 i 120.95 6 ,查概率表得: b=12.59b= 1121 6.4 在习题 6.1 中,假定装瓶机对瓶子的灌装量听从方差 的标准正态散布。
假定我们计划随机抽取 10 个瓶子构成样本,观察每个瓶子的灌装量,获得 10 个观察值,用这1n10 个观察值我们能够求出样本方差S 2 (S 2(Y i Y )2 ) ,确立一个适合的范围使得有n 1 i 1较大的概率保证 S 2落入此中是实用的,试求 b 1, b 2 ,使得p(b 1 S 2 b 2 ) 0.90解:更为样本方差的抽样散布知识可知,样本统计量:(n 1s)22(n 1 ) 2~此处, n=10,21 ,所以统计量(n 1)s 2(10 1)s 22~ 2(n 1)21 9s依据卡方散布的可知:P b 1 S 2 b 2P 9b 1 9S 29b 20.90又因为:2n122 n11P 1 29S2所以:P 9b 129b 2P2n 19S 22n1 10.909S122P 9b 12P222n 19S 9b 2 12 n 1 9S2P2922 9 0.900.959S0.05则:222 9299b 19b 10.95, b 20.050.959 ,9b 2 0.0599查概率表: 2 9 =3.325 ,2 9 =19.919 ,则0.950.052 92 90.95=0.369, b 20.05=1.88b 19927.1 从一个标准差为 5 的整体中采纳重复抽样方法抽出一个样本容量为40 的样本,样本均值为 25。
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688 要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
灯泡的使用寿命频数分布表3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
解:(1)频数分布表(2)茎叶图第三章、练习题及解答1. 已知下表资料:试根据频数和频率资料,分别计算工人平均日产量。
解:根据频数计算工人平均日产量:687034.35200xf x f===∑∑(件) 根据频率计算工人平均日产量:34.35fx xf==∑∑(件)结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
教材习题答案第3章用统计量描述数据详细答案:详细答案:详细答案:通过计算标准化值来判断,,,说明在A项测试中该应试者比平均分数高出1个标准差,而在 B 项测试中只高出平均分数个标准差,由于A项测试的标准化值高于 B项测试,所以A项测试比较理想。
详细答案:3种方法的主要描述统计量如下:(1 )从集中度、离散度和分布的形状三个角度的统计量来评价。
从集中度看,方法 A的平均水平最高,方法 C最低;从离散度看,方法 A的离散系数最小,方法 C最大;从分布的形状看,方法 A和方法B的偏斜程度都不大,方法 C则较大。
(2 )综合来看,应该选择方法 A,因为平均水平较高且离散程度较小。
第5章参数估计详细答案:第6章假设检验详细答案:,,,不拒绝,没有证据表明该企业生产的金属板不符合要求。
详细答案:,,,拒绝,该生产商的说法属实。
详细答案:设,。
,=,,不拒绝,广告提高了平均潜在购买力得分。
第7章方差分析与实验设计第8章一元线性回归详细答案:(1)散点图如下:产量与生产费用之间为正的线性相关关系。
(2)。
检验统计量,,拒绝原假设,相关系数显著。
详细答案:(1)方差分析表中所缺的数值如下:方差分析表(2)。
表明汽车销售量的变差中有漩由于广告费用的变动引起的。
(3)。
(4)。
回归系数表示广告费用每变动一个单位,销售量平均变动个单位。
(5)Significanee F =第10章时间序列预测详细答案:(1)时间序列图如下:从时间序列图可以看出,国家财政用于农业的支出额大体上呈指数上升趋势。
(2)年平均增长率为:。
(3)。
下表是1981年一2000年我国油彩油菜籽单位面积产量数据(单位:kg / hm2 )年份单位面积产量年份单位面积产量1981 1451 1991 12151982 1372 1992 12811983 1168 1993 13091984 1232 1994 12961985 1245 1995 14161986 1200 1996 13671987 1260 1997 14791988 1020 1998 12721989 1095 1999 14691990 1260 2000 1519(1)绘制时间序列图描述其形态。
第三章节:数据的图表展示 (1)第四章节:数据的概括性度量 (15)第六章节:统计量及其抽样分布 (26)第七章节:参数估计 (28)第八章节:假设检验 (38)第九章节:列联分析 (41)第十章节:方差分析 (43)3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B AE D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C E E A B D D C A D B C C A E D C B CBCEDBCCBC要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel 制作一张频数分布表。
用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作: (4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 1003.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:152124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126接收 频率E 16 D 17 C 32 B 21 A14要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
6.1调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差 1.0盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
解:总体方差知道的情况下,均值的抽样分布服从N , 的正态分布,由正态分布,x标准化得到标准正态分布:z= 〜N 0,1,因此,样本均值不超过总体均值的概率P/v n为:P |x | 0.3 =P = P 半畀/x/n /J n 的9 /J n 1 V9=P 0.9 z 0.9 =2 0.9 -1,查标准正态分布表得0.9 =0.8159因此,P X 0.3 =0.63186.2在练习题 6.1中,我们希望样本均值与总体均值的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?X0.30.3X0.3解:P X0.3 =P 1 Vn/V n 1 Vn=2 (0.3希) 1 0.95(0.3诉)0.97503」1.96 n 42.68288 n 436.3乙,乙,……,Z6表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得62P Z i b 0.95i 1解:由于卡方分布是由标准正态分布的平方和构成的:设Z1,Z2,……,Z n是来自总体N(0,1)的样本,则统计量2 Z12 Z;L Z;服从自由度为n的X分布,记为X〜X( n)6 6 6因此,令2Z2,贝y 2Z i2: 26,那么由概率P Z: b 0.95,可知:i 1 i 1 i 1b= ;0.956,查概率表得:b=12.59929 9996.4在习题6.1中,假定装瓶机对瓶子的灌装量服从方差21的标准正态分布。
假定我们计划随机抽取 10个瓶子组成样本,观测每个瓶子的灌装量,得到 10个观测值,用这1 n—(Y i Y)2),确定一个合适的范围使得有n 1 i 1 b 1,b 2,使得2p(bi Sb 2) 0.90解:更加样本方差的抽样分布知识可知,样本统计量:(n 1)s22(n 1)根据卡方分布的可知:又因为:P J 2 2 n 1 9S 2因此:P 9b 9S 2 9b 2 P 9S 2 0.90则:P 9b 1 9S 2 9b 21 9S 22.959 9S 220.050.909b 12 0.959 ,9b 2;05 920.95920.059查概率表:2 0.959 =3.325,2 0.059 =19.919,则 bi2 0.95=0.369, b 20.05 =1.8810个观测值我们可以求出样本方差 S 2 (S 2 较大的概率保证 S 2落入其中是有用的,试求此处,n=10,21,所以统计量(n 1)s 22(10 1)s 2 19 s 22(n 1)P b s 2 b 2p 9b 9S 20.90。
统计学人教版第五版7,8,10,11,13,14章课后题答案第七章 参数估计7.1 (1)79.0405===nx σσ (2)由于1-α=95% α=5% 96.12=αZ所以 估计误差55.140596.12≈⨯=nZ σα7.2 (1)14.24915===nx σσ (2)因为96.12=αZ 所以20.4491596.12≈⨯=nZ σα(3)μ的置信区间为20.41202±=±nZ x σα7.3 由于96.12=αZ 104560=x 85414=σ n=100所以μ的95%置信区间为14.167411045601008541496.11045602±=⨯±=±nZ x σα7.4(1)μ的90%置信区间为97.18110012645.1812±=⨯±=±n s Z x α(2)μ的95%置信区间为35.2811001296.1812±=⨯±=±n s Z x α(3)μ的99%置信区间为096.3811001258.2812±=⨯±=±n s Z x α7.5 (1)89.025605.396.1252±=⨯±=±nZ x σα(2)416.66.1197589.23326.26.1192±=⨯±=±n s Z x α(3)283.0419.332974.0645.1419.32±=⨯±=±n s Z x α7.6 (1)035.25389001550096.189002±=⨯±=±nZ x σα(2)650.16589003550096.189002±=⨯±=±nZ x σα(3)028.139890035500645.189002±=⨯±=±n s Z x α(4)583.196890035500326.289002±=⨯±=±n s Z x α7.7 317.31==∑i x nx ()609.1113612=--=∑=i ix x n s 90%置信区间为441.0317.336609.1645.1317.32±=⨯±=±n s Z x α95%置信区间为526.0317.336609.196.1317.32±=⨯±=±n s Z x α99%置信区间为6908.0317.336609.1576.2317.32±=⨯±=±n s Z x α7.8 101==∑i x nx ()464.311812=--=∑=i ix x n s 所以95%置信区间为()896.2108464.33646.21012±=⨯±=±-n s t x n α7.9 375.91==∑i x n x 由于()131.2)15(025.012==-t t n α ()113.4112=--=∑x x n s i 所以95%置信区间为()191.2375.916113.4131.2375.912±=⨯±=±-n s t x n α7.10 (1)63.05.1493693.196.15.1492±=⨯±=±n s Z x α(2)中心极限定理 7.11 (1)132.10150665011=⨯==∑i x nx ()641.188.131491112=⨯=--=∑x x n s i 455.032.10150641.196.132.1012±=⨯±=±n s Z x α(2)由于9.05045==p 所以 合格率的95%置信区间为()083.09.0501.09.096.19.012±=⨯⨯±=-±n p p Z p α7.12 由于128.161==∑i x n x ()745.3)24(005.012==-t t n α ()8706.0112=--=∑x x n s i所以99%置信区间为653.028.161258706.0745.328.161)1(2±=⨯±=-±n s n t x α 7.13 7396.1)17()1(05.02==-t n t α 556.131==∑i x nx ()800.7112=--=∑x x n s i所以90%置信区间为198.3556.13188.77396.1556.13)1(2±=⨯±=-±n s n t x α 7.14(1)()194.051.04449.051.0576.251.012±=⨯⨯±=-±n p p Z p α(2)()0435.082.030018.082.096.182.012±=⨯⨯±=-±n p p Z p α(3)()024.048.0115052.048.0645.148.012±=⨯⨯±=-±n p p Z p α7.15(1)90%置信区间为()049.023.020077.023.0645.123.012±=⨯⨯±=-±n p p Z p α(2)95%置信区间为()058.023.020077.023.096.123.012±=⨯⨯±=-±n p p Z p α7.16 89.1652001000576.222222222=⨯=⎪⎪⎭⎫ ⎝⎛=⇒=E Z n nZ E σδαα所以n 为166 7.17(1)()13.25302.06.04.0054.2122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为254 (2)()0625.15004.05.05.096.1122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为151(3)()89.26705.045.055.0645.1122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为268 7.18(1)64.05032==p (2)()46.611.02.08.096.1122222=⨯⨯=-⎪⎪⎭⎫⎝⎛=E Z n ππα 所以n 为62 7.19(1)()()339.661501205.022=-=-χχαn()()930.331501295.0221=-=--χχαn ()()2212222211ααχσχ--≤≤-s n s n所以()()40.272.1293.33492339.66491122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n(2)()()6848.231151205.022=-=-χχαn()()5706.61151295.0221=-=--χχαn()()043.0015.002.05.61470602.06848.23141122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n (3)()()6706.321221205.022=-=-χχαn()()5913.111221295.0221=-=--χχαn ()()725.4185.24315913.112131706.36211122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n 7.20(1)15.71==∑i x n x ()4767.0112=--=∑x x n s i ()()0228.1911012025.022=-=-χχαn ()()7004.211012975.0221=-=--χχαn ()()87.0328.04767.07004.294767.00228.1991122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n(2)()()326.3253.1822.17004.29822.10228.1991122122≤≤⇒⨯≤≤⨯⇒-≤≤--σσχσχααs n s n7.21 2)1()1(212222112-+-+-=n n s n s n s p=442.981910268.9613≈⨯+⨯ (1)21μμ-的90%置信区间为: 212122111)2()(n n s n n t x x p+-+±-α=⨯⨯±442.98729.18.971141+ =9411.78.9± (2)21μμ-的95%置信区间为: 212122111)2()(n n s n n t x x p+-+±-α=⨯⨯±442.9893.028.971141+ =13.698.9± (3)21μμ-的99%置信区间为: ⨯⨯±442.98609.828.971141+=40.1138.9± 7.22(1)2122121221)(n s n s z x x +±-α=36.096.12⨯±=176.12±(2)2)1()1(212222112-+-+-=n n s n s n s p=18209169⨯+⨯=18212122111)2()(n n s n n t x x p+-+±-α=5118.122⨯⨯±=8.932± (3)1)(1)()(222221212122122121-+-+=n n s n n s n s n s ν=17.78 2122121221)(t )(n s n s x x +±-να=6.31.22⨯±=98.32±(4)048.2)28(t 025.0=2)1()1(212222112-+-+-=n n s n s n s p=18.714 212122111)2()(n n s n n t x x p+-+±-α=20110114.71848.022+⨯⨯± =3.432±(5)1)(1)()(222221212122122121-+-+=n n s n n s n s n s ν1919.61)20201016(222++==20.05 086.2)(t =να2122121221)(t )(n s n s x x +±-να=1.61086.22+⨯±=64.332± 7.23(1)47d = 1)(2--=∑n d ds id =48332=917.6(2)n s n t d )1(d -±α=185.447± 7.24 6216.2)1(2=-n t α 11=d ,53197.6=d s d μ的置信区间为:ns n t d )1(d 2-±α=1053197.66216.211⨯±=4152.511±7.25(1)222111221)1()1()(p n p p n p p z p -+-±-α=25076.03.02506.04.0645.11.0⨯+⨯⨯±=0698.01.0± (2)222111221)1()1()(p n p p n p p z p -+-±-α=25076.03.02506.04.096.11.0⨯+⨯⨯±=0831.01.0± 7.26 241609.01=s 076457.02=s)1,1(21--n n F α=)20,20(025.0F =2.464 )20,20(975.0F =0.40576212221222122221αασσ-≤≤F s s F s s 40576.0986.9446.2986.92221≤≤σσ 611.240528.42221≤≤σσ7.27 222)1()(Ez n ππα-==2204.098.002.096.1⨯⨯=47.06 所以 n =487.282222)(E z n σα==2222012096.1⨯=138.30所以 n =139第8章 假设检验二、练习题(说明:为了便于查找书后正态分布表,本答案中,正态分布的分位点均采用了下侧分位点。
第一章统计学及基本概念 1第二章数据的收集与整理 4第三章统计表与统计图7第四章数据的描述性分析 9第五章参数估计 12第六章假设检验 17第七章方差分析 21第八章非参数检验24第九章相关与回归分析27第十章多元统计分析 31第十一章时间序列分析35第十二章指数38第十二章指数38第十三章统计决策42第十四章统计质量管理45第一章统计学及基本概念1.1 统计的涵义(统计工作、统计资料和统计学)1.2 统计学的内容(统计学分类:理论统计学和应用统计学;描述统计学与推断统计学)1.3 统计学的发展史(学派与主要代表人物)1.4 数据类型(定类、定序、定距和定比;时间序列、截面数据和面板数据;绝对数、相对数、平均数)1.5 变量:连续与离散;确定与随机1.6 总体、样本与个体1.7 标志、指标及指标体系1.8 统计计算工具习题一、单项选择题1. 推断统计学研究()。
(知识点:1.2 答案:D)A.统计数据收集的方法B.数据加工处理的方法C.统计数据显示的方法D.如何根据样本数据去推断总体数量特征的方法2. 在统计史上被认为有统计学之名而无统计学之实的学派是()。
(知识点:1.3 答案:D) A.数理统计学派B.政治算术学派C.社会统计学派D.国势学派3. 下列数据中哪个是定比尺度衡量的数据()。
(知识点:1.4 答案:B)A.性别B.年龄C.籍贯D.民族4. 统计对现象总体数量特征的认识是()。
(知识点:1.6 答案:C)A.从定性到定量B.从定量到定性C.从个体到总体D.从总体到个体5. 调查10个企业职工的工资水平情况,则统计总体是()。
(知识点:1.6 答案:C)A.10个企业B.10个企业职工的全部工资C.10个企业的全部职工D.10个企业每个职工的工资6. 从统计总体中抽取出来作为代表这一总体的、由部分个体组成的集合体是().(知识点:1.6 答案:A)A. 样本B. 总体单位C. 个体D. 全及总体7. 三名学生期末统计学考试成绩分别为80分、85分和92分,这三个数字是()。
第一章思考题1.事件的和或者差的运算的等式两端能“移项”吗?为什么?2.医生在检查完病人的时候摇摇头“你的病很重,在十个得这种病的人中只有一个能救活. ”当病人被这个消息吓得够呛时,医生继续说“但你是幸运的.因为你找到了我,我已经看过九个病人了,他们都死于此病,所以你不会死”,医生的说法对吗?为什么?3.圆周率π是一个无限不循.3=1415926环小数, 我国数学家祖冲之第一次把它计算到小数点后七位, 这个记录保持了1000多年! 以后有人不断把它算得更精确. 1873年, 英国学者沈克士公布了一个π的数值, 它的数目在小数点后一共有707位之多! 但几十年后, 曼彻斯特的费林生对它产生了怀疑. 他统计了π的608位小数, 得到了下表:你能说出他产生怀疑的理由吗?答:因为π是一个无限不循环小数,所以,理论上每个数字出现的次数应近似相等,或它们出现的频率应都接近于0.1,但7出现的频率过小.这就是费林产生怀疑的理由.4.你能用概率证明“三个臭皮匠胜过一个诸葛亮”吗?5.两事件A、B相互独立与A、B互不相容这两个概念有何关系?对立事件与互不相容事件又有何区别和联系?6.条件概率是否是概率?为什么?习题一1.写出下列试验下的样本空间:(1)将一枚硬币抛掷两次答:样本空间由如下4个样本点组成Ω=正正,正反,反正,反反{(,)(,)(,)(,)}(2)将两枚骰子抛掷一次答:样本空间由如下36个样本点组成Ω=={(,),1,2,3,4,5,6}i j i j(3)调查城市居民(以户为单位)烟、酒的年支出答:结果可以用(x,y)表示,x,y分别是烟、酒年支出的元数.这时,样本空间由坐标平面第一象限内一切点构成 .{(,)0,0}x y x yΩ=≥≥2.甲,乙,丙三人各射一次靶,记-A“甲中靶” -B“乙中靶” -C“丙中靶”则可用上述三个事件的运算来分别表示下列各事件:(1) “甲未中靶”:;A(2) “甲中靶而乙未中靶”:;B A(3) “三人中只有丙未中靶”:;CAB(4) “三人中恰好有一人中靶”:ACBABCB;CA(5)“三人中至少有一人中靶”:;CBA(6)“三人中至少有一人未中靶”: ;C B A 或;ABC(7)“三人中恰有两人中靶”: ;BC A C B A C AB(8)“三人中至少两人中靶”: ;BC AC AB(9)“三人均未中靶”: ;C B A(10)“三人中至多一人中靶”: ;C B A C B A C B A C B A(11)“三人中至多两人中靶”: ;ABC 或;C B A3 .设,A B 是两随机事件,化简事件 (1)()()A B A B (2)()()AB A B 解:(1)()()AB A B AB AB B B ==, (2) ()()A B A B ()A B A B B A A B B ==Ω=.4.某城市的电话号码由5个数字组成,每个数字可能是从0-9这十个数字中的任一个,求电话号码由五个不同数字组成的概率.解:51050.302410P P ==. 5.n 张奖券中含有m 张有奖的,k 个人购买,每人一张,求其中至少有一人中奖的概率.解法一:试验可模拟为m 个红球,n m -个白球,编上号,从中任取k 个构成一组,则总数为k n C ,而全为白球的取法有k m n C -种,故所求概率为k n k m n C C --1. 解法二:令i A —第i 人中奖,,.,2,1k i =B —无一人中奖,则k A A A B 21=,注意到k A ,,A ,A 21不独立也不互斥:由乘法公式)()()()()(11213121-=k k A A A P A A A P A A P A P B P (1)(2)(1)121n m n m n m n m k n n n n k -------+=⋅⋅---+!,1k k n m n m k k n n C C k C C ---同除故所求概率为.6.从5双不同的鞋子中任取4只,这4只鞋子中“至少有两只配成一双”(事件A )的概率是多少?解:122585410()C C C P A C -= 7.在[]1,1-上任取一点X ,求该点到原点的距离不超过15的概率. 解:此为几何概率问题:]11[,-=Ω,所求事件占有区间 ]5151[,-,从而所求概率为121525P ⋅==. 8.在长度为a 的线段内任取两点,将其分成三段,求它们可以构成一个三角形的概率.解:设一段长为x ,另一段长为y ,样本空间:0,0,0x a y a x y a Ω<<<<<+<,所求事件满足:0202()a x a y x y a x y ⎧<<⎪⎪⎪<<⎨⎪+>--⎪⎪⎩从而所求概率=14CDEOAB S S =. 9.从区间(0,1)内任取两个数,求这两个数的乘积小于14的概率. 解:设所取两数为,,X Y 样本空间占有区域Ω, 两数之积小于14:14XY <,故所求概率 ()()1()()1S S D S D P S Ω--==Ω,而11411()(1)1(1ln 4)44S D dx x =-=-+⎰,故所求概率为1(1ln4)4+. 10.设A 、B 为两个事件,()0.9P A =,()0.36P AB =,求()P AB . 解:()()()0.90.360.54P A B P A P AB =-=-=;11.设A 、B 为两个事件,()0.7P B =,()0.3P AB =,求()P AB . 解:()()1()1[()()]1[0.70.3]0.6P A B P AB P AB P B P AB ==-=--=--=.12.假设()0.4P A =,()0.7P A B =,若A 、B 互不相容,求()P B ;若A 、B 相互独立,求()P B .解:若A 、B 互不相容,()()()0.70.40.3P B P A B P A =-=-=;若A 、B 相互独立,则由()()()()()P A B P A P B P A P B +=+-可得()P B =0.5.13.飞机投弹炸敌方三个弹药仓库,已知投一弹命中1,2,3号仓库的概率分别为0.01,0.02,0.03,求飞机投一弹没有命中仓库的概率.解:设=A {命中仓库},则=A {没有命中仓库},又设=i A {命中第i 仓库})3,2,1(=i 则03.0)(,02.0)(,01.0)(321===A P A P A P ,根据题意321A A A A =(其中321,A A A 两两互不相容)故123()()()()P A P A P A P A =++=0.01+0.02+0.03=0.06 所以94.006.01)(1)(=-=-=A P A P即飞机投一弹没有命中仓库的概率为0.9414.某市有50%住户订日报,有65%的住户订晚报,有85%的住户至少订这两种报纸中的一种,求同时订这两种报纸的住户的百分比解: 设=A {用户订有日报},B ={用户订有晚报},则=B A {用户至少订有日报和晚报一种},=AB {用户既订日报又订晚报},已知85.0)(,65.0)(,5.0)(===B A P B P A P ,所以 即同时订这两种报纸的住户的百分比为30%15.一批零件共100个,次品率为10%,接连两次从这批零件中任取一个零件,第一次取出的零件不再放回,求第二次才取得正品的概率.解:设=A {第一次取得次品},=B {第二次取得正品},则=AB {第二次才取得正品},又因为9990)(,10010)(==A B P A P ,则 16.设随机变量A 、B 、C 两两独立,A 与B 互不相容. 已知0)(2)(>=C P B P 且5()8P B C =,求()P A B .解:依题意0)(=AB P 且)()()(B P A P AB P =,因此有0)(=A P . 又因25()()()()()3()2[()]8P B C P B P C P B P C P C P C +=+-=-=,解方程151()[()]()442P C P C P B ==⇒=舍去,,()()()()()0.5.P A B P A P B P AB P B =+-==17.设A 是小概率事件,即()P A ε=是给定的无论怎么小的正数.试证明:当试验不断地独立重复进行下去,事件A 迟早总会发生(以概率1发生).解:设事件i A —第i 次试验中A 出现(1,2,,)i n =,∵(),()1i i P A P A εε==-,(1,2,,)i n =,∴n 次试验中,至少出现A 一次的概率为121()()()n P A P A P A =-⋅⋅⋅(独立性)∴12lim ()1n n P A A A →∞=,证毕.18.三个人独立地破译一密码,他们能单独译出的概率分别是15,13,14,求此密码被译出的概率.解:设A ,B ,C 分别表示{第一、二、三人译出密码},D 表示{密码被译出},则1()1()()() P ABC P A P B P C =-=-42331..5345=-=. 19.求下列系统(如图所示)的可靠度,假设元件i 的可靠度为i p ,各元件正常工作或失效相互独立解:(1)系统由三个子系统并联而成,每个子系统可靠度为123p p p ,从而所求概率为31231(1)p p p --;(2)同理得2312[1(1)]p p --.20.三台机器相互独立运转,设第一,第二,第三台机器不发生故障的概率依次为0.9,0.8,0.7,则这三台机器中至少有一台发生故障的概率. 解:设1A —第一第三台机器发生故障,2A —第一第三台机器发生故障,3A —第一第三台机器发生故障,D —三台机器中至少有一台发生故障,则123()0.1,()0.2,()0.3P A P A P A ===,故21.设A 、B 为两事件,()0.7P A =,()0.6P B =,()0.4B P A=,求()P A B . 解:由()0.4B P A=得 ()0.4,()0.12,()()()0.48()P AB P AB P AB P B P AB P A ==∴=-=,()()()()0.82P A B P A P B P AB =+-=.22.设某种动物由出生算起活到20年以上的概率为0.8, 活到25年以上的概率为0.4. 问现年20岁的这种动物, 它能活到25岁以上的概率是多少?解:设A —某种动物由出生算起活到20年以上,()0.8P A =,B —某种动物由出生 算起活到25年以上,()0.4P B =,则所求的概率为23.某地区历史上从某年后30年内发生特大洪水的概率为80%,40年内发生特大洪水的概率为85%,求已过去了30年的地区在未来10年内发生特大洪水的概率.解:设A —某地区后30年内发生特大洪灾,()0.8P A =,B —某地区后40年内发生特大洪灾,()0.85P B =,则所求的概率为()()0.15()1()1110.250.2()()P BA P B B B P P A A P A P A =-=-=-=-=.24.设甲、乙两袋,甲袋中有2只白球,4只红球;乙袋中有3只白球,2只红球.今从甲袋中任意取一球放入乙袋中,再从乙袋中任意取一球.1)问取到白球的概率是多少?2)假设取到白球,问该球来自甲袋的概率是多少?解:设A :取到白球,B :从甲球袋取白球25.一批产品共有10个正品和2个次品,任取两次,每次取一个,抽出后不再放回,求第二次抽出的是次品的概率. 解:设i B 表示第i 次抽出次品,(1,2)i =,由全概率公式2221111()()()()()B B P B P B P P B P B B =+=211021*********⨯+⨯=. 26.一批晶体管元件,其中一等品占95%,二等品占4%,三等品占1%,它们能工作500h 的概率分别为90%,80%,70%,求任取一个元件能工作500h 以上的概率. 解:设=i B {取到元件为i 等品}(i =1,2,3) ,=A {取到元件能工作500小时以上} 则%1)(%,4)(%,95)(321===B P B P B P所以)()()()()()()(332211B A P B P B A P B P B A P B P A P ++= =⋅+⋅+⋅=%70%1%80%4%90%950.89427.某药厂用从甲、乙、丙三地收购而来的药材加工生产出一种中成药,三地的供货量分别占40%,35%和25%,且用这三地的药材能生产出优等品的概率分别为0.65,0.70和0.85,求从该厂产品中任意取出一件成品是优等品的概率.如果一件产品是优质品,求它的材料来自甲地的概率 解:以B i 分别表示抽到的产品的原材来自甲、乙、丙三地,A={抽到优等品},则有:123()0.35,()0.25,P B P B ==P(B )=0.4, 所求概率为().P A 由全概率公式得:28.用某种检验方法检查癌症,根据临床纪录,患者施行此项检查,结果是阳性的概率为0.95;无癌症者施行此项检查,结果是阴性的概率为0.90.如果根据以往的统计,某地区癌症的发病率为0.0005.试求用此法检查结果为阳性者而实患癌症的概率. 解:设A={检查结果为阳性},B={癌症患者}.据题意有()0.95,()0.90,A A P P B B ==()0.0005,P B =所求概率为().B P A()0.10,()0.9995.A P P B B ==由Bayes 公式得 29.3个射手向一敌机射击,射中的概率分别是0.4,0.6和0.7.如果一人射中,敌机被击落的概率为0.2;二人射中,被击落的概率为0.6;三人射中则必被击落.(1)求敌机被击落的概率;(2)已知敌机被击落,求该机是三人击中的概率.解:设A={敌机被击落},B i ={i 个射手击中},i=1,2,3. 则B 1,B 2,B 3互不相容.由题意知:132()0.2,()0.6,()1A A AP P P B B B ===,由于3个射手射击是互相独立的,所以因为事件A 能且只能与互不相容事件B 1,B 2,B 3之一同时发生.于是(1)由全概率公式得(2)由Bayes 公式得33331()(|)0.168(|)0.340.4944()(|)i ii P B P A B P B A P B P A B ====∑.30.某厂产品有70%不需要调试即可出厂,另30%需经过调试,调试后有80%能出厂,求(1)该厂产品能出厂的概率;(2)任取一出厂产品未经调试的概率.解:A ——需经调试A ——不需调试B ——出厂则%30)(=A P ,%70)(=A P ,%80)|(=A B P ,1)|(=A B P(1)由全概率公式:)()()()()(A BP A P A B P A P B P ⋅+⋅= %941%70%80%30=⨯+⨯=.(2)由贝叶斯公式:9470%94)()()()()(=⋅==A B P A P B P B A P B A P . 31.进行一系列独立试验,假设每次试验的成功率都是p ,求在试验成功2次之前已经失败了3次的概率.解:所求的概率为234(1)p p -.32.10个球中有一个红球,有放回地抽取,每次取一球,求直到第n 次才取k 次()k n ≤红球的概率 解:所求的概率为11191010k n k k n C ---⎛⎫⎛⎫ ⎪ ⎪⎝⎭⎝⎭33.灯泡使用寿命在1000h 以上的概率为0.2,求3个灯泡在使用1000h 后,最多只有一个坏了的概率.解:由二项概率公式所求概率为34.(Banach 问题)某人有两盒火柴,每盒各有n 根,吸烟时任取一盒,并从中任取一根,当他发现有一盒已经用完时,试求:另一盒还有r 根的概率.解:设试验E —从二盒火柴中任取一盒,A —取到先用完的哪盒,1()2P A =, 则所求概率为将E 重复独立作2n r -次A 发生n 次的概率,故所求的概率为222211()()()222n n n n r n r n r n r n r C P n C -----==. 第二章思考题1. 随机变量的引入的意义是什么?答:随机变量的引入,使得随机试验中的各种事件可通过随机变量的关系式表达出来,其目的是将事件数量化,从而随机事件这个概念实际上是包容在随机变量这个更广的概念内.引入随机变量后,对随机现象统计规律的研究,就由对事件及事件概率的研究转化为随机变量及其取值规律的研究,使人们可利用数学分析的方法对随机试验的结果进行广泛而深入的研究.随机变量概念的产生是概率论发展史上的重大事件,随机事件是从静态的观点来研究随机现象,而随机变量的引入则变为可以用动态的观点来研究.2.随机变量与分布函数的区别是什么?为什么要引入分布函数?答:随机变量与分布函数取值都是实数,但随机变量的自变量是样本点,不是普通实数,故随机变量不是普通函数,不能用高等数学的方法进行研究,而分布函数一方面是高等数学中的普通函数,另一方面它决定概率分布,故它是沟通概率论和高等数学的桥梁,利用它可以将高度数学的方法得以引入.3. 除离散型随机变量和连续型随机变量,还有第三种随机变量吗?答:有,称为混合型.例:设随机变量[]2,0~UX,令则随机变量)(XgY=既非离散型又非连续型.事实上,由)(XgY=的定义可知Y只在[]1,0上取值,于是当0<y时,0)(=yFY ;1≥y时,1)(=y F Y ;当10<≤y 时,于是首先Y 取单点{1}的概率021)01()1()1(≠=--==Y Y F F Y P ,故Y 不是连续型随机变量.其次其分布函数不是阶梯形函数,故Y 也不是离散型随机变量.4.通常所说“X 的概率分布”的确切含义是什么?答:对离散型随机变量而言指的 是分布函数或分布律,对连续型随机变量而言指的是分布函数或概率密度函数.5.对概率密度()f x 的不连续点,如何由分布函数()F x 求出()f x ?答:对概率密度()f x 的连续点,()()f x F x '=,对概率密度()f x 的有限个不连续点处,可令()f x c =(c 为常数)不会影响分布函数的取值.6.连续型随机变量的分布函数是可导的,“概率密度函数是连续的”这个说法对吗?为什么?答:连续型随机变量密度函数不一定是连续的,当密度函数连续时其分布函数是可导的,否则不一定可导.习题1.在测试灯泡寿命的试验中,试写出样本空间并在其上定义一个随机变量.解:每一个灯泡的实际使用寿命可能是),0[+∞中任何一个实数, 样本空间为Ωtt,若用X表示灯泡的寿命(小=|}0{≥时),则X是定义在样本空间}0t上|Ωt{≥=的函数,即t=)(是随机变量.X=Xt2.一报童卖报, 每份0.15元,其成本为0.10元. 报馆每天给报童1000份报, 并规定他不得把卖不出的报纸退回. 设X为报童每天卖出的报纸份数, 试将报童赔钱这一事件用随机变量的表达式表示.解:{报童赔钱}⇔{卖出的报纸钱不够成本},而当 0.15 X <1000× 0.1时,报童赔钱,故{报童赔钱} ⇔{X ≤666}3.若2{}1P X x β<=-,1{}1P X x α≥=-,其中12x x <,求12{}P x X x ≤<.解:1221{}{}{}P x X x P X x P X x ≤<=<-<21{}[1{}]1P X x P X x αβ=<--≥=--.4.设随机变量X 的分布函数为⎪⎩⎪⎨⎧≥<≤<=1,110,0,0)(2x x x x x F试求(1)⎭⎬⎫⎩⎨⎧≤21X P (2)⎭⎬⎫⎩⎨⎧≤<-431X P (3)⎭⎬⎫⎩⎨⎧>21X P 解:41)21(21)1(==⎭⎬⎫⎩⎨⎧≤F X P ; (2)1690169)1()43(431=-=--=⎭⎬⎫⎩⎨⎧≤<-F F X P ;(3)43)21(121121=-=⎭⎬⎫⎩⎨⎧≤-=⎭⎬⎫⎩⎨⎧>F X P X P . 5.5个乒乓球中有2个新的,3个旧的,如果从中任取3个,其中新的乒乓球的个数是一个随机变量,求这个随机变量的概率分布律和分布函数,并画出分布函数的图形.解:设X 表示任取的3个乒乓球中新的乒乓球的个数,由题目条件可知,X 的所有可能取值为0,1,2,∵33351{0}10C P X C ===,1223356{1}10C C P X C ===,2133353{2}10C C P X C === ∴随机变量X 的概率分布律如下表所示:由()k k x x F x P ≤=∑可求得()F x 如下:0 ,0{0} ,01(){0}{1} ,12{0}{1}{2} x P X x F x P X P X x P X P X P X <=≤<==+=≤<=+=+= ,2x ⎧⎪⎪⎨⎪⎪≥⎩X 0 1 2 P 0.1 0.6 0.30 ,00.1 ,010.7 ,121 ,2x x x x <⎧⎪≤<⎪=⎨≤<⎪⎪≥⎩,()F x 的图形如图所示. 6.某射手有5发子弹,射击一次命中率为0.9,如果他命中目标就停止射击,命不中就一直射击到用完5发子弹,求所用子弹数X 的概率分布解:7 .一批零件中有9个合格品与3个废品,安装机器时,从这批零件中任取一个,如果每次取出的废品不再放回,求在取出合格品之前已取出的废品数的分布律.解:设{}i i A =第次取得废品,{}i A i =第次取得合格品,由题意知,废品数X 的可能值为0,1,2,3,事件{0}X =即为第一次取得合格品,事件{1}X =即为第一次取出的零件为废品,而第二次取出的零件为合格品,于是有 19{0}()0.7512P X P A ====, 21211399{1}()0.2045121144A P X P A A P A P A ====⋅=≈()(),所以X 的分布律见下表8.从101-中任取一个数字,若取到数字)101( =i i 的概率与i 成正比,即1,2,,10P X i ki i ===(),(),求k . 解:由条件 1,2,,10P X i ki i ===(),(),由分布律的性质1011i i p ==∑,应有1011i ki ==∑,155k =.9 .已知随机变量X 服从参数1=λ的泊松分布,试满足条件{}01.0=>N X P 的自然数N . 解:因为{}{}{}99.0101.0),1(~=>-=≤=>N X P N X P Y X P P X 所以从而查附表得4=N10.某公路一天内发生交通事故的次数X 服从泊松分布,且一天内发生一次交通事故的概率与发生两次交通事故的概率相等,求一周内没有交通事故发生的概率.解:设~()X P λ,由题意:)1(=X P =)2(=X P ,2!2!1λλλλ--=e e ,解得2=λ,所求的概率即为2022!0)0(--===e e X P . 11 . 一台仪器在10000个工作时内平均发生10次故障,试求在100个工作时内故障不多于两次的概率.解:设X 表示该仪器在100个工作时内故障发生的次数,1~(100,)1000XB ,所求的概率即为)0(=X P ,)1(=X P ,)2(=X P 三者之和.而100个工作时内故障平均次数为=μ1.010001100=⨯,根据Poisson 分布的概率分布近似计算如下:故该仪器在100个工作时内故障不多于两次的概率为0.99984.12.设[]~2,5X U ,现对X 进行三次独立观察,试求至少有两次观察值大于3的概率. 解:()1 ,2530 ,x f x ⎧≤≤⎪=⎨⎪⎩其余,令()3A X =>,则()23p P A ==,令Y 表示三次重复独立观察中A 出现次数,则2~3,3Y B ⎛⎫ ⎪⎝⎭,故所求概率为()213023332121202333327P Y C C ⎛⎫⎛⎫⎛⎫⎛⎫≥=+= ⎪ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭⎝⎭. 13.设某种传染病进入一羊群,已知此种传染病的发病率为2/3,求在50头已感染的羊群中发病头数的概率分布律.解:把观察一头羊是否发病作为一次试验,发病率3/2=p ,不发病率3/1=q ,由于对50头感染羊来说是否发病,可以近似看作相互独立,所以将它作为50次重复独立试验,设50头羊群中发病的头数为X ,则X (50,2/3)X B ,X 的分布律为14.设随机变量X 的密度函数为2, 01()0 , x x p x <<⎧=⎨⎩其它,用Y 表示对X 的3次独立重复观察中事件1{}2X ≤出现的次数,求{2}P Y =.解:(3,)Y p B ,12011{}224p P X xdx =≤==⎰,由二项概率公式223139{2}()()4464P Y C ===. 15.已知X 的概率密度为2,0()0,0x ax e x f x x λ-⎧>=⎨≤⎩,试求: (1)、未知系数a ;(2)、X 的分布函数()F x ;(3)、X 在区间1(0,)λ内取值的概率.解:(1)由⎰+∞-=021dx e ax x λ,解得.22λ=a (2) ()()()F x P Xx f x dx +∞-∞=≤=⎰,∴当x ≤0时0)(=x F ,当x >0时,2220()1(22)2x x x e F x ax e dx x x λλλλ--==-++⎰, ∴2211(22),0()20, 0x x x F x x λλ⎧-++>⎪=⎨⎪≤⎩ . (3)511(0)()(0)12P X F F e λλ<<=-=-.16.设X 在(1,6)内服从均匀分布,求方程210x Xx ++=有实根的概率.解:“方程210x Xx ++=有实根”即{2}X >,故所求的概率为{2}P X>=45. 17.知随机变量X 服从正态分布2(,)N a a ,且Y aX b =+服从标准正态分布 (0,1)N ,求,a b .解:由题意解得:1,1a b ==-18.已知随机变量X 服从参数为λ的指数分布,且X 落入区间(1,2)内 的概率达到最大,求λ. 解:2(12)(1)(2)()P X P X P X e e g λλλ--<<=>->=-=令,令()0g λ'=,即022=---λλe e ,即021=--λe ,∴.2ln =λ19.设随机变量(1,4)XN ,求(0 1.6)P X ≤<,(1)P X <.解:01 1.61(0 1.6)()22P XP X --≤<=≤< 11(1)()(0)0.52P X -<==Φ=Φ=.20.设电源电压()2~220,25X N ,在200,200240,240X X X ≤<≤>电压三种情形下,电子元件损坏的概率分别为0.1,0.001,0.2,求: (1)该电子元件损坏的概率α;(2)该电子元件损坏时,电压在200~240伏的概率β. 解:设()()()123200,200240,240A X A X A X =≤=<≤=>, D —电子元件损坏,则 (1)123,,A A A 完备,由全概率公式()()()()123123D D D P D P A P P A P P A P A A A α⎛⎫⎛⎫⎛⎫==++ ⎪ ⎪ ⎪⎝⎭⎝⎭⎝⎭,今()()()12002200.810.80.21225P A -⎛⎫=Φ=Φ-=-Φ= ⎪⎝⎭,同理()()()()20.80.820.810.576P A =Φ-Φ-=Φ-=,()310.2120.5760.212P A =--=, 从而()0.062P D α==.(2)由贝叶斯公式()222D P A P A A P D P D β⎛⎫ ⎪⎝⎭⎛⎫== ⎪⎝⎭0.5760.0010.0090.062⨯==. 21.随机变量X 的分布律为求2Y X =的分布律解: .22.变量X 服从参数为0.7的0-1分布,求2X 及22X X -的概率分布. 解.X 的分布为 易见,2X 的可0和能值为1;而22X X-的可能值为1-和0,由于2{}P X u =={P X }u =(0,1)u =,可见2X 的概率分布为:由2{21}{1}0.7P X X P X -=-===,2{20}{0}0.3P X X P X -====,可得22X X-的概率分布为23.X 概率密度函数为21()(1)X f x x π=+,求2Y X =的概率密度函数()Y f y .解:2yx=的反函数为2y x=,代入公式得22()()()22(4)Y X y y f y f y π'==+.24.设随机变量[]~0,2X U ,求随机变量2Y X =在()0,4内概率密度()Y f y .解法一(分布函数法) 当y <时,()0,4Y F y y =>时()1Y F y =,当04y ≤≤时, 从而 ()40 ,XY f y f y ⎧=≤≤⎪=⎨⎪⎩其余解法二(公式法)2y x =在()0,2单增,由于反函数x =在()0,4可导,'y x ,从而由公式得25. ,0)0 ,0x X e x f x x -⎧≥=⎨<⎩(,求X Y e =的密度.解法一(分布函数法)因为0X ≥,故1Y >,当1y >时,()()()ln ln Y X F y P X y F y =≤=,()()ln 2111ln ,10 ,1y XY f y e y y y y f y y -⎧==>⎪∴=⎨⎪≤⎩.解法二(公式法)x y e =的值域()1,+∞,反函数ln x y =,故()()[]21ln ln ' ,10 ,1X Y f y y y y f y y ⎧=>⎪=⎨⎪≤⎩.26.设随机变量X 服从(0,1)上的均匀分布,分别求随机变量X Y e =和ln Z X =的概率密度()Y f y 和()Z f z .解:X 的密度为1, 01() xf x ⎧<<⎪=⎨⎪⎩0,若其它,(1)函数xy e =有唯一反函数,ln x y =,且1Y e <<,故(ln )(ln ), 1() X f y y y e f y '⎧<<⎪=⎨⎪⎩0,其它1, 1 y ey ⎧<<⎪=⎨⎪⎩0,其它.(2)在区间(0,1)上,函数ln ln z x x ==-,它有唯一反函数zx e -=,且0Z >,从而()(), () z z X Z f e e f z -->⎧'⎪=⎨⎪⎩z 00,其它0, zz e ->⎧⎪=⎨⎪⎩0,其它. 27. 设()X f x 为X 的密度函数,且为偶函数,求证X -与X 有相同的分布.证:即证Y X =-与X 的密度函数相同,即()()Y X f y f y =.证法一(分布函数法)()()()()()11Y X F y P X y P X y P X y F y =-≤=≥-=-≤-=--,()()()()1Y X X p y p y p y ∴=--⋅-=,得证.证法二(公式法) 由于y x=-为单调函数,∴()()()()()'Y X X X p y p y y p y p y =--=-=.28.设随机变量X服从正态分布),(2σμN ,0,>+∞<<-∞σμ ,)(x F 是X的分布函数,随机变量)(X F Y =. 求证Y 服从区间]1,0[上的均匀分布.证明:记X的概率密度为)(x f ,则⎰∞-=xdt t f X F .)()( 由于)(x F 是x 的严格单调增函数,其反函数)(1x F -存在,又因1)(0≤≤x F ,因此Y 的取值范围是]1,0[. 即当10≤≤y 时于是Y 的密度函数为即Y 服从区间]1,0[上的均匀分布.第三章 思考题1(答:错)2 (答:错) 3答:错)习题 三1解:)(}1,1{}1,1{}{已知独立==+-=-===Y X P Y X P Y X P2121212121}1{}1{}1{}1{=⋅+⋅===+-=-==Y P X P Y P X P .由此可看出,即使两个离散随机变量Y X 与相互独立同分布,Y X 与一般情况下也不会以概率1相等.2解:由∑∑ijij p =1可得:14.0=b ,从而得:.1,0;2,1,0}{}{},{=======j i j Y P i X P j Y i X P 故YX ,相互独立.3解:)()1,1(11AB P Y X P p ==== 因为:,32)(1)(:,1)()(=-==+A B P A B P A B P A B P 所以)()()()()()()()1,0(21=-=-=-=====AB P B A P AB P AB P B P A B P B A P Y X P p12812161121122=---=p ,结果如表所示. 4 解:X 的边缘分布律为32}2{,31}1{====X P X PY 的边缘分布律为21}2{,21}1{====X P Y P 1=Y 的条件下X 的条件分布为0}1{}1,1{}11{=======Y P Y X P Y X P2=X 的条件下Y 的条件分布为5 解:(1)由乘法公式容易求得),(Y X 分布律.易知,放回抽样时 且}{}{},{i X P i X j Y P j Y i XP ======于是),(Y X 的分布律为(2)不放回抽样,则,61}1{,65}0{====X P X P ,在第一次抽出正品后,第二次抽取前的状态:正品9个,次品2个.故又在第一次抽出次品后,第二次抽取前状态:正品10个,次品1个.故}11{,1110}10{======X Y P X Y P , 且{}{},{======X P i X j Y P j Y i X P于是),(Y X 的分布律为放回抽样时,两次抽样互不影响,故彼此相互独立;不放回抽样,第一次抽样对第二次抽样有影响,不相互独立. 6解),(y x f =⎪⎩⎪⎨⎧≤≤≤≤--.,0,,,))((1否则d y c b x a d c a b⎪⎩⎪⎨⎧><≤≤-=b x a x b x a ab x f X ,0,1)(,)(y f Y =⎪⎩⎪⎨⎧><≤≤-d y cy d y c d c ,0,1随机变量X 及Y 是独立的. 7 解(1)),(y x f =y x y x F ∂∂∂),(2=)9)(4(6222y x ++π(2)X 的边缘分布函数=+∞=),()(x F x F X )22)(22(12ππππ++x arctg =)22(1xarctg +ππ.由此得随机变量X 的边缘分布密度函数 同理可得随机变量Y 的边分布函数=+∞=),()(y F y F Y )32)(22(12yarctg ++ππππ=)32(1yarctg +ππY 的边缘分布密度函数(3)由(2)知)(x f X )(y f Y =)4(22x +π)9(32y +π=),(y x f ,所以X 与Y 独立.8 解因为X 与Y 相互独立,所以Y X ,的联合概率密度为 所以,Z的分布律为:.1}2{,}1{,}0{212212-----==-====eZ P eeZ P e Z P9解:(1)由⎰⎰∞+∞-∞+∞-dxdy y x f ),(=1,即⎰⎰∞+∞++-==⇒0)43(121Adxdy e A y x ,即 12=⇒A 因此),(y x f =,,00,0,12)43(⎪⎩⎪⎨⎧>>+-其它y x e y x (2)X 的边缘概率密度为 当>x ,)(x f X =⎰∞∞-dy y x f ),(=⎰∞+-0)43(12dy e y x =x e 33-,当>y ,)(y f Y =⎰∞0),(dx y x f =⎰∞+-0)43(12dx e y x =y e 44-,可知边缘分布密度为:)(x f X =⎪⎩⎪⎨⎧>-,,0,0,33其它x e x)(y f Y =⎪⎩⎪⎨⎧>-,,00,44其它y e y(3)}20,10{≤<≤<Y X P =⎰⎰--+---=102083)43()1)(1(12e e dxdy e y x10解因为⎰⎰∞+∞-∞+∞-dxdy y x f ),(=1,即⎰⎰=101021dy y xdx c , 6,13121==⋅⋅c c 对任意10<<x ,)(x f X =⎰∞+∞-dy y x f ),(=⎰=1226x dy xy ,所以)(x f X =⎩⎨⎧<<,,0,10,2其它x x对任意10<<y ,)(y f Y =⎰∞+∞-dx y x f ),(=⎰=1022,36y dx xy ,所以)(y f Y =⎪⎩⎪⎨⎧<<,,0,10,32其它y y故),(y x f =)(x f X )(y f Y ,所以X 与Y 相互独立. 11解由 2ln 12211===⎰e e D x dx xS当21e x ≤≤时,,2121),()(1010xdy dy y x f x f x x X ===⎰⎰其它)(x f X =0. 所以:.41)2(=Xf12解(1)X ,Y 的边缘密度为分布密度为:)(x f X =⎰-<<=xxx x dy 10,21)(y f Y =⎰<<--=111,11yy y dx故)(y x f Y X =)(),(y f y x f Y =⎪⎩⎪⎨⎧<-,,0,,11其它x y y)(x y f X Y =)(),(x f y x f X =⎪⎩⎪⎨⎧<<,,0,1,21其它y x x(2)因为)(x f X )(y f Y y -=1≠),(y x f =1,故X与Y 不相互独立.13证设X 的概率密度为)(x f ,Y 的概率密度为)(y f ,由于YX ,相互独立,故),(Y X 的联合密度为),(y x f =)(x f )(y f .于是交换积分次序可得:⎰⎰∞+∞+∞-=xdy y f dx x f )()(⎰⎰∞+∞+∞-ydx x f dy y f )()(所以=≤}{Y X P =>}{Y X P 1-}{Y X P ≤故21}{=≤Y XP . 14解 设)(A P p =,由于Y X ,相互独立同分布,于是有,)(}{}{)(p A P a X P a Y P B P ==≤=≤=则,1)(p B P -=又=)(B A P )(A P +)(B P -)(A P )(B P =p+()1p --p )1p -=9712=+-p p 解得:,32,3121==p p 因而a 有两个值.由于2121}{)(1-==≤=⎰a dx a XP A P a,所以,当311=p 时,由21-a =31得35=a 当322=p 时,由21-a =32得37=a . 15解 (1)Y X +的可能取值为2,3,4.且 故有:;41}4{,21}3{,41}2{==+==+==+Y X P Y X P Y X P (2)由已知易得;21}42{,21}22{====X P X P 16解 由已知得所以有17证明:对任意的,,,1,021n n k += 我们有∑=-====ki i k Y P i X P k Z P 0}{}{}{(因为X与Y 相互独立)=∑=-----ki i k n i k i k n i n i i n qp C q p C 0)(2211 =∑=-+-k i k n n k ik n i n q p C C 02121)( (利用组合公式 ∑=+-=ki k nm i k n im C C C)=k n n k k n n q p C -++2121 即Y X Z +=~),(21p n n b +18解Y X Z +=在[0,2]中取值,按卷积公式Z 的分布密度为: ,)()()()(10dx x z f dx x z f x fz f Y Y X Z -=-=⎰⎰∞+∞-⎩⎨⎧≤≤-≤≤⎩⎨⎧≤-≤≤≤,1,10:,10,10:z x z x x z x 即其中如图,从而:⎪⎪⎪⎩⎪⎪⎪⎨⎧≤≤-=≤≤==⎰⎰-。
第三章节:数据的图表展示 (1)第四章节:数据的概括性度量 (15)第六章节:统计量及其抽样分布 (26)第七章节:参数估计 (28)第八章节:假设检验 (38)第九章节:列联分析 (41)第十章节:方差分析 (43)3.1 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C一般;D.较差;E.差。
调查结果如下:B EC C AD C B A ED A C B C DE C E EA DBC C A ED C BB ACDE A B D D CC B C ED B C C B CD A C B C DE C E BB EC C AD C B A EB AC E E A BD D CA DBC C A ED C BC B C ED B C C B C要求:(1)指出上面的数据属于什么类型。
顺序数据(2)用Excel 制作一张频数分布表。
用数据分析——直方图制作:(3)绘制一张条形图,反映评价等级的分布。
用数据分析——直方图制作:(4)绘制评价等级的帕累托图。
逆序排序后,制作累计频数分布表:接收 频数 频率(%) 累计频率(%) C 32 32 32 B 21 21 53 D 17 17 70 E 16 16 86 A 14 14 1003.2 某行业管理局所属40个企业2002年的产品销售收入数据如下:152124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 9788123115119138112146113126要求:(1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率。
1、确定组数:()lg 40lg() 1.60206111 6.32lg(2)lg 20.30103n K =+=+=+=,取k=6接收频率E16D 17 C 32 B 21 A142、确定组距:组距=( 最大值 - 最小值)÷组数=(152-87)÷6=10.83,取103、分组频数表(2)按规定,销售收入在125万元以上为先进企业,115~125万元为良好企业,105~115 万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。
6.1 调节一个装瓶机使其对每个瓶子的灌装量均值为盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差盎司的正态分布。
随机抽取由这台机器灌装的9个瓶子形成一个样本,并测定每个瓶子的灌装量。
试确定样本均值偏离总体均值不超过0.3盎司的概率。
时间:2021.03.05 创作:欧阳理解:总体方差知道的情况下,均值的抽样分布服从的正态分布,由正态分布,标准化得到标准正态分布:z=~,因此,样本均值不超过总体均值的概率P为:====21,查标准正态分布表得=0.8159因此,=0.63186.2在练习题6.1中,我们希望样本均值与总体均值的偏差在0.3盎司之内的概率达到0.95,应当抽取多大的样本?解:===6.3 ,,……,表示从标准正态总体中随机抽取的容量,n=6的一个样本,试确定常数b,使得解:由于卡方分布是由标准正态分布的平方和构成的:设Z1,Z2,……,Zn是来自总体N(0,1)的样本,则统计量服从自由度为n的χ分布,记为χ~??χ(n)因此,令,则,那么由概率,可知:b??,查概率表得:b??????6.4 在习题6.1中,假定装瓶机对瓶子的灌装量服从方差的标准正态分布。
假定我们计划随机抽取10个瓶子组成样本,观测每个瓶子的灌装量,得到10个观测值,用这10个观测值我们可以求出样本方差,确定一个合适的范围使得有较大的概率保证S2落入其中是有用的,试求b1,b2,使得解:更加样本方差的抽样分布知识可知,样本统计量:此处,n=10,,所以统计量根据卡方分布的可知:又因为:因此:则:查概率表:=3.325,=19.919,则=0.369,=1.887.1 从一个标准差为5的总体中采用重复抽样方法抽出一个样本容量为40的样本,样本均值为25。
(1)样本均值的抽样标准差等于多少(2)在95%的置信水平下,估计误差是多少?7.2 某快餐店想要估计每位顾客午餐的平均花费金额。
在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(1)假定总体标准差为15元,求样本均值的抽样标准误差。
=2.143(2)在95%的置信水平下,求边际误差。
,由于是大样本抽样,因此样本均值服从正态分布,因此概率度t=因此,=1.96×2.143=4.2(3)如果样本均值为120元,求总体均值的95%的置信区间。
置信区间为:==(115.8,124.2)7.4 从总体中抽取一个n=100的简单随机样本,得到=81,s=12。
要求:大样本,样本均值服从正态分布:或置信区间为:,==1.2(1)构建的90%的置信区间。
==1.645,置信区间为:=(79.03,82.97)(2)构建的95%的置信区间。
==1.96,置信区间为:=(78.65,83.35)(3)构建的99%的置信区间。
==2.576,置信区间为:=(77.91,84.09)7.5 利用下面信息,构造总体均值的置信区间。
(1)(2)(3)7.6 利用下面的信息,构建总体均值的置信区间。
(1)总体服从正态分布,且已知(2)总体不服从正态分布,且已知(3)总体不服从正态分布,σ未知,(4)总体服从正态分布,σ未知,7.7 某大学为了解学生每天上网的时间,在全校7 500名学生中采取重复抽样方法随机抽取36人,调查他们每天上网的时间,得到下面的数据(单位:小时):3.3 3.1 6.2 5.8 2.34.15.4 4.5 3.24.4 2.05.4 2.66.4 1.8 3.5 5.7 2.32.1 1.9 1.2 5.1 4.3 4.23.6 0.8 1.54.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5求该校大学生平均上网时间的置信区间,置信水平分别为90%,95%和99%。
解:(1)样本均值=3.32,样本标准差s=1.61;(2)抽样平均误差:重复抽样:==1.61/6=0.268不重复抽样:===0.268×=0.268×0.9 98=0.267(3)置信水平下的概率度:=0.9,t===1.645=0.95,t===1.96=0.99,t===2.576(4)边际误差(极限误差):=0.9,=重复抽样:==1.645×0.268=0.441不重复抽样:=????????×??????????????????,??重复抽样:????????×?????? ????不重复抽样:==1.96×0.267=0.523=0.99,=重复抽样:==2.576×0.268=0.69不重复抽样:==2.576×0.267=0.688(5)置信区间:=0.9,重复抽样:==(2.88,3.76)不重复抽样:==(2.88,3.76)=0.95,重复抽样:==(2.79,3.85)不重复抽样:==(2.80,3.84)=0.99,重复抽样:==(2.63,4.01)不重复抽样:==(2.63,4.01)7.8 从一个正态分布总体中随机抽取样本容量为8的样本,各样本值分别为:10,8,12,15,6,13,5,11。
求总体均值的95%的置信区间。
解:7.9 某居民小区为研究职工上班从家里到单位的距离,抽取了由16个人组成的一个随机样本,他们到单位的距离(单位:km)分别是:10 3 14 8 6 9 12 11 7 5 10 15 9 16 13 2假定总体服从正态分布,求职工上班从家里到单位平均距离的95%的置信区间。
解:小样本,总体方差未知,用t统计量均值=9.375,样本标准差s=4.11置信区间:=0.95,n=16,==2.13==(7.18,11.57)7.10 从一批零件中随机抽取36个,测得其平均长度为149.5,标准差为1.93(1)试确定该种零件平均长度的95%的置信区间或者7.11 某企业生产的袋装食品采用自动打包机包装,每袋标准重量为l00g。
现从某天生产的一批产品中按重复抽样随机抽取50包进行检查,测得每包重量(单位:g)如下:每包重量(g)包数96~98 98~100 100~102 102~104 104~106 2 3 34 7 4合计50已知食品包重量服从正态分布,要求:(1)确定该种食品平均重量的95%的置信区间。
解:大样本,总体方差未知,用z统计量样本均值=101.4,样本标准差s=1.829置信区间:=0.95,==1.96==(100.89,101.91)(2)如果规定食品重量低于l00g属于不合格,确定该批食品合格率的95%的置信区间。
解:总体比率的估计大样本,总体方差未知,用z统计量样本比率=(505)/50=0.9置信区间:=0.95,==1.96==(0.8168,0.9832)7.13 一家研究机构想估计在网络公司工作的员工每周加班的平均时间,为此随机抽取了18个员工。
得到他们每周加班的时间数据如下(单位:小时):6 321817122011792182516152916假定员工每周加班的时间服从正态分布。
估计网络公司员工平均每周加班时间的90%的置信区间。
解:小样本,总体方差未知,用t统计量均值=13.56,样本标准差s=7.801置信区间:=0.90,n=18,==1.7369==(10.36,16.75)7.15 在一项家电市场调查中.随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。
其中拥有该品牌电视机的家庭占23%。
求总体比例的置信区间,置信水平分别为90%和95%。
解:总体比率的估计大样本,总体方差未知,用z统计量样本比率=0.23置信区间:=0.90,==1.645==(0.1811,0.2789)=0.95,==1.96==(0.1717,0.2883)7.16 一位银行管理人员想估计每位顾客在该银行的月平均存款额,他假设所有顾客存款额的标准差为1000元,要求估计误差在200元一位,置信水平为99%,则应选取多大的样本?解:7.17 计算下列条件下所需要的样本量(1)(2)(3)7.20 顾客到银行办理业务时往往需要等待一段时间,而等待时间的长短与许多因素有关,比如,银行业务员办理业务的速度,顾客等待排队的方式等。
为此,某银行准备采取两种排队方式进行试验,第一种排队方式是:所有顾客都进入一个等待队列;第二种排队方式是:顾客在三个业务窗口处列队三排等待。
为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取10名顾客,他们在办理业务时所等待的时间(单位:分钟)如下:方式1 6.5 6.6 6.7 6.87.17.37.47.77.77.7方式2 4.2 5.4 5.8 6.2 6.77.77.78.59.310要求:(1)构建第一种排队方式等待时间标准差的95%的置信区间。
解:估计统计量经计算得样本标准差=3.318置信区间:=0.95,n=10,==19.02,==2.7==(0.1075,0.7574)因此,标准差的置信区间为(0.3279,0.8703)(2)构建第二种排队方式等待时间标准差的95%的置信区间。
解:估计统计量经计算得样本标准差=0.2272置信区间:=0.95,n=10,==19.02,==2.7==(1.57,11.06)因此,标准差的置信区间为(1.25,3.33)(3)根据(1)和(2)的结果,你认为哪种排队方式更好?第一种方式好,标准差小!7.22 从两个正态总体中分别抽取两个独立的随机样本,他们的均值和标准差如下表所示:来自总体1的样本来自总体2的样本样本均值为25 样本均值为23样本方差为16 样本方差为20=18.714297.23 下表是由4对观察值组成的随机样本。
配对号来自总体A的样本来自总体B的样本1 2 3 425108765(1)计算A与B各对观察值之差,再利用得出的差值计算和。
=1.75,=2.62996(2)设分别为总体A和总体B的均值,构造的95%的置信区间。
解:小样本,配对样本,总体方差未知,用t统计量均值=1.75,样本标准差s=2.62996置信区间:=0.95,n=4,==3.182==(2.43,5.93)7.24 一家人才测评机构对随机抽取的10名小企业的经理人用两种方法进行自信心测试,得到的自信心测试分数如下:人员编号方法1方法2178712634437261489845917464951768558766098577105539构建两种方法平均自信心的分之差的95%的置信区间解:=11,=6.5319737.25 从两个总体中各抽取一个=250的独立随机样本,来自总体1的样本比例为=40%,来自总体2的样本比例为=30%。
要求:(1)构造的90%的置信区间。
(2)构造的95%的置信区间。