数据模型与决策试题及参考答案
- 格式:doc
- 大小:143.50 KB
- 文档页数:8
《数据模型与决策》复习(附参考答案)
2018.9
一、填空题(五题共15分)
1. 已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是 ① 。 解:N(167.48,0.609)
考查知识点:已知总体服从正态分布,求样本均值的分布。
2. 某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为 ② 。 解:[1040,1936]
考查知识点:区间估计的求法。正态总体均值的区间估计是[n s Z X α
--1,n
s
Z X α-+1] 其中X 是样本平均数,s 是样本的标准差,n 是样本数。 详解:直接带公式得:区间估计是 [n s Z X α
--1,n
s
Z X α-+1]= [100224021488-,100224021488+]
=[1040,1936]
3. 从遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。假设某人前一胎是女孩,那么她的下一胎也是女孩的概率为0.55;如果某人前一胎是男孩,那么她的下一胎还是男孩的概率为0.48。已知小李第一胎是女孩,那么她的第三胎生男孩的概率是 ③ 。 解 p=0.4653
考查知识点:离散概率计算方法。
详解:假设B1=第1胎生男孩,B2=第2胎生男孩,B3=第3胎生男孩 G1=第1胎生女孩,G2=第2胎生女孩,G3=第3胎生女孩
P (B3)=P (B3B2)+P (B3G2)(直观解释是:第二胎生男孩的情况下第三胎生男孩,第二胎生女孩的情况下第三胎生男孩,两个概率之和为P (B3))
= P(B3|B2)P(B2)+P(B3|G2)P(G2)
=0.48×(1-0.55)+(1-0.55) ×0.55
=0.4653
4. 调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是④。
解p=0.5
考查知识点:了解正态分布概率含义。
5. 结合生活实际,判断两个量之间的相关系数大概有多大?比如问您孩子身高与父母身高的的相关系数可能是。(请在0.3、0.6和0.9中选一个)
考查知识点:了解相关系数。
本题答案:孩子与父母平均身高的相关性比较高,应该选0.9
6. 简述模拟仿真的关键步骤。
考查知识点:模拟仿真的思想
二、单项选择题(五题共15分)
1. 下列事件中,属于小概率事件的随机事件是()
A. 抛一枚均匀的硬币2次,结果全是正面
B.抛一枚均匀的硬币3次,结果全是正面
C. 抛一枚均匀的硬币4次,结果全是正面
D.小王某天上班路上捡到10元钱
解: D
考查知识点:认识哪些事件是小概率事件?
2. 关于假设检验,下列说法正确的是()。
A. P值<0.05,拒绝原假设
B. P值<0.05,接受原假设
C. P值>0.05,拒绝原假设
D. P值>0.05,接受原假设
解: A
考查知识点:假设检验的思想
3. 天气预报常常用区间表示一天温度的变化,比如明天温度在[a,b]之间,这种预报其实是一个置信度为95%的区间。描述置信度与精确度的关系。
4. 不确定型决策方法。
5. 检验两个变量之间是否有关系,如“吸烟与患肺病有关系吗?”应采用()。
A. U检验
B. t检验
C. 2检验
D. F检验
解 C
考查知识点:分组数据检验方法。
三、简答题(两题共40分)
1. 货车的行驶时间与行驶距离的远近及运送货物的次数有关,表2给出的资料是从上海市某运输队收集来的:
表2 货车的行驶时间与行驶距离的远近及运送货物的次数统计
利用Excel,得到下列输出结果,回答后面的三个问题。
回归统计
Multiple R 0.913
R Square 0.833
Adjusted R
Square
0.785
标准误差0.616
观测值10
方差分析
df SS MS F Sig F
回归分析 2 13.253 6.626 17.464 0.002 残差7 2.656 0.379
总计9 15.909
Coefficients 标准误差 t Stat P-value
Lower 95%
Upper 95%
Intercept
A
0.802 2.762 0.028 0.318 4.110 X Variable 1 2.688 0.792 3.395 0.012 0.816 4.560 X Variable 2 0.377
0.109
3.449 0.011 0.119 0.635
(1) 从上述输出结果看,这个模型拟合效果如何? (2) 上表中的截距A 为多少?
(3) 写出货车的行驶时间与行驶距离的远近及运送货物的回归方程。 (4) 倘若某次行驶距离为50公里,跑4次,估计花费多少时间?
解:(1) 从模型检验的F 值为17.464对应的p 值等于0.002小于5%看模型拟合效果很好,另外,R 2=0.833也表明模型的解释能力达到83.3%,说明模型拟合效果不错。 (2) 上表中的截距A=(0.318+4.11)/2=2.214.
(3)货车的行驶时间与行驶距离的远近及运送货物的回归方程为:
21377.0688.22.214y
ˆx x ++= (4) 将x1=0.5,x2=4次带入回归方程21377.0688.22.214y
ˆx x ++=,得花费时间约为5.07小时。
考查知识点:回归方法的操作、模型选择、估计和预测。
2.(10分) Westdata 公司正在考虑如何管理其数据处理操作系统,它有两种方案选择,一是继续让自己的员工管理(自营),二是聘请供应商管理(外包)。管理数据处理操作系统的费用取决于未来的需求,市场部经理预测未来需求有高、中、低三个等级,并且预测当未来的需求高时,自营的费用是1300,外包的费用1800,当未来的需求中时,自营的费用是1300,外包的费用1200,当未来的需求低时,自营的费用是1200,外包的费用600,请回答问题:
(1)给出Westdata 公司决策问题的支付矩阵(收益表);