数据模型与决策试题及参考答案

  • 格式:doc
  • 大小:143.50 KB
  • 文档页数:8

下载文档原格式

  / 8
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

《数据模型与决策》复习(附参考答案)

2018.9

一、填空题(五题共15分)

1. 已知成年男子的身高服从正态分布N(167.48,6.092),随机调查100位成年男子的身高,那么,这100位男子身高的平均数服从的分布是 ① 。 解:N(167.48,0.609)

考查知识点:已知总体服从正态分布,求样本均值的分布。

2. 某高校想了解大学生每个月的消费情况,随机抽取了100名大学生,算得平均月消费额为1488元,标准差是2240元。根据正态分布的“68-95-99”法则,该高校大学生每个月的消费额的95%估计区间为 ② 。 解:[1040,1936]

考查知识点:区间估计的求法。正态总体均值的区间估计是[n s Z X α

--1,n

s

Z X α-+1] 其中X 是样本平均数,s 是样本的标准差,n 是样本数。 详解:直接带公式得:区间估计是 [n s Z X α

--1,n

s

Z X α-+1]= [100224021488-,100224021488+]

=[1040,1936]

3. 从遗传规律看,一个产妇生男生女的概率是一样的,都是50%,但也有个人的特殊情况。假设某人前一胎是女孩,那么她的下一胎也是女孩的概率为0.55;如果某人前一胎是男孩,那么她的下一胎还是男孩的概率为0.48。已知小李第一胎是女孩,那么她的第三胎生男孩的概率是 ③ 。 解 p=0.4653

考查知识点:离散概率计算方法。

详解:假设B1=第1胎生男孩,B2=第2胎生男孩,B3=第3胎生男孩 G1=第1胎生女孩,G2=第2胎生女孩,G3=第3胎生女孩

P (B3)=P (B3B2)+P (B3G2)(直观解释是:第二胎生男孩的情况下第三胎生男孩,第二胎生女孩的情况下第三胎生男孩,两个概率之和为P (B3))

= P(B3|B2)P(B2)+P(B3|G2)P(G2)

=0.48×(1-0.55)+(1-0.55) ×0.55

=0.4653

4. 调查发现,一个刚参加工作的MBA毕业生在顶级管理咨询公司的初始年薪可以用均值为9万美元和标准差是2万美元的正态分布来表示,那么一个这样的毕业生初始年薪超过9万美元的概率是④。

解p=0.5

考查知识点:了解正态分布概率含义。

5. 结合生活实际,判断两个量之间的相关系数大概有多大?比如问您孩子身高与父母身高的的相关系数可能是。(请在0.3、0.6和0.9中选一个)

考查知识点:了解相关系数。

本题答案:孩子与父母平均身高的相关性比较高,应该选0.9

6. 简述模拟仿真的关键步骤。

考查知识点:模拟仿真的思想

二、单项选择题(五题共15分)

1. 下列事件中,属于小概率事件的随机事件是()

A. 抛一枚均匀的硬币2次,结果全是正面

B.抛一枚均匀的硬币3次,结果全是正面

C. 抛一枚均匀的硬币4次,结果全是正面

D.小王某天上班路上捡到10元钱

解: D

考查知识点:认识哪些事件是小概率事件?

2. 关于假设检验,下列说法正确的是()。

A. P值<0.05,拒绝原假设

B. P值<0.05,接受原假设

C. P值>0.05,拒绝原假设

D. P值>0.05,接受原假设

解: A

考查知识点:假设检验的思想

3. 天气预报常常用区间表示一天温度的变化,比如明天温度在[a,b]之间,这种预报其实是一个置信度为95%的区间。描述置信度与精确度的关系。

4. 不确定型决策方法。

5. 检验两个变量之间是否有关系,如“吸烟与患肺病有关系吗?”应采用()。

A. U检验

B. t检验

C. 2检验

D. F检验

解 C

考查知识点:分组数据检验方法。

三、简答题(两题共40分)

1. 货车的行驶时间与行驶距离的远近及运送货物的次数有关,表2给出的资料是从上海市某运输队收集来的:

表2 货车的行驶时间与行驶距离的远近及运送货物的次数统计

利用Excel,得到下列输出结果,回答后面的三个问题。

回归统计

Multiple R 0.913

R Square 0.833

Adjusted R

Square

0.785

标准误差0.616

观测值10

方差分析

df SS MS F Sig F

回归分析 2 13.253 6.626 17.464 0.002 残差7 2.656 0.379

总计9 15.909

Coefficients 标准误差 t Stat P-value

Lower 95%

Upper 95%

Intercept

A

0.802 2.762 0.028 0.318 4.110 X Variable 1 2.688 0.792 3.395 0.012 0.816 4.560 X Variable 2 0.377

0.109

3.449 0.011 0.119 0.635

(1) 从上述输出结果看,这个模型拟合效果如何? (2) 上表中的截距A 为多少?

(3) 写出货车的行驶时间与行驶距离的远近及运送货物的回归方程。 (4) 倘若某次行驶距离为50公里,跑4次,估计花费多少时间?

解:(1) 从模型检验的F 值为17.464对应的p 值等于0.002小于5%看模型拟合效果很好,另外,R 2=0.833也表明模型的解释能力达到83.3%,说明模型拟合效果不错。 (2) 上表中的截距A=(0.318+4.11)/2=2.214.

(3)货车的行驶时间与行驶距离的远近及运送货物的回归方程为:

21377.0688.22.214y

ˆx x ++= (4) 将x1=0.5,x2=4次带入回归方程21377.0688.22.214y

ˆx x ++=,得花费时间约为5.07小时。

考查知识点:回归方法的操作、模型选择、估计和预测。

2.(10分) Westdata 公司正在考虑如何管理其数据处理操作系统,它有两种方案选择,一是继续让自己的员工管理(自营),二是聘请供应商管理(外包)。管理数据处理操作系统的费用取决于未来的需求,市场部经理预测未来需求有高、中、低三个等级,并且预测当未来的需求高时,自营的费用是1300,外包的费用1800,当未来的需求中时,自营的费用是1300,外包的费用1200,当未来的需求低时,自营的费用是1200,外包的费用600,请回答问题:

(1)给出Westdata 公司决策问题的支付矩阵(收益表);