数据分析与处理答案
- 格式:docx
- 大小:120.18 KB
- 文档页数:5
1.在Excel工作表的单元格中,如想输入数字字符串014812(学号),则应输入()。
A.“0014812“B."0014812"C.“014812”D.'0014812正确答案是:D2.在Excel工作表中,对单元格的引用有多种,被称为绝对引用的是()。
A.B$1B.$B$1C.B1D.$B1正确答案是:B3.在Excel工作表中,对单元格的引用有多种,被称为相对引用的是()。
A.D1B.D$1C.$D$1D.$D1正确答案是:A4.若在Excl某工作表的A1、B1单元格中分别填入了6.5和7,并将这2个单元格选中,然后向右拖动填充柄,在C1和D1中分别填入的数据是7.5,8。
A.对B.错正确答案是:A5.Exel单元格中输入字符的格式可以设置为()。
A.左对齐B.右对齐C.居中对齐D.两端对齐正确答案是:A,B,C6.在Excel 2010 中,进行分类汇总之前,我们必须对数据清单进行。
A.筛选B.对齐C.排序D.求和计算正确答案是:C7.关于筛选,叙述不正确的是()。
A.自动筛选可以同时显示数据区域和筛选结果B.高级筛选可以进行更复杂条件的筛选C.高级筛选不需要建立条件区,只有数据区域就可以了D.自动筛选可以将筛选结果放在指定的区域正确答案是:A,C,D8.使用Excel的数据筛选功能,是将()。
A.满足条件的记录显示出来,而删除掉不满足条件的数据B.不满足条件的数据用另外一个工作表来保存起来C.不满足条件的记录暂时隐藏起来,只显示满足条件的数据D.将满足条件的数据突出显示正确答案是:C9.以下哪种方式可在Excel中输入数值-6 ()_。
A.“6B.\\6正确答案是:D10.某单位要统计各科室人员工资情况,按工资从高到低排序,若工资相同,按工龄降序排列,则以下做法正确的是()。
A.主要关键字为"科室",次要关键字为"工资",第二个次要关键字为"工龄"B.主要关键字为"工资",次要关键字为"工龄",第二个次要关键字为"科室"C.主要关键字为"工龄",次要关键字为"工资",第二个次要关键字为"科室"D.主要关键字为"科室",次要关键字为"工龄",第二个次要关键字为"工资"正确答案是:A11.关于Excel区域定义不正确的论述是()。
数据分析及应用试题库及答案一、单选题(共50题,每题1分,共50分)1、用顺序查找法对具有n个结点的线性表查找一个结点的时间复杂度为()A、A O(log2n2)B、B O(nlog2n)C、C O(n)D、D O(log2n)正确答案:C2、 a = np.array([10,100]) b = np.array([1,2]) print (np.power(a,b))输出结果A、A [100 10000]B、B [10,100]C、C [10 10000]D、D [100,100]正确答案:C3、某二叉树的前序序列为ABCD,中序序列为BDCA,则该二叉树的深度为______。
A、A 4B、B 3C、C 2D、D 不确定正确答案:A4、求最短路径的 FLOYD 算法的时间复杂度为()A、A O(n)B、B O(n+e)C、C O(n^2)D、D O(n^3)正确答案:D5、归并排序的时间复杂度()A、A O(log(N))B、B O(N*log(N))C、C O(N)D、D O(N^2)正确答案:B6、哪个函数用户将序列中所有元素作为参数调用指定函数,并将结果构成新的序列A、A lambdaB、B mapC、C filterD、D zip正确答案:B7、以下选项中,不是Python中文件操作的相关函数是()。
A、A open ()B、B load ()C、C read ()D、D write ()正确答案:B8、关于预处理的说法中,下列选项中描述不正确是A、A concat()函数可以沿着一条轴将多个对象进行堆叠B、B merge()函数可以根据一个或多个键将不同的DataFrame进行合并C、C 可以使用rename()方法对索引进行重命名操作D、D unstack()方法可以将列索引旋转为行索引正确答案:D9、下列函数中,可以用于创建等差数组的函数是A、A empty()B、B arange()C、C zeros()D、D ones()正确答案:B10、假设有命令import numpy as np Array1 = np.linspace(1,5,3,dtype=int) print(Array1)则,执行结果是A、A 30B、B 20C、C [[ 7 10] [15 22]]D、D [[ 5 8] [15 22]]正确答案:A11、np.array([[1,2],[3]]).tolist()=(?)A、A [1 2 3]B、B [[1,2],[3]]C、C [[1 2],[3]]D、D 程序报错正确答案:D12、在 n 个结点的顺序表中,算法的时间复杂度是 O(1)的操作是():A、A 访问第i个结点(1≤i≤n)和求第i个结点的直接前驱(2≤i≤n)B、B 在第i个结点后插入一个新结点(1≤i≤n)C、C 删除第i个结点(1≤i≤n)D、D 将n个结点从小到大排序正确答案:A13、下面不属于软件工程三要素的是______。
数据分析方法课后答案【篇一:数据的分析练习题及答案】、选择题:(每题3分,共15分)1.小明家要买台电脑,下面是甲、乙、丙三种电脑近几年来的销量,如果小明想买一台近期比较流行的电脑,他应买()a.甲b.乙c.丙2.小李是个彩票迷,为了能得奖,他特意询问了前15天的中奖号码分别是:519、、706、328、556、768、215、435、741、624、307、821、696、741、471、285. 你认为这样的观点是否合理()a.不合理b.合理3.小靖想买双好的运动鞋,于是她上网查找有关资料,得到下表:她想买一双价格在300-600元之间,且她喜欢白色、红白相间、浅绿或淡黄色, 并且防水性能很好,那么她应选()a.甲b.乙c.丙d.丁4.为了计算植树节时本班同学所种植的30棵树苗的平均高度, 三位同学先将所有树苗的然后,他们分别这样计算这30棵树苗的平均高度:130130列式正确的是()a.(1)b.(1)和(2);c.(1)和(3)d.(2)和(3)5.某班在一次物理测试中的成绩为:100分7人,90分14人,80分17人,70分8人, 60分2人,50分2人.则该班此次测试的平均成绩为() a.82分b.62分c.64分d.75分二、填空题:(每题4分,共20分)6.一次知识竞赛中,36名参赛选手的得分情况为:5人得75分,8人得80分,6 人得85分,8人得90分,7人得95 分, 2 人得100 分, 要计算他们的平均得分, 可列算式:_____________.(1)7.某校九年级6个班级的学生的人数和平均体重如下表:要计算全校学生的平均体重,可列算式________,平均体重约为__________.8.某家庭搬进新居后,又添置了新的家用电器,为了了解用电量的大小, 该家庭在6月初连续几天观察电表的度数,如下表所示:9.为了解我国14岁男孩的平均身高,从北方抽取了300个男孩,平均身高1.60m; 从南方抽取了200个男孩,平均身高为1.50m;若北方14岁男孩数与南方14岁男孩数的比为3:2,由此可推断我国14岁男孩的平均身高约为______m.10.小明先用5千米/时的速度行驶3小时后,又用4千米/时的速度行驶5小时到达目的地,则小明的平均速度为________. 三、解答题:(每题9分,共54分)11.某同学对他在本学期的自我检测成绩进行了统计:95分的有12次,90 分的有10次,85分的有15次,80分的有3次,75分的有1次,65分的有3次.试计算该同学本学期自我检测的平均成绩..12.超市里要举行转盘摇奖活动,转盘如图所示,买满100元可摇奖一次,有人说:如果大家都摇到自行车,那么超市岂不是亏本了?如果你是超市决策者,会不会因此而改变有奖销售的方案呢?说说你的理由?自行车300元洗洁精2.80元酱油5.0元西红柿2.00元墨水3.50元13.请你根据上表比较这两个国家的数据,你能得出什么结论?14.由于水资源贫乏,节约用水非常重要,请你调查一下,本班每位学生所在家庭的月人均用水量,并据此制作频数分布图,同时估计一下当地家庭的月人均用水量.15.爸爸给小明一串钥匙,共有4把,小明决定先试试哪把是防盗门的钥匙. 请你用模拟实验方法估计一下,他第1次试开就成功的机会有多大?16.转动如图所示的转盘两次,每次指针都指向一个数字. 如果两次所指的数字之积是质数,游戏者a得10分;乘积不是质数,游戏者b得10分.你认为这个游戏公平吗?如果你认为这个游戏不公平,你愿意做游戏者a还是游戏者b?为什么?31246517.有人对记忆和遗忘的规律进行研究,人在记忆过某些知识后, 在不同时间段对其进行测试,结果如下表:分析测试结果,在图中绘制曲线图,并回答遗忘在数量上的变化规律.记忆效果1%记忆的保持曲线图答案:一、1.b 2.a 3.d 4.d 5.a148?50?49.8?46?50.2?55?49.5?48?51?52?50.3?547., 49.8kg50?46?55?48?52?54358.387.75 9.1.56 10.千米/时8三、144所以,美国的吸烟总人数和每天吸烟的总数都大于日本,但吸烟人口占总人口的比例小于日本.14.列出调查表,对本班学生实事求是地进行调查以获得真实的信息.15.可用4个相同的球,1个白的,3个黑的,每次抽1个,则第1次抽到白球的概率为所求概率,1为. 41516.不公平,愿做b 解:乘积是质数的概率是,乘积不是质数的概率是, 游戏不公平,故66愿做b.17.遗忘曲线表明了遗忘在数量上的变化规律,遗忘的数量随时间的前进而递增;这种递增先快后慢,在识记后的短时间内特别迅速,然后逐渐缓慢下来.二、6.记忆效果1%/d记忆的保持曲线图【篇二:定性数据分析第三章课后答案】9、对72个可疑患者用两种不同的方法进行检测,检测结果如下:问:检测方法1阳性和阴性的比例是否与检测方法2阳性和阴性的比例相同?解:(1)提出原假设根据题意,我们假设检测方法1阳性和阴性的比例与检测方法2阳性和阴性的比例是相同。
1题1. 在数据分析中,以下哪个步骤通常是第一步?A. 数据清洗B. 数据收集C. 数据可视化D. 数据建模2. 数据清洗的主要目的是什么?A. 增加数据量B. 删除无关数据C. 提高数据质量D. 加快数据处理速度3. 下列哪个工具最适合用于大数据分析?A. ExcelB. SQLC. HadoopD. Access4. 数据可视化的主要目的是什么?A. 隐藏数据B. 美化数据C. 展示数据D. 压缩数据5. 在数据分析中,描述性统计分析主要关注什么?A. 数据的变化趋势B. 数据的分布和集中趋势C. 数据的因果关系D. 数据的预测模型6. 下列哪个是数据仓库的主要功能?A. 数据加密B. 数据备份C. 数据集成D. 数据销毁7. 数据挖掘的主要目的是什么?A. 发现数据中的模式和关联B. 删除数据中的错误C. 增加数据的存储空间D. 加快数据输入速度8. 在数据分析中,预测性分析主要使用哪种技术?A. 回归分析B. 聚类分析C. 关联规则D. 因子分析9. 下列哪个是数据分析师的主要职责?A. 数据输入B. 数据分析和解释C. 数据存储D. 数据删除10. 数据分析项目中,以下哪个步骤最耗时?A. 数据收集B. 数据清洗C. 数据建模D. 数据可视化11. 在数据分析中,以下哪个工具常用于处理结构化数据?A. PythonB. RC. SQLD. Tableau12. 数据分析中的“数据湖”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据加密技术13. 在数据分析中,以下哪个步骤可以帮助理解数据的内在结构?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘14. 数据分析中的“数据集市”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据加密技术15. 在数据分析中,以下哪个工具常用于数据可视化?A. ExcelB. SQLC. HadoopD. Access16. 数据分析中的“数据治理”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据管理策略17. 在数据分析中,以下哪个步骤可以帮助发现数据中的异常值?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘18. 数据分析中的“数据字典”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据描述文档19. 在数据分析中,以下哪个工具常用于处理非结构化数据?A. PythonB. RC. SQLD. Tableau20. 数据分析中的“数据质量”是什么?A. 数据的准确性和完整性B. 数据的存储空间C. 数据的处理速度D. 数据的加密技术21. 在数据分析中,以下哪个步骤可以帮助提高数据的可解释性?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘22. 数据分析中的“数据集成”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据合并技术23. 在数据分析中,以下哪个工具常用于数据挖掘?A. ExcelB. SQLD. Access24. 数据分析中的“数据模型”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据表示方法25. 在数据分析中,以下哪个步骤可以帮助预测未来趋势?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘26. 数据分析中的“数据仓库”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据管理策略27. 在数据分析中,以下哪个工具常用于数据清洗?A. ExcelB. SQLC. HadoopD. Access28. 数据分析中的“数据流”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一种数据处理过程29. 在数据分析中,以下哪个步骤可以帮助发现数据中的模式?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘30. 数据分析中的“数据集”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 一组数据记录31. 在数据分析中,以下哪个工具常用于数据建模?B. SQLC. HadoopD. Access32. 数据分析中的“数据标签”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据分类标识33. 在数据分析中,以下哪个步骤可以帮助提高数据的可用性?A. 数据清洗B. 数据建模C. 数据可视化D. 数据挖掘34. 数据分析中的“数据备份”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据复制过程35. 在数据分析中,以下哪个工具常用于数据可视化?A. ExcelB. SQLC. HadoopD. Access36. 数据分析中的“数据加密”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据保护技术37. 在数据分析中,以下哪个步骤可以帮助保护数据安全?A. 数据清洗B. 数据建模C. 数据可视化D. 数据加密38. 数据分析中的“数据压缩”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据减少技术39. 在数据分析中,以下哪个工具常用于数据压缩?A. ExcelB. SQLC. HadoopD. Access40. 数据分析中的“数据恢复”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据还原过程41. 在数据分析中,以下哪个步骤可以帮助恢复丢失的数据?A. 数据清洗B. 数据建模C. 数据可视化D. 数据恢复42. 数据分析中的“数据迁移”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据转移过程43. 在数据分析中,以下哪个工具常用于数据迁移?A. ExcelB. SQLC. HadoopD. Access44. 数据分析中的“数据同步”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据更新过程45. 在数据分析中,以下哪个步骤可以帮助保持数据的一致性?A. 数据清洗B. 数据建模C. 数据可视化D. 数据同步46. 数据分析中的“数据审计”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据检查过程47. 在数据分析中,以下哪个步骤可以帮助检查数据的质量?A. 数据清洗B. 数据建模C. 数据可视化D. 数据审计48. 数据分析中的“数据归档”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据存储过程49. 在数据分析中,以下哪个步骤可以帮助长期保存数据?A. 数据清洗B. 数据建模C. 数据可视化D. 数据归档50. 数据分析中的“数据共享”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据分发过程51. 在数据分析中,以下哪个步骤可以帮助数据在不同系统间流通?A. 数据清洗B. 数据建模C. 数据可视化D. 数据共享52. 数据分析中的“数据权限”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据访问控制53. 在数据分析中,以下哪个步骤可以帮助控制数据的访问?A. 数据清洗B. 数据建模C. 数据可视化D. 数据权限54. 数据分析中的“数据标准化”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据格式统一55. 在数据分析中,以下哪个步骤可以帮助统一数据格式?A. 数据清洗B. 数据建模C. 数据可视化D. 数据标准化56. 数据分析中的“数据分类”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据分组过程57. 在数据分析中,以下哪个步骤可以帮助组织数据?A. 数据清洗B. 数据建模C. 数据可视化D. 数据分类58. 数据分析中的“数据聚合”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据汇总过程59. 在数据分析中,以下哪个步骤可以帮助汇总数据?A. 数据清洗B. 数据建模C. 数据可视化D. 数据聚合60. 数据分析中的“数据转换”是什么?A. 一种数据存储系统B. 一种数据清洗工具C. 一种数据可视化方法D. 数据格式变化61. 在数据分析中,以下哪个步骤可以帮助改变数据格式?A. 数据清洗B. 数据建模C. 数据可视化D. 数据转换答案1. B2. C3. C4. C5. B6. C7. A8. A9. B10. B11. C12. A13. D14. A15. A16. D17. A18. D19. A20. A21. C22. D23. C24. D25. B26. A27. A28. D29. D30. D31. B32. D33. A34. D35. A36. D37. D38. D39. C40. D41. D42. D43. B44. D45. D46. D47. D48. D49. D50. D51. D52. D53. D54. D55. D56. D57. D58. D59. D60. D61. D。
数据分析及应用试题库与答案一、单选题(共30题,每题1分,共30分)1、python源程序执行的方式A、A 编译执行B、B 解析执行C、C 直接执行D、D 边编译边执行正确答案:B2、实现最长公共子序列利用的算法是()A、A 分治策略B、B 动态规划法C、C 贪心法D、D 回溯法正确答案:B3、以下哪些选项为真?A、A O(log(n))B、B O(n)C、C O(nlog(n))D、D O(n^2)正确答案:B4、for i in range(10,-1,)循环如果自然结束将执行循环内语句(?)次。
A、A 10B、B 9C、C 1D、D 0正确答案:D5、在结构化方法中,用数据流程图(DFD)作为描述工具的软件开发阶段是______。
A、A 可行性分析B、B 需求分析C、C 详细设计D、D 程序编码正确答案:B6、已知df为DataFrame对象,提取Pulse列中值大于100并且Calories列中值小于400的行,代码是:()A、A print(df[df( Calories )>300] & (df[ Calories ]B、B print(df[(df[ Pulse ]>100) &&(df[ Calories ]C、C print(df[(df[ Pulse ]>100) and (df[ Calories ]D、D print(df[(df[ Pulse ]>100) &(df[ Calories ]正确答案:D7、pow(2,2,3)返回值为()。
A、A 64B、B 64.0C、C 1D、D 1.0正确答案:C8、下列哪种说法是错误的A、A 除字典类型外,所有标准对象均可以用于布尔测试B、B 空字符串的布尔值是FalseC、C 空列表对象的布尔值是FalseD、D 值为0的任何数字对象的布尔值是False正确答案:A9、时间复杂度不受数据初始状态影响而恒为的是()。
数据分析与应用试题(附参考答案)一、单选题(共60题,每题1分,共60分)1、()是对商品为店铺销售或利润贡献能力的衡量,主要指标包括客单价、毛利率、成本费用利润率等。
A、商品获客能力B、商品盈利能力C、商品运营能力D、商品研发能力正确答案:B2、数据采集遵循的原则不包括()oA、最大数据原则B、数据安全原则C、目的限制原则D、D.合法、公开原则正确答案:A3、EXCE1描述统计结果中,不包括()指标。
A、峰度、偏度B、平均数、标准差C、加权算术平均数D、最大值、最小值正确答案:C4、下列方法中,不是数据规范化方法的是()oA、最大-最小规范化B、零-均值规范化C、平均值规范化D、小数定标规范化正确答案:C5、在网店内的客户交易订单详情表中,以下字段中可作为度量使用的字段是()oA、商品类别B、购买数量C、省份D、客户名称正确答案:D6、以下内容中,不可衡量产品竞争能力的是()。
A、成本优势B、质量优势C、管理人员创新能力D、技术优势正确答案:C7、迷你图与正常的图表功能相似,下列说法正确的是()oA、迷你图可以设置数据标记B、迷你图可以设置图例C、迷你图也有坐标轴D、迷你图占用空间小正确答案:D8、某食品网店3天的成交总额为12880元,这3天的成交商品数量分别为256、468、320件,其件单价为()。
A、17.5B、12.3C、15D、18正确答案:B9、系列关于数据分析流程的说法,错误的是()oA、需求分析是数据分析最重要的一部分B、模型评价能够评价模型的优劣C、分析与建模时只能够使用数值型数据D、数据预处理是能够数据建模的前提正确答案:C10、完成数据采集后对数据进行复查或计算,将其和历史数据进行比较。
同时还要检查字段的完整性,保证核心指标数据完整,属于()检查。
A、完整性检查B、B、准确性检查C、规范性检查D、D、以上都不是正确答案:AIK以下指标中,可以实时反映出账户的竞争力的是()oA、展现量B、点击率C、留存量D、转化率正确答案:A12、从大数据中总结、抽取相关的信息和知识,帮助人们分析发生了什么,并呈现事物的发展历程的是()oA、描述性数据分析B、B.预测性数据分析C、规范性数据分析D、D.差异性数据分析正确答案:A13、以下关于数据可视化说法错误的是()oA、数据可视化能够化繁为简,增加信息可读性和趣味性B、战略地图是对企业战略要素及其之间因果关系的可视化表示方法C、数据可视化是指通过图形、动画等更加形象、清晰的方法对数据大小进行体现,同时阐释数据间的关系和趋势,使数据分析后得出的结果更加容易使用和理解D、数据可视化由于要实现其功能用途,因此会令人感到枯燥乏味正确答案:D14、以下关于平均数的说法错误的是()oA、平均数一般是指算术平均数B、平均数是非常重要的基础性指标C、能代表总体的一般水平D、体现了总体内各单位的差异正确答案:D15、网站流量数据分析方法有数据清洗、数据提取、数据转化和()oA、数据计算B、数据核对C、数据检查D、数据评估正确答案:A16、从竞争对手分析的角度来看,不包括哪个步骤()oA、从网店整体情况分析B、不需要从评论分析C、从商品信息分析D、从详情页分析正确答案:B17、()是指通过统计、数学或计算的方法对现象进行系统的实证研究。
智慧树知到《excel数据处理与分析》章节测试题与答案第一章单元测试1、在Excel中,一个工作簿就是一个Excel文件,其扩展名为()。
A:.XLSXB:.DBFXC:.EXEXD:.LBLX答案:【.XLSX】2、在Excel中,一个工作簿可以包含()工作表。
A:1个B:2个C:多个D:3个答案:【多个】3、Excel电子表格A1到C5为对角构成的区域,其表示方法是()。
A:A1:C5B:A1,C5C:C5;A1D:A1+C5答案:【A1:C5】4、以下单元格引用中,下列哪一项属于混合引用()。
A:E3B:$C$18C:$D$13D:B$20答案:【B$20】5、在Excel中,下面关于单元格的叙述正确的是()。
A:在编辑的过程中,单元格地址在不同的环境中会有所变化B:工作表中单元格是由单元格地址来表示的C:为了区分不同工作表中相同地址的单元格地址,可以在单元格前加上工作表的名称,中间用“#”间隔D:A4表示第4列第1行的单元格答案:【工作表中单元格是由单元格地址来表示的】6、Excel在公式运算中,如果引用第6行的绝对地址,第D列的相对地址,则应为()。
A:$D6B:D$6C:$6DD:6D答案:【D$6】7、在Excel中,进行公式复制时()发生改变。
A:绝对地址中的地址表达式B:绝对地址中所引用的单元格C:相对地址中的地址偏移量D:相对地址中所引用的单元格答案:【相对地址中所引用的单元格】8、在下列Excel运算符中,优先级最高的是()。
A:&B:<>C::D:^答案:【:】9、设在B1单元格存有一公式为:=A$5,将其复制到D1后,公式变为=C$5。
A:对B:错答案:【对】10、设在单元格A1中有公式:=B1+B2,若将其复制到单元格C1中则公式为=D1+D2。
A:错B:对答案:【对】第二章单元测试1、在Excel中,给当前单元格输入数值型数据时,默认为()。
A:左对齐B:居中C:随机D:右对齐答案:【右对齐】2、在工作表的单元格内输入数据时,可以使用"自动填充"的方法,填充柄是选定区域()的小黑方块。
《excel数据处理与分析》章节测试题与答案XXX知到《excel数据处理与分析》章节测试题与答案第一章单元测试1、在Excel中,一个工作簿就是一个Excel文件,其扩展名为()。
A:.XLSXB:.DBFXC:.EXEXD:.LBLX答案:【.XLSX】2、在Excel中,一个工作簿可以包含()工作表。
A:1个B:2个C:多个D:3个答案:【多个】3、Excel电子表格A1到C5为对角构成的区域,其表示方法是()。
A:A1:C5B:A1,C5C:C5;A1D:A1+C5答案:【4、以下单元格引用中,下列哪一项属于夹杂引用()。
A:E3B:$C$18C:$D$13D:B$20答案:【B$20】5、在Excel中,上面关于单元格的叙说正确的选项是()。
A:在编纂的进程中,单元格地址在不同的情形中会有所变化B:事情表中单元格是由单元格地址来透露表现的C:为了区分不同工作表中相同地址的单元格地址,可以在单元格前加上工作表的名称,中间用“#”间隔D:A4表示第4列第1行的单元格谜底:【事情表中单元格是由单元格地址来透露表现的】6、Excel在公式运算中,如果引用第6行的绝对地址,第D列的相对地址,则应为()。
A:$D6B:D$6C:$6DD:6D谜底:【D$6】7、在Excel中,进行公式复制时()发生改变。
A:绝对地址中的地址表达式B:绝对地址中所引用的单元格C:相对地址中的地址偏移量D:相对地址中所引用的单元格答案:【相对地址中所引用的单元格】8、在下列Excel运算符中,优先级最高的是()。
A:&B:<>C::D:^答案:【:】9、设在B1单元格存有一公式为:=A$5,将其复制到D1后,公式变为=C$5.A:对B:错答案:【对】10、设在单元格A1中有公式:=B1+B2,若将其复制到单元格C1中则公式为=D1+D2.A:错B:对谜底:【对】第二章单元测试1、在Excel中,给当前单元格输入数值型数据时,默认为()。
数据分析技术试题库与参考答案一、单选题(共50题,每题1分,共50分)1、请阅读下面一段程序: roll_window = ser_obj.rolling(window=10) 有关上述程序,下面描述错误的是()。
A、窗口的标签为非居中B、窗口的大小为10C、roll_window是一个Period类对象D、默认对一列的数据进行计算正确答案:C2、关于数据重塑的说法中,下列选项描述错误的是()。
A、数据重塑可以将DataFrame转换为SeriesB、stack()方法可以将列索引转换为行索引C、对一个DataFrame使用stack()方法后返回的一定是一个SeriesD、unstack()方法可以将行索引转换为列索引正确答案:C3、当使用resample()方法重新采样时,下列哪个参数可以确定采样的闭合区间?()A、closedB、howC、labelD、fill_method正确答案:A4、关于Series结构,下列描述正确的是()。
A、Series是一个类似于二维数组的对象B、Series由一组数据和与之相关的索引两部分构成C、Series只能保存整数和字符串类型的数据D、Series的索引默认是从1开始正确答案:B5、下列图表中,适用于比较跨类别数据的是()。
A、饼图B、直方图C、散点图D、折线图正确答案:C6、下列pyplot模块的函数中,可以绘制散点图的是()。
A、scatter()B、bar()C、pie()D、hist()正确答案:A7、下列函数中,用于计算整数的绝对值的是()。
A、square()B、sqrt()C、abs()D、floor()E、Abstract正确答案:C8、下列选项中,不属于groupby()方法分组方式的是()。
A、列表或数组B、DataFrame中某列的名称C、字典或SeriesD、集合正确答案:D9、关于agg()方法的使用中,下列描述错误的是()。
简答题(5X 2分,共10分)CL、UCL、LCL1、请解释质量控制图中三条主要控制线的意义:未学,不考2、请解释正交设计表“ L934”这个符号所指代的意义。
如果要做6因素4水平实验,应该选择以下哪一个正交表(不考虑交互作用):L l645,L3249L:正交;9:9行或9次实验;3:3个水平;4: 4列或4个因素选L3249.、计算题(90分)1、某分析人员分别进行4次平行测定,得铅含量分别是、、、、,试分别用3s法、Dixon法和Grubbs检验法判断是否为离群值。
(,4=,,5=)(12分)x=, s=,3s法:1应保留70.63 60.08Dixon : Q 0.896> ,5=,应舍去71.85 60.08Grubbs: G计=60.08 68.455/5.61 >,4,应舍去•2、4次测定结果为:%、%、%、%,根据这些数据估计此样品中铬的含量范围(P=95%)?(8分)(P 90% t o.10,3 2.353 , P 95% t o.05,3 3.182 , P 99% t。
* 5.841) x =%, s=%1.135 3.182 0.0238/1.135 0.0383、用一种新方法测定标准试样中的氧化铁含量(%),得到以下8个数据: .......... . 标准偏差为%,标准值为%问这种新方法是否可靠(P=95%,,7=) (10分)t l3°30 34.33爲 1.77< ,7,所以新方法可靠0.0484、某小组做加标回收试验考查方法的准确性,测得加标前1000mL样品浓度为L,加入浓度为1000mg/L的标准样品后,测得样品总浓度为L,求回收率是多少。
(8分)没讲,不考5、两分析人员测定某试样中铁的含量,得到如下结果:已知A的标准偏差S1= , B的标准偏差S2=,请比较两个人测定结果的精密度和准确的有无显着性差异。
(12分)F (,4,4) =, t (,8)=F==< F (,4,4),故精密度无显着性差异t=< t (,8),故准确度无显着性差异5. 拟考察茶多酚浓度、浸泡时间、维生素C等3个因素对米粉保鲜效果的影响,实验因素水平表如下表。
计算机应用技术等级证书数据处理与分析考试1. 在Excel中,用于计算平均值的函数是:A. SUMB. AVERAGEC. COUNTD. MAX2. 下列哪个不是数据库管理系统?A. MySQLB. OracleC. Microsoft ExcelD. PostgreSQL3. 在Python中,用于连接字符串的操作符是:A. +B. -C. *D. /4. 下列哪个工具常用于大数据分析?A. Microsoft WordB. TableauC. Adobe PhotoshopD. Google Docs5. 在SQL中,用于选择特定列的语句是:A. INSERTB. SELECTC. UPDATED. DELETE6. 下列哪个编程语言最适合用于数据科学?A. JavaB. C++C. PythonD. Ruby7. 在数据处理中,ETL代表什么?A. Extract, Transform, LoadB. Encode, Transfer, LoadC. Extract, Transfer, LinkD. Encode, Transform, Link8. 下列哪个不是数据可视化工具?A. Power BIB. MatplotlibC. TensorFlowD. D3.js9. 在R语言中,用于创建数据框的函数是:A. data.frame()B. matrix()C. array()D. list()10. 下列哪个是NoSQL数据库的例子?A. MongoDBB. MySQLC. OracleD. SQL Server11. 在数据分析中,PCA代表什么?A. Principal Component AnalysisB. Primary Component AlgorithmC. Principal Component AlgorithmD. Primary Component Analysis12. 下列哪个不是机器学习算法?A. K-MeansB. Decision TreeC. Linear RegressionD. SQL Query13. 在Python中,用于数据清洗的常用库是:A. NumPyB. PandasC. MatplotlibD. SciPy14. 下列哪个是云计算平台?A. Microsoft AzureB. Adobe IllustratorC. Autodesk AutoCADD. CorelDRAW15. 在数据仓库中,星型模式是一种:A. 数据存储结构B. 数据处理算法C. 数据可视化工具D. 数据加密技术16. 下列哪个是数据湖的特征?A. 结构化数据存储B. 非结构化数据存储C. 只存储文本数据D. 只存储图像数据17. 在数据分析中,OLAP代表什么?A. Online Analytical ProcessingB. Offline Analytical ProcessingC. Online Application ProcessingD. Offline Application Processing18. 下列哪个不是数据挖掘技术?A. ClusteringB. AssociationC. RegressionD. Sorting19. 在Python中,用于科学计算的库是:A. SciPyB. DjangoC. FlaskD. Pyramid20. 下列哪个是数据治理的关键组成部分?A. 数据质量B. 数据加密C. 数据压缩D. 数据备份21. 在数据处理中,CRM代表什么?A. Customer Relationship ManagementB. Corporate Resource ManagementC. Customer Record ManagementD. Corporate Record Management22. 下列哪个不是数据集成工具?A. InformaticaB. TalendC. SSISD. Photoshop23. 在数据分析中,BI代表什么?A. Business IntelligenceB. Business IntegrationC. Business InteractionD. Business Information24. 下列哪个是数据仓库的主要功能?A. 数据存储B. 数据加密C. 数据压缩D. 数据备份25. 在数据处理中,DWH代表什么?A. Data WarehouseB. Data Web HouseC. Data Wide HouseD. Data Work House26. 下列哪个不是数据分析的生命周期阶段?A. 数据收集B. 数据清洗C. 数据加密D. 数据可视化27. 在数据分析中,EDA代表什么?A. Exploratory Data AnalysisB. Exhaustive Data AnalysisC. Extensive Data AnalysisD. Experimental Data Analysis28. 下列哪个不是数据科学家的主要技能?A. 编程B. 统计学C. 图形设计D. 机器学习29. 在数据处理中,Hadoop是一个:A. 数据库管理系统B. 数据可视化工具C. 大数据处理框架D. 数据加密技术30. 下列哪个是数据湖的优势?A. 数据结构化B. 数据非结构化C. 数据安全性D. 数据备份31. 在数据分析中,SVM代表什么?A. Support Vector MachineB. System Vector ModelC. Support Variable ModelD. System Variable Machine32. 下列哪个不是数据仓库的组成部分?A. 数据集市B. 数据湖C. 数据集D. 数据模型33. 在数据处理中,MDM代表什么?A. Master Data ManagementB. Model Data ManagementC. Manage Data ManagementD. Master Database Management34. 下列哪个不是数据治理的组成部分?A. 数据质量B. 数据安全C. 数据加密D. 数据政策35. 在数据分析中,RFM代表什么?A. Recency, Frequency, MonetaryB. Recent, Frequent, MonetaryC. Recency, Frequency, MonitorD. Recent, Frequent, Monitor36. 下列哪个不是数据可视化的目的?A. 数据解释B. 数据加密C. 数据探索D. 数据交流37. 在数据处理中,BI工具的主要功能是:A. 数据存储B. 数据分析C. 数据加密D. 数据备份38. 下列哪个是数据科学的主要领域?A. 数据分析B. 数据加密C. 数据压缩D. 数据备份39. 在数据分析中,KPI代表什么?A. Key Performance IndicatorB. Key Process IndicatorC. Key Progress IndicatorD. Key Parameter Indicator40. 下列哪个不是数据仓库的设计模式?A. 星型模式B. 雪花模式C. 星座模式D. 树型模式41. 在数据处理中,OLTP代表什么?A. Online Transaction ProcessingB. Offline Transaction ProcessingC. Online Test ProcessingD. Offline Test Processing42. 下列哪个不是数据挖掘的主要任务?A. 分类B. 聚类C. 关联D. 排序43. 在数据分析中,NLP代表什么?A. Natural Language ProcessingB. Neural Language ProcessingC. Normal Language ProcessingD. Network Language Processing44. 下列哪个不是数据科学的主要工具?A. RB. PythonC. ExcelD. Photoshop45. 在数据处理中,ETL工具的主要功能是:A. 数据提取B. 数据加密C. 数据压缩D. 数据备份46. 下列哪个是数据仓库的主要用户?A. 数据科学家B. 数据分析师C. 数据管理员D. 数据工程师47. 在数据分析中,SQL代表什么?A. Structured Query LanguageB. Standard Query LanguageC. System Query LanguageD. Simple Query Language48. 下列哪个不是数据治理的主要目标?A. 数据质量B. 数据安全C. 数据加密D. 数据一致性49. 在数据处理中,BI系统的主要功能是:A. 数据存储B. 数据分析C. 数据加密D. 数据备份50. 下列哪个是数据科学的主要方法?A. 数据分析B. 数据加密C. 数据压缩D. 数据备份51. 在数据分析中,ML代表什么?A. Machine LearningB. Model LearningC. Manage LearningD. Master Learning52. 下列哪个不是数据仓库的主要特点?A. 数据集成B. 数据历史C. 数据加密D. 数据一致性53. 在数据处理中,DW代表什么?A. Data WarehouseB. Data WebC. Data WideD. Data Work54. 下列哪个不是数据分析的主要步骤?A. 数据收集B. 数据清洗C. 数据加密D. 数据可视化55. 在数据分析中,AI代表什么?A. Artificial IntelligenceB. Advanced IntelligenceC. Applied IntelligenceD. Adaptive Intelligence答案部分:1. B2. C3. A4. B5. B6. C7. A8. C9. A10. A11. A12. D13. B14. A15. A16. B17. A18. D19. A20. A21. A22. D23. A24. A25. A26. C27. A28. C29. C30. B31. A32. B33. A34. C35. A36. B37. B38. A39. A40. D41. A42. D43. A44. D45. A46. B47. A48. C49. B50. A51. A52. C53. A54. C55. A。
化工数据分析与处理(课后作业)第一章 误差原理与概率分布1、某催化剂车间用一台包装机包装硅铝小球催化剂,额定标准为每包净重25公斤,设根据长期积累的统计资料,知道包装机称得的包重服从正态分布,又其标准差为σ=0.75公斤,某次开工后,为检验包装机的工作是否正常,随机抽取9包催化剂复核其净重分别为:试问包装机目前的工作状况如何? 解:先做原假设 假设H 0:μ=μ0构造统计量:Z =nx /σμ--~N(0,1)-x =∑x i /n=25.45σ=0.75μ=μ0=25 得:Z =1.8查表得:Φ ( 1.8 ) = 0.9641给出适当的α ,取α=0.05,1- α = 0.95 < 0.9641 落在大概率解范围内接受H 0则 μ=μ0 ,即包装机目前工作正常。
气总平均值的0.95置信区间。
解:因为P =1-α=0.95 所以α=1-0.95=0.05σ不知,所以只能用t 分布 即用S 代替σ S 2=1)(--∑-n x x i =0.048515789 S=0.220263-x =3.21令T =nS x /μ--~t(n-1,2α)则有:P(-At <T <At)=1-α=1-0.05n-1=20-1=192α=0.025 查表得:At (19,0.025)=2.0930估计区间为:P(-x -At(n-1, 2α)*n S <μ<-x +At(n-1, 2α)*nS =0.95所以:3.21-2.0930*200.220263<μ<3.21+2.0930*200.220263即:3.21-0.100425<μ<3.21+0.100425所以:3.109575<μ<3.3104253、某厂化验室用A,B 两种方法测定该厂冷却水中的含氯量(ppm ),每天取样一次,下面是试问:这两种方法测量的结果有无显著的差异?一般可取显著水平α=0.01. 解:因为是用两种方法来测同一个溶液,故把所测氯含量为母体。
数据分析面试题及答案数据分析面试题及答案1.问题描述在大规模数据处理中,常遇到的一类问题是,在海量数据中找出出现频率最高的前K个数,或者从海量数据中找出最大的前K个数,这类问题通常称为“top K”问题,如:在搜索引擎中,统计搜索最热门的10个查询词;在歌曲库中统计下载率最高的前10首歌等等。
2.当前解决方案针对top k类问题,通常比较好的方案是【分治+trie树/hash+小顶堆】,即先将数据集按照hash方法分解成多个小数据集,然后使用trie树或者hash统计每个小数据集中的query词频,之后用小顶堆求出每个数据集中出频率最高的前K 个数,最后在所有top K中求出最终的top K。
实际上,最优的解决方案应该是最符合实际设计需求的方案,在实际应用中,可能有足够大的内存,那么直接将数据扔到内存中一次性处理即可,也可能机器有多个核,这样可以采用多线程处理整个数据集。
本文针对不同的应用场景,介绍了适合相应应用场景的解决方案。
3.解决方案3.1 单机+单核+足够大内存设每个查询词平均占8Byte,则10亿个查询词所需的内存大约是10^9*8=8G 内存。
如果你有这么大的内存,直接在内存中对查询词进行排序,顺序遍历找出10个出现频率最大的10个即可。
这种方法简单快速,更加实用。
当然,也可以先用HashMap求出每个词出现的频率,然后求出出现频率最大的10个词。
3.2 单机+多核+足够大内存这时可以直接在内存中实用hash方法将数据划分成n个partition,每个partition交给一个线程处理,线程的处理逻辑是同3.1节类似,最后一个线程将结果归并。
该方法存在一个瓶颈会明显影响效率,即数据倾斜,每个线程的处理速度可能不同,快的线程需要等待慢的线程,最终的处理速度取决于慢的线程。
解决方法是,将数据划分成c*n个partition(c>1),每个线程处理完当前partition后主动取下一个partition继续处理,直到所有数据处理完毕,最后由一个线程进行归并。
1117.00、 习题1.3統計資料(1) .由表可知,全国居民的均值、方差、标准差、偏度、峰度分别为 1031680.286、1015.717、1.025、-0.457。
cv -100* S(%)变异系数有公式 x 计算得90.9325。
(2) 中位数为727.50,上四分位数304.35,下四分位数为1893.50 四分位极差由公式R1 =Q ^Q1得到1579.15A 1 ± 1 ± 1M = —Q 1 +—M +—Q 3三均值由公式 4 2 4得到913.1857。
(3) 直方图(4) 茎叶图全国居民Stem-and-Leaf Plot Freque ncy Stem & Leaf9.00 0 . 1222233445.00 0 . 567882.00 1 . 031.00 1 . 71.00 2 . 33.00 2 . 6891.00 3 . 1Stem width: 1000Each leaf: 1 case(s)4000-3000-1X0-o-(5)由箱图可以看出并不异常点統計資料(1).由图可知农村居民的平均数、方差、标准差、偏度、峰度分别为747.86、399673.838、632.198、1.013、-0.451。
由公式可以算得变异系数为84.5342。
(2)中位数530.50 ,上四分位数239.75 ,下四分位数1197.00。
由公式可得四分位极差为957.25,三均值为624.4375。
(3)茎叶图农村居民Stem-and-Leaf PlotFreque ncy Stem & Leaf10.00 0 . 11112223346.00 0 . 5556782.00 1 . 144.00 1 . 7889Stem width: 1000 Each leaf: 1 case(s)2000-1500- socrQ-农村展民箱图表明了并无异常点統計資料(1) 由表可知城镇居民均值、方差、标准差、偏度、峰度为2336.41、4536136.444、2129.821、0.970、-0.573。
数据分析(第二版)答案第一章数据分析基础什么是数据分析?数据分析是一种通过收集、整理、分析和解释数据来获得有意义信息的过程。
它可以帮助我们了解数据中的模式、趋势和关联,并从中获得洞察力以支持决策和解决问题。
数据分析的步骤和流程数据分析一般可以分为以下步骤和流程:1. 确定分析目标:明确想要从数据中获得什么样的信息或解决什么样的问题。
2. 收集数据:获取和收集相应的数据来源,并将其存储在可访问的位置。
3. 整理数据:对数据进行清洗、去重、格式转换等操作,以确保数据的质量和一致性。
4. 探索数据:使用统计学和可视化工具探索数据的分布、关联和异常情况。
5. 分析数据:应用适当的分析技术来发现模式、趋势或其他有意义的信息。
6. 解释结果:将分析的结果转化为可理解的语言,并解释其意义和推论。
7. 做出决策:基于数据分析的结论和洞察,做出相应的决策和行动计划。
常见的数据分析工具数据分析过程中常用的工具有:- 数据处理和清洗:Excel、Python、R等。
- 数据可视化:Tableau、Power BI、Matplotlib、ggplot等。
- 统计分析:SPSS、SAS、Python等。
- 机器学习:Python、R、TensorFlow等。
数据分析的应用领域数据分析在各行各业有着广泛的应用,包括但不限于: -市场营销:通过数据分析来了解客户需求、市场趋势和竞争对手情况,从而制定更有效的市场策略和推广活动。
- 金融服务:利用数据分析预测市场波动、风险评估和投资决策。
- 健康医疗:通过分析患者数据和大量医疗记录,提供更精确的诊断和治疗方案。
- 社交媒体:通过用户行为、兴趣和社交网络分析,提供个性化内容和推荐系统。
- 网络安全:通过分析网络流量和异常行为来检测和防范网络攻击和欺诈行为。
第二章数据收集和整理数据收集方法常见的数据收集方法包括: - 原始数据收集:通过问卷调查、观察、实验等方式直接收集数据。
一、填写题(抄题,写答案)1.数据分析“六步曲”按顺序依次是:明确分析目的和内容、数据收集、数据处理、数据分析、数据展现、报告撰写。
2.定量数据一般可分为计量的、计数的、二种类型。
定性数据一般可分为有序的、名义的、二种类型。
3.数据收集方法总的可分为一手数据、二手数据、两大类。
前一类方法常用的具体方法有调查法、观察法、实验法;后一类方法常用的具体方法有机构查询、书刊查询、网络查询。
4.SPSS中有三种主要的工作窗口,它们是:数据编辑窗口、结果浏览窗口、程序编辑窗口;在进行数据表编辑时,有二种主要视图,它们是:数据视图、变量视图。
5.SPSS中对变量属性进行定义时,对变量的命名在Name 栏中设置,定义变量值标签在Values 栏中设置。
6.根据数据的计量性质,可以将数据分为定量的数据和定性的数据;根据数据获得的直接性,可以将数据分为一手数据和二手数据。
7.统计检验的一种思路是:设定原假设H0,构造相应的统计判断量,当根据实验数据或样本数据计算出的统计判断量落在拒绝区域,则拒绝原假设;反之,则落在接受区域,接受原假设。
在SPSS软件的统计操作中,通过计算样本数据的实际显著性概率Sig.,并将其与给定的显著性概率水平α比较,当Sig. < α时(填“>” 或“<” ),则拒绝原假设。
8.方差分析主要用来判断样本数据之间的差异是由不可控的随机因素造成的还是由研究中施加的对结果形成影响的可控因素造成的。
9.因子分析法是多元统计分析中处理降维的一种,其最主要的工作是降维,即将具有错综复杂关系的变量或者样品综合为数量较少的几个因子,以再现原始变量与因子之间的相互关系。
10.下图所示因子分析结果中,数值6.845的含义是第一主成分特征根,数值84.421的含义是前三个主成分的累计贡献率;在Extraction Sums块中,有三行数据,其含义是根据提取因子条件----特征值大于1,共选出了三个公共因子。
数据分析与处理答案 Prepared on 24 November 2020
一、简答题(5×2分, 共10分)
1、请解释质量控制图中三条主要控制线的意义:CL 、UCL 、LCL 未学,不考
2、请解释正交设计表“L 934” 这个符号所指代的意义。
如果要做6因素4水平实验,应该选择以下哪一个正交表(不考虑交互作用):L 1645,L 3249
L: 正交; 9:9行或9次实验; 3:3个水平 ; 4:4列或4个因素 选L 3249
二、计算题(90分)
1、某分析人员分别进行4次平行测定,得铅含量分别是、、、、,试分别用3s 法、Dixon
法和Grubbs 检验法判断是否为离群值。
(,4=, ,5=)(12分)
x =, s=,
3s 法:∣ 应保留 Dixon :70.6360.08
0.89671.8560.08
Q -=
=-> ,5=, 应舍去
Grubbs: G 计= 60.0868.455/5.61-=> ,4,应舍去·
··
2、4次测定结果为:%、%、%、%,根据这些数据估计此样品中铬的含量范围(P=95%)(8分)
( 2.353%903,10.0=⇒=t P , 3.182%9530.05=⇒=,t P , 5.841%9930.01=⇒=,t P )
x =%, s=%
3、用一种新方法测定标准试样中的氧化铁含量(%),得到以下8个数
据:、、、、、、、。
标准偏差为%,标准值为%问这种新方法是否可靠(P=95%,,7=)(10分)
x
=
34.3034.33 1.770.048
t -==< ,7,所以新方法可靠
4、某小组做加标回收试验考查方法的准确性,测得加标前1000mL 样品浓度为L ,加入浓度为1000mg/L 的标准样品后,测得样品总浓度为L ,求回收率是多少。
(8分) 没讲,不考
5、两分析人员测定某试样中铁的含量,得到如下结果:
已知A 的标准偏差s 1=,B 的标准偏差s 2=,请比较两个人测定结果的精密度和准确的有无显着性差异。
(12分) F (,4,4)=, t (,8)=
F==< F (,4,4),故精密度无显着性差异 t=< t (,8),故准确度无显着性差异
5. 拟考察茶多酚浓度、浸泡时间、维生素C 等3个因素对米粉保鲜效果的影响,实验因素水平表如下表。
请完成下列正交表格,并指出各因素的主次顺序,求出最优水平组合,并做方差分析,填方差分析表,并对实验结果做出讨论(可结合因素指标变化图)。
(25分)
因素主次顺序:B>A>C
优水平:A1B3C1
(要求在以下空白处写下方差分析完整计算过程)
6.利用方差分析法,判断某生物处理中污泥负荷对出水水质的影响。
请完成以下方差分析表。
(要求在以下空白处写下方差分析完整计算过程) 附:公式列表
1、对于有限次测量,总体均值μ的置信区间为(x x t -+)
2、Q 检验法:Q 计=(x n -x n-1)/(x n -x 1)或者(x 2-x 1)/(x n -
x 1) 3、Grubbs 检验法:G=(x 异常-x )/s
4、F 检验:F=2
2
12/s s (s 1>s 2)
5、t 检验:
1) 平均值与标准值比较:t =
2) 独立样本t 检验:12t x x =-6、单因素方差分析: S T =S A +S E
f A =b-1; f E =b(a-1); f T =ab-1;
A A A S S f =
; E E E S S f =; A E
S
F S = 7. 正交试验设计方差分析
2
1)(1∑==n z z y n P ,∑==b j ij i K a Q 121,∑==n
z z y W 1
2
S i =Q i -P, S E =S 0, i i i f S S =
; E Ei E f S S = ; E
i i S S
F =; 其中,n ——实验总次数,即正交表中排列的总实验次数;b ——某因素下水平数;a ——某因素下同水平的实验次数;——空列项偏差平方和,y z ——指标,Kij ——水平效应值。