生物统计学考试重点

  • 格式:doc
  • 大小:36.50 KB
  • 文档页数:3

下载文档原格式

  / 6
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

名词解释:

1、总体:又叫“统计总体”,是指一个统计问题研究对象的全体,它是具有某种共同特征的元素的集合。

2、参数:是描述总体特征的数,如反映数据的集中趋势的总体平均数,反映数据的变异程度的总体方差,反映不同总体的相关关系的相关系数等,常用希腊字母来表示,μ:总体平均数,σ²:总体方差,ρ:总体相关系数。

3、统计量:是描述样本特征的量,如样本平均数,样本方差,样本相关系数等,常用英文字母来表示。X:样本平均数,S²:样本方差,r:样本相关系数。

4、准确性:是指观测值或估计值与真值的接近程度。

5、精确性:是对同一物体的重复观察值或估计值彼此之间的接近程度。

6、连续性资料:是指在一定范围内可取任何实数值的数据资料,例如动物个体的体重,奶牛的产奶量,羊的产毛量等指标(变量)进行测定所得到的数据,他们通常是用度量衡等计量工具后得到的,因而也成为计量资料。

7、计数资料:是用计数的方式得到的数据资料,它们必须用整数来表示,如对猪的产仔数,鸡的产蛋数等指标(变量)的记录数据。

8、中位数:将资料内所有观察值,从小到大依次排列,位于中间的那个观察值称为中位数,用Md表示。

9、调和平均数:各观察值倒数的算术平均数的倒数,主要用于速度类和或数据中有个别极端大值的数据资料集中趋势的度量。

10、随机变量:(描述随机试验所有可能结果取值的变量)是在一定范围随机取值的变量,它的取值由于受到许多随机因素的影响。因而是不可预测的,但是这并不是说随机变量的取值是毫无规律的,其规律性就在于它取值的概率性,也就是说它的取值是服从某种概率分布的,因而我们也可以说随机变量是以一定的概率分布取值的变量。

11、概率函数:描述离散性随机变量取各个可能值的概率的函数。

12、概率分布函数:描述随机变量取值小于等于某值的概率的函数,也称为累计分布函数。

13、抽样分布:从一个总体中随机地抽取含量为几的样本,并由样本计算各种统计量,由于样本是随机抽取的,因而由样本数据计算的统计量也是随机变量,它们也有自己的概率分布,称之为抽样分布。

14、参数估计:(利用样本统计量对总体参数进行估计)由于总体往往非常庞大,甚至是无限的,不可能直接由总体的每个个体去计算参数,而只能通过样本去估计,这就是所谓参数估计问题。

15、点估计:以某个样本的计量作为该参考的一个估计值,这样的估计叫点估计。

16、区间估计:以一定的置信度对参数真值的可能取值范围进行估计。

17、I型错误:当原假设实际上是正确的,而依据某一样本作出拒绝原假设的判断,这就将正确的假设误以为是错误的,我们将这种“以假为真”的错误称为弃真错误,习惯叫它第1类错误或I型错误。

18、II型错误:原假设实际上是错误的,而依据某一样本做出了接受原假设的推断,也就是将错误的假设误以为是正确的,我们将这种“以假为真”的错误叫做纳伪错误,习惯叫做第2类错误或II型错误。

19、固定因子:如果一个因子的各个水平是我们有目的地挑选出来的,而我们的研究目的是要比较这些水平之间有误差异或估计这些水平的效应,我们就称之为固定因子,该因子各个水平的效应称问固定效应。

20、回归:研究由某些变量的变化去估计或预测另一些变量的变化,即将它们之间的关系看成是因果关系,并称之为回归关系。

21、试验单元:在试验中能接受不同处理的独立的试验载体。

22、试验因子:试验中根据试验目的要研究的影响试验指标的因素称为试验因子。

填空题:

1、统计学的3个基本特点:概率性二元性归纳性。

2、统计资料的特点:数字性大量性具体性。

3、统计资料可分为连续性资料和离散性资料两类,后者又可分为计数资料和分类资料。

4、统计表由标题、纵标目、横标目、表体、表注组成,通常分为简单表和复核表。

5、统计图:条形图——适用于分类资料和离散性数据资料的频数分布;

直方图——适用于连续性资料的频数分布;

饼图——适用于类别不多的分类资料的频数分布;

线形图——主要用于表示数据的动态变化趋势。

6、算术平均数性质:①离均差之和为零;②离均差平方和最小。

7、一组数据中的几何平均数、算术平均数、调和平均数的关系:H

8、正态分布是最重要的连续性随机变量的概率分布,曲线峰值位于x=μ处,μ决定曲线在x轴上的位置,σ决定曲线的形状,σ大时,曲线图形显得矮和宽,σ小时,曲线图形显得宽与窄。

9、当双尾概率为0.05时,分位数值μ=1.96;当双尾概率为0.01时,分位数值μ=2.58。

10、x2分布,F分布为非对称分布,t分布、正态分布为对称分布;x2自由度越大,分布越趋于对称;t分布自由度越小,离散程度越大。

11、配对资料的配对原则:配成对子的两个个体的初始条件应尽可能以致;配对方式:自身配对、亲缘配对、条件配对。

12、方差分析方法是由英国统计学家R 费歇于1918年提出的。

13、单向分类资料的平方和可剖分为组内平方和(误差平方和)和组间平方和(处理平方和);自由度也可剖分为组内自由度(误差自由度)和组间自由度(处理自由度)。

14、双向交叉分组无重复资料的平方和可剖分为A因子平方和、B因子平方和、误差平方和;自由度也可剖分为A因子自由度、B因子自由度、误差自由度。

15、离均差乘积和SPxy的绝对值越大,则正或负的线性相关关系越强,r=SPxy/√SSx*√SSy (-1≤r≤1)r<0,负相关r<0正相关r=-1完全负相关r=0零相关。

16、卡方适合性检验,是检验某一分类资料所在总体的分布是否符合某个假设的或理论的分布,卡方检验始终是右侧检验。

17、自由度一定,卡方值越大,概率越小。

18、x2分布的自由度大于1,当自由度等于1时,需进行连续性校正。

19、试验误差可分为系统误差和随机误差,系统误差可避免,随机误差只能降低,系统误差影响试验的准确性,随机误差影响试验的精确性。

20、试验设计三原则:随机化、重复、局部控制,此外,还要遵守的原则是平衡性。

21、常用动物试验设计方法:完全随机化设计、配对设计、随机区组设计、拉丁方设计、析因设计、正交试验设计。

22、完全随机设计的缺点为:没有应用局部控制的原则。

23、如果一个区组丢失一个数据,可对其进行估计,如果一个区组丢失数据太多,可直接把该区组去掉。

24、一个L9(34)正交表中L代表正交表,3代表每个因子有3个水平,4是正交表的对数,