DPS数据处理系统在生物统计分析中的应用_徐伟

  • 格式:pdf
  • 大小:1.15 MB
  • 文档页数:4

下载文档原格式

  / 4
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

因素。通过分析研究不同来源的变异对总变异的贡
图 1 异常值检测结果 从图 1 看出: C6 单元格的数值 0. 3942 是应该 剔除的异常值,应用相同的方法,可知: F5 单元格的 数值 0. 3152 也是应该剔除的异常值,其结果与文 献[6]中用 Excel 软件处理结果相同。 2. 2 方差分析及多重比较
DPS( Data Processing System) 数据处理系统,简 称 DPS。该系统是由浙江大学农业与生物技术学院 唐启义教授研发。该系统除了提供一些常用统计方 法,如 t 检验、单因素和多因素方差分析、回归分析、 相关分析等还提供了多种试验设计技术,如: 完全随 机分组、随机区组设计、拉丁方设计、正交设计等设 计技术,能完全满足科研、生产领域的专业人员处理 数据的需要[3]。同时系统采用多级下拉式菜单,用 户使用时整个屏幕犹如一张工作平台,绝大多数操 作仅靠点击鼠标即可完成,简便易行。 2 DPS 在生物统计分析中的应用 2. 1 异常值的检测
图 3 方差分析参数设置
图 5 回归分析数据编辑
图 4 方差分析及多重比较结果 计算结果显示包括: ( 1) 数据处理时当前日期; ( 2) 各 处 理 的 样 本 数、均 值、标 准 差、标 准 误 以 及 95% 的置信区间值。( 3) 方差分析表列出了处理间 和处理内的平方和、自由度、均方、F 值和显著水平。 由图 4 知,P < 0. 01,各处理之间差异极显著,需要 进一步进行多重比较。( 4) 输出各处理的均值差以 及新复极差多重比较的显著水平,同时将结果用目 前国内科技论文中常用的标记字母法表示出来,清 楚明白,为使用者提供了极大地方便。 从图 4 中可以看出,该试验除 1 与 3 处理无显 著差异外,4 与 2 及 1、3 处理间差异显著性达到 0. 05 水平。处理 2 与 1、4 与 2、1 与 3 无极显著差异; 4 与 1、3,2 与 3 呈差异极显著。该结果与文献[7]一 致。 2. 3 线性回归 在生物统计学试验中,常要研究多个变量之间 的相互关系,虽然他们之间没有严格的、确定性的函 数关系,但可以设法找出最能代表它们之间关系的 数学表达形式即多元回归方程。多元回归系数的计
摘 要: DPS 数据处理系统是一款具有统计分析和数学模型模拟分析功的实用软件。举例介绍 DPS 在 异常值检验、方差分析、多重比较以及回归分析等方面的具体操作。证实 DPS 数据处理系统可以准确、 快捷的应用于生物统计分析。 关键词: DPS 数据处理系统; 生物统计; 方差分析; 多重比较 中图分类号: S126 文献标志码: A 文章编号: 1008 - 3871( 2014) 04 - 0024 - 04
在科学实验中,由于外界条件的改变和主观因 素的影响,实验测量的数据中个别数据往往会产生 较大误差,即出现异常值。这些异常值的存在往往 会掩盖研 究 对 象 的 变 化 规 律,甚 至 得 出 错 误 的 结 论[4]。为了提高实验的数据的精确度,我们要将数 据中的异常值予以剔除。
对异常值的判断通常有三种标准: 3σ 准则准则 即拉依 达 准 则、格 拉 布 斯 ( Grubbs ) 准 则、狄 克 逊 ( Dixon) 准则。其中: 在测量次数较少时,最好不要 选用 3σ 准则[5]。用狄克逊准则判断样本数据中混 有一个以上异常值的情形效果较好。所以我们在此 选择使用格拉布斯准则。用有如下的判别准则: ︱ - ︱≥G( a,n) S 则数据粗差,应予剔除。否则,应 予保留。其中为该水平数据的算术平均数,s 为该 水平数据的便准偏差,公式: G( a,n) 是格拉布斯准 则的临界值,a 为显著水平,n 为该水平的重复次数。
图 7 回归分析结果 参考文献: [1]朱海涛,陈 黎,涂自良,等. DPS 数据处理系统在药学研究数据处理中的应用[J]. 医药导报,2006,25
( 4) : 363 - 365. [2]唐启义,冯明光. DPS 数据处理系统———实验设计、统计分析及模型优化[M]. 北京: 科学出版社,2006: 1. [3]唐启义. 通用统计软件 DPS 研制与应用[J]. 科学中国人,2004,( 9) : 56. [4]周中汉,王汉江,李 梅,等. 利用 DPS 剔除测量数据中的异常值[J]. 计量技术,2007,( 10) : 61 - 63. [5]沙定国. 实用误差理论与数据处理[M]. 北京: 北京理工大学出版社,1993: 56 - 57. [6]杜英秋. 对田间试验数据的统计处理方法———格拉布斯准则和应用 EXCEL 进行方差分析、多重比较
图 2 方差齐性检验结果 2. 2. 2 进行方差分析及多重比较。选中数据→单击 菜单栏中的“试验统计”→选择“完全随机试验”→ 选择“单因 素 试 验 统 计 分 析 ”→ 跳 出“方 差 分 析 参 数设置”对话框,见图 3 进行设置→单击“确定”,系 统将给出分析结果见图 4。
·26·
榆林学院学报
2014 年第 4 期( 总第 114 期)
算比较复杂,特别是当自变量达 3 个以上的回归分 析给计算带来很大的不便。用 DPS 数据处理软件 可以方便的进行回归系数计算和回归分析。如陆建 身[8]书中例题: 中籼南京 11 号高产田的每 1 / 15 hm2 穗数( ,单位: 104) 、每穗实粒数( ) 和每 1 / 15 hm2 稻谷产量( ,单位: 500 g) ,其结果如图 5。建立 每 1 / 15 hm2 穗数、每穗粒数对每 1 / 15 hm2 产量的 二元线性回归方程。
2014 年 7 月 第 24 卷 第 4 期
榆林学院学报 JOURNAL OF YULIN UNIVERSITY
July. 2014 Vol. 24 No. 4
DPS 数据处理系统在生物统计分析中的应用
徐 伟1 ,季索菲2
( 1. 安徽林业职业技术学院 园艺教研室,安徽 合肥 230031; 2. 安徽省农业科学院 水产所,安徽 合肥 230031)
这里检测结果采用的是 Bartlett 卡方检验。这 里计算得到卡方值 = 0. 69599,自由度 = 3,P = 0. 87415 > 0. 05,表示差异不显著即方差齐性。如果 p < 0. 05,侧表示方差鱼油显著异质性,这时不易用方 差分析法进行统计检验,可以考虑对数据进行适当
转换: 平方根转换、对数转换、正反弦转换,然后再进 行方差分析。
使用 DPS 数据处理软件将很方便的剔出异常 值。以 A、B、C、D、E、F6 个品种水稻植株镉的吸收 影响[6]为例见表 1。
首先,在 DPS 软件中录入数据,以行为水平,有 A、B、C、D、E、F6 行,1、2、3、4、5、6 列为重复。其次, 选中每一行的数据区域,将其定义为数据块。再单 击菜单栏中的“数据分析”→单击“异常值检测”→ 选择“格拉布斯( Grubbs) 法”→选择 P 值“0. 05 ” →单击“确定”按钮→输出“结果”见图 1。
收稿日期: 2013 - 12 - 30 基金项目: 安徽林业职业技术学院 2013 年度院级教学质量与教学改革工程项目( Lzy201308) 作者简介: 徐 伟( 1982—) ,男,江苏常州人,助教,硕士,研究方向为生物科学。Email: xwxwxw620@ 163. com 通讯作者: 季索菲( 1987 - ) ,女,江苏泰兴人,研究实习员,硕士,研究方向为动物遗传。Email: jisuofei@ 126. com
徐 伟,季索菲: DPS 数据处理系统在生物统计分析中的应用
·27·
3 结论与讨论 对生物试验数据进行整理、分析时需要大量的
数学公式 及 代 数 运 算,费 时 费 力 还 容 易 出 现 错 误。 Excel 电子表格程序进行数据处理虽然生动、直观, 但是没有提供对方差齐性检验以及多重比较的程 序,需要另外编写命令来完成[10]。SPASS、SAS 等数 据处理软件 虽 然 功 能 完 善,但 软 件 非 汉 化,使 用 不 便。DPS 数据处理软件无需使用者了解运算细节, 只需将试验数据输入电子表格,然后调用相应的分 析功能,系统将给出所有计算、分析结果。根据本文 的例子中使用的方法,我们可以很方便的完成数据 的异常值检验、方差分析、多重比较以及回归分析。 同时,DPS 数据处理软件还为生物研究工作者提供 了动植物种群数量抽样、动植物种群数量空间分布 研究、生物群落的消长演替过程分析等方面的内容, 使的数据处理工作简便易行,结果准确。
表 2 水稻不同药剂处理的苗高
药剂
苗高观察值 / cm
A
18
21
20
13
B
20
24
26
22
C
10
15
17
14
D
28
27
29
32
注: 表中数据来源于文献[7]。 2. 2. 1 方差齐性检验。因为方差分析的基本假定之 一就是误差同质性,所以在进行方差分析之前要判 断所有实验处理是否具有共同的误差方差。首先进 行样本方差齐性检验,选中数据→单击菜单栏中的 “试验统计”→单击“方差齐性检验”→系统默认“0 不转换”→ 单 击“OK ”,系 统 将 给 出 检 测 结 果 见 图 2。
图 6 线性回归操作界面 具体操作步骤: 按图 5 方式录入数据、定义数据 块→单击菜单栏“多元分析”→单击“回归分析”→ 单击“线性回归”,系统会给出如图 6 的操作界面。 从图中我们可以得到横坐标为 y 拟合值、纵坐标为 残差的残差你和分布图,以便于我们对残差进行分 析、诊断。同时,还知道了 X1,X2 的回归系数分别 是: 24. 8002 和 9. 3594,方差膨胀系数 < 10,所以诊 断不存在 多 重 共 线 性[9]。 当 诊 断 结 束,单 击“返 回 编辑”,系统将给出回归分析结果如图 7,从图中我 们可以得到回归方程: = - 351. 7457 + 24. 8002 + 9. 3594,决定系数 R2 = 0. 841570,回归方差极显著, 与文献[8]结果一致。
献大小,从而确定控制因素对研究结果影响是否显 著。当 F 检验结果显著时,表明可控因素对实验结 果影响显著,就需要进一步找出是何种控制对实验 影响显著,就需要对不同控制水平见进行两两单独 比较,以水 稻 不 同 药 剂 处 理 的 苗 高[7] 为 例,具 体 数 据如表 2 介绍使用 DPS 进行方差分析及多重比较。
0. 3561
0. 3701
0. 3893
注: 表中数据来源于文献[6]。
由于试验中各种因素的影响,研究所得的数据
呈现波动状,因此要比较两个或两个以上样本均数
差别是否显著,就要进行方差分析( F 检验) 。R. A.
Fister 认为: 造成波动的原因可分成两类,一是随机
因素,另一是研究中施加的对结果形成影响的控制
C
0. 3115
0. 2980
0. 3249
0. 3079
0. 2867
0. 3092
D
0. 2500
0. 2397
0. 2061
0. 2358
0. 3152
0. 2125
E
0. 3598
0. 3942
0. 3498
0. 3410
0. 3562
0. 3621
F
0. 3684
0. 3198
0. 3762
徐 伟,季索菲: DPS 数据处理系统在生物统计分析中的应用
·25·
表 1 不同植物镉的吸收量
品种
植株镉的吸收量( mg / kg)
A
0. 3132
0. 3222
0. 3598
0. 3392
0. 3294
源自文库
0. 3099
B
0. 3393
0. 3785
0. 2870
0. 3469
0. 3708
0. 2983
科学实验是生物类学科研究的重要方法之一, 通过科学实验的观察、测定和记载,可以得到大量数 据。只有通过对这些数据进行科学的整理和分析, 才能透过数据表现看到数据中的客观规律。所以, 数据整理和分析是试验工作的重要组成部分。目 前,常用 的 数 据 处 理 软 件 有: SAS、SPSS、Excel 等。 但他们都是外国编制的软件,有些分非汉化,使用不 便; 有些需要使用者编写复杂函数; 有些虽然有汉化 版,但 是 统 计 分 析 和 数 学 模 型 模 拟 分 析 功 能 不 全[1]。而 DPS = Excel + SPSS,她既有 Excel 那样方 便的在工作表里面处理基础统计分析的功能,又实 现了 SPSS 高级统计分析技术[2]。 1 DPS 简介