SAS随机分组方法及实现

  • 格式:docx
  • 大小:54.98 KB
  • 文档页数:20

下载文档原格式

  / 20
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

随机分组方法包括:

∙简单随机化(simple randomization)

∙区组随机化(block randomization)

∙分段(或分层)随机化(stratified randomization)

∙分层区组随机化(stratified block randomization)

∙动态随机化(dynamic randomization)

一、简单随机化,又称完全随机化

1、定义:在事先或者实施过程中不作任何限制和干预或调整,对研究对象直接进行随机分组。

通常,通过掷硬币、随机数字表、计算机产生随机数来进行随机化。

2、适用条件:在研究例数较少、总体中个体差异较小时,采用此法。

3、缺点:在研究对象例数较少时,由于随机误差难以保证组间病例数的均衡,各组例数可能会出现不平衡现象。

4、解决办法:随机数表法、随机数余数分组法。

随机数余数分组法的具体操作:

编号:研究对象(动物按体重大小、患者按预计样本量编号)从1 到N 编号;

获取随机数字:从随机数字表中任意一个数开始,沿同一方向顺序每个研究对象对应取一个随机数字;

求余数:随机数除以组数求余数。若整除,则取组数作为余数;

分组:按余数数值分组;

调整:假如某组待调整,该组共有n 例。从中抽取1 例,就取下一个随机数,随机数除以n。

除以n 的余数(若整除则余数为n )作为在该组中所抽研究对象的序号,调整到其他组。

例1-1:两组

对心脑病区观察20例(编号1~20)心血管病患者分为2组,一组以灯盏花注射液为治疗组,另一组给予瓜蒌薤白汤。

从随机数字表任一行开始(以第11行第1个数(57)计),按序查找,凡小于或等于20的数标记,查够10个数;

将与这10个数对应编号患者列为一组,余下患者为另一组。

第一组:9,10,4,6,15,20,11,12,3,7;第二组:1,2,5,8,13,14,16,17,18,19。

例1-2:多组(≥3组)

将15名血栓性血瘀证患者分为3组。

第一次分组后,甲组6例,乙组5例,丙组4例。由于各组例数不等,须将甲组调整1例到丙组。

因此,继续查随机数字表,下一个随机数字为58。由于58/6=9……4,甲组中第4个研究对象调整到丙组。

5、SAS实现

对20例病人随机分成两个等比例组,使每组为10例。

方法一:PROC PLAN SEED=n 过程。

PROC PLAN SEED=210000;

FACTORS n=20;

OUTPUT OUT=patient;

RUN;

DATA result;

SET patient;

number=_n_;

IF n<=10 THEN group='A';

ELSE group='B';

RUN;

PROC PRINT data=result NOOBS;

VAR number group;

RUN;

方法二:UNIFORM(n)函数。在完全随机化时,UNIFORM函数法结果的平衡性较差。

DATA patient;

DO number=1 to 20;

r=UNIFORM(210000);

OUTPUT;

END;

RUN;

PROC RANK data=patient OUT=rank;

RANKS r_rank;

VAR r;

RUN;

DATA result;

SET rank;

IF r_rank<=10 THEN group='A';

ELSE group='B';

RUN;

PROC PRINT data=result NOOBS;

VAR number group;

RUN;

二、区组随机化,又称均衡随机化、限制性随机化

1、定义:将随机加以约束,使各处理组的分配更加平衡,满足研究要求。在一个区间内包含一个预定的处理分组数目和比例。

区组:由若干特征相似的试验对象组成。如同一窝的动物、批号相同的试剂、体重相近的受试者等。

区组的长度:区组中对象的数目。

2、优点:区组随机化分组,避免简单随机化分组可能产生的不平衡现象,不仅提高统计学效率,而且保证分配率不存在时间趋势。

3、适用条件:区组的长度不宜太小,太小则形成不随机。一般区组的长度至少要求为组数的2倍以上。

区组的长度也不宜太大,太大易使分段内不均衡,

如果只有两个组别(试验组和对照组),区组的长度一般可取 4~8,如果有4个组别则区组的长度至少为8。

区组长度还与试验的疗程长短有关:

对于疗程较短的疾病,患者入组快,结束快,区组长短影响不大,而对于疗程比较长的疾病,区间长度不宜过大。

例2-1 区组随机化分组(两组)

以入院时间(月份)作为配伍因素,将入院时间同月相邻的4位患者作为一个区组,试对24名患者分配到A和B两组处理。

确定区组长度和两个组的所有可能排列:设区组长度为4,则A和B两组所有可能的排列为6。

给每种可能排列的区组分配抽样号码:每个区组4名患者的分配方案,如下图所示。

用抽签方法随机排列上述区组分配的号码:查随机数字表任意选择起始数,28、26、08、73、37、32,

按照从小到大排序得出上述区组分配的号码为:3、2、1、6、5、4。

将观察单位按事先编好的病例号从1号开始按顺序进入上述抽签后得到的区组号码顺序的各区组。