SAS随机分组方法及实现
- 格式:docx
- 大小:54.98 KB
- 文档页数:20
随机分组方法包括:
∙简单随机化(simple randomization)
∙区组随机化(block randomization)
∙分段(或分层)随机化(stratified randomization)
∙分层区组随机化(stratified block randomization)
∙动态随机化(dynamic randomization)
一、简单随机化,又称完全随机化
1、定义:在事先或者实施过程中不作任何限制和干预或调整,对研究对象直接进行随机分组。
通常,通过掷硬币、随机数字表、计算机产生随机数来进行随机化。
2、适用条件:在研究例数较少、总体中个体差异较小时,采用此法。
3、缺点:在研究对象例数较少时,由于随机误差难以保证组间病例数的均衡,各组例数可能会出现不平衡现象。
4、解决办法:随机数表法、随机数余数分组法。
随机数余数分组法的具体操作:
编号:研究对象(动物按体重大小、患者按预计样本量编号)从1 到N 编号;
获取随机数字:从随机数字表中任意一个数开始,沿同一方向顺序每个研究对象对应取一个随机数字;
求余数:随机数除以组数求余数。若整除,则取组数作为余数;
分组:按余数数值分组;
调整:假如某组待调整,该组共有n 例。从中抽取1 例,就取下一个随机数,随机数除以n。
除以n 的余数(若整除则余数为n )作为在该组中所抽研究对象的序号,调整到其他组。
例1-1:两组
对心脑病区观察20例(编号1~20)心血管病患者分为2组,一组以灯盏花注射液为治疗组,另一组给予瓜蒌薤白汤。
从随机数字表任一行开始(以第11行第1个数(57)计),按序查找,凡小于或等于20的数标记,查够10个数;
将与这10个数对应编号患者列为一组,余下患者为另一组。
第一组:9,10,4,6,15,20,11,12,3,7;第二组:1,2,5,8,13,14,16,17,18,19。
例1-2:多组(≥3组)
将15名血栓性血瘀证患者分为3组。
第一次分组后,甲组6例,乙组5例,丙组4例。由于各组例数不等,须将甲组调整1例到丙组。
因此,继续查随机数字表,下一个随机数字为58。由于58/6=9……4,甲组中第4个研究对象调整到丙组。
5、SAS实现
对20例病人随机分成两个等比例组,使每组为10例。
方法一:PROC PLAN SEED=n 过程。
PROC PLAN SEED=210000;
FACTORS n=20;
OUTPUT OUT=patient;
RUN;
DATA result;
SET patient;
number=_n_;
IF n<=10 THEN group='A';
ELSE group='B';
RUN;
PROC PRINT data=result NOOBS;
VAR number group;
RUN;
方法二:UNIFORM(n)函数。在完全随机化时,UNIFORM函数法结果的平衡性较差。
DATA patient;
DO number=1 to 20;
r=UNIFORM(210000);
OUTPUT;
END;
RUN;
PROC RANK data=patient OUT=rank;
RANKS r_rank;
VAR r;
RUN;
DATA result;
SET rank;
IF r_rank<=10 THEN group='A';
ELSE group='B';
RUN;
PROC PRINT data=result NOOBS;
VAR number group;
RUN;
二、区组随机化,又称均衡随机化、限制性随机化
1、定义:将随机加以约束,使各处理组的分配更加平衡,满足研究要求。在一个区间内包含一个预定的处理分组数目和比例。
区组:由若干特征相似的试验对象组成。如同一窝的动物、批号相同的试剂、体重相近的受试者等。
区组的长度:区组中对象的数目。
2、优点:区组随机化分组,避免简单随机化分组可能产生的不平衡现象,不仅提高统计学效率,而且保证分配率不存在时间趋势。
3、适用条件:区组的长度不宜太小,太小则形成不随机。一般区组的长度至少要求为组数的2倍以上。
区组的长度也不宜太大,太大易使分段内不均衡,
如果只有两个组别(试验组和对照组),区组的长度一般可取 4~8,如果有4个组别则区组的长度至少为8。
区组长度还与试验的疗程长短有关:
对于疗程较短的疾病,患者入组快,结束快,区组长短影响不大,而对于疗程比较长的疾病,区间长度不宜过大。
例2-1 区组随机化分组(两组)
以入院时间(月份)作为配伍因素,将入院时间同月相邻的4位患者作为一个区组,试对24名患者分配到A和B两组处理。
确定区组长度和两个组的所有可能排列:设区组长度为4,则A和B两组所有可能的排列为6。
给每种可能排列的区组分配抽样号码:每个区组4名患者的分配方案,如下图所示。
用抽签方法随机排列上述区组分配的号码:查随机数字表任意选择起始数,28、26、08、73、37、32,
按照从小到大排序得出上述区组分配的号码为:3、2、1、6、5、4。
将观察单位按事先编好的病例号从1号开始按顺序进入上述抽签后得到的区组号码顺序的各区组。