SAS随机分组方法及实现

格式：docx
大小：54.98 KB
文档页数：20

下载文档原格式

/ 20

1、下载文档前请自行甄别文档内容的完整性，平台不提供额外的编辑、内容补充、找答案等附加服务。
2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
3、如文档侵犯您的权益，请联系客服反馈,我们会尽快为您处理(人工客服工作时间：9:00-18:30)。

随机分组方法包括:

∙简单随机化(simple randomization)

∙区组随机化(block randomization)

∙分段(或分层)随机化(stratified randomization)

∙分层区组随机化(stratified block randomization)

∙动态随机化(dynamic randomization)

一、简单随机化，又称完全随机化

1、定义：在事先或者实施过程中不作任何限制和干预或调整，对研究对象直接进行随机分组。

通常，通过掷硬币、随机数字表、计算机产生随机数来进行随机化。

2、适用条件：在研究例数较少、总体中个体差异较小时，采用此法。

3、缺点：在研究对象例数较少时，由于随机误差难以保证组间病例数的均衡，各组例数可能会出现不平衡现象。

4、解决办法：随机数表法、随机数余数分组法。

随机数余数分组法的具体操作：

编号：研究对象（动物按体重大小、患者按预计样本量编号）从1 到N 编号；

获取随机数字：从随机数字表中任意一个数开始，沿同一方向顺序每个研究对象对应取一个随机数字；

求余数：随机数除以组数求余数。若整除，则取组数作为余数；

分组：按余数数值分组；

调整：假如某组待调整，该组共有n 例。从中抽取1 例，就取下一个随机数，随机数除以n。

除以n 的余数(若整除则余数为n )作为在该组中所抽研究对象的序号，调整到其他组。

例1-1：两组

对心脑病区观察20例(编号1～20)心血管病患者分为2组，一组以灯盏花注射液为治疗组，另一组给予瓜蒌薤白汤。

从随机数字表任一行开始(以第11行第1个数(57)计)，按序查找，凡小于或等于20的数标记，查够10个数；

将与这10个数对应编号患者列为一组，余下患者为另一组。

第一组：9，10，4，6，15，20，11，12，3，7；第二组：1，2，5，8，13，14，16，17，18，19。

例1-2：多组(≥3组)

将15名血栓性血瘀证患者分为3组。

第一次分组后，甲组6例，乙组5例，丙组4例。由于各组例数不等，须将甲组调整1例到丙组。

因此，继续查随机数字表，下一个随机数字为58。由于58/6=9……4，甲组中第4个研究对象调整到丙组。

5、SAS实现

对20例病人随机分成两个等比例组，使每组为10例。

方法一：PROC PLAN SEED=n 过程。

PROC PLAN SEED=210000;

FACTORS n=20;

OUTPUT OUT=patient;

RUN;

DATA result;

SET patient;

number=_n_;

IF n<=10 THEN group='A';

ELSE group='B';

RUN;

PROC PRINT data=result NOOBS;

VAR number group;

RUN;

方法二：UNIFORM(n)函数。在完全随机化时，UNIFORM函数法结果的平衡性较差。

DATA patient;

DO number=1 to 20;

r=UNIFORM(210000);

OUTPUT;

END;

RUN;

PROC RANK data=patient OUT=rank;

RANKS r_rank;

VAR r;

RUN;

DATA result;

SET rank;

IF r_rank<=10 THEN group='A';

ELSE group='B';

RUN;

PROC PRINT data=result NOOBS;

VAR number group;

RUN;

二、区组随机化，又称均衡随机化、限制性随机化

1、定义：将随机加以约束，使各处理组的分配更加平衡，满足研究要求。在一个区间内包含一个预定的处理分组数目和比例。

区组：由若干特征相似的试验对象组成。如同一窝的动物、批号相同的试剂、体重相近的受试者等。

区组的长度：区组中对象的数目。

2、优点：区组随机化分组，避免简单随机化分组可能产生的不平衡现象，不仅提高统计学效率，而且保证分配率不存在时间趋势。

3、适用条件：区组的长度不宜太小，太小则形成不随机。一般区组的长度至少要求为组数的2倍以上。

区组的长度也不宜太大，太大易使分段内不均衡，

如果只有两个组别(试验组和对照组)，区组的长度一般可取 4~8，如果有4个组别则区组的长度至少为8。

区组长度还与试验的疗程长短有关：

对于疗程较短的疾病，患者入组快，结束快，区组长短影响不大，而对于疗程比较长的疾病，区间长度不宜过大。

例2-1 区组随机化分组（两组）

以入院时间(月份)作为配伍因素,将入院时间同月相邻的4位患者作为一个区组，试对24名患者分配到A和B两组处理。

确定区组长度和两个组的所有可能排列：设区组长度为4，则A和B两组所有可能的排列为6。

给每种可能排列的区组分配抽样号码：每个区组4名患者的分配方案，如下图所示。

用抽签方法随机排列上述区组分配的号码：查随机数字表任意选择起始数，28、26、08、73、37、32，

按照从小到大排序得出上述区组分配的号码为:3、2、1、6、5、4。

将观察单位按事先编好的病例号从1号开始按顺序进入上述抽签后得到的区组号码顺序的各区组。

SAS随机分组方法及实现

合集下载

相关主题

文档推荐

最新文档