分享免费的编程资源和教程

网站首页 > 技术教程 正文

随机区组(配伍组)设计资料的方差分析的SPSS操作教程及结果解读

goqiw 2025-01-07 12:41:22 技术教程 17 ℃ 0 评论

作者/风仕

在上一期,我们主要讲了完全随机设计资料的方差分析的SPSS操作及结果解读,这期开始讲随机区组设计资料的方差分析的SPSS操作及结果解读,它是多因素方差分析最基本的方式,采用的是配对和随机分组相结合的方式,有效地推动了处理因素各水平的均衡可比性。现主要从随机区组设计资料的方差分析介绍、随机区组设计资料的方差分析使用条件及案例的SPSS操作演示这几方面进行讲解。

随机区组设计资料的方差分析方法介绍

随机区组设计(randomized block design)又称配伍组设计,它通常将受试对象按性质(如动物的性别、体重、病人的病情、性别、年龄等非实验因素)相同或相近组成b个区组,每个区组中的k个受试对象分别随机分配到k个处理组中去。区组选择的原则在于区组间差别越大越好,区组内差别越小越好。随机区组设计将受试对象分组后,进一步控制了个体差异,因此其检验效能高于完全随机设计的方差分析。

随机区组设计资料的总变异可以分解为处理组间变异、区组间变异和误差三部分。随机区组设计与完全随机设计,由于利用区组控制了可能的混杂因素,并在进行方差分析时,将区组间变异从原组内变异中分离出来,当区组间变异有统计学意义时,由于减少了误差均方使处理间的F值更容易出现显著性,从而提高了实验效率。随机区组设计实际是配对设计的扩展,当K=2时,随机区组设计的方差分析与配对设计的t检验完全等价,即t2=F。

随机区组设计中并没有考察其正态性与方差齐性,是因为无法考察。不管区组变量是否具有统计学意义,都应当保留在方程当中。作为区组变量,应当从设计上考虑与实验因素不存在交互作用,如果不能肯定是否存在交互作用,则应当釆用析因设计、正交设计等更加复杂的统计模型。

关键点:设计分两步,第一步先组成区组;第二步再随机处理组。

举个栗子:

按照一定条件将30只小白鼠分成10个区组,每个区组小白鼠的特征相近,然后,用随机的方法将每个区组内的3只小白鼠分别安排到饲料I、饲料ⅡI和饲料I组。

随机区组设计的方差分析:

SS总=SS组间+SS组内(SS组内=SS区组+SS误差)

相比于完全随机设计,随机区组设计的效率更高,样本量相同时,其处理组间均衡性好于完全随机设计。

在总变异分解中,组间变异的计算与完全随机设计相同,但它分解出了区组的变异,从而使随机误差的变异降低。此时,MS误差往往会减少,统计量F处理一般就会增大,这样就更容易得出多个总体均数差异有统计学意义的推断结果。

因此,随机区组设计方差分析检验效能要高于完全随机设计。

随机区组设计的方差分析属于无重复数据的双向方差分析,two-way ANOVA

分析步骤:

①建立检验假设,确定检验水准

对于处理组:

H0:处理组总体均数相等

H1:处理组总体平均水平不全相等

对于区组:

H0:区组总体均数相等

H1:区组总体均数不全相等

一般地,检验水准为α=0.05

②计算检验统计量

F处理组=MS组间/MS误差

F区组=MS区组/MS误差

③确定P值,做出统计推断

随机区组设计资料的方差分析使用条件

随机区组设计方差分析的适用条件依然是:独立、正态和方差齐。

1.观测指标满足独立性;

2.各组观测指标均来自正态分布总体;

3.各组观测指标方差相等。

在实际中由于方差分析具有稳健性,因此对正态性的条件要求不高,常不关注;随机区组设计,每一个单元只有一个数据,因此软件无法计算方差齐性检验。

随机区组设计中并没有考察其正态性与方差齐性,是因为无法考察。

不管区组变量是否具有统计学意义,都应当保留在方程当中。

作为区组变量,应当从设计上考虑与实验因素不存在交互作用,如果不能肯定是否存 在交互作用,则应当采用析因设计、正交设计等更加复杂的统计模型。是否具有统计学意义,都应当保留在方程当中。

案例的SPSS操作演示

分析示例

为探索丹参对肢体缺血再灌注损伤的影响,将30只纯种新西兰实验用大白兔,按窝别相同分为10个区组,每个区组的3只大白兔随机接受三种不同的处理,即在松止血带前分别给 予丹参2 ml/kg、丹参1 ml/kg、生理盐水2 ml/kg, 并分别测定松止血带前及松后1小时血中白蛋白含量(g/L), 算出白蛋白的减少量如表所示,问三种处理的效果是否不同?

研究假设

研究问题1:三组大白兔的白蛋白减少量是否相同?

研究问题2:如果总体有差别,那么是哪些组之间出现差别?

数据录入

1. 变量视图

名称b 标签 区组

名称 k 标签 处理

名称 x 标签 白蛋白减少量

2. 数据视图(部分)

操作流程

注意:单变量与多变量区别:① 因变量数=1,选择单变量。② 因变量数≥2,选择多变量。

在随机区组设计中,因为两个因素的不同水平作用下只有一个样本数据,所以无法分析其交互作用,故只能选择主效应。

1.因变量(D): 选入需要分析的因变量(dependent variable),因变量通常指我们所关心的 测量变量,如本例当中的白蛋白减少量x。

固定因子(F)和随机因子(A ):两者均指我们的处理因素和区组因素,也就是通常所说的自变量。固定因子(fixed factor)指该因子在样本中所有可能的水平都出现了,即该因子的所有可能水平均列出了,无需进行外推,如本例三种方案处理大白兔,有且只有三种方案,所以属 于固定因子。而随机因子(random factor)指该因子的所有可能的水平在样本中没有都出现, 需要进行外推,如本例中按窝别分为10个区组,我们认为窝别不止10种,因此属于随机因子。

2.下图为方差分析模型设定部分,又可以分为全模型(full model)和设定模型(specified model), 全模型包括所有自变量的主效应和交互作用,而设定模型则自由设定。在随机区组设计当中需要自己设定模型,模型当中只包括了主效应,即不考虑区组因素和处理因素的交互作用。

3.下图为两两比较的选项,我们只需要对处理因素之间是否存在差异感兴趣,因此在两两比较中选入k, 选用S-N-K法作为两两比较的统计方法。

4.下图表示我们需要获得各种处理的均数和标准差,因此选择描述统计(D)。

结果解释

1.下表给出了处理因素和区组因素的水平和例数,如处理组的水平为1(丹参2 ml/kg) 、 2(丹参1 ml/kg) 、3(生理盐水),各水平的例数均为10;而区组的水平从1到10,各水平的例数均为3。

2.下表给出了各种组合的均数和标准差,我们所关注的是处理因素各水平的均数和标准

差,其具体数值为丹参2 ml/kg(k=1)x±s=2.6±0.52,丹参1 ml/kg(k=2)x±s=3.0±0.40,生理盐水x±s=4.2±0.40。

3.下表为一个典型的方差分析结果表,处理因素(k)方差分析结果F=32.636,P<0.01,可认为三种不同的处理效果不同,即三个总体均数中至少有两个不同。至于三个总体均数中哪些不同,则需要用多个均数间的两两比较方法。区组因素(b) 中 F=0.824,P=0.602>0.05,即不能认为10个区组的总体均数不同。

4.下表对主体间效应的检验作进一步解释,但是对我们来说,意义并不太大。

5.又出现了令人头疼的SNK法两两比较结果,下表在纵向将各组均数按从小到大进行排 列,丹参2 ml/kg(k=1) 均数2.5800最小,居于顶端;而生理盐水组(k=3) 均数为4.1700最大,居于底端。而横向则被分成若干亚组,不同亚组间的P<0.05, 而同一亚组间的各组均数 P>0.05, 可见SNK法无法获知准确的P值,只能知道两组比较的P值是否>0.05。本例当中亚组1包括了丹参2 ml/kg(k=1)和丹参1 ml/kg(k=2),因此两组比较的P>0.05,而生理盐水组(k=3)位于亚组2,亚组1和亚组2之间的P>0.05,因此丹参2 ml/kg(k=1)和生理盐水组(k=3)比较P<0.05,丹参1 ml/kg组(k=2)和生理盐水组(k=3)比较P<0.05。

参考:《临床医学研究中的统计分析和图形表达实例详解》

欢迎关注我,让你身边多一位熟悉统计分析方法的帮手,有以下付费视频或服务可供选购:

1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。

2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。

3.购买视频课程赠送课程相关主题内容1对1答疑1年。

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表