快好知 kuaihz订阅观点

 

SPSS 统计分析策略(4): 多样本方差分析

1. 每周一讲,全方位的SPSS 教程粉墨登场

2. SPSS教程学习准备:“研究设计”视频

3. 正态性检验(SPSS详版、SPSS简版、R语言版)

4. 两样本t检验(SPSS详版、SPSS简版、R语言版)

5. 两样本秩和检验(SPSS详版、SPSS简版、R语言版)

第2讲 实验性研究定量数据统计策略(4):

多样本方差分析检验

t检验主要用于两组定量正态分布的数据比较,但是如果需要比较多组定量数据,t检验分析方法很可能不合适,此时,必须要借助另外一种方法,方差分析,英文缩写ANOVA(ANlysis Of VAriance)。

实例分析

在评价某临床新药耐受性及安全性的2a期临床试验中,对符合纳入标准的30名健康自愿者随机分为3组,每组10名。各组注射剂量分别为0.5U、1U、2U,观察48小时部分凝血活酶时间(s),试问不同剂量的部分凝血活酶时间有无不同?数据库见time48.sav1:思考

这个案例来源于上一讲,需要思考:

-这个案例由几个变量组成?

-研究的结局变量是什么?

-结局变量属于什么类型的变量?

-如果是定量变量数据,是偏态还是正态分布?

-研究目的是比较,那比较的组数是多少?2:案情分析

这个案例包括2个变量,一个是活酶时间(s),另外一个是分组变量。主要研究的结局指标是活酶时间,为定量变量数据;比较的组数是3组(0.5单位/1单位/2单位)。本案例目的是比较多组总体有无统计学差异。3:统计分析策略

多组定量数据的比较,基本的方法有2种。一种是成组F检验,一种是多样本的非参数秩和检验(Kruskal Wallis 秩和检验)。

究竟采用哪种方法,必须考虑“三个性”的条件:正态性、独立性、方差齐性。关于“三个性”的解释,可以看之前的文章,此处不再赘述:SPSS 统计分析策略(2): 两样本t检验

总的来说,方差分析针对两组或以上、定量、正态、独立、方差齐的数据比较。前面2个要求和多样本的非参数秩和检相同,差别在于F检验要求数据符合正态性、独立性、方差齐性三个要求。此外,如果细心的朋友可能会注意到,这里方差分析的条件是2组或以上,也就是方差分析不仅处理多样本,也同样可以处理2样本,关于这一点,我最后进行解释。

总结来说,对于本例:

本例采用随机化分组设计,独立性符合。

正态性方面,采用的是多样本正态性检验方法,探讨各组是否均来自于正态分布总体。经SW检验,0.5个单位P=0.531,1个单位P=0.250,2个单位P=0.605,没有统计学意义,三组数据正态性均符合。 

方差齐性检验,在SPSS 操作F检验时同时进行。

SPSS 操作1:F检验SPSS操作界面:

分析—比较均值—单因素ANOVA检验2:F检验具体参数设置

检验变量”放入活酶时间(time),“分组变量”放入分组(group),同时进行“定义组”。

检验变量:即放入结局指标,本例为凝血活酶时间(time)

② 分组变量:放入group,无须如同t检验“定义组”

③ 选项:此处内容较为丰富,见下图:

① 描述:描述不同组的结局的均数、标准差、95%CI置信区间

方差齐性检验方差分析“三个性”条件之一

③ 韦尔奇:这是一种F检验替代,用于方差不齐时进行使用。

④平均值:大致比较多组之间的均数,意义不大。3:F检验分析结果及解释

根据上述SPSS操作,F检验统计分析以下结果:第一,统计描述,给出均数、标准差、95%CI置信区间

第二,方差齐性检验。可选择第一行结果,结果显示方差齐性检验P=0.186,方差差不多一致。可采用F检验

第三,F检验结果,结果显示F=0.63,P值=0.005,说明多组总体均数存在着统计学差异。

①F值,为本表中两个均方值的比值(45.6/6.98=9)

②显著性,即P值

第四,韦尔奇检验,这是F检验的在方差不齐时的替代,Welch 检验,P值=0.002,意味着多组存在着统计学差异。

结果及表格的规范表达

根据上表,我们可以得到以下的规范的结论:

规范文字:0.5个单位剂量组平均凝血活酶时间为(36.6±2.3)s,1个单位剂量组平均凝血活酶时间为(37.8±2.2)s,2个单位剂量组平均凝血活酶时间为(35.1±3.3)s,三组时间总体均数存在着统计差异(F=6.5,P=0.005)。

规范的统计表(其中一种形式)为:

F检验在统计分析中的实际应用

1.F检验结论取决于研究设计F检验是最基本的假设检验方法,在随机、对照、平行的实验性研究中,F检验的结论十分可靠,完全证明一个干预措施是否真正产生效果,或者干预措施和定量结局是否存在着因果关系。

但是F检验如果用在观察性研究,比如比较男性、女性的体重有无差别,其结论不能说性别是体重的影响因素,只能说男性和女性体重存在着统计学差异,仅此而已。关于观察性研究F检验,后期再进行分析。

因此,同t检验一样,F检验结果到底能够说明什么问题,取决于研究设计。

3. 两样本比较,也可以用F检验

很多时候,如果进行多次方差分析,多个方差分析结果需要呈现在同一表中,有些分组变量为二分类,有些是多分类,此时,需要同时包括t检验和F检验吗?其实不用,两样本比较,也可以用F检验,而且两样本t检验和两样本F检验的结果是一致的。比如以下案例:

将出生28天的20只大白鼠随机分成两组,分别饲以高蛋白和低蛋白饲料,8周后观察其体重(g)。问两种不同饲料对大白鼠的体重影响有无差别?

高蛋白组:133,145,112,138,99,157,126,121,139,106,115

低蛋白组:118,75,106,87,94,110,102,124,130

t检验的结果

F检验的结果

可以看出,两个结果P=0.016,没有任何差别。所以,两组比较别就盯着两样本t检验了!

2.F检验“三个性”同t检验,是原则,不是铁标准关于“正态性、独立性和方差齐性”,与t检验一样,差不多即可,不用严格执行。总体上,独立性一般成组设计即可,无论是随机化设计还是自然成组,方差不齐,亦可以采用校正F检验(wetch检验),关键的主要是在于t检验。当F检验遇见正态性问题

是否采用F检验,要看其指标理论上是何分布,直方图形态是否大致中间多或者两边少,观其是否极端异常值;正态性检验是辅助的作用。以下分析习惯,与t检验套路相同,仅供参考:

如果指标理论上属于偏态分布,则放弃F检验

如果该指标理论上属于正态分布,无论大小样本,该只要直方图大致中间多或者两边少,无特别异常值,均可采用F检验

如果指标理论分布不明确,但样本量较大(>100),该只要直方图大致中间多或者两边少,无特别异常值,均可采用F检验,无需考虑正态性检验结果。

如果指标理论分布不明确,但样本量不大(<100),若两组数据正态性检验p值均>0.01,可以考虑采用F检验,若至少一组<0.01,建议放弃F检验

无论大小样本,如果直方图呈一边倒趋势,或者存在若干个极端异常值,放弃F检验

最后,多组数据比较,任何一组P<0.05,均可以放弃F检验而选择秩和检验(但我也很少这么做)

SPSS 课程视频和操作录屏

SPSS课程视频

带字幕去水印的视频可复制以下地址浏览器打开

https://evod.zcmu.edu.cn/resource.html?stationID=1&resourceid=415&isprivate=false&cateid=102SPSS课程录屏

-本讲结束-,敬请阅读同期R语言教程推文-

meta分析R语言

真实世界研究统计技巧

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:本方  本方词条  统计分析  统计分析词条  多样  多样词条  策略  策略词条  分析  分析词条