本帖最后由 木兮 于 2023-9-2 14:55 编辑
@缭绕
"The Mann–Whitney U test was performed for comparisons of two groups, and the
Kruskal–Wallis test was performed for comparisons of three or more groups. When a
significant difference was detected using the Kruskal–Wallis test, post hoc tests were
performed using the Mann–Whitney U test with Bonferroni correction. P-values < 0.05 were
considered statistically significant. Statistical analyses were performed using IBM SPSS
Statistics for Windows, version 25.0 (IBM Corp., Armonk, NY, USA)."
以上为原文中对统计学方法的描述,两组间比较采用Mann–Whitney U检验看是否具有统计学差异,Kruskal–Wallis test 检验用于比较多组间是否有统计学差异。如果具有差异,对结果进行矫正,观察矫正结果对组与组进行比较(When a significant difference was detected using the Kruskal–Wallis test, post hoc tests were performed using the Mann–Whitney U test with Bonferroni correction. )。
前提:
1、在选择统计学方法前,要先明确比较的数据所属变量类型,变量类型会影响统计学方法的选择
图片一为文章中统计的数据,比较的基本数据为接触患者前手总菌落数、接触患者后手总菌落数,为数值变量(例如人血红蛋白含量、身高、牙齿数等都为数值变量),且为单因素的分析(仅比较两个组或两个组以上的手总菌落数不同),两个组的比较可采用t检验、Mann–Whitney U检验等方法,三个及以上组的比较可采用方差分析、Kruskal–Wallis test 检验。
2、在各组进行比较的时候我们需考虑到数据的分布类型,根据数据的分布类型进行统计学方法的细分(例如两个组的比较可采用t检验、Mann–Whitney U检验,那到底用哪种?)
这里就要对原始的数据的分布进行了解,是符合某种分布吗,例如正态性分布(例如人群的身高分布就符合正态性分布)、二项分布、Poisson分布等。根据样本数据来自的总体分布是已知的,在此基础上进行估计或者检验,我们也称为参数统计,但实际的研究中,很多数据不符合参数统计的要求
,也就是数据不属于任何一种分布,这个时候就可以选择非参数检验的方法(非参数检验对样本来自的总体分布不作要求,例如不需要满足正态性分布等,例如Mann–Whitney U检验、Kruskal–Wallis test 检验、Friedman秩和检验均为非参数统计方法),但非参数统计有致命的缺点,就是检验功效低于参数统计方法。
了解以上前提以后,对该文献的数据进行统计学方法的选择
首先,该文献中有对两个组进行比较,例如图一中不戴手套和戴手套接触患者后手总菌落数的比较(P=0.028)
两个组的比较(单次检测手总菌落数比较)采用t检验需满足:样本数据符合正态分布、方差齐等条件两个条件。数据是否符合正态分布可以对数据进行正态性检验,若不符合正态性检验则不能采用t检验进行统计;方差是否齐也可以进行检验;若符合正态分布但方差不齐,仍可以采用t检验,但检验过程中需对自由度进行矫正。若不符合正态分布的数据,一般我们会采用非参数统计的方法。此外,如果数据符合正态分布,一般我们比较的是两组均数是否有差异;如果不符合正态分布,采用非参检验,我们一般只会描述中位数。
“After contact, gloved hands showed significantly higher median CFU counts tha bare hands
(9.00 CFUs vs. 3.50 CFUs, p = 0.028, Figure 3). The CFU counts of gloved hands
increased significantly after contact (p = 0.044 for single gloves and p = 0.001 for double
gloves), whereas those of bare hands did not (p = 0.293). The median number of CFUs after
patient contact was higher on single- and double-gloved hands than on bare hands (3.5 CFUs
for bare hands, 14.0 CFUs for single gloves, and 9.0 CFUs for double gloves), but there was
no statistically significant difference between three groups (p = 0.084).”
以上为文献中的结果,提到了“中位数”,说明手菌落数的分布应该是不符合正态分布的,否则应该描述“均数”,故两组间的比较,在文献中采用了Mann–Whitney U检验(不符合正态分布、两组比较),如“After contact, gloved hands showed significantly higher median CFU counts tha bare hands (9.00 CFUs vs. 3.50 CFUs, p = 0.028, Figure 3).”不戴手套和戴手套接触患者后手总菌落数的比较。
文献对不戴手套接触患者前、接触患者后比较;戴手套接触患者前、接触患者后比较;接触患者前不戴手套、接触患者前戴手套比较;接触患者后不戴手套和戴手套手比较等应该均采用了Mann–Whitney U检验。
“The median number of CFUs after patient contact was higher on single- and double-gloved hands than on bare hands (3.5 CFUs for bare hands, 14.0 CFUs for single gloves, and 9.0 CFUs for double gloves), but there was no statistically significant difference between three groups (p = 0.084).”以上描述的是患者接触后单手套、双手套的CFU中位数高于不戴手套,但三组之间无统计学意义差异 ([color=rgba(0, 0, 0, 0.9)]p = 0.084),比较的是三个组,不符合两个组的要求,采用的就不是Mann–Whitney U检验。
当比较的组数大于两个组时,就不能采用t检验、Mann–Whitney U检验等方法,因为这会大大增加一型错误的概率。大于两个组可以采用方差分析、Kruskal–Wallis test 检验,但同样要根据数据的分布情况进行细分。
方差分析要求统计的数据来自正态分布的总体、且等方差(在实际应用过程中,对正态性要求不是很严格,但对等方差要求严格);Kruskal–Wallis test 检验对数据的总体分布不作要求。
该文献中三组的比较采用的是Kruskal–Wallis test 检验,描述的是“中位数”是否有显著差异,因为数据不符合正态分布,方差可能也不齐,所以没有采用方差分析,而是Kruskal–Wallis test 检验(非参数检验)。
但需要注意的是,三组及三组以上的比较,得到的结果具有统计学意义,只能说明各组中存在差异,例如A|B|C三组比较,有统计学意义只能说明至少有两组是有差异的,如果要了解各组两两之间是否有差异,还需要再进行比较。在该文献中“When a significant difference was detected using the Kruskal–Wallis test, post hoc tests were performed using the Mann–Whitney U test with Bonferroni correction. ” 三组的比较Kruskal–Wallis test如果显著,采用Bonferroni 矫正的Mann–Whitney U test 对组与组之间分别比较。
同理,图片2中对接触前后手指、手腕、手掌等的比较方法也需要从上述几点进行考虑。
图片一
图片2
|