马上注册登录,享用更多感控资源,助你轻松入门。
您需要 登录 才可以下载或查看,没有账号?注册
|
×
本帖最后由 木兮 于 2023-9-5 07:58 编辑
以下为原文中关于统计学方法和结果的描述: 统计学方法“The Mann–Whitney U test was performed for comparisons of two groups, and the Kruskal–Wallis test was performed for comparisons of three or more groups. When a significant difference was detected using the Kruskal–Wallis test, post hoc tests were performed using the Mann–Whitney U test with Bonferroni correction. P-values < 0.05 were considered statistically significant. Statistical analyses were performed using IBM SPSS Statistics for Windows, version 25.0 (IBM Corp., Armonk, NY, USA)." 统计学方法中描述到两组间比较采用Mann–Whitney U检验是否具有统计学差异;多组间(三组及以上)比较采用Kruskal–Wallis检验是否有统计学差异,如果多组统计学结果显示具有显著差异,组与组之间的比较采用Bnferroni矫正的Mann–Whitney U 检验进行比较。
部分结果的描述“After contact, gloved hands showed significantly higher median CFU counts tha bare hands (9.00 CFUs vs. 3.50 CFUs, p = 0.028, Figure 3). The CFU counts of gloved hands increased significantly after contact (p = 0.044 for single gloves and p = 0.001 for double gloves), whereas those of bare hands did not (p = 0.293). The median number of CFUs after patient contact was higher on single- and double-gloved hands than on bare hands (3.5 CFUs for bare hands, 14.0 CFUs for single gloves, and 9.0 CFUs for double gloves), but there was no statistically significant difference between three groups (p = 0.084).” 以上为文献中描述的结果,比较的变量是手菌落数,提到了“中位数”,描述了两组间比较的结果、三组之间比较的结果
在进行统计学方法的选择时我们需要明确以下前提
1、我们需要比较的是什么?2、比较数据所属变量类型?
3、比较数据来自的总体的分布情况?
3、几组数据进行比较?
4、统计的变量有几种?
在选择统计学方法前,要先明确比较的数据所属变量类型,变量类型会影响统计学方法的选择
图片一为文章中统计的数据,比较的数据为手总菌落数,手总的菌落数为数值变量(例如人血红蛋白含量、身高、牙齿数等都为数值变量)
为什么要清晰比较的数据来自的总体的分布情况?
我们得到的数据都是样本,所做的检验是基于样本去推测总体是否具有显著差异,总体的分布情况决定了我们选择的统计学方法是否是符合逻辑的、检验功效如何等,总体数据的分布有很多种,例如正态性分布(例如人群的身高分布就符合正态性分布,正态分布也是比较常用的数据)、二项分布、Poisson分布等。如果样本数据来自的总体分布是已知的,在此基础上进行估计或者检验,我们也称为参数统计;但实际的研究中,很多数据的分布不明确,无法判断其总体的分布情况,这不符合参数统计的要求,这个时候就可以选择非参数检验的方法。非参数检验对样本来自的总体分布不作要求(例如Mann–Whitney U检验、Kruskal–Wallis test 检验、Friedman秩和检验均为非参数统计方法),但非参数统计有致命的缺点,就是检验功效低于参数统计方法。在各组进行比较的时候我们需考虑到数据的分布类型,根据数据的分布类型进行统计学方法的细分
如何明确数据的分布情况?
有的可以直接通过经验判断,例如人群的身高符合正态分布,如果不明确,可以通过一些检验方法判断是否属于某种分布。
几组数据进行比较?
几组数据的比较同样也会影响统计学方法的选择,有的方法适用与2组,有的方法适用于3组及3组以上,例如两个组的比较可采用t检验、Mann–Whitney U检验等方法,三个及以上组的比较可采用方差分析、Kruskal–Wallis test 检验。
统计的变量有几种?
统计的变量类型同样也会影响统计学方法的选择,例如单因素的统计,只比较两组身高是否有差异;再例如是多因素的统计,比较吸烟、久坐对高甘油三酯的影响,且为单因素的分析(仅比较两个组或两个组以上的手总菌落数不同),两个组的比较可采用t检验、Mann–Whitney U检验等方法,三个及以上组的比较可采用方差分析、Kruskal–Wallis test 检验。
了解以上前提以后,对该文献的数据进行统计学方法的选择
首先,该文献中有对两个组进行比较,例如图一中不戴手套和戴手套接触患者后手总菌落数的比较(P=0.028),是单因素、两个组的比较,且手总菌落数似乎可能满足正态分布的要求。两个组的比较(手总菌落数比较)采用t检验需满足:样本数据符合正态分布、方差齐等条件两个条件。数据是否符合正态分布可以对数据进行正态性检验,若不符合正态性检验则不能采用t检验进行统计;方差是否齐也可以进行方差齐性检验;若符合正态分布但方差不齐,仍可以采用t检验,但检验过程中需对自由度进行矫正。若不符合正态分布的数据且明显不满足其它分布的数据,一般我们会采用非参数统计的方法。此外,如果数据符合正态分布,我们描述的是数据的均数;如果不符合正态分布,我们一般只会描述中位数。
“After contact, gloved hands showed significantly higher median CFU counts tha bare hands (9.00 CFUs vs. 3.50 CFUs, p = 0.028, Figure 3). The CFU counts of gloved hands increased significantly after contact (p = 0.044 for single gloves and p = 0.001 for double gloves), whereas those of bare hands did not (p = 0.293). The median number of CFUs after patient contact was higher on single- and double-gloved hands than on bare hands (3.5 CFUs for bare hands, 14.0 CFUs for single gloves, and 9.0 CFUs for double gloves), but there was no statistically significant difference between three groups (p = 0.084).”
文献中的结果提到了“中位数”,说明手菌落数的分布应该是不符合正态分布的(应该做了正态性检验),否则应该描述“均数”,故两组间的比较,在文献中采用了Mann–Whitney U检验(不符合正态分布、两组比较),如“After contact, gloved hands showed significantly higher median CFU counts tha bare hands (9.00 CFUs vs. 3.50 CFUs, p = 0.028, Figure 3).”不戴手套和戴手套接触患者后手总菌落数的比较。
文献对不戴手套接触患者前、接触患者后比较;戴手套接触患者前、接触患者后比较;接触患者前不戴手套、接触患者前戴手套比较;接触患者后不戴手套和戴手套手比较等两组间比较应该均采用了Mann–Whitney U检验。
“The median number of CFUs after patient contact was higher on single- and double-gloved hands than on bare hands (3.5 CFUs for bare hands, 14.0 CFUs for single gloves, and 9.0 CFUs for double gloves), but there was no statistically significant difference between three groups (p = 0.084).”以上描述的是“患者接触后单层手套、双层手套的CFU中位数高于不戴手套,但三组之间无统计学意义差异(p = 0.084)”,比较的是三个组,不符合两个组的要求,三组间是否有统计学差异采用的就不是Mann–Whitney U检验。
当比较的组数大于两个组时,就不能采用t检验、Mann–Whitney U检验等方法,因为这会大大增加一型错误的概率。大于两个组可以采用方差分析、Kruskal–Wallis test 检验,但同样要根据数据的分布情况进行细分。
方差分析要求统计的数据来自正态分布的总体、且等方差(在实际应用过程中,对正态性要求不是很严格,但对等方差要求严格);Kruskal–Wallis test 检验对数据的总体分布不作要求,为非参数检验。
该文献中由于不符合正态分布,三组的比较采用的是Kruskal–Wallis test 检验,描述的是“中位数”是否有显著差异,方差是否齐没有给出结果,推测方差可能不齐,所以没有采用方差分析,而是Kruskal–Wallis test 检验(非参数检验)。
但需要注意的是,三组及三组以上的比较,得到的结果具有统计学意义,只能说明各组中有一些组存在差异,而不是每个组组与组之间存在差异。例如A|B|C三组比较,有统计学意义只能说明至少有两组是有差异的,如果要了解各组两两之间是否有差异,还需要再进行比较。在该文献中“When a significant difference was detected using the Kruskal–Wallis test, post hoc tests were performed using the Mann–Whitney U test with Bonferroni correction. ” 三组的比较Kruskal–Wallis test如果显著,采用Bonferroni 矫正的Mann–Whitney U test 对组与组之间分别比较,由于结果显示三组之间无统计学意义,显示三组无显著差别,故未给出组与组比较的结果。
同理,图片2中对接触前后手指、手腕、手掌等手菌落数百分比的统计方法也需要从上述几点进行考虑。
图片1
图片2
|