御剑迎风 发表于 2017-8-28 08:40

几种常见的滥(乱)用卡方检验的情况

本帖最后由 御剑迎风 于 2017-8-28 08:45 编辑

由于个人精力和能力有限,关于统计常见错误的讲解,就先不原创了,先进行一些转帖了。

感谢大家长时间的关注!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
卡方检验是医学科研中最常用的统计学方法之一,主要用于对分类资料进行比较分析。笔者粗略估计,医学期刊上刊登的临床研究类论文中,70% 以上会使用该统计方法对数据进行分析。然而,在医学期刊,特别是国内期刊上刊登的论文中,滥(乱)用卡方检验的情况十分普遍、屡见不鲜。

在此,笔者拟就常见的滥(乱)用卡方检验的情况进行总结、概括和辨析,以帮助大家正确使用卡方检验。

1、忽略卡方检验的应用条件
【原文1】佝偻病组与对照组的 VDR基因型分布频率见表1。
表1. 两组VDR基因型分布频率
http://img.mp.itc.cn/upload/20170612/dddd0fe3bf7b4876b9d0869f58e84156.jpg
(《中华儿科杂志》2005年发表)
【分析1】R×C资料χ2检验要求理论频数(注意不是实际频数)不宜太小,即有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1。如果遇到上述情况,有四种处理方法:
① 增大样本量;② 采用Fisher确切概率法;③ 将理论频数太小的行或列与性质相近的邻行或邻列合并;④ 删去理论频数太小的格子所对应的的行或列。
在该例中,有2个格子的理论值小于5,因此采用Fisher确切概率法,计算得到χ2=0.269,P=0.943,差异无统计学意义,不能认为两组的VDR基因型分布有差异。

【原文2】经查体甲状腺、心、肺、肝、脾阳性体征发生率,两组差异无显著性(P>0.05),见表2。
表2. 医用X线组与对照组阳性体征比较
http://img.mp.itc.cn/upload/20170612/6e3392e9c7aa405888701d56362411a7_th.jpg
(《预防医学文献信息》1997年发表)
【分析2】四格表χ2检验的应用条件为:
① 若n≥40且T>5时,用四格表χ2检验;② 若n≥40且1≤T≤5时,用校正四格表χ2检验;③ 若n<40或T<1时,用Fisher确切概率法。其中n为样本量,T为每个格子的理论频数(注意不是实际频数)。
在该例中,根据上述应用条件,甲状腺肿大、肺部异常、脾肿大三项应该采用Fisher 确切概率法,计算得三项均P>0.999,心脏异常、肝肿大两项应该采用校正四格表χ2检验,计算得两项χ2<0.001,P>0.999。

2、不能正确运用卡方检验分析有序资料

【原文1】从表3看,治疗组总有效率高于对照组,差异有统计学意义(χ2=3.906,P<0.05)。
表3. 治疗组与对照组疗效比较 (例(%))
http://img.mp.itc.cn/upload/20170612/e3eabbac89034d618ca8d2d27fef0641.jpg
(《针灸临床杂志》2010年发表)
【分析1】该研究实际上是将表3中的治愈、显效、有效三列数据合并为“有效”一列,然后与“无效”构成四格表的形式进行了四格表的χ2检验,读取了pearson卡方值,此时方法应用的本身并无错误,但是合并之后忽略了疗效的“等级”信息,相当于把信息粗化了。
该资料为单向有序资料,可以选择χ2检验的方法进行分析,但应读取linear-by-linear association的结果,即linear-by-linear association统计量为6.182,P<0.001,认为治疗组和对照组的疗效总体分布不同。

【原文2】
表4. 不同年龄组超重与肥胖的分布情况
http://img.mp.itc.cn/upload/20170612/4137bcbdb9b249cb839c4d7755fa9349_th.jpg
(《湘南学院学报》2004年发表)
【分析2】对于双向有序且属性不同的资料(以表4为例):
① 若研究目的是了解不同年龄组的BMI分布情况,可使用χ2检验,读取linear-by-linear association的结果;
② 若研究目的是了解年龄与BMI之间的相关关系,使用等级相关分析;
③ 若研究目的是想了解是否随着年龄的增长,BMI呈上升趋势,则可以采用χ2检验中ordinal中的gamma方法。
本研究是想了解年龄与BMI之间的关系,故应该采用等级相关分析,原文使用χ2检验方法是不对的。Spearman秩相关分析结果为:相关系数0.293,P<0.001,总体相关系数具有统计学意义。


3、误用一般卡方检验分析配对资料

【原文】用念珠菌显色培养基和沙保培养基,对3种念珠菌同时平行接种进行生长试验比较。结果经χ2检验,沙保培养基对白色念珠菌和热带念珠菌差异有显著意义P<0.01和P<0.05,而克柔念珠菌对这两种培养基差异无显著意义P>0.5,结果见表5。
表5. 两种培养基对126株念珠菌在48h生长情况(株)比较
http://img.mp.itc.cn/upload/20170612/3dd656e1712544b287f25d92dd5c3002_th.jpg
(《中华医学检验杂志》1999年发表)
【分析】该研究为配对设计,应该采用配对四格表的χ2检验。因为独立样本四格表资料,研究对象是随机分配的,不同组的数据相互独立;而配对四格表资料中,研究对象事先以某种方式配对,然后再根据不同组进行统计,结果不是相互独立的。
配对四格表χ2检验的应用条件为:① 若b+c≥40,应用配对四格表χ2检验计算公式;② 若b+c<40,需作连续性校正。
根据上述应用条件重新计算,得到三组χ2值和P值分别为χ2 1=21.43,P1<0.01;χ2 2=10.32,P2<0.01;χ2 3=5.33,P3<0.05;三组差异均有统计学意义。此外该研究还存在明显的错误,即原文描述与表格中的数据并不相符。

本文初步分析了几种常见的滥(乱)用卡方检验的情况,限于篇幅以及笔者水平所限,一些较为复杂的、少见的滥(乱)用卡方检验的行为不再一一赘述。实际上,在统计学家眼里,本文的观点多已是很基础的、老生常谈的话题,甚至并无成文的价值。之所以将这些问题重新总结成文,只是有感于部分同行在分析数据时不分青红皂白地滥(乱)用卡方检验处理数据,得出一番令人啼笑皆非的统计学结果之后还全然不知。希望读者阅毕本文后,在一笑而过的同时,能若有所思。

草莓小花朵 发表于 2017-8-28 08:49

第一个例子的问题主要是在样本量太小么?我的毕业课题貌似也是这么分组做的,不过我的样本量比较大。。。。

ICBC 发表于 2017-8-28 08:50

写论文的必看。卡方检验不能乱用的。

御剑迎风 发表于 2017-8-28 08:58

草莓小花朵 发表于 2017-8-28 08:49
第一个例子的问题主要是在样本量太小么?我的毕业课题貌似也是这么分组做的,不过我的样本量比较大。。。。

这个是AA样本例数太少,没有超过5~
与你分组无关

jcyyhlb 发表于 2017-8-28 09:01

谢谢老师的资料分享,学习了。

caoyulongchn 发表于 2017-8-28 09:15

史老师是统计大家~

゛♂木子.〃 发表于 2017-8-28 09:27

老师你好!为什么我的Fisher确切概率法结果没有检测值,只有一个p值,spss上操作的。

大智小慧 发表于 2017-8-28 09:33

草莓小花朵 发表于 2017-8-28 08:49
第一个例子的问题主要是在样本量太小么?我的毕业课题貌似也是这么分组做的,不过我的样本量比较大。。。。
主要是因为其中最小理论频数Tmin<5,跟你的分组没有关系,卡方检验的条件主要分三种:
①当n≥40且Tmin≥5时,使用一般公式;
②当n≥40且1<Tmin<5时, 使用校正公式;
③当n<40或Tmin≤1时,使用费舍尔确切概率法。

御剑迎风 发表于 2017-8-28 09:34

゛♂木子.〃 发表于 2017-8-28 09:27
老师你好!为什么我的Fisher确切概率法结果没有检测值,只有一个p值,spss上操作的。

Fisher's精确检验是直接概率法,直接得到P值。无检验统计量值

御剑迎风 发表于 2017-8-28 09:37

caoyulongchn 发表于 2017-8-28 09:15
史老师是统计大家~

过奖了,我也是借着这些案例来学习和补充自己的统计知识
在学习过程中发现这些例子很有启发意义,所以转发给大家{:1_12:}~

大智小慧 发表于 2017-8-28 09:37

゛♂木子.〃 发表于 2017-8-28 09:27
老师你好!为什么我的Fisher确切概率法结果没有检测值,只有一个p值,spss上操作的。

费舍尔确切概率法本身就是没有检验统计量的,是直接给计算出结果发生的精确概率,拿来直接跟设定的α值相比较即可

大智小慧 发表于 2017-8-28 09:42

御剑迎风 发表于 2017-8-28 09:34
Fisher's精确检验是直接概率法,直接得到P值。无检验统计量值

跟史老师竟然同时回复了{:1_12:}{:1_12:}{:1_12:},向史老师学习

御剑迎风 发表于 2017-8-28 10:09

大智小慧 发表于 2017-8-28 09:42
跟史老师竟然同时回复了,向史老师学习

您老谦虚了{:1_9:}
这么详细而明了的解释,应该是我向你学习{:1_7:}

guoli2008 发表于 2017-8-28 11:25

这个东西不太懂,好像又先天的免疫力,虽然认真学习了,但还是半懂半不懂。

tracy 发表于 2017-8-28 12:32

这些问题主要是忽视卡方检验的应用条件,如果知道应用条件,就不会犯这些错误      

999欣欣向荣 发表于 2017-8-28 13:14

学习了,谢谢分享!以后有不会的终于找到老师可以询问了{:1_1:}

゛♂木子.〃 发表于 2017-8-28 14:06

御剑迎风 发表于 2017-8-28 09:34
Fisher's精确检验是直接概率法,直接得到P值。无检验统计量值

谢谢老师的解答,但是我看老师您案例分析1第5行Fisher确切概率法给出了一个χ2=0.269,P=0.943,这个卡方值又是从哪里得出的呢,我在投文章的时候需要写上去吗?而且我看有些Fisher确切概率法监测结果又有检测值,希望老师能赐教,谢谢!C:\Documents and Settings\Administrator\桌面

御剑迎风 发表于 2017-8-28 14:22

゛♂木子.〃 发表于 2017-8-28 14:06
谢谢老师的解答,但是我看老师您案例分析1第5行Fisher确切概率法给出了一个χ2=0.269,P=0.943,这个卡方 ...

1.卡方和Fisher精确精确检验都适应用于四格表,只不过适应条件不同(见8楼老师回复)
2.至于是采用卡方检验结果还是Fisher精确检验结果,需要见表下面的a解释,如本次说2个单元格期望值少于5,那么应该采用Fisher精确检验。
3.SPSS在四格表时是真正的Fisher精确概率法。在行数或列数大于2时,用的是模拟法,而非真正的Fisher精确概率法,故出现统计量值。

゛♂木子.〃 发表于 2017-8-28 14:58

御剑迎风 发表于 2017-8-28 14:22
1.卡方和Fisher精确精确检验都适应用于四格表,只不过适应条件不同(见8楼老师回复)
2.至于是采用卡方 ...

非常感谢老师的解答!

lyluoxiuhua 发表于 2017-8-28 16:57

这方面的知识欠缺,学习并收藏慢慢消化!
页: [1] 2
查看完整版本: 几种常见的滥(乱)用卡方检验的情况