找回密码
 注册

微信登录,快人一步

QQ登录

只需一步,快速开始

查看: 3528|回复: 22

[转帖] 几种常见的滥(乱)用卡方检验的情况

  [复制链接]
发表于 2017-8-28 08:40:33 | 显示全部楼层 |阅读模式 IP:上海
本帖最后由 御剑迎风 于 2017-8-28 08:45 编辑

由于个人精力和能力有限,关于统计常见错误的讲解,就先不原创了,先进行一些转帖了。

感谢大家长时间的关注!
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
卡方检验是医学科研中最常用的统计学方法之一,主要用于对分类资料进行比较分析。笔者粗略估计,医学期刊上刊登的临床研究类论文中,70% 以上会使用该统计方法对数据进行分析。然而,在医学期刊,特别是国内期刊上刊登的论文中,滥(乱)用卡方检验的情况十分普遍、屡见不鲜。

在此,笔者拟就常见的滥(乱)用卡方检验的情况进行总结、概括和辨析,以帮助大家正确使用卡方检验。

1、忽略卡方检验的应用条件
原文1】佝偻病组与对照组的 VDR基因型分布频率见表1。
表1. 两组VDR基因型分布频率

                               
登录/注册后可看大图

(《中华儿科杂志》2005年发表)
分析1】R×C资料χ2检验要求理论频数(注意不是实际频数)不宜太小,即有1/5以上格子的理论频数小于5,或有1个格子的理论频数小于1。如果遇到上述情况,有四种处理方法:
① 增大样本量;② 采用Fisher确切概率法;③ 将理论频数太小的行或列与性质相近的邻行或邻列合并;④ 删去理论频数太小的格子所对应的的行或列。
在该例中,有2个格子的理论值小于5,因此采用Fisher确切概率法,计算得到χ2=0.269,P=0.943,差异无统计学意义,不能认为两组的VDR基因型分布有差异。

原文2】经查体甲状腺、心、肺、肝、脾阳性体征发生率,两组差异无显著性(P>0.05),见表2。
表2. 医用X线组与对照组阳性体征比较

                               
登录/注册后可看大图

(《预防医学文献信息》1997年发表)
分析2】四格表χ2检验的应用条件为:
① 若n≥40且T>5时,用四格表χ2检验;② 若n≥40且1≤T≤5时,用校正四格表χ2检验;③ 若n<40或T<1时,用Fisher确切概率法。其中n为样本量,T为每个格子的理论频数(注意不是实际频数)。
在该例中,根据上述应用条件,甲状腺肿大、肺部异常、脾肿大三项应该采用Fisher 确切概率法,计算得三项均P>0.999,心脏异常、肝肿大两项应该采用校正四格表χ2检验,计算得两项χ2<0.001,P>0.999。

2、不能正确运用卡方检验分析有序资料

原文1】从表3看,治疗组总有效率高于对照组,差异有统计学意义(χ2=3.906,P<0.05)。
表3. 治疗组与对照组疗效比较 (例(%))

                               
登录/注册后可看大图

(《针灸临床杂志》2010年发表)
分析1】该研究实际上是将表3中的治愈、显效、有效三列数据合并为“有效”一列,然后与“无效”构成四格表的形式进行了四格表的χ2检验,读取了pearson卡方值,此时方法应用的本身并无错误,但是合并之后忽略了疗效的“等级”信息,相当于把信息粗化了。
该资料为单向有序资料,可以选择χ2检验的方法进行分析,但应读取linear-by-linear association的结果,即linear-by-linear association统计量为6.182,P<0.001,认为治疗组和对照组的疗效总体分布不同。

原文2
表4. 不同年龄组超重与肥胖的分布情况

                               
登录/注册后可看大图

(《湘南学院学报》2004年发表)
分析2】对于双向有序且属性不同的资料(以表4为例):
① 若研究目的是了解不同年龄组的BMI分布情况,可使用χ2检验,读取linear-by-linear association的结果;
② 若研究目的是了解年龄与BMI之间的相关关系,使用等级相关分析;
③ 若研究目的是想了解是否随着年龄的增长,BMI呈上升趋势,则可以采用χ2检验中ordinal中的gamma方法。
本研究是想了解年龄与BMI之间的关系,故应该采用等级相关分析,原文使用χ2检验方法是不对的。Spearman秩相关分析结果为:相关系数0.293,P<0.001,总体相关系数具有统计学意义。


3、误用一般卡方检验分析配对资料

原文】用念珠菌显色培养基和沙保培养基,对3种念珠菌同时平行接种进行生长试验比较。结果经χ2检验,沙保培养基对白色念珠菌和热带念珠菌差异有显著意义P<0.01和P<0.05,而克柔念珠菌对这两种培养基差异无显著意义P>0.5,结果见表5。
表5. 两种培养基对126株念珠菌在48h生长情况(株)比较

                               
登录/注册后可看大图

(《中华医学检验杂志》1999年发表)
分析】该研究为配对设计,应该采用配对四格表的χ2检验。因为独立样本四格表资料,研究对象是随机分配的,不同组的数据相互独立;而配对四格表资料中,研究对象事先以某种方式配对,然后再根据不同组进行统计,结果不是相互独立的。
配对四格表χ2检验的应用条件为:① 若b+c≥40,应用配对四格表χ2检验计算公式;② 若b+c<40,需作连续性校正。
根据上述应用条件重新计算,得到三组χ2值和P值分别为χ2 1=21.43,P1<0.01;χ2 2=10.32,P2<0.01;χ2 3=5.33,P3<0.05;三组差异均有统计学意义。此外该研究还存在明显的错误,即原文描述与表格中的数据并不相符。

本文初步分析了几种常见的滥(乱)用卡方检验的情况,限于篇幅以及笔者水平所限,一些较为复杂的、少见的滥(乱)用卡方检验的行为不再一一赘述。实际上,在统计学家眼里,本文的观点多已是很基础的、老生常谈的话题,甚至并无成文的价值。之所以将这些问题重新总结成文,只是有感于部分同行在分析数据时不分青红皂白地滥(乱)用卡方检验处理数据,得出一番令人啼笑皆非的统计学结果之后还全然不知。希望读者阅毕本文后,在一笑而过的同时,能若有所思。

评分

参与人数 1威望 +2 金币 +5 收起 理由
王小虾 + 2 + 5 很给力!

查看全部评分

贡献排行榜:
发表于 2017-8-28 08:49:58 | 显示全部楼层 IP:河南郑州
第一个例子的问题主要是在样本量太小么?我的毕业课题貌似也是这么分组做的,不过我的样本量比较大。。。。
回复

使用道具 举报

发表于 2017-8-28 08:50:12 | 显示全部楼层 IP:天津
写论文的必看。卡方检验不能乱用的。
回复

使用道具 举报

 楼主| 发表于 2017-8-28 08:58:52 | 显示全部楼层 IP:上海
草莓小花朵 发表于 2017-8-28 08:49
第一个例子的问题主要是在样本量太小么?我的毕业课题貌似也是这么分组做的,不过我的样本量比较大。。。。

这个是AA样本例数太少,没有超过5~
与你分组无关
回复

使用道具 举报

发表于 2017-8-28 09:01:02 | 显示全部楼层 IP:浙江金华
谢谢老师的资料分享,学习了。
回复

使用道具 举报

发表于 2017-8-28 09:15:27 | 显示全部楼层 IP:北京
史老师是统计大家~
回复

使用道具 举报

发表于 2017-8-28 09:27:49 | 显示全部楼层 IP:四川成都
老师你好!为什么我的Fisher确切概率法结果没有检测值,只有一个p值,spss上操作的。
回复

使用道具 举报

发表于 2017-8-28 09:33:08 | 显示全部楼层 IP:山西临汾
草莓小花朵 发表于 2017-8-28 08:49
第一个例子的问题主要是在样本量太小么?我的毕业课题貌似也是这么分组做的,不过我的样本量比较大。。。。

主要是因为其中最小理论频数Tmin<5,跟你的分组没有关系,卡方检验的条件主要分三种:
①当n≥40且Tmin≥5时,使用一般公式;
②当n≥40且1<Tmin<5时, 使用校正公式;
③当n<40或Tmin≤1时,使用费舍尔确切概率法。
回复

使用道具 举报

 楼主| 发表于 2017-8-28 09:34:26 | 显示全部楼层 IP:上海
゛♂木子.〃 发表于 2017-8-28 09:27
老师你好!为什么我的Fisher确切概率法结果没有检测值,只有一个p值,spss上操作的。

Fisher's精确检验是直接概率法,直接得到P值。无检验统计量值
回复

使用道具 举报

 楼主| 发表于 2017-8-28 09:37:09 | 显示全部楼层 IP:上海
caoyulongchn 发表于 2017-8-28 09:15
史老师是统计大家~

过奖了,我也是借着这些案例来学习和补充自己的统计知识
在学习过程中发现这些例子很有启发意义,所以转发给大家~
回复

使用道具 举报

发表于 2017-8-28 09:37:48 | 显示全部楼层 IP:山西临汾
゛♂木子.〃 发表于 2017-8-28 09:27
老师你好!为什么我的Fisher确切概率法结果没有检测值,只有一个p值,spss上操作的。

费舍尔确切概率法本身就是没有检验统计量的,是直接给计算出结果发生的精确概率,拿来直接跟设定的α值相比较即可
回复

使用道具 举报

发表于 2017-8-28 09:42:03 | 显示全部楼层 IP:山西临汾
御剑迎风 发表于 2017-8-28 09:34
Fisher's精确检验是直接概率法,直接得到P值。无检验统计量值

跟史老师竟然同时回复了,向史老师学习
回复

使用道具 举报

 楼主| 发表于 2017-8-28 10:09:22 | 显示全部楼层 IP:上海
大智小慧 发表于 2017-8-28 09:42
跟史老师竟然同时回复了,向史老师学习

您老谦虚了
这么详细而明了的解释,应该是我向你学习
回复

使用道具 举报

发表于 2017-8-28 11:25:57 | 显示全部楼层 IP:山西太原
这个东西不太懂,好像又先天的免疫力,虽然认真学习了,但还是半懂半不懂。
回复

使用道具 举报

发表于 2017-8-28 12:32:55 | 显示全部楼层 IP:江西南昌
这些问题主要是忽视卡方检验的应用条件,如果知道应用条件,就不会犯这些错误      
回复

使用道具 举报

发表于 2017-8-28 13:14:58 | 显示全部楼层 IP:北京
学习了,谢谢分享!以后有不会的终于找到老师可以询问了
回复

使用道具 举报

发表于 2017-8-28 14:06:53 | 显示全部楼层 IP:四川成都
御剑迎风 发表于 2017-8-28 09:34
Fisher's精确检验是直接概率法,直接得到P值。无检验统计量值

谢谢老师的解答,但是我看老师您案例分析1第5行Fisher确切概率法给出了一个χ2=0.269,P=0.943,这个卡方值又是从哪里得出的呢,我在投文章的时候需要写上去吗?而且我看有些Fisher确切概率法监测结果又有检测值,希望老师能赐教,谢谢!C:\Documents and Settings\Administrator\桌面
_N9}V3NGZU3C[F3SBS@J`ZO.png
回复

使用道具 举报

 楼主| 发表于 2017-8-28 14:22:13 | 显示全部楼层 IP:上海
゛♂木子.〃 发表于 2017-8-28 14:06
谢谢老师的解答,但是我看老师您案例分析1第5行Fisher确切概率法给出了一个χ2=0.269,P=0.943,这个卡方 ...

1.卡方和Fisher精确精确检验都适应用于四格表,只不过适应条件不同(见8楼老师回复)
2.至于是采用卡方检验结果还是Fisher精确检验结果,需要见表下面的a解释,如本次说2个单元格期望值少于5,那么应该采用Fisher精确检验。
3.SPSS在四格表时是真正的Fisher精确概率法。在行数或列数大于2时,用的是模拟法,而非真正的Fisher精确概率法,故出现统计量值。
回复

使用道具 举报

发表于 2017-8-28 14:58:31 | 显示全部楼层 IP:四川成都
御剑迎风 发表于 2017-8-28 14:22
1.卡方和Fisher精确精确检验都适应用于四格表,只不过适应条件不同(见8楼老师回复)
2.至于是采用卡方 ...

非常感谢老师的解答!
回复

使用道具 举报

发表于 2017-8-28 16:57:09 | 显示全部楼层 IP:山东临沂
这方面的知识欠缺,学习并收藏慢慢消化!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 |

本版积分规则

×本站发帖友情提示
1、注册用户在本社区发表、转载的任何作品仅代表其个人观点,不代表本社区认同其观点。
2、如果存在违反国家相关法律、法规、条例的行为,我们有权在不经作者准许的情况下删除其在本论坛所发表的文章、帖子。
3、所有网友不要盗用有明确版权要求的作品,转贴请注明来源,否则文责自负。
4、本社区保护注册用户个人资料,但是在自身原因导致个人资料泄露、丢失、被盗或篡改,本论坛概不负责,也不承担相应法律责任。

关闭

站长推荐上一条 /1 下一条

快速回复 返回顶部 返回列表