找回密码
 注册

微信登录,快人一步

QQ登录

只需一步,快速开始

查看: 1848|回复: 12

[循证译稿] 【统计分析一点通】SIFIC统计专栏第三期:卡方检验应用实例解析(一)

  [复制链接]
发表于 2018-11-12 07:55:07 | 显示全部楼层 |阅读模式 IP:山西临汾
本帖最后由 大智小慧 于 2018-11-12 07:56 编辑

SIFIC科研设计与统计分析

作者:医统家园和SIFIC循证团队

       「循证感控」(Evidence based infection prevention and control,  EBIPC)含义丰富,工作中心基于证据(Evidence)。不仅仅在于证据的援引,更重要的价值在于努力寻找证据,发现证据,传播证据。然而,怎么才能科学的找到“证据”,并科学解读呢?科研设计和统计分析的重要性不言而喻。而这恰恰是感控相关工作人员甚至于对相当一部分临床工作者都是不小的困惑。

       SIFIC循证与“医统家园”合作,共同推出「SIFIC科研设计与统计分析」专栏,通过案例分析和解读,为大家系统介绍和科普科研设计和统计分析基础知识、剖析精品文章中的科研设计技巧和统计知识等。大家也可以通过公众号、SIFIC论坛等一系列途径,咨询科研设计和统计分析困惑。

       上一节,贝塔与大家共同学习了t检验的基本用法,今天给大家带来的是工作中应用更广泛的卡方检验,主要用于无序分类数据的统计分析,如不同组间率的比较和构成比的比较。
实例介绍

       在医学研究中,我们常需要对两组、多组率或构成比进行比较:如两种治疗方法的有效率、不同地区某种疾病的发病率、人群构成是否相同等。这类问题在统计上属于假设检验的范畴。其所涉及的数据类型为无序分类数据
       例如:研究者随机抽取河水引用区377人,泉水饮用区301人,采用X光拍片进行大骨节病的诊断。两类地区的大骨结病检出情况见表1。研究者关心的问题是:河水饮用地区与泉水饮用地区大骨节的检出率是否相同?
       1.jpg
分析思路

       由表1数据不难计算出河水饮用区的检出率为19.89%,泉水引用区的检出率为32.9%,两者之差为12.01%,但能不能下结论说大骨节病的发病率(分布情况)在两地间存在差别呢?

       不能。这一结果只是一次抽样得到的样本统计量的差别。这个差别,有可能是由随机误差导致(两组总体发病率相同),也有可能两地区间的发病率存在本质区别(两地总体发病率不同),泉水组的总体检出率真的较高。这仅从观测的样本数据无法判断,而需借助样本信息对其所代表的总体进行推断。
       如果更进一步将这一实际问题转化为统计问题,则其问题实质是考察某无序分类变量各水平在两组或多组间的分布是否一致。所用到的统计方法是卡方检验。

       卡方检验的历史悠久,英国著名统计学家Karl Pearson于1900年首次提出,而后得以广泛应用,可应用之广可泛媲美连续型变量均值比较的t检验。是对无序分类数据进统计推断的重要方法(但其应用不止于此)。其基本原理是通过二维列联表的期望频数和实际频数构建卡方统计量,并利用卡方统计量所服从的卡方分布进行统计推断。

实际操作

       下面我们来演示如何使用SPSS对表 1数据进行卡方检验。
第一步:输入数据
       将表1的数据按照图1形式输入SPSS。数据共三列四行,第一、第二列为不同地区检测结果的组合,第三列为地区与检出结果组合下的频数值。
       2.jpg
第二步:数据加权
       对数据进行加权,权重为计数列。此步骤目的是使SPSS能够识别地区和检出情况各类别组合下的频数数据。操作步骤见图2、图3。
       3.jpg
       图2 数据加权
       4.jpg
       图3 使用计数变量进行加权
第三步:卡方检验
       点击Analyze-Descriptive Statistics-Crosstabs(图4),将地区作为行变量、检出情况作为列变量(图5)。点击cells,勾选Row(图6),以计算行频数百分比(即检出率)。点击statistics勾选Chi-squqre以计算卡方统计量(图7)。这些设置完毕后,点击Crsosstabs界面的OK按钮,软件即可完成计算。
       5.jpg
       图4
       6.jpg
       图5
       7.jpg
       图6
       8.jpg
       图7
结果判读及解释
       输出主要结果分为两部分,第一部分是交叉表(图8-1),列出两个地区的检出、未检出频数以及检出率、未检出率以及合计值等指标。第二部分则为卡方检验的结果,第一行显示的为卡方检验相关信息,从左至右数值含义分别为皮尔逊卡方值、自由度、以及相应P值。P值是进行统计推断的依据,由图2可见P<0.001。因此,根据卡方检验结果可以认为河水饮水区与泉水饮水地区的大骨节病检出率差别具有统计学意义,且泉水引用区的检出率较高。
       9.jpg
       图8-1
       10.jpg
       图8-2
       本文介绍了卡方检验的在2*2四格表资料中的应用,相信通过上文的介绍,大家已经可通过SPSS进行卡方检验并解释其结果。在下一篇文章中,我们将进一步以实例结合SPSS操作剖析卡方检验:介绍其应用条件及应用条件不满足时的处理方法。

       数据来源:卫生统计学第八版,人民卫生出版社

【精彩回顾】:
       SIFIC统计专栏第一期:认识两组独立样本t检验(1)  https://bbs.sific.com.cn/thread-220940-1-1.html
       SIFIC统计专栏第二期:认识两组独立样本t检验(2)https://bbs.sific.com.cn/thread-221006-1-1.html
发表于 2018-11-12 08:38:58 | 显示全部楼层 IP:山西临汾
跟着老师学习了使用SPSS软件处理统计数据
回复

使用道具 举报

发表于 2018-11-12 08:50:08 | 显示全部楼层 IP:湖北十堰
谢谢老师的分享,回顾了用SPSS软件对数据进行卡方检验           
回复

使用道具 举报

发表于 2018-11-12 09:14:24 | 显示全部楼层 IP:山东潍坊
谢谢老师分享                                             
回复

使用道具 举报

发表于 2018-11-12 09:59:45 | 显示全部楼层 IP:河南濮阳
循证管理,做好工作,谢谢分享1
回复

使用道具 举报

发表于 2018-11-12 10:14:08 | 显示全部楼层 IP:青海
谢谢老师的分享!
回复

使用道具 举报

发表于 2018-11-12 14:32:01 | 显示全部楼层 IP:河南安阳
日学一点,终成大师,,,,,,,,,,,,,
回复

使用道具 举报

发表于 2018-11-12 14:56:25 | 显示全部楼层 IP:河南濮阳
谢谢老师的分享!努力学习中。。。。
回复

使用道具 举报

发表于 2018-11-12 21:49:08 | 显示全部楼层 IP:河北沧州
跟着老师学习了使用SPSS软件处理统计数据
回复

使用道具 举报

发表于 2018-11-13 09:08:31 | 显示全部楼层 IP:江苏无锡
简单易懂,继续学习,谢谢老师!
回复

使用道具 举报

发表于 2018-11-13 11:15:26 | 显示全部楼层 IP:江苏南京
谢谢老师分享                                 
回复

使用道具 举报

发表于 2019-2-22 22:35:26 | 显示全部楼层 IP:
持续打卡学习中,感谢老师分享!!!
回复

使用道具 举报

发表于 2019-11-15 09:26:03 | 显示全部楼层 IP:山西太原
太棒了,谢谢老师的分享!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 |

本版积分规则

×本站发帖友情提示
1、注册用户在本社区发表、转载的任何作品仅代表其个人观点,不代表本社区认同其观点。
2、如果存在违反国家相关法律、法规、条例的行为,我们有权在不经作者准许的情况下删除其在本论坛所发表的文章、帖子。
3、所有网友不要盗用有明确版权要求的作品,转贴请注明来源,否则文责自负。
4、本社区保护注册用户个人资料,但是在自身原因导致个人资料泄露、丢失、被盗或篡改,本论坛概不负责,也不承担相应法律责任。

关闭

站长推荐上一条 /1 下一条

快速回复 返回顶部 返回列表