找回密码
 注册

微信登录,快人一步

QQ登录

只需一步,快速开始

查看: 2196|回复: 30

[转帖] 统计学不得不说的二三事(一)

  [复制链接]
发表于 2017-2-4 08:27:51 | 显示全部楼层 |阅读模式 IP:上海
本帖最后由 御剑迎风 于 2017-2-4 10:30 编辑

毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。还有很多医疗同行,对于统计甚为迷恋,能统计的也统计,不能统计创造条件也要统计,看见P小于0.05比亲爹还亲爹。话说,统计是门很有神奇的学科,在讲之前我又要开始讲几个冷笑话,看懂了的可以举手。


话说:你知道吗,这个世界上绝大多数人拥有的腿的数量高于平均值?(第一遍没有看懂的小伙伴可以去面壁)


再讲一个:你知道一个普通的民众有多笨吗?世界上一半的人都比他更聪明。(其实这是不对的,世界上一多半的人都比他更聪明。因为人类的智能有上限,愚蠢却没有下限,所以不是一个完美的正态分布。)


不过瘾,再讲一个:曼德勃罗有一次说,他出生在波兰,但在法国上的学,所以平均而言他是个德国人。(所以,我出生在广东,但在东北上过学,所以平均而言我是个湖北人……)


好冷好冷,我们还是来讲点正事,分享几则统计小故事。


1、两个指标诊断疾病的问题


路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。


路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject!



这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。


稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。


路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject!



这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。


稿件被退了,路人甲很是郁闷。他吸取了经验教训,自学了很多统计学理论,终于弄清楚了采用何种方法去比较曲线下面积。接下来的事情就是改稿,然后另选杂志继续投稿。路人甲在文稿中特别注明了,曲线下面积是经过了统计学检验的,B的曲线下面积(0.82)与A的曲线下面积(0.80)之间的差异是有统计学意义的,而且还大摇大摆地在后面加了个括号,写明P=0.01。路人甲仰天长叹了一口气,很郑重地给自己的研究下了结论:本研究表明B的诊断效率是优于A的。


路人丁是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:B是常见的诊断指标,其检测结果并不对临床医师设盲,在很大程度上可以检测影响临床医师对疾病的诊断。A是新进发现的诊断指标,其结果完全对临床医师设盲,不可能影响医生的诊断。所以作者的结论(B比A优秀)是不可靠的。再说得通俗点,如果把A和B分别理解成法庭上的原稿和被告,那B无疑既充当了辩护律师,又充当了法官的角色。在这种情况下,A输掉了官司是十分正常的。如果换一个公平的、独立的法官来断案,B能否胜出就不好说了。Reject!



这个故事说明:实(试)验设计有缺陷,再优秀、再正规的统计学方法也于事无补。


稿件又被退了,路人甲的心情极度郁闷。思来想去,决定把实验重做一遍,让A和B在一个公平的环境中比较(为便于描述,此处忽略医学伦理学问题)。在新开展的研究中,A和B都是对临床医生设盲的,不可能影响金标准。这下A和B的比较结果应该比较可靠了吧,路人甲又仰天长叹了一口气,感觉自己如释重负了。科研太折腾人了,太不容易了!统计结果很快出来,A的曲线下面积是0.80,B的曲线下面积则变成了0.77,经过统计学检验后发现,A的诊断效能确实是高于B的。整个研究的试验设计滴水不漏,统计学过程天衣无缝,我就不信还有人敢拒这篇稿件,路人甲心中开始暗喜。


路人戊是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见写道:A和B的检测并不矛盾,他们之间的关系不应该是竞争关系,而应该是合作关系。读者最关心的问题显然不是A和B“孰强孰弱”的问题,虽然这个问题有一定的专业价值。如果我是坐诊医生,我会说:A和B谁强谁弱关我什么事?总之来一个病人我就A和B都检测,我的患者都不差钱!作者的研究重点应该是明确A和B能否互补,联合使用是否能有助于提高诊断准确性的问题,而非A和B“孰强孰弱”的问题。简单地说,就是明确1+1是否大于1的问题。Reject!



文章又被拒稿了。



这个故事说明:研究方向错了,即使是无懈可击的实(试)验设计和天衣无缝的统计方法,也是无济于事。


这四个故事说明:医学科研是很痛苦的,不重视统计学和科研设计,会走很多弯路的。

评分

参与人数 1威望 +2 金币 +5 收起 理由
听.讲 + 2 + 5 故事不错~

查看全部评分

贡献排行榜:
发表于 2017-2-4 08:46:09 | 显示全部楼层 IP:山东临沂
抢个沙发坐!非常感谢老师分享的统计学知识,学习了!
回复

使用道具 举报

发表于 2017-2-4 08:52:27 | 显示全部楼层 IP:贵州
统计学真的要好好学习下        
回复

使用道具 举报

发表于 2017-2-4 09:01:10 | 显示全部楼层 IP:江苏
  谢谢老师的经验分享 统计真的好难学案   
回复

使用道具 举报

发表于 2017-2-4 09:06:43 | 显示全部楼层 IP:山东淄博
对老师的独特讲解由衷佩服!搞科研确实是非常非常痛苦的,但成功的喜悦也是无法用语言来形容的。
回复

使用道具 举报

发表于 2017-2-4 09:10:31 | 显示全部楼层 IP:江西
"医学科研是很痛苦的,不重视统计学和科研设计,会走很多弯路的。"说得很有道理。
回复

使用道具 举报

发表于 2017-2-4 09:13:00 | 显示全部楼层 IP:河北石家庄
老师的讲解很形象易懂
回复

使用道具 举报

发表于 2017-2-4 09:29:24 | 显示全部楼层 IP:贵州黔东南州凯里
我对统计学是蒙的,有时间应该好好的学习。。。
回复

使用道具 举报

发表于 2017-2-4 09:59:51 | 显示全部楼层 IP:宁夏银川
虽然大学里统计学是作为专业课来说,但是还是没有学到统计学的精髓,仍需好好努力学习,不能只停留在表面
回复

使用道具 举报

 楼主| 发表于 2017-2-4 10:37:34 | 显示全部楼层 IP:上海
snowfly1314 发表于 2017-2-4 09:59
虽然大学里统计学是作为专业课来说,但是还是没有学到统计学的精髓,仍需好好努力学习,不能只停留在表面

统计重在应用,如何选择合适的统计方法是关键,一起加油`
回复

使用道具 举报

发表于 2017-2-4 12:21:54 | 显示全部楼层 IP:江西南昌
很有趣的统计故事,令人深思                 
回复

使用道具 举报

发表于 2017-2-4 14:56:21 | 显示全部楼层 IP:广东深圳
老师的讲解详尽,解析清晰易懂,尽管很认真学习了,对应用还不真懂!对于统计学,是个好大的空白!
回复

使用道具 举报

发表于 2017-2-4 15:18:42 | 显示全部楼层 IP:山东德州
谢谢老师的分享,学习了。
回复

使用道具 举报

发表于 2017-2-4 15:36:12 | 显示全部楼层 IP:吉林长春
本帖最后由 babygreen 于 2017-2-4 15:37 编辑

这个解释很是言简意赅,可是临床工作中到底要怎么做,才能找准方向,严谨设计实验、使用正确统计方法,得出科研产出,估计都得从教训中得到经验。
回复

使用道具 举报

 楼主| 发表于 2017-2-4 15:54:10 | 显示全部楼层 IP:上海
babygreen 发表于 2017-2-4 15:36
这个解释很是言简意赅,可是临床工作中到底要怎么做,才能找准方向,严谨设计实验、使用正确统计方法,得出 ...

Reading more and thinking more~
Good luck!
回复

使用道具 举报

发表于 2017-2-4 15:54:47 | 显示全部楼层 IP:广西梧州
御剑迎风 发表于 2017-2-4 10:37
统计重在应用,如何选择合适的统计方法是关键,一起加油`

老师是统计专业毕业的么?小故事挺有意思。
回复

使用道具 举报

发表于 2017-2-4 15:55:35 | 显示全部楼层 IP:广西梧州
yy950811 发表于 2017-2-4 14:56
老师的讲解详尽,解析清晰易懂,尽管很认真学习了,对应用还不真懂!对于统计学,是个好大的空白!

这个术业有专攻,可以找专业的人来做专业的事情。
回复

使用道具 举报

 楼主| 发表于 2017-2-4 16:00:48 | 显示全部楼层 IP:上海
听.讲 发表于 2017-2-4 15:54
老师是统计专业毕业的么?小故事挺有意思。

流行病学的研究生~
最近在看中文文章和部分英文文章,发现他们犯得统计错误太多了。
本想做个总结,无奈没有精力,所以借用他人的小故事让大家反思一下统计的意义
回复

使用道具 举报

发表于 2017-2-4 16:05:49 | 显示全部楼层 IP:广西梧州
御剑迎风 发表于 2017-2-4 16:00
流行病学的研究生~
最近在看中文文章和部分英文文章,发现他们犯得统计错误太多了。
本想做个总结,无 ...

是有很多错的地方,现在的论文本来也多是职称晋升催生的产物,所以,只要能发表,管他正确不正确。而且很多刊物没有一个真正学统计的人来把关,做数据分析的人也不是统计的人,所以这是无法避免的现象。流行病的研究生,院感数据挺多的,大有作为。
回复

使用道具 举报

发表于 2017-2-4 16:14:59 | 显示全部楼层 IP:辽宁大连
感谢老师分享,学习了。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 |

本版积分规则

×本站发帖友情提示
1、注册用户在本社区发表、转载的任何作品仅代表其个人观点,不代表本社区认同其观点。
2、如果存在违反国家相关法律、法规、条例的行为,我们有权在不经作者准许的情况下删除其在本论坛所发表的文章、帖子。
3、所有网友不要盗用有明确版权要求的作品,转贴请注明来源,否则文责自负。
4、本社区保护注册用户个人资料,但是在自身原因导致个人资料泄露、丢失、被盗或篡改,本论坛概不负责,也不承担相应法律责任。

关闭

站长推荐上一条 /1 下一条

快速回复 返回顶部 返回列表