找回密码
 注册

微信登录,快人一步

QQ登录

只需一步,快速开始

楼主: 御剑迎风

[原创] 一些常见的统计错误(一) 33/34楼有更新

  [复制链接]
 楼主| 发表于 2017-7-6 21:38 | 显示全部楼层
tracy 发表于 2017-7-6 20:02
这里涉及到率的标准化问题,考虑分层因素引起的率的差异,计算总率时不能直接比较,需要计算标准化率再进行 ...

很专业的点评,莫非您也是流行病与卫生统计的硕士?  
只是大家对这么多抽象概念不理解,我明天组织下语言,好好解答下
回复

使用道具 举报

 楼主| 发表于 2017-7-6 21:39 | 显示全部楼层
liyuyu2002 发表于 2017-7-6 09:39
对啊,有时月统计的数据是不能累加作为季统计的,我们也发现这样的情况

老师,能否把例子更为具体一点,方便大家阅读和理解
回复

使用道具 举报

发表于 2017-7-7 06:49 | 显示全部楼层
了解学习了新知识,谢谢老师分享。
回复

使用道具 举报

发表于 2017-7-7 08:20 | 显示全部楼层
长知识了,第1次知道数据说谎的问题
回复

使用道具 举报

发表于 2017-7-7 08:30 | 显示全部楼层
谢谢老师分享!长见识了。
回复

使用道具 举报

发表于 2017-7-7 08:40 | 显示全部楼层
中原一点红 发表于 2017-7-6 09:45
感觉我到死都学不完,也学不好。

同感,统计这块枯燥乏味
回复

使用道具 举报

发表于 2017-7-7 08:42 | 显示全部楼层
学习了解了统计学知识,感谢老师分享!
回复

使用道具 举报

发表于 2017-7-7 08:54 | 显示全部楼层
御剑迎风 发表于 2017-7-6 21:39
老师,能否把例子更为具体一点,方便大家阅读和理解

住院人数月统计,我们以第一天的病人数加这个月总的新入人数。例如第一天病人60加本月新入30,这月的病人总数为90人。如果作为季度统计把每月的人数相加,与本季度第一天的病人数加本季度的新入人数,数据差很大。
回复

使用道具 举报

发表于 2017-7-7 09:15 | 显示全部楼层
偶尔出现这样的问题,确实感觉很疑惑,但很少这样深入去考虑,谢谢分享
回复

使用道具 举报

发表于 2017-7-7 09:17 | 显示全部楼层
本帖最后由 ICBC 于 2017-7-7 09:33 编辑

连续剧模式已经开启,慢慢看

两点感触:
①田忌赛马。质和量的对比
②比/率,涉及到分子和分母,分母不同,则对比的基准不同

说谎的统计.png
回复

使用道具 举报

 楼主| 发表于 2017-7-7 09:47 | 显示全部楼层
ICBC 发表于 2017-7-7 09:17
连续剧模式已经开启,慢慢看

两点感触:

行家啊~
刷知乎上的帖子很有感悟,所以引申过来了

顺便转发另一个经典统计学结论

1.哥斯达黎加是世界杯史上为数不多能够战胜中国队的国家
2.即使是巴西队这样的世界强队也仅战胜过中国队一次
3.自2002年韩日世界杯后,中国队在世界杯正赛上不败纪录已经延续12年
4.纵观漫长的世界杯史,中国队也仅输过三次
5.中国队从未在世界杯点球大战中失利过
6.中国队在领先的情况下从未丢过球
7.还没有任何一直亚洲球队能够在世界杯上战胜中国队
8.世界杯神奇定律 历史上跟中国同组的球队除了一支以外不是冠军就是季军
9.自1930年至今,中国队在近一个世纪的世界杯历史中仅输过三场 让人肃然起敬
10.自12年前土耳其爆冷战胜中国队后,他们至今都没有机会与东方红魔交手
11.没有一支球队能够在世界杯上击败中国队两次以上
12.面对欧洲诸强:德西荷法英意葡等 中国队至今保持不败金身
13.世界杯淘汰赛的点球大战中 中国队完成恐怖的零失球
14.中国队在世界杯上的丢球数远少于足球之国巴西和以防守见长的意大利
15.中国队在世界杯正赛阶段的不失球记录已延续12年
16.在世界杯史上没有任何一支球队能将中国队拖入加时赛
17.没有任何一支非洲球队能在世界杯上战胜中国队,哪怕是逼平
18. 除了足球王国巴西队,世界上还没有另外一支球队敢跟中国队一样在球衣上印上五颗星。
19.强如C罗梅西里贝里这样的超级巨星也从未在世界杯上攻破过中国队的大门 世界杯历史第一射手克洛泽也没能对中国队取得进球
20.整个美洲也仅有巴西与哥斯达黎加在世界杯上战胜过中国 阿根廷 厄瓜多尔 智利 墨西哥 美国等美洲强队都未能击败中国
21.邵佳一是唯一一位在世界杯上获得红牌的中国球员
22.至今没有任何一位球员在世界杯上两次攻破中国队大门
23.中国神锋郜林在世界杯入球跟伊布一样多
24.纵观中国足球未来10年的规划 世界诸强想在世界杯上击败中国队也毫无可能
25.中国与巴西意大利豪夺9次世界杯 几乎占到总数一半
26.世界杯史上没有任何一支球队在打平就能出线的情况下逼平过中国队
27.世界杯史上共产生八支冠军球队 仅巴西层战胜过中国队
28.世界杯史上对阵中国队的球队仅三支保持零失球
29.中国队在世界杯上仅小组赛品尝过输球的滋味
30.世界足球联合统计协会最新报告世界杯史上丢球最少的球队 中国队榜上有名
31.南非世界杯冠军西班牙因在世界杯上对中国队零进球而被认为实力不如韩日世界杯冠军巴西队
回复

使用道具 举报

发表于 2017-7-7 11:02 | 显示全部楼层
御剑迎风 发表于 2017-7-7 09:47
行家啊~
刷知乎上的帖子很有感悟,所以引申过来了

哈哈哈,看到老师的帖子,忽然想起知乎上关于中国足球的神话,搜了一下,找到一张图,顺手贴出来,给严肃的学术讨论增加一点诙谐的气氛吧。

对我而言,统计学和医学一样深不可测。

继续围观大神级老师的连续剧
回复

使用道具 举报

 楼主| 发表于 2017-7-12 08:55 | 显示全部楼层
本帖最后由 御剑迎风 于 2017-7-12 10:41 编辑

为什么会出现辛普森悖论?

用文绉绉的话说,这是由于混合样本中可能包含着类型完全不同的个体,因此,全样本的分析并不能代表其中每类个体的特征,特别是当个体间在被解释变量上存在巨大差异以及不同个体的样本总数存在巨大差异的时候,辛普森悖论就更会产生。


用更简单的话概述:样本代表性有差异,不能直接比较!要尽可能的把差异先分层,再进行分析

流行病学中,通常将这种现象称为“混杂因素”,正是这一个因素的存在,使得原本的结果发生了扭曲,即真相被掩盖了。

例1中,新旧疗法对成人治愈率均为
50%,对儿童治愈率均为10%,这是一个比较稳定的频率。因此,选取成人和儿童人数相同情况下(即标准化后),新疗法和旧疗法的治疗效果是没有差异的,证明过程略。

同样方法用于例2。单看
总体治愈率,B手术是高于A手术的,但实际上A手术和B手术选取的患者是不均衡的。均衡的情况下,A的均是高于B的,总体也是A高于B。

评分

参与人数 1威望 +3 金币 +4 收起 理由
心怀感恩 + 3 + 4 很给力!

查看全部评分

回复

使用道具 举报

 楼主| 发表于 2017-7-12 10:13 | 显示全部楼层
本帖最后由 御剑迎风 于 2017-7-12 10:34 编辑

有关“辛普森悖论”的一些启示

量与质是不等价的,无奈的是量比质来得容易量测,所以人们总是习惯用量来评定好坏,而此数据却不是重要的。

关键变量,特别是直接影响被解释变量的变量(关系到研究的质量),一定要对其进行细分,然后才能得到正确的结论!否则结论往往可能是错的!

所以国内外高质量研究论文,对于入选对象的选择有着极为苛刻的要求。这些研究在频数匹配之外,还要对各种因素(如是性别、年龄、基础疾病、生活方式等因素)进行分层分析,并通过logistic回归分析调整这些因素的影响,进而做出有价值的判断。
回复

使用道具 举报

发表于 2017-7-14 09:20 | 显示全部楼层
御剑迎风 发表于 2017-7-12 10:13
有关“辛普森悖论”的一些启示

量与质是不等价的,无奈的是量比质来得容易量测,所以人们总是习惯用量来 ...

想要发表SCI文章,就不再是只要随便抓起一把数据写写写就算大功告成啦
回复

使用道具 举报

发表于 2017-7-21 15:24 | 显示全部楼层
比较两组数据有无统计学差异的前提必须是两组数据来源于同一总体,两组数据的构成需一致,这就是为什么需要先对数据进行同质性检验以及正态性检验了。我的专业是流行病与卫生统计学,欢迎大家共同学习!

评分

参与人数 1威望 +1 金币 +2 收起 理由
御剑迎风 + 1 + 2 赞一个!

查看全部评分

回复

使用道具 举报

发表于 2017-7-21 15:33 | 显示全部楼层
御剑迎风 发表于 2017-7-12 08:55
为什么会出现辛普森悖论?
用文绉绉的话说,这是由于混合样本中可能包含着类型完全不同的个体,因此,全样 ...

直白一点的讲就是,这两组人群本身就没有可比性,再进行疗效的比较就已经没有意义了。应该先对两组人群的一般人口学资料进行卡方检验或者单因素分析,在没有统计学差异的情况下才可以进行下一步的比较了
回复

使用道具 举报

 楼主| 发表于 2017-7-21 15:34 | 显示全部楼层
18235799740 发表于 2017-7-21 15:24
比较两组数据有无统计学差异的前提必须是两组数据来源于同一总体,两组数据的构成需一致,这就是为什么需要 ...

谢谢大咖的点评。
您讲的是经典统计学结论,但是很多老师还是不懂为什么会造成这样的现象,也很少先进行正态性检验和同质性检验,所以这个帖子的目的是告诉大家别乱用统计方法
回复

使用道具 举报

发表于 2017-7-21 16:32 | 显示全部楼层
御剑迎风 发表于 2017-7-21 15:34
谢谢大咖的点评。
您讲的是经典统计学结论,但是很多老师还是不懂为什么会造成这样的现象,也很少先进行 ...

谢谢版主
我觉得一般出现这种现象的原因主要还是在研究设计,研究对象的纳入与排除标准以及研究对象的随机分组上,现在大家搞科研发论文,大部分时间都在纠结选用什么统计学方法。我个人觉得,统计学就是一种工具,需要的时候拿来用就可以,最重要的还是根据研究目的,严格按照流行病学思维进行设计,就算最后不用任何统计学方法,也可以出很好的科研成果。
回复

使用道具 举报

 楼主| 发表于 2017-7-21 16:41 | 显示全部楼层
18235799740 发表于 2017-7-21 16:32
谢谢版主
我觉得一般出现这种现象的原因主要还是在研究设计,研究对象的纳入与排除标准以及研究对象的随 ...

理论都是很好的,但实际执行起来很难断定的。
比如,性别居然录取率有影响?一般人怎么也想不透的。
不进行分层分析,其实我们自己也很难发现性别居然影响这么大
所以好的文章对病人的基础信息尤为关注
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册 |

本版积分规则

快速回复 返回顶部 返回列表