马上注册登录,享用更多感控资源,助你轻松入门。
您需要 登录 才可以下载或查看,没有账号?注册
|
×
饱受争议的P值近十多年来,科学领域普遍使用P值作为统计检验的指标。但是随着越来越多研究出现的可重复性危机,P值的误解和误用成为一个非常严肃的问题。
很多研究者想尽一切办法让P值达到可发表的标准。这种做法导致了一个奇怪的现象:如果我们把已发表研究中的P值分布画出来,会发现 P值分布在0.05附近出现了一个峰值,表明在已发表的研究中,P值在0.05附近非常多。
2015年,Science上发表了200多个心理学研究者共同完成一项重复实验,他们试图重复100项研究,发现大约39%的能够成功重复出原来的结果。P值<0.05对于产生不可重复的研究,也有很大的影响:对2015年大规模重复实验的分析表明,P值与能够成功重复之间的关系也非常有趣:P值在0.04以上和0.05以下的研究中,被重复出来的最少。
除了研究者使用各种不太符合研究规范的做法来强行使结果中的P<.05,对于P值的常见批评还包括:
在某些领域中,会将P值的阈值设置的非常低来避免错误的结果。还一些科学家放弃了P值,使用贝叶斯定理等其他更复杂的统计学工具。
改变统计显著性的定义并不能解决真正的问题,因为真正的问题可能是科研机构的评价标准。目前的现况是:必须有一定的发表量才能获得工作,成功发表论文需要统计显著的结果。但是在很长一段时间之内,各类科研机构和科学期刊都很难改变现在的做法。这不仅是一个统计问题,也是体制的问题。 [url=]来源:3M感控学院[/url]
|