饱受争议的P值
饱受争议的P值近十多年来,科学领域普遍使用P值作为统计检验的指标。但是随着越来越多研究出现的可重复性危机,P值的误解和误用成为一个非常严肃的问题。很多研究者想尽一切办法让P值达到可发表的标准。这种做法导致了一个奇怪的现象:如果我们把已发表研究中的P值分布画出来,会发现 P值分布在0.05附近出现了一个峰值,表明在已发表的研究中,P值在0.05附近非常多。
2015年,Science上发表了200多个心理学研究者共同完成一项重复实验,他们试图重复100项研究,发现大约39%的能够成功重复出原来的结果。P值<0.05对于产生不可重复的研究,也有很大的影响:对2015年大规模重复实验的分析表明,P值与能够成功重复之间的关系也非常有趣:P值在0.04以上和0.05以下的研究中,被重复出来的最少。
除了研究者使用各种不太符合研究规范的做法来强行使结果中的P<.05,对于P值的常见批评还包括:
[*]P值提供不了我们想要的信息。我们希望知道研究数据是否符合我们的假设,然而P值告诉我们的却是当虚无假设成立,效应不存在时,得到研究结果的概率。
[*]P值的大小反应不出效应的大小。
[*]P值对于样本量太敏感,如果样本足够大,那么即使是很微弱的效应,也能达到显著。
在某些领域中,会将P值的阈值设置的非常低来避免错误的结果。还一些科学家放弃了P值,使用贝叶斯定理等其他更复杂的统计学工具。
改变统计显著性的定义并不能解决真正的问题,因为真正的问题可能是科研机构的评价标准。目前的现况是:必须有一定的发表量才能获得工作,成功发表论文需要统计显著的结果。但是在很长一段时间之内,各类科研机构和科学期刊都很难改变现在的做法。这不仅是一个统计问题,也是体制的问题。来源:3M感控学院
学习了,{:1_12:}{:1_12:}{:1_12:}{:1_12:} 受教了,有些深奥{:1_17:}需要深入学习 p值应该是“观察员”,而不应该是“审判官”
不是说P<0.05就审判为真,反之则是假
而是说只有当P<0.05时,结果才值得看,或者说能观测到
学习,谢谢分享给大家。 也是体制的问题?学习了 路过这里学习了老师的资料分享! 学习了,感谢老师分享 要有数理统计的知识才能更好的帮助我们理解 学习了,谢谢老师分享给大。 一切都要与时俱进!!!
谢谢老师分享!!! P值的误解和误用成为一个非常严肃的问题,不断变化的问题
页:
[1]