你真的会用P值吗?| 热点论文建议这样做
2022/11/16 17:59:09 阅读:174 发布者:
在科学报告中,常规的零假设显著性检验意义检验P值<0.05即为显著,这被视为报告科学发现的标准方式。但将P值以0.05为是否显著的分界线并不正确,论文:Rewriting results sections in the language of evidence 批评这种P值的二元决策,小编将结合作者观点对P值的使用问题进行讨论。
实际上,P值争论由来已久
《Nature》杂志发表过一篇题为《scientists rise up against statistical significance》的文章,旨在号召科研工作者放弃“统计显著性”。
Halsey 等在 Nature Methods 发表的文章也讨论到:“人们在使用 p 值时往往没有意识到,在大多数情况下,一个研究的统计功效太低以至于 p 值无益余数据解释。研究人员如果放弃用 p 值而使用替代的统计方法来解释数据会做的更好。”
P值的误用
作者认为P值得定义并不是问题所在,问题在于在零假设显著性检验中使用P值的二元决策方式(即显著或者不显著、有影响或者无影响)一小部分文献回顾表明,目前在生态学和进化方面的许多研究仍然无视警告,并且经常依赖基于P值的二元决策来报告统计意义。
2002年Haller和Krauss在心理学研究者和学生中做了一项关于P值意义的调查,作者给出了6个判断题(常见的关于P值的错误解读),让参与者进行正误判断,结果发现44个学生(100%)均无法完全判断正确;即使是教授方法学的导师,也有80%不能全部判断正确。这说明很多研究者其实并不完全理解他们所使用的研究工具!
举个例子,有文章因为P>0.05就草率地得出两组心衰患者6分钟步行距离无差别的可笑结论(一组均数443.85m,另一组均数377.91m)。为什么说可笑,因为对于心衰患者来说,66米的差异尽管没有越过所谓的P<0.05的“统计学显著性”门槛。
2016年,美国统计协会(ASA)曾针对这些误用发表了共识(表1)
表1. ASA关于P值的主要声明要点
此论文建议取消大多数科学论文中的二元决策,将P值分成多个类别,并给出对应的证据强弱。
作者认为最简单和最实际的措施之一是用更渐进的证据概念取代关于二元决策的措辞,以更好地反映数据所提供的实际信息。建议将P值视为实际值,即统计证据的连续计量,科学论文的结果部分不应报告二元的是/否测试结果,而应报告确切的P值,并将某一发现或效果解释为“没有/弱/中等/强/很强的证据”,这取决于实际P值的大致范围,如下表所示:
同时作者给出了相关的结论范例:
小编认为除了作者着重强调的P值的使用中“二元决策”这种错误用法,P值也有很多被误用的情况,建议若在进行研究中使用零假设显著性检验,首先要深刻了解零假设检验原理,跨入相应的“统计学显著性”门槛。
同时需要谨记统计意义≠科学重要性,因为即使正确理解和使用P值,也不意味着结论的科学性,毕竟P值本身也备受争议,但若没有行之有效的替代方法,P值仍然是最常用的统计指标之一,所以在此之前,请使用P值慎之又慎!
转自:“社科学术汇”微信公众号
如有侵权,请联系本站删除!