投稿问答最小化  关闭

万维书刊APP下载

盘点论文中常见的统计错误

2024/10/14 15:40:12  阅读:25 发布者:

统计学显著性和P

只有P值,没有效应值

一些作者常在论文只给出p值而不给出效应值(如ORRR)。如果是为了减少字数,在效应值和p值之间进行选择时,建议选择省略p值。效应值代表效应的大小,例如,患者风险降低了多少,在研究中具有显而易见的重要性。

使用近似的p

一些作者可能会以近似值的形式陈述p值,通常使用不等式,例如p<0.05。这是在计算机和统计软件普及之前遗留下来的,当时需要在表格或教科书中查找统计量,通常无法获得准确的 p 值。现在软件可以给出P值的精确值,如果有精确值,就没有理由使用近似值。

一个例外是p值非常小,甚至计算机软件都可能无法准确计算p值。对于这些非常小的p值,不要报告为“0.0000”。p值不能是0(也不会是1)。某些软件可能会由于四舍五入而输出这样的值,这意味着p小于某个值,通常是 0.001 0.0001,就能表示诸如为“P< 0.001”。

table 1”的P

论文的table 1”通常是显示不同研究人群的人口统计学和临床特征,我们也常能看到一些论文会放上p值,但这里的P值作用很小。在随机对照试验的情况下,p值可以证明随机化的“有效”,但由于是对多个变量进行比较,可能会偶然出现P<0.05的情况。但这改变了这是一项随机试验的本质,这些值也不应改变预先制定的分析计划,因此只需忽略p值。

在观察性研究中,比p值更重要的是组间差异的大小,或者作者对于预测因子临床重要性的看法。在table 1中给出p值会导致作者倾向于让这些p值来指导分析方法,例如,使用p值作为构建回归模型的筛选策略,但这不是正确的方法。

统计方法的表述问题

缺乏关于高级或新统计方法的细节

当使用一种新的医疗技术(例如新药或新手术)时,作者需要详细描述;对于非常常见的技术,不需要这样做。统计方法也是如此。通常,使用相对较新或不常见的统计方法时,作者可以引用使用了该方法的论文,引用描述该方法的论文要更好。此外,不要引用无法访问、不正确或反对使用该方法的论文。

对所用软件的描述不明确

就像作者应该告诉读者所使用的药物是哪家公司生产的一样,也应该告诉读者使用了什么统计软件,而且要足够详细,以便大家可以去找到。不要简单写R”,而应该是“R V.3.12”。另外,不要把前端和软件混为一谈,例如,RStudio是编辑器,而R是统计软件。此外,除了所使用的基础软件包外,还需要引用用户贡献的或专门用于特定统计方法的附加软件包。

缺乏有关如何处理缺失数据的详细信息

缺失数据随处可见,例如研究对象拒绝回答问题,或者退出,或者数据丢失,或者其他什么原因,要告诉读者你是如何处理这个问题的。常见的方法是多重插补,这种方法尚未得到充分利用,但在现代统计软件中越来越简单易用。

结果的表述问题

小数位数使用不当

如果研究的样本量为105,不要说样本中有55.238%是女性。同样,如果测量了年龄(以岁为单位),不要说平均年龄是34.561。经验法则是任何一个理性的人都会认为足够的精确度,然后再加一个数字,例如,对于以岁为单位的平均年龄,精确到1岁以内几乎肯定足够,因此可以报告1位小数:34.6 岁。对于女性百分比,则可以报告55.2%

因果关联的表述

谨慎使用因果的字眼,只有某些形式的研究设计和研究方法才能归因于因果关联。避免从观察性研究中得出笼统的结论。观察性研究可能表明父母教育水平与儿童营养不良之间存在关联,但这并不意味着提高父母教育水平就能消除儿童营养不良。当作者犯下这个基本错误时,编辑通常会拒绝将论文送去同行评审。

转自量化研究方法微信公众号,仅作学习交流,如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com