盘点论文中常见的统计错误

2024/10/14 15:40:12　阅读：202　发布者：

统计学显著性和P值

只有P值，没有效应值

一些作者常在论文只给出p值而不给出效应值（如OR、RR）。如果是为了减少字数，在效应值和p值之间进行选择时，建议选择省略p值。效应值代表效应的大小，例如，患者风险降低了多少，在研究中具有显而易见的重要性。

使用近似的p值

一些作者可能会以近似值的形式陈述p值，通常使用不等式，例如p<0.05。这是在计算机和统计软件普及之前遗留下来的，当时需要在表格或教科书中查找统计量，通常无法获得准确的 p 值。现在软件可以给出P值的精确值，如果有精确值，就没有理由使用近似值。

一个例外是p值非常小，甚至计算机软件都可能无法准确计算p值。对于这些非常小的p值，不要报告为“0.0000”。p值不能是0（也不会是1）。某些软件可能会由于四舍五入而输出这样的值，这意味着p小于某个值，通常是 0.001 或0.0001，就能表示诸如为“P< 0.001”。

“table 1”的P值

论文的“table 1”通常是显示不同研究人群的人口统计学和临床特征，我们也常能看到一些论文会放上p值，但这里的P值作用很小。在随机对照试验的情况下，p值可以证明随机化的“有效”，但由于是对多个变量进行比较，可能会偶然出现P<0.05的情况。但这改变了这是一项随机试验的本质，这些值也不应改变预先制定的分析计划，因此只需忽略p值。

在观察性研究中，比p值更重要的是组间差异的大小，或者作者对于预测因子临床重要性的看法。在table 1中给出p值会导致作者倾向于让这些p值来指导分析方法，例如，使用p值作为构建回归模型的筛选策略，但这不是正确的方法。

统计方法的表述问题

缺乏关于高级或新统计方法的细节

当使用一种新的医疗技术（例如新药或新手术）时，作者需要详细描述；对于非常常见的技术，不需要这样做。统计方法也是如此。通常，使用相对较新或不常见的统计方法时，作者可以引用使用了该方法的论文，引用描述该方法的论文要更好。此外，不要引用无法访问、不正确或反对使用该方法的论文。

对所用软件的描述不明确

就像作者应该告诉读者所使用的药物是哪家公司生产的一样，也应该告诉读者使用了什么统计软件，而且要足够详细，以便大家可以去找到。不要简单写“R”，而应该是“R V.3.12”。另外，不要把前端和软件混为一谈，例如，RStudio是编辑器，而R是统计软件。此外，除了所使用的基础软件包外，还需要引用用户贡献的或专门用于特定统计方法的附加软件包。

缺乏有关如何处理缺失数据的详细信息

缺失数据随处可见，例如研究对象拒绝回答问题，或者退出，或者数据丢失，或者其他什么原因，要告诉读者你是如何处理这个问题的。常见的方法是多重插补，这种方法尚未得到充分利用，但在现代统计软件中越来越简单易用。

结果的表述问题

小数位数使用不当

如果研究的样本量为105，不要说样本中有55.238%是女性。同样，如果测量了年龄（以岁为单位），不要说平均年龄是34.561。经验法则是任何一个理性的人都会认为足够的精确度，然后再加一个数字，例如，对于以岁为单位的平均年龄，精确到1岁以内几乎肯定足够，因此可以报告1位小数：34.6 岁。对于女性百分比，则可以报告55.2%。

因果关联的表述

谨慎使用因果的字眼，只有某些形式的研究设计和研究方法才能归因于因果关联。避免从观察性研究中得出笼统的结论。观察性研究可能表明父母教育水平与儿童营养不良之间存在关联，但这并不意味着提高父母教育水平就能消除儿童营养不良。当作者犯下这个基本错误时，编辑通常会拒绝将论文送去同行评审。

转自量化研究方法微信公众号，仅作学习交流，如有侵权，请联系本站删除！

上一篇： SCI论文配图规范化技巧
下一篇： 本硕毕业写论文多大的创新点才算创新

投稿问答最小化 关闭

盘点论文中常见的统计错误

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化 关闭

盘点论文中常见的统计错误

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化关闭