柳叶刀：医学论文中统计报告的建议

2024/3/4 9:43:44　阅读：92　发布者：

2024年2月17日，《Lancet》发布了一篇通信类文章（Correspondence），基于对近三年投稿到《Lancet》的1000多份文章的审查，总结了常见的统计误区，并为如何避免这些错误提供了指导。

原文链接：

https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(24)00139-9/fulltext

准确报告统计数据的基本建议总结

使用均值和标准差（SD）（或中位数和四分位间距[IQR]）描述定量数据的分布情况；在补充材料中提供直方图或表格。

不要简单写P值小于或大于0.05（或0.01），要报告精确的P值（例如，P值为0.032，应写P=0.032，而不是P<0.05）；但对于极小的P值，可以报告为P<0.0001。

不要简单将结果描述为没有效果，除非区间估计的所有效应值均没有临床意义。

应基于临床重要性来解释结果。

根据背景信息（如因果有向无环图[DAG]所示）识别混杂因素，而不是显著性检验。

缺失数据的占比过高，可能会影响结果，不要简单删除不完整数据，可使用逆概率加权或多重插补等方法。

应使用专用的方法评估和处理稀疏数据偏倚（sparse-data bias）。

如果结局发生率较高，应报告危险比（risk ratio，RR）或危险差（risk difference，RD），而不是比值比（odds ratio，OR）

即使采用了相乘模型，也要评估相加交互作用。

描述性统计对于读者了解数据情况至关重要。均值和标准差常用于描述定量变量，对于高偏态的变量（如典型的环境暴露变量），应描述中位数和四分位间距。对于仅有正数的变量，如果均值/标准差<2，提示严重偏态[1]。完整的统计描述还需要给出连续性变量的直方图、分类变量的计数表、以及缺失数据的百分比，由于这部分内容较多，可在补充材料中给出。

所有的统计分析都基于基本假设，例如治疗分配的随机性；而统计模型的有效性取决于需要评估的进一步假设，仅有统计学检验是不够的，还需要图形。多数回归模型的重要假设是定量数据一定范围内呈线性，应使用分数多项式或回归样条等方法进行估计。

统计学推断主要基于参数估计和假设检验。P值可以提供关于统计假设或模型相容性的有用信息，应精确报告P值，不应简单定性报告（即显著/不显著），即不要将P值简单报告为大于或小于0.05或0.01。要注意，P值大不应简单解释为无关联或无影响，缺乏证据不代表不存在[2]。除非区间估计接近零值，且区间非常窄，才可以推断为研究没有发现重要的关联或影响。一般情况下，还应根据合适指标的区间估计（如均数差或危险差）来判断结果的临床重要性。

许多研究问题涉及因果关联，调整混杂因素至关重要。应根据背景因果信息（如因果有向无环图所示）来选择混杂因素[3, 4]。检验显著性的统计方法（如逐步选择法）可能会遗漏重要的混杂因素，产生较大的误导性[5, 6, 7]。

数据缺失普遍存在，如果缺失数据的比例较高（>5%），应避免使用简单的缺失数据处理方法（如完整个案分析、末次观测值结转法），这些方法可能产生较大偏倚。更好的方法包括逆概率加权和多重插补，但这些方法也依赖于缺失是随机缺失[8, 9]。

Logistic回归或Cox回归一个重要的偏倚来源是稀疏数据，即变量的某些水平组合中的事件发生数较少。OR较大和置信区间较宽（例如，OR>10，区间为2-50）提示存在数据稀疏偏倚，可以通过惩罚函数或贝叶斯方法减少偏倚[10, 11]。当因变量是一个常见结局的指标时，调整后的危险比（RR）在评估临床相关性方面优于OR，因前者更容易合理解释。在队列研究和随机对照试验中可使用改良的泊松回归或标准化回归系数来估计危险比（RR）和危险差（RD）[12, 13]。

许多研究试图调查两种治疗方法的相互作用对结局的影响，或者想要估计一种治疗方法被另一种方法调整的程度（即effect-measure modification）。研究者常在回归模型（如logistic或Cox）中加入乘积项，但相加交互作用与临床决策和公共健康的相关性更大，也应该进行评估[14]。

转自医咖会微信公众号，仅作学习交流，如有侵权，请联系本站删除！

上一篇： 作为非英语母语人士，我是如何学会的研究论文撰写
下一篇： 文章写完了，如何选择合适的期刊/杂志投稿？做好这6步，论文分分钟被发表！

投稿问答最小化 关闭

柳叶刀：医学论文中统计报告的建议

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化 关闭

柳叶刀：医学论文中统计报告的建议

本文评论

暂无相应记录！

期刊论文热门文章

本站推荐

最近更新

投稿问答最小化关闭