分享|从Simpson悖论看常犯的医学统计错误

2023/7/10 15:45:32　阅读：129　发布者：

无论是从前还是现在以及遥远的未来，统计学对临床医务工作者来说都是一个难以跳过去的坎，因此在其发表的医学论文中出现统计学错误也是常事。

小编以“统计方法错误”为关键词分别从中英文数据库中检验相应文献中，最早的文献均出现在上世纪90年代，最近的文献就在几年前，而且相关文献的数量也非常之多。即使Nature和JAMA高影响因子期刊上的医学论文也会出现统计方法的误用。

小编今天将从经典的Simpson悖论来开启统计学方法错误介绍的大门，后续将分系列文章详述各种错误及应对策略。

Simpson悖论的背景资料

假设有一组吸烟与肺癌关系的调查研究数据，对其进行统计分析时，若考虑的影响因素的个数不同，将会得到自相矛盾的结论。

具体地说，在这个调查研究数据中，总调查人数400人，若按是否吸烟划分，其中吸烟者200人、不吸烟者200人；若按年龄划分，其中小于等于40岁的225人，大于40岁的175人。设P1代表吸烟者患肺癌率、P2代表不吸烟者患肺癌率。

原作者分析策略和结果如下：

分析策略1：若仅考察吸烟与不吸烟者患肺癌率之间的差别时，发现吸烟者似乎更不易于患肺癌；

分析策略2：若分别在男性组与女性组中考察吸烟与不吸烟者患肺癌之间的差别时，发现吸烟者更容易患肺癌；

分析策略3：若先将调查资料按受试者年龄分为“小于等于40岁组”和“大于40岁组”，再对每个年龄组内采用上述分析策略2进行计算，得出结论为：吸烟者似乎更不易患肺癌。

问题：为什么三种策略得到的结果前后矛盾？哪一种分析策略结果正确？分析错误的原因是什么？

实际上，上述三种分析策略均是错误的，得出的结论均不可信，而且这种错误是很难弥补的，因为在设计上就存在重大缺陷。

一、下面我们将对上述分析策略具体运算过程进行详述：

分析策略1具体运算步骤：

若仅考虑吸烟与不吸烟者患肺癌率之间的差别，计算结果如表1所示，吸烟组患病率为40%，小于不吸烟组患病率50%，因此得出吸烟者似乎更不易于患肺癌的结论。

分析策略2具体运算步骤：

若将性别设立亚组，分别在男性和女性亚组中考虑吸烟与否与患肺癌之间的关系，计算结果详见表2，由于在各亚组中吸烟组患病率均大于不吸烟组，因此得出吸烟者似乎更容易患肺癌的结论。

分析策略3具体运算步骤：

先将调查资料按受试者年龄分“小于等于40岁年龄组”和“大于40 年龄组”，再在每个年龄组内，按策略2的步骤进行分析，计算结果详见表3。

不难发现在分层后的各亚组中吸烟组的患病率均小于不吸烟组，因此得出吸烟者似乎更不易患肺癌。

二、上述分析策略错误的原因

1. 分析策略1中，只考虑一个因素“吸烟与否”对是否患肺癌的影响，并不能保证“性别构成”和“年龄构成”因素在吸烟组和不吸烟组之间是均衡的。若吸烟组和不吸烟组之受到来自性别和年龄的影响相差悬殊，其结果就不能单纯由“吸烟与否”来解释，因此，据此得出的结论是不可信的。

2. 分析策略2中，表面上考察了“吸烟与否”和“性别”两个因素对是否患肺癌的影响，但是从本质上看，只是将性别简单分层后，来考察“吸烟与否”对是否患肺癌的影响。没有考虑“年龄构成”混杂因素对结果的干扰，若“年龄构成”因素在吸烟组和不吸烟组之间不均衡，则得出的结论很可能是不真实的，因此，据此得出的结论是不可信的。

3. 分析策略3中，表面上考察了“吸烟与否”、“性别”和“年龄”三个因素对是否患肺癌的影响，但是从本质上看，只是按“性别”和“年龄”因素水平组合简单分成四层后，来考察“吸烟与否”对是否患肺癌的影响。若各层中样本含量很小，样本的代表性很差，则得出的结论很可能是不真实的。事实上，由表3可知，有两组数据是有严重问题的，在小于等于40岁的男性吸烟组和女性不吸烟组样本量仅为10，而且竟然都有5人患了肺癌，在如此小的样本中竟有如此高的患肺癌率，这说明上述调查资料数据存在严重的抽样设计误差，即样本的代表性极差，某些层中样本量过小，调查结果存在严重偏倚，因此，据此得出的结论是不可信的。

三、正确做法

正确做法：

在试验一开始应该将患肺癌的主要影响因素进行分层随机抽样，本例中主要影响因素为“吸烟与否”、“性别”和“年龄”三个因素。

各层的样本量例数应该事先在设计阶段根据样本量计算公式计算分配好，以保证各层有足够的样本量，并确保样本具有很好的代表性。

对受多因素影响的调查资料，应该采用相应的多因素和多元统计分析方法（如多因素logistic回归等）进行处理，并结合专业知识和统计学知识进行合理的解释，方可得出正确的结论。

最好根据获得的结果，开展大规模的前瞻性调查研究，对已获得的初步结论进行验证，从而得出更科学的结论。

申明：

本文主要摘自于胡良平教授发表的《影响我国科研成果和学术论文质量的要因分析》一文。

参考文献：

[1] 胡良平，张天明. 影响我国科研成果和学术论文质量的要因分析[J]. 科学观察. 2006, 001(004): 9-19.

[2] Simpson EH. The interpretation of interaction in contingency table. J. Roy. Statist. Soc. B, 1951, 13:238-241.

来源: 统计联盟

转自：“斐然智达SCI学术服务”微信公众号

如有侵权，请联系本站删除！

上一篇： 干货|R语言: 临床试验设计、检测、分析专题
下一篇： 总结|临床医生论文中最常犯的 5 个统计学错误

投稿问答最小化 关闭

分享|从Simpson悖论看常犯的医学统计错误

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化 关闭

分享|从Simpson悖论看常犯的医学统计错误

本文评论

暂无相应记录！

学界研圈热门文章

本站推荐

最近更新

投稿问答最小化关闭