投稿问答最小化  关闭

如何不用软件计算研究的样本量?

2023/2/24 13:48:59  阅读:99 发布者:

样本量估算是研究设计中非常重要的一部分,也是很多人觉得困难的地方。因为样本量估算总是需要我们提前预知结局发生的数据,但是就是因为不知道结局的发生数据,才需要估算样本量呀,这就像一个鸡生蛋的故事。

不过这个问题不是我们今天的重点,我们先看看样本量计算最常用的2种方法:

1.假设检验法:它是基于一个严格的统计学假设来进行计算,例如比较两个均值的差异或比较一个样本的均值与一个已知的标准值,根据一类错误。二类错误的统计学概念,来进行科学的样本量计算。常见的假设检验包括t检验,F检验和卡方检验等。

我们常说的使用PASS软件计算样本量就是这种方法。这种方法的优点是准确性高,但缺点是需要对假设检验的原理和统计学方法有一定的理解。同时需要我们有一定的先验知识,比如每个组别的均数标准差等等,需要有非常相似的研究数据作为支撑。

2.经验公式法:经验公式法是一种简单的样本量估计方法,主要是根据经验毛估估的算出一个样本量的范围,不具有针对性,但是对于项目初期评估样本量的大致区间很有用。

当然,这种方法的优点是简单易用,但缺点是可能过于简化了问题,导致估计结果不够准确。

今天我们主要介绍的就是第二种经验公式法。在这种方法中,我们最推荐的则是EPVevents per variable)方法。

什么是EPV方法

EPVevents per variable)指的是每个自变量对应的事件(比如死亡、复发等)的最小样本量。我们举一个例子方便大家理解:

假设有一项心梗患者的研究,按照既往经验,每100例突发心梗患者,术后有30例会发生死亡。如果预判最后的Logistics方程需要纳入6个变量,这个时候我们按照EPV方法来推算样本量。

先按照EPV最经常取值是10,也就是每个变量需要消耗10个事件。6个变量共计需要消耗60个事件(也就是上面例子中的死亡)。因此,一共需要60例死亡患者的数据,按照30%的事件发生比例,共需要200例患者。

换句话说,EPV是通过后期回归方程所需样本量的消耗,来推算出一共需要多少事件,反而推算出来总体的样本量。如果EPV过低,即每个自变量所对应的事件样本数量过少,回归分析的结果可能不可靠或不准确。

EPV方法在SCI中认可吗

虽然EPV是一种经验法,但是根据这个专有名词大家就能推断,它是受到SCI文章认可的。我们用 number of events per variable 作为关键词在pubmed.pro中检索,可以看到有很多SCI文章中包含这句话,说明这些文章也使用了EPV的方法进行样本量的估算。

比如这篇2021年发表在GutIF=31.7分)期刊的文章 Prediction model of bleeding after endoscopic submucosal dissection for early gastric cancer: BEST- J score。在样本量估算中,就提到了按照EPV=10来进行估算。方程中包含了23项变量,因此共需要230个事件,按照5%的发生率,共需要纳入4510例患者。

IF30多分的大牛期刊都认可了,大家也就不用担心啦。正如Gut这篇文章所写,大家在使用这种方法的时候可以引用EPV方法的原始文献:

Wynants L, Bouwmeester W, Moons KGM, et al. A simulation study of sample size demonstrated the importance of the number of events per variable to develop prediction models in clustered data. J Clin Epidemiol 2015;68:140614.

EPV一般取值多少

根据既往的文献,绝大部分文献EPV都等于10。所以大家也就采用EPV=10就可以了。

EPV适用范围

根据前面提到的EPV方法原理就知道,它是根据事件的发生数量进行估算,因此适用的模型也需要有二元性质,也就是结局是01类型。

因此EPV通常用于Logistic回归或生存分析等二分类或时间到事件的模型中,因为这些模型通常具有事件发生的二元性质,需要根据事件发生的样本数量来确定需要多少样本才能得到可靠的估计结果。

对于其他类型的模型,如线性回归或ANOVA等,EPV法通常不适用,因为这些模型不涉及到事件发生的二元分类问题。在这种情况下,通常需要使用其他方法来计算样本量,例如基于效应大小或差异、置信水平和统计功效的方法。

转自:“易侕科研”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com