生存分析是重要的医学数据分析方法,常应用于预后分析。生存曲线(Kaplan-Meier曲线)是医学论文中常用的表示患者生存情况的图像之一,能够简明地表示生存率与时间的关系,绘制漂亮、专业的生存曲线不仅可以令编辑、读者和审稿专家眼前一亮,同时也能为论文增色不少。近年来,随着研究方法的普及,国内生存分析类医学论文数量也明显增多。
我们在日常审稿和编辑过程中发现生存曲线相关的文、图和表中存在较多错误和疏漏,影响论文的质量和真实性。现对生存曲线的审核要点进行总结,并对常见错误进行解析,以期为作者朋友和编辑同仁们提供帮助。
先来了解几个概念:
1. 事件(Event)指研究中规定的生存研究的终点。一般指患者的死亡,也可以自定义为疾病的复发、产生耐药等等。
2. 生存时间(Survival time)从检测开始到事件发生所经过的时间。
3. 删失(Sensoring)指由于所关心的事件没有被观测到或者无法观测到,以至于生存时间无法记录的情况。常由两种情况导致:(1)失访;(2)在研究终止时,所关心的事件还未发生。
4. 对数秩检测(log-rank test)对数秩检测有时也被称为Mantel-Cox测试,其基本思想为:假定无效假设成立(两总体生存曲线无差别),则根据两种处理不同生存时期的期初观察人数和理论死亡概率计算出的理论死亡数,与实际死亡数应相差不大,否则无效假设不成立,认为两条生存曲线差异有统计学意义。一般P<0.05有统计学意义,即分组条件的不同与生存具有相关性。在Kaplan-Meier生存分析中有三种检验方法:log-rank、breslow、tarone。log-rank法侧重于远期差别,breslow法侧重于近期差别,tarone法介于两者之间。对于一开始靠得很近,随着时间的推移逐渐拉开的生存曲线,log-rank法较breslow法更容易得到显著性的结果;反之,对于一开始拉的很开,以后逐渐靠近的生存曲线,breslow法较log-rank法更容易获得统计学差异。如果log-rank法有显著差异,而breslow没有差异,可以解释为在开始时生存率没有差异,随之时间的推移生存率出现差异,反之亦然。tarone法是一种折中的方法,介于两者之间。
1、生存曲线构成要素
在有随访资料的研究中才能绘制生存曲线,生存曲线构成有两个重要的要素,就是终点事件是否发生以及终点事件发生的时间。生存曲线其实就是通过绘制一个单调向下的折线来展示一群患者随着时间的推移,终点事件发生的情况。在肿瘤临床研究里,这个事件常常是死亡、转移或复发。我们的随访时间或者说发生终点事件的时间,其实是从观察开始到发生了终点事件的时间。也就是说在生存曲线中除了终点事件还隐含了一个起始事件,临床研究中这个起始事件往往是某种干预,比如:服药、手术、化疗等;或者是某个特征时间点,比如:发病、疾病稳定、疾病缓解等。
以随访时间为X、以某状态结局发生概率为Y构建函数,可以是生存函数,也可以是风险函数,结局状态决定了函数性质。Y为生存概率时,对应的曲线为生存曲线;Y为死亡概率时,对应的曲线为风险曲线。由于在观察开始的时候,所有个体都是存活的,所以此时累积生存概率值为1,时间越长,概率越小,所以无论应用哪种函数,生存曲线总是呈下降的走势,风险曲线则是上升的走势。累积生存概率单因素分析最常见的方法是Kaplan-Meier法,多因素分析常基于模型,最常见的就是Cox回归模型。
可以看出来,绘制生存曲线需要确定至少4方面的资料,包括随访信息、终点事件或结局、累积生存概率计算方法、假设检验方法,这些信息与曲线的坐标轴、形态及分析结果的解读关系密切,也是关于生存曲线审核的要点。
2、审核要点
2.1横坐标 生存曲线的横轴为随访时间。随访信息严谨的表述应包括随访方式、随访开始时间和终止时间、随访时间的统计学描述(中位随访时间)。审核时需重点关注横轴的名称、单位和刻度。
【横轴名称】:随访时间,简写为时间。
【横轴单位】:与随访方式有关,单位一般可取“天”、“周”、“月”或“年”。最常见的错误是不标注时间单位。其次是单位与随访方式不相符。比如,如果终点事件发生与否是以影像学检查来判定,由于影像学检查一般不会间隔一天就重复,一般间隔时间以“月”为宜,这种情况下横轴的单位就不宜是“天”。而对于一些长期随访,横轴以“周”或“天”为单位也不现实。
【横轴刻度】:最大值应≤随访开始和终止时间之差,≥下四分位数。
2.2 纵坐标 生存曲线的纵轴为累积生存概率,绘图时通常会简写为“生存概率”或“生存率”,此值本质上是概率(probability)值,许多作者经常错误的将其理解成频率指标(rate)来解读结果。在此也建议医学论文生存曲线纵坐标使用“生存概率”,摒弃“生存率”表述。纵坐标最大值不能大于1或100%。
2.3曲线形态 生存函数(模型)类型、样本量、终点事件均影响曲线的形态。
模型构建的审核可以参见相关文献。
生存曲线形态最常见的错漏是缺少删失数据的显示、删失数据的显示与文字描述不一致。样本量越大,生存曲线越平滑,曲线下标注每组每时的样本量,将会使分析结果更完整,但目前只有极少数医学论文标注样本量。建议医学期刊统计学规范对生存曲线样本量的标注作出要求。
终点事件的定义、取值直接影响曲线形态。常见的疏漏有正文无终点事件定义或定义不明、终点事件不是二分类变量。终点事件取失效值(如死亡)和非失效值(如生存)曲线走势正好相反,应注意图题图注与曲线性质是否一致。常见错误有图题图注为生存曲线,而图形实质为风险曲线。而取非失效值在结果解读上常难以符合逻辑。
终点事件率太小,曲线下降将非常缓慢,有时生存概率甚至降不到80%。此种数据其实不适合进行生存分析,建议更换分析方法。有些终点事件在近、远期随访阶段的事件率差别很大,或两条生存曲线有交叉,此时建议通过landmark分析找出时间节点,在各个时间段内绘制生存曲线,或者更换假设检验方法。
2.4 统计报告 生存曲线的描述一般采用中位生存时间(下、上四分位数)展示。审核时要注意曲线和文表数据是否一致。常见错误为文字叙述的生存概率值与曲线上相应时间点的纵坐标值不一致。生存曲线的假设检验常采用 Log-rank检验,检验统计量为图片值,该方法比较的是不同特征人群的生存过程(生存曲线),而不是比较某个时间点(横坐标)对应的生存概率(纵坐标)。此部分常出现文字描述为两组生存率差异有统计学意义,但这里应理解为两个生存曲线不同。
3、常见问题
3.1 缺少删失病例标注
一般来说,没有删失病例的生存曲线是很少见的,除非所有的入组患者全部存活(即全部删失)或者在随访时间内全部患者都死于所观察的疾病,故有删失病例(用“凸点”表示)的生存曲线更加严谨、可信。但在来稿中存在缺失删失病例的“凸点”或未标注“删失”的情况(图1为已补充“删失”标注),值得注意。
3.2 中位生存时间与生存曲线不对应
生存曲线由X轴(时间)和Y轴(生存率)构成,其中Y轴上50%生存率所对应的X轴上的时间即为各条曲线的中位生存时间(图2中A、B点对应a、b组的中位生存时间)。但在编校过程中存在中位生存时间与生存曲线不对应的情况,撰稿过程中应仔细核对。
3.3 随访时间与生存曲线最末一点不对应
生存曲线依据生存时间绘制,医学论文中往往报道了随访时间,且一般情况下最长生存时间≤随访时间。因此,若生存曲线中的生存时间长于论文中的随访时间,则数据就存在较大的问题,需要核查。
3.4 生存曲线横坐标为“0”时生存率不是“100%”
研究开始时,入组的患者应该全部是存活的,所以对应的生存率应该是100%,而图3中SKP2(+)组在研究开始生存率为95%,明显有误,应进行修改。
4、案例分析
某研究收集2015年1月1日到2017年9月30日收治的乳腺癌106例,手术治疗,术前采集静脉血测定Th17细胞比例,术后定期门诊复查、电话随访至2020年8月31日,随访中位时间49(36~69)个月。记录随访期间患者生存情况。生存时间指手术日至死于乳腺癌或随访截止时间。Kaplan-Meier法分析不同Th17表达水平的乳腺癌患者的生存率,Log-rank检验生存率的差异。随访期间失访12例,死亡49例,生存曲线见图1。结果的统计报告文字描述为“不同Th17细胞比例乳腺癌患者的3 年生存率无统计学差异(40.82% vs. 56.82%,图片=1.585,P=0.208)”。
该文存在如下问题。
①由于病例最早入组时间为2015年1月 1日,随访截止日期为2020年8月31日,因此理论上横轴最大值为68个月。正文叙述随访中位时间为49(36~69)个月,依据叙述无法判断69是极值还是四分位数,但无论是极值还是四分位数,69均大于68。图中横坐标最大刻度为40个月,而曲线截止于38个月附近,均小于68。图形、统计描述均与所述事实不符。
②纵坐标应为生存概率,而不是某个时间点(3年)的存活率。
③随访期间失访12例,死亡49例。实线上显示清晰的删失只有两例,虚线上没有删失数据的显示。文内没有明确说明终点事件定义,只是叙述为“记录随访期间患者生存情况”,据此可以确定终点事件变量的取值不是死亡(失效值),不符合逻辑。
④ “不同Th17细胞比例乳腺癌患者的3 年生存率无统计学差异(40.82% vs. 56.82%,图片=1.585,P=0.208)”这段文字描述错误,应为“两组术后生存曲线(过程)差异无统计学意义,图片=1.585,P=0.208”。
转自医刊界微信公众号,仅作学习交流,如有侵权,请联系本站删除!