2023/4/4 10:13:07 阅读:283 发布者:
来源:
大家好,今天我们来聊一聊真实世界研究RWS的数据分析。真实世界研究的数据不同于既往的临床研究数据,因为数据来自于真实诊疗环境,所以分析难度也更大。
RWS中治疗队列/对照队列的人群因为不是随机分配,所以可能会产生混杂偏倚。那么如何通过统计分析的方法消除这些混杂偏倚呢?
下面先带大家了解一下临床研究中的混杂偏倚,然后通过解读两篇SCI文章,来解答大家的疑惑。
临床研究与混杂偏倚
在RCT研究中,由于随机与对照已经平衡了组间的混杂因素,因此可以直接通过比较两组间的差异来衡量治疗效果。而真实世界研究或观察性研究中并非如此,由于没有事先进行随机化,所以会有很多的混杂因素,组间差异可能是由于混杂因素引起,而非治疗效果引起,因此不能直接比较组间差异来衡量治疗效果。
在真实世界研究中,如果某些协变量同时与治疗方案和结果相关,则可能会造成混杂。所以需要通过倾向性评分来调整两组间协变量分布的不均衡,达到两组间具有可比性的目的。
接下来通过两篇SCI文章,来举例说明倾向性评分在真实世界研究中的应用。
文章一的题目是:Pulmonary Rehabilitation in Idiopathic Pulmonary Fibrosis and COPD: A Propensity-Matched Real-World Study. 翻译成中文是:特发性肺纤维化和COPD的肺康复:一项倾向匹配的真实世界研究。
用PICOS原则来解读一下这篇文章,研究人群P是特发性肺纤维化患者,对照C是COPD患者,观察终点O是肺康复和全因死亡率,研究类型S是真实世界研究。
接下来具体看一下该研究具体是如何设计的。
该研究的IPF队列是前瞻性的招募,对照队列是在IPF患者入组完成之后再回顾性的匹配同一时期转诊到同一家中心的COPD患者,用倾向性评分中最邻近法匹配患者,匹配因素包括基线资料和疾病特征。
从研究流程图中可以更加清晰的看到研究的入组及完成情况。
进行PSM之后,应该如何统计分析呢?
文章的图一对两个队列的基线特征进行了描述,分别对经过PSM的变量和其它变量对比了两组之间的差异,可以看到经过PSM的变量两组间差异SMD<0.1,说明匹配良好;其它变量在两组之间仍有显著差异,但可能对研究的终点指标影响不大,所以也无关紧要。经过匹配之后两组之间就可以进行终点指标的比较了。
文章二的题目是:Naoxintong capsule delay the progression of diabetic kidney disease: A real-world cohort study. 翻译成中文是:脑心通胶囊延缓糖尿病肾病进展:一项真实世界队列研究。
我们继续用PICOS原则来解读:研究人群P是使用了脑心通的糖尿病患者,对照C是未使用脑心通的糖尿病患者,研究终点指标O是肾小球滤过率eGFR的变化,研究设计S是真实世界队列研究。
这项研究数据来源于天津市健康医疗大数据平台,疾病登记系统或卫生信息系统是真实世界数据来源之一,使用的是回顾性数据,样本量较大,研究流程如下:
从流程图可以非常清晰的看到这项回顾性研究的患者筛选流程:在2011年到2021年期间DKD患者298537例,符合纳入标准的有122210例,有结局指标测量或其它终点事件的有91695例,经过排除标准筛选后暴露组有1471例受试者,对照组有8234例受试者,经过倾向性评分匹配,最终暴露组和对照组各纳入899例患者。
这个患者筛选流程对于我们开展注册登记研究非常有借鉴意义,如何从庞大的疾病登记数据库里筛选出符合研究入排的患者,大家也可以学习这样的筛选与匹配的思路。
那倾向性评分应该匹配哪些变量呢?文章里是这么描述的:通过文献检索和逐步回归方法来挑选匹配变量。
通过查找类似的文献,看下在其它研究里两组之间均衡了哪些因素,我们就可以作为倾向性评分的匹配因素,这样可以尽量减少混杂偏倚,又不至于出现匹配过度。
文章的表1列出了匹配前和匹配后的两组之间基线特征的对比,可以看到经过倾向性评分后,两组之间的基线特征达到均衡,差异不显著。
好了,以上就是两篇应用了倾向性评分的真实世界研究的解读,使用PSM相当于进行了“事后随机化”,使真实世界研究的数据达到近似随机分配的效果,使文章的结论更具有说服力。点击文末的阅读原文,可以直接阅读这两篇文献哦。
转自:“易侕科研”微信公众号
如有侵权,请联系本站删除!