投稿问答最小化  关闭

万维书刊APP下载

这篇中国学者发表在《柳叶刀》子刊的文章,数据分析的套路值得一看

2022/6/10 11:14:00  阅读:330 发布者:


之前我们在公众号报道中国学者发表在《柳叶刀》子刊的文章。

没想到,久坐增加12种患病风险!中国学者《柳叶刀》子刊全面分析

 

目前该论文发表在柳叶刀子刊《EClinicalMedicine》上,今天我来讲讲这篇论文统计分析是怎么做的? 从分析过程来看,方法不是太难,但算是值得学习的套路了。

 

久坐与疾病的论文介绍

 

一、论文的基本情况

 

文章数据来源于英国生物银行(UK Bio-bank,该数据库是一项前瞻性队列研究,收集了2006年至2010年间招募的英国50多万40-69岁个体的问卷数据,身体测量和生物样本。参与者的基线评估包括详细评估病史,生活方式和营养习惯,身体检查和血液取样,该平台是国际上公认影响力较大的生物医学大数据平台。

 

本研究共纳入360,047名参与者,其中年龄在37-73岁之间,纳入研究时不患45种常见的非传染性疾病,主要目标是评估用轻度体育活动、中度体育活动、剧烈体育活动和睡眠替代每天久坐的时间是否与降低某些非传染性疾病的风险。

 

暴露因素:久坐时间(看电视、使用电脑和驾驶行为)和体力活动(通过国际体育活动问卷问卷测量)的信息通过基线时的自我报告收集。在调整了潜在混杂因素后,采用等时替代模型研究用轻体力活动(LPA)、中等体力活动(MPA)和剧烈体力活动(VPA)替代久坐时间。

 

结局:根据ICD-10代码,对参与者进行了45种非传染性疾病诊断的随访,直到2020年,参与者45种非传染性疾病的患病率

 

 

二、主要结果

 

1.与每天久坐2小时的人相比,每天久坐>6小时的人患12种慢性病的风险增加26.7%包括缺血性心脏病、糖尿病、慢性阻塞性肺疾病、哮喘、慢性肾脏病、慢性肝病、甲状腺疾病、抑郁、偏头痛、痛风、类风湿性关节炎、憩室疾病。

 

 

2.如果所有参与者每天久坐时间减少至6小时以下,大约将预防3.7%-22.1%的慢性病。

 

因此,研究结果显示:与每天久坐2小时的人相比,每天久坐>6小时的人患12种慢性病的风险增加26.7%包括缺血性心脏病、糖尿病、慢性阻塞性肺疾病、哮喘、慢性肾脏病、慢性肝病、甲状腺疾病、抑郁、偏头痛、痛风、类风湿性关节炎、憩室疾病。

 

而每天运动代替久坐,是非常重要的预防疾病的措施。各位电脑族、手机族、赶紧行动起来吧。

 

它是如何进行数据分析的?

 

这篇文章如何进行分析的?

 

这篇文章是观察性队列研究。观察性研究研究暴露因素与结局的关联性,即久坐与癌症发生的关系。一般而言,观察性研究暴露与结局的关系,总会收到干扰因素的影响,因此需要借助回归等手段控制。本研究是随访研究,采用的是生存时间资料。

 

现在具体来进行解剖。

 

1.基本统计描述

 

首先是统计描述。对于定量数据,根据是否呈现正态分布,分别采用均数±标准差或中位数(四分位数)的形式描述;分类数据采用例数(百分比)描述。采用卡方检验或方差分析进行分析。

 

 

我说:上述这段话,是统计学描述与差异性分析,几乎所有的观察性研究一开始都会这么写。

 

2. 主要回归分析方法

 

作者采用Cox比例风险模型计算风险比(HR)以及95%置信区间。所有模型均进行矫正。

 

 

我说:介绍Cox回归模型如何控制协变量。我们一般说构建回归是先单后多,先单因素分析,再挑出P值较小者开展多因素回归。高端文章也是这么干的么?

 

其实往往不是的,很多好的文章,要从专业上挑选协变量(理论驱动)而非数据驱动挑选变量纳入模型。

 

如果是数据驱动的先单后多,可能会把很多中介变量也纳入模型,这就不合适了!

 

3. 非线性关系分析

 

观察性研究遇到定量或者等级变量的时候,往往还会做绘制了限制性立方样条图,并采用似然比检验久坐时间的非线性关系。

 

 

观察性研究遇到定量或者等级变量的时候,往往还会绘制限制性立方样条图。该方法可以探讨暴露因素与结局非线性关系,是近几年较为流行的方法。

 

4. 敏感性分析方法

 

首先,作者在主分析模型上增加了体力活动和睡眠强度进一步构建Cox回归分析模型,看结果是否一致。

 

 

其次:在分析时,排除了纳入研究后两年内发病的参与者,以尽量减少反向因果关系对研究结果的潜在影响。

 

 

还有:对缺失数据进行了多重填补,对填补后的完整数据再次进行分析,,最后排除了现在吸烟和之前吸烟的参与者后,再次对数据进行分析,以避免吸烟造成的混杂偏倚。

 

 

我说一篇好的观察性研究论文,敏感性分析是重要组成部分。一个真实可靠的因果关系(久坐和死亡),应该可以久经考验的。也就是,如果你这个结果可靠,那么同个结果应该用不同的方法、不同的数据、不同的人群应该具有一定的稳健性(即变动幅度不大),否则说明我们得到的结果并一定真实可靠。敏感性便是一种用类似方法、数据、人群进行再分析来评价结果稳健性的方法。

 

本研究敏感性手段包括:1)不同的统计学方法,Cox回归纳入更多的协变量 2)排除一部分结局:那些在开始随访后2年内就发病的人群,看看主分析结果会不会被因果颠倒的情况所困扰(很多时候暴露因素和1-2内发病的之间没有因果关系,或者因果颠倒);3)缺失数据填补后进行敏感性分析,看看缺失数据对结果有无重大影响。4)排除吸烟的干扰,该研究还排除了吸烟人群再分析。

 

总之,敏感性分析手段往往在观察性研究较为常用,杂志社希望研究者提供更多的信息来证明结果的可靠性。

 

5.I 型错误的控制

 

为了避免多次检验导致一类错误的增大,所有分析均采用Bonferroni进行矫正。

 

 

我说在观察性研究中,I 类错误的校准不多见,因为观察性研究主要仍然是探索性研究。不过能够控制I 类错误的情况下进行分析,再好不过了。

 

闲来郑语

 

总的来说,这篇论文在分析方法上全面而细致,其分析手段与过程值得各位的参考。

 

感叹下!现在国人统计分析的套路也越来越具有国际范,即便是全华帮,也照样能整一套符合国际顶级期刊的统计分析过程。

 

如此,论文就不怕在统计学上被人针对。

 

其实,统计学真的不难学,关键在于你能否用点心思去学。

 

最后,再次感叹!最近好多论文都是在给外国数据打工呀!

 

声明:本文来源于医学论文与统计分析,仅用于分享,版权归原作者所有

 

 

 

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com