投稿问答最小化  关闭

万维书刊APP下载

有向无环图在循证医学中的应用

2022/5/23 9:12:59  阅读:370 发布者:

中国医师杂志, 2018,20(2) 子言, 吴小丽, 解美秋, .

摘要

循证医学是遵循证据的医学,是临床医生应用最佳证据对患者进行诊治的医疗实践,证据的提供者和应用者都需要对医学研究过程中可能出现的偏倚进行识别和控制,有向无环图作为探索因果关系的辅助工具,可通过简单的图形语言揭示研究中可能存在的偏倚,对研究中的偏倚进行有效控制,从而提高医学研究质量,更好的指导临床实践。

循证医学是临床实践和认知的整合,是临床医生在复杂的临床实例中认识疾病本质的过程,是根据临床所得的最佳证据去解决临床问题的过程[]。而临床工作者在筛选最佳证据时,需要严格评判文献的质量,判断研究设计是否合理,研究结果是否真实,在研究过程中是否存在混杂因素或偏倚。最佳证据的产生基于医学研究,没有严谨的客观的医学研究,就不可能产生最佳证据来做出科学决策,医学研究如果受到主观或客观因素的影响,则会产生虚假甚至错误的证据。因此,无论是证据提供者或是证据应用者,都需要识别和控制混杂等偏倚因素的影响[]。有向无环图(Directed acyclic graphsDAGs)是识别和控制混杂等偏倚的重要图形工具,其图形语言简单,并且假设是定性和非参数的,不暗示变量之间的关系或分布的具体函数形式,不涉及统计分析,常被用来辅助探讨因果关系[]

有向无环图由节点和连接节点的箭头组成,所有的变量被箭头连接,成为有方向的路径,并且没有形成一个封闭的环。研究者将暴露、结局、潜在混杂因素、冲撞变量等变量表示在图上,构成一个因果网[],见图1。其中,节点ABCDE表示变量ABCDE,箭头表示变量间的时序关系,EA表示E发生在前,A发生在后,EA的父代(parent)AE的子代(child);若同一方向路径上存在多于两个的变量,如EABD,则ED的祖先,DE的孙代。

1有向无环图示意图

若某变量同时存在两个或两个以上的子代,见图1中的变量C,我们称之为混杂变量(Confounder),依据流行病学判定混杂变量的标准,混杂变量是所研究疾病的危险因素,与可疑的暴露相关联,并且不是研究因素与疾病因果链上的中间病因[]。在DAGs中,混杂变量出现在暴露和结局之前,混杂偏倚是当暴露和结局存在共同原因时,缺乏对暴露和结局的共同父代进行调整,在两个子代之间产生的后门路径可传递关联,我们称之为混杂偏倚(Confounding bias)[]。在医学研究中,混杂的存在往往会歪曲暴露到疾病的真实关联,识别并控制混杂变量成为因果推断的关键。

有向无环图提供了一种简单易操作的方法,便于研究者识别混杂变量,当某路径存在混杂变量时,可通过ShrierPlatt的六步法则来识别需进行调整的变量,如果在对变量集S进行调整后,暴露到疾病不存在关联时,我们称该变量集S为充分调整集,调整S足以控制暴露到疾病关联中的混杂偏倚,如果从S中去除任何变量都会残存偏倚,则S集为最小充分调整集[]。在实践中,可能有几个不同的充分调整集,甚至有几个不同的最小充分调整集,考虑到调整更少的变量能够减少工作量,增加统计分析效率,研究者可能更倾向于选择最适宜的最小充分调整集,即选含变量少的,容易测量的,无缺失值的最小充分调整集[]

2痴呆与婚姻状况关系图

DAGs中,若某变量同时存在两个或两个以上的父代,如图1中的变量A,我们称之为冲撞变量(Collider),如果对其进行调整,会引入冲撞分层偏倚(Collider-stratification bias)[]。例如在分析人群中痴呆与婚姻状况时,见图2。假如人群中痴呆和婚姻状况没有关联,但痴呆患者和离异者在年老时多选择养老院作为居住场所,痴呆和婚姻状况均对居住场所产生影响,居住场所为冲撞变量,如果选择养老院居民作为研究对象进行研究时,可能形成婚姻状况与痴呆之间的虚假关联,从而产生在人群中痴呆与婚姻状况存在关联的错误结论。

在实际研究过程中,我们处理混杂变量的常用办法是对混杂变量进行调整,而按照传统的混杂变量判别标准,研究者可能会错误的选择需调整的变量,对貌似混杂变量的冲撞变量进行不恰当的调整会产生冲撞分层偏倚,反而歪曲暴露到疾病真实的因果关系。我们引用了Rothman[]的研究,在探讨儿童期教育程度是否会影响研究对象患糖尿病的风险时,假设已知研究对象的母亲是否患有糖尿病(W),研究对象儿童期家庭经济状况(Z1),以及研究对象的母亲携带糖尿病基因的风险(Z2),若研究对象儿童期家庭经济状况不佳,会影响研究对象受教育的程度,同时也会影响母亲患糖尿病的风险;且研究对象的母亲是否携带糖尿病基因也会影响到母亲患糖尿病的风险和研究对象患糖尿病的风险。构建DAGs,见图3,可见XY的关联在W处被阻断,W为冲撞变量无法传递关联,按照传统的流行病学判定混杂的方法,WX相关,WY相关,且W不是X-Y路径上的中间病因,我们可能误判W为混杂变量并对其进行调整以控制混杂偏倚,然而,在实际DAGs中,W为冲撞变量,对W进行调整会打开W的两个父代Z1Z2之间的路径,在Z1Z2间产生虚假关联,从而使原本不传递任何关联的DAGs变成开放的DAGs,产生儿童期的教育程度会影响患糖尿病风险的错误结论。

3儿童期教育程度与患糖尿病风险关系图

为了更好的阐明混杂偏倚与冲撞分层偏倚的区别,Janszky[]设计了两个病例对照研究,为了排除其他变量的影响,研究只包含三个变量:E代表暴露,D代表结局,C代表第三个变量。两个研究共享一份数据,见表1。未调整C时,OR(1 500×500)/(1 000×1 000)0.75,调整C时,OR(1 200×100)/(600×400)0.5

1两个病例对照研究的共享数据

研究1.假设手工工作(C)与工作中的体力活动(E)和心力衰竭(D)均相关,见图4。手工工作导致工作体力活动量增大,同时,手工工作者多为低社会经济地位者,患心力衰竭的风险较高。C是暴露和结局共同的父代,是标准混杂因素。研究1正确的OR值应该为调整混杂变量C后的OR0.5,而不是未调整的OR0.75。如果不能对手工工作C进行调整,则会错误地低估工作中的体力活动对心力衰竭的保护效果。

4工作中的体力活动和心力衰竭关系图 C:手工工作;D:心力衰竭;E:工作中的体力活动

5

节食和心力衰竭关系图 C:体重减轻;D:心力衰竭;E:节食

研究2.假设体重减轻(C)与节食(E)和心力衰竭(D)相关,见图5,心力衰竭和节食都会导致体重减轻。C是暴露和结局共同的子代,是标准的冲撞变量。在ED的关系中,存在冲撞变量C并不会混淆ED之间的关系,然而,对C进行调整反而会引起ED关系的偏倚。研究2正确的OR值应该为未调整冲撞变量C时的OR0.75,而不是调整后的OR0.5。如果对体重减轻C进行调整,则会引入负偏倚从而高估了节食对心力衰竭的保护作用。

可见,对混杂变量进行调整和控制可以消除混杂偏倚,从而获得所研究关系的无偏估计;而对冲撞变量进行调整和控制,则可能诱发冲撞分层偏倚,获得错误的研究结论[]

医学研究的主要目的是获得暴露对疾病效应的无偏估计,根据专业背景知识,如通过查阅文献和询问专家意见等方法,绘制出正确的有向无环图,不仅能够给研究者提供识别混杂变量和冲撞变量的简单易操作的办法,同时能够避免过少调整导致的残余混杂和过度调整引入的冲撞分层偏倚,从而获得真实的因果关系[]。有时,根据临床具体情况,研究者可能会绘制出不同的有向无环图,需要仔细甄别并选择最恰当的有向无环图;在关系复杂或是难以获得完整因果网的研究中,绘制有向无环图可能存在困难。有向无环图作为一个简单灵活的工具,能帮助我们理解各种假定的因果结构或因果模型下的因果关系,为认识错误的研究设计或分析方法引起的偏倚提供了一种简单灵活的直观方法[。无论是循证医学的证据提供者,还是证据运用者,在提供证据和筛选证据时都应该了解因果图的简单图形语言并运用有向无环图来识别和控制研究中的混杂偏倚和冲撞分层偏倚,从而帮助研究者提供真实有效的证据,帮助临床工作者筛选最佳证据,提高临床实践质量,促进医学发展。

转自:医学科研与管理空间

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com