投稿问答最小化  关闭

万维书刊APP下载

【文献译读81】harvest plot:综合干预措施不同效果的证据的方法

2022/12/28 10:10:19  阅读:266 发布者:

文献分享会

摘要

背景介绍

Meta分析的吸引力之一是森林图,它是对系统回顾中所包含的基本数据和总体“结果”的紧凑概述。然而,Meta分析并不总是适用于综合有关干预措施效果的证据,这些干预措施可能会影响更广泛的健康决定因素。作为系统综述的一部分,我们设计了一种新的综合方法,旨在将森林图的图形直接性应用于综合来自复杂和多样化研究的证据问题。

方法

我们从两个方法学方面(研究设计的适宜性和执行质量)对纳入的研究(n = 85)进行了编码,并提取了按不平等的六个不同方面(收入、职业、教育、性别、种族或民族和年龄)分层的效果数据,对“硬”(行为)和“中间”(过程或态度)结果进行了区分。采用假设测试的方法,我们评估了每项研究对每个不平等维度的三个竞争性假设(正的社会梯度、负的社会梯度或无梯度)中哪一个得到了最好的支持。

结果

我们将每一类干预措施的结果绘制在一个矩阵(harvest plot”)上,根据方法学标准对研究进行加权,并将其分布在竞争性假设之间。这些矩阵构成了分析过程的一部分,有助于概括结果,例如提请注意提高烟草制品价格可能对阻止低收入者和低职业群体吸烟更为有效这一结论。

结论

harvest plot是一种新的、有用的方法,用于综合有关人口层面干预措施的不同效果的证据。它有助于应对通过纳入所有相关数据来最佳利用所有可用证据的挑战。视觉显示有助于综合过程和对结果的吸收。该方法适用于证据综合中的各种问题,对于解决可能与决策者最相关的更广泛类型的研究问题的系统回顾可能特别有用。

前言

超越森林图

在对干预措施效果的系统回顾中,综合多项研究的证据的目标通常是寻求关于有效性的总体结论。诸如Cochrane合作组织或评论与传播中心(CRD)编制的指南区分了“定量”综合方法(尤其是Meta分析)和“描述性”、“非定量”或“叙述性”综合方法。例如,Cochrane手册描述了“在Meta分析不可行或不可取的情况下”使用叙述性综合方法,而CRD指南提到,如果Meta分析被认为不可行,“非定量综合方法可以非正式地探索研究特征的差异如何影响其结果”。

Meta分析的一个优点是,可以用森林图等图形来总结结果,在森林图中,每个研究用一个正方形表示效果大小的点估计值,用一条水平线表示围绕该估计值的置信区间。效应大小的集合估计值及其置信区间在图的底部用钻石表示。因此,森林图为每项研究的基本数据和总体 “结果”提供了一个紧凑的、具有视觉冲击力的概述[3]

然而,Meta分析的统计有效性取决于研究之间的同质性,尤其是在结果指标方面,这在临床试验领域之外可能是不现实的。例如,Slavin--“最佳证据综合”概念的提出者--质疑是否应该仅仅因为无法从研究结果中计算出适合Meta分析的效应大小而排除这些研究,并质疑Meta分析首先一定是综合有效性数据的最有意义的方式的假设。Cochrane健康促进和公共卫生领域的指南警告说,即使数据在统计学上可以进行Meta分析,系统评审员也“需要在进行Meta分析之前提出理由”。

最近的一个项目旨在为替代性的、“叙述性”的综合方法提供指导,发现这些方法并不以权威的知识体系为基础。所使用的技术范围很广,从通常与定性研究相关的技术,如主题分析,到各种表格方法,再到数量的定量分析和图形绘制,如OR。然而,根据定义,叙述性综合在很大程度上取决于使用文本来“讲述故事”。如果纳入的研究数量较多,就会导致结果部分冗长且难以消化,与森林图的简洁和直接相比,这可能是不可取的。

寻求有关不同效果的证据

如果一个系统综述要研究多个相关的研究问题,那么综合的复杂性就会增加。Cochrane合作组织健康公平领域和坎贝尔合作组织公平方法小组的成立,反映了人们对综合干预措施的效果在人口和社会经济群体中的差异的证据越来越感兴趣。尽管近年来对减少健康不平等现象给予了政治上的优先考虑,但很少有系统性综述对旨在减少健康不平等现象的干预措施的有效性或适用于整个人口的干预措施的分配效果进行研究。了解干预措施是否以及如何在不同群体中发挥作用,对于确保表面上有益的总体人口效应不会掩盖更多和更少优势群体之间不断扩大的健康差距非常重要。

然而,不平等有许多方面,如PROGRESS标准中列举的那些方面(居住地、种族或民族、职业、性别、宗教、教育、社会经济地位和社会资本)。因此,综合有关干预措施效果的多种潜在社会梯度的证据,对进行系统回顾的人来说是一种方法上的挑战。我们提出了一种方法,该方法是我们在对人口层面的烟草控制干预措施对吸烟的社会不平等的影响进行系统回顾的过程中设计的。我们的目的是将森林图的图形直接性与充分但不详尽的叙述相结合,说明可以从一组高度多样化的研究中了解到什么。我们的方法并不专门针对本综述的主题,可以很容易地应用于其他研究问题,或对其进行调整。

方法

输入数据

系统回顾的一般方法已在其他地方报告(Thomas S, Fayter D, Misso K, Ogilvie D, Petticrew M, Sowden A, Whitehead M, Worthy G. Population tobacco control interventions and their effects on social inequalities in smoking: systematic review,已提交)。简而言之,我们广泛搜索了评估任何类型的人群烟草控制干预效果的研究,并报告了按至少一种人口或社会经济特征分层的效果。我们纳入了所有符合这些标准的研究,而不考虑研究设计、方法学质量或测量结果。我们从两个方法学方面对研究进行了编码:一个是研究设计适宜性的三点量表,改编自美国社区预防服务工作组的社区指南,另一个是执行质量的六项检查表,改编自为安大略省汉密尔顿的有效公共卫生实践项目制定的标准,旨在适用于整个纳入的研究设计范围(附加文件1)。

纳入研究的特点在其他地方也有报道(Thomas S, Fayter D, Misso K, Ogilvie D, Petticrew M, Sowden A, Whitehead M, Worthy G. Population tobacco control interventions and their effects on social inequalities in smoking: systematic review,已提交)。这85项研究从防止烟草出售给未成年人(低于法定最低购买年龄的人)的随机对照试验到香烟需求价格弹性的截面计量经济学分析不等,还包括其他各种实验性和观察性、对照性和非对照性研究设计。该领域的干预措施的效果已经使用了广泛的结果和结果衡量标准(通常在同一研究中使用几种)进行评估,从自我报告的对禁烟政策的认识变化到直接观察到的吸烟行为变化(表1)。在整个纳入的研究中,效果按六个不同的不平等维度进行分层--按收入、职业、教育、性别、种族或民族,以及按年龄--但很少在一项研究中按其中的两个或三个维度分层。

界定要测试的假说

我们采取了一种假设检验的方法。对于每项研究和每个不平等的维度,我们都提出了一个无效假设(即干预措施的有效性没有社会梯度)和两个备选假设(一个是有效性有正的社会梯度,另一个是有效性有负的社会梯度)。我们将有效性的正向梯度定义为:干预措施对更多的优势群体(为此定义为更富裕的人、受教育程度更高的人、技能更强的职业群体、男性、老年人或在特定研究中处于多数或最有利地位的种族或民族群体)更有效,而负向梯度则定义为:干预措施对更多的弱势群体更有效。由于我们是从公平的角度来研究证据的,所以我们特别希望找出具有负梯度效果的干预措施,以便为减少健康不平等的政策提供信息。

将每项研究分配给得到最佳支持的假设

对于一些研究--例如,那些具有单一结果测量和明确发现干预措施对某些群体比其他群体更有效的研究--确定该研究最支持哪一个竞争性假设是很直接的。然而,一些研究提出了相互矛盾的结果数据。在这种情况下,评估每项研究的一对评审员必须就如何从公平的角度解释结果达成一致的总体判断,例如,对某些结果措施给予更大的重视。

例如,ChaloupkaWechsler的计量经济学研究发现,男性和女性对香烟需求的价格弹性都是负的。然而,价格弹性的社会梯度方向取决于对香烟需求的定义方式。女性参与吸烟(即在过去30天内是否吸烟)对价格比男性更敏感,而男性的香烟消费(即吸烟的数量)对价格比女性更敏感。我们把这项研究总体上归类为最能支持有效性没有性别梯度的无效假设。Lewit及其同事的另一项计量经济学研究发现,男孩在14岁时参与吸烟对价格比女孩更敏感,而男孩和女孩吸烟意向的价格弹性(即认为在下一年吸烟的可能性)相似。我们将这项研究归类为总体上支持按性别划分的有效性正梯度的假设,即价格的提高对男性更有效,并在我们完整报告的结果部分的文本中描述了相互矛盾的数据。

绘制证据的分布图

对于每一类干预措施(如对未成年人的销售限制),我们都会借鉴使用矩阵来分析和综合定性数据的例子,填充一个矩阵,以显示证据的分布。每个矩阵由六行(每个不平等的维度各占一行)和三列(三个竞争性假设各占一列)组成。这些矩阵被复制为一个单一的组合“超矩阵”,涵盖所有的干预类别(图1)。我们在每一行(不平等的维度)用一个标记来表示每一项研究,该研究报告了相关的结果。为了模仿森林图中研究加权的视觉表现,我们对每项研究的标记进行了加权和注释,以表示三个特征。

1)采用“硬”行为结果测量的研究(吸烟行为的改变)用全色调(黑色)条表示,采用中间结果测量的研究(如态度的改变)用半色调(灰色)条表示。

2)研究设计的适宜性由条形图的高度来表示。

3)每个条形图都有注释,说明该研究符合的其他方法学标准的数量。

重点叙述性综述

然后,我们以形成性和总结性的方式将这些矩阵应用于综合的问题。一方面,我们利用这些图表来确定证据库中需要集中叙述性综合的领域--例如,具有最令人信服的证据来证明有效性方面的积极或消极社会梯度的领域,或者“离经叛道”的案例(具有明显非典型或不协调结果的孤立研究)。另一方面,在总结我们的结果时,我们也使用了图表来配合叙述性综合,例如,提请注意空白处,这表明对不平等的干预类型和层面的研究最不彻底,或者提请注意更高质量的证据,例如,与限制在学校吸烟相比,限制向未成年人销售的效果。

结果

所得出的矩阵强调了证据库中某些似乎与我们的研究问题特别相关的领域,并帮助我们将叙述性综合和讨论集中在相关主题上。例如,提高烟草制品的价格可能对阻止低收入人群和低职业群体吸烟更为有效。我们认为,确定有可能增加不平等的干预措施与确定有可能减少不平等的干预措施同样重要,在这方面,我们发现没有明确的证据表明许多类别的干预措施的效果存在不利的社会梯度,这一点令人欣慰。然而,这些矩阵再次帮助我们确定了可能存在问题的领域。例如,在工作场所和公共场所限制吸烟的矩阵(图2)表明,与其他人口或社会经济特征相比,职业群体的效果梯度更强。然而,矩阵中这一行的条形图(研究)的色调、高度和注释的分布表明,这种梯度的证据主要是由相对较弱的研究设计提供的,其中一些研究只在“中间”而非“硬”结果测量中发现了梯度。通过关注这组研究,考虑有关干预措施的背景,并借鉴相关的定性研究,我们能够将我们的发现综合为。......如果有的话,在工作场所限制吸烟[]对较高职业等级的工作人员可能更有效"Thomas S, Fayter D, Misso K, Ogilvie D, Petticrew M, Sowden A, Whitehead M, Worthy G. Population tobacco control interventions and their effects on social inequalities in smoking: systematic review,已提交)。

讨论

我们提出了一种新的方法来综合关于异质和复杂干预措施的不同效果的证据。与森林图不同的是,森林图强调的是对类似参与者进行类似干预的若干类似研究的综合“底线”,我们不认为我们的矩阵提供了系统回顾的“结果”的明确声明;相反,它们构成了分析过程的一部分,因为它们有助于总结产出。然而,来自同行评审员和会议代表的早期反馈表明,这种显示摘要数据的方法确实有助于吸收一组复杂的发现。我们建议将我们所展示的这种矩阵命名为“harvest plot”,以反映从该领域的各个角落收集和筛选最佳可用证据的过程。

harvest plot的优点

我们的方法的第一个优点是,它对主要研究中使用的结果和指标是不可知的。SlavinMeta分析的批评在这种方法中得到了解决,因为没有数据需要被丢弃:所有的数据都是相关的,因为所有的数据都可以根据它们是否倾向于支持某个特定的假设来判断。因此,该方法有助于最大限度地提高而不是限制从系统综述中的研究中获得的潜在学习。

第二个优点是,该方法可以针对特定证据体系中最相关的研究特点进行调整。在本综述中,我们选择强调研究设计的适宜性,而不是研究的执行质量,因为在审查了所有可用的证据后,我们认为研究设计是更重要的衡量标准,可以对每项研究结果的权重进行分级。因此,该矩阵特别清楚地表明,现有证据基础的大部分完全或部分地依赖于薄弱的研究设计,以及灰色条形图所代表的“中间”结果测量。尽管如此,希望了解特定研究所满足的方法学标准数量的用户仍然可以在矩阵中找到这些数据。我们还选择不强调样本量(通常在可比较的研究的Meta分析中用作主要的加权因素),因为我们认为这一特征在这个特定的系统回顾中所包括的所有研究设计中都是不可比较的,这些研究设计从随机对照试验(样本量通常在102103之间)到大型人口数据集的计量经济学分析(样本量通常在104105之间)。尽管如此,希望了解特定研究的样本量的用户仍然可以在报告全文的表格中找到这些数据。对收获图的原则进行调整以反映不同系统综述的现有证据的性质是很容易的--例如,用条形图的色调来区分随机研究和非随机研究,或者(如果所有纳入的研究都是类似的研究设计)用条形图的高度来代表样本量。然而,研究人员应该记住,选择强调不同的研究特征可能会影响对最佳可用证据平衡点的解释。

第三个优点是,像任何图形方法一样,收获图不仅可以“使统计数字更容易接受”,而且还可以帮助我们“发现我们没有想到的东西”。在综合证据的过程中,我们发现通过检查矩阵来比较干预类型、不平等维度和竞争性假设之间的证据,并确定感兴趣的模式,比研究充满大量文字的冗长表格更容易;评论的使用者也可能发现,视觉显示有助于他们吸收和消化复杂评论的结果。然而,这并不是要否认从主要研究中提取并列出所有相关数据的重要性:表格仍然是这一过程的重要组成部分,并且需要用来验证和解释收获图所揭示的模式。

harvest plot的局限性

一个局限性是,一个在结果指标方面接受“所有来者”的方法,以及在这种情况下的研究设计,显然对某些类型的系统回顾比其他类型更合适。对于从“集合”而非“分离”的角度进行的系统综述,即那些解决与政策制定者更相关的更广泛问题的综述,这种方法可能特别有用。然而,在其他情况下,将如此广泛的数据纳入同一矩阵可能会有掩盖甚至扭曲最重要、最有效的推论的风险,这些推论可以从最有力的研究子集中得出。

另一个限制是,人们对矩阵的解读可能超过了数据的合理性,特别是如果它们被单独展示,而没有附带的叙述性综述和对主要研究的方法学限制的说明。例如,现在普遍要求演讲者提供他们的幻灯片,以便在会议网站上发布,但Tufte和其他人强调了依靠这种独立的“幻灯片”(伪装成文件的幻灯片)来正确理解演讲背后的认知内容的危险性[19,20]。森林图符合普遍理解的图形词汇,任何熟悉该惯例的人都能立即读懂“结果”及其统计意义。相反,在任何意义上,收获图都不能被解释为显示“统计学意义”的结果;相反,它有助于说明证据的分布,例如,在哪些竞争性假设得到更多或更少的支持。

需要附带叙述性综述的一个特别例子是,在中心栏下收集的证据--支持有效性无梯度的无效假设--可能包括几种类型的“无效”证据:真正有力地证明不存在梯度的研究;权力不足或执行不力的研究,即使存在梯度,也极不可能发现梯度;或者有内部冲突结果的研究,为了填充矩阵,被视为相互抵消了。除了随附的叙述性综述外,我们还没有找到一种令人满意的方法来区分这种多样性的“无效”证据。

结论

harvest plot是一种新的、有用的辅助手段,用于综合有关复杂的、异质的、人口层面的干预措施的不同效果的证据。它结合了传统森林图的直观性和更具包容性的假设测试方法,以总结最佳可用证据在多个同时存在的不平等方面的分布。该方法适用于证据综合中的各种问题。因此,我们邀请同事们考虑应用和调整harvest plot,作为综合和报告其他复杂干预措施不同效果的系统回顾结果的过程的一个组成部分。

转自:“一起学科研”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com