中华风湿病学杂志, 2022,26(6) 李挺, 李军, 姜晨晨, 等.
随机对照试验(randomized controlled trials,RCTs )是采用随机分配方法,将符合临床试验要求的受试者分配到试验组和对照组,并给予相对应的干预措施,评价疗效和安全性的一种临床试验方法。由多家(一般≥3家)临床机构共同参与,按照同一个方案进行的临床试验项目被称为多中心临床试验。虽然高质量的单中心RCTs被认为可以提供Ⅰ级证据[1],但多中心临床试验,由于其诸多的优点,被认为可以提供更可靠的证据。首先,多中心临床试验纳入更多样化的人群,特别是不同地区、不同人种的受试者,提供了不同生活习惯、文化背景下的干预效果。另外,不同地区不同背景的研究者共同参与,能做到集思广益,提高临床试验的设计水平;在不同的中心共同完成试验,也让研究结论更加可靠,更有普适性。当然,多个中心可以在较短的时间内收集较多的受试者,提高了大样本临床试验的可行性。本文以笔者团队最近在《JAMA》杂志上发表的RAGA(Regional Anesthesia vs. General Anesthesia)多中心RCTs为例[2],简述如何实施多中心RCTs并获得高质量的临床研究结果。
随机对照试验(randomized controlled trials,RCTs )是采用随机分配方法,将符合临床试验要求的受试者分配到试验组和对照组,并给予相对应的干预措施,评价疗效和安全性的一种临床试验方法。由多家(一般≥3家)临床机构共同参与,按照同一个方案进行的临床试验项目被称为多中心临床试验。虽然高质量的单中心RCTs被认为可以提供Ⅰ级证据[],但多中心临床试验,由于其诸多的优点,被认为可以提供更可靠的证据。首先,多中心临床试验纳入更多样化的人群,特别是不同地区、不同人种的受试者,提供了不同生活习惯、文化背景下的干预效果。另外,不同地区不同背景的研究者共同参与,能做到集思广益,提高临床试验的设计水平;在不同的中心共同完成试验,也让研究结论更加可靠,更有普适性。当然,多个中心可以在较短的时间内收集较多的受试者,提高了大样本临床试验的可行性。本文以笔者团队最近在《JAMA》杂志上发表的RAGA(Regional Anesthesia vs. General Anesthesia)多中心RCTs为例[],简述如何实施多中心RCTs并获得高质量的临床研究结果。
01
中立的视角
社会学家马克思·韦伯提出"价值中立"的观点,即进行科学研究时,应当不包含任何的倾向性,尽量成为独立、不偏不倚的"观察者"。历史上,第1个多中心临床试验是关于普通感冒的治疗。当时《Lancet》杂志发表了个案报告和单中心研究认为棒曲霉素(青霉素的衍生物)对感冒有效,然而棒曲霉素企业开展了1项严谨的多中心双盲对照临床试验观察其疗效,最终结果证明棒曲霉素是无效的[]。这项研究为后来著名的链霉素用于肺结核治疗的临床试验[]奠定了很好的基础。因此,在进行多中心临床试验时,无论是"非劣效性""等效性"或"优效性"临床试验设计,都应该注意保持"中立的视角",并采取预设的系统组织架构避免主观的偏倚及利益冲突。RAGA试验在2013年提出初步假设:与全身麻醉比较,局部麻醉可能降低老年患者髋部骨折术后谵妄的发生率。当时大部分麻醉医生观点是全身麻醉会增加术后谵妄,设计方案时绝对不能有意无意地设置一些偏向主流观点的指标,达到"想要"的结果。而且在试验实施过程、数据分析及论文撰写时,均要采取各种措施保持"中立的视角",这是多中心临床试验的关键。
02
研究问题的确立
研究问题的确立是整个临床试验的第1步,也直接影响研究各阶段的决策。因此深入理解临床实践,全面了解目前的研究进展及证据情况非常重要,可以通过阅读大量文献、做系统综述、meta分析或与同行、护士及患者交流等形式,找到研究问题。RAGA项目组也查阅了大量关于麻醉方式对髋部骨折及术后谵妄影响的相关文献。其中2篇分别在2010年和2011年发表于英国NICE Guideline[]。关于髋部骨折和谵妄管理的系统综述给了很大的启发。1篇认为现有的证据不能阐明麻醉方式对髋部骨折患者预后的影响;另1篇认为髋部骨折是术后谵妄的独立危险因素,麻醉方式是否对术后谵妄有影响有待进一步研究。因此基本确定了麻醉方式对髋部骨折患者术后谵妄的影响是值得研究的问题。当然,还需要考虑研究的可行性(feasible)、新颖性(novel)、伦理性(ethical)、是否引人注意(interesting)及与改变临床实践、健康政策等的相关程度(relevance),这5个维度称为"FINER"[]。在对这5个维度考证过程中,研究的假设就明晰了,即传统认为"局部麻醉可以减少老年患者术后谵妄"。如果研究结果是假设成立,则需要大力推广局部麻醉在老年患者髋部骨折手术中的应用;反之,则不需要顾忌全身麻醉的影响,使用全身麻醉来增进患者术中的舒适度。后续研究团队对英文文献的meta分析发现只有14项前瞻性研究将髋部骨折术后谵妄作为观察指标之一,仅5项为RCTs,其中4项RCTs的样本量均不超过40例,而超过300例的研究其主要观察指标并不是术后谵妄[]。2016年Guay等[]也系统综述了各种麻醉方式对髋部骨折术后各种预后指标的影响,其结论证据级别都很低,不能得出确切的结论。2018年《中华麻醉学杂志》发表的述评《中国麻醉学亟待解决的十大科学问题》就包括"全麻药物和围术期应激对衰老脑功能的影响及其远期效应"[]。这些都表明需要多中心临床试验来阐明这个问题,鼓励着RAGA团队坚持下去。
03
集思广益、完善研究方案
制订详尽的研究方案也是一个非常重要的步骤。首先要注意避免方法学上的缺陷,就需要统计学或流行病学专家早期介入方案的设计,重点协助数据收集、控制方法学上的偏倚。研究者需要对可能的混杂因素进行分类处理,对严重影响结果的因素,需要在设计上进行排除或通过动态随机等措施在方法学上进行控制。但过于严苛的控制会削弱RCTs研究结果与真实世界的关联性及试验的可行性等。多中心RCTs可以入组较多的受试者,平衡大部分混杂因素。在大样本量情况下,不需要严格控制试验对象,采用更接近临床实际的设计,即所谓的实效性临床试验(pragmatic clinical trial,PCT)[]。RAGA试验就采用了PCT,结合了观察研究的真实世界特性和RCTs的科学严谨性,可能得到更适合日常诊疗的结论。但PCT在方案设计和实施方面要求更高,需要各临床试验中心的研究者认同研究方案,自愿参加研究,为最终的方案做出妥协。所以,需要针对研究方案的原则性问题对计划参与研究的单位进行问卷调查。RAGA研究团队就麻醉方式、髋部骨折术前等待时间、术后住院天数等重要问题进行了系列调研。这些结果不仅能帮助筛选研究中心,而且也为方案的细化提供了依据,如:术后谵妄可以观察几天、麻醉干预措施如何控制等问题。问卷调查可采用德尔菲法,即修正、循环几次达到一致。另一种方式是问题导向的讨论会,条件允许下,可以召集各研究中心的协调研究者专门参与面对面方案讨论会,也可以就某个问题小范围讨论,不建议在国家或区域的学术会议上,让研究者们挤出时间讨论。研究者讨论会需要精心准备,会议主席要具有很高的学术威望,有引导大家达成一致的能力;项目负责人要有研究经验,并能在众多的建议和意见中甄别出对研究方案有帮助的信息,修正好方案细节。RAGA研究团队就谵妄量表等方案细节问题与神经专科医生进行多次小组专题讨论,并确定标准培训流程,保障各中心的操作一致。研究方案的打磨是一个漫长的过程,RAGA方案通过各中心人员面对面沟通、邮件问卷交流、模拟操作等各种形式,历时约18个月,最终促成了多中心临床试验启动会。
04
临床试验的实施
当临床试验方案确定、伦理获批、注册完成后,就进入实施阶段。临床试验实施阶段的宗旨就是"尽量保持与方案的一致性",一般有利于这条的措施,就要去创造条件实施。RAGA试验采取了中央随机系统,随机工作可以在麻醉前几分钟内完成,实现麻醉方式方案违背率在5%以内。临床试验电子数据管理系统[]极大提升了数据的可靠性,在线交流功能让数据质量控制变的非常便捷,显著缩短了数据采集和管理周期,节约人力。当然,最重要的工作是人员组织架构,要有总的项目管理员,各分中心的协调研究者,最好配备研究协调员、独立的项目质量控制人员;另外,根据需要设立各种临床试验相关的委员会,包括临床试验指导委员会[]、数据监察委员会[]、不良事件监查委员会、受试者委员会等。对于研究人员要进行标准化的培训和考核,达到要求后才能参与试验。RAGA试验的主要指标和重点的次要指标受人为因素影响较大,标准化操作就尤其重要。在试验进行过程中,仍需要对各中心进行监查,及时发现方案违背或偏离的现象并纠正。实施过程中应该注意的其他细节问题,可以参考"CONSORT statement"[]。
预试验是推进多中心临床试验很好的手段,分为外部预试验和内部预试验[]。外部预试验,又称为"可行性研究",是独立于多中心试验的各种小样本研究。其主要目的是分析主试验的可行性和有效性,如干预方式、剂量、频次等,随机和盲法是否适合,患者的接受度、样本量计算等。一般药物或新技术试验需要进行比较多的外部预试验,药物Ⅰ期临床试验就是剂量探索外部预试验。RAGA试验是比较两种常规的麻醉方式,有丰富的临床经验和文献数据支持,故只对随机和盲法等进行试点。内部预试验属于主试验的一部分,可以先进行内部预试验,数据分析后,调整后续试验的一些参数或变量,或重新计算样本量,两部分的数据最终可以一起分析。故内部预试验有节约样本等优势,但设计相对复杂,需要统计上控制Ⅰ类错误。近年热门的适应性设计[]就是采取这样的思路进行临床试验设计。
05
数据库与统计学分析
高质量病例报告表(case report form,CRF)是多中心临床试验获取高标准研究数据的必要手段。应当遵循以下设计原则:(1)完全遵循临床试验方案,方案中涉及的问题必须在CRF中体现,方案中不收集的信息一定不要出现在CRF中;(2)全面完整,简明扼要,没有歧义,结构化,标准化;(3)一般要符合临床试验访视流程和临床业务习惯,便于数据录入人员填写;(4)注意遵循CDASH标准,便于统一性、容易量化。当然,电子CRF可实现即时、跨区域、同步的临床资料收集特点,对多中心临床研究管理和实施帮助很大。需要注意的是,无论是电子或纸质CRF,都要经过所有中心研究者、监查员或协调员的测试并同意。
样本量的估算是方案设计阶段重点的统计工作。需要考虑研究目的、假设、设计方法、研究Ⅰ类错误(α)、Ⅱ类错误(β)、效应值及变异大小等,多中心临床试验的样本量计算需要考虑更多的因素,如中心效应[]、随机方式、各中心脱落率等。当然也可以采用复杂的适应性设计,在实施过程中调整样本量。RAGA方案规定的样本量是1 000例,在实施过程数据监察委员会发现实际脱落率远低于预计值,故建议达到950例时停止试验,最终由临床试验指导委员会决定停止试验。
统计学分析也需要事先制订计划(statistical analysis plan,SAP),但必须完全遵循方案并在数据库锁定、揭盲或数据分析前定稿。事先设定的统计分析结果,在证据级别上更可靠。事后分析,俗称"马后炮"分析,是对SAP的补充,RAGA也做了事后分析来支承主要的发现。但应当注意,事后分析只能作为提示性的信息,不能作为主要结论的依据。在导出可以分析的数据集之前,数据库要经过审查、清理、转换、验证4个步骤,然后锁定数据库。分析的第1步要根据方案和SAP确定分析集,即哪些患者应当统计在内,哪些患者应当排除[]。然后按既定的统计学方法,根据资料的类型进行统计学分析。统计结果表达的一般原则是:重点突出、层次清楚、简单明了。多中心临床试验要重点考虑中心随机效应,RAGA数据分析时,针对年龄、术前是否谵妄、术前是否老年痴呆和试验中心的差异,采取了混合效应模型[]进行校正分析。
06
总结
多中心临床试验是不同研究团队协作的系统工程,其方案应包容各方建议、求同存异;其实施过程应标准统一,采取各种方法化繁为简,提高临床试验的数据质量;规范多中心临床试验需要符合伦理和科学的选题与设计,统一、高标准地实施,透明规范地报告数据,才有可能获取可靠的、普适的研究成果,指导临床实践,助力麻醉与围术期医学发展。本文对多中心临床试验的一些普遍的问题进行了简要的归纳,期望能给准备开展多中心临床试验的麻醉同仁一些参考,有不足和错误之处,望指正。
转自:“医学科研与管理空间”微信公众号
如有侵权,请联系本站删除!