医学科研与管理空间 2022-04-27 15:30
中华外科杂志, 2022,60 陆俊, 许斌斌, 沈莉莉, 等.
摘要
目的
探讨2000—2019年胃癌随机对照试验(RCT)研究的开展现状和已发表RCT研究的基本特征。
方法
在ClinicalTrials.gov网站搜索2000年1月至2019年12月期间注册的以“胃癌”为关键词的三期或四期RCT研究,记录其基本特征。搜索PubMed和Scopus数据库以确定计划在2016年6月前结束的RCT研究的最终发表状态。使用《医学科研论文撰写的基本要求》评估已发表RCT研究的报告充分性。根据存在的偏倚和(或)系统综述的引用情况,评估是否存在可避免的设计局限。采用χ2检验或Fisher确切概率法对数据进行分析。
结果
共纳入262项RCT研究,呈逐年上升趋势(从2000年的1项升至2015年的30项)。干预措施为靶向治疗或免疫治疗的RCT研究占比从2000—2004年的0升至2015—2019年的37.1%(36/97)。亚洲地区注册的RCT研究为191项,非亚洲地区为71项;非亚洲地区多中心RCT研究的比例高于亚洲地区[70.4%(50/71)比50.3%(96/191),χ²=8.527,P=0.003]。分析137项RCT研究的成果发表状态,81项(59.1%)已发表;其中65项(80.2%)判定为报告充分,63项(77.8%)判定为存在可避免的设计缺陷。
结论
靶向和免疫治疗相关RCT研究正在成为胃癌研究热点。目前亚洲地区开展的多中心临床研究较少,已开展RCT研究的成果发表比例较低。已发表的RCT研究中相当一部分报告不充分,存在可避免的设计缺陷。
随机对照试验(randomized controlled trial,RCT)在研究设计、患者招募、随访和数据分析等环节需要投入较大的人力物力。Chapman等[]分析了2011年1月至2012年12月注册的304项外科相关大型RCT研究,发现259项存在资源的无效使用;包括可避免的设计缺陷降低了研究结果的可信度;未发表的研究成果无法为其他学者提供有益参考,增加后续研究参与者的风险;已发表的研究成果存在报告不充分,研究结果难以获得重复验证并有效投入临床实践。优化科研资源的使用,使科研成果更多惠及临床,能够产生可观的社会效益与经济效益[]。目前,胃癌临床研究项目日益增多[],我们利用公共数据库探讨胃癌领域RCT研究的变化趋势,并根据文献[],就研究是否发表、论文撰写规范性完整性和研究方案设计3项特征对RCT研究进行综合评价,分析胃癌领域科研资源应用的效果,以期为优化RCT实践,促进研究结果更加适应临床需要,推动临床转化效能提供参考。
01
资料与方法
一、研究对象
于临床试验注册中心ClinicalTrials.gov(https://clinicaltrials.gov)采用关键词“gastric cancer”进行检索,限定注册时间为2000年1月1日至2019年12月31日,研究类型为三期或四期临床试验,共检索到306项研究。通过筛选标题和摘要,排除非RCT研究 31项、非三期或四期临床试验3项、与胃癌无关的研究9项、重复研究1项,最终262项RCT研究纳入分析。
二、研究内容
1.基本特征:审查员收集每项研究的基本特征,包括干预措施类别、是否为多中心研究、主要研究者所在地区、招募病例数量、资助基金来源和其他由 ClinicalTrials.gov 审查人员审核的关键要素[]。根据研究中对照组与试验组所对比的干预措施是否涉及药物使用,将研究分为药物治疗、非药物治疗[]。主要研究者所在地区分为亚洲、非亚洲,基金资助分为无或部门拨款、企业或其他外部基金资助,盲法设计分为开放标签、单盲、双盲及以上,研究臂数分为双臂、三臂及以上,招募病例数量分为<200例、≥200例。
2.发表状态判定:选择计划在2016年6月前结束的研究,2名审查员在 PubMed 和 Scopus上使用 NCT 编号、主要研究者名称和与研究内容相关的关键词进行搜索,确定研究成果是否发表。对主要研究者来自中国的研究,在万方及知网平台按照相同方法进行补充检索。逐一审查检索到的论文的内容,确定其与研究的对应关系。
3.报告充分性评估:根据2010版《医学科研论文撰写的基本要求》(Consolidated Standards of Reporting Trials,CONSORT)评估每篇已发表论文的报告充分性。根据研究采取的干预措施是药物治疗或非药物治疗,分别审查37或40项条目[],每个项目赋值1分。评估前对论文进行盲法处理,2名审查员独立审查论文和评分,出现差异时通过协商一致解决。CONSORT条目符合率达75%时(药物治疗研究符合28项,非药物治疗研究符合30项),判定为报告充分[]。
4.研究方案设计缺陷评估:(1)2名审查员根据Cochrane工具评估论文的偏倚风险,包括选择偏倚、实施偏倚、测量偏倚、随访偏倚、报告偏倚和其他偏倚[]。选择偏倚关注随机分配方法和分配隐藏方案的描述,实施偏倚关注是否对受试者和干预提供者施盲及其对研究结果的影响,测量偏倚关注是否对结果评价者施盲及其对研究结果的影响,随访偏倚关注结局数据的完整性及其对研究结果的影响,报告偏倚关注汇报的结果与研究方案是否一致。每项评估结果分为低风险、不明确、高风险。(2)记录论文是否引用与研究方向相关的系统综述;对于未引用者,记录作者是否给出不引用的理由。
存在上述偏倚之一或未引用相关系统综述的研究,认为存在可避免的设计缺陷。同一研究分多次发表(包括事后分析)时,仅分析报告主要终点结果的论文。如论文中已明确指出部分研究结果已于前文发表,补充审查所述论文的相关内容。如该研究的中期报告中已详细描述了随机分配方法,且报告主要终点结果的论文对其进行了引用,则根据中期报告中的描述进行评估。
5.研究终点:(1)阐述近20年胃癌RCT研究的特点及发表情况;(2)评估已刊发论文的报告充分性及研究是否存在可避免的设计缺陷。
三、统计学方法
采用R 3.6.1统计学软件对数据进行处理。分类资料以频数和百分比表示,无序分类资料组间比较采用χ²检验或Fisher确切概率法。以P<0.05为差异有统计学意义。
02结果
一、胃癌相关RCT研究的特征
1.基本特征:全部262项RCT研究中,干预措施为药物相关的研究占比为72.9%(191/262),多中心研究占比为55.7%(146/262),接受来自接受企业或其他外部基金资助占比29.4%(77/262)(表1)。
表12000—2019年注册的262项胃癌相关随机临床试验的基本特征
2.胃癌RCT注册数量的变化:胃癌RCT的注册数量随着年份逐渐增加,从2000年的1项增长为2015年的30项,此后增长趋势趋于平缓,2018—2019年每年注册15项(表2)。
表22000—2019年不同干预措施类型胃癌相关随机临床试验的逐年注册数量(项)
3.不同干预措施研究占比变化:由于2007年及以前的胃癌注册研究数量较少,因此将2000—2019年每5年分为一个时间段,计算不同干预措施研究数量及其占比随时间变化的情况。围手术期放化疗研究的绝对数量虽有增长,但占比持续下降;靶向或免疫治疗研究的绝对数量和占比呈上升趋势;外科治疗研究的占比相对稳定,其他研究略有下降(图1)。
图12000—2019年不同干预措施类型胃癌相关随机对照试验每5年的注册数量及占比
4.多中心研究在不同地区的分布:尽管各时间段亚洲地区注册RCT数量高于非亚洲地区,但非亚洲地区多中心RCT研究比例高于亚洲地区[70.4%(50/71)比50.3%(96/191),χ²=8.527,P=0.003](表3)。
表32000—2019年不同时间段亚洲和非亚洲地区胃癌相关随机对照试验中单中心和多中心研究的构成情况比较(项)
二、发表状态
137项研究计划在2016年6月之前结束,研究成果发表于同行评审期刊的比例为59.1%(81/137),研究干预措施为药物治疗的比例为74.5%(102/137)。未发表研究中亚洲地区注册研究的比例高于已发表研究[83.9%(47/56)比65.4%(53/81),χ²=5.746,P=0.017],招募病例数<200例、单中心研究、无资助或仅为部门拨款的比例亦高于已发表研究(P均<0.05)(表4)。
表42000—2019年胃癌相关随机临床试验中已发表研究与未发表研究特征的比较[项(%)]
三、报告充分性
按照CONSORT对已发表的81项研究进行报告充分性评估,判定为报告充分的比例为80.2%(65/81)。药物治疗的64项研究中,报告不足主要发生在研究方案(68.7%,44/64)、随机序列生成机制(54.7%,35/64)及随机序列分配实施(53.1%,34/64)等环节。在非药物治疗的17项研究中,报告不足主要发生在干预者对方案的依从性(16/17)、实施干预的标准化(13/17)、研究方案(12/17)、随机序列生成机制(11/17)及随机序列分配实施(11/17)。相较于报告不足的研究,报告充分的研究中,药物治疗、多中心研究及招募病例数≥200例的比例较高;以2010年为界进行亚组分析,发表于2010年前的研究中报告充分的比例低于发表于2010年及以后的研究(P均<0.05)(表5)。
表52000—2019年已发表的胃癌相关随机临床试验中报告充分与不充分研究特征的比较[项(%)]
四、设计缺陷
81项成果已发表的研究中,63项(77.8%)存在至少有一种不明确或高风险的偏倚风险;常见的原因是报告偏倚(63.0%,51/81)、随机序列分配隐藏(56.8%,46/81)和结果评价者盲法(54.3%,44/81)(图2)。26项研究(32.1%)未引用相关的系统综述。在上述63项存在可避免的设计缺陷的研究中,注册于2000—2009年和招募病例数<200例的比例高于不存在设计缺陷的研究(P值均<0.05)(表6)。
图22000—2019年已发表的81项胃癌相关随机临床试验中潜在偏倚评估结果的百分比堆积条形图[项(%)]
表62000—2019年已发表的胃癌相关随机临床试验中存在与不存在设计缺陷研究特征的比较[项(%)]
03讨论
一、靶向与免疫治疗研究开展比例逐年增加
由于目前缺乏相关研究结果,我们尝试利用ClinicalTrials.gov网站的信息,分析了2000—2019年262项胃癌相关RCT研究的特征,发现近5年围手术期靶向或免疫治疗研究的注册数量明显增加。随着外科治疗尤其是微创手术应用于胃癌患者取得高级别循证医学证据[],围手术期放化疗、靶向或免疫治疗将成为未来胃癌的主要研究方向[],担负着胃癌治疗取得突破性进展的重任。因此,对于有志于胃癌领域的青年学者,应注意从临床实践中发现问题,结合当前该领域包括基础研究在内的发展方向和最新成果,根据实际条件科学严谨地制定研究目标并进行长期规划,并避免进行重复和低效的研究。
二、已发表的RCT研究多存在可避免的设计缺陷
良好的科研设计是高质量临床研究的前提,在研究设计时需对相应领域已有的研究成果进行充分的系统回顾[]。然而,在已发表的81项研究中,有26项(32.1%)未在文中明确指出研究设计是否进行了此项工作。科研人员应密切关注学科发展,在设计研究时,应避免重复已经研究过的问题,可在已有工作的基础上,借鉴其经验,并提出新的方法改进其缺陷。
研究设计的特征如分配隐藏、盲法和随机方法等亦影响效果估计的大小,这种影响在主要研究终点是主观结果时尤为明显[]。本研究中,77.8%的研究存在可避免的设计缺陷,这一比例超出我们的预期。严格控制误差,是提高临床试验结果科学性可靠性的重要环节[]。研究的管理者应重视开展针对研究参与人员的方法学培训[]。本研究中,设计缺陷常发生在随机序列分配隐藏和评估者盲法等环节,未来开展研究时应重点注意。受研究对象和研究者主观因素的影响,在设计、资料收集或分析阶段容易出现信息偏倚;而盲法的使用难度较小,成本效益比高,在条件允许的情况下应尽量使用盲法设计。
三、已发表RCT研究的报告充分程度仍待提高
充分报告临床试验结果,有助于读者判断该结果是否适用于自身的临床实践。规范、透明和清晰的报告不仅有利于提高RCT研究结果的可信度,亦能促进成果向诊疗指南转化。我们在评价报告充分程度时,使用了2010年发表的2份CONSORT,该版本与2001年版[]基本一致,细化了项目内容,修订了表述方式,提高了实操性[]。结果显示,80.2%的研究达到了报告充分的标准,但是对研究方案和随机化情况的报告质量不佳,可能会影响读者对临床试验整体设计的理解。研究者与期刊共同努力,利用好CONSORT工具,胃癌RCT研究的报告质量仍有相当大的提升空间。
我们还发现,在干预措施为外科治疗的研究中,部分研究未详细描述手术干预措施及干预措施标准化情况。Bencini等[]报告了一项多中心RCT研究,探讨胃切除术中同时行胆囊切除术对患者术后胆石症发生率及总体并发症发生率的影响,但既没有阐述主要干预措施在不同中心间的实施步骤,亦没有对两组患者的围手术期管理进行标准化处理。而在JCOG0110研究中,作者则详细描述了实验组与对照组的干预措施,并实施1年3次的质控监测[]。研究实施过程中的质量控制是保证研究质量的重要手段[],外科干预在方法、技术、设备等方面较药物干预具有更高的可变性,干预措施汇报的详尽程度直接决定了该研究的可重复性和结果的可信度,也是未来研究者在开展外科相关RCT研究时应重点注意的方面。
四、从关键环节入手开展高质量RCT研究
分组比较的结果显示,盲法实施、多中心研究、招募病例数≥200例、外部基金资助等特征可能有助于高质量临床研究的开展。在已发表的研究中,获得企业或其他外部基金资助的比例较未发表的研究更高;如果不考虑利益冲突,这提示我们,对于无资助或仅为部门拨款资助的研究,应加强研究实施情况的监管,督促研究者更多地发表其研究结果。
大样本、多中心研究可能由于有完善的设计和长期规划,或者更受期刊的偏爱,因此更容易发表。样本量不足是临床研究中常见的问题,容易让研究者陷入无法甄别阴性结果究竟源于治疗手段无效还是假阴性的困境[]。我国胃癌人群基数大、案例丰富、进展期胃癌占比大,有利于开展多中心大样本前瞻性研究,研究者应充分利用这一优势,开展更多高质量临床研究[]。
尽管如此,小样本、无外部基金资助的小型临床试验可以帮助研究者们在较短时间内完成某一选题的初步探索,并为未来大型临床试验奠定前期基础,应与多中心大样本临床试验互为补充。学者应针对不同的临床问题,选择恰当的研究策略;也希望期刊不是仅关注研究的参与中心数目和样本量,而是更关注研究本身所关注的科学问题,以及研究结果可能为临床实践带来的优化提升,给更多有价值的研究更充分的展示交流机会。
五、局限性和展望
第一,全面探索如何提升临床研究成果的实践转化效能是一项复杂的工作,绝不应仅限于本研究提及的是否发表、报告充分性和可避免的设计缺陷3个要素。第二,ClinicalTrials.gov仅是WHO认可的注册机构之一,本研究中未纳入其他国家和地区的特定注册机构。第三,各类研究终点均由人工收集,部分指标不可避免地受到主观判断的影响。第四,我们试图以胃癌领域为鉴,举一反三,呼吁国内同道对临床试验的设计和开展进行理性再思考、再优化,为未来开展合理的临床研究提供借鉴;但同时我们也承认,以临床试验为代表的科学探索必然是一个不断试错不断纠错的过程,不同领域针对不同临床问题设计的临床试验必然存在差异,我们采用的文本分析方法存在滞后性,亦无法涵盖未来可能会出现的具体问题。从研究目的、研究设计、研究执行等多维度着手,优化科研资源的使用,促进研究成果转化,将是未来我们持续努力的目标。
如有侵权,请联系本站删除!