投稿问答最小化  关闭

万维书刊APP下载

【文献译读106】精准医疗时代UKB高影响力论文的贡献

2023/7/21 10:16:37  阅读:45 发布者:

文献分享会

回顾英国生物库中发表的影响最大的研究,评估其对 "精准医疗 "的贡献。我们回顾了2008年至20195月期间从英国生物库中发表的689项研究中的140项,这些研究通过引用、替代指标数据或在高影响力期刊上发表而被认为具有高影响力。我们根据这些研究是否(1)主要是方法论文,(2)主要复制了先前的研究结果或关联,(3)产生了新的研究结果或关联,(4)开发了风险预测模型,但与先前的模型相比,这些模型在风险估计方面没有产生临床上显著的改进,或者(5)开发的模型在个体化风险评估、定向筛查或定向治疗方面产生了显著的改进,对这些研究进行了分类。最后一类代表 "精准医学"。我们将15篇文章归为第1类,33篇文章归为第2类,85篇文章归为第3类,6篇文章归为第4类,1篇文章归为第5类。在对英国生物库的前7年和基因数据可用性的前4年进行的评估中,大多数有重大影响的英国生物库研究要么重复了已知的关联,要么产生了新的关联,但在风险预测、筛查或治疗方面没有临床相关的改进。这些信息可能对其他队列研究的设计者有用,有助于设计和随访,促进精准医学研究。

前言

英国生物库(UKB)是正在进行的几项大型前瞻性队列研究之一,其既定目标是提供有关常见和不常见疾病病因的新见解。UKB最初构想于21世纪初,是一项纵向研究,研究对象是英国国民健康服务局登记在册的50万英国公民,基线年龄为40-69岁。将研究嵌套在国家卫生服务机构内是该研究的主要设计特点,这促进了招募工作,并为后续研究提供了便利。2006-2010年的初始数据收集包括广泛的诊室临床测量和多种问卷调查。研究经费用于对队列中的子集进行额外的表型分析,例如对10万人进行视网膜扫描。在几篇设计论文中,UKB的主要研究者指出,该研究的结果将有助于制定更好的预防、诊断和治疗各种危及生命和致残性疾病的策略。

UKB这样的大型前瞻性研究的一个潜在成果可能是最终能够改善对个体患者的预测。在当前的大数据时代,"个体化医疗 "是对未来的想象,即能够为每个独特的个体量身定制预防、诊断和治疗方案。最近,"个性化医疗 "一词已被目前流行的 "精准医疗 "一词所取代,但两者的目标似乎相似--针对个体而非大群体的诊断和治疗方法的能力大大提高。目前改进治疗选择的例子包括使用基因阵列检测早期乳腺癌。尽管人们对 "精准 "医疗的兴趣日渐浓厚,但将大量生物库数据转化为有临床意义的预测所面临的挑战是多方面的。数据收集和挖掘需要大量的人力和物力,数据的有效性仍然是最重要的,但很难在如此大规模的数据中得到保证,有意义的预测所需的相对风险不能通过增加样本量来保证。此外,人们还担心 "消费者基因组学 "固有的市场压力以及过度诊断和治疗的风险。像UKB这样的大型数据库是否能够在独特的个体水平上促进医学决策,目前仍不确定。

截至20195月,UKB已发表了689项研究。随着7年多的基线数据可用性、4年多的遗传数据可用性以及通过与英国国民健康服务的数据链接进行的近10年的随访,评估UKB在多大程度上开始实现其既定目标或更具挑战性的更高医疗精准度目标成为可能。这样的评估可能对其他队列研究的设计和随访有帮助。因此,我们对引用次数最多、Altmetric评分最高、发表在影响最大的期刊上的已发表论文进行了回顾,按照从简单描述UKB资源到改进预测或精准医疗的层次对论文进行了分类。

研究方法

从英国生物库网站(http://www.ukbiobank.ac.uk/)获取截至201957日使用英国生物库研究数据发表的文章列表。当时的期刊论文总数为689篇。为了关注影响最大的研究,对于在综述日期前发表的每项研究,我们收集了传统引用指标、替代指标和期刊影响因子。我们认为,发表在高影响力期刊上、被引用次数较多且替代指标得分较高的文章将代表UKB迄今为止发表的最重要的论文。

每篇文章的引用指标均通过SCOPUS获得(如有)。从altmetric.com获取每篇文章的替代指标(新闻提及率、Twitter提及率、Mendeley阅读量等)。我们根据文章的引用次数、Altmetric关注度得分(根据替代指标数据得出的文章影响力汇总指标)和期刊影响因子对文章进行排序。

我们通过这三种方法分别对前10%的文章进行了审查。如果3种分组方法之间存在重叠,我们不会在综述中添加新的文章。我们决定将Nature Genetics排除在最高影响因子期刊名单之外,因为已有16Nature Genetics的研究被纳入最高被引和最高Altmetric类别--比其他任何期刊都多。

文章由两名审稿人进行评估,并归入以下类别之一:

1. 描述英国生物库研究方法的文章,或描述英国生物库数据集带来的研究方法进展的文章。

2. 重复旧的关联(通常使用更大的数据集)或提供新的患病率或标准数据的研究。

3. 发现新的遗传或其他方面关联的研究。这些研究结果虽然新颖,但在预测、诊断或治疗方面并无重大改进。

4. 建立了预测模型,但与以前的模型相比,在临床上并未显示出明显的预测改进的研究。

5. 研究开发了患者选择方法或预测模型,能够显著改善预测、改善风险评估、更有针对性的筛查和/或更有针对性的治疗。这类研究代表了 "精准医疗"

当两位审稿人对文章进行不同分类时,他们将共同裁定分类。如有必要,第三位审稿人将打破任何平局。

研究结果

3种论文筛选方式存在相当大的重叠,最终共纳入140篇文章(表1,补充表1)。纳入的研究发表于2008年至2019年,在研究问题、方法和结果方面差异很大。如上所述,Nature Genetics收录了16篇文章,多于其他期刊(表2)。在140项研究中,77项主要侧重于遗传分析,包括全基因组关联研究(GWAS)、全表型关联研究(PheWAS)、孟德尔随机化研究和遗传风险评分研究。在这140项研究中,有64项研究利用了另一个联盟/研究的数据,通常作为发现集或验证集。

在收录的140篇文章中,除12篇外,审稿人对其他所有文章的分类均达成一致。最初分类中的所有差异均通过共同裁定解决;从未要求第三位仲裁者。另有10篇文章由于任何一位审稿人都不清楚其适当的分类而进行了联合裁定。审稿人将15篇文章归为第1类,33篇归为第2类,85篇归为第3类,6篇归为第4类,1篇归为第5类(表3)。在审稿人不确定且无法验证研究关联是否真正新颖的情况下(第2类与第3类),我们将研究评为第3类。在利用英国生物库复制其他数据集中发现的新基因结果的出版物中,我们将这些研究评为第 3 类。下面以每种情况下引用率最高的文章为例,介绍每类研究。

1类:描述英国生物库研究方法本身或描述英国生物库数据集带来的研究方法的进步

Sudlow C, Gallacher J, Allen N, et  al. (2015). UK Biobank: An Open Access Resource for Identifying the Causes of a Wide Range of Complex Diseases of Middle and Old Age. PLoS Med 12(3): e1001779.

引用: 252

Altmetric关注度得分: 99

Sudlow等人的2015年论文中,作者描述了英国生物库研究的设计以及收集的数据,并对研究的资金、监督和管理进行了补充评论。作者还介绍了数据的在线开放访问,并鼓励英国以外的研究人员申请访问。

2类:重复旧有关联(通常使用更大的数据集)或提供新的流行率或常模数据的研究

Di Angelantonio E, Bhupathiraju SN., Wormser D et al. (2016). Body-mass index and all-cause mortality: individual-participant-data meta-analysis of 239 prospective studies in four continents. Lancet; 388(10046): 776786.

引用: 179

Altmetric关注度得分: 1298

Di Angelantonio等人的2016年研究中,作者对189BMI前瞻性研究(包括英国生物库)中3951455人的个人参与者数据进行了荟萃分析。这些研究来自亚洲、澳大利亚、欧洲、新西兰和北美。为了限制混淆和反向因果关系,他们将研究对象限定为从不吸烟者,排除了原有疾病患者,并将研究对象限定为前5年随访存活者。主要分析了随访期间385,879例死亡以及相对于体重指数22.5-<25.0 kg/m2的年龄和性别调整危险比(HRs)。作者发现,BMI20-25的人群全因死亡率最低,在所有四大洲,死亡率随着BMI的升高呈近似对数线性增长。这些结果对在超重和中度肥胖范围内BMI增加对死亡率有保护作用的说法提出了质疑。作者得出结论认为,应支持应对各种过量脂肪的策略。这篇论文的审稿人并未将本文中的任何研究结果评为新发现,只是重复了之前的研究结果。

3类:发现遗传或其他方面新关联的研究。这些研究结果虽然新颖,但并不能显著改善预测、诊断或治疗效果

Okbay A, Baselmans B, De Neve JE (2016). Genetic variants associated with subjective well-being, depressive symptoms, and neuroticism identified through genome-wide analyses. Nature Genetics; 48: 624633.

引用: 108

Altmetric关注度得分: 714

Okbay等人的2016年研究中,作者利用英国生物库数据对三种表型进行了全基因组关联研究:主观幸福感(n=298,420)、抑郁症状(n=161,460)和神经质(n=170,911)。作者发现了3个与主观幸福感相关的位点、2个与抑郁症状相关的位点和11个与神经质相关的位点。他们在一个独立的抑郁症样本中复制了2个与抑郁症状相关的位点。这些发现支持了这样一种观点,即如果有足够大的样本,GWAS可用于鉴定与高度多基因表型相关的基因。然而,作者指出,每个SNP的解释力很低,要解释 "适度份额 "的遗传性,必须鉴定数百至数千个变异。审稿人认为这些发现很新颖,但没有提出预测模型。

4类:建立了预测模型,但未显示与以前的模型相比在临床上显著提高了预测能力的研究

Khera AV, Chafn M, Aragam KG, et al. (2018). Genomewide polygenic scores for common diseases identify individuals with risk equivalent to monogenic mutations. Nature Genetics; 50: 12191224.

引用: 71

Altmetric 关注分数: 1506

Khera等人利用英国生物库开发并验证了五种常见疾病的全基因组多基因风险评分。该方法分别确定了8.0%6.1%3.5%3.2%1.5%的人群患冠心病、心房颤动、2型糖尿病、炎症性肠病和乳腺癌的风险增加了三倍以上。接收者运算曲线分析报告的曲线下面积从0.63(炎症性肠病)到0.81(冠心病)不等。然而,这些风险评分还包括年龄和性别,而年龄和性别是独立预测风险的有力因素。对于所研究的疾病,没有与其他风险估计方程进行比较。审稿人认为,所开发的GPS,尤其是在剔除年龄和性别的情况下,可能不会优于其他临床风险预测指标。

5类:研究开发的患者选择方法或预测模型能够显著改善预测、改善风险评估、更有针对性的筛查和/或更有针对性的治疗。这类研究代表了 "精准医学"

Muller D, Johansson M, and Brennan P (2017). Lung cancer risk prediction model incorporating lung function: Development and validation in the UK Biobank prospective cohort study. J Clin Oncol 35: 861869.

引用: 4

Altmetric关注度得分: 16

2017Muller等人的研究中,作者利用502321名既往未诊断肺癌的英国生物库参与者的数据,建立了一个估计2年肺癌概率的模型。该模型包括性别、尼古丁成瘾和吸烟史相关因素、肺癌家族史、病史和肺功能(1秒内用力呼气容积)。在1,469,518人年的随访期间,共诊断出738例肺癌。该模型具有很好的鉴别力(c index0.85 [0.82-0.87]),明显优于标准肺癌筛查资格标准(c-statistic=0.66 [0.64-0.69])。它还经过了良好的校准和内部验证,但未经外部验证。

讨论

我们回顾了利用英国生物库数据发表的140篇(共689篇)影响最大的论文,根据引用数据、替代指标数据和期刊影响因子估算,这些论文代表了前10%的论文。我们根据论文是否回顾了研究方法(第1类)、是否重复了已知的关联(第2类)、是否产生了新的关联(第3类)、是否开发了新的预测模型(第4类)或是否展示了显著改善的预测、风险评估、筛查或治疗(第5类)进行了分类。迄今为止,英国生物库中85%以上的高影响力论文属于第2类或第3类。六项研究报告了新的预测模型,经我们审查,一项研究在现有模型的基础上对风险预测进行了重大改进。

这些数据与英国生物库的既定目标一致--调查与中老年疾病相关的已知和新型风险因素,包括遗传因素和其他因素。目前有许多前瞻性生物库研究正在进行招募--如韩国国家生物库、加拿大明日合作计划和美国 "我们所有人 "研究计划等。随着生物样本库研究的不断增加,以英国生物样本库为早期范例来说明其他生物样本库可能产生的研究成果是很有启发性的。这里包括的一半以上的研究主要是遗传学性质的,近一半的研究利用了其他联盟的数据进行发现、复制或验证。上文提到的Okbay等人和Khera等人的研究体现了许多遗传学研究的发现。他们发现了与表型性状相关的新基因位点,进行了孟德尔随机化以确定基因与结果之间的因果关系,或开发了多基因风险评分。根据我们的评估,虽然来自生物库的基因数据已经产生了一系列引人入胜的见解和关联,但尚未在 "精准 ""个性化 "医疗方面取得重大进展。英国生物库产生的基因数据和基因见解,即使与其他联盟的数据相结合,也尚未在个性化风险评估、筛查或治疗方面取得重大突破。鉴于许多其他生物库研究的既定目标--推进精准或个性化医疗,这一点意义重大。

我们的研究有几个局限性。首先,我们的搜索方法依赖于英国生物库网站上最新的已发表研究列表,因此我们可能遗漏了一些已发表的论文。其次,我们选择了引用率、Altmetric关注度得分和期刊影响因子排名前10%的文章。这些都是衡量影响力的不完善指标,我们可能会因此而遗漏一些重要研究,尤其是那些发表在低影响力期刊或无影响因子的BioRxiv上的研究。然而,我们可以合理地认为,我们的选择方法代表了研究类型的频率。第三,尽管每项决定均由两名独立审稿人做出,并由他们裁定任何初步分歧,但审稿仍具有一定的主观性。

另外一个限制因素是,10年在大型研究的生命周期中是一个相对较短的时间。如果有时间进行更长时间的随访、再接触研究以及更广泛的基因分型和表型分析,UKB的遗传学洞察力有可能被用来推动 "精准医学 "的到来。随着核磁共振成像数据、新生物标记物和全基因组测序数据的收集,更深入的表型分析正在进行中,尚未见报道。随着UKB内部或外部的新发现,冷冻样本可能会被挖掘出新的见解。此外,英国生物库提供的数据共享机会是独一无二的,可以进行传统出版途径可能无法获得的分析。私营企业可以获取数据以寻求治疗或检测方面的进步。一些作者选择在互联网上发布自己的GWAS结果,供所有人访问和浏览[16]。随着时间的推移,这些方法可能会带来一些进展,这些进展不容易被这类分析所捕捉,但仍可能有助于 "精准医疗"

最后,我们承认重复的重要性,因为纳入的许多研究都是重复分析。毫无疑问,这对 "精准医疗 "和整个科学界都有价值。然而,我们不禁要问,像英国生物库这样规模和成本的研究是否需要进行复制分析,事实上,这是否是英国生物库的初衷。

总之,根据对140项研究的审查,这些研究代表了根据引用数据、替代指标数据和期刊影响因子估算的前10%的出版物,目前发表的大多数研究要么重复了已知的关联,要么产生了新的关联,但在风险预测、筛查或治疗方面没有直接的临床相关改进。由于在第345类中有如此多的新发现,UKB的既定目标正在逐步实现。其他队列研究提出的 "精准医疗 "这一更具挑战性的目标,从目前UKB发表的文章来看似乎并不迫切。这些知识可能对其他队列研究的设计者有用,有助于设计和随访以促进精准医学研究。

转自:“一起学科研”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com