背景:
多组学研究为动脉粥样硬化性心血管疾病(ASCVD)提供了传统危险因素之外的精准预防和治疗策略。通过使用人工智能(AI)和机器学习(ML)方法,可以将多个组学和临床数据集集成到工具中,用于开发个性化的诊断和治疗方法。然而,目前仍需要解决数据质量、集成和隐私方面的多重挑战。
简介:
2023年10月6日,来自卢森堡健康研究所的Yvan Devaux教授课题组在Trends Mol Med(IF: 13.6)杂志上发表题为“Multiomics tools for improved atherosclerotic cardiovascular disease management”的文章[1]。在本文中,作者强调以AtheroNET COST行动为代表的共同努力在克服ASCVD研究中推进多组学方法的挑战方面发挥了关键作用,目的是促进更精准和有效的患者治疗。
主要结果:
多组学研究的方法学要求和挑战。
为了最大限度地发挥多组学研究的效用,它们应该包括大量数据的整合,不仅包括基因组学、转录组学、蛋白质组学和代谢组学,还包括生活方式(例如通过不同问卷收集的数据)和临床信息。此外,在多组学研究中,对组学技术的优势和缺陷的全面了解,以及适当的研究设计和研究计划是至关重要的,因为它决定了结果的准确性和可靠性。在设计研究时,必须仔细考虑样本量、样本来源和类型、组学平台、研究终点和统计分析方法等因素。在此,作者讨论了为ASCVD研究背景下的组学研究开发的各种技术[全外显子组测序(WES)、短读长测序(SRS)、批量RNA测序(bulk RNA sequencing)、单细胞RNA测序(scRNA-seq)、质谱(MS)和核磁共振(NMR)]及其优缺点,并建议在独立实验室之间更一致地使用和提高结果的可重复性。
全外显子组和短读长测序。
基因组序列在很大程度上独立于分析前变量,并且除了癌组织外,整个生命周期相对稳定。WES通常使用SRS进行,其中基因组被读取为短片段(150个碱基对),并从生物信息学上映射到参考序列。分析和解释、存储和处理能力的成本仍然很大。最近的泛基因组参考文献将改善与参考基因组相关的一些问题。在参考序列中标记罕见变异体的方法已经开发出来。此外,人们对非编码基因以及基因组的基因间区和调控区也越来越感兴趣。然而,线粒体基因组和嵌合体往往不能得到正确的评估,这一点在使用单细胞WES时在动脉粥样硬化中变得越来越明显。
批量和单细胞RNA测序。
批量RNA测序使我们能够对RNA图谱进行无偏倚的探索。然而,文库制备面临挑战,包括靶点富集和根据靶点丰度优化测序深度[例如,已知长非编码RNA (lncRNA)的表达水平非常低]。此外,能够同时分析长和短转录本的方案仍然很少。与标准的RNA测序方法不同,Oxford Nanopore平台依赖于直接RNA测序,这可以提供差异表达之外的信息,包括检测特异性RNA修饰。目前,该方法的主要局限性包括相对较多的起始材料(可能在临床研究中受到限制)、文库制备方案(特别是当关注lncRNA时)以及可供充分和可靠地检测改良碱基的生物信息学工具。单细胞图谱(如scRNA-seq)的出现凸显了组织和疾病中存在的细胞异质性,使其成为一个重要的讨论主题。
质谱和非靶向蛋白质组学。
MS仍然是非靶向蛋白质组学的首选方法。基于抗体和适配体的技术作为靶向策略正在获得发展势头,可以补充基于MS的方法,如选择性反应监测(SRM)和平行反应监测(PRM)。虽然从非靶向MS方法到靶向MS方法或蛋白质阵列失去了发现的潜力,但灵敏度(允许测量组织中的信号蛋白或血液中动脉粥样硬化斑块释放的产物)、可重复性和定量准确性的提高支持在临床实践中更快地整合替代生物标志物。尽管如此,非靶向的代谢综合征仍然是机制和药物开发研究的基础,特别是揭示模糊的蛋白质形式和蛋白质变异以及发现翻译后修饰。无论如何,如果我们加快实施更可重复和定量数据独立的获取方法(与经典的依赖数据的方法相反),消除在选择用于碎片化的蛋白质/肽时的随机性,产生更完整的数据,并生成可在实验室之间共享的光谱库,以协调蛋白质定量,那么非靶向MS的输出可以得到优化。
代谢组学分析平台。
代谢组学为发现疾病生物标志物提供了一种新方法,这些标志物可在临床症状出现之前评估疾病发生风险并诊断疾病(包括ASCVD)。靶向代谢组学专注于分析一组特定的感兴趣的分子,而非靶向代谢组学专注于生物样本在特定生理状态下的所有代谢物,事先不知道会发生什么。
由于分析仪器和生物信息学工具的进步,代谢组学领域在过去十年中呈指数增长。代谢组学研究的两个主要分析平台是核磁共振波谱和高分辨率质谱(HRMS)联合液相或气相色谱(LC或GC)。NMR具有提供脂质脂蛋白分布的结构信息的能力,但缺乏敏感性,且采购和操作成本较高。LCMS/MS技术具有高灵敏度和高选择性,具有宽动态范围的MS系统,是代谢组学研究中最常用的技术。
人工智能和机器学习作为多组学数据整合的解决方案。
如前所述,高通量组学技术与人工智能和机器学习相结合,为ASCVD风险预测提供了超越传统因素的个性化治疗和改善结局的前景。然而,要充分发挥基于人工智能/机器学习的ASCVD风险预测方法的优势,还需要解决几个挑战。首先,从同一患者收集不同类型数据的大规模研究对于准确的患者分层和风险预测至关重要。为了收集如此全面的数据集,多个机构和医疗保健提供者之间的合作也很有必要。然而,由于实验设计、样本制备、组学分析方法和数据分析工作流程的不一致,整合不同研究的数据具有挑战性。数据质量带来了另一个问题,因为某些组学数据(基因组学和转录组学)比其他组学数据(表观基因组学、蛋白质组学和代谢组学)更可靠和一致。这一差异使得我们难以开发出能够准确解释数据质量差异的AI/ML模型。由于数据格式、结构和描述的差异,以及与处理组学数据相关的复杂性,将AI/ML与临床数据整合存在额外的挑战。此外,临床数据中的信息不完整、不一致和噪声也会影响分析结局。还必须仔细考虑与种族、性别和社会经济地位相关的偏见,以避免AI/ML模型被夸大。
转化的观点。
为了促进研究结果从实验室向临床的成功转化,并推进ASCVD的治疗,建立明确的转化路线图势在必行。基于多组学的新型工具在临床实践中的应用不仅取决于其透明度和循证益处,还需要促进最终用户(即医疗服务提供者和患者)之间的信任。对这些创新工具的信任是采用和有效利用这些工具改善ASCVD管理的基石。
“组学工具在ASCVD治疗中的转化需要遵循循证医学原则。”任何一种新型组学工具的广泛临床应用之路都充满了多种标准,必须满足这些标准才能确保其可靠性和临床实用性。如前文所述,在发现过程中,分析前和分析前标准化对于确保结果的可重复性至关重要。我们需要大量独立的验证步骤来评估多组学生物标志物和模型在临床环境中的敏感性、特异性、阳性和阴性预测值以及总体诊断准确性。
多组学研究提供的丰富信息使诊断和治疗无缝交织的诊断方法得以发展。例如,孟德尔随机化研究可以利用遗传变异体作为自然实验来确定特定的生物标志物是否与疾病发病机制有关,从而帮助揭示因果关系。
结论和展望:
多组学研究有望发现新的ASCVD预防、诊断和治疗策略。近年来的研究表明,超越低密度脂蛋白(LDL)胆固醇等传统危险因素,抗炎药物对ASCVD的治疗有益。新的临床工具应该能够提供更多信息,从而更好地对ASCVD患者进行分层,并为每例患者量身定制新的方法,取代旧的一刀切方法。理想情况下,这种所谓的“深度表型”,以及随后的适当数据解读,将提供每个患者的独特分子身份,可以补充临床数据,然后用于特定的治疗方法或当前治疗的“微调”,就像现在正在进行的一些癌症治疗一样。随着ASCVD精准医学的不断发展,由于技术的快速发展,定义组学平台和生物信息学算法的理想组合具有挑战性。值得注意的是,可解释的ML和AI方法的持续开发对于提高患者和临床医师之间的信任和可用性至关重要。未来可能需要将组学数据与数字标志物合并,以增强预测和风险分层,从而有望改善患者治疗。
然而,就ASCVD而言,我们仍有很长的路要走,才能将这一概念从实验室推广到临床。高通量组学技术的高成本仍然阻碍了其在大规模研究中的广泛应用。重要的是首先讨论和解决一些基本挑战,然后为心血管研究开发和实施适当的多组学方法。从研究设计和方法学的挑战到数据处理和数据整合,面临的挑战是多方面的,很明显,要成功克服目前的障碍,需要跨学科的共同努力。将研究人员、分析专家、临床医师和数据科学家聚集在一起可确保结果的准确性和普遍适用性,并加速多组学方法在临床中的实施。这一跨学科概念是在动脉粥样硬化性心血管疾病预防和研究中实施多组学方法的CA21153网络(AtheroNET COST)的基础。
原文链接:
https://www.cell.com/trends/molecular-medicine/fulltext/S1471-4914(23)00219-8?_returnURL=https%3A%2F%2Flinkinghub.elsevier.com%2Fretrieve%2Fpii%2FS1471491423002198%3Fshowall%3Dtrue
参考文献:
[1] Sopic M, Vilne B, Gerdts E, Trindade F, Uchida S, Khatib S, Wettinger SB, Devaux Y, Magni P; EU-AtheroNET COST Action CA21153. Multiomics tools for improved atherosclerotic cardiovascular disease management. Trends Mol Med. 2023 Oct 6:S1471-4914(23)00219-8. doi: 10.1016/j.molmed.2023.09.004. Epub ahead of print. PMID: 37806854.
转自:“生物医学科研之家”微信公众号
如有侵权,请联系本站删除!