10. 生物网络、机制研究和肺血管疾病网络医学
2012年,Parikh等人从经过筛选的文献中编制了一个包含131个与PH发展直接相关的基因列表(即PH疾病模块)。TargetScan 5算法在PH模块内识别了miRNA靶点,并关注了在包含超过14,000个蛋白质和超过170,000个功能性或物理蛋白质相互作用信息的综合互作图中识别出的miRNA-蛋白质对(蛋白质-蛋白质相互作用)。从这个方法中,miR-21被确定为对低氧敏感且在体内可能与PH相关。随后的实验数据验证了miR-21对肺血管重塑的功能重要性,通过抑制RhoB表达和促进血管生成的Rho激酶活性。
Samokhin等人从各种资源中汇编了纤维化基因,并根据功能性(即生理性的创伤愈合与病理性的血管纤维化)对其进行了分离。结果被映射到综合互作图中,并在由醛固酮调节的基因靶点的背景下进行了分析,醛固酮在PAH中增加并已知具有促纤维化作用。介数中心性利用网络距离来量化通路的重要性,用于排名对于区分这两种纤维化功能特别重要的网络特征。这种方法在体内确定了Cas蛋白NEDD9(神经前体细胞表达发育下调蛋白9)作为PAH中的新型促纤维化中介体。验证实验确定了位于位置18的氧化敏感半胱氨酸巯基,它调控了COL3A1的转录和PAH中的血管纤维化,而在汇合工作中,显示NEDD9在慢性血栓栓塞性PH的发病机制中也很重要。
最近的机制数据表明,Csf2/GM-CSF(粒细胞-巨噬细胞集落刺激因子)在PAH中引起炎性血管损伤,这引发了补体蛋白的循环水平在预后上可能很重要的可能性。由于调节补体途径的复杂性,以及对可能对PAH重要的补体蛋白的确切亚组的不确定性,因此在预先考虑非还原主义方法时,确定最具信息量的中间体是必要的。为了解决这个问题,研究人员分析了与N=143名PAH患者的临床风险增加有关的蛋白质组学特征,以建立一个包含13个蛋白质和18个蛋白质相互作用的补体-PAH网络,其中重点关注了补体途径内的补体中间体。这个网络中中间体的蛋白质浓度定义了两个不同的患者亚组(通过k均值分析确定),这两个亚组具有截然不同的结果特征。
总的来说,这些研究展示了使用网络和分子生物学方法来深入研究PH的发展和机制的重要性。它们揭示了一些与PH相关的关键基因和分子,有助于我们更好地理解这种疾病的发病机制。
11. 表型网络与肺动脉高压
肺动脉高压(PAH)临床试验中结果多变以及肺动脉高压亚组之间的病理生理学重叠,使得精细的临床表型分析变得更加重要。这部分原因在于当前对患者进行亚组分组的方法,主要基于使用分支链逻辑分析的一组狭窄的血流动力学参数。相比之下,利用血流动力学数据集成的方法阐明了支撑极端PH亚表型的肺动脉压力、肺血管阻力和肺动脉楔压范围之间的新颖见解。
在相关研究中,从超过750名接受侵入性心肺运动测试以明确不同的呼吸困难诊断的患者中,建立了一个运动网络。来自侵入性心肺运动测试的参数被分配到7个运动功能中的一个(氧气输送、运动能力、肺功能、侵入性心脏功能、通气功能、非侵入性心脏功能和血流动力学)。然后,组装了一个成对相关网络,其中仅包括不同运动功能之间变量之间的关系,以发现意想不到的关联。与直接聚类分析相反,后者仅依赖于变量之间的统计差异来确定患者亚组,网络步骤允许临床参数之间的功能性关联显现。当关注与氧气摄取峰值相关的网络中的9个变量时,包括5个功能领域中的参数,使用聚类分析来识别4个离散的运动亚组。这种方法建立了基于网络医学和欧氏原理而不是线性回归的新型风险评估工具,用于预测患有不同呼吸困难病症且有患PH风险的患者。
图3. 利用网络优化肺动脉高压(PAH)中的表型分型。A, 从各种来源编制了大规模屏幕的PPI(蛋白质-蛋白质相互作用)数据,建立了中央蛋白质-蛋白质互作图。因此,互作图中的PPI反映了蛋白质之间的功能性或物理关联,从而生成了包括功能相关信号通路在内的分子通路的布线图。B,从患有PAH和对照组的患者中收集的产生多重数据的转录组或蛋白组学签名可以使用网络进一步分析。在组之间差异表达的数据被映射到互作图上,并且PPI合作伙伴被保留以生成PPI网络。因此,网络基于来自患者的生物数据,但转化为网络输出。由于互作图中仅包含有效的功能性或物理PPI,因此输出是一张由患者样本提供信息的生物学重要PPI的布线图。C,将PPI与临床表型数据集成后,定义了Reticulotypes,如先前报道的由于心肌病引起的世界研讨会肺动脉高压2型肺动脉高压患者。AD表示活性结构域;BD表示结合结构域;DE表示差异表达;GTP表示三磷酸鸟苷;TF表示转录因子;UAS表示上游激活序列。
12. 药物再利用和网络医学在肺动脉高压中
由于已批准的治疗药物在分子靶点上的广泛多靶点性,药物再利用已经成为提高高度致命和复杂疾病患者护理的重要机会。网络医学在这一努力中的作用基于需要强调支撑疾病表型的功能性分子途径,因为仅仅基于药物靶点和疾病之间的关联通常不足以预测疗效。
Wang和Loscalzo关注了15种已批准的肺动脉高压治疗药物,分为6类:内皮素受体拮抗剂、磷酸二酯酶5抑制剂、肠外前列环素、可溶性鸟苷酸环化酶刺激剂、前列环素受体激动剂和钙通道拮抗剂。基于与这些已批准的肺动脉高压药物的相互作用,以及基于共享的分子机制,包括药物靶点、药物酶和药物转运体的关联,选择了再定位药物候选者,涉及1329种非肺动脉高压药物的8199种药物相互作用。数据进一步根据非肺动脉高压和肺动脉高压药物之间的分子/化学结构重叠、实验药物的去除,以及非肺动脉高压药物-靶点相互作用与综合互作图中的肺动脉高压疾病模块的接近度进行过滤。考虑到支持性出版物,被认为有生物学上合理的再定位用于肺动脉高压的15种药物(例如,尼达尼布、他莫昔芬、吡格列酮、紫杉醇等)。药物再利用的替代方法包括利用差异依赖网络来预测基于共享分子重编程模式的潜在肺动脉高压化疗药物,这些模式在癌症和低氧和炎症条件下对药物治疗的响应中被观察到,通过网络进行了说明。
13. 定义致病途径:网状类型
最近,一种个体化PPI网络的方法被应用到了一组患有梗阻性肥厚型心肌病心力衰竭的患者中,这种疾病易导致2型肺动脉高压。个体化PPI网络数据可以用来预测特定患者独特的病理生物学和组织病理表型特征。个体患者网络特征还与与肺动脉高压和心力衰竭中的不良预后相关的关键参数相关,包括索引性肺血管阻力。通过患者-患者网络(由临床、生物学或组合数据集制定)的正交方法已经在癌症队列中报告,并有望用于阐明肺动脉高压患者的网状类型,这可以成为个性化治疗的基础。
14. 综合组学
迄今为止,有关PAH的深度表型研究主要是单组学性质的,然而在每个领域内观察到了分子配置文件的改变。从单组学的角度看待这些变化只能提供对整体病理生物学情况的部分了解,忽略了许多潜在重要的相互依赖关系。综合多组学分析可以更完整地理解基因型、环境和导致PAH临床异质性的汇聚内表型之间的关系。
最简单的多组学方法的示例包括验证改变的RNA表达配置是否也反映在蛋白质组测量中,或者定义导致分子水平变化的遗传变异(定量性状位点[QTL]见下文)。然而,也可能出现一种平台可以为另一种平台提供信息,而不需要检查相同的基因或其产物。总的来说,多组学数据可以被分为两种方式进行整合,一种是顺序整合,其中组学领域是独立分析的,然后在下游进行相关性/聚合,或者同时整合,其中使用复杂的计算方法来对汇总的多组学数据集进行综合分析。在更基本的顺序整合结构下,首先对每个组学领域中最适合研究任务的分子特征进行选择(即差异表达的特征,或与临床变量或结果相关的特征子集)。然后,可以将来自每个组学领域的选定特征进行相关性分析,或进行聚合,并映射到公共互作网络、通路数据库和其他可用的知识源,以推断共享的生物学背景。相比之下,同时整合策略通过对汇总的多组学数据进行更全面的基于系统的分析来减少偏差。正如下文进一步讨论的,计算方法的各种方法已经越来越多地用于肿瘤学研究中的同时整合。同时整合方法可能会推动PH多组学研究的未来。然而,目前在PH中使用多组学数据的概念验证仅限于涉及顺序整合的少数几项研究。
在Harbaum等人的一项研究中,PAH患者接受了基于核磁共振的代谢组学分析和血液中的蛋白质组学分析。发现患有不良临床结局的患者具有携带原纤溶蛋白等纤溶蛋白的HDL(高密度脂蛋白)-4颗粒物质减少。核磁共振定量化了脂蛋白亚类,与蛋白质组测量相关,并通过ELISA法验证了HDL-4亚型中相关蛋白ApoA1、前卡利克林和神经丛1的存在,这些蛋白质通过超速离心法测定。
与疾病发展风险相关的常见遗传变异通常位于非编码基因组位置,例如内含子或基因间区域。对于可能的机制重要性的理解通常涉及解释包括表观基因组学和转录组学数据在内的多层公共组学数据集。组蛋白修饰和DNA可访问性数据表明可能存在组织特异性调控区域(启动子和增强子),染色质免疫沉淀测序数据识别了可能修改的结合蛋白(转录因子/抑制子)。染色质构象数据,其中DNA交联、剪切和测序以了解DNA片段的三维相互作用(例如HiC数据),可以提供有关远程调控元件的潜在靶基因的信息。这些分析被应用于PAH GWAS,其中染色体8信号被表征为改变了内皮细胞中活跃的增强子元素的活性,在一个基于HiC数据的拓扑关联区域中(仅包含SOX17基因)。对人肺动脉内皮细胞的功能研究证实,CRISPR抑制靶向增强子区域特异性地抑制了Sox17。从冠状动脉疾病中解释非编码GWAS命中的另一个令人印象深刻的例子是,通过QTL分析首次表征了1p13位点,其中常见的遗传变异与表型相关,例如基因表达(eQTL),确定了与变异相关的3个基因的水平。只有这些基因中的一个,SORT1的过度表达,特别影响了小鼠代谢物配置,包括肝脏VLDL(超低密度脂蛋白)分泌,从而定义了该基因在冠状疾病中的关键作用。多组学分析包括时间维度的综合分析已经设定了集成多组学分析的基准,肿瘤学领域的研究表明,合并各种组合的组学数据提供了更清晰和更全面的病理生物学见解。这些成功案例已经推动了用于同时多组学数据整合、分析和可视化的许多生物信息学工具的快速发展。整合方法可用于支持监督预测或无监督的聚类工作。因此,这些方法可以在PH中用于识别有助于早期诊断、预测预后、预测治疗反应或区分新的亚表型的多组学特征。与单组学分析相比,多组学整合具有理论上的优势。整合方法可以减少非生物噪声的影响,并且它们有望捕获反映细胞调控的多组学领域之间的低维度表示。然而,最近的基准分析发现,单组学聚类方法有时比多组学方法产生更好的结果。这表明整合组学领域仍处于早期的探索阶段,方法可能会随着经验的积累而迅速发展。然而,随着综合组学工作的出现,将需要解决一些挑战。构建多组学数据集将是昂贵且资源密集的。没有标准方法可用于确定样本大小,并且在像PH这样的罕见疾病中,获得具有相同多组学数据的独立验证队列可能会具有挑战性。
幸运的是,PH研究界似乎已经准备好应对这些挑战,多个合作网络已经着手收集多组学数据(请参见注册表和研究网络部分),其中一些网络,包括PVDOMICS计划,正在收集纵向数据。整合个人组学分析项目最初以单个个体的广泛组学分析开始,随后扩展到更大的亚队列分析,提供了纵向多组学整合如何导致个性化精密医学的令人兴奋的一瞥。作为这个项目的一部分,一个富集了糖尿病风险的患者队列中的>100名患者每季度接受了长达8年的深度综合纵向分析(临床测量、基因组、免疫组、转录组、蛋白组、代谢组、微生物组和可穿戴监测),这产生了无数的发现,包括了解健康与疾病之间的个人和个体间变异性,识别与多种疾病状态相关的分子通路,检测对免疫和病毒感染疫苗的不同主机和微生物变化,以及在发病前预测糖尿病的标志物的发展。因此,具有时间维度的多组学分析有潜力检测健康到疾病的转变,确定各种干扰如何直接影响疾病状态和结果,真正审查环境和遗传因素对临床表型的影响。
参考文献:
Rhodes CJ, Sweatt AJ, Maron BA. Harnessing Big Data to Advance Treatment and Understanding of Pulmonary Hypertension. Circ Res. 2022 Apr 29;130(9):1423-1444. doi: 10.1161/CIRCRESAHA.121.319969. Epub 2022 Apr 28. PMID: 35482840; PMCID: PMC9070103.
转自:“肺动脉高压研究进展”微信公众号
如有侵权,请联系本站删除!