投稿问答最小化  关闭

万维书刊APP下载

10+!人工智能通过组织病理学图像揭示乳腺癌新辅助化疗反应相关特征~

2023/8/14 16:23:30  阅读:48 发布者:

以下文章来源于作图丫 ,作者月野兔

导语:计算算法和工具的进步使得使用计算病理学预测癌症患者的结果变得可行。然而,由于对肿瘤免疫微环境的了解不足,从治疗前的组织病理学图像预测临床结果仍然是一项具有挑战性的任务。

背景介绍

今天小编为大家带来的这篇文章,作者描述了一种自动、准确、全面、可解释和可重复的全幻灯片图像 (WSI) 特征提取管道,称为基于图像的病理注册和分割统计 (IMPRESS)。文章发表在《Npj Precision Oncology》上,影响因子为:10.092,文章题目为:Artificial intelligence reveals features associated with breast cancer neoadjuvant chemotherapy responses from multi-stain histopathologic images

数据介绍

这项研究包括 62 HER2 阳性乳腺癌 (HER2+) 女性患者和 64 名接受新辅助化疗 (NAC) 和后续手术切除治疗的三阴性乳腺癌 (TNBC) 女性患者。

技术路线

本研究技术路线如图1所示,包括H&E图像采集和分割、IHC图像采集和分割以及H&E-IHC图像配准。给定输入配对的 H&E IHC WSI,使用相应的 H&E WSI 作为固定参考对每个 IHC WSI 执行自动非刚性配准。利用由病理学家训练的深度神经网络“DeepLabV3”标记TCGA乳腺癌H&E图像,进行H&E组织分割,并识别出四个感兴趣区域,包括间质区(Stroma)、肿瘤区(Tumor)、淋巴细胞聚集区(Lymph)和排除区域。所有包含的区域(基质、肿瘤和淋巴)被定义为所有 H&E 区域(全部)。

1

结果解析

01

队列的临床和组织病理学特征

本研究包括 62 HER2 阳性 (HER2+) BC 64 TNBC 女性患者,接受 NAC 和手术切除治疗。HER2+ BC患者接受阿霉素/环磷酰胺/紫杉醇联合抗HER2靶向治疗,其中24例(39%)有残留肿瘤。TNBC 患者接受标准 NAC(阿霉素/环磷酰胺/紫杉醇)治疗,其中 37 名患者(58%)有残留肿瘤。这些患者的临床和组织病理学特征总结于表1。此外,表1进一步报告了HER2+TNBC亚型的外部队列特征。外部队列包括40名经组织病理学证实的浸润性乳腺癌患者,他们接受了NAC并随访完成 NAC 后进行向上手术。根据 ASCO/CAP 指南更新指南的标准,使用 HER2 IHC FISH 对活检标本确定 HER2 状态。

1

02

功能构建

2ab 显示了 H&E 图像及其分割结果的示例。通过基于颜色的 K 均值分割来识别多重 IHC 标记,包括 CD8(绿色)、CD163(红色)和 PD-L1(棕色)。图2cd显示了IHC图像及其分割结果。所有结果均由两位病理学家审查和确认。接下来,本研究构建了基于人工智能的自动、准确、全面、可解释和可重复的 WSI 特征提取管道,并生成 36 个基于图像的病理注册和分割统计(IMPRESS)特征。图2fCD8为例演示了如何计算IMPRESS特征。

除了 IMPRESS 特征外,还利用了临床特征和分子标志物(ERPR HER2)的状态。在HER2+队列中,采用年龄、雌激素受体状态(ER+/)、雌激素受体百分比(ER%)、孕激素受体状态(PR+/)、孕激素受体百分比(PR%)HER217号染色体的表达比(HER2/ CEP17)6个特征。在 TNBC 队列中,年龄是唯一可用的临床特征,因为 ERPR HER2 均为阴性。

2

03

使用IMPRESS功能的机器学习模型预测NAC结果

本研究采用 LASSO 正则化逻辑回归来评估所提出的 IMPRESS 特征的预测能力。本研究比较了四组特征,包括全部36IMPRESS加临床特征(IMPRESS)、IMPRESS H&E图像特征加临床特征[IMPRESS(仅H&E]IMPRESS IHC图像特征加临床特征[ IMPRESS(仅 IHC],病理学家评估 IHC 图像特征加上临床特征(病理学家)。

本研究首先将 IMPRESS IMPRESS(仅限 H&E)和 IMPRESS(仅限 IHC)进行比较。从表 2 和图 3a 中,发现 IMPRESS AUC 显著高于 IMPRESS(仅 H&E)和 IMPRESS(仅 IHC)。同样,从表 2 和图 3b 中,发现 IMPRESS AUC 显著高于 IMPRESS(仅 H&E)和 IMPRESS(仅 IHC)。结果表明,结合 H&E IHC 组织病理学图像可以提取额外的特征,以改善对 NAC 预测的响应。

2

3

04

IMPRESS特征在预测NAC结果方面优于病理学家

HER2+ 队列中,本研究发现 IMPRESS 的表现明显优于病理学家评估的特征(图 3a)。在 TNBC 队列中,本研究发现 IMPRESS 的表现(AUC = 0.7674 ± 0.0209)比病理学家评估的特征(AUC = 0.7626 ± 0.0095)稍好,t 检验统计量 = 0.94(图 3b)。详细性能总结于表 2 中。这些结果表明,从 H&E IHC 组织病理学图像中提取的基于 AI 的特征可以实现与病理学家评估的特征相同或更好的性能,并且是开发机器学习算法以预测乳腺癌患者对NAC的反应的首选输入。

05

机器学习模型中的特征重要性分析

为了系统地评估主导预测的关键特征,本研究总结了图 3cHER2+ 队列)和图 3dTNBC 队列)中 LASSO 正则化逻辑回归产生的特征系数。对于 HER2+ 队列,前 5 个有利预后标志物中的 3 个与淋巴细胞聚集区域相关,包括 CD8 比率、CD163 比率和 PD-L1比率。HER2/CEP17比值这一有利的临床预后标志位居第三,这与参考文献中的发现相呼应,表明高 HER2/CEP17 比率与 pCR 显著相关。相比之下,前五个不良预后标志物中的四个与临床变量相关,包括年龄、ER 比率、PR 阳性和 PR 比率。第二强的不良预后标志物是基质:CD8 比例。对于 TNBC 队列,前 5 个有利的预后标志物是淋巴:PD-L1 比例、淋巴:PD-L1 比例、肿瘤:CD8 比例、肿瘤:CD8 纯度和淋巴:CD163 比例。前五个不良预后标志物是基质:CD8 比例、年龄、肿瘤:PD-L1 比例、基质:CD8 比例和淋巴:CD8 纯度。从这些结果中,可以观察到与淋巴细胞聚集区域(淋巴)相关的特征是 pCR 最有利的预后标志物。此外,年龄起着相反的作用,在 HER2+ 队列中比在 TNBC 队列中更为重要。

HER2+ TNBC 队列之间系数重要性的比较如图 3e 所示。HER2+ TNBC 队列中的一些 IMPRESS 特征一致。例如,淋巴:PD-L1 比例和肿瘤:CD8 比例是 pCR 的共同有利特征;年龄和基质:CD8 比例是 pCR 的常见不良特征。然而,本研究也观察到 HER2+ TNBC 队列之间存在一些差异:CD8 CD163 HER2+ 队列中发挥更重要的作用,而 PD-L1 TNBC 队列中提供更多信息。在下面的单变量分析中也可以观察到类似的结果(图3fg)。

06

NAC响应的单因素分析

由于基于 AI IMPRESS 特征在预测 pCR 方面优于病理学家评估的特征,并且与 RCB 相关,因此本研究进一步进行了单因素分析,以研究 IMPRESS 特征和 NAC 反应之间的关系,并确定在HER2+TNBC队列之间预测NAC反应方面显示显著差异的特定IMPRESS特征。

本研究通过使用双侧学生t检验将pCR病例与残留肿瘤病例进行比较。差异最显著的前 5 个有利/不利特征如图 3f HER2+ 队列)和图 3gTNBC 队列)所示。本研究发现pCR病例与残留肿瘤病例中最显著不同的特征与机器学习方法识别的特征高度一致,例如淋巴:CD163比率,淋巴:CD8 比率,这是 HER2+ 病例的两个最有利的特征,通过单因素分析和机器学习模型确定。然而,单因素分析确定的一些特征与机器学习结果不一致。例如,肿瘤:CD163 纯度是 HER2+ 病例的不良特征之一,但在机器学习中并未识别出来(图 3c)。在 TNBC 病例中也发现了类似的不一致,例如淋巴:CD8 比例。

为了提出 IMPRESS 特征与 pCR 之间关系的另一种观点,使用 Spearman 等级相关系数 (SCC) 来评估特征之间与 pCR 关系的差异。SCC结果与机器学习特征重要性结果(图3cd)和单因素分析结果(图3fg)基本一致,特别是与淋巴细胞聚集区域和肿瘤区域相关的特征。这些结果证实了 NAC TIL 在预测 pCR 中的重要作用。

07

IMPRESS特征与残留癌症负担之间的关系

除了 pCR 之外,本研究还计算了残留肿瘤患者的残留癌症负荷 (RCB)HER2+ 队列中的 RCB 中位数为 1.39,范围为 0.91-4.14TNBC 队列中的 RCB 中位数为 2.01,范围为 0.80-4.27。对于 pCR 患者,RCB 定义为 0。使用具有两侧 P 值的 SCC ρ 的非参数统计来检查 IMPRESS 特征和 RCB 之间的关系。来自机器学习分析的前 5 个最有利和最不利的 IMPRESS 预后特征与 RCB 进行了进一步比较[4a (HER2+)和图4b (TNBC)]

如图4a所示,HER2+病例显示淋巴:CD8比率、淋巴:CD163比率、淋巴:PD-L1比率和淋巴:CD8比率与RCB显著负相关。相反,基质:CD8比例和肿瘤:CD163纯度与RCB显著正相关。从图 4b 中的 TNBC 队列来看,淋巴 PD-L1 比例与 RCB 显著负相关。相反,基质:CD8比例与RCB呈正相关。这些结果表明,NAC 前图像中基于 AI IMPRESS 特征也可以定量预测 RCB 值。

4

08

相关性分析揭示了IMPRESS特征中的潜在依赖性

为了充分研究 IMPRESS 特征之间的关系并揭示潜在的依赖关系,本研究对成对的 SCC 进行了分析(图 5)。这些成对的 SCC ρ 证明了每对 IMPRESS 特征之间的潜在关系。总体特征相关性在 HER2+ 队列(图 5a)和 TNBC 队列(图 5e)之间存在细微差异。

面积比特征的所有 SCC ρ 均为正值。本研究对来自不同 IHC 标记的高度相关的面积比特征特别感兴趣。对于 HER2+ 的面积比(图 5b),来自不同 IHC 标志物的最相关的比值统计数据是基质:PD-L1 比率和全部:CD163 比率;基质:CD163 比率和基质:PD-L1 比率。对于TNBC的面积比(图5f),来自不同IHC标志物的最相关的比率统计数据是基质:PD-L1比率和基质:CD8比率;全部:PD-L1 比率和基质:CD8 比率;全部:PD-L1 比率和全部:CD8 比率。面积比统计结果表明,HER2+PD-L1面积比与CD163的相关性最强,而TNBC中与CD8的相关性最强。

对于 IMPRESS 特征中的比例统计,在相同的 H&E 区域内观察到正相关。相反,在不同的 H&E 区域观察到负相关(图 5cd)。本研究对来自不同 H&E 地区且负相关性最强的特征特别感兴趣。在 HER2+ 中(图 5c),负相关比例统计量最大的是肿瘤:H&E 比例和基质:H&E 比例;肿瘤:CD163 比例和基质:CD163 比例。在TNBC中(图5g),最负相关的比例统计是肿瘤:H&E比例和基质:H&E比例;肿瘤:CD163 比例和基质:CD163 比例。比例统计结果表明,CD163 是肿瘤或间质区域中负相关性最强的 IHC 标记物。

对于 IMPRESS 特征中的纯度统计,在相同的 IHC 标记内观察到正相关。相反,不同 IHC 标记之间观察到负相关(图 5dh)。本研究对来自不同 IHC 标记且负相关性最强的那些特征特别感兴趣。在 HER2+ 中(图 5d),不同 IHC 标记物的负相关纯度统计数据是淋巴:CD163 纯度和淋巴:CD8 纯度;基质:CD163 纯度和全部:CD8 纯度;肿瘤:CD163 纯度和肿瘤:PD-L1 纯度。在TNBC中(图5h),来自不同IHC标记的最负相关的纯度统计是基质:CD163纯度和基质:CD8纯度;基质:CD163 纯度和全部:CD8 纯度。纯度统计结果表明,CD163 CD8 是两个最不同的 IHC 标记,在不同的 H&E 区域中相互竞争。

5

小编总结

本研究构建了一个自动、准确、全面、可解释和可重复的 WSI 特征提取管道 (IMPRESS),并使用这些 IMPRESS 特征开发机器学习模型来预测乳腺癌患者对 NAC 的反应。使用组合特征集的机器学习模型显示出良好的性能,特别是对于 HER2+ 亚型。单因素分析确定了 pCR 相关和 RCB 相关的图像特征,这些肿瘤免疫微环境信号可以用作预测标记或用于改进一线治疗的选择,这可能是精准肿瘤学的重要参与者。

转自:SCI科研力”微信公众号

如有侵权,请联系本站删除!


  • 万维QQ投稿交流群    招募志愿者

    版权所有 Copyright@2009-2015豫ICP证合字09037080号

     纯自助论文投稿平台    E-mail:eshukan@163.com