学术分享 | 数字病理图像分析方法的开发

学术分享 | 数字病理图像分析方法的开发
文章图片
学术分享 | 数字病理图像分析方法的开发
文章图片
论文重点内容
数字病理分析方法
数字病理分析可大致分为两种主要方法:定量分析和人工智能评估 。 尽管任何特定的应用场景都需要两者结合 , 但通常一种方法占主导地位 。 这种区分有助于阐明算法开发和验证的问题 , 以及阐明如何把病理学家的知识真正应用于数字系统 。
定量分析
历史上 , 病理图像分析一直专注于检测、分类、计数和/或量化图像中可见的特定“物体” 。 这些物体可能是不同的种类 , 不同的识别规模 。 例如 , 确定切片是否包含侵袭性原发肿瘤 , 转移性肿瘤 , 或幽门螺杆菌感染 , 都是主要的检测任务 。 通常来说 , 检测到的东西也需要分类 。 例如 , 可以根据不同的细胞类型对细胞核进行分类 , 这可用于确定治疗反应的预测指标 , 如淋巴细胞和肿瘤细胞的相对比例 。 或者 , 我们可以避开细胞检测 , 而通过影像图素直接归类为肿瘤上皮、基质或其他组织类型 , 并以此来量化每种组织类型所占的区域(例如 , 评估脂肪比例 , 或肿瘤基质比例) 。 根据我们想要解决的问题 , 不同的分析方法可以应用于组织切片的同一次全视野数字切片扫描 。
这种定量分析的共同特征是 , 它关注于评估定义明确且可见的东西 。 原则上 , 它复现了病理学家通过看切片就能确定的东西 。 有经验的观察者可以通过可视化所检测到的、分类的和量化的内容来确定是否正确进行了分析 。
基于人工智能的评估
通过定量分析解决的问题可能往往是我们真正想知道的 , 包括从图像中确定诊断或预后信息 , 不同患者的不同治疗方案问题 。
数字病理学最近大多集中于如何更直接地解决这些问题——而不是明确地检测或量化特定的特征 。 一个早期的例子表明 , 人工智能可以预测肺腺癌中6个常见突变基因的突变 。 此后 , 类似的策略也被用于预测各种组织类型中基因的突变 。 其他研究表明 , 人工智能可以通过苏木精和伊红[H&E]切片扫描直接预测患者的预后 。
在这些情况下 , 输出的的是不基于直接测量任何特定特征或结构的预测 。 这使得验证结果变得更加困难 , 至少基于每个图像是这样的 。 可信度需要通过以下途径来获得:(1)使用不同数据集的大规模验证研究(2)能够可视化对结果有重要贡献的切片区域 。 这样的可视化表示人工智能已经学会如何基于已知的临床相关的图像区域来进行预测 。
混合的方法
虽然上述两类并不能归纳所有的数字病理学应用 , 但我们仍可以区分哪些输出是可接受视觉验证的 , 哪些是不可接受的 。 例如 , 已开发出许多基于人工智能的格里森评分方法 。 其中一些包含了人工智能应用前的目标检测和量化元素 , 而另一些则更直接地对图像进行处理 , 没有明确的检测;不管怎样 , 病理学家可以通过比较人工智能最终的评定与自己的评估来评估该算法的性能 。 这与基于人工智能的前列腺癌风险分层或癌症复发预测方法不同 , 这种方法没有任何既定的分级系统 , 不太容易接受视觉验证 , 因此在病理学家对这种方法不太有兴趣 。
图像分析技术
无论采用何种方法 , 数字病理学的基本挑战仍然是相同的:在图像中发现特定模式 。 这需要对输入图像中的数字进行数学运算 , 通常采用将图像逐步转换为其他形式的方式 , 将关键特征分离出来 。 虽然每个单独的操作可能比较简单直接 , 但当数百甚至数千个这样的操作组合成一个数十亿像素应用于算法时 , 复杂性就随之而来 。 尽管如此 , 认识到构建数字病理算法本质上的简单性是理解其优势和预测其局限性的核心 。 在某些情况下 , 复杂分析的成功或失败可以归因于关键步骤中应用的单个截止阈值 。