学术分享 | 数字病理图像分析方法的开发( 三 )


技术的比较
这篇非常简短的概述旨在展示图像处理、机器学习和数字病理分析的深度学习方法之间的重叠 。 最后 , 所有这些都应用于图像的像素值 。 卷积——缩放和求和相邻像素值——在每种情况下都扮演着重要的角色 。
专门使用传统图像处理来开发算法的一个优点是 , 这些方法定义明确、易于处理 。 开发人员通过设置关键参数(如过滤器大小和阈值)来调整性能 。 优点是简单:使用少量直观参数的算法很容易应用适应新图像 , 而一个复杂的、手工调整的算法很可能是脆弱的 , 并过度拟合某个数据集 。 然而 , 简单性同时也是一个限制因素:病理数据的复杂性意味着仅靠图像处理往往是不够的 。
传统机器学习的一个好处是 , 开发人员可以专注于更高层次的问题:他们可以提供训练数据和表示应该处理的图像的标注 , 而不是指定固定的规则 。 开发和应用传统的机器学习模型也可以非常快:在交互式标注图像时 , 可以在几秒钟内训练一个模型 , 并在需要时逐步细化 , 尽管更结构化的多图模型训练方法通常更好 。 然而 , 即使经过大量的训练 , 成功与否最终还是取决于输入特征的有用性和信息量 。 由于关键参数被包裹在模型中 , 所以它们不能很容易地调优用于处理新图像 。 所以当算法失败时 , 我们需要训练一个新的模型 。
关于传统机器学习的大多数观点也适用于深度学习 , 但有两点需要注意 。 首先 , 从头开始训练深度学习模型通常要慢得多:通常需要几个小时或更长时间 , 这取决于模型、训练数据和可用的计算资源——不过 , 如果可以将训练应用于现有模型 , 进行微调 , 则可以大大减少训练时间 。 其次 , 模型性能不太受可用特征的限制 , 尽管它仍然受可用训练数据和损失函数定义的限制 。
在实践中 , 所有的技术都有优缺点 。 复杂的分析问题通常需要将它们中的所有元素组合起来(图1) 。
实践中的分析
任何寻求开发或应用数字病理的人都会遇到许多相同的挑战 。 这里我将讨论一些主要困难 , 并考虑如何解决它们 。
泛化和偏向
有限的泛化影响了所有的数字病理分析 , 并被描述为“可能是在临床中大规模实施[计算病理学]技术的唯一最主要的障碍” 。 一个看似成功的算法在遇到与用于开发的数据有明显差异的数据时 , 可能会以不同的(通常是微妙的)方式受到阻挠 。 例如 , 据报道 , 在CAMEYLON17大挑战中 , 用于检测淋巴结转移的排名最高的深度学习算法 , 仍在训练集中很少出现的良性区域受到阻挠 。
另一项研究报告称 , 通过使用更大的训练数据集和更弱的标注(即切片级标注 , 而不是勾画单个转移瘤的轮廓)提高了算法强大性 , 但其仍然承认 , 当用于训练和测试的切片来自不同来源或使用不同的扫描仪时 , 算法性能有所下降 。 不同的深度学习方法 , 输入图像中细微的、视觉下的变化也可能导致截然不同的预测 , 这种方法甚至可以被用作一种“攻击” , 通过故意操纵图像来引起不同的预测 。
解决这一问题的一个策略是涵盖来自不同来源、使用不同扫描仪获得的更多样化的训练图像 。 然而 , 问题在于 , 这可能会引入可学习的隐藏变量 , 从而产生批次效应 。 例如 , 一项将深度学习应用于五家机构的黑色素瘤幻灯片的研究表明 , 可以了解切片来源、扫描仪类型、患者年龄 , 甚至(在较小程度上)切片制备日期的信息 。 一项类似的研究表明 , 在癌症基因组图谱(TCGA)的图像中可以识别特定位点的特征 , 而这些特征与种族有关 。 如果模型学习到与训练标注相关的特征(由于队列构成而不是疾病) , 那么这种效应可能会提供一个夸大的准确性估计或系统偏差 。