AI病理学基础模型CHIEF:19种癌症“一眼看透“——Nature重磅研究解读
AI病理学基础模型CHIEF19种癌症一眼看透——Nature重磅研究解读作者思陌智能 | 2026-06-19导读2024年9月哈佛医学院团队在Nature正刊发表CHIEF病理学基础模型。该模型在60,530张全切片图像上训练覆盖19个解剖部位经32个独立队列验证在癌症检测、肿瘤起源识别、基因突变预测和生存预后四大任务中全面超越现有方法性能提升最高达36.1%。这是迄今规模最大、验证最全面的AI病理学基础模型。一、研究背景癌症是全球第二大致死原因病理学诊断一直是癌症诊疗的金标准。传统的病理诊断依赖病理学家在显微镜下对组织切片进行视觉评估这一过程不仅耗时费力还受到观察者经验差异的影响。近年来深度学习在数字病理学领域取得了长足进展2019年Campanella等人在Nature Medicine发表的临床级计算病理学工作已展现出AI辅助病理诊断的巨大潜力。然而现有AI病理模型面临一个根本性挑战领域偏移domain shift。在特定数据集上训练优化的模型很难泛化到不同医院、不同制片流程、不同扫描设备产生的病理图像这严重限制了AI在真实临床场景中的应用。2024年3月哈佛医学院团队在Nature Medicine发表了UNI通用病理基础模型同年8月斯坦福团队在Nature Medicine发表了视觉-语言病理基础模型CONCH这些工作推动着计算病理学从专病专用向通用基础模型转变。2024年9月哈佛医学院Kun-Hsing Yu和Sen Yang领衔的多中心研究团队在Nature正刊发表了一项里程碑式成果——CHIEFClinical Histopathology Imaging Evaluation Foundation病理学基础模型。该模型覆盖19种解剖部位在32个独立队列中验证展现了前所未有的泛化能力。二、研究创新点CHIEF的核心创新体现在以下方面1. 双阶段互补预训练策略首次将无监督图像块级特征学习与弱监督全切片模式识别有机融合在统一框架下提取多尺度病理表征。2. 前所未有的规模与广度在60,530张全切片图像WSI上训练数据量达44TB横跨19个解剖部位训练数据来自TCGA、GTEx、PAIP、CPTAC等16个大型国际研究联盟。3. 多任务通用能力单一模型同时完成癌症检测、肿瘤起源识别、分子特征预测和生存预后评估四大任务突破传统一病一模型的局限。4. 极强的泛化性与鲁棒性在24家医院和队列的32个独立切片集上验证相比现有最先进方法性能提升最高达36.1%。三、技术原理CHIEF的技术架构围绕双阶段预训练和弱监督学习展开第一阶段无监督图像块级预训练。将全切片图像分割为大量256×256像素的图像块tile每个10亿像素级别的全切片可产生数万个图像块。通过自监督对比学习CHIEF学习每个图像块的特征表示无需人工标注即可捕捉细胞形态、组织结构和纹理特征。第二阶段弱监督全切片级预训练。在图像块级特征基础上采用注意力机制的多实例学习Attention-based MIL框架仅需切片级标签如癌症/非癌症、分子突变状态即可学习全切片级别的诊断模式。注意力机制自动识别对诊断决策最重要的组织区域提供可解释性。第三阶段多任务微调。通过微调策略CHIEF可适配癌症检测、肿瘤起源分类、基因突变预测和生存预后四项任务。CHIEF的架构设计使其能够跨不同染色方案、扫描设备和患者群体泛化得益于大规模多样化的预训练数据覆盖了主要的微观形态变异。四、实验结果CHIEF在多个独立验证集上展现了卓越性能1. 癌症检测在包含15种癌症类型的11个独立数据集中CHIEF的癌症检测AUROC达0.9397显著优于现有方法。2. 肿瘤起源识别对18种不同肿瘤起源CHIEF在独立验证集上达到AUROC 0.9853±0.0245宏平均准确率为89.5%显著超过现有最先进方法P0.000015。3. 基因突变预测CHIEF成功从HE染色切片预测54种常见基因突变状态包括TP53、IDH1、BRAF等关键驱动基因。在胶质瘤IDH突变预测中CHIEF在高低级别胶质瘤中均表现出高度准确性且模型注意力高亮区域与病理学家标注的形态学特征高度一致。4. 生存预后预测在17种癌症类型的患者中CHIEF基于病理图像单独预测的生存风险分层显著优于现有方法且与肿瘤分期的区分能力相当。对高注意力区域进行Hover-Net细胞分割分析发现CHIEF自动捕捉到肿瘤浸润淋巴细胞、坏死区域等预后相关组织微环境特征。5. 泛化能力在完全未参与模型开发的独立CPTAC队列中CHIEF性能下降远小于其他方法体现了强大的领域泛化能力。任务指标CHIEF性能对照方法癌症检测AUROC0.9397提升显著肿瘤起源识别AUROC0.9853优于现有36.1%基因突变预测AUROC多基因0.80显著提升生存预后C-index优于分期多癌种显著五、技术优势1. 通用性与灵活性CHIEF类似病理学领域的ChatGPT一个模型适应多种诊断任务降低开发和部署成本。2. 弱监督学习仅需切片级标签无需昂贵且耗时的像素级标注通常每张全切片标注需数小时极大降低了数据准备门槛。3. 可解释性注意力机制可视化使模型决策过程透明化病理学家可验证模型关注的区域是否与病理学知识一致增强临床信任度。4. 跨中心泛化在32个独立队列的验证证明了CHIEF对制片差异、扫描差异和人群差异的鲁棒性这是临床落地的关键前提。5. 开源与可复现模型代码已开源在GitHubgithub.com/hms-dbmi/CHIEF并提供Docker镜像便于全球研究者复现和扩展。六、应用前景1. 临床病理诊断辅助在基层医院病理资源匮乏的地区CHIEF可作为AI病理专家提供初步诊断意见提高癌症诊断的准确性和可及性。2. 精准肿瘤学从常规HE染色切片预测基因突变状态可指导靶向治疗选择减少对昂贵基因测序的依赖降低患者经济负担。3. 肿瘤筛查在大规模人群癌症筛查中CHIEF可快速过滤阴性样本使病理学家专注于可疑病例提高筛查效率。4. 预后评估与治疗决策基于病理图像进行生存预测可为临床医生提供更精准的个体化预后评估辅助制定治疗策略。5. 药物研发在临床试验中CHIEF可提供与分子特征高度相关的病理学标志物加速伴随诊断开发。七、研究局限性与未来方向1. 回顾性数据研究基于回顾性分析尚未在真实临床工作流中前瞻性验证。CHIEF在真实诊疗环境中的临床表现和临床获益仍需随机对照试验证实。2. 罕见肿瘤覆盖不足虽然覆盖19个解剖部位但对某些罕见肿瘤类型的样本量有限模型在这些癌种上的表现需要进一步检验。3. 多模态融合当前版本仅基于HE染色图像未来整合基因组学、蛋白质组学、放射影像等多模态数据有望进一步提升预测精度。4. 监管与伦理AI辅助诊断系统的临床部署需要满足各国医疗器械监管要求如FDA、CE、NMPA审批涉及数据隐私、算法公平性和责任归属等伦理问题。5. 计算资源需求44TB的预训练数据和复杂模型架构对计算资源有较高要求可能限制在资源有限环境中的部署。八、结论CHIEF作为迄今规模最大、验证最全面的病理学基础模型在癌症检测、肿瘤起源识别、分子特征预测和生存预后四大任务中均达到或超越现有最先进水平。其突出的跨中心泛化能力为AI病理学从实验室走向临床提供了关键证据。随着前瞻性验证和多模态融合的推进类似CHIEF的通用AI病理学模型有望在未来数年内深刻改变癌症诊疗模式使精准医疗更加普惠可及。参考文献1. Campanella G, et al. Clinical-grade computational pathology using weakly supervised deep learning on whole slide images.Nature Medicine, 2019, 25: 1301–1309. PMID: 31308507.2. Chen RJ, et al. Towards a general-purpose foundation model for computational pathology.Nature Medicine, 2024, 30: 850–862. PMID: 38504018.3. Lu MY, et al. A visual-language foundation model for computational pathology.Nature Medicine, 2024, 30: 863–874. PMID: 38504013.4. Wang X, Zhao J, Marostica E, et al. A pathology foundation model for cancer diagnosis and prognosis prediction.Nature, 2024, 634: 970–978. DOI: 10.1038/s41586-024-07894-z. PMID: 39232164.—— 本文由思陌智能基于公开学术文献解读仅供学术参考 ——

相关新闻