最大!前列腺甲基化全景
摘要前列腺癌具有高度的临床异质性与分子异质性。目前学界对其基因组异质性已有充分解析但对表观基因组异质性的认知仍较为有限。为此本研究构建了涵盖3,001例多族裔前列腺甲基化组的整合数据集样本覆盖正常组织、各级别局限性前列腺癌到多发转移性疾病的完整疾病进程其中884例样本配套了多组学DNA与/或RNA组学数据。本研究鉴定出4种表观基因组亚型可对患者进行风险分层且反映了肿瘤不同的演化轨迹。研究证实DNA拷贝数变异与甲基化之间存在广泛的调控互作者对基因转录的调控效应随基因类型与疾病分期不同存在差异。研究明确了15项关键临床-分子特征的表观遗传失调特征并为每项特征构建了对应预测模型。例如研究鉴定出可预测患者预后的特异性表观特征且该特征与临床预后指标具有协同效应。上述结果揭示了肿瘤遗传变异与表观遗传改变之间的复杂互作机制者共同调控基因表达程序与临床表现该过程部分通过调控表观衰老进程实现。pboutrossbpdiscovery.orgjarbetcoh.org#前列腺癌 #DNA甲基化 #表观亚型 #拷贝数变异 #预后分层 #生化复发 #表观衰老 #CpG岛甲基化表型结果前列腺癌甲基化亚型图1前列腺癌表观基因组全景a. 来自15个队列的2,355例前列腺肿瘤与646例正常样本的亚型甲基化谱含临床基线变量。热图纳入IMPACC筛选的5,486个亚型分型关键CpG位点CpG位点采用完全连锁法、欧氏距离进行层次聚类后均分为5组用于可视化缺失值以白色标注正常样本未展示临床变量年龄除外。队列标签对应文献TCGA-PRAD、Zhao等2017、Li等2020、ICGC PRAD-CA、Berglund等2024、Dairo等2024、Kirby等2017、ICGC PRAD-FR、Ramakrishnan等2024、Zhao等2020、Ylitalo等2021、Mundbjerg等2017、Toth等2019、Brocks等2014Melbourne队列为未发表数据。b-e. 按队列竖条展示不同分组的亚型占比分别为局限性前列腺肿瘤样本(b)、转移性样本(c)、正常样本(d)、全部队列汇总(e)。柱形上方标注各队列总样本量。L局限性肿瘤M转移性肿瘤N正常样本。f. 纳入所有具备生化复发BCR数据的患者n882采用Kaplan-Meier曲线估算各亚型的无生化复发生存率右上角P值来自对数秩检验。左上角附图为校正队列因素后以MS-1为参照组的Cox比例风险模型风险比及95%置信区间、Wald检验P值图下方表格为0-5年各时间点的风险患者数。右下角森林图为7个具备BCR相关结局队列的Meta分析结果「总体」行为MS-4对比MS-1的合并Meta分析风险比圆点为估算风险比横线为95%置信区间。g. 点图汇总全部样本及各队列中亚型与4项临床特征年龄、T分期、ISUP分级、PSA的关联强度。临床变量按补充表1进行分类采用Fisher精确检验分析其与4种甲基化亚型的关联圆点大小对应偏倚校正的克莱姆V效应量背景色对应多重检验校正后的q值按各临床变量分别校正单元格内叉号代表该队列无对应特征数据。h-j. 采用Fisher精确检验与比值比比较亚型特征CpG与非亚型特征「背景」CpG在各染色体 (h)、不同CpG类型岛、开放海洋、架、岸(i)、不同基因区域基因体、基因间区、基因启动子区(j)的分布差异。肿瘤拷贝数变异驱动区域甲基化与基因表达图2 前列腺癌调控全景图谱a. y轴为基因组对应位置x 轴基因发生拷贝数扩增红柱或缺失蓝柱的患者占比竖洋红色条标注后续f图展示的基因。b-d. 各基因内甲基化与拷贝数的斯皮尔曼相关性(b)、甲基化与mRNA的相关性(c)、拷贝数与mRNA的相关性 (d)正相关以蓝色标注负相关以橙色标注。基因水平甲基化以每位患者基因启动子区CpG岛的中位β值表示。e. 2元甲基化状态高/低甲基化按中位值2分类与2元拷贝数状态缺失/中性若缺失突变更常见或扩增/中性若扩增突变更常见的线性回归交互项系数因变量为RNA表达量log2 TPM经z-score标准化。图中展示交互效应显著q0.05的基因以及BCL2L10基因q0.055。f. 6个基因的甲基化-拷贝数互作对mRNA表达的影响示例qint为交互效应检验的q值。基因水平甲基化以每位患者基因启动子区CpG岛的中位β值计算按中位值2分为高甲基化与低甲基化组。g. 若基因拷贝数状态在样本间存在差异取占比更高的类型扩增或缺失作为该基因的主导拷贝数状态比较存在该拷贝数变异与拷贝数中性患者之间基因启动子区CpG岛的中位甲基化水平y轴为log2倍数变化。按肿瘤类型、已知癌症驱动基因/其他基因x轴分组展示。数值大于0代表拷贝数变异组甲基化水平高于中性组小于0代表拷贝数变异组甲基化水平更低接近0代表拷贝数对该基因甲基化影响极小。小提琴图上方字母为组间两两比较结果共享字母代表两组无显著差异Wilcoxon秩和检验q0.05字母不同代表差异显著q0.05扩增上图与缺失下图分别独立标注。h-j. 局限性与转移性样本中基因内甲基化、拷贝数、RNA三者的斯皮尔曼相关性分布。基因甲基化以基因启动子区CpG岛的中位β值计算。甲基化亚型反映肿瘤遗传学特征与微环境状态图3不同甲基化亚型的拷贝数变异与转录组谱差异a. 包含亚型特征CpG的1,653个基因的拷贝数状态。热图每行对应1个基因展示各亚型列中发生基因拷贝数扩增与缺失的患者占比行采用欧氏距离、完全连锁法层次聚类排序。采用有序逻辑回归模型以基因拷贝数状态缺失、中性、扩增为因变量亚型、基因组变异百分比PGA、队列为自变量计算亚型效应的似然比检验P值右侧条形图展示多重检验校正后的q值。b. y轴为基因组对应位置x轴发生拷贝数扩增红柱或缺失蓝柱的患者占比按甲基化亚型分行展示。c. 采用Kruskal-Wallis秩和检验比较4种甲基化亚型的基因组变异百分比PGA标注P值。共享字母代表组间无显著差异Mann-Whitney U检验q0.05字母不同代表差异显著q0.05。d. 纳入3,516个在亚型间差异显著的mRNA转录本经PGA与队列校正Kruskal-Wallis秩和检验q0.05且亚型中位值的标准差0.4将各亚型的中位表达量从1-4排序由低到高列百分比展示对应亚型处于某一排序的占比。e. 采用GSVA算法计算50个标志性通路的患者特异性通路得分经PGA与队列校正热图展示各通路在不同亚型的校正后mRNA表达中位z值。右侧条形图为Kruskal-Wallis检验的q值通路按亚型中位值的标准差降序排列展示前20个最显著通路缺氧通路采用Buffa基因集。f. 热图展示PTEN野生型WT与PTEN缺失肿瘤中各通路的校正后GSVA通路中位z值右侧条形图为Wilcoxon秩和检验比较PTEN野生型与缺失组的FDR校正q值仅展示q0.05的通路缺氧通路采用Buffa缺氧基因集。g. 各甲基化亚型内PTEN拷贝数状态与GSVA通路得分的关联圆点为效应量定义为亚型内发生PTEN拷贝缺失与未缺失肿瘤的通路得分中位差值背景色为FDR校正后的q值。h. 各甲基化亚型内复发性拷贝数驱动事件与GSVA缺氧得分的关联圆点为效应量定义为亚型内发生与未发生该变异的肿瘤缺氧得分中位差值背景色为FDR校正后的q值。体细胞驱动突变塑造前列腺癌表观基因组图4体细胞驱动突变对前列腺癌表观组的影响与临床-分子特征的表观特征a. 检验CpG β值与28项体细胞事件、临床特征的关联体细胞特征分为5类突变负荷突变密度、拷贝数变异、染色体倒位、单核苷酸变异、染色体易位含ETS融合。左侧条形图为不同q值区间的占比连续特征采用斯皮尔曼ρ检验分类特征采用Kruskal-Wallis检验右侧条形图为与各特征显著差异甲基化的CpG位点数量q0.05按甲基化/未甲基化状态划分中位β值阈值 0.61。b. 关联CpG位点最多的前4项驱动事件的甲基化谱。每项驱动事件选取100个满足q0.05的CpG位点连续特征要求相关性0.62元MYC扩增特征要求ε²0.2再筛选标准差最大的100个CpG。行CpG位点采用完全连锁法、欧氏距离层次聚类排序连续特征的列样本按降序排列PGA、SNVs/Mbp、基因组重排计数MYC扩增的列采用上述层次聚类排序。c. 按TP53拷贝缺失与SNV突变状态分层的患者行CpG甲基化列热图左侧协变量条标注分组。选取与TP53拷贝缺失显著正相关的前1,000个CpG、显著负相关的前1,000个CpG与TP53 SNV显著正相关的前1,000个CpG、显著负相关的前1,000个CpG合并展示列与行均采用完全连锁法、欧氏距离层次聚类排序。d. 采用逻辑回归检验驱动事件与亚型的关联校正队列与PGA因素以MS-2为参照组展示各亚型列发生对应突变行的比值比。PGA与SNVs/Mbp按中位值2分类图中展示q0.05的12项驱动事件。e. 箱线图展示各甲基化亚型的总驱动事件数标注Kruskal-Wallis检验P值组间两两比较采用Mann-Whitney U检验字母不同代表差异显著q0.05。f. 最终入选模型对各特征y轴标签的预测性能圆点为测试集上的估算性能横线为95%自助法置信区间。数值特征采用皮尔逊相关系数r评估分类特征采用平衡准确率BA评估。g. 预测log2 SNVs/Mbp的测试集性能标注皮尔逊相关系数r与95%自助法置信区间括号内。h. 预测MYC拷贝数扩增的测试集混淆矩阵标注平衡准确率BA与95%自助法置信区间括号内单元格按行占比着色。i. 采用不同数据组合作为预测因子x 轴标签定义见 j分别训练随机森林RF蓝色与正则化Cox比例风险模型rCoxPH红色预测生化复发时间柱高为训练集与测试集的一致性指数C-indexC-index越高代表预测性能越好。j. 图i使用的预测因子组合每行对应1种数据组合名称方框标注纳入的数据类型。k. 采用i中最优模型对测试集161例患者计算复发风险评分按中位值2分为高风险组与低风险组Kaplan-Meier图展示2组的无生化复发生存率标注Cox比例风险模型计算的风险比、95%置信区间与Wald检验P值图下方表格为0-5年各时间点的风险患者数。l. 采用i中最优模型计算52例正常样本、测试集161例局限性前列腺癌样本、99例转移性样本的生化复发风险评分采用Kruskal-Wallis秩和检验比较3组风险评分差异标注P值字母不同代表组间风险评分分布差异显著两两Wilcoxon检验q0.05。DNA甲基化年龄与驱动突变的负相关关系图5体细胞驱动突变对前列腺癌衰老进程的影响a. 10种DNA甲基化时钟的性能表现标注皮尔逊相关系数r与95%置信区间右侧条形图为FDR校正后的q值。b. 10种DNA甲基化时钟的两两相关性皮尔逊r。c. 正常与配对肿瘤样本的DNA甲基化年龄两两比较虚线为拟合线性模型斜率 0.53截距 23.1。d-e. 校正实际年龄后的残差采用Kruskal-Wallis秩和检验比较不同甲基化亚型(d)、不同ISUP分级(e)的相对年龄加速值差异标注P值。f-g. 校正实际年龄后的残差采用Mann-Whitney U检验比较MYC拷贝扩增(f)、NKX3-1拷贝缺失(g)与对应野生型的相对年龄加速值差异标注P值。h. ICGC PRAD-CA队列、TCGA队列及合并队列中拷贝数驱动事件与相对年龄加速校正实际年龄的关联汇总圆点为效应量背景色为q值。讨论图6不同疾病状态下的甲基化亚型分布差异疾病进展过程中甲基化亚型、临床事件、复发性驱动事件的分布示意图。原发肿瘤按ISUP分级分为低级别G1、中级别G2-G3、高级别G4-G5转移性肿瘤单独展示。每个疾病阶段标注各MS亚型占比、5年生化复发率、发生率≥10%的复发性驱动事件转移性肿瘤统一标注为事件阳性。正常、局限、转移病例的整体MS亚型分布见图1e。作为对照底部展示既往研究提出的整合分子亚型IMS-1至IMS-7在原发疾病各阶段的占比。上方小图总结转移性与局限性肿瘤中DNA甲基化-拷贝数关联的变化以中位ρ差值转移-局限≈0.22表示。软件本研究开发的R包PrCaMethy可实现基于Illumina 450K与850K甲基化芯片的前列腺癌DNA甲基化数据分析核心功能包括甲基化亚型预测、临床特征预测、体细胞驱动突变预测等。该R包已在GitHub开源公开https://github.com/TheBoutrosLab/package-PrCaMethy历史版本可访问https://uclahs-cds.github.io/package-PrCaMethy/详细总结思维导图鉴定4类独立预后前列腺甲基化亚型MS-1/MS-2/MS-3/MS-4分型流程TCGA-PRAD队列498肿瘤 50正常作为发现集剩余14个外部队列完成跨队列验证4类亚型具有稳定临床分布规律参考Cancer Discov. 2026 Jun 17. doi: 10.1158/2159-8290.CD-25-0761.The Landscape of Prostate Tumour Methylation260617PrCaMethy.pdf注AI辅助创作如有不当欢迎指出。内容仅供参考不构成任何建议。

相关新闻