Eur Radiol(IF=4.7)山西医科大学第一医院核磁影像科王效春等团队:基于Transformer增强型卷积神经网络的多中心MRI评估膀胱癌肌层浸润

张开发
2026/4/21 6:57:10 15 分钟阅读

分享文章

Eur Radiol(IF=4.7)山西医科大学第一医院核磁影像科王效春等团队:基于Transformer增强型卷积神经网络的多中心MRI评估膀胱癌肌层浸润
01文献学习今天分享的文献是由山西医科大学第一医院核磁影像科王效春教授等团队于2026年4月4日在《European Radiology》中科院2区IF4.7上发表的研究“Application of transformer-enhanced convolutional neural network: multicenter MRI assessment of muscle invasion in bladder cancer”即基于Transformer增强型卷积神经网络的多中心MRI评估膀胱癌肌层浸润该研究旨在解决膀胱癌MRI评估中存在的“形态相关诊断偏倚”即有蒂 vs. 无蒂病变。研究团队开发了一种基于ConvNeXt-tiny架构的2.5D深度学习模型用于评估膀胱癌是否侵犯肌层并与放射科医生初级和高级的诊断表现进行对比。结果表明该模型在无蒂病变中显著减少了过度分期表现出与病变形态无关的稳定诊断性能。创新点①融合Transformer理念的ConvNeXt通过大核卷积、层归一化等设计增强全局上下文建模无需手工特征即可提升分期准确性。②揭示形态学诊断偏倚首次证实放射科医生对无蒂病变存在过度分期特异性显著下降而模型无此偏倚。③高效2.5D框架与可解释性采用2.5D输入和类激活映射兼顾计算效率与决策逻辑可视化优于传统3D模型。临床价值①减少无蒂病变过度治疗模型特异性达91.9-96.0%避免将非肌层浸润误判为肌层浸润降低不必要根治手术。②提供形态无关的客观评估不受肿瘤带蒂/无蒂形态干扰为VI-RADS评分提供补充尤其适用于疑难病例。③多中心前瞻性验证高灵敏度在90%特异性下灵敏度达84-89%优于放射科医生提升早期检测可靠性。图 2研究整体工作流程图AnnU-Net 分割网络展示编码器-解码器架构包含3D卷积层、InstanceNorm、LeakyReLU和跳跃连接。用于自动分割T2WI上的肿瘤区域。B2.5D 分类框架以肿瘤最大面积切片为中心取前后各3层共7层切片用滑动窗口步长1循环边界生成7个三通道堆栈沿batch维度拼接后输入网络。CConvNeXt‑tiny 骨干网络包含4个阶段分别有3、3、9、3个ConvNeXt块每个块采用逆瓶颈设计、LayerNorm、GELU激活和1×1卷积组成的MLP。下采样通过2×2卷积实现最后通过全局池化和全连接层输出分类概率。02研究背景和目的研究背景膀胱癌是全球第九大常见恶性肿瘤其治疗决策的核心依据是肿瘤是否侵犯肌层非肌层浸润性膀胱癌NMIBC预后较好通常采用经尿道切除术而肌层浸润性膀胱癌MIBC预后较差需行根治性切除联合放化疗。MRI是目前评估肌层浸润最重要的无创影像方法尤其是T2加权像可清晰显示肿瘤与膀胱壁的关系。然而常规MRI评估存在明显的形态相关诊断偏倚临床经验认为“有蒂”病变的肌层浸润风险低“无蒂”病变风险高这种固定思维模式可能导致放射科医生在解读图像时产生锚定偏倚和确认偏倚从而对无蒂病变过度分期假阳性。尽管VI-RADS评分系统提高了诊断一致性但其评分标准中明确将“蒂”作为低分1-2分的关键特征可能反而强化了这一偏倚。近年出现的深度学习模型如ResNet、Inception V3虽在预测肌层浸润方面展现出潜力但它们作为传统卷积神经网络CNN全局上下文建模能力有限往往需要依赖手工提取的影像组学特征来提升性能。ConvNeXt是一种融合了Transformer设计理念大核卷积、层归一化、GELU激活的现代化CNN能够在保持卷积计算效率的同时增强全局上下文建模。因此探索该模型能否克服形态相关的诊断偏倚具有重要的临床价值。研究目的本研究旨在开发并验证一个基于ConvNeXt的增强型卷积神经网络Transformer-enhanced CNN用于术前通过多中心MRI评估膀胱癌的肌层浸润状态并重点检验该模型是否能够独立于肿瘤形态有蒂 vs. 无蒂实现准确诊断从而克服传统影像评估中存在的形态相关诊断偏倚。具体目标包括第一利用nnU-Net辅助肿瘤分割构建2.5D分类框架处理T2加权图像并对比ConvNeXt-tiny与ResNet50、DenseNet169、Inception V3等传统CNN的性能第二在回顾性训练/验证集和三个前瞻性测试集内部及两个外部中心中系统比较模型与高年资10年经验和低年资5年经验放射科医生的诊断效能AUC、准确率、敏感度、特异度尤其针对无蒂病变的特异性进行亚组分析第三通过类激活映射CAM可视化解释模型的决策逻辑并采用决策曲线分析评估其临床净获益。研究假设模型不受形态偏倚影响在无蒂病变中能显著提高特异性减少过度分期从而为临床提供更可靠的辅助决策工具尤其适用于易被误判的无蒂病变。03数据和方法研究数据总样本量1374例膀胱尿路上皮癌患者来自三个中心。数据划分训练集487例中心A回顾性2018-2022验证集121例内部测试集490例中心A前瞻性2022-2024外部测试集1181例中心B外部测试集295例中心C排除标准最大直径 5mm的微小病变图 1患者筛选流程图技术方法图像分割使用nnU-Net辅助分割T2加权图像中的肿瘤区域。模型架构ConvNeXt-tiny2.5D框架7层切片堆叠滑动窗口输入。训练策略Asymmetric Loss、AdamW优化器、CyclicLR调度。对比模型ResNet50、DenseNet169、Inception V3。评估指标AUC、准确率、灵敏度、特异性。统计方法Delong检验、Z检验、Fisher精确检验、FDR校正。04实验结果模型性能验证集及三个测试集AUC为0.915–0.925准确率84.9–91.0%。显著优于传统CNN模型。形态偏倚分析模型在有无蒂病变之间无显著性能差异。放射科医生在无蒂病变中特异性显著下降从~90%降至~75%。头对头比较在无蒂病变中模型特异性91.9–96.0%显著高于医生72.8–79.8%。在内部测试集中模型AUC0.921显著高于高级0.876和初级0.867医生。图 3放射科医生诊断性能的雷达图图 4在90%特异性下的灵敏度比较条形图文本推断图 5Grad-CAM 可视化对比图 6与蒂相关的诊断偏倚代表性病例05研究结论该研究证明膀胱癌肌层浸润的MRI评估存在与肿瘤形态相关的诊断偏倚主要表现为放射科医生对无蒂sessile病变的特异性显著下降从带蒂病变的约90%降至75%左右即倾向于过度诊断为肌层浸润性膀胱癌。相比之下基于ConvNeXt‑tiny架构的深度学习模型在带蒂与无蒂病变间的诊断性能无显著差异有效克服了形态依赖的偏倚。头对头比较显示在无蒂病变中模型的特异性91.9%–96.0%显著高于高级和初级放射科医生72.8%–79.8%且AUC、灵敏度等指标整体更优。模型在内部及外部测试集中均表现稳定AUC 0.915–0.925并具有良好的校准度和临床净收益。类激活映射进一步揭示了模型对肿瘤及膀胱壁区域的全局上下文建模能力为其可解释性提供了直观证据。综上该深度学习模型能够独立于肿瘤形态评估肌层浸润状态尤其可减少对无蒂病变的过度诊断有望作为临床辅助工具提升MRI评估的准确性。参考文献Fan Z, Li D, Chen W, Li Y, Guo J, Zheng W, Wang B, Wang Y, Wang X. Application of transformer-enhanced convolutional neural network: multicenter MRI assessment of muscle invasion in bladder cancer. Eur Radiol. 2026 Apr 4. doi: 10.1007/s00330-026-12497-5.

更多文章