网页首页>科技动态

真实世界大规模部署显示:AI驱动的乳腺癌筛查工作流可提升检出率且改善亚群差异
发布时间: 2025年12月15日  浏览次数:


乳腺癌是全球最常见的恶性肿瘤之一。基于人群的乳腺影像筛查(尤其乳腺X线检查)已被证实可促进早期发现并降低死亡风险。然而在真实世界实践中,筛查效能在不同人群间并不完全均衡:乳腺致密度升高可增加组织遮挡,降低病灶可见性并提高漏诊风险;在美国,黑人女性等群体长期面临更高的乳腺癌死亡率与诊断延迟等结构性差异。因此,任何旨在提升筛查效能的新技术,都需要同时接受“总体利益(overall benefit)”与“公平影响(equitable impact)”两方面的检验。

既往研究显示,AI在欧洲筛查体系(双读片、较长筛查间隔、以全视野数字乳腺X线摄影为主)中具有潜在价值;但美国筛查工作流存在显著差异:以单读片、年度筛查、乳腺断层摄影(DBT)为主,且人群构成更为多样。在此背景下,关键问题在于:AI能否在美国式真实世界工作流中实现可规模化的筛查效能提升,并在乳腺密度及种族/族裔等关键亚群中维持一致获益,而非加剧既有差异。

近日,美国 DeepHealth 公司等研究团队在《Nature Health》发表题为“Equitable impact of an AI-driven breast cancer screening workflow in real-world US-wide deployment”的研究论文。该研究评估了一种“多阶段AI辅助筛查工作流”在美国真实世界部署后的效果。工作流包含两部分:第一阶段为用于DBT的 CADe/x 系统(DeepHealth Breast AI),输出分级总体可疑度并标注可疑区域;第二阶段为AI支持的“安全复核(safeguard review)”:当AI提示高风险而初读放射科医师未建议召回时,系统将该检查路由至乳腺影像专科医师进行追加复核,并向初读医师反馈复核意见;最终召回决策仍由初读医师做出,以符合程序要求。

研究在美国4个州的5家影像机构中开展,覆盖109个站点、96名放射科医师。作者将AI工作流部署前后分为两个队列比较:标准流程队列370,692例(2021-09-01至2022-05-19)与AI工作流队列208,891例(2022-08-03至2022-12-31)。

总体结果显示,与标准流程相比,AI工作流带来以下变化:乳腺癌检出率(CDR)提高21.6%(5.58 vs 4.59 /1,000);召回率(RR)小幅上升5.7%(11.1% vs 10.6%);召回阳性预测值(PPV1)提高15.0%(5.01% vs 4.35%)。其中,AI工作流队列有约8.0%的检查(16,763/208,891)触发第二阶段安全复核。上述结果提示:尽管召回率略有增加,但召回的阳性预测值同步改善,新增召回更可能对应真实癌症检出,而非单纯增加不必要的复检负担。

更为关键的是公平性评估。按乳腺密度与种族/族裔分层分析后发现:

·致密乳腺人群CDR提高22.7%(6.18 vs 5.04 /1,000),非致密(A/B)人群CDR提高21.0%(5.10 vs 4.21 /1,000)。

·黑人非西班牙裔、西班牙裔、白人非西班牙裔等主要亚群的CDR相对提升幅度总体集中在约20–22%。

·在CDR、RR与PPV1层面,未观察到AI工作流导致种族/族裔或乳腺密度相关差异扩大的信号;进一步多变量调整(控制年龄、种族/族裔、乳腺密度,并按读片医师聚类)后,结论与未调整分析一致,交互检验未提示亚组间效应差异。

从临床层面看,该研究提供了一个具有可扩展性的折中路径:不同于对所有病例实施双读片的高资源占用模式,该工作流通过AI筛选并触发少量“安全复核”,将额外人力集中于高风险、潜在漏诊的少数病例,而非对全部检查进行重复读片,从而以不足10%的额外复核比例获得显著的检出率增益,并在致密乳腺及主要种族/族裔亚群中表现出总体一致的筛查性能提升。


论文链接:https://doi.org/10.1038/s44360-025-00001-0

注:此研究成果摘自《Nature Health》杂志,文章内容并不代表本网站的观点和和立场,仅供参考