网页首页>科技动态

科学家开发一种基于生成式人工智能模型利用孤儿非编码RNA预测早期肺癌的新方法
发布时间: 2024年12月09日  浏览次数:48

肺癌是全球最常见的癌症之一,其中非小细胞肺癌(non-small cell lung cancer, NSCLC)占大多数病例。然而,早期检测仍然是全球健康的一项重大挑战。孤儿非编码RNA(oncRNAs)是一类在癌症特异性基因组重编程过程中产生的小RNA,它们在癌症细胞中丰富、稳定,并且能从活体癌细胞中主动分泌到血液中。这些特性使得oncRNAs成为液体活检中理想的生物标志物。

近日,来自加利福尼亚大学的科学家在《Nature Communications》上发表了研究文章,题为“Deep generative AI models analyzing circulating orphan non-coding RNAs enable detection of early-stage lung cancer”。该研究介绍了一种基于深度生成式AI模型Orion的液体活检测试,通过分析血清样本中的oncRNAs对早期NSCLC进行检测。

研究团队从1050名不同阶段确诊的NSCLC患者的血清样本中提取出oncRNAs数据,利用开发的多任务生成式AI模型Orion进行分析。Orion结合先进的机器学习技术,通过捕捉和去除批次效应等混杂因素,能够准确识别出早期癌症的特征模式。实验结果显示,Orion在检测NSCLC方面的性能显著优于传统方法,在所有阶段的癌症检测中实现了94%(95% CI: 87%-98%)的整体敏感性,在87%(95% CI: 81%-93%)的特异性下,比其他方法在保留验证数据集上的敏感性高出约30%以上,这表明Orion模型能够有效地从血液中的oncRNAs模式中识别出肺癌信号。

Orion模型能够从高噪声和稀疏的数据中学习潜在的分布特征,这使得它在处理多元生物标志物数据时,能够发现传统方法难以识别的模式与关联,为生成式 AI 在推进液体活检和液体组织学应用方面的潜力奠定了强有力的依据。


论文链接:https://doi.org/10.1038/s41467-024-53851-9

注:此研究成果摘自《Nature Communications》杂志,文章内容并不代表本网站的观点和立场,仅供参考。