肿瘤新抗原研究进展加速了免疫疗法的开发,如癌症疫苗和抗体疗法。新抗原由肿瘤细胞的基因突变产生,能够激活T细胞反应。尽管新一代测序和人工智能技术使识别和预测新抗原成为可能,但识别能引发强T细胞反应的新抗原仍具挑战。这涉及到TCR-抗原-HLA三者间的复杂相互作用,且相应序列在个体间差异较大。针对个体进行个性化诊断和新抗原筛选仍缺乏有效的方法。
华东理工大学药学院李洪林团队、华东师范大学计算机学院张凯团队等多家单位合作在《Nature Machine Intelligence》发表题为"Sliding-attention transformer neural architecture for predicting T cell receptor-antigen-human leucocyte antigen binding" 的研究论文。研究人员提出了“物理启发的Sliding-Transformer”算法—PISTE,用于个性化的TCR-抗原-HLA结合预测和肿瘤新抗原筛选。该算法既继承了传统数据驱动的注意机制的灵活性,又继承了物理原理的规律性,在临床相关的应用上显示出良好的效果。
TCR-抗原-HLA序列的多样性和现有数据的长尾分布问题给个性化的TCR-抗原-HLA结合预测提出了挑战。为解决该问题,作者创新地对Transformer的注意力机制进行了改进,使得模型可以在残基水平上有效地探索多个生物序列复杂、高维的相互作用空间。具体得,作者首先将TCR-抗原-HLA序列输入序列编码器模块,提取子序列特征;然后使用滑动注意模块以残基相互作用的梯度场为指引实现氨基酸残基的逐步定位,有效地探索相互作用景观并识别最可能的结合构象。最后,将这三个序列反馈到池化模块转换为固定维度表示,用于预测全局结合状态。通过该预测分数作为指标,作者最终得到一组新抗原的排序。
计算实验结果显示,该算法达到了90%以上的精度,并能提供残基相互作用的清晰图景(HLA-抗原相互作用矩阵与真实接触矩阵的相关系数为0.75,TCR-抗原相互作用矩阵为0.916),该结果表明模型可以为体外的免疫反应评估提供依据。在一项于前列腺癌患者中进行的前瞻性研究中,75%的患者对模型筛选的全新抗原表现出免疫反应,展现出模型在临床相关应用方面的巨大潜力。
综上所述,PISTE通过残基相互作用的梯度场引导解决了Transformer的局限性,该算法不仅显著提升了准确性和可解释性,还展现了一定的临床应用前景,有望为癌症的个性化诊断和治疗策略选择提供新的范例框架。
论文链接:
https://www.nature.com/articles/s42256-024-00901-y
注:此研究成果摘自《Nature Machine Intelligence》期刊,文章内容并不代表本网站的观点和立场,仅供参考。