点击本文中加粗蓝色字体即可一键直达新药情报库免费查阅文章里提到的药物、机构、靶点、适应症的最新研发进展。
RNA可变剪接是基因表达后的一项重要调控机制,被认为是生物多样性和蛋白质多功能性的重要来源之一。研究表明,人类90%以上的基因可以进行可变剪接,不同的组织和细胞类型中,这一过程的多样性进一步促进了细胞表型的多样化。同时,RNA可变剪接的变化也与多种遗传疾病有着密切的关联。特别值得注意的是,RNA可变剪接具有强烈的组织特异性,相同的pre-mRNA序列在不同组织中可能产生不同的剪接结果,导致复杂的转录组和蛋白质组表达。
当前,尚缺乏能够预测组织特异性可变剪接的精确算法。因此,开发能够精确预测这种剪接模式的工具显得尤为重要,以期加深我们对遗传变异的理解,并推动后续研究的进展。
2024年10月23日,浙江大学良渚实验室沈宁和刘志红团队在《Nature Communications》杂志上发表了一篇题为《SpliceTransformer predicts tissue-specific splicing linked to human diseases》的研究论文。他们开发了一种基于Transformer架构的多模态深度学习模型——SpliceTransformer(简称SpTransformer),用于预测pre-mRNA序列中的组织特异性可变剪接位点。该模型提供了一种新方法,通过解析与组织特异性剪接变异相关的疾病,提供了基于可变剪接机制的新见解。
SpTransformer创新性地利用多样的训练数据,包括GTEx人体组织的RNA-seq数据及来自其他哺乳动物的RNA-seq数据。模型采取one-hot编码的pre-mRNA序列作为输入,卷积编码器处理序列后,结合八层自注意力Transformer网络输出多标签分类结果。该方法能够处理9000nt至15000nt的长序列上下文信息,对序列中央段同时进行预测。SpTransformer的预测精确性显著优于现有的其他算法。
研究团队还探讨了模型的可解释性,揭示SpTransformer可以成功识别出远端序列调控元件对可变剪接的影响。此外,依据突变前后序列的预测差异,研究者以数学方法量化了突变对可变剪接的影响,称之为ΔSplice分数。通过分析和预测大规模数据库ClinVar中的1,273,053个单核苷酸变异(SNV),发现这些突变可能引发显著的组织特异性变化。
进一步的研究显示,尽管可变剪接的组织特异性早已广为人知,但SNV如何影响这种特异性仍是研究热点。研究者开发了Tissue z-score分数衡量突变对特定组织剪接模式的影响。这一评估方法帮助识别出涉及组织特异性剪接的基因,研究结果表明这些基因往往与相关遗传疾病相关。
此外,研究还应用SpTransformer探讨了多种精神疾病的潜在机制,包括自闭症、精神分裂症及双相障碍,通过超过17万个样本的全外显子组分析,揭示了涉及脑组织特异性剪接变化的基因及潜在致病机制。与以往对基因表达量的研究相比,SpTransformer提供了新的视角,可能成为解析复杂疾病遗传机制的重要工具。
该研究还在肾脏特异性剪接的分析中发挥重要作用,利用RNA-seq方法验证突变对组织特异性影响的准确性达到83%。
综上所述,该论文介绍的SpTransformer模型展现了其预测组织特异性可变剪接的准确性及应用潜力,特别是在遗传诊断中的实际价值。该工具的代码已在GitHub上开源,并提供了在线服务平台,供用户使用以快速预测突变对特异性剪接的影响。
这项研究由浙江大学良渚实验室沈宁研究员和刘志红院士联合指导,其他多位科研人员也对此做出了重要贡献,其研究意义和临床应用潜力不可小觑。
免责声明:新药情报内容编辑团队专注于介绍全球生物医药健康研究的最新进展,本文旨在提供信息交流,不代表任何立场或治疗方案推荐。如需专业医疗建议,请咨询正规医疗机构。