解码生命语言:深度学习模型TranslationAI揭示RNA翻译新规则

news2025/5/16 15:14:23

RNA翻译是基因表达的核心环节,其精确调控依赖于翻译起始位点(TIS)和终止位点(TTS)的准确识别。传统方法依赖于简单的经验规则(如Kozak序列或最长开放阅读框ORF),但忽略了RNA结构、顺式调控元件等复杂因素,导致预测准确性有限。近年来,深度学习技术在生物学领域的应用为解决此类复杂问题提供了新思路。近日,《Nucleic Acids Research》发表了一项突破性研究——TranslationAI,一个基于深度学习的模型,能够直接从全长度mRNA序列预测翻译起始位点(TIS)和终止位点(TTS),并揭示了翻译调控的新规律!

 

图示摘要

TranslationAI的架构与训练

TranslationAI基于深度残差卷积神经网络构建,采用独热编码表示mRNA序列作为输入(图1A)。模型包含32层扩张卷积结构,能够处理长达2000 nt的侧翼序列,输出每个位置作为TIS、TTS或非翻译位点(NS)的概率(图1A,补充图S1)。训练数据集来自RefSeq注释的47,098个人类蛋白质编码转录本,其中70%用于训练,30%用于测试。模型通过优化分类交叉熵损失函数,结合Adam优化器进行训练,最终在测试集上实现了>99%的精确召回曲线下面积(PR-AUC)(图1B)。

 

图1:用于翻译预测的深度学习网络构建

模型性能与特征分析

TranslationAI在预测经典TIS/TTS时表现出色,其准确性随输入窗口增大而显著提升(图1B)。值得注意的是,长序列上下文(如2k nt)对预测至关重要,尤其是对于长转录本(图1C)。模型通过系统扰动实验揭示了其学习的关键特征:

  • 密码子身份:替换经典起始或终止密码子会显著降低预测分数(图1F)。

  • UTR序列:5'-UTR的扰动对TIS预测影响显著,而3'-UTR的扰动对TTS预测影响较小(图1G)。

  • 密码子偏好:高密码子适应指数(CAI)的 synonymous 突变提升预测分数,反之则降低(图1I)。

  • 三联体规则:单或双核苷酸缺失破坏阅读框,显著影响预测,而三核苷酸缺失影响较小(图1H)。

 

翻译终止的新调控机制

TranslationAI揭示了密码子使用在翻译终止中的重要作用。强终止位点上游倾向于富含C/G的密码子,且第三位碱基的C/G偏好尤为显著(图2D)。这种密码子偏好可能与进化选择有关,暗示着密码子使用在翻译终止中的未被充分认识的作用(图2D)。实验验证显示,在终止密码子上游引入C/G富集的 synonymous 突变可减少翻译通读,而A/U富集的突变则增加通读(图2F)。此外,核糖体分析数据支持弱TTS位点后存在更高的翻译泄漏(图2G)。

 

图2:TranslationAI预测特征的评估

非经典ORF的发现

TranslationAI成功预测了人类转录组中大量非经典ORF,包括上游ORF(uORF)、下游ORF(dORF)及lncRNA中的新ORF(图3A)。例如,模型在lncRNA中鉴定了3,794个潜在可翻译ORF,其中部分通过核糖体分析(Ribo-seq)和质谱(MS)验证(图3F, 3G)。值得注意的是,模型对经典TIS/TTS的预测准确性高于非经典位点(图3C),可能源于训练数据的偏差。

 

图3:人类转录组中非经典开放阅读框的鉴定

跨物种与病毒的适用性

TranslationAI在多种真核生物(如小鼠、斑马鱼、果蝇等)中表现出高预测准确性(图4A),且优于现有工具(如TITER和TIS-predictor)。此外,模型对依赖宿主翻译机制的病毒(如埃博拉病毒)的ORF预测效果良好(图4B),但对SARS-CoV-2等复杂基因组的预测准确性较低(图4C),可能与多顺反子结构有关。

 

图4:TranslationAI精确预测真核生物、原核生物和病毒翻译起始与终止位点

讨论与展望

TranslationAI通过深度学习框架揭示了RNA翻译的复杂调控规则,其成功依赖于对全长mRNA序列的全局分析。模型的局限性包括对非经典起始密码子(如非AUG)的预测不足,以及对组织特异性翻译调控的有限覆盖。未来可通过整合更多实验数据(如多组织Ribo-seq)进一步优化模型。

总之,TranslationAI不仅为翻译调控研究提供了高效工具,还通过其预测结果拓展了对翻译机制的理解,为基因注释和疾病相关变异研究开辟了新途径。

关注我们,获取更多前沿生物信息学研究成果!有什么想法可以在评论区评论,也可以私信获取原文PDF哦!

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2376953.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

重磅发布!OpenAI 推出最新模型 GPT-4.1 系列!

今日凌晨,OpenAI宣布开放全新模型GPT-4.1,并于即日起在ChatGPT中投入使用。 超长上下文与卓越编码能力 GPT-4.1作为OpenAI的最新模型,支持长达100万tokens的上下文,是OpenAI首次发布的长窗口模型。相较于前代,GPT-4.1…

sqli-labs靶场第七关——文件导出注入

一:目标 通过sql注入将php代码写入网站目录,通过这个php文件执行命令 二:确认前置条件 %secure_file_priv% 首先我们需要Mysql是否允许导出文件 先尝试在网页中sql注入,检查导出权限 ?id1)) union select 1,secure_file_pr…

解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs-docker MCP解析

解密企业级大模型智能体Agentic AI 关键技术:MCP、A2A、Reasoning LLMs-docker MCP解析 这里面有很重要的原因其中一个很其中一个原因是因为如果你使用docker的方式,你可以在虚拟环境下就类似于这个沙箱的这个机制可以进行隔离。这对于安全,…

OpenCV图像旋转原理及示例

OpenCV计算机视觉开发实践:基于Qt C - 商品搜索 - 京东 图像旋转是数字图像处理的一个非常重要的环节,是图像的几何变换手法之一。图像旋转算法是图像处理的基础算法。在数字图像处理过程中,经常要用到旋转,例如在进行图像扫描时…

【实战篇】数字化打印——打印部署管理接口开发

前言 前面的章节已经介绍了打印管理模块的主要界面设计,本篇介绍用myBuilder开发界面接口,实现最终的功能。 1. 配置打印应用菜单 首先配置挂载好模块菜单 让菜单点击能访问到对应的页面 2. 打印部署管理数据表详细设计 以下是打印部署管理的数据表字…

MacOS Python3安装

python一般在Mac上会自带,但是大多都是python2。 python2和python3并不存在上下版本兼容的情况,所以python2和python3可以同时安装在一台设备上,并且python3的一些语法和python2并不互通。 所以在Mac电脑上即使有自带python,想要使…

idea启动报错:java: 警告: 源发行版 11 需要目标发行版 11(亲测解决)

引起原因 idea的jdk没有替换干净 1.配置project file–Project Structrue–Project 2.配置Modules-Sources file–Project Structrue–Modules-Sources 改为jdk11 3.配置Modules-Dependencies file–Project Structrue–Modules-Dependencies

《Adversarial Sticker: A Stealthy Attack Method in the Physical World》论文分享(侵删)

原文链接:Adversarial Sticker: A Stealthy Attack Method in the Physical World | IEEE Journals & Magazine | IEEE Xplore author{Xingxing Wei and Ying Guo and Jie Yu} 摘要 为了评估深度学习在物理世界中的脆弱性,最近的工作引入了对抗补丁…

嵌入式STM32学习——继电器

继电器模块引脚说明 VCC(): 供电正极。连接此引脚到电源(通常是直流电源),以提供继电器线圈所需的电流。 GND(-): 地。连接此引脚到电源的负极或地。 IN(或…

从基础到实习项目:C++后端开发学习指南

在当今技术快速迭代的背景下,后端开发作为软件工程的核心支柱持续发挥着关键作用。C凭借其卓越的性能表现和系统级控制能力,依然是构建高性能后端服务的首选语言之一。本文将系统性地解析现代C后端开发的核心技术体系,包括从语言特性精要到架…

Xinference推理框架

概述 GitHub,官方文档。 核心优势 性能优化:通过vLLM、SGLang等引擎实现低延迟推理,吞吐量提升2-3倍;企业级支持:支持分布式部署、国产硬件适配及模型全生命周期管理;生态兼容:无缝对接LangC…

前端ECS简介

ECS概念 ECS是一种软件架构模式,常见于游戏业务场景,其主要对象分类为 • Entity 实体,ECS架构中所有的业务对象都必须拥有一个唯一的Entity实体 • Component 组件,存储着数据结构,对应着某一种业务属性,一个Entity上可以动态挂载多个Component • …

Dify与n8n全面对比指南:AI应用开发与工作流自动化平台选择【2025最新】

Dify与n8n全面对比指南:AI应用开发与工作流自动化平台选择【2025最新】 随着AI技术与自动化工具的迅速发展,开发者和企业面临着多种平台选择。Dify和n8n作为两个备受关注的自动化平台,分别专注于不同领域:Dify主要面向AI应用开发&…

【深度学习之四】知识蒸馏综述提炼

知识蒸馏综述提炼 目录 知识蒸馏综述提炼 前言 参考文献 一、什么是知识蒸馏? 二、为什么要知识蒸馏? 三、一点点理论 四、知识蒸馏代码 总结 前言 知识蒸馏作为一种新兴的、通用的模型压缩和迁移学习架构,在最近几年展现出蓬勃的活力…

redis解决常见的秒杀问题

title: redis解决常见的秒杀问题 date: 2025-03-07 14:24:13 tags: redis categories: redis的应用 秒杀问题 每个店铺都可以发布优惠券,保存到 tb_voucher 表中;当用户抢购时,生成订单并保存到 tb_voucher_order 表中。 订单表如果使用数据…

TypeScript中文文档

最近一直想学习TypeScript,一直找不到一个全面的完整的TypeScript 中文文档。在网直上找了了久,终于找到一个全面的中文的typescript中文学习站,有学习ts的朋友可以年。 文档地址:https://typescript.uihtm.com 该TypeScript 官…

Function Calling

在介绍Function Calling之前我们先了解一个概念,接口。 接口 两种常见接口: 人机交互接口,User Interface,简称 UI应用程序编程接口,Application Programming Interface,简称 API接口能「通」的关键,是两边都要遵守约定。 人要按照 UI 的设计来操作。UI 的设计要符合人…

面试--HTML

1.src和href的区别 总结来说&#xff1a; <font style"color:rgb(238, 39, 70);background-color:rgb(249, 241, 219);">src</font>用于替换当前元素&#xff0c;指向的资源会嵌入到文档中&#xff0c;例如脚本、图像、框架等。<font style"co…

SparkSQL操作Mysql-准备mysql环境

我们计划在hadoop001这台设备上安装mysql服务器&#xff0c;&#xff08;当然也可以重新使用一台全新的虚拟机&#xff09;。 以下是具体步骤&#xff1a; 使用finalshell连接hadoop001.查看是否已安装MySQL。命令是: rpm -qa|grep mariadb若已安装&#xff0c;需要先做卸载MyS…

DeepBook 与 CEX 的不同

如果你曾经使用过像币安或 Coinbase 这样的中心化交易所&#xff08;CEX&#xff09;&#xff0c;你可能已经熟悉了订单簿系统 — — 这是一种撮合买卖双方进行交易的机制。而 DeepBook 是 Sui 上首个完全链上的中央限价订单簿。 那么&#xff0c;是什么让 DeepBook 如此独特&…