ESMFold对决AlphaFold:蛋白质-肽相互作用预测的新进展

news2025/5/14 7:17:45

今天向大家介绍的这篇文章题目为:“Protein−Peptide Docking with ESMFold Language Model”,近期发表在JCTC上。

本文主要研究 ESMFold 语言模型在蛋白质-肽对接中的应用。通过探索多种对接策略,评估其在预测蛋白质-肽相互作用方面的性能,并与 AlphaFold-Multimer、AlphaFold 3 等工具对比,发现 ESMFold 虽整体准确性不及 AlphaFold 系列工具,但在某些情况下表现出色,且计算效率高,在高通量肽设计的一致性方法中具有潜在价值。

Image

作者信息

  • • 第一作者 Mateusz Zalewski:单位为华沙大学化学系生物与化学研究中心;研究方向与蛋白质-肽对接等生物化学计算领域相关.

  • • 通讯作者 Sebastian Kmiecik:单位是华沙大学化学系生物与化学研究中心;研究方向涵盖蛋白质结构预测、蛋白质-肽相互作用的计算研究等,致力于通过计算手段推动生物化学领域的发展。

拟解决的问题

探究 ESMFold 语言模型在蛋白质-肽对接中的有效性,评估其性能并与其他工具对比,确定其在蛋白质-肽对接研究及药物设计中的价值与潜力。

用到的方法与材料

  • • 数据集:使用 Wallner 等人创建的 Dataset 1(包含 112 个实验蛋白质-肽复合物结构,因内存限制排除 6UEB 结构)和 Manshour 等人引入的 Dataset 2(包含 60 个蛋白质-肽结构)。

  • • ESMFold 模型:利用在 ColabFold 笔记本中实现的 ESMFold 版本,通过在氨基酸链之间引入柔性聚甘氨酸接头进行蛋白质-肽对接,预测后去除接头。

  • • 评估指标:采用 DockQ 分数衡量蛋白质-肽对接质量(0 - 1 分,0.23 - 0.5 为可接受,0.5-0.8 为中等质量,0.8 及以上为高质量),使用预测的局部距离差异测试(pLDDT)值评估预测的置信度和可靠性(平均 pLDDT 值超过 70 为高置信度)。

主要结果

  • • ESMFold Default Protocol结果:使用 30 个氨基酸的聚甘氨酸接头和默认设置时,111 个案例中只有 15 个结构达到或超过可接受阈值(DockQ≥0.23) ,其中只有 5 个为高质量;许多肽与受体距离超过 8Å,表明对接错误;去除错误案例后,有效成功率为 36%;预测 252 个残基的蛋白质-肽复合物在 A100 GPU 上仅需 21s(不包括首次安装 ESMFold 的约 3 分钟设置时间)。

Image

  • • Random Masking(随机掩码) Approach结果:采用随机掩码策略(掩码率 0.25,每个复合物生成 8 个结构),产生了 27 个可接受或更好的结构,其中 6 个为高质量;通过不同 pLDDT 值评分策略筛选,以受体接触残基比例加权 pLDDT 分数的方法效果最佳;去除错误对接案例后,有效成功率为 40%;生成 8 个结构在 A100 GPU 上约需 61s。

Image

  • • 其他策略结果:探索自适应循环和各种接头配置,发现扩展循环次数效果不如随机掩码;30 个残基的 C 末端接头为最佳配置。

Image

Image

  • • 与 AlphaFold 对比:在 Dataset 1 上,ESMFold 整体精度低于 AlphaFold-Multimer(增强采样) ,但在 3 个案例中 ESMFold 产生了可接受或更好的模型,而 AlphaFold 预测质量不可接受;在 Dataset 2 上,ESMFold 表现与 Dataset 1 相当或更好,且在部分案例中优于 AlphaFold 3。

Image

Image

数据与代码链接

ESMFold 模型可通过 ColabFold 访问,相关代码可在https://github.com/sokrypton/ColabFold获取;

本研究修改后的 ESMFold 脚本及生成的所有输出结构可在https://github.com/ZalewskiMa/ESMFold-docking获取。
代码链接要复制我这里的哦,原文的链接给的不对!!!

总结

  • • 不足之处:许多生成的模型对接不正确,ESMFold 的对接准确性有待进一步提高。

  • • 意义:ESMFold 在蛋白质-肽对接中能产生可接受的模型,偶尔优于 AlphaFold 系列工具,且速度快,在高通量肽设计的一致性方法中有潜在价值;其利用序列嵌入和识别关键结合基序的能力,为蛋白质-肽对接研究提供了新方向,后续发展有望成为现有方法的有力补充,推动基于肽的治疗药物开发。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2314116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

win终端添加git-bash,支持linux的shell语法

git的git-bash支持很多linux的语法,比如ll,rm等等,用着很方便,比cmd、ps用着习惯 点击下箭头,设置 添加新配置 配置 地址为git地址\bin\bash.exe,不要用根目录的git-bash.exe,这个会打开新弹窗后…

wpf中DataGrid组件每一行的背景色动态变化

背景描述:存在多个轧辊,其中有的轧辊是成对的,成对的辊ROLL_NO这个变量的值相同,有的轧辊是单个暂时没有配对的。成对的辊北京颜色交替突出显示,单个辊不需要设置背景色。 实现: 换辊的时候给成对的辊分配相…

002-告别乱码-libiconv-C++开源库108杰

本课文包含三个视频! 为什么中文版Windows是编程出现乱码的高发地带?怎么用 libiconv 把国标编码的汉字转换成宇宙统一码?怎么简化 libiconv 那些充满坑的 纯C 函数API? 1. 安装 libiconv 通常,你在 MSYS2 中安装过 G…

DeepSeek赋能智慧交通:城市交通流量智能预测与优化,开启智能出行新时代

在数字化转型的浪潮中,智慧交通正成为提升城市运行效率、改善居民出行体验的关键领域。 DeepSeek作为人工智能领域的前沿技术,凭借其强大的数据分析、智能决策和多模态交互能力,正在为智慧交通注入新的活力,推动交通管理从“经验…

Token登录授权、续期和主动终止的方案(Redis+Token(非jwtToken))

1、RedisToken方案的授权 1.1 基本原理 登录后使用UUID生成token,前端每次请求都会带上这个token作为授权凭证。这种方案是能自动续签,也能做到主动终止。所以很多项目用的都是RedisToken方案,简单方便问题少。缺点就是需要依赖Redis和数据…

强大的数据库DevOps工具:NineData 社区版

本文作者司马辽太杰, gzh:程序猿读历史 在业务快速变化与数据安全日益重要的今天,生产数据库变更管理、版本控制、数据使用是数据库领域的核心挑战之一。传统的解决方式往往采用邮件或即时通讯工具发起审批流程,再通过堡垒机直连数…

【动态规划篇】1137. 第 N 个泰波那契数

前言: 动态规划问题一般分为五步: 先确定一个状态表示根据状态表示来推导状态方程初始化填表顺序返回值 ①状态表示 先创建一个以为数组,起名为dp,这个一维数组就叫做dp表 把dp表填满,填满后的某个值就是我们想要的结果状态表…

网络信息安全专业(710207)网络安全攻防实训室建设方案

一、引言 随着信息技术的飞速发展,网络空间安全已成为国家安全的重要组成部分,对网络信息安全专业人才的需求日益增长。为满足网络信息安全专业(专业代码710207)的教学需求,提升学生在网络安全攻防领域的实践能力&…

【Linux】:线程池

朋友们、伙计们,我们又见面了,本期来给大家带来线程池相关的知识点,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成! C 语 言 专 栏:C语言:从入门到精通 数据结构…

共享内存(System V)——进程通信

个人主页:敲上瘾-CSDN博客 进程通信: 匿名管道:进程池的制作(linux进程间通信,匿名管道... ...)-CSDN博客命名管道:命名管道——进程间通信-CSDN博客 目录 一、共享内存的原理 二、信道的建立 …

ctfhub-HTTP协议

请求方式 它要我们使用CTF**B Method,其实就是ctfhub方式 我们直接抓包试一试,把GET改成CTFHUB,在发送到repeater 在repeater处点击发送,得到响应 302跳转 点击“give me flag"没有任何变化,我们抓个包试试 我们把它发送到repeater&…

【TMS570LC4357】之工程创建

备注:具体资料请在官网海淘.TMS570LC4357资料 在线文档Hercules Safety MCU Resource Guide — Hercules Safety MCUs Documentation XDS100 Debug Probe (ti.com) Git https://git.ti.com/git/hercules_examples/hercules_examples.git https://git.ti.com/cgit/h…

一种改进的Estimation-of-Distribution差分进化算法

为了充分利用差分进化(DE)的强大开发和estimation-of-distribution算法(EDA)的强大探索,提出了一种混合estimation-of-distribution算法的改进差分进化IDE-EDA。首先,提出了一种新的协同进化框架&#xff0…

[数据结构]排序之希尔排序( 缩小增量排序 )

希尔排序法又称缩小增量法。希尔排序法的基本思想是: 先选定一个整数,把待排序文件中所有记录分成个 组,所有距离为的记录分在同一组内,并对每一组内的记录进行排序。然后,取,重复上述分组和排序的工 作。当…

进程(下)【Linux操作系统】

文章目录 进程的状态R状态:S状态:D状态:T状态t状态Z状态:孤儿进程X状态: 进程的优先级如果我们要修改一个进程的优先级重置进程优先级 进程切换进程的调度 进程的状态 在内核中,进程状态的表示&#xff0c…

Insar结合ISCE2,某一个文件进行并行-stackSentinel.py

stackSentinel.py 依次执行 run_01 到 run_15,记录各自的日志 并行执行 run_16 里的所有命令,仍然记录日志 不知道对不对,测试的时间有点长就给停了 #!/bin/bash# ✅ 适用于 WSL/Linux runfiles_path"/mnt/e/insar_order_test/Stack…

2.2.3 TCP—UDP-QUIC

文章目录 2.2.3 TCP—UDP-QUIC1. TCP如何做到可靠性传输1. ACK机制2. 重传机制3. 序号机制4. 窗口机制5. 流量机制6. 带宽机制 2. tcp和udp如何选择1. tcp和udp格式对比2. ARQ协议(Automatic Repeat reQuest,自动重传请求)1. ARQ协议的主要类…

【Golang】第一弹-----初步认识GO语言

笔上得来终觉浅,绝知此事要躬行 🔥 个人主页:星云爱编程 🔥 所属专栏:Golang 🌷追光的人,终会万丈光芒 🎉欢迎大家点赞👍评论📝收藏⭐文章 一、Go语言的简单介绍 1、G…

K8S学习之基础二十三:k8s的持久化存储之nfs

K8S持久化存储之nfs ​ 在 Kubernetes (k8s) 中使用 NFS(Network File System)作为存储解决方案是一种常见的方式,特别是在需要共享存储的场景中。以下是关于如何在 Kubernetes 中使用 NFS 存储的详细说明: 1. 准备 NFS 服务器 …

【Linux通信篇】深入理解进程间通信——管道

--------------------------------------------------------------------------------------------------------------------------------- 每日鸡汤:找一个对的人,然后好好去爱。一个你跟他在一起,然后又可以舒舒服服做自己的人。 -------…