Paper - CombFold: Predicting structures of large protein assemblies 推理流程

欢迎关注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://spike.blog.csdn.net/article/details/136165853

CombFold 是一种新的组装技术,可以利用 AlphaFold-Multimer 预测的可能的亚复合物的结构,来构建大型蛋白质复合物的结构。CombFold 的推理步骤如下:

  • 第一步:定义亚单位。亚单位是指在组装过程中不会改变结构的单个结构域,例如 PDB: 6YBQ 中的 A0 和 G0。需要创建一个 subunits.json 文件,描述复合物中的所有亚单位的序列和链名。
  • 第二步:使用 AlphaFold-Multimer 预测所有亚单位配对的结构。AlphaFold-Multimer 是一种可以预测多个亚单位之间相互作用的结构模型的方法。每个亚单位配对可以有多个结构模型,因为在组装时可以考虑不同的成对相互作用。
  • 第三步:[可选] 使用 AlphaFold-Multimer 预测更大的亚单位组合的结构。这一步可以提高组装的准确性,但也会增加计算的复杂度。
  • 第四步:运行组合式组装算法,将所有生成的结构组合成一个大型复合物的结构。该算法使用贪心策略,从最大的亚复合物开始,逐步添加更小的亚复合物,直到完成组装或达到最大结果数。

框架图:
CombFold

GitHub: https://github.com/dina-lab3D/CombFold

步骤1 定义亚基 (Subunits)

第一步是将复合物分割成亚基,并创建 subunits.json 文件来定义复合物。亚基在组装过程中不会改变它们的结构(只会改变它们相对于其他亚基结构的位置),所以我们希望选择亚基是单个结构域的。

简单地说,每个亚基应该是复合物中的完整链。如果链很长,就需要将它切割成几个亚基。这可以通过两种方法实现,一种是简单地将链分割成等长的亚基,另一种是根据序列使用功能域 (Functional Domains) 预测器。还有一种选择是根据序列,预测无序区域(例如使用 IUPred3),再去除它们。再在这些区域上分割序列。

亚基由4个字段定义:

  • name: 亚基的唯一名称
  • sequence: 亚基的氨基酸序列
  • chain_names: 代表亚基的化学计量的链名称列表
  • start_res: 链上序列的起始残基的索引。用于设置同一链上其他亚基的约束。

注意:每个唯一的序列,只应该出现在一个亚基定义中,根据化学计量,它可以被转换成组装复合物中的多个链。

这描述了一个有5条链 (A\B\C\D\E) 的复合物,其中A和B是相同的链 (长度50),C和D也是 (长度50)。另外,在这个例子中,链E (长度100) 被分割成两个亚基。这可能发生在,例如,如果完整的E太大,无法用我们的GPU和其他亚基一起预测。

例如 PDB 6YBQ,即:

>6YBQ_1|Chains A, B, C, D, E, F|Propionyl-CoA carboxylase beta chain|Methylorubrum extorquens (strain ATCC 14718 / DSM 1338 / JCM 2805 / NCIMB 9133 / AM1) (272630)
MKDILEKLEERRAQARLGGGEKRLEAQHKRGKLTARERIELLLDHGSFEEFDMFVQHRSTDFGMEKQKIPGDGVVTGWGTVNGRTVFLFSKDFTVFGGSSSEAHAAKIVKVQDMALKMRAPIIGIFDAGGARIQEGVAALGGHGEVFRRNVAASGVIPQISVIMGPCAGGDVYSPAMTDFIFMVRDTSYMFVTGPDVVKTVTNEVVTAEELGGAKVHTSKSSIADGSFENDVEAILQIRRLLDFLPANNIEGVPEIESFDDVNRLDKSLDTLIPDNPNKPYDMGELIRRVVDEGDFFEIQAAYARNIITGFGRVEGRTVGFVANQPLVLAGVLDSDASRKAARFVRFCNAFSIPIVTFVDVPGFLPGTAQEYGGLIKHGAKLLFAYSQATVPLVTIITRKAFGGAYIVMASKHVGADLNYAWPTAQIAVMGAKGAVEIIFRAEIGDADKVAERTKEYEDRFLSPFVAAERGYIDEVIMPHSTRKRIARALGMLRTKEMEQPRKKHDNIPL
>6YBQ_2|Chains G, H, I, J, K, L|Propionyl-CoA carboxylase alpha subunit|Methylorubrum extorquens (strain ATCC 14718 / DSM 1338 / JCM 2805 / NCIMB 9133 / AM1) (272630)
MFDKILIANRGEIACRIIKTAQKMGIKTVAVYSDADRDAVHVAMADEAVHIGPAPAAQSYLLIEKIIDACKQTGAQAVHPGYGFLSERESFPKALAEAGIVFIGPNPGAIAAMGDKIESKKAAAAAEVSTVPGFLGVIESPEHAVTIADEIGYPVMIKASAGGGGKGMRIAESADEVAEGFARAKSEASSSFGDDRVFVEKFITDPRHIEIQVIGDKHGNVIYLGERECSIQRRNQKVIEEAPSPLLDEETRRKMGEQAVALAKAVNYDSAGTVEFVAGQDKSFYFLEMNTRLQVEHPVTEMITGLDLVELMIRVAAGEKLPLSQDQVKLDGWAVESRVYAEDPTRNFLPSIGRLTTYQPPEEGPLGGAIVRNDTGVEEGGEIAIHYDPMIAKLVTWAPTRLEAIEAQATALDAFAIEGIRHNIPFLATLMAHPRWRDGRLSTGFIKEEFPEGFIAPEPEGPVAHRLAAVAAAIDHKLNIRKRGISGQMRDPSLLTFQRERVVVLSGQRFNVTVDPDGDDLLVTFDDGTTAPVRSAWRPGAPVWSGTVGDQSVAIQVRPLLNGVFLQHAGAAAEARVFTRREAELADLMPVKENAGSGKQLLCPMPGLVKQIMVSEGQEVKNGEPLAIVEAMKMENVLRAERDGTISKIAAKEGDSLAVDAVILEFA

subunits.json 如下:

{
  "A0": {
    "name": "A0",
    "chain_names": [
      "A",
      "B",
      "C",
      "D",
      "E",
      "F"
    ],
    "start_res": 1,
    "sequence": "MKDILEKLEERRAQARLGGGEKRLEAQHKRGKLTARERIELLLDHGSFEEFDMFVQHRSTDFGMEKQKIPGDGVVTGWGTVNGRTVFLFSKDFTVFGGSSSEAHAAKIVKVQDMALKMRAPIIGIFDAGGARIQEGVAALGGHGEVFRRNVAASGVIPQISVIMGPCAGGDVYSPAMTDFIFMVRDTSYMFVTGPDVVKTVTNEVVTAEELGGAKVHTSKSSIADGSFENDVEAILQIRRLLDFLPANNIEGVPEIESFDDVNRLDKSLDTLIPDNPNKPYDMGELIRRVVDEGDFFEIQAAYARNIITGFGRVEGRTVGFVANQPLVLAGVLDSDASRKAARFVRFCNAFSIPIVTFVDVPGFLPGTAQEYGGLIKHGAKLLFAYSQATVPLVTIITRKAFGGAYIVMASKHVGADLNYAWPTAQIAVMGAKGAVEIIFRAEIGDADKVAERTKEYEDRFLSPFVAAERGYIDEVIMPHSTRKRIARALGMLRTKEMEQPRKKHDNIPL"
  },
  "G0": {
    "name": "G0",
    "chain_names": [
      "G",
      "H",
      "I",
      "J",
      "K",
      "L"
    ],
    "start_res": 1,
    "sequence": "MFDKILIANRGEIACRIIKTAQKMGIKTVAVYSDADRDAVHVAMADEAVHIGPAPAAQSYLLIEKIIDACKQTGAQAVHPGYGFLSERESFPKALAEAGIVFIGPNPGAIAAMGDKIESKKAAAAAEVSTVPGFLGVIESPEHAVTIADEIGYPVMIKASAGGGGKGMRIAESADEVAEGFARAKSEASSSFGDDRVFVEKFITDPRHIEIQVIGDKHGNVIYLGERECSIQRRNQKVIEEAPSPLLDEETRRKMGEQAVALAKAVNYDSAGTVEFVAGQDKSFYFLEMNTRLQVEHPVTEMITGLDLVELMIRVAAGEKLPLSQDQVKLDGWAVESRVYAEDPTRNFLPSIGRLTTYQPPEEGPLGGAIVRNDTGVEEGGEIAIHYDPMIAKLVTWAPTRLEAIEAQATALDAFAIEGIRHNIPFLATLMAHPRWRDGRLSTGFIKEEFPEGFIAPEPEGPVAHRLAAVAAAIDHKLNIRKRGISGQMRDPSLLTFQRERVVVLSGQRFNVTVDPDGDDLLVTFDDGTTAPVRSAWRPGAPVWSGTVGDQSVAIQVRPLLNGVFLQHAGAAAEARVFTRREAELADLMPVKENAGSGKQLLCPMPGLVKQIMVSEGQEVKNGEPLAIVEAMKMENVLRAERDGTISKIAAKEGDSLAVDAVILEFA"
  }
}

步骤2 预测成对的结构

在这个阶段,我们将对每一对亚基运行 AFM。使用这个仓库中的脚本:

python3 scripts/prepare_fastas.py subunits.json --stage pairs --output-fasta-folder <path_to_output_folder> --max-af-size 1800

将会生成一个文件夹,里面有多达 ((N+1)*N)/2.fasta 文件。这些文件都可以作为 AFM 的输入。注意,所需的 AFM 预测的数量取决于亚基的数量(复合物中的唯一链),而不是复合物中的链的数量。例如,一个有10条链的 同源复合物 (homooligomer) ,在这个阶段只需要一个 AFM 预测。注意,命令行定义了 --max-af-size,设置为你的预测环境可以预测的最大残基数。

例如,只有2个链 A0 和 G0,预测的复合物 A6B6,包括:

A0*3: AFM_A0_A0_A0_unrelaxed_rank_1_model_3.pdb
A0*3: AFM_A0_A0_A0_unrelaxed_rank_2_model_1.pdb
A0*2+G0: AFM_A0_A0_G0_unrelaxed_rank_1_model_1.pdb
A0*2+G0: AFM_A0_A0_G0_unrelaxed_rank_2_model_3.pdb
A0*2: AFM_A0_A0_unrelaxed_rank_1_model_1.pdb
A0*2: AFM_A0_A0_unrelaxed_rank_2_model_4.pdb
A0+G0: AFM_A0_G0_unrelaxed_rank_1_model_2.pdb
A0+G0: AFM_A0_G0_unrelaxed_rank_2_model_3.pdb
G0*2: AFM_G0_G0_unrelaxed_rank_1_model_4.pdb
G0*2: AFM_G0_G0_unrelaxed_rank_2_model_5.pdb

步骤3 预测大型组的结构 (可选)

在这个阶段,我们将对更大的亚基组合运行 AFM(一次预测最多6个亚基)。为了减少所需的预测次数,我们只会选择基于对的预测分数更有可能得到高分结果的更大的亚基组合。这个阶段是可选的,因为组装可以只使用对的预测来完成,但是,这个阶段显著提高了生成结果的准确性和组装复杂复合物的能力。使用相同的脚本,我们将生成一个包含更大组合的 .fasta 文件的文件夹:

python3 scripts/prepare_fastas.py subunits.json  --stage groups --output-fasta-folder <path_to_output_folder>--max-af-size 1800 --input-pairs-results <path_to_AFM_pairs_results>

这里你还需要提供 path_to_AFM_pairs_results,它是一个包含了前一阶段 AFM 预测的所有 .pdb 文件的文件夹。虽然脚本会生成亚基分组的建议,为了提高结果,用户也被鼓励使用关于目标复合物的生物学知识来手动创建 .fasta 文件,用于已知的、脚本没有建议的亚基分组。生成的和手动定义的 .fasta 文件都要作为输入提供给 AFM,就像在前一阶段一样。

与之前的区别是 stage 参数是 pairs,还是 groups

步骤4 组合组装 (Combinatorial Assembly)

在这个使用阶段,用户已经有了 AlphaFold-Multimer 对不同亚基组合的结构预测 (以 .pdb 文件的形式)。例如,对于一个有27条链 (A9B9C9) 的复合物,将会有所有2条链的 .pdb 模型 (AA,AB,AC,BB,BC,CC) 以及可选的扩展子复合物,如 ABC,AAB,AABC 等。组合式组装的输入将是这些 .pdb 文件加上 subunits.json

注意,与原始论文不同,所提供的脚本使用的相互作用评分函数是基于 interface-plDDT 而不是 PAE。也就是说,一个包含 subunits.json 文件和一个名为 pdbs 的文件夹,该文件夹包含了前几个阶段 AFM 生成的所有 PDB 文件。

使用本地安装 通过运行 scripts/run_on_pdbs.py

python3 scripts/run_on_pdbs.py <path_to_subunits.json> <path_to_folder_of_pdbs> <path_to_empty_output_folder>

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/395063.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【Oracle】玩转Oracle数据库(二):体系结构、存储结构与各类参数

前言 嘿伙计们&#xff01;准备好了吗&#xff1f;今天我要和你们探讨一个酷炫的话题——Oracle数据库&#xff01;&#x1f389; 在这篇博文【Oracle】玩转Oracle数据库&#xff08;二&#xff09;&#xff1a;体系结构、存储结构与各类参数&#xff0c;我们要揭开Oracle数据库…

甲方紧急需求带来封闭式开发,项目负责人如何做好团队共识?

在职场上总会遇到各种类型的甲方金主&#xff0c;项目开展过程中也难免出现多种变更要求。本期小编就结合一位希赛学员的工作经验分享&#xff0c;一起来大家探讨下&#xff1a;面对甲方的紧急需求&#xff0c;项目经理该如何做才能带领团队克服困难&#xff0c;最终促成项目收…

【Prometheus】node-exporter、server、Grafana安装与配置

基于Prometheus和K8S构建智能化告警系统 一、Prometheus对kubernetes的监控二、node-exporter组件安装和配置2.1、node-exporter介绍2.2、安装node-exporter【1】拉取镜像【2】编写yaml文件【3】运行pod【4】获取数据 三、Prometheus server安装和配置3.1、创建sa账号&#xff…

Mysql 权限与安全管理

0 引言 MySQL是一个多用户数据库&#xff0c;具有功能强大的访问控制系统&#xff0c;可以为不同用户指定允许的权限。MySQL用户可以分为普通用户和root用户。root用户是超级管理员&#xff0c;拥有所有权限&#xff0c;包括创建用户、删除用户和修改用户的密码等管理权限&…

单机环境搭建Redis伪集群

1、Redis版本 [rootwsdhla ~]# redis-server -v Redis server v6.2.6 sha00000000:0 mallocjemalloc-5.1.0 bits64 buildbf23dac15dfc00fa[rootwsdhla ~]# redis-cli -v redis-cli 6.2.62、创建节点目录 创建6个节点目录&#xff0c;分别复制一份redis.conf并编辑&#xff1a…

电路设计(20)——数字电子钟的multism仿真

1.设计要求 使用数字芯片&#xff0c;设计一个电子钟&#xff0c;用数码管显示&#xff0c;可以显示星期&#xff0c;时、分、秒&#xff0c;可以有按键校准时间。有整点报警功能。 2.设计电路 设计好的multism电路图如下所示 3.芯片介绍 时基脉冲使用555芯片产生。在仿真里面…

hal/SurfaceFlinger/perfetto实战需求问题探讨作业-千里马framework开发

背景 hi&#xff0c;粉丝朋友们&#xff1a; 在新课halperfettosurfaceflinger https://mp.weixin.qq.com/s/LbVLnu1udqExHVKxd74ILg 推出后&#xff0c;各位学员朋友们都积极响应&#xff0c;开始马不停蹄的学习&#xff0c;学员学习后希望有更多的实战案例或者项目拿来练手&…

自动化上位机开发C#100例:雷赛运动控制卡EtherCAT总线卡C#封装类

自动化上位机开发C#100例:雷赛运动控制卡EtherCAT总线卡C#封装类 文章目录 LTDMC.dll下载LTDMC.cs LTDMC.dll C#调用封装下载ICard.cs 运动控制卡接口Card.cs 运动控制卡抽象类CardLTDMC.cs 雷赛运动控制卡EtherCAT总线卡实现类CardList.cs 总线卡列表封装 LTDMC.dll下载 最新…

OpenAI公布阻止国家相关威胁行为者对人工智能的恶意使用(包括中国、朝鲜、伊朗、俄罗斯)

曾梦想执剑走天涯&#xff0c;我是程序猿【AK】 目录 简述总结 简述 本篇幅公布OpenAI于2月14日公布的”阻止国家相关威胁行为者对人工智能的恶意使用“一文&#xff0c;其中提及到阻止并限制了来自&#xff08;包括中国、朝鲜、伊朗、俄罗斯&#xff09;的一些用户的使用&…

实习日志15

1.大改了一下界面 1.1.识别与验真 1.2.历史记录 2.改了几个bug 2.1.改json格式用JSON.stringify(value,null,2); 2.2.内嵌页面值与原页面值重复 2.3.验真条件判断 if (isVerifyCell.getValue() "不需要") {if (verifyResultCell.getValue() ! "未查验")…

IDEA实现序列化时如何自动生成serialVersionUID

实现步骤&#xff1a;1.安装GenerateSerialVersionUID插件 2.点击idea左上角File -> Settings -> Editor -> Inspections -> 搜索 Serialization issues &#xff0c;找到 Serializable class without ‘serialVersionUID’ ->打上勾&#xff0c;再点击Apply-&…

计算机功能简介:EC, NVMe

一 EC是指Embedded Controller 主要应用于移动计算机系统和嵌入式计算机系统中&#xff0c;为此类计算机提供系统管理功能。EC的主要功能是控制计算机主板上电时序、管理电池充电和放电&#xff0c;提供键盘矩阵接口、智能风扇接口、串口、GPIO、PS/2等常规IO功能&#xff0c;…

MySQL-锁(LOCK)

文章目录 1. 锁是什么&#xff1f;2. 全局锁2.1 相关语法2.2 特点 3. 表级锁3.1 表锁3.1.1 共享读锁&#xff08;S&#xff09;3.1.2 排它写锁&#xff08;X&#xff09; 3.2 元数据锁&#xff08;MDL&#xff09;3.2 意向锁&#xff08;IS、IX&#xff09; 4. 行级锁4.1 行锁 …

【力扣 - 二叉树的中序遍历】

题目描述 给定一个二叉树的根节点 root &#xff0c;返回 它的 中序 遍历 。 提示&#xff1a; 树中节点数目在范围 [0, 100] 内 -100 < Node.val < 100方法一&#xff1a;递归 思路与算法 首先我们需要了解什么是二叉树的中序遍历&#xff1a;按照访问左子树——…

【Linux系统化学习】深入理解文件系统(Ext2文件系统)

目录 前言 磁盘的物理结构 物理结构 磁头和盘片工作解析图 盘面区域划分图&#xff08;俯视盘面图&#xff09; 扇区的寻址、定位&#xff08;CHS定位&#xff09; 磁盘存储的逻辑抽象结构 LBA定址 文件系统 磁盘分区 EXT2文件系统 组块中的信息介绍 查看inode编号…

代码随想录算法训练营|二叉树总结

二叉树的定义&#xff1a; struct TreeNode {int val;TreeNode* left;TreeNode* right;TreeNode():val(0),left(nullptr),right(nullptr){}TreeNode(int val):val(val),left(nullptr),right(nullptr){}TreeNode(int val,TreeNode* left,TreeNode* right):val(val),left(left),…

【Linux】软件包管理器 yum | vim编辑器

前言: 软件包管理器 yum和vim编辑器讲解 文章目录 软件包管理器 yum编辑器-vim四种模式普通模式批量化注释和批量化去注释末行模式临时文件 软件包管理器 yum yum&#xff08;Yellowdog Updater, Modified&#xff09;是一个在基于 RPM&#xff08;管理软件包的格式和工具集合&…

Smart Link和Monitor Link简介

定义 Smart Link&#xff0c;又叫做备份链路。一个Smart Link由两个接口组成&#xff0c;其中一个接口作为另一个的备份。Smart Link常用于双上行组网&#xff0c;提供可靠高效的备份和快速的切换机制。 Monitor Link是一种接口联动方案&#xff0c;它通过监控设备的上行接口…

Facebook Horizon:探索虚拟现实中的社交空间

随着科技的不断进步&#xff0c;虚拟现实&#xff08;VR&#xff09;技术正成为社交互动和娱乐体验的新前沿。在这个数字时代&#xff0c;Facebook作为全球最大的社交媒体平台之一&#xff0c;正在引领虚拟社交的新时代&#xff0c;其推出的虚拟社交平台Facebook Horizon成为了…

手持三防平板丨国产化加固平板丨国产三防平板发展的意义是什么?

随着现代科技的快速发展&#xff0c;平板电脑在我们的生活中扮演着越来越重要的角色。然而&#xff0c;传统的平板电脑只能在普通的环境中使用&#xff0c;而无法在恶劣的环境中使用&#xff0c;例如在高海拔、高温、高湿度、沙漠等环境中&#xff0c;传统平板电脑往往会出现故…