PPDock: Pocket Prediction-Based Protein−Ligand Blind Docking 发表于
Journal of Chemical Information and Modeling
,第一作者为 Jie Du,通讯作者为 Manning Wang,研究团队来自复旦大学。该研究提出一种新的基于口袋预测的蛋白质 - 配体盲对接方法 PPDock,在对接准确性、泛化能力和效率上表现优异。
作者信息
- Jie Du:复旦大学基础医学院数字医学研究中心,上海医学图像计算与计算机辅助干预重点实验室,研究方向与蛋白质 - 配体对接的深度学习方法相关。
- Manning Wang:复旦大学基础医学院数字医学研究中心、上海医学图像计算与计算机辅助干预重点实验室,职位未详细提及。研究聚焦于数字医学相关领域,在蛋白质 - 配体对接等方向开展研究工作
解决的问题
传统蛋白质-配体对接方法在盲对接场景(口袋未知时)存在推理时间长、准确性低的问题;现有基于深度学习的盲对接方法,有的将蛋白质划分为多个体素块时可能不包含整个口袋,有的使用整个蛋白质进行对接难以识别正确口袋,导致泛化性能差。旨在开发一种新方法,提高盲对接的准确性、泛化能力和效率
采用的方法
提出一种两阶段对接范式,即口袋预测后进行基于口袋的对接,并设计了基于口袋预测的蛋白质-配体盲对接方法 PPDock。该方法包含口袋预测(Anchor Prediction 和 Cut 两个模块)和 Dock 两个主要组件。使用 PDBbind v2020 数据集进行实验,采用 Ligand RMSD、Centroid Distance 等指标评估模型性能
主要发现
- 对比其他对接方法性能优越
PPDock 在几乎所有评估指标上排名第一,在 Ligand RMSD < 2 Å 的比例上达到 36.4% ,显著优于传统对接方法和多数深度学习对接方法;平均推理时间仅 0.06s ,在大规模蛋白质 - 配体对接中优势明显。
- 高精准对接能力出色
PPDock 在 Ligand RMSD 和 Centroid Distance 两个关键指标上均优于总体排名第二的 FABind,在 Ligand RMSD < 1 Å 时,PPDock 的结果比例超过 10%,而 FABind 低于 5%
- 对未见蛋白质的泛化能力强
在包含未见蛋白质的新测试子集上,所有对接方法性能均下降,但 PPDock 仍达到 22.2% 的 Ligand RMSD < 2 Å 比例,显著优于其他深度学习方法和 Glide
- 实际案例表现优异
通过对 PDB 6QGE、6HOR、6E5S 等案例研究,发现 FABind 存在预测不合理、镜像翻转、无法定位正确口袋等问题,而 PPDock 能成功对接,预测结果与真实情况匹配度高
总结
- 不足之处: 未对网络参数进行广泛探索;尽管 PPDock 在现有研究中表现出色,但在使用直接使用口袋标签训练 Dock 组件时,Ligand RMSD < 2 Å 的比例为 45.2% ,而当前仅达到 36.4% ,仍有提升空间
- 意义: PPDock 为蛋白质 - 配体盲对接提供了一种更高效准确的方法,其两阶段对接范式具有创新性;口袋预测组件可作为独立模块与其他基于口袋的对接算法兼容,推动盲对接领域发展;研究成果有助于加速药物研发进程,对理解药物作用机制、预测药物副作用等具有重要意义