「超级细菌」魔咒或将打破,MIT 利用深度学习发现新型抗生素

作者:加零

编辑:李宝珠、三羊

MIT 利用图神经网络 Chemprop 识别潜在抗生素,特异性杀死鲍曼不动杆菌。

自然界中充满了各种各样的微生物,例如结核杆菌(导致肺结核)、霍乱弧菌(导致霍乱)等严重危害了人们的健康。而在人类历史上,感染这些致病细菌,除了依赖人体自身的免疫系统,几乎无解。直到 1928 年,青霉素的发现,让人类第一次拥有了战胜致病细菌的有力武器。

然而,抗生素的广泛应用也带来了一个巨大的危机 —— 抗生素耐药性 (AMR),据世界卫生组织 (WHO) 统计, 2019 年全球约有 120 万人死于抗生素耐药性 (AMR) 所加剧的细菌感染,这已经高于艾滋病导致的死亡人数。滥用抗生素催生某些「超级细菌」的出现,成为了 21 世纪临床重要致病因。要解决这一难题,迫切需要开发全新的抗生素。

针对特异细菌,深度学习模型可以提高对化合物药效和安全性的预测准确性,有效减少实验室实验和临床试验的时间和资源消耗,对有效且安全的抗生素发现至关重要。

为此,来自 MIT 的研究者们开发了一种深度学习方法来发现抗生素,利用图神经网络 Chemprop 从大型化学库中识别潜在的抗生素,并发现了一类新型抗生素。 他们能够特异性杀死重要的耐药菌 —— 鲍曼不动杆菌 (Acinetobacter baumannii),相关论文已发表于 Nature。

在这里插入图片描述

论文已发表于 Nature

论文地址:
https://www.nature.com/articles/s41586-023-06887-8
关注公众号,回复「发现抗生素」下载完整论文

实验方法:利用图神经网络的深度学习

数据集:多种化合物

初步筛选: 该研究初步筛选了 39,312 种化合物,对其抗生素活性和人类细胞毒性特征进行分析。
扩大预测: 为进一步扩大预测范围,这些模型对 12,076,365 种化合物进行测试,其中 11,277,225 种来自 Mcule 数据库,799,140 种来自 Broad Institute 数据库。

在这里插入图片描述

39,312 个化合物的分子量分布

算法训练:利用图神经网络进行训练

使用图神经网络 Chemprop 对筛选出的 39,312 种化合物进行训练,预测其抗生素活性和人类细胞毒性,训练过程如下。

在这里插入图片描述

分子表示: 使用 RDKit 从每个化合物的 SMILES(Simplified Molecular Input Line Entry Specification,简化分子输入线性入口系统)字符串生成基于图的分子表示。

特征向量生成: 为每个原子和键生成特征向量,包括原子特征(如原子序数、键数、正电荷等)和键特征(如键类型、共轭、环成员资格等)。

信息传递: 实现基于键的信息传递卷积神经网络,更新键的消息,通过神经网络层并应用非线性激活函数。

模型输出: 模型在固定的信息传递步骤后,对整个分子的消息进行汇总,通过前馈神经网络预测化合物的活性,如抗生素活性、细胞毒性或改变质子动力势的活性。

优化措施: 包括添加额外的分子级特征、使用超参数优化选择最佳性能参数,以及通过集成学习增强模型的鲁棒性。

模型架构:保证化合物的有效性和安全性

抗生素活性模型

研究人员在化合物浓度 50 μM 的培养基中预测其对金黄色葡萄球菌 (S. aureus) 的抗生素活性,以 80% 标准化生长抑制截止值 (normalized growth inhibition cut-off) 区分为活性或无活性。共 10 个图神经网络模型在同一 80% - 20% 的训练数据集上进行了训练、验证和测试。

结果显示,具有 RDKit 特征的 Chemprop 模型表现出更优越的预测能力,在 39,312 种化合物中识别出 512 种活性化合物。

在这里插入图片描述

预测抗生素活性的深度学习模型比较

人类细胞毒性模型

研究人员利用 39,312 种化合物对人类肝癌细胞 (HepG2)、人类初级骨骼肌细胞 (HSkMCs) 和人类肺成纤维细胞 (IMR-90) 进行毒性筛选。在用每种化合物 10 μM 浓度处理 2-3 天后,评估细胞活力,以 90% 细胞活力截止值 (cell viability cut-off) 将化合物活性分类。

同样对 10 个 Chemprop 模型集合进行了训练、验证和测试,对比结果如下图:

在这里插入图片描述

预测人类细胞毒性的深度学习模型比较

结果显示,分别有 3,341 (8.5%)、1,490 (3.8%) 和 3,447 (8.8%) 的化合物对 HepG2 细胞、HSkMCs 和 IMR-90 细胞具有毒性。在上步筛选出的 512 种活性抗菌化合物中,306 种对这三种细胞类型均无毒性。

总结来看,尽管与抗生素活性模型相比存在一定局限性,这一模型平衡了药物的有效性和对人体的无害性,展示了在药物发现中使用先进计算方法的潜力。

实验结果:抗生素的筛选识别

精炼和大范围应用模型:全化学空间的筛选和可视化

在这一研究阶段中,重点在于精炼和应用模型,以便在庞大的化学空间中识别潜在的抗生素化合物,并评估它们的细胞毒性。研究人员重新训练了 20 个 Chemprop 模型用于预测抗生素活性和 HepG2、HSkMC、IMR-90 细胞的细胞毒性,改进后的模型被应用于 12,076,365 种化合物预测上。

化合物筛选

抗生素活性筛选:从 Mcule 数据库中筛选出抗生素预测得分超过 0.4 的 3,004 种化合物;从 Broad Institute 数据库中筛选出得分超过 0.2 的 7,306 种化合物。

人类细胞毒性筛选:

保留细胞毒性预测得分低于 0.2 的化合物,最终筛选出 3,646 种化合物(1,210 种来自Mcule 数据库,2,436 种来自 Broad Institute 数据库)——占所有评估化合物的 0.03%。

在这里插入图片描述

化合物筛选

a:计算机模拟过滤程序b-e:抗生素活性和 HepG2、HSkMC、IMR-90 细胞的细胞毒性预测

化学空间的可视化

以摩根指纹 (Morgan fingerprints) 为分子表示,采用 t 分布随机相邻嵌入 (t-SNE, t-distributed stochastic neighbour embedding) 方法对化学空间进行可视化。

如下图所示,t-SNE 的可视化揭示了 hits(通过筛选的化合物)和 non-hits(抗生素预测得分低的化合物)之间的明显差异。

在这里插入图片描述

对化合物的 t-SNE 分析

进一步筛选:识别两个有效化合物

在 3,646 个化合物中筛选出 2 个对金黄色葡萄球菌表现出高活性且对人类细胞具有良好选择性的化合物(1 号和 2 号),这两种化合物在各种测试条件下的表现、特别是在含血清的培养基中的生长抑制能力很优越,值得进一步研究。

这些化合物的研究表明,深度学习模型预测的结构类别可以有效地指导实验筛选,从而发现新的抗生素候选物。

筛选过程

化合物筛选:从最初的 3,646 个 hits 化合物中去除了含有可能反应活性、致突变或药代动力学不利的 PAINS 和 Brenk 警报的化合物,筛选至 2,209 个。

结构筛选:进一步筛选与训练集中化合物结构不同的化合物,使用最大 Tanimoto 相似性得分 ≤0.5 作为初步切断点,并排除含 β-内酰胺环或喹诺酮双环核心的化合物,最终得到 1,261 个化合物。

有效化合物的识别

生长抑制测试: 在 9 个与理性组 G1-G5 相关的 hits 化合物中,发现 4 个化合物 (44%) 对金黄色葡萄球菌 (S. aureus) 有活性,最小抑制浓度 (MIC) ≤32 μg/ml。

结构类别和有效性:这些有效化合物与理性组 G1、G2 和 G5 相关,其中 G2 组的两个化合物(1号和2号)被证实为活性。这两个化合物同时符合 Lipinski 的规则和 Ghose 标准,表明它们具有良好的口服生物利用度和药物样特性,值得进一步研究。

在这里插入图片描述

筛选出的两个化合物

进一步研究:两个化合物的特性

通过深入的机制研究和体内外实验,化合物 1 和 2 显示出作为新型抗生素候选物的潜力。它们不仅针对多重耐药菌株有效,而且具有较低的耐药性发展趋势和良好的安全性。

这些发现表明,这两种化合物可作为抗生素药物发展的有希望的化学系列。

作用机制和耐药性

共同结构: 化合物 1 和 2 共享 N-[2-(2-chlorophenoxy)ethyl]aniline core 这一结构,预测表明这可能是抗生素活性的基本结构。

生长抑制实验: 在对金黄色葡萄球菌和枯草杆菌的时间杀菌实验中,这两种化合物显示出了抗生素活性,与范科霉素类似但杀菌力较低。

耐药性研究: 在对抗生素耐药的金黄色葡萄球菌株进行的实验中,这两种化合物的最小抑制浓度 (MIC) 只略有增加,表明它们可能具有与常见抗生素不同的作用机制。

耐药性的发展: 经过 30 天的连续培养,这两种化合物的 MIC 几乎没有变化,显示出较低的耐药性发展趋势。

抗多重耐药菌效果

广泛抗性: 这两种化合物对包括万古霉素耐药性肠球菌在内的 40 种不同细菌种类表现出活性,其中 MIC 的中位数分别为 4 和 3 μg/ml。

对静止期细菌的有效性: 这两种化合物对枯草杆菌的静止期细胞也显示出活性。

毒理学、化学特性及功效

安全性研究: 这两种化合物在体外实验中表现出良好的安全性,包括非溶血性、不结合金属离子、无基因毒性、化学稳定性以及在小鼠体内的安全性。

体内功效实验: 在小鼠金黄色葡萄球菌皮肤感染和大腿感染模型中,化合物 1 表现出显著的抗菌活性。

在这里插入图片描述

化合物的体内疗效

深度学习:应对抗生素耐药性的利器

研究人员多年来一直在探索应对抗生素耐药性的有效、易推广的方法,在这一过程中,深度学习的出现为研究人员提供了新的解题思路,深度学习在应对抗生素耐药性方面的应用价值在于:

超越传统抗生素发现方法: 传统的抗生素发现方法往往依赖于已知的活性结构,这限制了新药发现的范围。深度学习方法可以识别与传统抗生素结构不同的新化合物,可能对当前耐药的菌株有效。

个性化和精准医疗: 深度学习可以用于分析特定病原体的遗传和表型特征,从而有助于开发针对特定病原体或感染类型的个性化抗生素。

道阻且长,行之将至。深度学习在药物研发中的应用仍处于相对早期阶段,可能会面临数据质量和可解释性等挑战,但作为人类对抗细菌的重要防线,相关研究意义重大,相信势必会在技术迭代的加持下持续向前。

参考文献:
https://www.nature.com/articles/s41586-023-06887-8

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/308667.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Vue 自定义仿word表单录入之单选按钮组件

因项目需要&#xff0c;要实现仿word方式录入数据&#xff0c;要实现鼠标经过时才显示编辑组件&#xff0c;预览及离开后则显示具体的文字。 鼠标经过时显示 正常显示及离开时显示 组件代码 <template ><div class"pager-input flex border-box full-width fl…

程序员试用期转正工作总结

一、试用期工作总结 在公司的三个月试用期中&#xff0c;我完成了以下工作&#xff1a; 完成了XX个功能模块的开发&#xff0c;包括XX模块、XX模块和XX模块。参与了XX个项目的开发和上线&#xff0c;其中XX项目、XX项目和XX项目是我主导的。优化了现有系统的性能&#xff0c;特…

CMU15-445-Spring-2023-Project #2 - 前置知识(lec07-010)

Lecture #07_ Hash Tables Data Structures Hash Table 哈希表将键映射到值。它提供平均 O (1) 的操作复杂度&#xff08;最坏情况下为 O (n)&#xff09;和 O (n) 的存储复杂度。 由两部分组成&#xff1a; Hash Function和Hashing Scheme&#xff08;发生冲突后的处理&…

【Python】使用tkinter设计开发Windows桌面程序记事本(2)

上一篇&#xff1a;【Python】使用tkinter设计开发Windows桌面程序记事本&#xff08;1&#xff09;-CSDN博客 下一篇&#xff1a; 作者发炎 此代码模块是继承上一篇文章的代码模块的基础上开始设计开发的。 如果不知道怎么新建"记事本项目"文件夹&#xff0c;请参…

【高等数学之泰勒公式】

一、从零开始 1.1、泰勒中值定理1 什么是泰勒公式?我们先看看权威解读: 那么我们从古至今到底是如何创造出泰勒公式的呢? 由上图可知&#xff0c;任一无穷小数均可以表示成用一系列数字的求和而得出的结果&#xff0c;我们称之为“无穷算法”。 那么同理我们想对任一曲线来…

C2-4.2.2 决策树-纯度+信息熵+信息增益

C2-4.2.2 决策树-纯度信息熵信息增益 1、首先了解他的应用背景——决策树 其实说白了&#xff0c;就是一个二叉树 2、纯度 我们举一个买黄金的例子吧&#xff01;黄金有999 和 9999 。 他们是有区别的&#xff0c;代表着黄金的纯度&#xff08;相对杂质而言&#xff09;&…

JMS消息发送

目录 概述1.搭建 JMS 环境2.使用JmsTemplate 发送消息3.接收JMS 消息 概述 JMS是一个Java标准&#xff0c;定义了使用消息代理(message broker)的通用API,在2001年提出。长期以来&#xff0c;JMS一直是Java 中实现异步消息的首选方案。在JMS 出现之前每个消息代理都有其私有的…

MongoDB 启动提示错误code=killed, signal=ABRT

1.停止MongoDB sudo systemctl stop mongod 2.检查数据损坏 sudo mongod --repair --dbpath /var/lib/mongodb 3.赋权限 chown -R mongodb:mongodb /var/lib/mongodb chown mongodb:mongodb /tmp/mongodb-27017.sock 如果不赋权限&#xff0c;启动的时候则会提示 4.启动Mo…

python 工作目录 与 脚本所在目录不一致

工作目录&#xff1a;执行脚本的地方 我以为工作目录会是当前执行脚本的目录位置&#xff0c;但其实不是&#xff0c;例如&#xff1a; 图中红色文件为我执行的脚本文件&#xff0c;但是实际的工作目录是PYTHON LEARNING 可以用如下代码查询当前工作目录&#xff1a; import os…

2024年甘肃省职业院校技能大赛 “信息安全管理与评估”赛项样题卷①

2024年甘肃省职业院校技能大赛 高职学生组电子与信息大类信息安全管理与评估赛项样题 第一阶段&#xff1a;第二阶段&#xff1a;模块二 网络安全事件响应、数字取证调查、应用程序安全第二阶段 网络安全事件响应第一部分 网络安全事件响应第二部分 数字取证调查第三部分 应用程…

redis可视化工具 RedisInsight

redis可视化工具 RedisInsight 1、RedisInsight是什么2、下载RedisInsight3、使用RedisInsight4、其他redsi可视化工具 1、RedisInsight是什么 RedisInsight 是一个用于管理和监控 Redis 数据库的图形用户界面&#xff08;GUI&#xff09;工具。它是由 Redis Labs 开发的&…

Linux驱动学习—输入子系统

1、什么是输入子系统&#xff1f; 输入子系统是Linux专门做的一套框架来处理输入事件的&#xff0c;像鼠标&#xff0c;键盘&#xff0c;触摸屏这些都是输入设备&#xff0c;但是这邪恶输入设备的类型又都不是一样的&#xff0c;所以为了统一这些输入设备驱动标准应运而生的。…

CHS_01.2.1.1+2.1.3+进程的概念、组成、特征

CHS_01.2.1.12.1.3进程的概念、组成、特征 进程进程的概念 进程的组成——PCB进程的组成——PCB进程的组成——程序段、数据段知识滚雪球&#xff1a;程序是如何运行的&#xff1f;进程的组成进程的特征 知识回顾与重要考点 从这个小节开始 我们会正式进入第二章处理机管理相关…

【前端】使用javascript开发一个在线RGB颜色转换

欢迎来到《小5讲堂》 大家好&#xff0c;我是全栈小5。 这是是《前端》序列文章&#xff0c;每篇文章将以博主理解的角度展开讲解&#xff0c; 特别是针对知识点的概念进行叙说&#xff0c;大部分文章将会对这些概念进行实际例子验证&#xff0c;以此达到加深对知识点的理解和掌…

领英Linkedin自动跳转中国站点的解决方案

linkedin放弃中国市场后&#xff0c;在国内打开linkedin.com&#xff0c;会自动跳转到 linkedin.cn&#xff0c;无法与国际友人在同一个平台上联系。 按照搜到的方法尝试解决&#xff0c;包括修改浏览器默认语言、清除浏览数据、使用软路由上的插件给 linkedin.com设置从国外线…

CentOS本地部署SQL Server数据库无公网ip环境实现远程访问

文章目录 前言1.安装GeoServer2. windows 安装 cpolar3. 创建公网访问地址4. 公网访问Geo Servcer服务5. 固定公网HTTP地址 前言 GeoServer是OGC Web服务器规范的J2EE实现&#xff0c;利用GeoServer可以方便地发布地图数据&#xff0c;允许用户对要素数据进行更新、删除、插入…

使用 CMake 和 Ninja 构建 C/C++ 项目的教程

使用 CMake 和 Ninja 构建 C/C 项目的教程 CMake 是一个跨平台的开源构建工具&#xff0c;它简化了项目的构建过程。而 Ninja 是一个快速、轻量级的构建系统&#xff0c;与 CMake 配合使用可以提高项目的构建效率。本教程将向你介绍如何使用 CMake 和 Ninja 来构建你的 C/C 项…

版本控制背景知识

版本控制背景知识 本文是关于 Git 系列文章的导读&#xff0c;我们先介绍一下版本控制的背景知识。 什么是版本控制 版本控制是一种记录一个或若干文件内容变化&#xff0c;以便将来查阅特定版本修订情况的系统。它将什么时候、什么人更改了文件的什么内容等信息如实记录下来…

代码随想录算法训练营第一天|数组理论基础、704二分查找、27移除元素

数组理论基础 一维数组 数组中的元素在内存空间中是连续的数组名与数组中第一个元素的地址相同&#xff08;一维数组&#xff09;数组的下标从0开始删除数组的元素其实是用后面的元素覆盖掉要删除的元素数组的长度不能改变 二维数组 二维数组是按照行存储的&#xff0c;也是…

Vue入门四(组件介绍与定义|组件之间的通信)

文章目录 一、组件介绍与定义介绍定义1&#xff09;全局组件2&#xff09;局部组件 二、组件之间的通信1&#xff09;父组件向子组件传递数据2&#xff09;子传父通信 一、组件介绍与定义 介绍 组件(Component)是Vue.js 最强大的功能之一&#xff0c;它是html、css、js等的一个…