AIDD - 人工智能药物设计 -深度学习赋能脂质纳米颗粒设计,实现高效肺部基因递送

Nat. Biotechnol. | 深度学习赋能脂质纳米颗粒设计,实现高效肺部基因递送

今天为大家介绍的是来自美国麻省理工和爱荷华大学卡弗医学院团队的一篇论文。可离子化脂质(ionizable lipids)是脂质纳米颗粒(lipid nanoparticles)的关键组成部分,而脂质纳米颗粒是当前最先进的非病毒信使RNA递送技术。为超越当前依赖实验筛选和/或理性设计的可离子化脂质鉴定方法,作者引入了一种基于神经网络的脂质优化方法,这是一种用于可离子化脂质设计的深度学习策略。作者创建了一个包含超过9,000条脂质纳米颗粒活性测量数据的数据集,并利用这些数据训练了一个定向消息传递神经网络,以预测具有多样性脂质结构的核酸递送效果。通过这种神经网络的脂质优化方法,作者在体外和体内均成功预测了RNA的递送效果,并将预测范围外推至与训练集结构不同的脂质。作者在计算机模拟中评估了160万个脂质,并确定了其中的两种结构:FO-32和FO-35。这两种结构在小鼠的肌肉和鼻黏膜中实现了局部mRNA递送。FO-32的雾化mRNA递送效果与小鼠肺部的当前最先进水平相当,而FO-32和FO-35在雪貂的肺部中也能高效递送mRNA。总体而言,这项研究展示了深度学习在改善纳米颗粒递送性能方面的强大潜力。

Image

用于RNA递送的脂质纳米颗粒(LNPs)最近开始展示出在改善人类健康方面的潜力。针对2019冠状病毒的信使RNA疫苗已证明其在预防重症方面的出色效果。此外,肝脏RNA递送已成功推出了美国食品和药物管理局(FDA)批准的药物Onpattro,以及其他一些具有潜力的临床项目。尽管如此,仍需要更高效且更具针对性的LNPs,以促进RNA疗法在遗传疾病中的广泛应用,减少副作用,改善贮藏稳定性,将RNA递送至如肺上皮等肝外组织,并加强对炎症的控制。

以肺为靶点的基因治疗特别具有挑战性,但它有望用于治疗包括囊性纤维化(CF)、特发性肺纤维化、α-1抗胰蛋白酶缺乏症、慢性阻塞性肺疾病(COPD)、原发性纤毛不动症、哮喘等多种疾病。迄今为止,用于LNPs递送的可离子化脂质几乎完全依赖于实验筛选、理性设计或这两种方法的结合。实验筛选依赖于高效的组合化学技术来生成具有化学多样性的脂质库,而理性设计则利用了有效的可离子化脂质的特征,如可生物降解的基团和分支尾结构。最近,尝试利用机器学习来设计LNPs的类似物也展现了其在从递送脂质库中设计新型脂质方面的潜力。

在本篇论文中,作者提出了一种基于神经网络的脂质优化方法(LiON),这是一种用于脂质发现和设计的深度学习(DL)方法。LiON采用了深度消息传递神经网络(D-MPNNs),这是一种适用于化学结构分析的深度学习子集,已在领域内实现了最先进的性能,并协助识别出新的抗生素。作者假设,LiON可以促进高效脂质的设计,包括一些人类专家可能不会认为有前景的脂质。值得注意的是,与以往的研究相比,D-MPNNs的强大功能和灵活性使得LiON能够在多个具有化学多样性的脂质库上进行训练,并学习到有关可离子化脂质设计的通用规则。

模型部分

Image

图 1

作者的LiON方法包含五个步骤。首先,作者收集了所有可用的高通量LNP活性筛选数据,包括已发表的和未发表的数据(图1a)。这共计20个独立的数据集,其中包括4个体内筛选数据,包含575个独立数据点,以及16个体外筛选数据,包含8,727个独立数据点(补充表1)。补充图1展示了数据集中包含的化学多样性。其次,作者使用这些数据集来训练和评估一个用于预测LNP效力的深度学习(DL)模型(图1b)。第三,作者利用该模型预测特定类别中所有可合成的可离子化脂质的mRNA递送能力(图1c)。第四,作者将顶级候选脂质制成配方并在体内进行测试(图1d)。最后,作者测试了这些顶级脂质的类似物,以进一步优化其活性(图1e)。

由于不同的数据集之间不可比拟——例如,无法将HeLa细胞中的mRNA递送与条形码标记的肝脏mRNA递送直接比较——作者在下文中逐一报告了每个数据集的性能。未来的一个有价值的研究方向是生成一个标准化的数据集,在该数据集中,多种可离子化脂质库在相同的条件下进行筛选,包括相同的载荷、目标细胞或组织类型、助剂脂质的摩尔比和身份。此外,在多种配方条件下进行筛选也将允许可离子化脂质和配方的协同优化。

在本研究中,作者推测,尽管筛选中使用了不同的条件和配方参数,LiON仍能够学习到可离子化脂质设计的通用规则。由于几乎每次筛选都会在保持配方不变的情况下改变脂质结构,作者使用LiON仅优化了脂质结构,而未优化配方。

LiON基于组合化学合成的可离子化脂质,将D-MPNNs(深度消息传递神经网络)调整为适用于LNPs的特定背景。为了进行预测,LiON将可离子化脂质的结构和元数据(配方、载荷和目标信息)输入到Chemprop软件包中的D-MPNN中。Chemprop使用D-MPNN处理脂质的化学结构,并将D-MPNN的输出与元数据在密集层中合并,生成一个单一的预测值(图1b)。

在超参数优化后,作者将数据集按70%–15%–15%的比例划分为训练集、验证集和测试集,并以每个独立数据集中预测的mRNA递送活性与实际活性之间的相关系数来衡量模型性能。结果显示,所有数据集的相关性都很高(图1f)。

由于这些脂质是通过组合化学生成的,数据点之间存在一定的相关性,这使得模型的性能看起来异常出色,但这可能会导致过拟合(补充图2a,b)。受到小分子药物研究中基于骨架分割方法的启发,作者使用基于胺头基的训练–验证–测试划分方法(补充图2c)。因此,模型的性能仅在具有新型胺头基的脂质上进行衡量,从而减少训练集与测试集之间的相关性,并迫使模型进行外推预测。

如果同时基于胺头基和尾部组分进行分割,则需要丢弃数据集中的大部分数据(补充图2d)。正如预期的那样,基于胺头基的分割方法的性能较差,但作者仍观察到几乎普遍显著的正相关关系(图1g)。

LiON在分支酯库中的应用

在LiON的首次应用中,作者希望在一个大型体内数据集的基础上进行扩展,因为准确的预测更有可能转化为体内的实际表现。最近,作者团队报告了一种基于肽编码的条形码方法,用于筛选包含384种分支酯的脂质,以实现肝脏的mRNA递送(图2a)。这项研究确定了RM-133-3为表现最佳的脂质,并提出了一种优化的配方,作者在该库的所有实验测试中都使用了该配方。作者的模型在该数据集上表现良好(图1f,1g)。

Image

图 2

作者预测了一个潜在的包含2,574种脂质的库的肝脏mRNA递送能力(补充表2和表3)。如补充图3中所示,模型更倾向于选择具有二十二碳六烯酸(DHA)和二十碳五烯酸(EPA)尾部的脂质,这一结果也在预料之中,因为在条形码筛选的前21种LNP中,尾部结构都包含DHA或EPA。

作者进一步检查了具有EPA或DHA尾部的脂质,并筛选了前11种预测头基用于萤火虫荧光素酶(FFL)mRNA的肝脏递送,发现了3种与RM-133-3具有相当活性的候选脂质(图2b)。带有超过3个尾部的脂质发生聚集,并表现出较差的性能。RJ-A03-T16是一种与RM-133-3结构类似的脂质,其性能略优于RM-133-3(图2c)。在整个筛选过程中,作者通常使用每种脂质n=1只小鼠来最大化筛选的通量,同时最小化小鼠的使用量,偶尔会使用n=2以确认测试结果的可靠性。

接下来,作者推测DHA和EPA的大型尾部可能并不适合与较大的优选头基搭配。因此,作者测试了具有α-亚麻酸(ALA)和γ-亚麻酸(GLA)尾部的脂质,这两种尾部在DL模型中的排名分别为第三和第五(通过所有头基的平均预测递送性能来衡量,见补充表4)。与之前的结果类似,具有4个或更多尾部的脂质发生聚集,但RJ-A14-T30和RJ-A14-T34显示出了良好的递送能力(图2d)。与第四名的花生四烯酸(AA)尾部的脂质相比,RJ-A14-T34的性能更优(补充图4)。RJ-A14-T34的效力显著高于DLin-MC3-DMA(MC3是FDA批准的Onpattro中用于siRNA肝脏递送的脂质),并且与SM-102(Moderna的FDA批准的用于肌内冠状病毒疫苗的配方)相当,但效力不及Lipid 5(一种靶向肝脏的候选脂质)(图2e)。

然后,作者测试了排名第六的尾部,并发现RJ-A30-T01的效力显著高于MC3和RM-133-3(图2f,2g)。最后,作为一种概念验证的蛋白质替代疗法的应用,作者测试了促红细胞生成素(Epo)mRNA的递送。RJ-A30-T01的表现至少与Lipid 5相当,并且比RM-133-3高出9倍(图2h)。详细的表征结果显示,RJ-A30-T01的表达主要集中在肝脏中,仅在脾脏中检测到微弱的信号。所生成的LNP在冷冻-解冻后,其直径几乎没有变化,并且这些LNP几乎未引起可检测的炎症或肝损伤。

RJ-A14-T34的尾部和头基都未在最初的384种脂质筛选中出现,这表明模型具备外推能力。此外,RJ-A30-T01虽然在原始筛选中存在,但并未被识别为阳性结果,这可能是由于条形码筛选中固有的非线性效应所致。这一现象表明,LiON可以改进基于条形码的筛选结果。

为了验证深度学习(DL)模型中额外的数据集是否能提高性能,作者仅使用分支酯肝脏数据集训练了一个模型。该模型将用于两个顶级候选物(RJ-A30-T01和RJ-A14-T34)的T01和T34尾部分别排在了后五位。因此,识别RJ-A30-T01和RJ-A14-T34需要纳入额外的训练数据集。这一结果突显了整合多个数据集的重要性,并表明,随着更多数据的可用性,LiON的实用性将会提升,模型的泛化能力也将进一步增强。

用于肌肉内递送的脂质设计

虽然优化现有的筛选方法具有一定的实用性,但拓展到新的高多样性化学空间更具挑战性,但也可能带来更高的回报。为此,作者开发了一种四组分Ugi反应,涉及一个伯胺、一个羧酸、一个异腈和一个酮(图3a),并利用LiON来建议脂质结构。尽管与之相关的反应此前已有报道,但对于这类脂质库,作者尚无数据。此外,该反应的产率通常低于10%,因此需要对每种脂质进行单独纯化,从而无法进行高通量的测试。尽管面临这些挑战,4CR方法仍提供了显著的化学多样性,因此作者利用LiON来识别具有高效力的脂质。

Image

图 3

首先,作者根据预测的递送能力对86,400种脂质进行了排名,并选择了预测效果最好的候选物用于体内测试。由于与3CR和4CR反应最接近的类似物的训练数据是在HeLa细胞中使用35 : 16 : 46.5 : 2.5的脂质 : DOPE : 胆固醇 : PEG-脂质的摩尔比条件下获得的(在下文中称为“KK”配方),作者将这些条件用作元数据,因为这产生了最稳定的预测结果。

作者对这些筛选出的排最高的预测LNPs进行了肌肉内递送的测试,并推测主要基于体外递送训练的模型在预测局部递送方面的效果可能优于全身递送。前两个被测试的候选物ML3和ML5表现出了非零的递送效力(图3b),此外,它们还具有二级可离子化胺,而这种特性在可离子化脂质中并不常见。

将ML3转变为其三级胺类似物ML3Me后,mRNA的递送能力得到了改进(图3c,3d),而ML3Me的羧酸类似物则进一步提升了性能。基于这些结果,作者在后续研究中限制了可能的胺头基选择,排除了次级胺的使用。

接下来,作者对可由53种胺、60种羧酸、11种异腈和51种酮合成的脂质进行了计算机模拟排名。由于前几百种脂质的预测结果几乎相同,作者从前200种脂质中手动选择了一组化学多样性较高的脂质进行合成和测试。作者还合成了顶级候选物的类似物,特别是n-丁基异腈类似物,这种类似物提高了产率。此外,作者还使用了二甲氨基丙胺头基,因为它在先前的Ugi脂质中表现出良好的效果。

第一轮测试的结果显示在补充图9中,后续测试的结果显示在图3e中。许多LNPs的转染效率与SM-102相当,但低于cKK-E12。作者通过引入支链羧酸尾部,生成了FO-32,其活性与SM-102和cKK-E12相当(图3f、3g)。随后,作者对FO-32的类似物进行了系统性检查,但未能进一步提高其性能。

在通过实验设计(DOE)优化配方后,作者确定了F3配方,并对FO-16和FO-22进行了改造,使其也包含了支链羧酸尾部,最终生成了FO-35和EB-66(图3g)。随后,作者在广泛的剂量范围内测试了FO-32、FO-35和EB-66,并将其与cKK-E12(使用F3和KK配方)和SM-102进行了比较(图3h–3k)。在所有测试的剂量中,FO-32和FO-35的效力在平均水平上均高于cKK-E12 KK和SM-102,但在高剂量下,FO-35的表现不如FO-32,尽管这一差异在每个具体剂量上并不总是显著的。在低剂量下,FO-35是最有效的新型LNP,而在高剂量下,FO-32的效力最高。

参考资料

Witten, J., Raji, I., Manan, R. S., Beyer, E., Bartlett, S., Tang, Y., … & Anderson, D. G. (2024). Artificial intelligence-guided design of lipid nanoparticles for pulmonary gene therapy. Nature Biotechnology, 1-10.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/953074.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【SVN】版本发布快捷操作

摘要:因为每次发版都需要制作一份相同的文件夹,而大部分的包都不需要变更,但是文件又非常大,记录自己的操作经验。 首先在SVN Repository Browser 界面把上一次的版本复制一份,复制的时候重命名为新的版本号 右击要复…

AR 眼镜之-拍照/录像动效切换-实现方案

目录 📂 前言 AR 眼镜系统版本 拍照/录像动效切换 1. 🔱 技术方案 1.1 技术方案概述 1.2 实现方案 1)第一阶段动效 2)第二阶段动效 2. 💠 默认代码配置 2.1 XML 初始布局 2.2 监听滑动对 View 改变 3. ⚛️…

HTML5实现好看的端午节网页源码

HTML5实现好看的端午节网页源码 前言一、设计来源1.1 网站首页界面1.2 登录注册界面1.3 端午节由来界面1.4 端午节习俗界面1.5 端午节文化界面1.6 端午节美食界面1.7 端午节故事界面1.8 端午节民谣界面1.9 联系我们界面 二、效果和源码2.1 动态效果2.2 源代码 源码下载结束语 H…

Android使用系统消息与定时器实现霓虹灯效果

演示效果: 界面设计: 在帧布局FrameLayout中添加6个TextView 依次设置这6个TextView的宽,高,权重 也可在XML中直接设置 添加自定义颜色 关联自定义颜色到数组变量 关联6个TextView控件到数组变量 处理自定义系统消息 Handler _sysHandler new Han…

多活架构的实现原理与应用场景解析

一、多活架构为何如此重要? 企业的业务运营与各类线上服务紧密相连,从日常的购物消费、社交娱乐,到金融交易、在线教育等关键领域,无一不依赖于稳定可靠的信息系统。多活架构的重要性愈发凸显,它宛如一位忠诚的卫士,为业务的平稳运行保驾护航。 回想那些因系统故障引发的…

【JVM-2.2】使用JConsole监控和管理Java应用程序:从入门到精通

在Java应用程序的开发和运维过程中,监控和管理应用程序的性能和资源使用情况是非常重要的。JConsole是Java Development Kit(JDK)自带的一款图形化监控工具,它可以帮助开发者实时监控Java应用程序的内存、线程、类加载以及垃圾回收…

《自动驾驶与机器人中的SLAM技术》ch2:基础数学知识

目录 2.1 几何学 向量的内积和外积 旋转矩阵 旋转向量 四元数 李群和李代数 SO(3)上的 BCH 线性近似式 2.2 运动学 李群视角下的运动学 SO(3) t 上的运动学 线速度和加速度 扰动模型和雅可比矩阵 典型算例:对向量进行旋转 典型算例:旋转的复合 2.3 …

如何使用高性能内存数据库Redis

一、详细介绍 1.1、Redis概述 Redis(Remote Dictionary Server)是一个开源的、内存中的数据结构存储系统,它可以用作数据库、缓存和消息中间件。Redis支持多种类型的数据结构,如字符串(strings)、哈希&am…

C++ vtordisp的应用场景

文章目录 问题代码1. 基本概念回顾2. 应用场景虚继承与虚函数并存的类层次结构 3. 编译器相关考虑 问题代码 #include <iostream> using namespace std;class base { public:base() {}virtual void show() { cout << "base:: show"<<endl; } priv…

数据安全与隐私:Facebook在技术创新中的新挑战

在数字化高速发展的今天&#xff0c;数据安全与隐私保护成为社会关注的核心议题之一。作为全球最大的社交媒体平台之一&#xff0c;Facebook&#xff08;现为Meta&#xff09;在技术创新和用户体验优化的同时&#xff0c;也面临着前所未有的数据安全挑战。​ 技术创新中的数据…

SQL从入门到实战-2

高级语句 窗口函数 排序窗口函数 例题二十九 select yr,party,votes, rank() over (PARTITION BY yr ORDER BY votes desc) as pson from ge where constituency S14000021 order by party,yr 偏移分析函数 例题三十 select name,date_format(whn,%Y-%m-%d) data, confi…

爬虫基础之爬取歌曲宝歌曲批量下载

声明&#xff1a;本案列仅供学习交流使用 任何用于非法用途均与本作者无关 需求分析: 网站:邓紫棋-mp3在线免费下载-歌曲宝-找歌就用歌曲宝-MP3音乐高品质在线免费下载 (gequbao.com) 爬取 歌曲名 歌曲 实现歌手名称下载所有歌曲 本案列所使用的模块 requests (发送…

django基于Python对西安市旅游景点的分析与研究

基于Django框架和Python语言对西安市旅游景点进行的分析与研究&#xff0c;是一个结合现代Web技术和数据分析能力的综合性项目。 一、项目背景与意义 随着旅游业的快速发展&#xff0c;对旅游景点的深入分析和研究变得越来越重要。西安市作为中国历史文化名城&#xff0c;拥有…

spring boot 集成 knife4j

1、knife4j介绍以及环境介绍 knife4j是为Java MVC框架集成Swagger生成Api文档的增强解决方案,前身是swagger-bootstrap-ui,取名knife4j是希望它能像一把匕首一样小巧,轻量,并且功能强悍!其底层是对Springfox的封装&#xff0c;使用方式也和Springfox一致&#xff0c;只是对接口…

Apache Hadoop YARN框架概述

一、YARN产生和发展简史 1.1背景 数据、程序、运算资源&#xff08;内存、CPU&#xff09;三者组在一起&#xff0c;才能完成数据的计算处理过程。在单机环境下&#xff0c;三者之间协调配合不是太大问题。为了应对海量数据的处理场景&#xff0c;Hadoop软件出现并提供了分布…

妙用编辑器:把EverEdit打造成一个编程学习小环境

1 妙用编辑器&#xff1a;把EverEdit打造成一个编程学习小环境 1.1 应用场景 最近在学习Python语言&#xff0c;由于只是学习和练习&#xff0c;代码规模很小&#xff0c;不想惊动PyCharm、VSCode、WingIDE这些重型武器&#xff0c;只想轻快的敲些代码&#xff0c;记事本虽好&…

使用RSyslog将Nginx Access Log写入Kafka

个人博客地址&#xff1a;使用RSyslog将Nginx Access Log写入Kafka | 一张假钞的真实世界 环境说明 CentOS Linux release 7.3.1611kafka_2.12-0.10.2.2nginx/1.12.2rsyslog-8.24.0-34.el7.x86_64.rpm 创建测试Topic $ ./kafka-topics.sh --zookeeper 192.168.72.25:2181/k…

笔记本电脑 选购 回收 特权模式使用 指南

笔记本电脑 factor 无线网卡&#xff1a;有些笔记本无法检测到特定频段的信息&#xff0c;会导致连不上校园网 sudo iwlist wlp2s0 scan | grep Frequency > net.txt cat net.txt>表示用终端输出覆盖后续文件&#xff0c;>>表示添加到后续文件的末尾 一种更简…

【python A* pygame 格式化 自定义起点、终点、障碍】

pip install pygame 空格键&#xff1a;运行 A* 算法。CtrlC 键&#xff1a;清空路径。CtrlS 键&#xff1a;保存当前地图到 map.json 文件。CtrlL 键&#xff1a;从 map.json 文件加载地图。 import pygame import json from queue import PriorityQueue from tkinter import…

Mac——Docker desktop安装与使用教程

摘要 本文是一篇关于Mac系统下Docker Desktop安装与使用教程的博文。首先介绍连接WiFi网络&#xff0c;然后详细阐述了如何在Mac上安装Docker&#xff0c;包括下载地址以及不同芯片版本的选择。接着讲解了如何下载基础镜像和指定版本镜像&#xff0c;旨在帮助用户在Mac上高效使…