佛罗里达大学利用神经网络,解密 GPCR-G 蛋白偶联选择性

内容一览:G 蛋白偶联受体 (GPCRs) 是一种将细胞膜外的刺激,传递到细胞膜内的跨膜蛋白,广泛参与到人体生理活动当中。近日,佛罗里达大学的研究者测定了 GPCRs 和 G 蛋白的结合选择性,并开发了预测二者选择性的算法,对这一选择性的结构基础进行了研究。
关键词:GPCR 神经网络 药物研发

作者 | 雪菜

编辑 | 三羊

G 蛋白偶联受体 (GPCRs) 是一种将细胞膜外的刺激传递到细胞膜内的跨膜蛋白。通过激活细胞膜内的 G 蛋白及其下游信号通路,GPCRs 能够广泛参与到发育、免疫、激素调节和神经活动等重要生理活动中。

G 蛋白由 Gα、Gβ 和 Gγ 亚基组成,其多样性决定了 GPCRs 信号反应的多样性。人类基因组共编码了 16 个 Gα 亚基,分为 4 个亚家族 Gαi/o、Gαq、Gαs 和 Gα12/13。G 蛋白决定了下游的信号通路,进而决定了细胞反应。因此,GPCRs 和 G 蛋白的选择性结合是理解生物体信号系统的关键。

学界一度认为 GPCRs 只会与单个 G 蛋白偶联,进而从功能上将 GPCRs 对应划分为 4 种。然而近期研究者发现,大多数 GPCRs 会与多个 G 蛋白偶联,以激活复杂细胞反应。一对一的分类模式已经不足以描述 GPCRs 和 G 蛋白的偶联关系,然而 GPCRs-G 蛋白的选择性机制又暂不明晰。

为此,佛罗里达大学的研究者使用动力学测量和生物发光共振能量转移 (BRET) 技术,测定了 GPCRs 对 G 蛋白的鸟苷酸交换因子,以分析二者的选择性结合。据此,研究人员以 GPCRs 对 G 蛋白的偏好对其分类,建立了包括不同哺乳动物的 124 种 GPCRs 的粗粒度模型。随后,开发了一个预测 GPCRs-G 蛋白选择性的算法,研究了选择性的结构基础。相关成果已发表在 「Cell Reports」。

这一成果已发表于「Cell Reports」

论文链接:

https://doi.org/10.1016/j.celrep.2023.113173

01 BRET:GPCRs-G 蛋白选择性量化

为了量化检测 GPCRs-G 蛋白选择性,研究人员使用 BRET 技术在活体细胞中测量了 G 蛋白的活性。

实时检测 G 蛋白活性的 BRET 技术

随后,研究人员在胆囊收缩素 Ⅱ 型受体 (CCKBR) 上进行了验证。响应振幅 (Amplitude) 结果表明,CCKBR 可以激活 Gαi/o、Gαq、Gα15 和 Gα12/13 家族的 G 蛋白,且激活水平差距不大,但无法激活 Gαs 家族的蛋白。

而基于激活率 (Activation Rate) 的结果清晰表明,CCKBR 对 Gαq 家族激活效果最好,随后才是 Gαi/o、Gα15 和 Gα12/13,这说明基于激活率的 BRET 技术可以捕获到不同 G 蛋白活性之间的细微差异。

基于振幅的 BRET 结果 (C) 及基于激活率的 BRET 结果 (D)

据此,研究人员测量了 124 种 GPCRs 和 G 蛋白的选择性,作为本研究的数据集。

B 类 GPCRs 与 G 蛋白的选择性测量结果

02 模型构建:二元分类神经网络

上述结果表明,基于激活率的 BRET 技术能够对上百种 GPCRs 与 G 蛋白的选择性进行区分。基于这一结果,研究人员开发了一种基于机器学习的 A 类 GPCRs-G 蛋白选择性预测算法。

算法的任务包括两个:

1、针对 GPCRs 的偶联性,判断某种 GPCR 能否与 G 蛋白偶联,即振幅 >0%;

2、针对 GPCRs 的选择性,判断某个 GPCR-G 蛋白偶联体能够迅速激活,即激活率 >30%。

机器学习算法的概念图

每个 GPCR 和不同家族的 G 蛋白的偶联都是一个分类问题,因此每个任务可以设计为 5 个二元分类。据此,研究人员设计了 10 个神经网络分类器处理这些任务。神经网络由两个全连接层(分别为 128 个和 16 个神经元)、一个压平层 (Flattening Layer)、三个全连接层(分别为 128 个、32 个和 4 个神经元)以及一个输出层(1 个神经元)组成,内层由校正线性单元 (ReLU) 激活,最后进行批量归一化。输出层通过 sigmoid 函数激活。

由于数据量有限,在假设决定 G 蛋白选择性的序列在进化过程中相对保守的前提下,为每种 GPCR 增加了 50 个同源序列,进行数据扩充。在模型中部署序列嵌入协议,使用无监督深度学习模型描述蛋白质残基在特定环境中的属性。

神经网络的输入是大小为 B*30*1024 的张量。其中第一维度是 batch size (B=32),第二维度是残基数量 (30),第三维度为每个氨基酸残基预训练序列嵌入的大小 (1024)。

模型对振幅和激活率预测的平均 AUROC 均为 0.85,说明模型对两项指标的预测均有较好的性能。其中,对 Gs 家族蛋白预测最佳,AUROC 分别为 0.89 和 0.95。然而,对于 Gα15 和 Gα12/13 家族的蛋白,模型没有展现出明显的学习能力。

振幅 (C) 和激活率 (D) 预测的 ROC 曲线

03 GPCRs-Gα 蛋白选择性的机制解密

BRET 实验和机器学习为破解 GPCRs-G 蛋白选择性的结构基础提供了解决方案。基于此,研究人员调查了可用的 GPCRs-G 蛋白复合物,并对 33 个 A 类受体进行了分析,找到了决定 A 类 GPCRs-Gα 蛋白选择性的结构。

研究人员调查了 GPCRs-Gα 蛋白的残基网络,结果显示 GPCRs 面向细胞质的所有结构均不同程度地参与到了与 Gα 蛋白的结合当中。同样的,Gα 蛋白中也有 13 个结构与 GPCRs-Gα 蛋白的结合相关,其中 C 端的 α-螺旋 (H5) 参与程度最高。

GPCRs 和 Gα 蛋白不同结构元素的交互

对于普遍的 GPCRs-Gα 偶联,GPCRs 使用 ICL2、H8 和大部分 TM 残基与 Gα 蛋白相连。其中,绝大多数结构主要与 H5 相连,而 ICL2 的连接更为广泛。

GPCRs 与 Gαi/o 和 Gαq 家族的蛋白偶联模式类似,唯一的区别在于 GPCRs 与前者的连接严重依赖 TM6,而与后者的连接则不需要。GPCRs 与 Gαs 的连接当中,ICL2 和 ICL3 的份额大幅减少,而更依赖 TM3 和 TM5。上述结果说明,对于不同家族的 Gα 蛋白而言,其与 GPCRs 的连接依赖于不同的结构。

进一步的,结合 GPCRs-G 蛋白的选择性顺序,调查特定结构对不同家族 Gα 蛋白的影响。首先,判断与 Gαi/o 结合的 GPCRs 能否与 Gα15 结合,并对比二者残基网络的差异。与前者相比,GPCRs 与后者的连接切断了 ICL3 和 H4 的联系,弱化了 ICL2-H5 的交互,强化了 TM4-HN 和 ICL2-s2s3 的连接。这说明 ICL2 与其他残基的联系可能是与 Gαi/o 或 Gα15 相连的 GPCRs 的主要区别。

GPCRs 只与 Gαi/o 连接的残基网络 (J) 和 GPCRs 与 Gα15/Gαi/o 相连的残基网络 (K)

同样的,对比了 GPCRs 与 Gαs 和 Gαi/o 结合的残基网络之后,结果显示 ICL1 和 TM5 之间的联系是二者的主要区别。

上述结果说明,BRET 和机器学习能够对 GPCRs-G 蛋白结合的蛋白残基网络进行分析,进而找到二者选择性的结构基础,为 GPCRs 的研究提供了新方法。

04 AI-GPCR:96.4% 的未探索区域

过去十年间,AI 和机器学习在 GPCR 领域的应用比例稳步提升。2022 年,有 3.6% 的 GPCR 相关论文中提到了 AI 相关方法。

GPCR 相关论文中提及 AI 的比例

鉴于 AI 在 GPCR 药物研究中的应用的不断增加,对应的算法也不断被开发。对于分类问题,最常用的算法是传统机器学习领域的常用算法,如 scikit-learn 库中的算法,包括支持向量机 (SVM)、决策树、梯度提升机和 k-近邻算法等。

对于数值结果,如蛋白-配体结合的亲和力等,常用回归算法求解,如多元线性回归、支持向量机和深度学习网络等。

最近的成果多使用多层感知器、卷积神经网络 (CNN) 等深度学习算法进行预测。随着深度学习生成算法的发展,蛋白质配体和结构设计愈发高效和准确。生成对抗性网络 (Generative Adversarial Network)、循环神经网络 (Recurrent Neural Network)、强化学习等算法可以利用向量空间的自动构造和自适应度量来探索更大的生成空间。

AI 在 GPCR 药物研发各阶段的作用

因此,这些算法可以产生更多具有所需功能的配体,或是更准确地预测未知蛋白质的结构,如 AlphaFold2。虽然 AlphaFold2 等模型并不专用于预测 GPCR 的结构,但仍可以高效准确地预测 GPCR 的结构。此外,无监督或自监督深度学习也在药物发现重崭露头角。

可见,AI-GPCR 可能是未来药物研发的新方向,但同时也为我们留下了 96.4% 的未知区域。在高效分类和精准预测的算法帮助下,人们能够对 GPCR 的偶联机制有更清晰的了解,为生物医学的发展注入新动能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/217327.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C++日常遇到的一些坑的总结

一、const 相关 C中const的不同位置的用法 const 修饰符用法总结 二、函数形参没有变量名 三、指针偏移问题 笔记&#xff1a; 包含来自C标准库的头文件&#xff0c;用#inlcude<xxx>&#xff0c;包含不来自C标准库的头文件&#xff0c;用#include"xxx"最…

【动手学深度学习】(十)PyTorch 神经网络基础

文章目录 一、层和块1.自定义块2.顺序块3.在前向传播函数中执行代码 二、参数管理1.参数访问2.参数初始化3.参数绑定 三、自定义层1.不带参数的层2.带参数的层 四、读写文件1.加载和保存张量2.加载和保存模型参数 [相关总结]state_dict() 一、层和块 为了实现复杂神经网络块&am…

论文投稿查询会议期刊及deadlines的网站

1. 这个是查近期CCF-ABC的ddl会议的网址 https://ccfddl.github.io/ https://ccfddl.top/ 2. 期刊选刊 https://ijournal.topeditsci.com/home https://journalsuggester.springer.com/ 3. IEEE出版物推荐 https://publication-recommender.ieee.org/home

java后端技术演变杂谈(未完结)

1.0版本javaWeb&#xff1a;原始servletjspjsbc 早期的jsp&#xff1a;htmljava&#xff0c;页面先在后端被解析&#xff0c;里面的java代码动态渲染完成后&#xff0c;成为纯html&#xff0c;再通过服务器发送给浏览器显示。 缺点&#xff1a; 服务器压力很大&#xff0c;因为…

【C语言】深入理解C语言中的数学运算和类型转换

文章目录 引言取负运算的奥秘源码探索分析与解读 浮点数运算的精细差异源码分析 精度损失与隐式类型转换精度和除零运算探究float类型和double类型的精度各是多少&#xff08;即十进制有效位的位数&#xff09;&#xff1f;在你的机器上&#xff0c;“负数开方”是如何处理的&a…

用友U8 Cloud TaskTreeQuery SQL注入漏洞复现

0x01 产品简介 用友U8 Cloud是用友推出的新一代云ERP&#xff0c;主要聚焦成长型、创新型企业&#xff0c;提供企业级云ERP整体解决方案。 0x02 漏洞概述 用友U8 Cloud /service/~iufo/nc.itf.iufo.mobilereport.task.TaskTreeQuery接口处存在SQL注入漏洞&#xff0c;未授权的…

类和对象——(6)友元

归纳编程学习的感悟&#xff0c; 记录奋斗路上的点滴&#xff0c; 希望能帮到一样刻苦的你&#xff01; 如有不足欢迎指正&#xff01; 共同学习交流&#xff01; &#x1f30e;欢迎各位→点赞 &#x1f44d; 收藏⭐ 留言​&#x1f4dd; 没有存储汗水&#xff0c;就无法支取成…

奥本海默-电影剧情简介

片头&#xff0c;奥本海默 脑海浮现恒星生命周期画面 1925年&#xff0c;奥本海默离开美国去欧洲学习新物理&#xff08;量子力学&#xff09; 脑海浮现量子力学相关画面&#xff08;像 德布罗意波&#xff09; 1927年从德国哥廷根大学毕业&#xff0c;获得物理学博士学位。…

MySQL笔记-第04章_运算符

视频链接&#xff1a;【MySQL数据库入门到大牛&#xff0c;mysql安装到优化&#xff0c;百科全书级&#xff0c;全网天花板】 文章目录 第04章_运算符1. 算术运算符2. 比较运算符3. 逻辑运算符4. 位运算符5. 运算符的优先级拓展&#xff1a;使用正则表达式查询 第04章_运算符 …

计算机辅助药物设计AIDD-小分子-蛋白质|分子生成|蛋白质配体相互作用预测

文章目录 计算机辅助药物设计AIDD【小分子专题】AIDD概述及药物综合数据库学习机器学习辅助药物设计图神经网络辅助药物设计自然语言处理辅助药物设计药物设计与分子生成 计算机辅助药物设计【蛋白质专题】蛋白质数据结构激酶-Kinase相似性学习基于序列的蛋白质属性预测基于结构…

【Windows】使用SeaFile搭建本地私有云盘并结合内网穿透实现远程访问

1. 前言 现在我们身边的只能设备越来越多&#xff0c;各种智能手机、平板、智能手表和数码相机充斥身边&#xff0c;需要存储的数据也越来越大&#xff0c;一张手机拍摄的照片都可能有十多M&#xff0c;电影和视频更是按G计算。而智能设备的存储空间也用的捉襟见肘。能存储大量…

使用typescript搭建express

使用typescript搭建express 开始 为这个项目创建一个新的目录&#xff0c;使用下面的命令初始化项目并创建一个包。 NPM init -y初始化后&#xff0c;让我们安装必要的包 npm i express dotenv cors helmet body-parser 在express中配置typescript npm i -D typescript typ…

filter过滤器

package com.it.filter;import javax.servlet.*; import javax.servlet.annotation.WebFilter;import java.io.IOException;WebFilter(urlPatterns"/*") public class DemoFilter implements Filter {Override // 初始化的方法 只要调用一次public void init(Filte…

【React 开发】增强你的React 技能:2024年要掌握的4种高级模式

React由于其简单和灵活&#xff0c;近年来已成为最受欢迎的前端库之一。然而&#xff0c;当应用程序的复杂性扩展时&#xff0c;管理状态、处理异步输入和维护可扩展的体系结构可能会变得困难。我们将在本文中介绍四种高级React模式&#xff0c;它们将帮助您克服这些困难以及如…

(C语言)判定一个字符串是否是另一个字符串的子串,若是则返回子串在主串中的位置。

要求&#xff1a; &#xff08;1&#xff09;在主函数中输入两个字符串&#xff0c;调用子函数cmpsubstr()判断&#xff0c;并在主函数输出结果。 &#xff08;2&#xff09;子函数的返回值为-1表示未找到&#xff0c;否则返回子串的位置&#xff08;起始下标&#xff09;。 …

人工智能-A*算法-八数码问题

一&#xff0c;A*算法设计思想 A*算法&#xff08;A-star&#xff09;是一种寻路算法&#xff0c;主要用于游戏、机器人等领域。 它的设计思想是将最短路径搜索问题转化为一个优化问题&#xff0c;通过计算每个节点的评分&#xff08;f(n) g(n) h(n)&#xff09;来寻找最优…

YOLOv8-Seg改进:简单高效的模块-现代反向残差移动模块 (iRMB) | | ICCV2023 EMO

🚀🚀🚀本文改进:设计了一种面向移动端应用的简单而高效的现代反向残差移动模块 (Inverted Residual Mobile Block, iRMB),它吸收了类似 CNN 的效率来模拟短距离依赖和类似 Transformer 的动态建模能力来学习长距离交互,引入YOLOV8 🚀🚀🚀YOLOv8-seg创新专栏:h…

【华为OD题库-064】最小传输时延I-java

题目 某通信网络中有N个网络结点&#xff0c;用1到N进行标识。网络通过一个有向无环图.表示,其中图的边的值表示结点之间的消息传递时延。 现给定相连节点之间的时延列表times[]{u&#xff0c;v&#xff0c; w)&#xff0c;其中u表示源结点&#xff0c;v表示目的结点&#xff0…

小程序长按识别二维码

小程序开发中要实现长按识别二维码的功能很简单&#xff0c;只需要在image标签里添加如下属性即可&#xff1a; 小程序版本&#xff1a; show-menu-by-longpress"{{true}}" uniapp版本&#xff1a; :show-menu-by-longpress"true" 举例&#xff1a; …

金融银行业更适合申请哪种SSL证书?

在当今数字化时代&#xff0c;金融行业的重要性日益增加。越来越多的金融交易和敏感信息在线进行&#xff0c;金融银行机构必须采取必要的措施来保护客户数据的安全。SSL证书作为一种重要的安全技术工具&#xff0c;可以帮助金融银行机构加密数据传输&#xff0c;验证网站身份&…