PTMD2.0-疾病相关的翻译后修饰数据库

翻译后修饰(PTMs,post-translational modifications)通过调节蛋白质功能参与了几乎所有的生物学过程,而 PTMs 的异常状态常常与人类疾病相关。在此,PTMD 2.0展示与疾病相关的 PTMs 综合数据库,其中包含 93 种 PTM 类型、涉及 15105 种蛋白质的 342624 个 PTM - 疾病关联(PDAs,PTM–disease associations)以及 2083 种疾病。基于疾病中不同的 PTM 状态,数据库已将所有的 PDAs 分为六类:PTM 水平的上调(U)或下调(D)、PTM 的存在(P)或缺失(A)以及 PTM 位点的产生(C)或破坏(N)。数据库为每个 PDA 提供了详细注释,并通过整合来自 101 个涵盖 13 个层面的额外资源的知识,对疾病相关蛋白质进行了详细注释,这些层面包括疾病相关信息、变异和突变、蛋白质 - 蛋白质相互作用、蛋白质功能注释、DNA 和 RNA 元件、蛋白质结构、化合物-靶标关系、mRNA 表达、蛋白质表达/蛋白质组学、亚细胞定位、生物学途径注释、功能域注释和理化性质。该数据库数据量约为 8GB,PTMD 2.0 将成为进一步分析 PTMs 与疾病之间关系的基础资源。

原文请参考:Xinhe Huang, Zihao Feng, Dan Liu, Yujie Gou, Miaomiao Chen, Dachao Tang, Cheng Han, Jianzhen Peng, Di Peng, Yu Xue, PTMD 2.0: an updated database of disease-associated post-translational modifications, Nucleic Acids Research, Volume 53, Issue D1, 6 January 2025, Pages D554–D563, https://doi.org/10.1093/nar/gkae850

PTMD 2.0 的在线服务可在 https://ptmd.biocuckoo.cn/ 免费获取

目录

  • 背景概述
  • 数据管理
  • 疾病相关蛋白质和 PDA 位点的全面注释
  • PTMD 2.0统计信息
  • 使用案例

背景概述

翻译后修饰(PTM)是调控多种生物过程的最重要机制之一。各种 PTM 通过改变残基疏水性和稳定性来调控蛋白质结构和功能动态。迄今为止,已发现 680 多种 PTM (http://www.uniprot.org/docs/ptmlist.txt),其中磷酸化和泛素化由于在细胞中含量丰富而研究最多。1992 年,Edomond H. Fischer 和 Edwin G. Krebs 因发现可逆蛋白质磷酸化作为一种​​生物调控机制而获得诺贝尔生理学或医学奖,该机制随后与调控信号转导、细胞骨架重排和细胞周期进程等其他关键细胞过程密切相关。 2004 年,欧文·罗斯 (Irwin Rose)、阿隆·切哈诺沃 (Aaron Ciechanover) 和阿夫拉姆·赫什科 (Avram Hershko) 因发现泛素化是蛋白酶体降解蛋白质的可转移信号而获得诺贝尔奖。此外,乙酰化等其他修饰通过修饰组蛋白和非组蛋白来调节转录和细胞代谢。

随着 PTM 研究的快速发展,越来越多的证据表明,异常的 PTM 状态通常与多种人类疾病有关,例如神经退行性疾病、癌症和糖尿病。例如,microtubule-associated protein tau (MAPT) 的位点特异性磷酸化可抑制淀粉样蛋白-β 毒性,这为阿尔茨海默症 (AD) 中的突触后过程提供了见解,并强调了 MAPT/tau 磷酸化在神经元毒性中的致病作用。此外,据报道,S 期激酶相关蛋白 2 (SKP2) 是一种癌蛋白和细胞周期调节剂,可促进乳腺癌细胞中肿瘤抑制因子程序性细胞死亡蛋白 4 (PDCD4) 的磷酸化、泛素化和降解。此外,丝氨酸/苏氨酸蛋白激酶基因(富含亮氨酸重复激酶 2 (LRRK2))的基因突变被认为是家族性帕金森病 (PD) 的最常见原因。据报道,Ser1292 的自身磷酸化表明 LRRK2 激酶活性,并有助于 PD 突变的细胞效应。这些研究表明 PTM 与多种疾病之间存在密切关联。因此,具有详细注释的全面 PTM-疾病关联 (PDA) 数据资源将为进一步阐明人类疾病病理学背后的分子机制提供基础。

2018 年,作者开发了 PTMD 1.0,这是一个与疾病相关的 PTM 数据库,其中包含23 种 PTM 类型, 275 种疾病类型, 749 种蛋白质中的 1950 个已知 PDA。近年来,越来越多的研究集中于分析 PTM 与疾病之间的关系。作者不断维护和更新数据库,现在,PTMD 2.0 包含 93 种 PTM 类型, 2083 种疾病, 15 105 种蛋白质中,342 624 个 PDA。首先,作者从文献中手动收集了 6740 个高质量和实验确定的 PDA。此外,整合并处理了来自三个公共数据库的 335 884 个潜在 PDA,包括 ActiveDriverDB 、BioMuta 和 PhosphoSitePlus,它们绘制并表征了与疾病相关突变重叠的 PTM 位点。
此外,通过整合来自 101 个额外资源的知识仔细注释了与疾病相关的蛋白质,这些资源涵盖 13 个方面,包括疾病相关信息、变异和突变、蛋白质-蛋白质相互作用、蛋白质功能注释、DNA 和 RNA 元素、蛋白质结构、化学-靶标关系、mRNA 表达、蛋白质表达/蛋白质组学、亚细胞定位、生物途径注释、功能域注释和物理化学性质。与 PTMD 1.0 相比,报告的 PDA 数量增加了 3.5 倍。此外,PTMD 2.0 包含约 8 GB 的数据,与 PTMD 1.0(约 0.2 GB)相比,数据量增加了 40 倍。预计更新后的 PTMD 2.0 将成为进一步分析 PTM 与疾病之间关系的基础资源。

数据管理

为了解 PTM 与疾病之间的关系,作者根据疾病中 PTM 事件的状态将所有收集到的 PDA 分为六类(补充图 S1)。
supfig1

  • 补充图S1:根据疾病中 PTM 事件的状态,将所有收集到的 PDA 分为六类。
  1. Upregulation (U):疾病中 PTM 水平升高。例如,mHtt 的表达会增加 p53 在 Ser46 处的磷酸化,使其与 Pin1 相互作用并与 iASPP 分离,从而诱导凋亡靶基因的表达。
  2. Downregulation (D):疾病中 PTM 水平下调。在白血病中,PRL2 下调 CBL 酪氨酸 371 处的磷酸化,降低 FLT3 泛素化和降解,从而增强 FLT3 信号传导。
  3. Presence §:PTM 事件的存在与疾病进展有关。例如,EZH2 的磷酸化通过 STAT3 甲基化激活 STAT3 信号传导并促进胶质母细胞瘤干细胞样细胞的致瘤性 。
  4. Absence (A):PTM 事件的缺失与疾病进展有关。组蛋白 H4 的 Lys16 乙酰化缺失和 Lys20 三甲基化是人类癌症的常见特征。
  5. Creation ©:突变事件(单个氨基酸或插入/缺失突变)创建一个或多个 PTM 位点或增加疾病中的蛋白质 PTM 水平。许多引起人类遗传疾病的突变可能会产生新的N-糖基化位点,其致病作用是由N连接碳水化合物的添加引起的。
  6. Disruption (N):破坏一个或多个PTM位点或降低疾病中蛋白质PTM水平的突变事件。这种疾病相关PTM的典型例子是PINK1的T313M突变破坏了其MARK2介导的磷酸化并与PD有关。

因此,前两种类型(U和D)强调了患病组织与正常组织相比PTM水平的变化。相反,P和A型强调了PTM事件的存在与否与疾病进展的关联。后两种类型C和N关注突变事件对疾病中PTM的影响。

疾病相关蛋白质和 PDA 位点的全面注释

PTMD 2.0 中的每个蛋白质条目都分配有一个唯一的 PTMD ID,作为标识符,例如 PTMD00006,用于人类细胞肿瘤抗原 p53。对于每个蛋白质条目,从 UniProt 中整合了基本注释,例如 UniProt/RefSeq/Ensembl ID、蛋白质名称/同义词、基因名称/同义词、基因 ID、NCBI 分类 ID、功能描述、蛋白质序列、核苷酸序列、基因本体术语和相关关键词。从蛋白质数据库 (PDB) 和 AlphaFold 蛋白质结构数据库 (AlphaFold DB) 中选择了代表性的 3D 蛋白质结构,以用于可视化已知的 PDA 位点(在蛋白质上存在翻译后修饰–PTM–且这种修饰与特定疾病发生关联的位点)。每个 PDA 位点都包含有关修饰位置、残基、修饰类型、调节类型和相关疾病的信息。对于每个已知的 PDA 事件,都提供了在疾病中的调节作用的简要描述,以及主要参考文献的 PMID,以确保可追溯性和可信度。

通过整合来自 101 个额外公共数据库的知识进一步增强了数据库,提供了与疾病相关的蛋白质和 PDA 位点的详尽注释。这些公共资源涵盖 13 个方面:(i) 变异和突变;(ii) 疾病相关信息; (iii) 蛋白质-蛋白质相互作用;(iv) 蛋白质功能;(v) DNA 和 RNA 元素;(vi) 蛋白质结构;(vii) 化合物-靶标关系;(viii) mRNA 表达;(ix) 蛋白质表达/蛋白质组学;(x) 亚细胞定位;(xi) 生物途径;(xii) 功能域注释;(xiii) 物理化学性质 (图 1)。所有注释都可以从 PTMD 2.0 (https://ptmd.biocuckoo.cn/download.php) 下载。
fig1

  • 图1:构建 PTMD 2.0 的步骤。首先,从 PubMed 中手动收集实验鉴定的疾病相关蛋白和 PDA 位点。此外,作者整合并处理了四个公共数据库的数据,包括 PTMD 1.0、ActiveDriverDB、BioMuta和 PhosphoSitePlus。此外,通过来自 101 个额外数据库的知识注释了疾病相关蛋白,这些数据库涵盖 13 个方面:(i)变异和突变;(ii)疾病相关信息;(iii)蛋白质-蛋白质相互作用;(iv)蛋白质功能;(v)DNA 和 RNA 元素;(vi)化学-靶标关系;(vii)蛋白质结构;(viii)mRNA 表达;(ix)物理化学性质;(x)蛋白质表达/蛋白质组学;(xi)亚细胞定位;(xii)生物途径;及 (xiii) 域注释。
  • 图中,Ac,乙酰化;Gly,糖基化;Kla,赖氨酸乳酸化;Me,甲基化;P,磷酸化;SUMO,SUMO 化;Ub,泛素化。

PTMD 2.0统计信息

为了探索已知 PTM 与疾病之间的关系,作者对已报道的 PDA 事件进行了统计分析。此前,在 PTMD 1.0 中,作者将 23 种 PTM 类型分为 9 种超类型,包括乙酰化、糖基化、甲基化、硝化、S-棕榈酰化、磷酸化、S-亚硝基化、SUMO 化和泛素化。例如,丝氨酸磷酸化、苏氨酸磷酸化和酪氨酸磷酸化以及去磷酸化和自身磷酸化都归类为磷酸化超类型,而单泛素化、多泛素化、去泛素化和自身泛素化则归类为泛素化超类型。

随着修饰类型的扩展,作者添加了 70 种新的修饰类型,并将所有 PTM 类型分为 49 种超类型。图中显示了每种 PTM 类型的修饰事件数量(图 2A)。与疾病关联数量最多的前三种 PTM 超类型是磷酸化(4181 个 PDA,68.09%)、泛素化(761 个 PDA,12.39%)和乙酰化(625 个 PDA,9.27%),而其他 PTM 超类型的疾病关联相对较少。

作者还根据起源组织位置将 2083 种疾病分为 34 种超类型(图 2B)。在所有疾病中,神经系统疾病超类型与 PTM 的关联数量最多(13.8%),这表明 PTM 在神经退行性疾病中可能发挥重要作用。许多异常 PTM 事件广泛发生在多种神经退行性疾病中,例如 AD 和 PD,并涉及神经元功能障碍和细胞死亡。这些显著的关联表明,针对异常 PTM 事件可能提供有效的治疗策略

在六种类型的 PDA 中,61.14% 的 PTM 在疾病中上调,21.23% 的 PTM 在疾病中下调(图 2C)。这些发现表明,PTM 水平的改变可能显著促进疾病发展,显示出作为疾病治疗的预后标志物和治疗靶点的巨大潜力。此外,12.28% 的疾病相关 PTM 事件以 PTM 的存在为特征,而只有 2.79% 以 PTM 的缺失为特征。这些发现表明 PTM 事件优先发生在疾病进展期间,而只有一小部分疾病的发展与 PTM 的丧失有关。

此外,每种 PDA 类型中的疾病关联数量在 34 种疾病超类型中存在显着差异(图 2D)。
fig2

  • 图2A:93 种 PTM 类型被分为 49 种超类型。显示每种 PTM 类型已知的 PDA 位点数量。
  • B:PTMD 2.0 中不同疾病超类型的百分比。总共 2083 种疾病根据组织信息分为 34 种超类型。
  • C:每种疾病相关 PTM 中已知疾病关联的数量。
  • D:六种已知 PDA 在疾病超类型中的分布。点大小表示每种疾病的 PDA 数量。

使用案例

PTMD 2.0 的在线服务以易于使用的方式开发。选择human p53 作为示例来描述 PTMD 2.0 的使用。在浏览页面上,实现了三种类型的浏览选项,包括“按 PDA 浏览”、“按疾病浏览”和“按 PTM 浏览”(图 3)。

在“按 PDA 浏览”选项中,用户可以选择调节类型“上调”,然后选择相关的 PTM 类型“磷酸化”,这将生成所有上调并涉及磷酸化的 PDA 的表格列表(图 3A)。

对于“按疾病浏览”选项,34 种疾病超类型直观地显示(图 3B)。用户可以单击这些图标来探索与每种组织相关的特定疾病。通过单击“卵巢”,用户可以查看特定类型疾病的表格。此外,点击“卵巢癌/癌”链接将显示与卵巢癌疾病相关的所有 PDA。

对于“按 PTM 浏览”选项,用户可以点击“磷酸化”链接,从各种磷酸化类型中进行选择,包括酪氨酸磷酸化、苏氨酸磷酸化、丝氨酸磷酸化、磷酸化、去磷酸化和自身磷酸化,以查找相关的 PDA (图 3C)。

通过点击 PTMD ID“PTMD00006”,用户可以访问 p53 的蛋白质页面(图 3D)。在结构窗口下方实现了一个“放大”按钮,允许在更大的窗口中查看human p53 的 3D 结构。除了 PDA 位点的基本信息和详细信息外,还可以通过单击左侧栏上的“注释”按钮或单击 PTMD ID 旁边的“集成注释”图标来访问其他注释(图 3D)。点击相应名称即可查看每种附加注释。例如,用户可以点击变异和突变部分下的“dbSNP”,查看单核苷酸多态性数据库 (dbSNP) 中识别的 TP53 基因中的所有单核苷酸多态性(图 3E)。
fig3

  • 图3:PTMD 2.0 的浏览页面。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/959819.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

ArcGIS10.2 许可License点击始终启动无响应的解决办法及正常启动的前提

1、问题描述 在ArcGIS License Administrator中,手动点击“启动”无响应;且在计算机管理-服务中,无ArcGIS License 或者License的启动、停止、禁止等均为灰色,无法操作。 2、解决方法 ①通过cmd对service.txt进行手动服务的启动…

spring框架之IoC学习与梳理(1)

目录 一、spring-IoC的基本解释。 二、spring-IoC的简单demo(案例)。 (1)maven-repository官网中找依赖坐标。 (2).pom文件中通过标签引入。 (3)使用lombok帮助快速开发。 &#xff…

系统架构设计师教材:信息系统及信息安全

信息系统 信息系统的5个基本功能:输入、存储、处理、输出和控制。信息系统的生命周期分为4个阶段,即产生阶段、开发阶段、运行阶段和消亡阶段。 信息系统建设原则 1. 高层管理人员介入原则:只有高层管理人员才能知道企业究竟需要什么样的信…

基于STM32单片机设计的宠物喂食监控系统

1. 项目开发背景 随着宠物数量的增加,尤其是人们对宠物的养护需求日益增多,传统的人工喂养和管理方式难以满足现代养宠生活的需求。人们越来越希望通过智能化手段提高宠物养护的质量和效率,特别是对于宠物喂食、饮水、温湿度控制等方面的智能…

帕金森患者:科学锻炼,提升生活质量

帕金森病,作为一种常见的神经系统退行性疾病,给患者的日常生活带来了诸多挑战。然而,通过科学的锻炼,患者不仅可以在一定程度上缓解症状,还能提升生活质量。本文将详细介绍帕金森患者应该进行的几种关键锻炼&#xff0…

GA-CNN-LSTM-Attention、CNN-LSTM-Attention、GA-CNN-LSTM、CNN-LSTM四模型多变量时序预测一键对比

GA-CNN-LSTM-Attention、CNN-LSTM-Attention、GA-CNN-LSTM、CNN-LSTM四模型多变量时序预测一键对比 目录 GA-CNN-LSTM-Attention、CNN-LSTM-Attention、GA-CNN-LSTM、CNN-LSTM四模型多变量时序预测一键对比预测效果基本介绍程序设计参考资料 预测效果 基本介绍 基于GA-CNN-LST…

redis 实践与扩展

文章目录 前言一、springboot整合redis1、jedis1.1、单点模式1.2、哨兵模式1.3 集群模式1.4、关于jedis线程不安全的验证 2、lettuce(推荐)2.1、单点模式2.2、哨兵模式2.3、集群模式 3、RedisTemplate config 二、redis常用知识点1、缓存数据一致性2、缓存雪崩3、缓存击穿4、缓…

積分方程與簡單的泛函分析7.希爾伯特-施密特定理

1)def函數叫作"由核生成的(有源的)" 定义: 设 是定义在区域上的核函数。 对于函数,若存在函数使得, 则称函数是“由核生成的(有源的)”。 这里的直观理解是: 函数的“来源”可以通过核函数 与另一个函数的积分运算得到。 在积分方程理论中,这种表述常…

RH850F1KM-S4-100Pin_ R7F7016453AFP MCAL PWM 测试

1、PortPin配置 2、PwmChannel配置 4、PwmComplexDriverInit 配置注意事项 此参数指定通道是否初始化并由复杂驱动程序使用。 True:通道将被初始化并由复杂驱动程序使用。False:通道不会被初始化并被复杂驱动程序使用。

Spring Boot Starter介绍

前言 大概10来年以前,当时springboot刚刚出现并没有流行,当时的Java开发者们开发Web应用主要是使用spring整合springmvc或者struts、iBatis、hibernate等开发框架来进行开发。项目里一般有许多xml文件配置,其中配置了很多项目中需要用到的Be…

【科研建模】Pycaret自动机器学习框架使用流程及多分类项目实战案例详解

Pycaret自动机器学习框架使用流程及项目实战案例详解 1 Pycaret介绍2 安装及版本需求3 Pycaret自动机器学习框架使用流程3.1 Setup3.2 Compare Models3.3 Analyze Model3.4 Prediction3.5 Save Model4 多分类项目实战案例详解4.1 ✅ Setup4.2 ✅ Compare Models4.3 ✅ Experime…

CY T 4 BB 5 CEB Q 1 A EE GS MCAL配置 - MCU组件

1、ResourceM 配置 选择芯片信号: 2、MCU 配置 2.1 General配置 1) McuDevErrorDetect: - 启用或禁用MCU驱动程序模块的开发错误通知功能。 - 注意:采用DET错误检测机制作为安全机制(故障检测)时,不能禁用开发错误检测。2) McuGetRamStateApi - enable/disable th…

【论文阅读】RAG-Reward: Optimizing RAG with Reward Modeling and RLHF

研究背景 研究问题:这篇文章要解决的问题是如何优化检索增强生成(RAG)系统,特别是通过奖励建模和人类反馈强化学习(RLHF)来提高大型语言模型(LLMs)在RAG任务中的效果。研究难点&…

关于WPF中ComboBox文本查询功能

一种方法是使用事件&#xff08;包括MVVM的绑定&#xff09; <ComboBox TextBoxBase.TextChanged"ComboBox_TextChanged" /> 然而运行时就会发现&#xff0c;这个事件在疯狂的触发&#xff0c;很频繁 在实际应用中&#xff0c;如果关联查询数据库&#xff0…

java求职学习day15

多线程 1 基本概念 1.1 程序和进程的概念 &#xff08;1&#xff09;程序 - 数据结构 算法&#xff0c;主要指存放在硬盘上的可执行文件。 &#xff08;2&#xff09;进程 - 主要指运行在内存中的可执行文件。 &#xff08;3&#xff09;目前主流的操作系统都支持多进程&a…

2025年数学建模美赛:A题分析(1)Testing Time: The Constant Wear On Stairs

2025年数学建模美赛 A题分析&#xff08;1&#xff09;Testing Time: The Constant Wear On Stairs 2025年数学建模美赛 A题分析&#xff08;2&#xff09;楼梯磨损分析模型 2025年数学建模美赛 A题分析&#xff08;3&#xff09;楼梯使用方向偏好模型 2025年数学建模美赛 A题分…

2024年终总结:技术成长与突破之路

文章目录 前言一、技术成长&#xff1a;菜鸟成长之路1. 学习与实践的结合2. 技术分享与社区交流 二、生活与事业的平衡&#xff1a;技术之外的思考1. 时间管理与效率提升2. 技术对生活的积极影响 三、突破与展望&#xff1a;未来之路1. 技术领域的突破2. 未来规划与目标 四、结…

go入门Windows环境搭建

简介 Go 即 Golang&#xff0c;是 Google 公司 2009 年 11 月正式对外公开的一门编程语言。 根据 Go 语言开发者自述&#xff0c;近 10 多年&#xff0c;从单机时代的 C 语言到现在互联网时代的 Java&#xff0c;都没有令人满意的开发语言&#xff0c;而 C往往给人的感觉是&a…

机器学习:支持向量机

支持向量机&#xff08;Support Vector Machine&#xff09;是一种二类分类模型&#xff0c;其基本模型定义为特征空间上的间隔最大的广义线性分类器&#xff0c;其学习策略便是间隔最大化&#xff0c;最终可转化为一个凸二次规划问题的求解。 假设两类数据可以被 H x : w T x…

MyBatis框架基础学习(1)

目录 一、MyBatis框架介绍。 &#xff08;1&#xff09;简化开发。 &#xff08;2&#xff09;持久层&#xff1f; &#xff08;3&#xff09;框架的解释&#xff01; 二、JDBC开发缺点。 &#xff08;1&#xff09;硬编码。 &#xff08;2&#xff09;操作繁琐。 三、MyBatis框…