蛋白质致病突变的计算方法(四)

3.1.5 域定位 (domain location)

残基在序列中的位置可分为N-terminal(1-30%)、中间(31-70%)和C-terminal(71-100%)。Singh等人报告称,TP53的中心和高度保守的DNA结合域包含一簇体细胞错义突变,包括R175、G245、R248和R273。这些突变形成与DNA的直接接触,并有助于维持蛋白质的三级结构。同样,P152L突变发生在S3/S4转向,与突变p53的DNA结合面相反,导致DNA结合域的构象变化(conformation change)。在EGFR中(图3),大多数突变位于细胞内区域(残基669-1210),该区域包含酪氨酸激酶和细胞质结构域。这些域因其在激活下游信号和调节EGFR功能方面的关键作用而闻名,该突变已在多种癌症类型中检测到,包括B-cell淋巴瘤和肿瘤发生中的多种信号通路。在其他基因如asPIK3CA, PTEN, EGFR和KRAS中也报道了类似的数据。

(举这些例子的目的是通过具体的案例来说明在不同蛋白质中突变的位置和性质可能导致的不同影响,以及这些影响可能如何与癌症的发生和发展相关联)

     图3 细胞内区域EGFR (PDB id: 2EB2)的驱动基因(红色)和乘客基因(绿色)突变。

3.1.6 PSSM

PSSM (Profiles)是生物学中解码蛋白质序列进化信息的重要特征之一。它利用了从PSI-BLAST获得的多序列比对,该比对对保守位置赋予了较高的权重。在第一次迭代中生成PSSM,用于在后续迭代中搜索序列的新匹配。该过程重复多次迭代以获得最终矩阵。

之前写过一个计算的方法:
Blast生成蛋白质序列位置特异性矩阵-PSSM矩阵详细版_pssm blast-CSDN博客

python 服务器批处理得到PSSM矩阵_python语言如何获取未知蛋白质序列的pssm矩阵-CSDN博客

3.1.7 突变矩阵

突变矩阵是一个氨基酸替代矩阵(20*20矩阵),其中每个元素显示了取代其他19个残基的比率、偏好和概率。常用的矩阵有点接受变异矩阵(PAM)和块替换矩阵(BLOSUM)。PAM矩阵是根据观察到的密切相关蛋白质的高度可变和保守区域沿其整个长度的变化计算出来的(Dayhoff等,1978)。通过对同源序列高度保守区域的氨基酸置换得到blossom matrix 。此外,利用大量不同的蛋白质序列集,并根据大型预对齐的成对序列比对迭代评估替换率和进化距离,开发了几个突变矩阵。此外,已经报道了针对特定基因组或蛋白质家族的特殊基质,以及恶性疟原虫和约利疟原虫的富集基因组,整合膜蛋白, β-桶跨膜蛋白,G蛋白偶联受体的视紫红质家族,蛋白质-蛋白质相互作用网络的枢纽蛋白和本质紊乱蛋白。AAindex数据库中包含了这些突变矩阵,可以作为识别致病突变的重要特征。

3.1.8 保守性得分

一个残基的保守性得分揭示了在不同同源序列中同一位点出现相同残基的趋势。Valdar开发了一个web服务器AACon,它可以计算18个不同的保护分数,其中包括DNA结合和膜区域的特定分数。守恒计算服务器的例子arePhyloP、PhastCons 、AL2CO、FATHMM 和Consurf 。这些服务器有助于了解同源序列之间的系统发育(phylogenetic)关系,并识别功能/结构上重要的位点。

(具体的计算方法没有涉及过,这周应该会尝试一下,如果success,会更~)

3.1.9基于氨基酸基团的相邻残基信息

根据氨基酸的物理化学性质,将20个氨基酸残基分为脂肪族、芳香族、极性、含硫、负电荷和正电荷。两边的这些残基组的偏好。突变体位置在特定窗口长度内的变化。

(我觉得这个有点像蛋白质的一些描述子的方法,比如联合三元组(CT)、自协方差(AC)自相关描述符(AD)、局部描述子(LD)、多元互信息(MMI),这些的计算方法可以参考:
https://github.com/xueleecs

LD(Local descriptor)_ld和蛋白质序列-CSDN博客 )

3.2 基于结构的特征

利用实验已知或预测的三维结构来计算几个特征。web服务器PDBparam提供了四类基于结构的参数,即(1)结合位点,(2)残基间相互作用,(3)二级结构的倾向(propensity),(4)物理化学性质评估。具体特征包括氨基酸残基的二级结构,残基之间的氢键,每个残留物的可及表面积,长程顺序和周围疏水性。

(这一部分现在的热点应该是alphafold 、Rosetta以及MD,这一部分在尝试)

3.3 基于网络的特征

基于网络的特征包括度和介数中心性、聚类系数、特征向量和紧密度。度中心性衡量的是网络中一个蛋白质(或氨基酸)与其他蛋白质(或氨基酸)相互作用的次数,而介数中心性衡量的是一个蛋白质在网络中充当其他蛋白质(或氨基酸)之间桥梁的次数。Drivers 通常被发现具有高度的中心性和介数中心性,因为它们参与了许多对疾病进展重要的相互作用。图神经网络(GNNs)和基于接触图的特征被用于学习分子结构的表示。

(接触图了解过,可以找机会整理下,其他的还没了解)

(今天发现好多需要回顾的东西……)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/567061.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Docker 部署 WordPress 并完成建站

什么是 WordPress WordPress 是使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设属于自己的网站。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一款个人博客系统,并逐步演化…

DC-DC电源设计中电感选型详解

电感参数: DC-DC 电感选型步骤: 1, 根据 DC-DC 的输入输出特性计算所需的最小电感量。 (1)对于 Buck 型 DC-DC,计算公式如下 Lmin= 【Vout*(1-Vout/Vinmax)】/ (Fsw*Irpp ) 其中: Vinmax = maximum input voltage Vout = output voltage fsw = switching frequency…

第二届阿里巴巴大数据智能云上编程大赛亚军比赛攻略_北方的郎队

关联比赛: 第二届阿里巴巴大数据智能云上编程大赛-智联招聘人岗智能匹配 查看更多内容,欢迎访问天池技术圈官方地址:第二届阿里巴巴大数据智能云上编程大赛亚军比赛攻略_北方的郎队_天池技术圈-阿里云天池

Pytorch:张量的梯度计算

目录 一、自动微分简单介绍1、基本原理2、梯度计算过程3、示例:基于 PyTorch 的自动微分a.示例详解b.梯度计算过程c.可视化计算图 4、总结 二、为什么要计算损失,为何权重更新是对的?1、梯度下降数学原理2、梯度上升 三、在模型中使用自动微分…

Qt 菜单栏上手教程:QMenuBar QMenu QToolbar

引言 在Qt框架中,QMenuBar、QMenu、QToolbar和QAction都是用于构建应用程序界面中的用户交互元素。 QMenuBar 是什么:QMenuBar是一个用于创建横向菜单栏的类。在桌面应用程序中,它通常位于窗口的顶部。应用场景:当您需要一个包含…

CTF小工具

1 ciphey https://github.com/Ciphey/Ciphey Ciphey 是一个使用自然语言处理和人工智能的全自动解密/解码/破解工具。 简单地来讲,你只需要输入加密文本,它就能给你返回解密文本。就是这么牛逼。 有了Ciphey,你根本不需要知道你的密文是哪…

ros2_control【B站WMGIII教学学习记录】1

资源 https://www.bilibili.com/video/BV1ku411G7UR? 学习过程中存在bug,记录一下 1 Q:"package ‘joint_state_publisher_gui’ not found, searching: [/home A: sudo apt install ros-humble-joint-state-publisher2 https://fishros.org.cn/forum/to…

如何高效的压缩GIF图片?一键搞定GIF动图压缩 就是这么简单

一,引言 压缩GIF动图是一个常见的需求,无论是在社交媒体上分享动态表情,还是在网页设计中添加动态元素,GIF动图都扮演着重要的角色。然而,过大的GIF文件大小可能会导致加载速度慢,影响用户体验。因此&…

Github首页美化(updating)

Github首页美化 https://github.com/QInzhengk一、新建仓库二、美化Github首页主页访问量统计仓库状态统计常用语言占比统计社交链接 界面展示 https://github.com/QInzhengk 一、新建仓库 对Github首页进行美化,需要新建一个仓库名和自己 Github 用户名相同的仓库…

YOLC: You Only Look Clusters for Tiny Object Detection in Aerial Images

摘要 由于以下因素,从航拍图像中检测物体面临着重大挑战:1)航拍图像通常具有非常大的尺寸,通常有数百万甚至数亿像素,而计算资源有限。2)物体尺寸较小导致有效信息不足,无法进行有效检测。3)物体分布不均匀导致计算资源浪费。为了解决这些问题,我们提出YOLC(You Onl…

Python ADTK库:时间序列异常检测的利器

更多Python学习内容:ipengtao.com ADTK(Anomaly Detection Toolkit)是一个用于时间序列异常检测的Python库,提供了多种算法和工具,帮助用户识别和分析时间序列数据中的异常点和趋势变化。本文将详细介绍ADTK库的功能、…

2024年学浪视频怎么缓存

2024年已经到来,越来越多的人开始购买学浪视频,然而一些课程的时间限制使得许多人希望能够永久保存这些宝贵的学习资源。幸运的是,本文将向大家介绍一个解决方案——使用小浪助手工具来下载学浪视频,以便随时随地享受学习的乐趣。…

C++实战演练---负载均衡在线oj项目预热

顾得泉:个人主页 个人专栏:《Linux操作系统》 《C从入门到精通》 《LeedCode刷题》 键盘敲烂,年薪百万! 前言 学习准备了快一年时间,心心念念的实战演练终于可以开始了,话不多说,直接进入主题…

从构成看自来水厂自动化控制系统的创新与发展

自来水厂自动化控制系统涵盖了多个关键组成部分,包括水管理云平台、供水监控系统以及供水调度平台。 系统内嵌了一系列自主创新的核心算法,这些算法结合了数学建模、机器仿真和流体力学等多元数据模型,以优化设备间的关联和控制关系&#xf…

Midjourney-01 初试上手 注册使用并生成你的第一张AI图片 详细流程 提示词 过程截图 生成结果 付费文生图的天花板!

背景介绍 Midjourney是一款基于人工智能技术的绘画软件,利用深度学习算法来辅助用户进行绘画创作。这款软件能够通过用户输入的文本描述生成图像,支持多种生成方式,包括文字生成图片、图片生成图片和混合图片生成图片。 图像生成方式&#…

华为外派伊拉克,一天补助6000元

大家好,我是YUAN哥! 最近有朋友询问关于华为外派伊拉克的补助情况,听说一天能拿到6000元,这听起来相当诱人,但真实性有待考证。 据我所知,华为对艰苦地区的外派员工确实有补助,但最高一天是100美…

Proxmox VE 实现企业微信通知

前言 主要实现获取系统信息发送给企业微信机器人。 企业微信机器人自动化获取PVE系统信息脚本编写 生成FIGlet和AOL宏字体 参考最终实现获取系统信息,获取到的信息发送给企业微信机器人进行输出企业微信机器人创建参考 更改以下脚本企业微信机器人地址企业微信机…

数控6面钻的优缺点

在木工、家具制造和建筑行业中,数控6面钻已成为一种革命性的工具。这种先进的机器以其高效、精准和多功能性受到了广大制造商的青睐。然而,就像任何技术产品一样,数控6面钻也有其优缺点。在本文中,我们将深入探讨数控6面钻的优缺点…

如何在React中构建动态下拉组件 - 解释React复合组件模式

下拉菜单长期以来一直是网站和应用程序中的重要组成部分。它们是用户交互的默默英雄,通过简单的点击或轻触默默地促进着无数的操作和决策。 今天你可能已经遇到了其中之一,无论是在你最喜爱的在线商店上选择类别,还是在注册表单上选择你的出…

106短信群发平台如此火热究竟有没有效?

106短信群发平台之所以如此火热,确实是因为它在多个方面展现出了显著的有效性。 首先,从发送速度和到达率来看,106短信平台表现优秀。无论是节假日还是平日,其发送速度都能保持在一个较快的水平,这对于验证码短信、通…