miRMaker

Introduction

除了miRNA表达数据,各种miRNA相关的知识也强有力地支持了对miRNA功能相互作用的理解。

那些具有许多共同调控靶基因或疾病的miRNAs可能具有相似的功能

一些方法通过考虑实验验证的miRNA-靶标关系来评估miRNA相互作用,评估miRNA功能相互作用的直观方法是通过Jaccard指数(Jaccard index)计算共同靶标的比例。但是,它丢失了大量的相似信息

杰卡德系数(Jaccard Index)

杰卡德系数,又称为杰卡德相似系数,用于比较两个样本之间的差异性和相似性。杰卡德系数越高,则两个样本相似度越高。

一些方法尝试使用基因本体注释或者)蛋白质-蛋白质相互作用(PPI)作为推断miRNA相互作用的靶基因的额外信息。

然而,GO数据库对大量靶基因的注释信息有限,不利于准确评价miRNA相互作用。同时,PPI数据库中存在大量不符合实验有效性的假阳性,这可能会给计算miRNA功能相似性带来偏差。

"Gene Ontology Annotations"(基因本体注释)是一种用于描述基因和蛋白质功能的标准化方法。基因本体是一个系统化的生物学术语表,它将基因和蛋白质的功能划分为三个主要的本体(ontology):分子功能(molecular function)、细胞组分(cellular component)和生物过程(biological process)。

总的来说,Gene Ontology Annotations 提供了一种标准化的方式来描述基因和蛋白质的功能,使得科研人员能够更好地理解生物体内各种生物学过程。

"Protein–protein interactions"(PPIs,蛋白质-蛋白质相互作用)是指在生物体内,两个或多个蛋白质之间发生的相互作用或结合。这种相互作用对于维持细胞结构、调控信号传导、执行代谢途径等生物学过程至关重要。 

总结:

miRNA与疾病的关系提供了miRNA参与疾病发生发展的直接证据,成为评价miRNA功能相互作用的有力选择。 

一种miRNA通常调控多种疾病的发生发展过程,一种疾病与多种miRNA相关。基于疾病的miRNA功能相似度计算的关键是准确评估疾病语义相似度。

Wang等人[23]提出了一种基于疾病有向无环图(DAG)的疾病语义相似度图推理方法。然而,基于DAG的疾病相似性通过平等地评估与根病具有相同距离的疾病的重要性而忽略了特定疾病的语义意义[24]。

因此,要获得高质量的miRNA功能相互作用,必须合理评估和充分利用miRNA-疾病关系中的疾病语义信息。

同时,利用miRNA表达数据和知识库中的信息,有利于构建稳健的miRNA相互作用网络。miRNA表达数据包含了不同样本组之间miRNA协同调控的变化信息。已知的miRNA与疾病的关系为miRNA功能相似性的评价提供了有力的支持。因此,将miRNA协同调控与miRNA功能相似性相结合,可以促进下游网络分析任务的开展,包括潜在的疾病生物标志物的鉴定。

定义基于分子相互作用网络的信息子网络是生物网络分析中的一个重要课题。一些方法采用聚类技术来划分生物网络。一般来说,需要预定义的簇号,但很难确定。一些方法采用启发式策略来识别重要模块。

Zhang等人[26]提出了基于网络的博弈论方法(NGTM),通过在基于博弈论的模块扩展中使用合作博弈论度量(Shapley值)评估特征贡献来识别潜在的癌症子网络生物标志物。但基于启发式的模块识别方法所使用的启发式信息有限,容易陷入局部最优。

与监督学习和无监督学习不同,强化学习(RL)旨在做出最大化长期回报的决策[27]。因此,RL策略可以通过充分探索解空间以获得全局最优结果来为模块生物标志物识别带来更多可能性。

Paim等人[28]尝试使用RL来检测复杂网络中的社区,并提出了Q-Learning [29] for Community Detection(QLCD)方法。网络中的每个节点充当一个代理,从其最近的邻居节点(动作空间)中选择一个节点组成集群。代理节点学习的行动策略,以最大限度地提高网络的模块化。然而,由于QLCD固有的简单动作空间和学习策略不足,在疾病研究中可能无法找到竞争模块。有必要进一步探索强化学习在定义疾病网络生物标志物方面的潜力。

为了有效识别潜在的miRNA疾病生物标志物,提出了基于多视图网络和强化学习的miRNA数据分析方法miRMarker。

  • 基于表达数据构建miRNA协同调控网络。
  • 利用公共知识库中已知的miRNA-疾病关系构建miRNA功能相似性网络。
  • 然后,miRMarker整合两个miRNA网络,并通过强化学习策略定义关键的miRNA模块。

我们通过在9个转录组学数据集上与8种有效的数据分析方法进行比较,验证了miRMarker在疾病样本区分方面的有效性。

此外,我们检查了由miRMarker定义的结直肠癌的潜在miRNA模块生物标志物。实验结果表明miRMarker在确定疾病诊断和预后的重要模块生物标志物方面具有巨大的潜力。

材料和方法

miRMarker由两个主要部分组成:

(i)分别基于miRNA表达数据和miRNA-疾病关系构建miRNA网络,整合两个网络;

(ii)通过强化学习策略定义关键的miRNA模块。图1显示了miRMarker的工作流程。

miRNA表达数据集

在这项研究中,收集了9个miRNA表达数据集,以评估miRMarker的有效性。所有数据集均来自公共数据库Gene Expression Omnibus(GEO),涉及多种疾病,如肝细胞癌、血小板增多症和结直肠癌。

表1给出了9个miRNA表达数据集的详细信息。数据集GSE 41574、GSE 67139、GSE 32273、GSE 34496、GSE 41282和GSE 108153是两类数据集。数据集GSE 31164、GSE 39046和GSE 35834是多类数据集。

我们使用miRBase v22.0将所有人类成熟miRNA名称映射到标准miRNA编号。将代表相同miRNA的探针的表达值平均。

因为同一个miRNA可能会被多个探针检测到,而这些探针的测量结果可能会有一些变化。通过取平均值,可以得到更为稳定和可靠的miRNA表达量。

miRNA与疾病的关系 

从两个最大的知识库miRCancer [20]和miR 2Disease [21]中提取手动策划的miRNA-疾病关系。

miRCancer使用文本挖掘技术从PubMed数据库中的医学文献中提取miRNA-癌症关联,然后手动修改关联。

"miR2Disease提供了从已发表的论文中整理出的miRNA与人类疾病之间的全面调控关联信息。

我们下载了miRCancer(9080个条目,于2022年6月下载)和miR2Disease(2877个条目,于2022年7月下载)的最新版本。

所有人类成熟miRNA的名称都通过miRBase映射到标准miRNA存取号。将关系中的疾病名称映射到MeSH中的规范疾病术语(于2022年7月下载)。

我们整合了miRCancer和miR 2Disease的miRNA-疾病相互作用,并消除了重复条目。最终获得了6099个miRNA与疾病的关系,涉及163种人类疾病。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/255347.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

自清洗过滤器工作原理尺寸选型参数,内部结构,压差开关如何调节

​ 1:全自动自清洗过滤器设备介绍 全自动反冲洗过滤器是水净化过程中不可缺少的处理手段,用于拦截水中的各种杂质,以净化水质或保护系统中其他设备的正常工作。普通网式过滤器因其结构简单、过滤效果好、阻力小而广泛应用于水源过滤、工业循…

【Android Studio】各个版本下载地址

下载地址: https://developer.android.com/studio/archive?hlzh-cn

如何用 Cargo 管理 Rust 工程系列 丁

以下内容为本人的学习笔记,如需要转载,请声明原文链接微信公众号「ENG八戒」https://mp.weixin.qq.com/s/PP9b5cSNd-7IqgNovcrB0A 优化输出 前面已经对 cargo package 工程编译输出了好多遍,发现编译结果打印的信息都包含了这个 unoptimize…

c语言:[输出函数]与[输入函数]|要点简述

一、【输出函数】 printf() 与 puts()的不同点 1、printf()函数 printf()支持单个字符%c的输出,以及字符串%s的输出。 (1)如果是以%c的形式输出,是一个字符一个字符的输出。因此,要用一个循环语句,把字符逐个输出。 (2)而用%…

Unity与Android交互通信系列(2)

在上一篇文章中,我们介绍了Unity和Android交互通信的原理及在Unity中直接调用Java代码的方式,但没有给出代码示例,下面通过实际例子演示上篇文章中AndroidJavaClass、AndroidJavaObject两个类的基本用法,由于交互通信涉及到两端&a…

查看知乎数学公式Tex源码的方法

首先使用F12打开开发者工具,再使用元素选择器选中要查看的公式。 在源码对应位置附近可以看到一个类型为 math/tex 的 script,如果没找到可以展开目录查找。

网络时间服务器

本章主要介绍网络时间服务器。 使用chrony配置时间服务器 配置chrony客户端向服务器同步时间 1 时间同步的必要性 一些服务对时间要求非常严格,例如,图所示的由三台服务器搭建的ceph集群。 这三台服务器的时间必须保持一致,如果不一致&#…

若依打包将vue放到.jar里面部署

1.vue静态文件,以及单页面 ruoyi-admin\src\main\resources\static \ruoyi-admin\src\main\resources\templates 2.后台开放白名单 "/cms", "/cms#/login" 3. mvc访问vue页面入口,接口 package com.ruoyi.web.controller.syst…

08_CSS定位与综合案例开发

day08_CSS定位与&综合案例开发 Objective(本课目标) 理解什么是定位能说出为什么要用定位 1. 为什么使用定位 标准流在最底层 (海底) ------- 浮动的盒子在中间层 (海面) ------- 定位的盒子 在 最上层 (天空) 小黄色块在…

软件测试面试八股文,最常见的7个高频面试题(附答案,建议收藏)

问题1:请自我介绍下? 核心要素:个人技能优势工作背景经验亮点 参考回答: 第一种:基本信息离职理由 面试官您好,我叫张三,来自番茄市,在软件测试⾏业有 3 年的⼯作经验。做过 Web…

算法——动态规划(DP,Dynamic Programming)

一、基础概念 DP的思想: 把问题分成子问题,前面子问题的解决结果被后面的子问题使用DP与分治法的区别: 分治法把问题分成独立的子问题,各个子问题能独立解决 自顶向下DP前面子问题的解决结果被后面的子问题使用,子问题…

3090K MOSFET N通道沟槽功率 PWM应用

3090K 采用沟槽技术&#xff0c;提供活x氧(导通)&#xff0c;低栅J电荷和栅J电压低至4.5V的工作。3090K 设备适用于各种应用。 3090K 特性&#xff1a; ● VDS 30V,ID 86A RDS(ON) < 5 mΩ VGS 10V RDS(ON) < 9.5mΩ VGS 4.5V ● 高功率和电流处理能力 ● 获得无…

【性能测试】基础知识篇-压力模型

常见压力模式 并发模式&#xff08;即虚拟用户模式&#xff09;和RPS模式&#xff08;即Requests Per Second&#xff0c;每秒请求数&#xff0c;吞吐量模式&#xff09;。 本文介绍这两种压力模式的区别&#xff0c;以便根据自身业务场景选择更合适的压力模式。 并发模式 …

C++面向对象(OOP)编程-模板

本文主要讲解C的模板&#xff0c;其中包括模板的分类&#xff0c;函数模板和类模板&#xff0c;以及类模板与友元函数关系引起的几种关系。强调提供代码来搞懂C模板这一泛型编程手段。 目录 1 C模板 2 模板的本质 3 模板分类 4 函数模板 4.1 函数模板定义格式 4.2 函数模…

下午好~ 我的论文【遥感】(第一期)

写在前面&#xff1a;下午浑浑噩噩&#xff0c;泡杯茶&#xff0c;读篇论文吧 首先说明&#xff0c;时间有限没有那么精力一一回复了&#xff0c;对不起各位了TAT 文章目录 遥感Bi-Dilation-formerCNN-GNN-FusionMulti-hierarchical cross transformerCoupled CNNs 遥感 Bi-D…

Linux---Ubuntu软件安装

1. 软件安装的介绍 Ubuntu软件安装有两种方式: 离线安装(deb文件格式安装&#xff09;在线安装(apt-get方式安装) 2. deb文件格式安装 是 Ubuntu 的安装包格式&#xff0c;可以使用 dpkg 命令进行软件的安装和卸载。 命令说明dpkg安装和卸载deb安装包 dpkg命令选项: 选项…

TestSSLServer4.exe工具使用方法简单介绍(查SSL的加密版本SSL3或是TLS1.2)

一、工具使用方法介绍 工具使用方法参照&#xff1a;http://www.bolet.org/TestSSLServer/ 全篇英文看不懂&#xff0c;翻译了下&#xff0c;能用到的简单介绍如下&#xff1a; 将下载的TestSSLServer4.exe工具放到桌面上&#xff0c;CMD命令行进入到桌面目录&#xff0c;执…

Kafka--从Zookeeper数据理解Kafka集群工作机制

从Zookeeper数据理解Kafka集群工作机制 这一部分主要是理解Kafka的服务端重要原理。但是Kafka为了保证高吞吐&#xff0c;高性能&#xff0c;高可扩展的三高架构&#xff0c;很多具体设计都是相当复杂的。如果直接跳进去学习研究&#xff0c;很快就会晕头转向。所以&#xff0c…

Java小案例-RocketMQ的11种消息类型,你知道几种?(死信消息)

前言 在RocketMQ中&#xff0c;死信消息&#xff08;Dead-Letter Message&#xff09;是指那些在正常情况下无法被消费者消费的消息。这些消息会被存储在死信队列&#xff08;Dead-Letter Queue&#xff0c;简称DLQ&#xff09;中。 死信消息的特性包括&#xff1a; 不会再被…

如何免费搭建私人电影网站(一)

前言&#xff1a;在线看电影经常会出现烦人的广告&#xff0c;为了不浪费时间看广告&#xff0c;有必要做自己的专属网站。 准备工作&#xff1a; 1、申请免费域名&#xff08;也可以花钱注册域名相对稳定&#xff09;链接: 申请免费域名方法 2、申请免费主机&#xff08;也可以…