R语言绘制动态网络图Network教程WGCNA

今天分享的笔记是使用NetworkD3对WGCNA的共表达网络进行可视化,创建交互式动态网络图,展示基因之间的相互关系,可以用于转录组或者其他调控网络展示。

加权基因共表达网络分析 (WGCNA, Weighted correlation network analysis)是用来描述不同样品之间基因关联模式的系统生物学方法,可以用来鉴定高度协同变化的基因集,并根据基因集的内连性和基因集与表型之间的关联鉴定候补生物标记基因或治疗靶点。

alt

例如上图展示特异性模块内的基因共表达网络,点的大小和深浅代表该基因在网络中连通性的高低。转录因子用三角形表示, 其他基因用圆形表示。

如何绘制动态网络图?

首先,加载R包和数据,所用到的数据是WGCNA分析得到的输出网络文件,格式是Cytoscape的输入格式,本文的示例数据已上传,留言区回复邮箱,系统自动发送示例数据和全部代码。

library(networkD3)
library(tidyverse)
library(vroom)

df_node <- vroom::vroom("CytoscapeInput-nodes-black.txt")
df_edge <- vroom::vroom("CytoscapeInput-edges-black.txt")

> head(df_node)
# A tibble: 6 × 3
  nodeName  altName   `nodeAttr[nodesPresent, ]`
  <chr>     <chr>     <chr>                     
1 AT1G01010 AT1G01010 black                     
2 AT1G01090 AT1G01090 black                     
3 AT1G01180 AT1G01180 black                     
                  
> head(df_edge)
# A tibble: 6 × 6
  fromNode  toNode    weight direction  fromAltName toAltName
  <chr>     <chr>      <dbl> <chr>      <chr>       <chr>    
1 AT1G69920 AT1G71030  0.445 undirected AT1G69920   AT1G71030
2 AT1G15125 AT1G71030  0.440 undirected AT1G15125   AT1G71030
3 AT1G02920 AT1G71030  0.438 undirected AT1G02920   AT1G71030

df_node文件保存节点信息,df_edge保存边的信息,包括起始位置和结束为止,以及连线的权重大小。这里每个节点可以表示一个基因,节点之间的weight权重值用来表示两个基因之间的关联性。

数据的过滤与筛选

df_edge <- df_edge %>% arrange(-weight) %>% head(100)
# 删除自身和自身相关位点
df_edge <- df_edge[which(df_edge$fromNode != df_edge$toNode),]
networkData <- df_edge[1:2]
simpleNetwork(networkData,linkDistance = 100)

由于基因数量比较多,因此这里先按照权重值进行排序,然后选取前100行,这一步可以根据你的需要设置,也可以按照制定阈值过滤,然后绘制一张简单版本的网络图:

alt

格式转换与重新编码

alt

由于我们WGCNA输出的文件中节点都是通过基因ID来表示,但是绘图时无法直接识别节点ID,需要修改为数字0、1、2...因此,需要对节点进行重新修改。

# 转换格式
df_edge_net <- df_edge[,c(1,2,3)] %>% as.data.frame()
df_node_net <- df_node[,c(1,3)] %>% as.data.frame()

colnames(df_edge_net) <- c("source" ,"target" ,"value")
colnames(df_node_net) <- c("name","group")

# 合并第一列和第二列,并取并集
merged_elements <- union_all(df_edge_net$source,df_edge_net$target) %>% unique()

# 对合并后的元素进行编号
element_numbers <- seq_along(merged_elements)

# 创建一个新的数据框,包含合并的元素和对应的编号
result_df <- data.frame(merged_elements, element_numbers)
result_df$element_numbers <- result_df$element_numbers-1

# 使用映射表更新原始数据框的第一列和第二列
df_edge_net$source <- result_df$element_numbers[match(df_edge_net$source, result_df$merged_elements)]
df_edge_net$target <- result_df$element_numbers[match(df_edge_net$target, result_df$merged_elements)]

经过这一步处理后能够得到两个新的数据框,这就是绘制动态网络图的关键输入数据。在此基础上,我们还可以添加一些额外的信息,比如按照不同的分组将节点赋予不同的颜色,或者根据根据基因之间的正调控和负调控设置连接线的颜色。

# 生成模拟数据
df_edge_net$value <- c(runif(nrow(df_edge_net)/2,0,1),runif(nrow(df_edge_net)/2,0,5))
df_edge_net$color <- c(rep("red",50),rep("green",50))

value值表示节点之间连线的权重大小,可以用来展示两个基因之间的关联程度,该值越大线越粗,关联性越强。

color值可以用来设置连线的颜色,比如设置正调控为红色,负调控为绿色。

除了设置节点与节点之间边的关系,还能设置单个节点的参数,比如通过下面的代码设置节点的大小用来表示基因的表达量,表达量高的基因节点直径越大。还可以用过Type将节点进行分组,比如转录因子为A组,目标基因为B组等等。

df_node_net <- result_df
df_node_net$size <- runif(nrow(df_node_net),0,20)
df_node_net$type <- rep(c("A","B","C"),10000)[1:nrow(df_node_net)]
colnames(df_node_net) <- c("name""group""size","type")

绘制动态网络图

接下来通过调用forceNetwork绘制网络图,将刚刚的两个数据作为输入文件,设置如下参数即可获得结果图。

p <- forceNetwork(Links = df_edge_net, 
             Nodes = df_node_net, 
             Source = "source"
             Target = "target",
             linkColour=df_edge_net$color,
             arrows=TRUE,
             legend=TRUE,
             Value = "value",
             NodeID = "name",
             Group = "type"
             bounded=F,
             opacityNoHover = 0.5,
             linkDistance = 100,
             charge=-500,
             Nodesize='size',
             # radiusCalculation = "Math.sqrt(d.nodesize,2)*5",
             # linkWidth = JS("function(d) { return Math.sqrt(d.value)-4;}"),
             # linkDistance=JS("function(d){return 1/(d.value)*100 }"),
             opacity = 0.9,
             zoom = T,
             fontFamily = "Aril",
             fontSize = 12) 
p
alt

这张图是通过JS实现的,因此支持动态交互,比如将鼠标放在节点上会显示节点名称(基因ID),还可以拖动节点查看与之关联节点。

alt

如果想要将其保存下来,最好的方法是html格式,这样仍具有动态交互属性。

saveNetwork(network = p,file = 'Net.html')

今天分享的内容就到这里,感谢您的阅读,如需本文代码和数据,请把收件邮箱发在评论区,欢迎点赞转发分享。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/566232.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数值分析复习:Richardson外推和Romberg算法

文章目录 Richardson外推Romberg&#xff08;龙贝格&#xff09;算法 本篇文章适合个人复习翻阅&#xff0c;不建议新手入门使用 本专栏&#xff1a;数值分析复习 的前置知识主要有&#xff1a;数学分析、高等代数、泛函分析 本节继续考虑数值积分问题 Richardson外推 命题&a…

Python环境找不到解决方法

Python环境找不到 打开设置&#xff1a;Ctrl Alt S 添加Local Interpreter... 打开System Interpreter&#xff0c;找到本地安装的Python.exe路径&#xff0c;然后一路点OK Trust Project 如果打开工程时&#xff0c;出现如下对话框&#xff0c;请勾选 Trust projects in ...&…

CDN技术:全球化的数字内容快速分发系统

CDN技术&#xff1a;全球化的数字内容快速分发系统 在今天的互联网世界中&#xff0c;内容分发网络&#xff08;CDN&#xff09;技术起着至关重要的作用。它通过全球分布的服务器网络&#xff0c;快速、安全地将内容送达世界各地的用户&#xff0c;极大地提升了网页加载速度和…

使用 ollama 部署最新的Llama 3 70B本地模型

一、ollama是什么? 在本地启动并运行大型语言模型。运行Llama 3&#xff0c;Mistral, Gemma, Code Llama和其他模型。自定义并创建您自己的。 综合优点&#xff1a; 快速下载容器自动运行大模型&#xff0c;现在下载&#xff0c;马上上手。本地利用 cpu 运行大模型&#xff0c…

java:Java中的异常处理

目录 异常的概念与体系结构 异常的概念&#xff1a; 异常的体系结构&#xff1a; 异常的处理方式 防御式编程&#xff1a; 异常的抛出&#xff1a; 异常的捕获&#xff1a; finally&#xff1a; 代码示例&#xff1a; 异常的处理流程 自定义异常类 举例&#xff1a…

【Hadoop3.3.6】数据块副本放置策略及解析EditLog和FsImage

目录 一、摘要二、正文2.1 环境说明2.2 网络拓扑2.3 Hadoop副本放置策略介绍2.4 解析EditLog和Fsimage镜像文件三、小结一、摘要 通过解析存储于NameNode节点上的日志文件EditLog和镜像文件(元数据)Fsimage来反向验证HDFS的数据块副本存放策略,其目的是希望加深对Hadoop的数…

2024HVV在即| 最新漏洞CVE库(1.5W)与历史漏洞POC总结分享!

前言 也快到护网的时间了,每年的护网都是一场攻防实战的盛宴,那么漏洞库就是攻防红蓝双方人员的弹药库,红队人员可以通过工具进行监测是否存在历史漏洞方便快速打点,而蓝队则可以对资产进行梳理和监测历史漏洞,及时处理和修复,做好准备. 下面分享的…

【电控笔记5.4】pwm延迟

PWM延迟 1标准采样法 Td=MCU计算延迟+输出延迟 Tcon=电流控制周期 Ts=PWM载波周期 Td=1.5Ts(6.3节 ) 电流环跟PWM采样周期同步 2修改采样法

YOLOv5改进 | Conv篇 | 利用CVPR2024-DynamicConv提出的GhostModule改进C3(全网独家首发)

一、本文介绍 本文给大家带来的改进机制是CVPR2024的最新改进机制DynamicConv其是CVPR2024的最新改进机制&#xff0c;这个论文中介绍了一个名为ParameterNet的新型设计原则&#xff0c;它旨在在大规模视觉预训练模型中增加参数数量&#xff0c;同时尽量不增加浮点运算&#x…

如何使用 ArcGIS Pro 快速为黑白地图配色

对于某些拍摄时间比较久远的地图&#xff0c;限于当时的技术水平只有黑白的地图&#xff0c;针对这种情况&#xff0c;我们可以通过现在的地图为该地图进行配色&#xff0c;这里为大家讲解一下操作方法&#xff0c;希望能对你有所帮助。 数据来源 教程所使用的数据是从水经微…

kafka 命令行使用 消息的写入和读取 quickstart

文章目录 Intro命令日志zookeeper serverkafka servercreate topic && describe topic Intro Kafka在大型系统中可用作消息通道&#xff0c;一般是用程序语言作为客户端去调用kafka服务。 不过在这之前&#xff0c;可以先用下载kafka之后就包含的脚本文件等&#xff0…

ChromaDB教程

使用 Chroma DB&#xff0c;管理文本文档、将文本嵌入以及进行相似度搜索。 随着大型语言模型 &#xff08;LLM&#xff09; 及其应用的兴起&#xff0c;我们看到向量数据库越来越受欢迎。这是因为使用 LLM 需要一种与传统机器学习模型不同的方法。 LLM 的核心支持技术之一是…

数据库管理-第173期 OceanBase一体化Plus多模融合(20240422)

数据库管理173期 2024-04-22 数据库管理-第173期 OceanBase一体化Plus多模融合&#xff08;20240422&#xff09;1 架构简化2 不止融合2.1 行列混存2.2 多维使用2.3 多模JOIN 3 展望 数据库管理-第173期 OceanBase一体化Plus多模融合&#xff08;20240422&#xff09; 作者&…

Skill Check: Building Blocks for an LLM Application

Skill Check: Building Blocks for an LLM Application

腾讯云轻量2核4G5M服务器优惠价格165元1年,2024年多配置报价单

腾讯云轻量2核4G5M服务器优惠价格165元1年。腾讯云服务器价格表2024年最新价格&#xff0c;轻量2核2G3M服务器61元一年、2核2G4M服务器99元1年&#xff0c;三年560元、2核4G5M服务器165元一年、3年900元、轻量4核8M12M服务器646元15个月、4核16G10M配置32元1个月、8核32G配置11…

vue-element-admin vue设置动态路由 刷新页面后出现跳转404页面Bug 解决方法

做项目时遇到的这个bug&#xff0c;因为除了跳404之外也没太大影响&#xff0c;之前就一直放着没管&#xff0c;现在项目基本功能实现了&#xff0c;转头处理了一下&#xff0c;现在在这里记录一下解决方法 这个bug的具体情况是&#xff1a;设置了动态路由之后&#xff0c;不同…

如何在PostgreSQL中使用索引覆盖扫描提高查询性能?

文章目录 解决方案1. 创建合适的索引2. 确保查询能够使用索引覆盖扫描3. 调整查询以利用索引覆盖扫描4. 监控和调优 示例代码1. 创建索引2. 编写查询3. 检查是否使用索引覆盖扫描4. 调整索引 总结 在PostgreSQL中&#xff0c;索引是提高查询性能的关键工具之一。索引允许数据库…

物理机中没有VMNet1和VMNet8虚拟网卡

控制面板——网络连接——网络适配器 VMware Network Adapter VMnet1 VMware Network Adapter VMnet8 如果没有这两个虚拟网卡&#xff0c;虚拟机的网络会出现问题 # 解决办法-恢复虚拟网卡默认设置 1、下载并打开ccleaner&#xff0c;ccleaner官网&#xff1a;CCleaner M…

【苍穹外卖】HttpClient-快速理解入门

目录 HttpClient-快速理解&入门1. 需求2. 如何使用3. 具体示例4. 大致优点5. 大致缺点 HttpClient-快速理解&入门 1. 需求 在平常访问服务器里面的资源的时候&#xff0c;我们通常是通过浏览器输入网址&#xff08;或者在浏览器点击某个连接&#xff09;这种方式&…

OpenCV杂记(2):图像拼接(hconcat, vconcat)

OpenCV杂记&#xff08;1&#xff09;&#xff1a;绘制OSD&#xff08;cv::getTextSize, cv::putText&#xff09;https://blog.csdn.net/tecsai/article/details/137872058 1. 简述 做图像处理或计算机视觉技术的同学都知道&#xff0c;我们在工作中会经常遇到需要将两幅图像拼…