R高级绘图 | P1 | 带边缘分布散点图 | 代码注释 + 结果解读

新系列 —— R高级绘图,准备整理所有曾经绘制过的图图和未来需要的图图们的代码!预计这个系列会囊括所有常见图形,只提供高级绘图代码,基础绘图主要在 R语言绘图 系列中进行介绍,这个系列咱们主打:需要XX图?没问题!来这里!找到你要画的图!点进去!直接复制粘贴RUN!

更新顺序随机,小伙伴们有急需想要的图图也可以后台告诉我!我给它优先更新!

带边缘分布散点图

带边缘分布散点图(Scatter Plot with Distribution Plots),用于同时显示两个变量的散点分布以及每个变量的边缘分布。它将散点图与边缘直方图或核密度估计图结合起来,提供了更全面的数据分析视角。在这种图中,通常沿着图的边缘或周围绘制边缘直方图核密度估计图,以显示每个变量的分布情况,而散点图则展示了两个变量之间的关系。

带边缘分布散点图经常用于展示两个生物学特征之间的关系,并且可以提供关于每个特征的单独分布的信息。以下是一些在生物信息学领域中使用带边缘分布散点图的常见应用:

  1. 基因表达和关联分析: 通过在横轴和纵轴上分别表示两个基因的表达水平,可以使用带边缘分布散点图来展示它们之间的相关性。这有助于发现共表达基因、检测共调控模式以及了解基因表达的整体分布。
  2. 疾病与基因关联: 用于研究基因与特定疾病之间的关联。例如,可以将基因的变异情况与患病状态绘制在散点图上,同时在边缘显示基因变异和患病状态的分布情况。
  3. 蛋白质-蛋白质相互作用网络: 在蛋白质组学研究中,可以使用带边缘分布散点图来可视化蛋白质之间的相互作用关系。横轴和纵轴上的变量可能分别表示两个蛋白质的特定性质,而散点图的模式和趋势有助于了解它们之间的相互作用。
  4. 突变和表达关系: 当研究基因突变与基因表达之间的关系时,带边缘分布散点图可以用于同时显示突变信息和基因表达水平,例如,可以将基因表达量在横轴上表示,基因突变情况在纵轴上表示,并在边缘绘制基因表达和突变的分布,这有助于发现突变与表达之间的关联。
  5. 单细胞: 在单细胞研究中,带边缘分布散点图可以用于可视化单细胞表达谱中不同细胞群体之间的关系,同时提供每个基因的边缘表达分布信息。
  6. ……(让我们聪明的小脑瓜子自由发挥吧!!!)

总的来说,带边缘分布散点图提供了一个直观的方式来同时观察两个变量之间的关系及其各自的分布情况,可用于多种分析,包括基因表达、相互作用网络、突变与表达关系等,有助于我们发现两个生物学特征之间潜在的关联和模式。

绘图代码

这里,我们使用了 ggplot2 包来创建带边缘分布的散点图,所用数据集为R自带的iris数据集(大家替换为自己的数据即可,记得与示例数据格式保持一致),其中展示了Sepal.LengthSepal.Width之间的关系,同时通过颜色区分了不同物种,也就是Species

首先绘制散点图

# 带边缘分布散点图(Scatter Plot with Distribution Plots)

# 我们使用R自带的iris数据集
head(iris)
#   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
# 1          5.1         3.5          1.4         0.2  setosa
# 2          4.9         3.0          1.4         0.2  setosa
# 3          4.7         3.2          1.3         0.2  setosa
# 4          4.6         3.1          1.5         0.2  setosa
# 5          5.0         3.6          1.4         0.2  setosa
# 6          5.4         3.9          1.7         0.4  setosa

# 其中包含3个物种,每个物种包含50个样本
table(iris$Species)
# setosa versicolor  virginica 
#     50         50         50 

# 首先绘制散点图
p <- 
  # 指定数据集为iris,x轴为Sepal.Length,y轴为Sepal.Width,同时用颜色表示不同的物种
  ggplot(iris, aes(Sepal.Length, Sepal.Width, color = Species)) +
  
  # 添加散点图层,设置点的大小为4
  geom_point(size = 4) + 
  
  # 添加图表标签
  labs(
    title = 'Scatterplot with Edge Distribution',    # 标题,自己给图片起个名!
    subtitle = 'IRIS: Sepal.Length vs Sepal.Width',  # 副标题,展示两个变量是什么!
    caption = 'source: IRIS'   # 节标题,这里我们展示了图表来源!
  ) +
  
  # 设置颜色,不同颜色表示不同物种
  scale_color_manual(values = c("#025259", "#d94f04", "#f29325")) +
  
  # 设置主题为极简主题,并指定基础字体大小为14
  theme_minimal(base_size = 14) +
  
  # 设置绘图区域背景颜色为白色,并将图例放在底部,当然,咱想放哪放哪!随心所欲!
  theme(plot.background = element_rect(fill='white', color='white'),
        legend.position = 'bottom')
p

图形解读:

  1. 散点分布: 散点图展示了Sepal.LengthSepal.Width两个变量之间的关系。每个点代表iris数据集中的一个观测值,横轴是Sepal.Length,纵轴是Sepal.Width。通过观察散点的分布,可以初步判断这两个变量之间是否存在某种趋势或者模式。
  2. 颜色区分: 每个点通过颜色进行分类,颜色表示不同的物种。通过scale_color_manual函数设置了颜色映射,不同的颜色分别代表不同的物种。这样的颜色映射可以帮助我们直观地辨认出每个点所属的类别。
  3. 点的大小: 所有的点都使用了相同的大小,这可能是为了确保所有点在图中都有相似的可见性。点的大小通常可以用来突出重要的观测值或者显示数据的某些特性。

添加边缘分布图形

# 添加边缘分布图形

# 使用ggMarginal在散点图p上添加边缘分布图形

# 加载包,没安装的记得装一下哟!
library(ggExtra)

# 添加直方图类型的边缘分布图
p1 <- ggMarginal(p, type = "histogram", groupColour = TRUE, groupFill = TRUE, alpha = 0.7)
p1

# 函数解读:
# - `ggMarginal`: 用于在原始图上添加边缘分布图形的函数。
# - `type = "histogram"`: 指定了边缘分布图的类型为直方图。
# - `type = "density"`: 指定了边缘分布图的类型为核密度估计图。
# - `type = "boxplot"`: 指定了边缘分布图的类型为箱线图。
# - `type = "densigram"`: 指定了边缘分布图的类型为联合密度图。
# - `groupColour = TRUE`: 设置边缘分布图中的颜色与散点图中的颜色一致
# - `groupFill = TRUE`: 设置边缘分布图中的颜色与散点图中的颜色一致,并且填充颜色
# - `alpha = 0.7`: 设置图形的透明度,增加图形的可读性。

# 添加核密度估计图类型的边缘分布图
p2 <- ggMarginal(p, type = "density", groupColour = TRUE, groupFill = TRUE, alpha = 0.7)
p2

# 添加箱线图类型的边缘分布图
p3 <- ggMarginal(p, type = "boxplot", groupColour = TRUE, groupFill = TRUE, alpha = 0.7)
p3

# 添加联合密度图类型的边缘分布图
p4 <- ggMarginal(p, type = "densigram", groupColour = TRUE, groupFill = TRUE, alpha = 0.7)
p4

漂亮!!!

添加拟合线

如果你关注的是两个变量之间的相关性,比如两个基因表达水平之间或者某基因与疾病状态之间,这样就需要在散点图中添加拟合线,使用stat_smooth(method = lm, level = 0.99)即可实现。

添加拟合线时要注意是否需要不同组别(我们所用的数据中指不同物种)分别进行拟合,我们这里给大家演示一下。

# 添加拟合线
p <- 
  # 指定数据集为iris,x轴为Sepal.Length,y轴为Sepal.Width,同时用颜色表示不同的物种
  ggplot(iris, aes(Sepal.Length, Sepal.Width, color = Species)) +
  
  # 添加散点图层,设置点的大小为4
  geom_point(size = 4) + 
  
  # 添加拟合线,
  stat_smooth(method = lm, level = 0.99) +
  # `method = lm`: 设置平滑曲线的拟合方法为线性回归,我们也可以选择其他方法!
  # `se = F`: 设置不显示平滑曲线的标准误差带。
  # `level = 0.99`: 当采用线性回归方法拟合平滑曲线时,`level` 参数表示置信区间的水平。
  
# 添加图表标签
  labs(
    title = 'Scatterplot with Edge Distribution',    # 标题,自己给图片起个名!
    subtitle = 'IRIS: Sepal.Length vs Sepal.Width',  # 副标题,展示两个变量是什么!
    caption = 'source: IRIS'   # 节标题,这里我们展示了图表来源!
  ) +
  
  # 设置颜色,不同颜色表示不同物种
  scale_color_manual(values = c("#025259", "#d94f04", "#f29325")) +
  
  # 设置主题为极简主题,并指定基础字体大小为14
  theme_minimal(base_size = 14) +
  
  # 设置绘图区域背景颜色为白色,并将图例放在底部
  theme(plot.background = element_rect(fill='white', color='white'),
        legend.position = 'bottom')
p

p4 <- ggMarginal(p, type = "densigram", groupColour = TRUE, groupFill = TRUE, alpha = 0.7)
p4

哒哒哒!每个组别都拟合就会是这样子!所以如果你只有一个组,那图图肯定就很简单明了!快去试试吧!

但其实,还有一种更简单的方法!一个函数就能搞定!

为了方便大家复现,我们还是用iris数据集进行演示,大家可以将Sepal.LengthSepal.Width两个变量想象为你关注的两个基因你关注的某基因与可能相关的疾病

# 加载包,没安装的记得装一下哟!
library(ggstatsplot)

# 使用ggscatterstats创建带有边缘分布图的散点图
ggscatterstats(
  data = iris,                  # 使用iris数据集
  x = Sepal.Length,             # 设置x轴为Sepal.Length列的数据
  y = Sepal.Width,              # 设置y轴为Sepal.Width列的数据
  xlab = "Sepal Length",        # 设置x轴标签为"Sepal Length"
  ylab = "Sepal Width",         # 设置y轴标签为"Sepal Width"
  marginal = TRUE,              # 在图上添加边缘分布图
  marginal.type = "histogram",  # 边缘分布图的类型为直方图
  centrality.para = "mean",     # 在边缘分布图上显示中心趋势,使用均值
  margins = "both",             # 显示上下和左右两侧的边缘分布图
  title = "Relationship between Sepal Length and Sepal Width",    # 设置整个图的标题
  messages = FALSE,             # 禁用输出关于平均值和置信区间的消息
)

哇!是不是你想要的嘞!


那今天的分享就到这里啦!我们下期再见哟!

最后顺便给自己推荐一下嘿嘿嘿!

如果我的分享对你有用的话,欢迎关注点赞在看转发分享阿巴阿巴阿巴阿巴巴巴!这可是我的第一原动力!

蟹蟹你们的喜欢和支持!!!

啊对!如果小伙伴们有需求的话,也可以加入我们的交流群:一定要知道 | 我们的生信交流群终于来啦!

还有兴趣的话,也可以看看我掏心掏肺的干货满满 | 给生信小白的入门小建议 | 掏心掏肺版!绝对干货满满!

后续这个链接可能会更新,如果小伙伴点开它之后发现,咦,怎么失效啦!不要慌!咱们辛苦一下动动小手去公众号主页的作者精选那里,会有一篇同名的文章,点进去就是啦!

参考资料
  1. https://zhuanlan.zhihu.com/p/654728525
  2. https://zhuanlan.zhihu.com/p/627088942

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/361520.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数学公式OCR识别php 对接mathpix api 使用公式编译器

数学公式OCR识别php 对接mathpix api 一、注册账号官网网址&#xff1a;https://mathpix.com 二、该产品支持多端使用注意说明&#xff08;每月10次&#xff09; 三、api 对接第一步创建create keyphp对接api这里先封装两个请求函数&#xff0c;get 和post &#xff0c;通过官方…

Kotlin快速入门系列11

Kotlin的集合 集合类 Java类库有一套相当完整的容器集合类用来持有对象。跟Java一样&#xff0c;集合类存放的都是对象的引用&#xff0c;而非对象本身(我们经常说的集合指的是集合中对象的引用)&#xff0c;Kotlin的集合类是在Java的集合类库基础上进行的优化&#xff0c;新引…

拥抱变局,坚韧向新|复旦大学-华盛顿大学EMBA项目C20毕业典礼

12月初&#xff0c;复旦大学-华盛顿大学EMBA项目20班的学员们前往美国&#xff0c;完成了项目最后一次移动课堂&#xff0c;并在奥林商学院举办了毕业典礼。      20班的学员们在项目20周年之际入学&#xff0c;也是疫情以来第一个正式恢复线下授课的班级。虽然经历了一些波…

《二叉树》——3(层序遍历)

目录 前言&#xff1a; 层序遍历: 解析&#xff1a; 前言&#xff1a; 本文主讲链式二叉树的层序遍历&#xff0c;在前面的张篇blog我们初步实现了链式二叉树递归部分的内容&#xff0c;对于递归算法的学习和思维方式我们仍然需要不断加强&#xff0c;所以将对链式二叉树进行…

Docker本地部署Firefox浏览器并结合内网穿透公网访问

文章目录 1. 部署Firefox2. 本地访问Firefox3. Linux安装Cpolar4. 配置Firefox公网地址5. 远程访问Firefox6. 固定Firefox公网地址7. 固定地址访问Firefox Firefox是一款免费开源的网页浏览器&#xff0c;由Mozilla基金会开发和维护。它是第一个成功挑战微软Internet Explorer浏…

Python pip 不是内部或外部命令...

文章目录 1 问题截图2 解决办法2.1 配置环境变量2.2 试试 pip3 3 扩展分析3.1 查询 Python 版本及位数3.2 查询 Python 安装路径3.3 查询当前 pip 的版本 1 问题截图 2 解决办法 2.1 配置环境变量 2.2 试试 pip3 根据安装的 Python 版本不同&#xff0c;使用的 pip 也会不同若…

ESP8266 AP配网

首先引入需要的库 #include <WiFiManager.h> // https://github.com/tzapu/WiFiManager 在setup() 方法中设置网络名称等待登录连接 void setup(){Serial.println("Wait for Smartconfig");WiFi.mode(WIFI_STA);WiFiManager wm;bool res;res wm.autoConnec…

基础小白快速入门python------Python程序设计结构,循环

循环在计算机中&#xff0c;是一个非常重要的概念&#xff0c;是某一块儿代码的不断重复运行&#xff0c;是一种逻辑思维 在编程中的体现&#xff0c;运用数学思维加代码结合加数据&#xff0c;就构成了一个循环。 在Python中&#xff0c;循环主要分为三大类 for循环 while循…

面试必考精华版Leetcode450. 删除二叉搜索树中的节点

题目&#xff1a; 代码&#xff08;首刷看解析&#xff09;&#xff1a; class Solution { public:TreeNode* deleteNode(TreeNode* root, int key) {if(rootnullptr){return nullptr;}if(root->val > key ){root->left deleteNode(root->left,key);return root;…

EXCEL VBA实现重复字段出现次数并列显示

EXCEL VBA实现重复字段出现次数并列显示 Sub dotest() Dim arr, dApplication.ScreenUpdating FalseSet d CreateObject("Scripting.Dictionary")With Sheets("Sheet2")r .Cells(.Rows.Count, "a").End(xlUp).Rowarr .[a1].Resize(r, 1)En…

幻兽帕鲁服务器多少钱?服务器租借价格一览表

2024年幻兽帕鲁服务器价格表更新&#xff0c;阿里云、腾讯云和华为云Palworld服务器报价大全&#xff0c;4核16G幻兽帕鲁专用服务器阿里云26元、腾讯云32元、华为云26元&#xff0c;阿腾云atengyun.com分享幻兽帕鲁服务器优惠价格表&#xff0c;多配置报价&#xff1a; 幻兽帕鲁…

福布斯财富增长榜前十富豪身价暴增3.5万亿!他们致富的秘诀究竟是?

按照《福布斯》最新的数据显示&#xff0c;今年全球前十位财富增长最多的富豪的身家总共增加了4900亿美元&#xff08;约3.5万人民币&#xff09;&#xff0c;大家可能对于3.5万亿没什么概念&#xff0c;但是换算一下&#xff0c;中国一共才14亿人&#xff0c;如果把这3.5万亿平…

测试环境搭建整套大数据系统(二:安装jdk,mysql)

一&#xff1a;安装JDK 参考 https://blog.csdn.net/weixin_43446246/article/details/123328558 二&#xff1a;安装mysql 1.因为我们安装cdh6.3.2。cdh支持的是5.6和5.7版本的mysql。 2. 步骤 wget https://downloads.mysql.com/archives/get/p/23/file/mysql-server_5.7.…

基于Android的成人教育课程学习考试系统uniAPP的 小程序_12lo1

APP性能需求 &#xff08;1&#xff09;会员在安卓App页面各种操作可及时得到反馈。 &#xff08;2&#xff09;该平台是提供给多个会员使用的平台&#xff0c;会员使用之前需要注册登录。登录验证后&#xff0c;会员才可进行各种操作[10]。 &#xff08;3&#xff09;管理员用…

书写触感细腻的电容触控笔,透明造型超好看,西圣Pencil2上手

iPad在配上手写笔之后&#xff0c;才能才能充分发挥优势&#xff0c;实现除看视频之外的更多功能。很多人入手iPad的初衷都是工作或者学习&#xff0c;如果只拿来观剧或玩游戏就太浪费了。当然了&#xff0c;现实情况下&#xff0c;Apple Pencil高昂的定价也是很多人望而却步的…

Android组件化中的Arouter学习

假设现在有两个业务组件登录和问答模块之间需要进行通信&#xff0c;可能会想到用反射的方式&#xff0c;是可以但是会影响性能&#xff0c;而写的代码比较多类名这些要记清楚。 路由可以看做表&#xff0c;每个map对应一张表 我们可以试着这么写&#xff0c;完成MainActivity跳…

WINDOWS中电源设置小工具

你可以使用WinPowerSet&#xff0c;玩CS2之前&#xff0c;把电源设置为“高性能”&#xff0c;玩后设置为“平衡”。 WinPowerSet 下载地址&#xff1a; 链接&#xff1a;https://pan.baidu.com/s/1iOp29c4ica9L47t_l9lZ2w?pwdd248 提取码&#xff1a;d248 最近新配了一台12…

由《幻兽帕鲁》私服漏洞引发的攻击面思考

《幻兽帕鲁》私服意外丢档 当了一天的帕鲁&#xff0c;回家开机抓帕鲁的时候发现服务器无法连接。运维工具看了下系统负载发现 CPU 已经跑满。 故障排查 登录服务器进行排查发现存在可疑的 docker 进程。 经过一番艰苦的溯源&#xff0c;终于在命令行历史中发现了端倪 攻击…

Java多线程--线程安全问题练习题

文章目录 &#xff08;1&#xff09;练习题1&#xff08;2&#xff09;练习题2&#xff08;3&#xff09;练习题3 现在咱们线程一共说了这么几件事情&#xff0c;如下&#xff1a; 具体文章见专栏。 接下来看几个练习题吧。 &#xff08;1&#xff09;练习题1 &#x1f30b;题…

实现单点登录

指再多系统应用群中登录一个系统&#xff0c;便可在其他所有系统中得到授权而无需再次登录&#xff0c;包括单点登录与单点注销两部分。 相比于单系统登录&#xff0c;sso需要一个独立的认证中心&#xff0c;只有认证红心能接受用户的用户名密码等安全信息&#xff0c;其他系统…