R语言中的常用基础绘图函数 直方图,箱线图,条形图,散点图

目录

R语言中的绘图参数

绘图函数

1.plot函数绘制散点图

2.hist函数绘制直方图

如何修饰直方图?

如何在直方图上标注各组频数?

使用text函数把某些信息标注在直方图上

如何在直方图上添加概率密度曲线?

3.boxplot函数绘制箱线图

4.barplot函数绘制条形图

如何生成横向条形图?


首先介绍一下:在R语言中,当你在调用函数时为参数明确指定名称,那么参数的顺序就不再是必须遵循函数原型定义的顺序。这是因为通过参数名指定值,R能够识别并正确地将值分配给对应的参数,无论这些参数在函数调用中的实际顺序如何。

例如,考虑一个简单的函数定义:

my_function <- function(a, b, c) 

在正常情况下,你会按照a、b、c的顺序传递参数:

result <- my_function(1, 2, 3) 

但是,如果你指定了参数名称,那么这些参数可以以任意顺序出现:

result <- my_function(c = 3, a = 1, b = 2) 且结果相同

这种通过名称指定参数的特性,不仅使得函数调用更加灵活,还可以提高代码的可读性,尤其是在处理有很多参数,且部分参数具有默认值的情况下。此时,明确指出参数名称有助于理解每个参数的作用,避免混淆。这就让我们在使用R中的函数的时候可以不用像C语言那样记住每个参数的位置,而是只需要记住哪个参数是干啥的就行

R语言中的绘图参数

R语言中绘图参数非常多样,它们允许你定制化绘制的图形,以适应不同的需求和偏好。这些参数可以分为几个大类,包括图形参数、文本参数、线条参数、颜色参数等。以下是一些常用的绘图参数及其简要说明:

图形参数

  • pch: 点的类型,可以是数字或符号,控制点的形状。
  • type: 图形类型,如"p"代表点,"l"代表线等。
  • xlim: x轴的范围。
  • ylim: y轴的范围。
  • xlab: x轴的标签。
  • ylab: y轴的标签。
  • main: 图形的主标题。
  • sub: 图形的副标题。

文本参数

  • cex: 文本的缩放比例。
  • col: 文本的颜色。
  • font: 字体样式,如粗体、斜体等。
  • text: 在图形中添加的具体文本。

线条参数

  • lty: 线型,如实线、虚线等。
  • lwd: 线宽。
  • col: 线条的颜色。

颜色参数

  • col: 用于点、线、文本等的颜色。
  • bg: 背景颜色,特定图形元素如柱状图的填充颜色。

边界和布局参数

  • mar: 图形四周的边界空间。
  • oma: 外边界空间。
  • mfrow: 分割窗口,按行排列多个图形。
  • mfcol: 分割窗口,按列排列多个图形。

这只是R语言绘图参数中的一小部分。不同的绘图函数可能会支持不同的参数集合。例如,plot()函数支持的参数与barplot()或hist()可能不同。因此,最佳实践是查阅特定绘图函数的帮助文档来获取完整的参数列表和详细说明。在R中,你可以通过?函数名,如?plot,来访问这些帮助文档。

绘图函数

R语言中有很多用于绘图的函数,这些函数可以分为两大类:基础绘图系统(Base Plotting System)和其他专用图形包如ggplot2、lattice等。下面列出了一些在基础绘图系统中常用的绘图函数及其用途:

  1. plot()

:这是R中最基本的绘图函数,用于创建各种类型的图形,如散点图、线图等。根据提供数据的类型和参数的不同,plot()函数可以生成不同风格的图表。

  1. hist()

:用于绘制直方图,可展示数据的分布情况。

  1. barplot()

:用于绘制条形图,适用于展示分类数据的比较。

  1. boxplot()

:用于绘制箱线图,常用于比较不同组数据的分布情况及中位数等统计信息。

  1. pie()

:用于绘制饼图,表示部分与整体之间的比例关系。

  1. abline()

:在图形中添加直线,常用于添加回归线或参考线。

  1. lines()

:在现有图形上添加线条,常用于折线图的绘制。

  1. points()

:在现有图形上添加点,可用于突出显示特定数据点。

  1. text()

:在图形中添加文本,用于注释或标记。

  1. legend()

:为图形添加图例,有助于解释图中的符号和颜色代表的含义。

  1. axis()

:自定义坐标轴的样式和参数,如刻度、标签等。

除了这些基础绘图函数,R语言中还有其他强大的图形系统和包,如:

  • ggplot2:一种实现了格兰特图形语法的绘图系统,非常灵活和强大,适合复杂的图形制作。
  • lattice:受S语言trellis图形灵感启发的图形包,适用于创建条件图,以展示变量之间的关系。
  • plotly:提供了一个交云互动图表的界面,可以用于创建动态和交互式的Web图形。

这些工具和函数使R成为一个强大的数据可视化工具,无论是基础图形还是复杂的定制化图形,R都能够胜任。

type通常是plot函数中的一个参数,用于设定图像的形式,比如点还是线,下面是一些常见的type参数选项:

  • "p": 只绘制点(Points),不连接。
  • "l": 只绘制线(Lines),不显示点。
  • "b": 同时绘制点和折线,线是连接各数据点的。
  • "o": 同时绘制点和折线,线通过点中心。
  • "h": 绘制垂直线,从每个点到X轴。
  • "s": 阶梯图(Stairsteps),横向直线。
  • "n": 不绘制任何图形,通常用于只添加注释或特殊元素到已存在的图形。

下面来详细介绍几个函数

1.plot函数绘制散点图

运行之后就得到了一幅这样的图

如果在刚才的那句代码中加上axes=F,就会发现坐标轴没了,axes这个参数是用来决定显示坐标轴与否的,默认是显示,如果我们不想让坐标轴显示,可以加上一句axes=F

来看一段代码

col用来设置点的颜色,pch=16来设置点的形状,16表示实圆形,cex设置点的大小,1代表正常大小

这个代码的运行结果如图

2.hist函数绘制直方图

hist()函数在R语言中用于创建直方图,它是用来探索数据集分布特征的重要工具。直方图通过将数据分布到连续的、不重叠的区间(或称“桶”、“bin”)中,来展示在每个区间内数据点的数量。

基本使用

hist()函数的基本语法如下:

hist(x, breaks = "Sturges", freq = NULL, probability = !freq, col = NULL, border = NULL, main = paste("Histogram of" , xname), xlim = NULL, ylim = NULL, xlab = xname, ylab = "Frequency", axes = TRUE, plot = TRUE, labels = FALSE, ...)

主要参数

  • x: 包含要绘制直方图的数值数据的向量。
  • breaks: 用于指定区间(bin)的方法或数值。可以是一个向量,指定每个区间的边界,或者是一个单一数值,指定区间的数量。还可以是一个字符串,指定算法(如"Sturges","Scott","FD"等),自动计算区间数量。
  • freq: 逻辑值,指定是绘制频数直方图(TRUE)还是密度直方图(FALSE)。默认情况下,如果probability未被设置,freq = TRUE。
  • probability: 逻辑值,与freq相反。如果设置为TRUE,y轴显示每个区间的数据点占总数据点的比例。
  • col: 指定直方图柱子的填充颜色。
  • border: 指定直方图柱子边界的颜色。
  • main: 图形的主标题。
  • xlim和ylim: 分别指定x轴和y轴的范围。
  • xlab和ylab: 分别指定x轴和y轴的标签。
  • axes: 逻辑值,指定是否绘制坐标轴。
  • plot: 逻辑值,指定是否绘制直方图。设置为FALSE可以用来仅仅创建直方图的统计数据而不绘制它。
  • labels: 逻辑值,指定是否在每个柱子上方显示其频数或概率。

实际上hist函数中只有一个参数是必须提供的,那就是x,其他的参数如果不提供,系统都会提供一个默认的合适值

示例

下面是一个简单的例子,展示如何使用hist()函数绘制直方图:

这个例子展示了如何生成一个包含100个正态分布随机数的直方图,使用了10个区间,并且设置了直方图的颜色、边界颜色以及各种标签。运行结果如图所示

如果我们加上一个probability=T,就变成了这样

可以发现y轴已经变成了每个区间的数据点占总数据点的比例。

breaks还可以人为规定区间,比如我们这样写

表示区间从-3开始,终止于5,步长为1,于是结果就是这样

再来看一个例子

mtcars是R中自带的一个数据集,mpg是其中一个

breaks可以指定组数,如果不写,系统会自动确定一个组数

我们应该保证breaks的大小能够囊括所给数据中的所有值,如果不知道一个数据集的最大值和最小值,可以使用max函数和min函数来查看

breaks可以人为指定,比如我们可以使用seq函数生成一个等差数列,也可以手动输入一些区间的边界值,人为指定,就可以实现不等距分组

因此总结一下,如果我们要等距分组,可以使用seq函数,如果要实现不等距分组,需要人为输入区间边界值

如何修饰直方图?

如果想要用条纹填充图像中的柱体,可以加一个参数叫做density,同时可以指定条纹的密度,而angle参数可以设定条纹的倾斜程度,默认是45度

参数border用来设定图像里面柱体的边界颜色,比如

图就变成了这样,因为1在R中是黑色

再看这个代码

这段代码表示绘图的数据来自mpg,颜色用绿色,分了五个区间,用条纹填充,条纹的密度是20,角度是30,柱形的边界用红色,主标题改成示例,横坐标标题改成MPG,纵坐标标题改成Freq,cex.main是主标题大小改成正常字体的两倍,cex.lab指的是所有副标题的大小改成正常字体大小的1.5倍,cex.axis表示把横轴和纵轴的刻度标签大小(就是这些0 2 4 6 8啥的)改成正常大小的0.8倍

如何在直方图上标注各组频数?

在使用hist函数绘制直方图的时候实际上会自动保存绘制的图形的参数,比如区间个数,这些参数可以通过$来观察

比如我要查看区间分了多少个

比如我要查看图中每个柱形的数值

使用text函数把某些信息标注在直方图上

在R语言中,text()函数用于在图形上添加文本标签。这个函数非常有用,特别是当你需要在图表中标注特定的点或者提供额外的信息时。使用text()函数可以直接在指定的坐标位置上添加文本。

text()函数的基本用法如下:

text(x, y, labels, col = "color", pos = 4, cex = 1, ...)

其中参数的含义如下:

  • x和y:分别指定文本标签的x和y坐标位置。这些坐标应该与图形中使用的坐标系一致。
  • labels:要添加的文本标签。可以是单个字符串也可以是字符串向量,对应于每个x和y坐标点。
  • col:文本的颜色。
  • pos:文本相对于指定坐标的位置。取值为1到4,分别表示文本位于坐标的下方、左侧、上方、右侧。
  • cex:文本的缩放比例因子,用于调整文本的大小。
  • ...:其他图形参数,如字体类型font,旋转角度srt等。

如图

运行结果为

我们发现添加的信息贴在了这个柱形上,如果想要让他上移一点,可以使用参数adj,这个参数可以是一个值,也可以是两个值,当adj只有一个值时,它指定了文本的水平对齐方式。adj = 0表示左对齐,adj = 0.5表示居中对齐,而adj = 1表示右对齐。

  • 当adj有两个值时,第一个值控制水平对齐,第二个值控制垂直对齐。例如,adj = c(0, 0)会让文本左下对齐,adj = c(0.5, 0.5)则会让文本在指定的坐标点居中对齐,adj = c(1, 1)则让文本右上对齐。

最终结果如下

如何在直方图上添加概率密度曲线?

在R的库函数中有一个函数叫做density,用于估计给定数据的核密度。lines()函数用于在现有的图形上添加线条。

结果如图

这好像什么也没添加?其实不是的,密度曲线已经添加到了这个图中,但是由于这个图是一个频数直方图,纵轴太大,导致我们添加的概率密度曲线看不见,应该先把频数直方图转换成频率直方图,使用参数freq=F,这样就可以直观的观察到密度曲线了

还可以在lines函数中设置参数lwd的大小来改变密度曲线的粗细

3.boxplot函数绘制箱线图

在R语言中,boxplot()函数用于创建箱线图,这是一种用于图形化显示数据分布的标准方式。通过箱线图,可以直观地看到数据的中位数、四分位数、异常值等统计信息。箱线图特别适合比较不同数据集的分布情况。

基本用法

boxplot(x, data = NULL, ...)

  • x:可以是一个向量、数据框(data.frame)、或是一个公式(formula),用于指定要绘制的数据。
  • data:当x是公式时,指定公式中变量的数据框。
  • ...:其他参数和细节设置,如main用于标题,xlab和ylab用于轴标签等

主要组成部分

  • 中位数(Median):箱体中的一条线,表示数据的中位数。
  • 四分位数(Quartiles):箱体的边缘,表示数据的第一四分位数(Q1)和第三四分位数(Q3)。
  • 异常值(Outliers):图上单独标出的点,通常是那些小于Q1-1.5IQR或大于Q3+1.5IQR的值(IQR是四分位距)。
  • 箱体(Box):表示从第一四分位数到第三四分位数的范围。
  • 胡须(Whiskers):从箱体出发到最近的非异常值的线,表示数据的正常范围。

boxplot()函数的强大之处在于其灵活性和配置选项的多样性,可以根据需要调整和自定义各种参数,以达到预期的图形效果。

下面是一个例子

运行结果如图

4.barplot函数绘制条形图

在R语言中,barplot()函数用来创建条形图,这是展示数据分布和比较不同类别数据的一种有效方式。条形图通过条形的高度或长度来表示数据的大小,适合用于展示数量比较、频数统计等。

基本用法

barplot(height, names= NULL, beside = FALSE, ...)

  • height:一个数值向量或矩阵,指定每个条形的高度。
  • names:可选参数,为每个条形指定名字。
  • beside:布尔值,如果为TRUE,则将矩阵的列并排显示,而不是堆叠显示。
  • ...:其他控制图形外观的参数,如main、xlab、ylab、col等用于添加标题、轴标签和颜色等。

简单条形图

示例:堆叠和并排条形图

如何生成横向条形图?

通过设置horiz函数,可以生成横向条形图

结果如图

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/463140.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

爬虫学习 Scrapy中间件代理UA随机selenium使用

目录 中间件UA、代理处理---process_requestUA随机 代理处理seleniumscrapy 中间件 控制台操作 (百度只起个名 scrapy startproject mid scrapy genspider baidu baidu.com setting.py内 ROBOTSTXT_OBEY FalseLOG_LEVEL "WARNING"运行 scrapy crawl baidu middle…

Rust 程序设计语言学习——所有权

这一节主要来学习 Rust 语言的其他特性&#xff0c;所有权、引用与借用、Slice 类型。 1 所有权 Rust 的核心功能&#xff08;之一&#xff09;是所有权&#xff08;ownership&#xff09;。虽然该功能很容易解释&#xff0c;但它对语言的其他部分有着深刻的影响。 所有程序…

宜搭faas服务器获取accessToken

可以用faas服务器的OpenAPIUtil.getCustomAccessTokenThenCache&#xff08;Client ID,Client Secret&#xff09;就可以获取 至于获取这个Client ID&#xff0c;Client Secret 就需要在钉钉开放平台创建一个应用 然后在这个应用的基础信息里面有 注意的是&#xff1a;如果需要…

软考79-上午题-【面向对象技术3-设计模式】-结构型设计模式02

一、组合模式 1-1、意图 将对象组合成树型结构&#xff0c;以表示"部分-整体"的层次结构。Composite使得用户对单个对象和组 合对象的使用具有一致性。 示例&#xff1a;对象&#xff1a;文件、文件夹 1-2、结构 Component 为组合中的对象声明接口&#xff1b;在适…

深入理解RAG:检索与生成的融合

原文地址&#xff1a;https://dev.to/portkey/understanding-rag-a-deeper-dive-into-the-fusion-of-retrieval-and-generation-1l4b 深入理解RAG:检索与生成的融合 检索增强生成(RAG)模型代表了检索系统和生成模型两大不同但互补组件完美结合的杰作。通过无缝集成相关信息检…

HM2019碰撞安全之假人定位

1、调整假人的位置&#xff08;Tools→Dummy&#xff09; 2、对假人的姿态进行调整 方法一&#xff1a;手动调整 方法二&#xff1a;自动调整 3、假人姿态调整后&#xff0c;还可以对假人目前的姿态保存。 4、将假人恢复到最初状态方法 5、将假人与座椅相关联&#xff08;Tool…

鸿蒙Harmony应用开发—ArkTS声明式开发(容器组件:WaterFlow)

瀑布流容器&#xff0c;由“行”和“列”分割的单元格所组成&#xff0c;通过容器自身的排列规则&#xff0c;将不同大小的“项目”自上而下&#xff0c;如瀑布般紧密布局。 说明&#xff1a; 该组件从API Version 9 开始支持。后续版本如有新增内容&#xff0c;则采用上角标单…

Rust写一个wasm入门并在rspack和vite项目中使用(一)

rust打包wasm文档 文档地址 安装cargo-generate cargo install cargo-generate 安装过程中有问题的话手动安装cargo-generate下载地址 根据自己的系统下载压缩包&#xff0c;然后解压到用户/.cargo/bind目录下&#xff0c;将解压后的文件放到该目录下即可。 创建wasm项目 …

wsl ubuntu 安装cuda nvcc环境

wsl ubuntu 安装cuda环境&#xff1a; CUDA Toolkit 11.6 Downloads | NVIDIA DeveloperDownload CUDA Toolkit 11.6 for Linux and Windows operating systems.https://developer.nvidia.com/cuda-11-6-0-download-archive?target_osLinux&target_archx86_64&Distri…

[MTK6771] android13系统启用OMAPI 支持esim.me

OMAPI是啥&#xff1f;看看谷歌的解释&#xff1a; 说了一大堆懂的人不需要看&#xff0c;不懂的还是看不懂&#xff0c;我就是后者 总之说人话就是&#xff0c;像SIM卡&#xff0c;NFC这类模块需要用到这个东西&#xff0c;那么接着往下看 上层APP想要使用这个OMAPI供应商稳…

相机与相机模型(针孔/鱼眼/全景相机)

本文旨在较为直观地介绍相机成像背后的数学模型&#xff0c;主要的章节组织如下&#xff1a; 第1章用最简单的针孔投影模型为例讲解一个三维点是如何映射到图像中的一个像素 第2章介绍除了针孔投影模型外其他一些经典投影模型&#xff0c;旨在让读者建立不同投影模型之间的建模…

(学习日记)2024.03.12:UCOSIII第十四节:时基列表

写在前面&#xff1a; 由于时间的不足与学习的碎片化&#xff0c;写博客变得有些奢侈。 但是对于记录学习&#xff08;忘了以后能快速复习&#xff09;的渴望一天天变得强烈。 既然如此 不如以天为单位&#xff0c;以时间为顺序&#xff0c;仅仅将博客当做一个知识学习的目录&a…

从大模型到Agentscope——分布式Multi-Agent应用开发与部署

目录 Why需要分布式 案例 多进程的分布书版本能快速提升速度 分布式的挑战 AgentScope分布式解决 方案 实现RPC Agent 基于Actor模式的并行调度缺点&#xff1a;需要Agent内部决定消息传递目标 被调用的Agent立即返回占位符placeholder to_dist: 开启自动将单机进行扩展…

数据结构/C++:红黑树

数据结构/C&#xff1a;红黑树 概念实现基本结构插入uncle为红色节点uncle为黑色节点 总代码展示 概念 红黑树是一种二叉搜索树&#xff0c;一般的二叉搜索会发送不平衡现象&#xff0c;导致搜索效率下降&#xff0c;于是学者们开始探索如何让二叉搜索树保持平衡&#xff0c;这…

字符函数以及字符串函数

1.strlen的使用和模拟实现 • 字符串以 \0 作为结束标志&#xff0c;strlen函数返回的是在字符串中 \0 前⾯出现的字符个数&#xff08;不包 含 \0 )。 • 参数指向的字符串必须要以 \0 结束。 • 注意函数的返回值为size_t&#xff0c;是⽆符号的&#xff08; 易错 &#xff…

springboot基于Hadoop技术下的校园二手交易系统的设计与实现

摘 要 自从新冠疫情爆发以来&#xff0c;各个线下实体越来越难做&#xff0c;线下购物的人也越来越少&#xff0c;随之带来的是一些不必要的浪费&#xff0c;尤其是即将毕业的大学生&#xff0c;各种用品不方便携带走导致被遗弃&#xff0c;造成大量的浪费。本系统目的就是让毕…

引领人工智能时代的应用安全

当生成式人工智能开始展现其编程能力时&#xff0c;开发人员自然会求助于它来帮助他们高效地编写代码。但随着大量人工智能生成的代码首次进入代码库&#xff0c;安全领导者现在正面临着人工智能对整体安全态势的潜在影响。 无论是人工智能被用来将恶意代码插入开源项目&#…

自定义协议

应用层 有许多现成的协议(HTTP协议做网站必备),也有许多需要程序员自定义的协议. 1.自定义协议 自定义协议: 1.明确传递的信息是什么 2.约定好信息按照什么样的格式来组织成二进制字符串 举个例子: 当我们点外卖时,打开软件,会显示商家列表,列表中有很多项,每一项都包含了一…

SQLiteC/C++接口详细介绍之sqlite3类(十四)

返回目录&#xff1a;SQLite—免费开源数据库系列文章目录 上一篇&#xff1a;SQLiteC/C接口详细介绍之sqlite3类&#xff08;十三&#xff09; 下一篇&#xff1a;SQLiteC/C接口详细介绍之sqlite3类&#xff08;十五&#xff09; 43.sqlite3_preupdate_hook sqlite3_preup…

ClickHouse:一款高效且强大的列式数据库管理系统

ClickHouse是一款开源的列式数据库管理系统&#xff0c;专为大规模数据仓库和数据分析应用而设计。它允许用户快速地存储和处理海量数据&#xff0c;同时提供了简单易用的SQL接口。本文将介绍ClickHouse的概念、技术原理以及使用案例&#xff0c;并探讨其优势和挑战。 一、引言…