简单好用的折线图绘制!

折线图的概念及作用:

折线图(Line Chart)是一种常见的图表类型,用于展示数据的变化趋势或时间序列数据。它通过一系列的数据点(通常表示为坐标系中的点)与这些点之间的线段相连,直观地展示变量随着时间或其他因素变化的情况。折线图适用于比较多个数据集的变化趋势,尤其是在时间序列数据分析中,常用于反映数据的连续性和波动。

1. 折线图的基本概念

折线图是由坐标系中的一系列数据点和这些点之间的直线段组成。每个数据点的横坐标通常代表某一时间点或顺序,而纵坐标则表示对应的数值(如销量、温度、股票价格等)。通过连接这些点,形成折线图,可以清晰地看到数据的波动趋势和变化规律。

  • 横坐标(X轴):通常表示自变量,例如时间、日期、阶段等。它是连续的或离散的。
  • 纵坐标(Y轴):表示因变量,即需要观察的数据值。
  • 数据点:每一个数据点对应一个横坐标和纵坐标的组合,表示某个时刻或某个条件下的观测值。
  • 折线:通过连接数据点,形成的线条展示了数据的变化趋势。

2. 折线图的作用

折线图的作用主要体现在以下几个方面:

a. 展示数据变化的趋势

折线图最常见的用途是展示数据随时间或其他因素变化的趋势。通过观察折线的走势,可以直观地了解数据随时间的波动和变化模式。

  • 例如,绘制一年中每个月的气温变化折线图,可以清晰地看出气温的升降趋势,揭示季节性变化。
b. 比较多个数据系列

折线图还可以用来比较多个数据系列的变化趋势。当有多个变量或不同类别的时间序列数据时,可以将它们绘制在同一张图表上,通过不同的颜色、线型或符号区分不同的数据系列。

  • 例如,比较不同公司在同一时间段内的股票价格变化,或不同地区的气温变化。
c. 揭示数据的波动性和周期性

折线图不仅能展示数据的趋势,还能揭示数据中的周期性波动(如季节变化)、突发性变化、趋势反转等重要特征。

  • 例如,通过绘制股票市场的折线图,可以看到市场的波动性,识别牛市和熊市的周期性变化。
d. 识别异常值或趋势变化点

折线图能够帮助观察数据中的异常值或突变点。例如,突如其来的数据激增或暴跌在折线图中会形成尖锐的波动,容易被观察者识别出来。

  • 例如,销售额的急剧下降可能是某个重要事件导致的,需要进一步分析。

3. 折线图的类型

根据数据的特点和需求,折线图可以有不同的变种,常见的有:

a. 基本折线图(Simple Line Chart)

最基本的折线图,展示一个数据系列随时间的变化趋势。

b. 多重折线图(Multiple Line Chart)

适用于比较多个数据系列。每个系列通过不同的颜色或线型区分,以便在同一图表中显示多个变量的变化趋势。

c. 堆叠折线图(Stacked Line Chart)

在多重折线图的基础上,堆叠折线图显示了不同数据系列之间的叠加关系。每个数据系列的值在前一系列之上堆叠起来,适用于表示部分与整体的关系。

  • 例如,展示各个产品在某个月的销售额时,可以通过堆叠折线图看到不同产品的销售额与总销售额之间的关系。
d. 平滑折线图(Smooth Line Chart)

在基本折线图的基础上,通过平滑算法(如样条插值等)使得折线不那么尖锐,适用于数据变化较为平稳、且不要求每个数据点之间的波动都十分显著的情况。


代码:

第一部分:加载所需包

library(ggplot2)
library(dplyr)
library(tidyr)
library(gridExtra)
library(openxlsx)
  • ggplot2:用于数据可视化。
  • dplyr:用于数据操作。
  • tidyr:用于数据整理(例如宽表和长表的转换)。
  • gridExtra:用于排版多个图表。
  • openxlsx:用于读取和写入 Excel 文件。

第二部分:数据加载与清理

mydata <- read.xlsx("gpt.xlsx")
mydata <- subset(mydata, mydata$final != 3)
mydata <- mydata %>%
  mutate(
    gpt = factor(gpt, levels = c("gpt3.5", "gpt4")),
    system = factor(system, levels = c("system2", "system1")),
    query = factor(query, levels = c("query1", "query2")),
    final_new = factor(final, labels = c("不参加", "参加")),
    sort_new = factor(sort, labels = paste0(seq(10, 90, by = 10), "%"))
  )
  1. 数据加载:

    • read.xlsx("gpt.xlsx"):读取 Excel 文件 gpt.xlsx
  2. 数据过滤:

    • subset(mydata, mydata$final != 3):去除 final 列中值为 3 的数据。
  3. 数据清理:

    • 使用 mutate 对数据进行格式化处理:
      • gptsystemquery 列转为因子变量,设定排序规则。
      • finalsort 列创建新的因子变量,并赋予更易读的标签。

第三部分:分组并汇总数据

result_wide <- mydata %>%
  group_by(gpt, system, query, final_new) %>%
  summarise(Frequency = n(), .groups = 'drop') %>%
  pivot_wider(names_from = final_new, values_from = Frequency, values_fill = list(Frequency = 0)) %>%
  mutate(Proportion = 参加 / (不参加 + 参加))
  1. 分组与汇总:

    • group_by(gpt, system, query, final_new):按 gptsystemqueryfinal_new 进行分组。
    • summarise(Frequency = n(), .groups = 'drop'):计算每组的频数,生成 Frequency 列。
  2. 宽表转换:

    • pivot_wider(names_from = final_new, values_from = Frequency, values_fill = list(Frequency = 0))
      • final_new 的值("不参加" 和 "参加")作为新列,值来源于 Frequency
      • 未匹配的单元格填充为 0
  3. 计算比例:

    • mutate(Proportion = 参加 / (不参加 + 参加)):计算 "参加" 在总频数中的比例,结果存储在 Proportion 列中。

第四部分:绘制折线图

plota <- ggplot(result_wide, aes(x = system, y = Proportion, 
                                  color = gpt, linetype = query, 
                                  group = interaction(gpt, query))) +
  geom_line(linewidth = 1.1) +
  geom_point(size = 2) +
  labs(title = "比对折线图", x = "system", y = "参加比例") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5),
    legend.title = element_blank(),
    legend.position = "bottom"
  ) +
  scale_color_manual(values = c("gpt3.5" = "red", "gpt4" = "green")) +
  scale_linetype_manual(
    values = c("query1" = "solid", "query2" = "dashed", "query4" = "dotted"),
    labels = c("query1" = "query1-单次博弈", "query2" = "query2-多次博弈", "query4" = "query4-聚合结果的多次博弈")
  ) +
  scale_x_discrete(labels = c("system1" = "system1【AI】", "system2" = "system2【Human】"))
核心部分解释:
  1. ggplot 初始化:

    • aes(x = system, y = Proportion, color = gpt, linetype = query, group = interaction(gpt, query))
      • xsystem 作为 x 轴变量。
      • yProportion 作为 y 轴变量(参加比例)。
      • colorgpt 区分颜色。
      • linetypequery 区分线型(例如虚线、实线等)。
      • group:按照 gptquery 的组合分组,确保线条连续。
  2. 绘制折线和点:

    • geom_line(linewidth = 1.1):绘制折线,设置线宽为 1.1。
    • geom_point(size = 2):在线上叠加点,设置点大小为 2。
  3. 添加标题和标签:

    • labs(title = "比对折线图", x = "system", y = "参加比例"):设置图表标题和轴标签。
  4. 主题样式:

    • theme_minimal():应用简约主题。
    • theme(...)
      • plot.title = element_text(hjust = 0.5):标题居中。
      • legend.title = element_blank():去除图例标题。
      • legend.position = "bottom":将图例放在底部。
  5. 自定义颜色和线型:

    • scale_color_manual(...):指定颜色:
      • "gpt3.5" 为红色,"gpt4" 为绿色。
    • scale_linetype_manual(...)
      • values:指定线型(实线、虚线、点线)。
      • labels:为每种 query 提供易读的标签描述。
  6. 自定义 x 轴标签:

    • scale_x_discrete(labels = c("system1" = "system1【AI】", "system2" = "system2【Human】"))
      • system1system2 的标签分别替换为 system1【AI】system2【Human】

第五部分:保存图表

ggsave("plota.png", plota, width = 8, height = 6, bg = "white")
  • 将绘制的图形 plota 保存为 PNG 文件:
    • 文件名为 plota.png
    • 宽度和高度分别为 8 英寸和 6 英寸。
    • 背景色为白色。

总结:

# ------- 加载所需包 -------
library(ggplot2)
library(dplyr)
library(tidyr)
library(gridExtra)
library(openxlsx)

# ------- 加载并清理数据 -------
mydata <- read.xlsx("gpt.xlsx")
mydata <- subset(mydata, mydata$final != 3)
mydata <- mydata %>%
  mutate(
    gpt = factor(gpt, levels = c("gpt3.5", "gpt4")),
    system = factor(system, levels = c("system2", "system1")),
    query = factor(query, levels = c("query1", "query2")),
    final_new = factor(final, labels = c("不参加", "参加")),
    sort_new = factor(sort, labels = paste0(seq(10, 90, by = 10), "%"))
  )

# ------- 分组并汇总数据 -------
result_wide <- mydata %>%
  group_by(gpt, system, query, final_new) %>%
  summarise(Frequency = n(), .groups = 'drop') %>%
  pivot_wider(names_from = final_new, values_from = Frequency, values_fill = list(Frequency = 0)) %>%
  mutate(Proportion = 参加 / (不参加 + 参加))

# 打印汇总数据
print(result_wide)

# ------- 绘制折线图 -------
plota <- ggplot(result_wide, aes(x = system, y = Proportion, 
                                  color = gpt, linetype = query, 
                                  group = interaction(gpt, query))) +
  geom_line(linewidth = 1.1) +
  geom_point(size = 2) +
  labs(title = "比对折线图", x = "system", y = "参加比例") +
  theme_minimal() +
  theme(
    plot.title = element_text(hjust = 0.5),
    legend.title = element_blank(),
    legend.position = "bottom"
  ) +
  scale_color_manual(values = c("gpt3.5" = "red", "gpt4" = "green")) +
  scale_linetype_manual(
    values = c("query1" = "solid", "query2" = "dashed", "query4" = "dotted"),
    labels = c("query1" = "query1-单次博弈", "query2" = "query2-多次博弈", "query4" = "query4-聚合结果的多次博弈")
  ) +
  scale_x_discrete(labels = c("system1" = "system1【AI】", "system2" = "system2【Human】"))

# 显示图表
print(plota)

# ------- 保存图表 -------
ggsave("plota.png", plota, width = 8, height = 6, bg = "white")

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/925535.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

模型 布鲁姆法则

系列文章 分享 模型&#xff0c;了解更多&#x1f449; 模型_思维模型目录。分层提升思维力。 1 布鲁姆法则的应用 1.1 布鲁姆法则在产品开发流程中的应用 背景&#xff1a; 在产品开发领域&#xff0c;创新和效率是关键。布鲁姆法则可以帮助产品经理和设计师系统地提升产品开…

如何通过实验室Lims系统解决效率和数据管理难题?

您的实验室是否还在为这些问题而苦恼呢&#xff1f; 提升企业业务效率&#xff1f; 质量可追溯、数据合规性&#xff1f; 提升客户服务质量&#xff1f; 如何让管理经验和检测数据有效积累? 实验室Lims系统功能 1、业务管理 2、检验管理 3、财务管理 4、客户管理 5、…

【目标跟踪】Anti-UAV数据集详细介绍

Anti-UAV数据集是在2021年公开的专用于无人机跟踪的数据集&#xff0c;该数据集采用RGB-T图像对的形式来克服单个类型视频的缺点&#xff0c;包含了318个视频对&#xff0c;并提出了相应的评估标准&#xff08;the state accurancy, SA)。 文章链接&#xff1a;https://arxiv.…

PyG教程:MessagePassing基类

PyG教程&#xff1a;MessagePassing基类 一、引言二、如何自定义消息传递网络1.构造函数2.propagate函数3.message函数4.aggregate函数5.update函数 三、代码实战1.图数据定义2.实现GNN的消息传递过程3.完整代码4.完整代码的精简版本 四、总结1.MessagePassing各个函数的执行顺…

Win10 系统下使用研华XNavi安装板卡驱动失败

配置&#xff1a;主板 AIMB-705G2&#xff0c;CPU i5-6500&#xff0c;系统 Windows10_64bit_Pro_22H2&#xff0c; 测试&#xff1a; 1、多次安装驱动。FAIL 2、尝试在其他电脑上移植板卡驱动并且使用数字签名安装。FAIL 3、系统更新到WIN10最新版本。FAIL 4、杀毒软件卸…

用三维模型的顶点法向量计算法线贴图

法线贴图的核心概念是在不增加额外多边形数目的情况下&#xff0c;通过模拟细节来改善光照效果。具体流程包括&#xff1a; 法线的计算与存储&#xff1a;通过法线映射将三维法线向量转化为法线贴图的 RGB 值。渲染中的使用&#xff1a;在片段着色器中使用法线贴图来替代原有的…

idea编译与maven编译的问题

先说下idea编译按钮的位置 编译运行时&#xff0c;会在idea底部出现Build面板 比较&#xff1a; idea编译器编译整个项目 maven编译器根据pom.xml的配置&#xff0c;可实现灵活编译 两套编译会遇到的问题&#xff1a; maven 编译成功 &#xff0c;但idea编译失败&#xff…

deepin 安装 chrome 浏览器

deepin 安装 chrome 浏览器 最近好多小伙伴儿和我说 deepin 无法安装最新的谷歌浏览器 其实是因为最新的 谷歌浏览器 其中的一个依赖需要提前安装 提前安装依赖然后再安装谷歌浏览器就可以了 安装 fonts-liberationsudo apt -y install fonts-liberation安装 chrome 浏览器sudo…

《String类》

目录 一、定义与概述 二、创建字符串对象 2.1 直接赋值 2.2 使用构造函数 三、字符串的不可变性 四、常用方法 4.1 String对象的比较 4.1.1 比较是否引用同一个对象 4.1.2 boolean equals(Object anObject)方法&#xff1a;按照字典序比较 4.1.3 int compareTo(Strin…

OpenSSH-9.9p1 OpenSSL-3.4.0 升级步骤详细

前言 收到漏洞扫描通知 OpenSSH 安全漏洞(CVE-2023-38408) OpenSSH 安全漏洞(CVE-2023-51385) OpenSSH 安全漏洞(CVE-2023-51384) OpenSSH 安全漏洞(CVE-2023-51767) OpenSSH 安全漏洞(CVE-2023-48795) OpenSSH&#xff08;OpenBSD SecureShell&#xff09;是加拿大OpenBSD计划…

【Stable Diffusion】安装教程

目录 一、python 安装教程 二、windows cuda安装教程 三、Stable Diffusion下载 四、Stable Diffusion部署&#xff08;重点&#xff09; 一、python 安装教程 &#xff08;1&#xff09;第一步下载 打开python下载页面&#xff0c;找到python3.10.9&#xff0c;点击右边…

Scala身份证上的秘密以及Map的遍历

object test {def main(args: Array[String]): Unit {val id "42032220080903332x"//1.生日是&#xff1f;//字符串截取val birthday id.substring(10,14) //不包括终点下标println(birthday)val year id.substring(6,10) //println(year)//性别&#xff1a;倒数第…

springboot 异步 @Async 的日常使用及失效场景

文章目录 springboot 异步 Async 的日常使用引言一、Async 使用位置二、Async 使用三、注解 Async 失效的情况&#xff08;1&#xff09;调用同一个类中的异步方法&#xff08;内部调用&#xff09;&#xff08;2&#xff09;未使用 EnableAsync 注解&#xff08;3&#xff09;…

Laravel8.5+微信小程序实现京东商城秒杀方案

一、商品秒杀涉及的知识点 鉴权策略封装掊口访问频次限制小程序设计页面防抖接口调用订单创建事务使用超卖防御 二、订单库存系统方案&#xff08;3种&#xff09; 下单减库存 优点是库存和订单的强一致性&#xff0c;商品不会卖超&#xff0c;但是可能导致恶意下单&#xff…

三角网格体的光滑性问题

三角网格体的光滑性问题 在计算机图形学和计算机辅助设计中&#xff0c;C0连续性&#xff08;也称为位置连续性&#xff09;是指两个曲线或曲面在它们的公共边界上具有相同的位置。这意味着它们在边界处没有缝隙或重叠&#xff0c;但它们的切线方向可以不同。C0连续性是最低级…

独家|京东调整职级序列体系

原有的M、P、T、S主序列将正式合并为新的专业主序列P。 作者|文昌龙 编辑|杨舟 据「市象」独家获悉&#xff0c;京东已在近日在内部宣布对职级序列体系进行调整&#xff0c;将原有的M、P、T、S主序列正式合并为新的专业主序列P&#xff0c;合并后的职级体系将沿用原有专业序…

Echarts 绘制地图

一、Apache Echarts 官网地址&#xff1a;https://echarts.apache.org/ npm install echarts --save 二、获取地图的GeoJSON 地址&#xff1a;DataV.GeoAtlas地理小工具系列 左侧是地图&#xff0c;右侧是JSON数据路径&#xff0c;点击你想要生成的地图省市、地级&#xff0…

想入手养宠宠物空气净化器,养宠宠物空气净化器哪个好?

家里有了宠物后&#xff0c;确实多了很多欢乐&#xff0c;但掉落的毛发也多了不少&#xff0c;特别是换毛期&#xff0c;掉毛问题真的很让人头疼&#xff01;作为养了多年宠物的铲屎官&#xff0c;我真心推荐大家买一台宠物空气净化器&#xff0c;它能大大提升家里的空气质量&a…

ASUS/华硕ROG掌机 2023款 RC71 NR2301原厂win11系统 工厂文件 带ASUS Recovery恢复

华硕工厂文件恢复系统 &#xff0c;安装结束后带隐藏分区&#xff0c;一键恢复&#xff0c;以及机器所有驱动软件。 系统版本&#xff1a;windows11 原厂系统下载网址&#xff1a;http://www.bioxt.cn 需准备一个20G以上u盘进行恢复 请注意&#xff1a;仅支持以上型号专用…

nginx 升级http 到 http2

同步发布于我的网站 &#x1f680; 背景介绍准备工作配置过程遇到的问题及解决方法验证升级总结参考资料 背景介绍 HTTP/2 是 HTTP 协议的最新版本&#xff0c;相比 HTTP/1.1&#xff0c;它带来了多项重要的改进&#xff0c;包括多路复用、头部压缩和服务端推送。这些特性可…