R语言——条形图数据可视化的多种方式

本文章将会介绍如何使用R语言中的ggplot2包使用条形图进行数据可视化。将会使用一个“生产企业原材料的订购与运输”的订单数据,该数据来自2021数学建模国赛C题。

某建筑和装饰板材的生产企业所用原材料主要是木质纤维和其他植物素纤维材料总体可分为 A B C 三种类型。该企业每年按48周安排生产需要提前制定24周的原材料订购和转运计划,即根据产能要求确定需要订购的原材料供应商(称为供应商和相应每周的原材料订购数量(称为订货量确定第三方物流公司(称为转运商并委托其将供应商每周的原材料供货数量(称为供货量)转运到企业仓库。附件1给出了该企业近5年402家原材料供应商的订货量和供货量数据。根据附件1对402家供应商的供货特征进行量化分析。下面将会主要使用附件1的数据,利用ggplot2包进行条形图可视化。

1 数据读取和预处理操作

建立决策数据分类模型时,使用预处理好的泰坦尼克数据集,预处理好的数据使用下面的方式进行数据切分:

library(ggplot2)
## 设置ggplot2在可视化时的一些基本情况
theme_set(theme_bw(base_family = "STKaiti")+
            theme(plot.title = element_text(hjust = 0.5)))
## 读取附件一的数据并进行简单的预处理
library(readxl)
library(tidyverse)
library(RColorBrewer)
GHdata1 <- read_excel("附件1 近5年402家供应商的相关数据.xlsx",
                      sheet = "供应商的供货量(m³)")
DHdata1 <- read_excel("附件1 近5年402家供应商的相关数据.xlsx",
                      sheet = "企业的订货量(m³)")
## 数据分组计算
## 计算近5年402家供应商所有的供货量总和
Hdata5sum <- GHdata1[,1:2]
Hdata5sum$GHnumber <- rowSums(GHdata1[,3:242])
## 计算近5年402家供应商的企业的订货量总和
Hdata5sum$DHnumber <- rowSums(DHdata1[,3:242])

head(Hdata5sum)
## # A tibble: 6 x 4
##   供应商ID 材料分类 GHnumber DHnumber
##   <chr>    <chr>       <dbl>    <dbl>
## 1 S001     B              49      231
## 2 S002     A             273      309
## 3 S003     C           13138    14279
## 4 S004     B              64      713
## 5 S005     A            6912     6538
## 6 S006     C              30      462

2 条形图数据可视化

(1)可视化图像1:使用条形图只可视化数量较多的50个供应商数据,运行下面程序后可获得可视化图像图1。

## 只可视化数量较多的50个供应商数据
GHtop50 <- Hdata5sum%>%arrange(desc(GHnumber))%>%slice(1:50)
## 条形图可视化
ggplot(GHtop50 ,aes(x = reorder(供应商ID,-GHnumber), y = GHnumber))+
  geom_bar(aes(fill = 材料分类),stat = "identity")+
  theme(axis.text.x = element_text(angle = 90,vjust = 0.5))+
  labs(x = "供应商",y = "供货量",title = "5年来供货量较多的供应商")

(2)可视化图像2:针对使用条形图可视化得到的图像1,可以使用分面对其进一步的分组可视化,运行下面程序后可获得可视化图像图2。

## 使用分面图进行可视化
ggplot(GHtop50 ,aes(x = reorder(供应商ID,GHnumber), y = GHnumber))+
  geom_bar(aes(fill = 材料分类),stat = "identity")+coord_flip()+
  facet_wrap(vars(材料分类), scales = "free_y",nrow = 1)+
  labs(x = "供应商",y = "供货量",title = "5年来供货量较多的供应商")

(3)可视化图像3:针对供货量和订货量的整体情况,可以使用金字塔分组条形图进行可视化,运行下面程序后可获得可视化图像图3。

## DHtop50的订货量和供货量差异
ggplot()+
  geom_bar(data = DHtop50 ,aes(x = reorder(供应商ID,-DHnumber),
                               y = DHnumber,fill = "订货"),
           stat = "identity")+
  geom_bar(data = DHtop50,aes(x = reorder(供应商ID,-DHnumber),
                              y = -GHnumber,fill = "供货"),
           stat = "identity")+
  scale_y_continuous(labels = abs, limits = c(-500000,500000))+
  theme(axis.text.x = element_text(angle = 90,vjust = 0.5))+
  scale_fill_manual("方式",values = c("订货" = "red","供货" = "blue"))+
  labs(x = "供应商",y = "定货量",title = "5年来企业定货量和供应商供货量差异")

(4)可视化图像4:针对供货量和订货量的差异情况,可以使用分组条形图进行可视化,运行下面程序后可获得可视化图像图4。

## 可视化供货和订货差异较大的一些企业
Hdata5sum$chayi <- Hdata5sum$DHnumber - Hdata5sum$GHnumber
chayitop50 <- Hdata5sum%>%arrange(desc(chayi))%>%slice(1:50)
chayitop50
## # A tibble: 50 x 5
##    供应商ID 材料分类 GHnumber DHnumber  chayi
##    <chr>    <chr>       <dbl>    <dbl>  <dbl>
##  1 S201     A           81989   348699 266710
##  2 S140     B          302047   481103 179056
##  3 S126     C           47540   132285  84745
##  4 S348     A           92421   167109  74688
##  5 S151     C          194498   266510  72012
##  6 S160     C              45    62688  62643
##  7 S308     B          136998   186278  49280
##  8 S330     B          136652   172980  36328
##  9 S157     A             395    33284  32889
## 10 S108     B          240950   271445  30495
## # … with 40 more rows
## 可视化
ggplot(chayitop50 ,aes(x = reorder(供应商ID,chayi), y = chayi))+
  geom_bar(aes(fill = 材料分类),stat = "identity")+coord_flip()+
  facet_wrap(vars(材料分类), scales = "free_y",nrow = 1)+
  labs(x = "供应商",y = "定货量-供货量",title = "5年来缺货较多的供应商")

(5)可视化图像5:针对供货量较多的50个供货商的数据,可以使用经过极坐标变换的分组条形图进行可视化,运行下面程序后可获得可视化图像图5。

## 在每个分组数据的后面插入几行缺失值
GHtop50$材料分类 <- as.factor(GHtop50$材料分类)
empty_bar <- 3
to_add <- data.frame(matrix(NA, empty_bar*nlevels(GHtop50$材料分类),
                            ncol(GHtop50)))
colnames(to_add) <- colnames(GHtop50) # 设置数据表的名称
#为数据表添加分组变量
to_add$材料分类 <- rep(levels(GHtop50$材料分类), each=empty_bar)
GHtop50 <- rbind(GHtop50, to_add) # 合并两个数据
GHtop50 <- GHtop50 %>% arrange(材料分类) # 将数据根据分组进行排序
GHtop50$id <- seq(1, nrow(GHtop50))
# 获取每个样本的名称在y轴的位置和倾斜角度
label_data <- GHtop50
number_of_bar <- nrow(label_data) # 计算条的数量
## 每个条上标签的轴坐标的倾斜角度
angle <- 90 - 360 * (label_data$id-0.5) /number_of_bar
label_data$hjust <- ifelse( angle < -90, 1, 0) # 调整标签的对其方式
label_data$angle <- ifelse(angle < -90, angle+180, angle) ## 标签倾斜角度
## 为数据准备基础弧线的数据
base_data <- GHtop50 %>% group_by(材料分类) %>%
 summarize(start=min(id), end=max(id) - empty_bar) %>%
 rowwise() %>% mutate(title=mean(c(start, end)))
## 可视化分组圆环条形图
p1 <- ggplot(GHtop50)+
 ## 添加条形图
 geom_bar(aes(x=as.factor(id), y=GHnumber, fill=材料分类),
          stat="identity",alpha=0.8) +
 ## 添加文本表示每条线的大小
 annotate("text", x = rep(max(GHtop50$id),3), y = c(100000, 200000, 300000),
          label = c("100000", "200000", "300000") , color="blue", size=3,
          angle=0, fontface="bold", hjust=1) +
  ylim(-200000,400000) + ## 设置y轴坐标表的取值范围,可流出更大的圆心空白
  ## 设置使用的主题并使用极坐标系可视化条形图
  theme_minimal() +
  theme(legend.position = "none", # 不要图例
        axis.text = element_blank(),# 不要x轴的标签
        axis.title = element_blank(), # 不要坐标系的名称
        panel.grid = element_blank(), # 不要网格线
        plot.margin = unit(rep(-1,4), "cm"))+ ## 整个图与周围的边距
  coord_polar() + ## 极坐标系
  ## 为条形图添加文本
  geom_text(data=label_data,
            aes(x=id, y=GHnumber+2000, label=供应商ID,hjust=hjust),
            color="black",fontface="bold",alpha=0.8, size=2.5,
            angle= label_data$angle, inherit.aes = FALSE) +
  # 为图像添加基础线的信息
  geom_segment(data=base_data, aes(x = start, y = -10000,
                                   xend = end, yend = -10000),
               colour = "black", alpha=0.8, size=0.6 , inherit.aes = FALSE )+
  ## 添加分组文本信息
  geom_text(data=base_data, aes(x = title, y = -50000,
                                label=材料分类),alpha=0.8,
            colour = "black", size=4,fontface="bold", inherit.aes = FALSE)
p1

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/414362.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

密码学系列(四)——对称密码2

一、RC4 RC4&#xff08;Rivest Cipher 4&#xff09;是一种对称流密码算法&#xff0c;由Ron Rivest于1987年设计。它以其简单性和高速性而闻名&#xff0c;并广泛应用于网络通信和安全协议中。下面是对RC4的详细介绍&#xff1a; 密钥长度&#xff1a; RC4的密钥长度可变&am…

影像仪激光扫描功能,无缝连接2D/3D混合测量

在现代工业生产领域&#xff0c;影像仪用于质量控制和产品检测&#xff0c;是一个不可或缺的工具。它通过高精度的成像和图像处理技术&#xff0c;可以及时发现产品的缺陷和异常&#xff0c;以保证产品质量的稳定性和一致性。 影像仪的重要性及其面临的挑战 在工业生产方面&a…

分段与分页,LDT与GDT,页目录表与页表简单的认识

综合四篇文章看下分段与分页机制&#xff1a; 分段&#xff1a;LDT与GDT 分页&#xff1a;页目录表与页表 首先明确两个结论&#xff1a; 1.cr3里保存页目录表的基址的地址类型为物理地址&#xff0c;页目录表里的每一项也是页表的物理地址。 2.gdtr的地址和gdt里的描述符里的…

MySQL:开始深入其数据(一)DML

在上一章初识MySQL了解了如何定义数据库和数据表&#xff08;DDL&#xff09;&#xff0c;接下来我们开始开始深入其数据,对其数据进行访问&#xff08;DAL&#xff09;、查询DQL&#xff08;&#xff09;和操作(DML)等。 通过DML语句操作管理数据库数据 DML (数据操作语言) …

Vue3列表触底请求(上手体验hooks新特性)

今天我们来聊一聊业务开发中的触底请求&#xff0c;其实就是分页的一种&#xff0c;只不过传统的分页感觉很丑而已&#xff0c;正好我的小博客最近在做触底分页&#xff0c;借此机会来说一说具体怎么实现的&#xff0c;以及来带领大家使用一下Vue3中的新特性hooks函数。 案例和…

uniapp小程序uView自定义tabbar

两年没接触小程序&#xff0c;又重新拾请来 前言 工具&#xff1a;HBuilder X 3.99版本 微信开发者工具 1.06 语言&#xff1a;vue2 uView 一、创建项目 先使用HBuilder X工具创建一个空白uni-app项目 uviewTest 二、安装和配置 HBuilder X找到工具-》插件安装-》插件市场 u…

Flutter中高级JSON处理:使用json_serializable进行深入定制

Flutter中高级JSON处理 使用json_serializable库进行深入定制 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at: https://jclee95.blog.csdn.netEmail: 291148484163.com. Shenzhen ChinaAddress of this article:https://blog.csdn.net/qq_28550263/article/details/1363…

vscode不能远程连接ubuntu18.04.6

目录 问题解决Portable Mode 安装vscode 补充说明学习资料 问题 vscode远程ssh连接ubuntu18.04.6时&#xff0c;出现如下提示框&#xff0c;单击Learn More后&#xff0c;定位到问题。Can I run VS Code Server on older Linux distributions? 原始是&#xff1a;需要glibc …

Mac 配置Clion Qt 调试显示变量值

背景 使用Clion开发Qt程序&#xff0c;在进行调试时&#xff0c;会看不到Qt类的变量值&#xff0c;只有指针形式&#xff0c;对于调试很不方便。 环境&#xff1a; Macbook ProCPU&#xff1a;M3Qt 5.15.13CLion 2023.3.4 解决方案 为了让Clion能显示Qt类的值&#xff0c;…

Ubuntu常用状态命令

目录 一、温度 1&#xff0c;查看CPU温度 2&#xff0c;查看硬盘温度 二、CPU状态 1&#xff0c;显示CPU的详细信息&#xff0c;包括型号、频率、缓存等 2&#xff0c;显示CPU架构、CPU核心数、线程数、频率等信息 三、登录状态 1&#xff0c;查看成功登录的用户 2&am…

4核8g服务器能支持多少人访问?

腾讯云4核8G服务器支持多少人在线访问&#xff1f;支持25人同时访问。实际上程序效率不同支持人数在线人数不同&#xff0c;公网带宽也是影响4核8G服务器并发数的一大因素&#xff0c;假设公网带宽太小&#xff0c;流量直接卡在入口&#xff0c;4核8G配置的CPU内存也会造成计算…

【代码解读】OpenCOOD框架之model模块(以PointPillarFCooper为例)

point_pillar_fcooper PointPillarFCooperPointPillarsPillarVFEPFNLayerPointPillarScatterBaseBEVBackboneDownsampleConvDoubleConv SpatialFusion检测头 &#xff08;紧扣PointPillarFCooper的框架结构&#xff0c;一点一点看代码&#xff09; PointPillarFCooper # -*- c…

在两台CentOS 7服务器上部署MinIO集群---准确

环境说明&#xff1a; 2台Centos7服务器 IP地址分别为172.16.1.9和172.16.1.10 1. 创建minio用户和目录 在两台服务器上执行以下命令&#xff1a; sudo useradd -m -d /app/minio minio sudo mkdir -p /app/minioData sudo mkdir -p /app/minio/logs sudo chown -R mini…

数据结构与算法(数组,栈,队列,链表,哈希表,搜索算法,排序算法,查找算法,策略算法,递归算法,二叉搜索树BST,动态规划算法)

文章目录 1 课程介绍1.1 前置知识1.2 为什么要学习算法1.3 大厂面试常见数据结构题目(基础)1.4 数据结构和算法的关系 2 数据结构2.1 数据结构概述2.1.1 数据结构是什么2.1.2 数据结构分类2.1.2.1 线性结构2.1.2.2 非线性结构2.1.2.3 小总结 2.1.3 数据结构范围 2.2 数组Array2…

leetcode 2.27

leetcode hot 100 哈希1.字母异位词分组2.最长连续序列 双指针1.盛最多水的容器2.和为 K 的子数组 数组1.除自身以外数组的乘积 哈希 1.字母异位词分组 49. 字母异位词分组 方法一&#xff1a;排序 由于互为字母异位词的两个字符串包含的字母相同&#xff0c;因此对两个字符…

Redis之一: 简介及环境安装搭建

什么是NoSQL? NoSQL&#xff0c;指的是非关系型的数据库。NoSQL有时也称作Not Only SQL的缩写&#xff0c;是对不同于传统的关系型数据库的数据库管理系统的统称。 NoSQL用于超大规模数据的存储。&#xff08;例如谷歌或Facebook每天为他们的用户收集万亿比特的数据&#xf…

python:时间序列谐波拟合与残差分析(利用最小二乘法确定模型参数)

作者&#xff1a;CSDN _养乐多_ 在科学研究中&#xff0c;经常需要对实验数据进行拟合&#xff0c;以找出其中的规律。本文介绍了如何使用Python中的NumPy、Matplotlib和SciPy库进行谐波拟合&#xff0c;并对拟合结果进行残差分析。 从下图可以看出&#xff0c;谐波拟合曲线…

Python算法100例-2.6 分糖果

完整源代码项目地址&#xff0c;关注博主私信源代码后可获取 1.问题描述2.问题分析3.算法设计4.确定程序框架5.完整的程序6.运行结果 1&#xff0e;问题描述 10个小孩围成一圈分糖果&#xff0c;老师分给第1个小孩10块&#xff0c;第2个小孩2块&#xff0c;第3个小孩8块&…

C#,弗洛伊德-瑞文斯特(Floyd-Rivest)算法与源代码

Robert W. Floyd 1 Floyd-Rivest 算法 Floyd-Rivest 算法是一种选择算法&#xff0c;用于在不同元素的数组中找到第k个最小元素。它类似于快速选择算法&#xff0c;但在实际运行中有更好的运行时间。 和 QuickSelect 一样&#xff0c;该算法基于分区的思想工作。对数组进行分…

istio学习记录——VirtualService详解

上一篇使用VirtualService进行了简单的流量控制&#xff0c;并通过Gateway将流量导入到了集群内。这一篇将更加深入的介绍 VirtualService。 k8s中有service&#xff0c;service能够对流量进行负载均衡&#xff0c;那为什么istio又引入了VirtualService呢&#xff0c;因为serv…