【数据可视化复习方向】

1.数据可视化就是数据中信息的可视化

2.数据可视化主要从数据中寻找三个方面的信息:模式、关系和异常

3.大数据可视化分类:科学可视化、信息可视化、可视分析学

4.大数据可视化作用:记录信息、分析推理、信息传播与协同

5.可视化流程:1️⃣数据采集 2️⃣数据处理和变换 3️⃣ 可视化映射和人机交互 5️⃣用户感知

6.数据4V特征:大量、多样、高速、价值

7.可视化元素由三个部分组成:可视化空间、标记、视觉通道(分别对应什么东西)

8.可视化设计原则:1.数据筛选原则 2.数据到可视化的直观映射原则 3.视图选择与交互设计原则 4.美学原则 5.适当运用隐喻原则 6.颜色与透明度选择原则

9.时间数据分类主要有两种:连续型时间数据可视化,离散型时间数据可视化

连续型时间数据可视化:阶梯图、折线图、螺旋图、热图

离散型时间数据可视化:散点图、柱形图、堆叠柱形图、点线图

10.时间数据可视化设计三个维度:表达、比例和布局

11.P31-P34 不同图形之间有什么特点 (各个图形进行比较)

12.时空比例数据可视化 + 这些图干嘛的

13.关系数据可视化

关系数据具有关联性和分布性

关联性:正相关、负相关和不相关

14.气泡图、散点图矩阵等展现了关系数据什么特性?茎叶图,直方图等展现什么特性?要会画?

15.文本数据可视化包括哪几种可视化方式?

文本数据大致可以分为三种:单文本、文档集合和时序文本数据;对应的文本可视化也可分为:文本内容可视化、文本关系可视化、文本多层面信息的可视化

文本内容可视化:是对文本内的关键信息分析后的展示

文本关系可视化:既可以对单个文本进行内部的关系展示,也可以对多个文本进行文本之间的关系展示;

文本多特征信息可视化:是结合文本的多个特征进行全方位的可视化展示

16.对文本的理解需求分成哪几个层级?不同层级使用什么方法?

词汇级、语法级、语义级;

词汇级使用各类分词算法,语法级使用一些句法分析算法,语义级使用主题提取算法

17.文本可视化的基本流程

涉及到文本流程图一定要看

18.时序文本是干嘛的?特点,图形有哪些,不同可视化元素代表什么?

时序文本具有时间性和顺序性。对具有明显时序信息的文本进行可视化时,需要在结果中体现这种变化。

有三种流图可以满足这种可视化需求

1️⃣主题河流:两个属性:颜色用以区分主题的类型,相同主题用相同颜色的涌流表示;宽度表示主题的数量,涌流状态随着主题变化,可能扩展、收缩或者保持不变

2️⃣文本流:是主题河流的一种变形,可以表达主题变化,以及随着时间流动,各个主题之间的分裂和合并信息

3️⃣故事流:可以表达文本的情节或者电影中的情节

19.文本分布可视化

文本分布可视化实际上是引入了词语在文本当中的位置、句子长度等信息,这些信息常被制作成文本弧。文本弧特性如下:P48

20.文本关系可视化P48

21.第七章看看书和PPT吧

22.实验部分作业

数据可视化/实验一.ipynb · 南毅c/school - Gitee.com

数据可视化/子图绘制.ipynb · 南毅c/school - Gitee.com

数据可视化/实验二.ipynb · 南毅c/school - Gitee.com

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['Songti SC']  # 解决中文不能正常显示的问题
# 子类目
categories = ['童装', '奶粉辅食', '母婴专区', '洗护喂养', '宝宝尿裤', '春夏新品', '童车童床', '玩具文娱', '童鞋']
# 销售额
sales = [29665, 3135.4, 4292.4, 5240.9, 5543.4, 5633.8, 6414.5, 9308.1, 10353]

# 计算占比
total_sales = sum(sales)
percentages = [(sale / total_sales) * 100 for sale in sales]

# 设置饼图标题
plt.title("拼多多平台子类目的销售额")

# 绘制饼图
patches, texts, autotexts = plt.pie(percentages, labels=categories, autopct='%1.1f%%', startangle=90)

# 添加图例
plt.legend(patches, categories, loc="best")

# 添加表格
plt.table(cellText=[sales], rowLabels=["销售额"], colLabels=categories, cellLoc='center', loc='bottom')

# 确保饼图是圆形
plt.axis('equal')

# 显示图形
plt.show()

 

import matplotlib.pyplot as plt


# 各专业各年的选课人数
data = {
    "电子商务": [136, 197, 428, 263],
    "可视化": [327, 379, 315, 317],
    "网络爬虫": [148, 195, 239, 193],
    "python基础": [495, 140, 211, 452]
}

# 年份
years = [2016, 2017, 2018, 2019]

# 设置柱状图的底部位置
bottoms = [[0] * len(years) for _ in range(len(data))]

# 颜色对应年份
colors = ['blue', 'orange', 'green', 'red']

# 绘制堆积柱状图
for i, (key, values) in enumerate(data.items()):
    for j, value in enumerate(values):
        if j > 0:
            bottoms[i][j] = bottoms[i][j - 1] + values[j - 1]
        plt.bar([key], [value], bottom=bottoms[i][j], color=colors[j], label=str(years[j]))

# 设置标题和坐标轴标签
plt.title("招生情况")
plt.xlabel("专业")
plt.ylabel("人数")

# 显示图例
plt.legend(title="年份")

# 显示图形
plt.show()

 

数据可视化复习1-Matplotlib简介属性和创建子图_python多子图插入插图-CSDN博客

数据可视化复习2-绘制折线图+条形图(叠加条形图,并列条形图,水平条形图)+ 饼状图 + 直方图_条形图+折线图-CSDN博客

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/942941.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Python 多进程编程详解

目录 一、多进程编程简介 1. 什么是多进程 2. 多进程与多线程的区别 二、Python 中的多进程编程 1. 创建进程 2. 进程间通信 3. 进程池 4. 进程同步 5. 注意事项 三、实际应用案例 四、总结 在 Python 中,多进程编程是一种提高程序运行效率的有效手段。相…

Redis篇--应用篇1--会话存储(session共享)

1、概述 实现Session共享是构建分布式Web应用时的一个重要需求,尤其是在水平扩展和高可用性要求较高的场景下。 在分布式服务或集群服务中往往会出现这样一个问题:用户登录A服务后可以正常访问A服务中的接口。但是我们知道,分布式服务通常都…

ip-协议

文章目录 1. 网络层2. ip协议2.1 ip协议格式2.2 网段划分基本概念网段划分的两种方式为什么要网段划分?特殊的IP地址IP地址数量不足 2.3 私有IP与公网IP2.4 路由 3. IP的分片与组装为什么要分片与组装?如何分片?如何组装? 1. 网络…

ECharts散点图-气泡图,附视频讲解与代码下载

引言: ECharts散点图是一种常见的数据可视化图表类型,它通过在二维坐标系或其它坐标系中绘制散乱的点来展示数据之间的关系。本文将详细介绍如何使用ECharts库实现一个散点图,包括图表效果预览、视频讲解及代码下载,让你轻松掌握…

Jmeter录制https请求

jmeter 5.5版本,chrome浏览器 1、首先添加Test Plan-Thread Group-HTTP(S) Test Script Recorder 2、设置HTTP(S) Test Script Recorder界面的Port(监听端口,设置浏览器代理时需要与这里保持一致)、HTPS Domains(录制…

【Git 常用操作:pull push】

Git 基本概念 Git 是一个先进的开源的分布式版本控制系统,常用于管理工作内容、项目代码等功能。 Git 工作流程 图片来源:https://www.runoob.com/git/git-basic-operations.html 说明: workspace:工作区staging area&#xff…

LLaMA-Factory GLM4-9B-CHAT LoRA 指令微调实战

🤩LLaMA-Factory GLM LoRA 微调 安装llama-factory包 git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git进入下载好的llama-factory,安装依赖包 cd LLaMA-Factory pip install -e ".[torch,metrics]" #上面这步操作会完成…

基于kraft部署kafka集群

kafka介绍 Apache Kafka 是一个开源的分布式事件流平台,被数千家公司用于高性能数据管道、流分析、数据集成和关键任务应用。 Kafka是一个拥有高吞吐、可持久化、可水平扩展,支持流式数据处理等多种特性的分布式消息流处理中间件,采用分布式…

Day13 苍穹外卖项目 工作台功能实现、Apache POI、导出数据到Excel表格

目录 1.工作台 1.1 需求分析和设计 1.1.1 产品原型 1.1.2 接口设计 1.2 代码导入 1.2.1 Controller层 1.2.2 Service层接口 1.2.3 Service层实现类 1.2.4 Mapper层 1.3 功能测试 1.4 代码提交 2.Apache POI 2.1 介绍 2.2 入门案例 2.2.1 将数据写入Excel文件 2.2.2 读取Excel文…

Web前端基础知识(三)

表单的应用非常丰富&#xff0c;可以说&#xff0c;每个网站都会用到表单。下面首先介绍表单中的form标签。 --------------------------------------------------------------------------------------------------------------------------------- <form></form&g…

NLP中的神经网络基础

一&#xff1a;多层感知器模型 1&#xff1a;感知器 解释一下&#xff0c;为什么写成 wxb>0 &#xff0c;其实原本是 wx > t ,t就是阈值&#xff0c;超过这个阈值fx就为1&#xff0c;现在把t放在左边。 在感知器里面涉及到两个问题&#xff1a; 第一个&#xff0c;特征提…

docker安装MySQL--宝塔面板操作版

记录 1 在centos中安装宝塔面板 参照宝塔面板官方网页上步骤进行操作&#xff0c;然后登录网页地址 成功后直接拉取 成功后可以在本地镜像中看到 2 创建配置文件 cd /home/mysql/conf vim my.cnf [rootplmomn-gw conf]# cat /home/mysql/conf/my.cnf [client] #设置客户端…

C++简明教程(3)(初识VS)

一、编程工具大揭秘——IDE 当我们准备踏入 C 编程的奇妙世界时&#xff0c;首先要认识一个重要的“魔法盒子”——集成开发环境&#xff08;IDE&#xff09;。IDE 就像是一个全能的编程工作室&#xff0c;它把我们写代码所需要的各种工具都整合到了一起&#xff0c;让编程这件…

电脑出现 0x0000007f 蓝屏问题怎么办,参考以下方法尝试解决

电脑蓝屏是让许多用户头疼的问题&#xff0c;其中出现 “0x0000007f” 错误代码更是较为常见且棘手。了解其背后成因并掌握修复方法&#xff0c;能帮我们快速恢复电脑正常运行。 一、可能的硬件原因 内存问题 内存条长时间使用可能出现物理损坏&#xff0c;如金手指氧化、芯片…

分布式调度框架学习笔记

一、分布式调度框架的基本设计 二、线程池线程数量设置的基本逻辑 cpu是分时复用的方法&#xff0c;线程是cpu调度的最小单元 如果当前cpu核数是n&#xff0c;计算密集型线程数一般设为n&#xff0c;io密集型(包括磁盘io和网络io)线程数一般设置为2n. 计算密集型线程数一般设…

快速排序算法 -- 深入研究

一 . 快排性能的关键点分析 快排性能的关键点分析 : 决定快排性能的关键点是每次单趟排序后 &#xff0c; key 对数组的分割 &#xff0c; 如果每次选key 基本二分居中&#xff0c;那么快排的递归树就是颗均匀的满二叉树&#xff0c;性能最佳。但是实际中虽然不可能每次都是二…

ORA-65198 PDB clone 时 不能新加datafile 以及hang的一个原因

create pluggable database XX from SS keystore identified by "YYY" parallel 32 service_name_convert( _srv, _srv); 20TB 4小时 update /* rule */ undo$ set name:2,file#:3,block#:4,status$:5,user#:6,undosqn:7,xactsqn:8,scnbas:9,scnwrp:10,inst#:11,…

Android--java实现手机亮度控制

文章目录 1、开发需求2、运行环境3、主要文件4、布局文件信息5、手机界面控制代码6、debug 1、开发需求 需求&#xff1a;开发一个Android apk实现手机亮度控制 2、运行环境 Android studio最新版本 3、主要文件 app\src\main\AndroidManifest.xml app\src\main\res\layou…

HarmonyOS NEXT 实战之元服务:静态案例效果--- 日出日落

背景&#xff1a; 前几篇学习了元服务&#xff0c;后面几期就让我们开发简单的元服务吧&#xff0c;里面丰富的内容大家自己加&#xff0c;本期案例 仅供参考 先上本期效果图 &#xff0c;里面图片自行替换 效果图1完整代码案例如下&#xff1a; import { authentication } …

一起学Git【番外篇:如何在Git中新建文件】

在介绍Git之前&#xff0c;我们需要了解一下如何在Git里添加、编辑和删除文件。 首先&#xff0c;需要使用文件编辑器进行文件的创建&#xff0c;常见的文件编辑器有以下几种&#xff1a; Vim&#xff1a;一种基于命令行的编辑器&#xff0c;功能强大&#xff0c;适合开发者和…