一次性掌握数据可视化图表
- 1、引言
- 2、代码示例
- 2.1 等高线密度图
- 2.1.1 安装
- 2.1.2 示例
- 2.2 旭日图
- 2.3 分簇散点图
- 2.4 点图
- 2.5 小提琴图
- 2.6 词云
- 3、总结
1、引言
小屌丝:鱼哥, 老板让我把数据整理成视图。
小鱼:那你就整啊。
小屌丝:我整的不好看。
小鱼:看 内(shen)容(cai)的时候,要什么颜值。
小屌丝:那不行,老板说了,如果我这次把图表整好看了,给我涨薪2K。
小鱼:我去~ 你老板这是考验你啊。
小屌丝:所以…鱼哥 … 嘿嘿…
小鱼:你别嘿嘿了, 你有啥就直说吧。
小屌丝:这次,能不能涨薪,就靠你了。
小鱼:跟我有什么关系, 涨薪也不分给我。
小屌丝:鱼哥,老地方… 听说… 新加项目了…
小鱼:额… 我加班,可没时间去…
小屌丝:确定哈, 票我可有哦
小鱼:… 好吧,那我就帮你一次,就这一次哦。
2、代码示例
2.1 等高线密度图
2.1.1 安装
pip install plotly
然后就是等待着安装。
其它安装方式,直接看这两篇:
- 《Python3,选择Python自动安装第三方库,从此跟pip说拜拜!!》
- 《Python3:我低调的只用一行代码,就导入Python所有库!》
注
- 如果在pycharm 安装失败plotly,需要先安装 Pandas。
2.1.2 示例
代码示例
# -*- coding:utf-8 -*-
# @Time : 2023-03-30
# @Author : Carl_DJ
'''
实现功能:
等高线密度图
'''
import plotly.express as pt
fig = pt.density_contour(demofile, x="sepal_width", y="sepal_length")
fig.update_traces(contours_coloring="fill", contours_showlabels = True)
fig.show()
运行结果
2.2 旭日图
代码示例
# -*- coding:utf-8 -*-
# @Time : 2023-03-30
# @Author : Carl_DJ
'''
实现功能:
旭日图表
'''
import plotly.express as pt
demofile = pt.data.tips()
2.3 分簇散点图
代码示例
# -*- coding:utf-8 -*-
# @Time : 2023-03-30
# @Author : Carl_DJ
'''
实现功能:
分簇散点图
'''
import seaborn as sns
#data是数据源文件
sns.swarmplot(data=demofile, x="species", y="sepal_width")
2.4 点图
代码示例
# -*- coding:utf-8 -*-
# @Time : 2023-03-30
# @Author : Carl_DJ
'''
实现功能:
点图
'''
import seaborn as sns
sns.pointplot(data=demofile,x="species", y="sepal_width")
2.5 小提琴图
代码示例
# -*- coding:utf-8 -*-
# @Time : 2023-03-30
# @Author : Carl_DJ
'''
实现功能:
小提琴图
'''
import seaborn as sns
sns.violinplot(data=demofile, y="sepal_width")
运行结果
2.6 词云
关于词云,我想不用过多介绍, 小鱼也有专篇介绍。
- 《Python3,我只用一段代码,就写了个词云生成器,功能强大到怀疑人生。》
# -*- coding:utf-8 -*-
# @Time : 2023-03-30
# @Author : Carl_DJ
'''
实现功能:
词云生成器
'''
import json
import stylecloud
import codecs
import jieba
from collections import Counter
#过滤掉高频出现的词汇
passwords = set()
#读取词汇文档
content = [line.strip() for line in open('./data/passwords.txt', 'r',encoding='utf8').readlines()]
passwords.update(content)
#获取文档词汇, 并截取长度为3个
def make_words(txt):
make_list = jieba.cut(txt)
c = Counter()
words_list = []
#获取词汇文本
for x in make_list:
#长度为3,超过截取
if len(x) == 3 and x !='\r\n':
c[x] += 1
words_list.append(x)
for k,v in c.most_common(50):
if k not in passwords:
# print(f'{k,v}')
#组合词云内容
return " ".join(words_list)
#读取中大型suv测评.txt内容
with codecs.open('./data/中大型suv测评.txt','r','utf8') as f: #格式需要utf8 否则会报错
txt = f.read()
#
words_txt = make_words(txt)
#设置词云展示的样式,字体,生成文件名称等,
stylecloud.gen_stylecloud(text=words_txt,custom_stopwords=content,
background_color='#1A1A1A',
colors=['#dd4444', '#fec42c', '#fac858'],
max_font_size=100,
output_name='xt6测评.jpg',
font_path="C:/Windows/Fonts/FZSTK.TTF"
)
3、总结
看到这里, 今天的分享差不多就该结束了。
在当前数据分析为主的时代, 学会一两种可视化图表,只有好处没有坏处。
并且,在年终总结或者季度总结中,也都会用到数据可视化分析图表。
所以, 你要不要掌握几种呢?
我是小鱼:
- CSDN 博客专家;
- 阿里云 专家博主;
- 51CTO 博客专家;
- 51认证讲师;
- 金牌面试官;
- 职业规划师;
关注我,带你学习更多更有趣的Python知识。