最近在 B 站上看到了一个宝藏 up 主,名叫 "Jannchie见齐",专门做动态条形图相关的数据可视化。
可以看到做出的效果还是很不错的,但工具使用的是 JS,不是 Python,于是尝试搜索了一下,看看 Python 有没有相关的库能够做出动态条形图相关的效果。幸运的是还真有相关的库,叫 bar_chart_race,那么下面就来看看相关的用法。
老规矩,使用之前先安装,直接 pip install bar-chart-race 即可。
使用方法
下面来看看使用方法。
import pandas as pd
import bar_chart_race as bcr
# 如果出现SSL错误,则全局取消证书验证
# import ssl
# ssl._create_default_https_context = ssl._create_unverified_context
# 获取数据
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 生成 GIF 图像
bcr.bar_chart_race(df, "covid19_horiz.gif")
我们看到代码非常简单,就是将数据转成 pandas 的 DataFrame,然后调用 bar_chart_race 即可生成 GIF 图像。
整体还是不错的,然后我们重点来看一下数据:
其中表头就是 GIF 图表中 Y 轴的部分,但需要注意的是,我们的图表是随时间不断变化的,所以我们在生成 DataFrame 的时候必须将 date 字段设置为索引。然后数据随着时间不断变化,并且条形图之间会根据数据的大小进行排序。
当然了,以上只是默认生成的,bar_chart_race 里面还有很多的参数,我们来看一下。
动态条形图变动态柱状图
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, "covid19_horiz.gif", orientation='v')
我们看到为了避免文字发生重叠,自动倾斜了,所以还是比较人性化的。
排序方式,默认为降序
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置排序方式
bcr.bar_chart_race(df, "covid19_horiz.gif", sort='asc')
条目数限制
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置最多能显示的条目数,这里最多显示 6 条
bcr.bar_chart_race(df, 'covid19_horiz.gif', n_bars=6)
设置固定类目
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 选取如下 5 个国家的数据
bcr.bar_chart_race(df, 'covid19_horiz.gif', fixed_order=['Iran', 'USA', 'Italy', 'Spain', 'Belgium'])
固定数值轴,使其不发生动态变化
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置数值的最大值,固定数值轴
bcr.bar_chart_race(df, 'covid19_horiz.gif', fixed_max=True)
设置图像帧数,默认 10 帧
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 图像帧数:数值越小,越不流畅;越大,越流畅
bcr.bar_chart_race(df, 'covid19_horiz.gif', steps_per_period=3)
可以看到,动图变得不流畅了。
设置帧率,单位时间默认为 500ms
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置帧率为 200ms,总共 20 帧
bcr.bar_chart_race(df, 'covid19_horiz.gif', steps_per_period=20, period_length=200)
设置每帧增加的标签时间,默认为 False
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, 'covid19_horiz.gif', interpolate_period=True)
绘图属性设置
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# figsize:设置画布大小,默认 (6, 3.5)
# dpi:图像分辨率,默认 144
# label_bars:显示柱状图的数值信息,默认为 True;指定为 False 则不显示;指定为字典,则自定义显示属性
# period_label:显示时间标签信息,默认为 True;指定为 False 则不显示;指定为字典,则自定义显示属性
# period_fmt:设置日期格式
# title:图表标题
# title_size:标题字体大小
# shared_fontdict:全局字体属性,例如 {'family': 'Helvetica', 'weight': 'bold', 'color': 'rebeccapurple'}
bcr.bar_chart_race(df, 'covid19_horiz.gif', figsize=(5, 3), dpi=100, label_bars=False,
period_label={'x': .99, 'y': .1, 'ha': 'right', 'color': 'red'},
title='COVID-19 Deaths by Country')
条形图属性,可以设置透明度,边框等
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# bar_kwargs:条形图属性
bcr.bar_chart_race(df, 'covid19_horiz.gif', bar_kwargs={'alpha': .2, 'ec': 'black', 'lw': 3})
添加动态文本
import pandas as pd
import bar_chart_race as bcr
import matplotlib.pyplot as plt
# 设置字体,否则无法显示中文
plt.rcParams['font.sans-serif'] = ['SimHei'] # Windows
# plt.rcParams['font.sans-serif'] = ['Hiragino Sans GB'] # Mac
plt.rcParams['axes.unicode_minus'] = False
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
def summary(values, ranks):
# 动态文本的内容
"""
values 为 df 的每一行(Series),例如
Belgium 1143.0
China 3326.0
France 6520.0
Germany 1275.0
Iran 3294.0
Italy 14681.0
Netherlands 1490.0
Spain 11198.0
USA 7418.0
United Kingdom 3611.0
Name: 2020-04-03, dtype: float64
ranks 则是针对 values 的值进行了排名,例如
Belgium 1.0
China 5.0
France 7.0
Germany 2.0
Iran 4.0
Italy 10.0
Netherlands 3.0
Spain 9.0
USA 8.0
United Kingdom 6.0
Name: 2020-04-03, dtype: float64
"""
all_people = int(values.sum())
ranks_country = ranks.sort_values().index
s = f'总死亡人数:{all_people},死亡人数最多的国家:{ranks_country[-1]},死亡人数最少的国家:{ranks_country[0]}'
# 设置文本位置、数值、大小、颜色等
return {'x': .99, 'y': .05, 's': s, 'ha': 'right', 'size': 8}
# 添加文本
bcr.bar_chart_race(df, 'covid19_horiz.gif', period_summary_func=summary)
添加垂直条
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
# 设置垂直条数值,分位数
def func(values, ranks):
return values.quantile(.9)
# 添加垂直条
bcr.bar_chart_race(df, 'covid19_horiz.gif', perpendicular_bar_func=func)
设置柱状图颜色
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, 'covid19_horiz.gif', cmap="plotly3")
那么颜色都有哪些呢?
from pprint import pprint
from bar_chart_race._colormaps import colormaps
pprint(list(colormaps.keys()))
"""
['dark12',
'dark12_r',
'plotly3',
'viridis',
'cividis',
'inferno',
'magma',
'plasma',
'blackbody',
'bluered',
'electric',
....
....
"""
柱状图颜色不重复
import pandas as pd
import bar_chart_race as bcr
df = pd.read_csv('covid19_tutorial.csv', index_col=["date"])
bcr.bar_chart_race(df, 'covid19_horiz.gif', cmap="plotly3", filter_column_colors=True)
以上就是绝大部分配置,当然源码中注释写的也比较详细,可以点进去看一下。