热力图是一种数据可视化技术,可以显示变量之间的相关性。这个代码段是数据分析和可视化的常用方法,特别适合于展示变量之间的相关性,对于数据科学和机器学习项目非常有帮助。
1、 导入必要的库
首先,确保你已经安装了matplotlib
和seaborn
库。如果没有安装,可以使用以下命令进行安装:
pip install matplotlib seaborn
2、 导入库和创建数据
然后,导入必要的库并创建一个示例数据框 df_model
:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
# 创建示例数据框
np.random.seed(0)
df_model = pd.DataFrame(np.random.randn(10, 5), columns=list('ABCDE'))
# 设置图形大小和分辨率
fig = plt.figure(figsize=(15, 12), dpi=200)
# 创建一个热力图,显示 df_model 数据框的相关性矩阵
ax = sns.heatmap(df_model.corr(), cmap="YlGnBu",
linecolor='black', lw=0.65, annot=True, alpha=0.95)
# 设置 x 轴和 y 轴标签
ax.set_xticklabels([x for x in df_model.columns])
ax.set_yticklabels([y for y in df_model.columns])
# 显示图形
plt.show()
代码说明
fig = plt.figure(figsize=(15, 12), dpi=200)
:创建一个新的图形对象,指定图形的大小和分辨率。sns.heatmap()
:创建一个热力图,参数df_model.corr()
表示输入数据的相关性矩阵,cmap
指定颜色映射,linecolor
和lw
设置线条颜色和宽度,annot=True
表示在每个单元格中显示数据值,alpha
设置透明度。ax.set_xticklabels()
和ax.set_yticklabels()
:设置x轴和y轴的标签,使其与数据框的列名匹配。plt.show()
:显示图形。