参考资料:用python动手学统计学
使用数据见代码:
dic={
"x":[18.5,18.7,19.1,19.7,21.5,21.7,21.8,22.0,23.4,23.8],
"y":[34,39,41,38,45,41,52,44,44,49]
}
cov_data=pd.DataFrame(dic)
变量x、y的协方差Cov(x,y)的计算公式如下:
协方差的含义:
协方差大于0:一个变量取值越大,另一个变量的取值也越大;
协方差小于0:一个变量取值越大,另一个变量的取值越小;
协方差等于0:两个变量不相关。
numpy.cov()函数可计算出x和y的协方差矩阵。
当指定ddof=0时,计算总体的协方差
当指定ddof=1时,计算样本协方差
在协方差矩阵中,左上到右下的对角线上分别是x和y的标准差,左下到右上的对角线上分别是x和y的标准差。
pearson相关系数
python实现方法:
方法1:dataframe.corr()
方法2:series.corr()
方法3:numpy.corrcoef()