此图用的是箱状图,的纵轴是“Pearson’s r”,是实际观测值与机器学习模型预测值之间的相关性
Pearson's f得分,它是一个统计量,用来衡量两个变量之间线性相关性的强度。这个得分可能是用来衡量实际观测值与机器学习模型预测值之间的相关性。
Pearson's f得分的范围从-1到1:
- 一个接近1的得分表示一个非常强的正相关性,意味着模型的预测值随着观测值的增加而增加。
- 一个接近-1的得分则表示一个非常强的负相关性,即模型的预测值随着观测值的增加而减少。
- 一个接近0的得分表示几乎没有或没有线性相关性。
得分越接近1,表示模型的预测准确度越高。
对于上图来说:
他这个中位线在箱子靠上或者靠下的位置是什么含义?
对于Pearson's r来说,由于它是衡量正相关性的指标,箱线图中的中位数线位置(无论靠上还是靠下)并不直接反映偏态,而是反映在一系列测试中模型预测与实际值相关性的一致性和准确性的中间值。简单来说,中位数线越靠近1.00,表示模型预测与实际值的相关性越强,性能越好。中位数线的位置在箱体内上方或下方,主要说明了数据的分布情况,而不是偏态。在这个特定的上下文中,我们关心的是中位数线与1.00这个完全正相关的值有多接近,而不是它在箱体内的相对位置。