问题预览
- 为什么要可视化成本函数?
- 可视化之后的成本函数是什么样子?
- 如何在三维空间里通过w和b找到一个成本函数的值?
- 如何在三维空间里找到成本函数的最小值?
解读
可视化成本函数:为了更加方便的看到不同的w和b,是如何影响成本函数的。上节课只看到了w如何影响成本函数,这节课回归到原始模型,也就是w和b是如何一起影响成本函数的。
可视化
- 三维空间展示:w和b两个参数,共同影响着成本函数的值,z轴的值即为成本函数的值。三维空间确认成本函数的值:找到w和b的值,这两点对应的z轴,就是成本函数的值。
三维空间找到成本的最小值
- 等高线图:假设有一座山,我们想知道山的等高线图。
- 从上往下看山,就是等高线图的样子。
- 回到模型中,先看最下方,它是w,b,成本函数的三维空间图,图里三个不同颜色的点表示我们选择对应位置的w,b,以及对应的成本函数的值。
- 再看右上方,我们制作了三维空间图的等高线图,三个点同样对应了不同的w和b,但是J(成本函数)的值是一样的,因为等高线图,我们没有了高度。但是我们知道,w和b移动到等高线图最中心圆圈时,成本函数的值是最小的。因为当w和b处于最中心圆圈这个位置时,在三维空间里对应的恰好是碗底的形状,而在三维空间里,碗底的位置就是成本函数的最小值。
- 左上方的图表示房子大小和房子价格,三条不同颜色的线表示我们所选择不同的w和b绘制的线性回归。此时我们的w和b远离碗底的位置,代表通过成本函数的值是很大的,也就是表示模型预测误差会很大,因此在绘制左上方的线性模型图时,能够看到选择图里的w和b的值构建的模型,没有很好的拟合训练集这些数据。合适的模型,线条趋势应该是沿着右上方,而图里的三条线全是冲着左下方。
总结
通过三维空间,我们看到了w和b与成本函数的值的关系。
通过等高线图,我们知道了如何选择w和b,才能最小化成本函数。
下节课会通过等高线图,演示多种w和b,以及对应成本函数的值,更加直观的看到影响。