神经网络学习的方式,就是不断的试错。知道了错误,然后沿着错误的反方向(梯度方向)不断的优化,就能够不断的缩小与真实世界的差异。
此时,如何评价正确答案与错误答案,错误的有多么的离谱,就需要一个评价指标。这时候,损失和损失函数就运用而生。
开始之前,我们先做一个简单的思考:假设,我们要比较两个正态分布的模型的差异,那该如何做?
我们都知道,描述一个正太分布的模型,只需要用到均值和方差即可。如果要进行比较两个都是已知是正太分布的,那直接比较描述两个模型的均值和方差就行。
那如果,两个不知道长什么样子的模型,该如何比较呢?
一、什么是损失?什么是损失函数?
- 单个样本的预测值PD,与标注的真实值GT的差,称之为损失;
- 用于计算损失的函数,称之为损失函数;
- 损失函数是非负实数值函数。
二、损失函数是怎么来的
我们都知道许多的损失函数,和表达损失函数计算的公式,比如交叉熵损失、均方误差损失,那这些损失函数的表达形式是怎么来的?这个点是不是没有仔细的想过呢?
入门弄懂这一点,推荐学习视频(前后建议翻看三遍)&#