- 深度学习就是训练神经网络。
1、神经网络
- 举个最简单的例子,以下是一个使用线性回归来预测房屋价格的函数。
- 这样一个用于预测房屋价格的函数被称作是一单个神经元。
- 大一点的神经网络,就是将这些单个神经元叠加起来。例如:
- 神经网络根据多个相关联的输入来预测房屋价格。但这只是人为表示,真正的神经网络并不是这样的,如下图所示。
- 实际的神经网络中,隐藏单元的输入同时来自所有的特征。也就是说,我们不会具体地说第一个单元表示家庭成员数,或者家庭成员数取决于x1和x2。而是神经网络自行决定这个单元是什么,我们给予它四个特征,随便它如何计算。
- 只要给神经网络足够多的x、y训练样本,神经网络就能准确地计算出x到y的映射函数。
2、监督学习
- 监督学习旨在从已知的输入和输出样本中学习预测新的输入对应的输出,其关键特点是学习过程中使用了标记的训练数据。上述整个预测房屋价格的过程就是监督学习的过程。
- 关系理解:
- 神经网络在监督学习中的应用:
- 前馈神经网络(FNN),如:房屋价格预测
- 卷积神经网络(CNN)——图像领域,如:面部识别
- 循环神经网络(RNN)——序列数据,如:音频和语言处理
- 混合神经网络,如:智能驾驶
- 监督学习可以分为两类问题:
- 回归:当输入和输出存在关系时,则是回归。如:预测房屋价格。
- 分类:当通过输入判断其类别时,则是分类。如:判断男性女性。
- 监督学习的步骤:
- 收集标注数据集:收集包含输入特征和输出标签的训练数据集。
- 数据预处理:包括数据清洗、数据变换、特征工程等,将原始数据转换为模型可用的数据表示。
- 选择模型:选择监督学习模型,如线性回归、神经网络、决策树等。
- 训练模型:使用训练集数据对选择的模型进行训练,学习输入和输出之间的映射关系。
- 评估模型:在验证集上评估模型的性能,如精度、召回率、ROC曲线等。
- 优化模型:根据评估结果,对模型或者训练过程进行优化,如调参、增数据、 Ensemble等。
- 测试模型:在测试集上评估模型的泛化性能。
- 应用模型:将训练好的模型应用到实际问题中进行预测,如分类或回归等。
- 持续迭代:持续收集新数据并重复上述步骤,进行模型更新。