目录
- 解决过拟合(一):增加数据
- 解决过拟合(二):减少特征
- 特征选择
- 缺点
- 解决过拟合(三):正则化
- 总结
解决过拟合(一):增加数据
收集更多训练数据,是解决过拟合的首要方法。
解决过拟合(二):减少特征
如果收集不到更到的训练数据,则看看是否可以使用更少的特征,我们需要特征选择。
特征选择
选择合适的特征集,具体做法是根据直觉,保留你认为最有用的特征(课程专项第二部分会细讲)。
缺点
万一所有特征都是很有用的,特征选择可能会丢弃一些有用的特征。有些算法会自动选择特征集(专项课程二详细说明)。
解决过拟合(三):正则化
尽可能的缩小参数的值,例如0.000014,0.0001。
总结
解决过拟合最常用的三种方法分别是增加训练集数据,减少训练样本特征,以及使用正则化。正则化是使用最多也是效果最好的方法。