定义:使用多项式函数来拟合数据点,以预测因变量和自变量之间的关系。
基本形式如下:
理解:
在了解了线性回归模型之后,我们会意识到数据集上的点有时使用曲线拟合效果会更好。我们可以选择使用多项式曲线进行拟合。
还是以房价的模型为例,假设数据集如下图中的点阵所示:我们提取的特征为占地大小,则将大小的平方设为第二个特征,大小的立方设为第三个特征可以得到下图中框出的特征函数。当然,我们也可以选择使用平方根的方式。
Scikit-learn库
Scikit-learn是一个用于机器学习的Python库,它提供了各种工具和算法,用于数据挖掘和数据分析。Scikit-learn包含了许多常用的机器学习算法,包括分类、回归、聚类、降维、模型选择和预处理等功能。
学习地址:scikit-learn中文社区