说明:这是一个机器学习实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取。
1.项目背景
滚动加权最小二乘法回归模型(Rolling Weighted Least Squares, RollingWLS)是一种在时间序列分析中动态更新参数估计的方法。它将数据集分为一个移动窗口,并针对窗口内的数据子集应用加权最小二乘法进行回归分析,随着窗口向前滑动,不断对新的观测值纳入并丢弃旧的观测值,从而得到随时间变化的回归系数估计。
滚动加权最小二乘回归模型是一种适应性强、能够捕捉数据动态特性的统计方法,广泛应用于经济、金融、气象学以及其他需要跟踪系统动态行为的领域。
本项目通过RollingWLS回归算法来构建滚动加权最小二乘法回归模型。
2.数据获取
本次建模数据来源于网络(本项目撰写人整理而成),数据项统计如下:
编号 | 变量名称 | 描述 |
1 | x1 | |
2 | x2 | |
4 | y | 因变量 |
数据详情如下(部分展示):
3.数据预处理
3.1 用Pandas工具查看数据
使用Pandas工具的head()方法查看前五行数据:
关键代码:
3.2 数据缺失查看
使用Pandas工具的info()方法查看数据信息:
从上图可以看到,总共有3个变量,数据中无缺失值,共100条数据。
关键代码:
3.3 数据描述性统计
通过Pandas工具的describe()方法来查看数据的平均值、标准差、最小值、分位数、最大值。
关键代码如下:
4.探索性数据分析
4.1 y变量直方图
用Matplotlib工具的hist()方法绘制直方图:
从上图可以看到,y变量主要集中在-2~2之间。
4.2 相关性分析
从上图中可以看到,数值越大相关性越强,正值是正相关、负值是负相关。
5.特征工程
5.1 建立特征数据和标签数据
关键代码如下:
5.2 定义权重
关键代码如下:
6.构建滚动加权最小二乘法回归模型
主要使用RollingWLS回归算法,用于滚动加权最小二乘法回归模型。
6.1 构建模型
编号 | 模型名称 | 参数 |
1 | RollingWLS回归模型 | window=5 |
2 | weights=weights |
7.模型评估
7.1 滚动回归的系数
7.2 滚动窗口的R-squared
8.结论与展望
综上所述,本文采用了RollingWLS算法来构建滚动加权最小二乘法回归模型,最终证明了我们提出的模型效果良好。此模型可用于日常产品的预测。
# 本次机器学习项目实战所需的资料,项目资源如下:
# 项目说明:
# 获取方式一:
# 项目实战合集导航:
https://docs.qq.com/sheet/DTVd0Y2NNQUlWcmd6?tab=BB08J2
# 获取方式二:
链接:https://pan.baidu.com/s/1eO6uMkXpRnyQaX1MyBDxBA
提取码:ovv8