用NeuralProphet预测股价:AI金融新利器(附源码)

作者:老余捞鱼

原创不易,转载请标明出处及原作者。

写在前面的话:我用NeuralProphet模型预测了股票价格,发现其通过结合时间序列分析和神经网络算法,确实能提供比传统Last Value方法更精准的预测。经过一系列超参数调优,其预测效果更是显著,如果你也对AI金融股价预测感兴趣,这篇文章会给你带来不少启发。

一、NeuralProphet 概述

在本文中,我们将尝试用 NeuralProphet 来预测股票价格。NeuralProphet 是由 Meta 公司开发的,据说比之前的 Prophet 软件包更强大。在之前的文章中,我们用 Prophet 做过类似的任务,但效果不太理想。这次,我们将看看 NeuralProphet 是否能带来更好的表现。根据 NeuralProphet 官网的介绍:

NeuralProphet - 使用标准深度学习方法融合传统时间序列算法,基于 PyTorch 构建,灵感来自 Facebook Prophet 和 AR-Net。

NeuralProphet 采用可分解的时间序列模型,其模型组件包括趋势、季节性、事件效应和回归效应。它们的组合公式为:

y(t) = T(t) + S(t) + E(t) + F(t) + A(t) + L(t),

where 

T(t) = Trend at time t
S(t) = Seasonal effects at time t
E(t) = Event and holiday effects at time t
F(t) = Regression effects at time t for future-known exogenous variables
A(t) = Auto-regression effects at time t based on past observations
L(t) = Regression effects at time t for lagged observations of exogenous variables

这种可分解的时间序列在预测领域非常常见。在文章的后半部分,我们会详细讲解如何调整上述方程中的各个组成部分,以便更好地优化预测结果。

官网地址如下:NeuralProphet

二、目的

我们的核心任务是利用过去 N 天的历史数据,预测 Vanguard 全市场 ETF(VTI)每日调整后的收盘价。为了实现这一目标,我们使用了 VTI 从 2013 年 1 月 2 日到 2018 年 12 月 28 日共 6 年的历史价格数据。这些数据可以从雅虎财经轻松获取,下载后的数据集结构如下所示。通过这个项目,我们旨在验证 NeuralProphet 模型在股价预测中的表现,并探索其在实际投资分析中的应用潜力。

我们总共有 1509 天的数据可供使用。整个数据集中的调整后收盘价图如下所示:

我们使用以下公式计算每日收益

其中,r(t) 和 p(t) 分别表示第 t 天的日收益率和调整后收盘价。为了观察每日收益的分布情况,我们绘制了下面的分布图:

如上图所示,分布图非常接近高斯分布。为了进一步验证这一点,我们使用 scipy.stats 软件包绘制概率图,如下所示。对于 scipy.stats 中的概率图,默认情况下是将样本分布与高斯分布进行比较。与红色直线的拟合度越高,则与高斯分布的拟合度越高。我们观察到,除了极端值(约 > +/- 2.5)外,每日回报的分布与高斯分布的拟合程度相当高。

为了全面评估 NeuralProphet 的性能,仅仅在单一日期进行一次预测是远远不够的。因此,我们将在数据集中的多个不同日期进行多次预测,并取这些预测结果的平均值作为最终评估依据。在每次预测中,我们都会将 NeuralProphet 方法与 Last Value 方法进行对比,以更客观地衡量 NeuralProphet 的准确性和稳定性。这种方法不仅能减少随机误差的影响,还能更好地反映模型在实际应用中的表现。

为了评估我们方法的有效性,我们将使用均方根误差 (RMSE)、平均绝对百分比误差 (MAPE) 和平均绝对误差 (MAE) 指标。对于所有指标,数值越小,预测效果越好。

三、训练和验证

为了进行预测,我们需要将数据分为训练集和验证集。具体来说,我们将使用 3 年的数据(约 756 天,按每年 252 个交易日计算)作为训练集,并用接下来 1 年的数据(252 天)作为验证集。这意味着每次预测都需要 1,008 天的数据(756 天训练 + 252 天验证)。模型会在训练集上进行训练,而验证集则用于调整超参数。

为了优化超参数,我们采用了移动窗口验证法。举个例子,假设我们总共有 896 天的数据,并希望在第 857 天进行为期 40 天的预测。根据经验,对于预测范围 H,我们通常每隔 H/2 天进行一次预测。通过 756 天的训练集,我们可以进行 4 次验证(如下图所示)。我们会计算这 4 次验证的误差指标(如 RMSE、MAPE 等),并取其平均值。最终,选择误差平均值最小的超参数组合作为最佳模型配置。确定最佳超参数后,我们将在第 857 天进行预测并报告结果。这种方法不仅能提高模型的稳定性,还能更准确地评估其在实际应用中的表现。

在下文中,我们将首先对数据集的第 1009 天进行预测,预测期限为 21 天(注意,一个月约有 21 个交易日,不包括周末)。对于 NeuralProphet,我们将使用前 1008 天作为训练集和验证集,如上文所述,按 756:252 的比例分割。我们将在下一节首先解释最后值方法。

四、Last Value

在"Last Value"方法中,预测值直接采用最近一次的观测值。具体到我们的应用场景,就是将当前的调整后收盘价预测为前一天的调整后收盘价。这种方法具有以下特点:

  • 实现简单,计算成本最低。
  • 无需进行任何超参数调整。
  • 常被用作评估更复杂预测模型的基准。

基于该方法,我们对数据集第1009天进行了21天期限的预测。这种朴素预测方法虽然简单,但在某些情况下可能表现出令人惊讶的有效性,特别是在时间序列具有较强持续性的情况下。

上述预测的 RMSE 为 1.89,MAPE 为 1.59%,MAE 为 1.80。

五、运行预测


5.1 无超参数调整的 NeuralProphet

要使用 NeuralProphet 运行预测,请使用下面的代码。

from neuralprophet import NeuralProphet, set_random_seed

train_size = 252*3                     # Use 3 years of data as train set
val_size = 252                         # Use 1 year of data as validation set
train_val_size = train_size + val_size # Size of train+validation set
i = train_val_size                     # Day to forecast
H = 21                                 # Forecast horizon

set_random_seed(random_seed) # Set a random seed for reproducibility

m = NeuralProphet()
m.set_plotting_backend("plotly-static")
metrics = m.fit(df_nprophet[i-train_val_size:i])

# Create dataframe with the dates we want to predict
future = m.make_future_dataframe(df_nprophet[i-train_val_size:i], n_historic_predictions=True, periods=H)

# Predict
forecast = m.predict(future)

为了快速直观,我们使用 Prophet 绘制预测图:

m.plot(forecast)

这个模型结构较为基础,其初始配置包括趋势项、每周周期性变化以及年度周期性变化。您可以根据以下方式单独查看每个组成部分的内容。

m.plot_components(forecast);

请注意观察就会发现,周季节性曲线图几乎是平的,这意味着 NeuralProphet 无法检测到周内差异。

单个系数的数值也可以绘制成如下图所示,以获得更深入的了解。

m.plot_parameters()

请注意,上面显示的 "季节性:年图 "和 "季节性:周图 "是成分图的一个周期。

在上图的预测中,显示的是股票收益预测。我们可以使用代码将其转换为价格:

# Convert back to price
est_adj_close = []
prev_tg = df.loc[i-1, 'adj_close']
for n in range(H):
    est_adj_close.append((float(preds_list.iloc[n])/100+1)*prev_tg)
    prev_tg = (float(preds_list.iloc[n])/100+1)*prev_tg

之后,股票价格的预测结果如下。

上述预测的 RMSE 为 1.60,MAPE 为 1.35%,MAE 为 1.52。

5.2 带有超参数调整功能的 NeuralProphet - Changepoints

时间序列的轨迹通常会发生突变。这种变化点检测的强度可以通过参数 n_changepoints 来调整。增加 n_changepoints 会使趋势更灵活,导致过度拟合。减少 n_changepoints 会降低趋势的灵活性,导致拟合不足。默认情况下,该参数设置为 10。

在偏移量 m 的基础上,再将增长率 k 乘以自起点 t0 起的时间差 (t1-t0),就得到了 t1 时刻的趋势效应。

trend(t1) = m + k(t1 - t0) = trend(t0) + k(t1-t0)

测试 n_变化点的值为 2、5、10、15 和 20。对于 n_changepoints 的每个值,我们使用训练集和验证集进行预测,结果如下:

上述过程共耗时 8 分钟。接下来,我们使用这个值在测试集上运行预测。结果如下所示。

上述预测的 RMSE 为 2.75,MAPE 为 2.35%,MAE 为 2.65。

5.3 带有超参数调整的 NeuralProphet - Monthly Seasonality


每月的季节性可以在 NeuralProphet 中这样设置:

m = NeuralProphet()
m = m.add_seasonality(name="monthly", period=30.5, fourier_order=3)


NeuralProphet 中的季节性是借助傅立叶项来建模的。上述傅立叶阶数指的是用于估计季节性的偏和中的项数。

使用 2、4、6、8 和 10 的傅立叶阶数值进行测试。对于每个傅立叶阶数值,我们使用训练集和验证集进行预测,结果如下:

上述过程总共耗时 8 分钟。接下来,我们使用这个值在测试集上进行预测。结果如下所示。


上述预测的 RMSE 为 2.19,MAPE 为 1.87%,MAE 为 2.12。

5.4 带有超参数调整功能的 NeuralProphet - 活动和假期

在节假日期间,股市的走势可能会受到影响。以“圣诞反弹”现象为例,这是指股市在圣诞节期间通常会出现的上涨趋势。NeuralProphet 在进行市场预测时能够将这些特定事件纳入考量。为此,我们首先需要创建一个事件数据框,如下所示,这一步骤可以通过导入CSV文件轻松完成。

事件可以在 NeuralProphet 中这样设置(events 就是上图所示的数据帧):

m = NeuralProphet()
m.add_events("hols", lower_window=lower_window, upper_window=upper_window)
history_df = m.create_df_with_events(df, holidays)
m.fit(history_df)
future = m.make_future_dataframe(history_df, events_df=events, n_historic_predictions=True, periods=H)
forecast = m.predict(future)

窗口大小超参数将假期扩展到日期周围的 [lower_window, upper_window]天数。为简单起见,假设 lower_window 和 upper_window 的大小相同,即 lower_window = upper_window = 窗口大小。我们将测试窗口大小的值 0、1 和 2。对于每个窗口大小值,我们使用训练集和验证集进行预测,结果如下:

过程共耗时 5 分钟。接下来,我们使用这个值在测试集上进行预测。结果如下所示。

预测的 RMSE 为 2.05,MAPE 为 1.74%,MAE 为 1.96。

5.5 带有超参数调整功能的 NeuralProphet - 自回归

自回归是一种时间序列模型,它使用前一时间步的观测值作为回归方程的输入,以预测下一时间步的值。

NeuralProphet 中的自回归由 n_lags 参数决定。我们将测试 n_lags 的值 0、2、5 和 10。对于每个 n_lags 值,使用训练集和验证集进行预测,结果如下:

上述过程共耗时 7 分钟。接下来,我们使用这个值在测试集上运行我们的预测。结果如下所示。

预测的 RMSE 为 1.18,MAPE 为 0.89%,MAE 为 1.01。

5.6 带有超参数调整功能的 NeuralProphet - 结合所有超参数

下一步将测试超参数的组合,找出最佳的超参数集。以网格搜索方式测试上述每个超参数组合总共需要 5 * 5 * 3 * 4 * 7 分钟 = 35 小时。为了节省时间,参考上述结果,只用以下值进行测试:

n_changepoints_list = [2, 5]
fourier_order_list = [6, 8]
window_list = [1]         
n_lags_list = [0, 2] 

此外,我们还尝试了上述超参数,首先是不带事件超参数的超参数,其次是带事件超参数的超参数。以下是不带事件超参数的结果。

以下是使用事件超参数得出的结果。

从上面可以看出,n_changepoints、fourier_order、window 和 n_lags 的最佳值分别为 2、6、1、2 和使用事件。接下来,我们使用这些值在测试集上运行我们的预测。结果如下所示。

上述预测的 RMSE 为 1.04,MAPE 为 0.81%,MAE 为 0.91。

经过对所有超参数的细致优化,我们在第1009天的预测中,利用NeuralProphet模型取得了卓越的表现。在完成超参数的全面调整后,该模型在RMSE、MAPE和MAE指标上均达到了最低值,超越了包括Last Value基准在内的其他所有预测方法。接下来,我们将探究NeuralProphet模型在其他日期的预测成效。

5.7 多日预测

在审视了上述超参数调整带来的成果之后,我们计划将这种方法扩展应用,以对连续多天进行预测。我们的预测将从数据集的第1009天起步,并以42天为周期进行新一轮预测。鉴于数据集包含1509天的数据,我们将执行共计12轮的预测。每轮预测都将覆盖未来21天的时间范围。同时,对于每一天t的预测,我们都将应用之前确定的最优超参数配置。

从上文中可以明显看出,并非所有的预测结果都是理想的。有些日期的预测方向和幅度与实际值相当接近,然而在其他日期,预测的方向和幅度则与实际值相去甚远。以下展示了每项预测的性能指标结果。

让我们将上述结果与下图所示的 " Last Value "方法进行比较。

NeuralProphet 在12次预测中的平均RMSE为2.15,平均MAPE为1.41%,平均MAE为1.88。相比之下,Last Value方法的平均RMSE为2.53,平均MAPE为1.69%,平均MAE为2.26。在这些指标上,NeuralProphet 显然表现更为优异。这一结果颇为有趣,因为在我的先前实验中,使用的是Prophet而非NeuralProphet,那时Last Value方法的表现更为突出。在这个案例中,NeuralProphet 的贡献不容小觑。

六、观点总结

  • NeuralProphet 在股价预测中表现卓越:文章通过对比 Last Value 方法和 Prophet 模型,证实 NeuralProphet 在预测股价时具有更高的准确性,成为金融分析中的新利器。
  • 超参数调优是提升模型性能的关键:作者通过调整 changepoints、fourier_order、window_size 和 n_lags 等超参数,展示了如何优化模型,从而显著提升预测效果。
  • 事件和假期对股市影响不可忽视:文章强调了节假日和特殊事件对股价波动的重要性,提醒我们在建模时需充分考虑这些因素,以提高预测精度。
  • 自回归显著提升预测准确性:通过引入自回归参数 n_lags,NeuralProphet 能够更好地捕捉时间序列中的动态变化,从而大幅提升预测的可靠性。
  • NeuralProphet 具备高度灵活性和扩展性:作者通过添加事件数据框架和调整季节性参数,展示了 NeuralProphet 如何适应复杂的市场环境,满足多样化的预测需求。
  • 多日预测实验证明 NeuralProphet 的优越性:在多次预测实验中,NeuralProphet 的 RMSE、MAPE 和 MAE 指标均优于 Last Value 方法,展现了其在股价预测领域的巨大潜力。

代码地址:Stocks2025/StockReturnsPrediction_fh21/StockReturnsPrediction_v9_neuralprophet.ipynb at master · alexyu2013/Stocks2025 · GitHub

谢您阅读到最后,希望本文能给您带来新的收获。码字不易,请帮我点赞、分享。祝您投资顺利!如果对文中的内容有任何疑问,请给我留言,必复。


本文内容仅限技术探讨和学习,不构成任何投资建议。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/965649.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

现场流不稳定,EasyCVR视频融合平台如何解决RTSP拉流不能播放的问题?

视频汇聚EasyCVR安防监控视频系统采用先进的网络传输技术,支持高清视频的接入和传输,能够满足大规模、高并发的远程监控需求。平台灵活性强,支持国标GB/T 28181协议、部标JT808、GA/T 1400协议、RTMP、RTSP/Onvif协议、海康Ehome、海康SDK、大…

html转PDF文件最完美的方案(wkhtmltopdf)

目录 需求 一、方案调研 二、wkhtmltopdf使用 如何使用 文档简要说明 三、后端服务 四、前端服务 往期回顾 需求 最近在做报表类的统计项目,其中有很多指标需要汇总,网页内容有大量的echart图表,做成一个网页去浏览,同时…

记录 | WPF创建和基本的页面布局

目录 前言一、创建新项目注意注意点1注意点2 解决方案名称和项目名称 二、布局2.1 Grid2.1.1 RowDefinitions 行分割2.1.2 Row & Column 行列定位区分 2.1.3 ColumnDefinitions 列分割 2.2 StackPanel2.2.1 Orientation 修改方向 三、模板水平布局【Grid中套StackPanel】中…

电脑开机提示按f1原因分析及终极解决方法来了

经常有网友问到一个问题,我电脑开机后提示按f1怎么解决?不管理是台式电脑,还是笔记本,都有可能会遇到开机需要按F1,才能进入系统的问题,引起这个问题的原因比较多,今天小编在这里给大家列举了比…

【数据结构】(6) LinkedList 链表

一、什么是链表 1、链表与顺序表对比 不同点LinkedListArrayList物理存储上不连续连续随机访问效率O(N)O(1)插入、删除效率O(1)O(N) 3、链表的分类 链表根据结构分类,可分为单向/双向、无头结点/有头节点、非循环/循环链表,这三组每组各取…

Mac电脑上好用的压缩软件

在Mac电脑上,有许多优秀的压缩软件可供选择,这些软件不仅支持多种压缩格式,还提供了便捷的操作体验和强大的功能。以下是几款被广泛推荐的压缩软件: BetterZip 功能特点:BetterZip 是一款功能强大的压缩和解压缩工具&a…

VUE 集成企微机器人通知

message-robot 便于线上异常问题及时发现处理,项目中集成企微机器人通知,及时接收问题并处理 企微机器人通知工具类 export class MessageRobotUtil {constructor() {}/*** 发送 markdown 消息* param robotKey 机器人 ID* param title 消息标题* param…

通信易懂唠唠SOME/IP——SOME/IP-SD服务发现阶段和应答行为

一 SOME/IP-SD服务发现阶划分 服务发现应该包含3个阶段 1.1 Initial Wait Phase初始等待阶段 初始等待阶段的作用 初始等待阶段是服务发现过程中的一个阶段。在这个阶段,服务发现模块等待服务实例的相关条件满足,以便继续后续的发现和注册过程。 对…

Day 30 卡玛笔记

这是基于代码随想录的每日打卡 93. 复原 IP 地址 有效 IP 地址 正好由四个整数(每个整数位于 0 到 255 之间组成,且不能含有前导 0),整数之间用 . 分隔。 例如:"0.1.2.201" 和 "192.168.1.1" …

【中间件】 Kafka

1.先导知识: 消息队列MQ(Message Queue): 将需要传输的数据临时(设置有效期)存放在队列中,进行存取消息消息队列中间件: 用来存储消息的中间件(组件) 2.消息队列的应用场景 异步处理 为什么要使用消息队列? 比较耗时的操作放在其他系统中…

给排水 笔记

给水管(上水管) 概述 专用于上水系统的管道。 单位 基本单位解读 项概述符号表示备注公称直径(DN)指管道的平均外直径。是行业描述的标准,是参考值,并非指任何直径。-理论外直径。公称外径&#xff08…

React 设计模式:实用指南

React 提供了众多出色的特性以及丰富的设计模式,用于简化开发流程。开发者能够借助 React 组件设计模式,降低开发时间以及编码的工作量。此外,这些模式让 React 开发者能够构建出成果更显著、性能更优越的各类应用程序。 本文将会为您介绍五…

C++11详解(三) -- 可变参数模版和lambda

文章目录 1.可变模版参数1.1 基本语法及其原理1.2 包扩展1.3 empalce系列接口1.3.1 push_back和emplace_back1.3.2 emplace_back在list中的使用(模拟实现) 2. lambda2.1 lambda表达式语法2.2 lambda的捕捉列表2.3 lambda的原理 1.可变模版参数 1.1 基本…

【数据结构】_时间复杂度相关OJ(力扣版)

目录 1. 示例1:消失的数字 思路1:等差求和 思路2:异或运算 思路3:排序+二分查找 2. 示例2:轮转数组 思路1:逐次轮转 思路2:三段逆置(经典解法) 思路3…

OSPF基础(2):数据包详解

OSPF数据包(可抓包) OSPF报文直接封装在IP报文中,协议号89 头部数据包内容: 版本(Version):对于OSPFv2,该字段值恒为2(使用在IPV4中);对于OSPFv3,该字段值恒为3(使用在IPV6中)。类型(Message Type):该OSPF报文的类型。…

第二篇:前端VSCode常用快捷键-以及常用技巧

继续书接上一回, 我们讲解了常用的vscode 插件。 vscode 常用的插件地址: 前端VSCode常用插件-CSDN博客 本篇文章,主要介绍vscode常用的快捷键,可以提高我们的开发效率。 一、VSCode常用的快捷键 注意,其实这个快捷…

【LeetCode】152、乘积最大子数组

【LeetCode】152、乘积最大子数组 文章目录 一、dp1.1 dp1.2 简化代码 二、多语言解法 一、dp 1.1 dp 从前向后遍历, 当遍历到 nums[i] 时, 有如下三种情况 能得到最大值: 只使用 nums[i], 例如 [0.1, 0.3, 0.2, 100] 则 [100] 是最大值使用 max(nums[0…i-1]) * nums[i], 例…

vue生命周期及其作用

vue生命周期及其作用 1. 生命周期总览 2. beforeCreate 我们在new Vue()时,初始化一个Vue空的实例对象,此时对象身上只有默认的声明周期函数和事件,此时data,methods都未被初始化 3. created 此时,已经完成数据观测&#xff0…

什么是三层交换技术?与二层有什么区别?

什么是三层交换技术?让你的网络飞起来! 一. 什么是三层交换技术?二. 工作原理三. 优点四. 应用场景五. 总结 前言 点个免费的赞和关注,有错误的地方请指出,看个人主页有惊喜。 作者:神的孩子都在歌唱 大家好…

e2studio开发RA2E1(5)----GPIO输入检测

e2studio开发RA2E1.5--GPIO输入检测 概述视频教学样品申请硬件准备参考程序源码下载新建工程工程模板保存工程路径芯片配置工程模板选择时钟设置GPIO口配置按键口配置按键口&Led配置R_IOPORT_PortRead()函数原型R_IOPORT_PinRead()函数原型代码 概述 本篇文章主要介绍如何…