“IVE: Enhanced Probabilistic Forecasting of Intraday Volume Ratio with Transformers”
论文地址:https://arxiv.org/pdf/2411.10956
摘要
本文介绍了一种创新的金融市场成交量比预测技术,特别适用于VWAP(成交量加权平均价格)策略的执行。研究中采用了Transformer模型来预测每分钟级别的日内成交量比例,并通过对数正态变换处理以稳定高波动性的数据。为了增强预测精度,输入的数据集涵盖了成交量统计特征、外部与成交量有关的因素、绝对时间标记以及个股属性。
该模型架构基于编码器-解码器类型的Transformer,并配置了分布头以实现贪婪采样,旨在优化对高流动性股票的预测效果。此外,模型引入了概率性预测机制,用以估计成交量比的期望值和离散程度,从而能够提前识别出重要的日内成交量高峰。在韩国市场使用简化交易逻辑作为代理进行的实际测试表明,相较于传统的VWAP基准,此方法在两个半月的时间段内表现出更佳的性能。研究表明,基于Transformer的概率预测模型在成交量比预测方面展现出了潜力,为后续的研究开辟了新的路径。
简介
本研究开发了一种基于Transformer架构的模型,用于分钟级别的成交量比率预测,以增强VWAP策略的执行准确度。通过对数正态变换的应用,该模型解决了传统方法在预测高波动性成交量比率时遇到的问题。通过整合一个广泛的数据集——包含外部成交量相关特征、时间信息和个股特性——来提升预测的精确性。此外,模型采用了概率预测技术,可以评估成交量比率的平均值和标准差,从而更好地应对市场变化。在韩国市场的实盘交易测试中,此模型的表现超过了VWAP基准,证明了其实际应用的价值。
01 背景
最佳执行和VWAP
在金融交易中,最优执行策略对于减少交易成本至关重要,这通常依赖于交易者的经验直觉或是通过数学模型来达成。成交量加权平均价格(VWAP)作为衡量交易表现的重要标准,受到市场参与者行为的影响,体现了特定时间段内的平均成交价。
VWAP策略的主要挑战来自于市场参与者行为的不可预测性和未来市场订单流的随机性质。为了有效实施VWAP策略,对短期市场状况(如分钟级别的变动)进行精确预测是非常关键的,这有助于实现更高效的订单执行。为此,已经开发了多种VWAP策略,重点在于对成交量占比(POV)、累计成交量占比(POCV)以及周转率进行数学建模,以响应短期市场的变化。在这些策略中,将大额订单拆分成小额订单以最小化对市场的冲击,并利用市场价格波动来降低交易成本是一个核心方法,特别适合处理大规模的订单。
日内成交量预测
历史上,U型日内交易量模式已经通过统计建模(例如ARIMA)和传统机器学习方法进行了预测。研究发现,基于梯度的方法在提高预测精度方面是有效的,而RNN虽然能够在50分钟的时间尺度上成功应用,但在更短时间尺度上的表现受限于梯度消失问题。
本文提出了一种基于Transformer架构的模型,用于进行分钟级别的概率性日内交易量预测,并设计了简化的交易量分布策略,在VWAP目标策略中展现了优越性能。与传统方法不同,本研究特别注重利用对数变换来稳定交易量比率,以解决交易时段内比率数据缺失和高波动性的问题,这与VWAP跟踪策略的复杂需求相匹配。
02 方法
数据集构建和特征工程
交易量分析的复杂性超越了简单统计特征,受多种因素影响,包括日内季节性、非平稳性和绝对时间信息。股票流动性水平导致不同的交易量曲线,强调历史交易数据的重要性。
开发的模型IVE(Intraday Volume Estimator)利用Transformer架构,结合时间编码和标准位置嵌入,处理绝对时间信息。模型上下文长度设为390,涵盖完整交易日的历史数据,包含多种交易量相关特征。采用归一化方法确保不同数据集的一致性,模型中嵌入股票特定的分类信息以捕捉独特的交易量特征。模型架构和训练方法基于Transformer,使用分布头概率预测交易量比率。
模型架构和训练
输入编码方法。
对于高维多变量数据,选择了线性投影方法而不是1D卷积层。
模型架构。
采用了变换器(Transformer)架构,并在输出层使用了T分布,以适应金融市场中常见的厚尾特性。
训练目标。
专注于预测1到3个时间步长,以避免时间序列模型容易出现的简单插值问题。
数据集。
数据集涵盖了2023年1月25日至8月期间韩美市场前100大股票的数据,其中6月的数据用作验证集,而8月的数据作为测试集。
模型配置。
该模型基于变换器架构,包含4层编码器和解码器,设定的时间上下文为一天,优化器选用AdamW,学习率设为3×10^-4。
性能评估。
通过与Bi-LSTM、LSTM、RNN等基线算法对比,采用MAE和RMSE作为评估指标来衡量模型性能。
实验结果。
IVE模型在韩美市场的RMSE和MAE上均优于其他模型,尤其在捕捉交易量动态方面表现出色。在美国市场,IVE模型的RMSE为0.1678,MAE为0.0876,尽管与BiLSTM-HR的差异较小(RMSE 0.1725,MAE 0.1076),但依然证明了其有效性。IVE模型展示了处理美国市场复杂性的能力,体现了设计的稳健性和特征选择的恰当性。IVE模型在不同市场中的一致表现表明它适合多样化的交易环境,特别是在特征融合、时间编码和Transformer架构的应用上。预测三步而非一步的策略提高了对交易量动态的准确描述,进一步增强了模型的性能。
03 日内交易量峰值检测的可能性
本研究开发了一种概率模型,用于预测交易量比率,并同时输出均值和标准差的统计特征,这与以往仅提供点预测的研究有所不同。该研究假设模型预测的标准差对日内交易量比率的增长具有预见性。
实验设计包含两个阶段:第一阶段旨在验证预测标准差与交易量比率之间是否存在线性关系;第二阶段则检验预测标准差的变化(首差)与正值交易量比率变化(首差)之间的线性关联。
在第一阶段,结果显示出极低的p值(3.56390 × 10^−123),R²值为0.07509,回归系数为0.06954,这表明标准差与交易量比率间存在显著的线性关系。
第二阶段的结果同样显示了极低的p值(3.92482 × 10^−52),R²值为0.08087,系数为0.08310,证明了标准差的变动与交易量比率的首次差异之间也存在明显的线性联系。
这些发现指出,预测的标准差可能反映了市场波动性,可以作为投资者识别风险和机遇的信号。尽管p值非常低,但较低的R²值提示模型尚未完全捕捉到影响交易量的所有因素,因此需要考虑其他变量的影响。在实际交易测试中,当交易量比率超过中位数时,模型展示出一定的预测能力,其中标准差的调整因子设定为0.2,并根据观察到的性能进行了经验性调整。
04 现实世界的交易和结果
评估Intraday Volume Estimator (IVE) 模型的实用性,我们进行了实盘交易测试,采用了简单的交易逻辑。测试是在韩国市场通过韩国投资证券公司的API进行的,初始资本为3.5亿韩元。
交易策略与执行
每天从KOSPI前100名股票中随机挑选5只,不包括那些有交易限制的股票。依据预测的交易量比率,在最优买卖价格处下达订单。在市场收盘前30分钟,任何未成交的订单将被取消并改为市价单;而在市场收盘前10分钟,仍未成交的订单会再次取消,并下达最终的市价单。该策略从2023年9月26日实施至11月23日,期间共执行了163个订单,每天涉及3到5只股票。
性能指标
交易执行的表现超过了市场VWAP,平均超出4.82个基点。执行表现的标准差为34.59个基点。市场VWAP超越比率为59%,意味着该策略超过市场VWAP的频率超过了半数。前20%的最佳交易表现优于市场VWAP 15.55个基点,而后20%的最差交易则低于市场VWAP 10.08个基点。大部分的交易执行与市场VWAP相比没有显著差异。
详细的买入/卖出表现
买卖订单的表现差异体现了测试期间的市场状况和波动性。实盘交易测试显示,IVE模型能够有效地执行订单,其性能与VWAP策略相媲美,并且具有合理的稳定性。整体正面的表现指标验证了该模型在实际交易应用中的有效性。
05 总结
模型介绍。
本文提出了一种基于Transformer架构的Intraday Volume Estimator (IVE) 模型,用于预测金融市场分钟级别的日内交易量比率。该模型结合了多种特征和分布头,实现了概率预测功能。
概率预测。
IVE模型提供概率性预测,能够有效地预估日内交易量的波动情况。实证分析表明,模型输出的标准差与实际交易量比率之间存在显著关系,这反映了市场的不确定性和波动性。
实用交易应用。
在韩国市场进行的实盘测试中,IVE模型的表现超越了VWAP基准,平均执行效果优于市场VWAP 4.82个基点,胜率为59%。
实验结果。
通过在韩国和美国市场的广泛实验,IVE模型展示了相对于现有方法的改进,表现出良好的稳健性和适应能力。
未来研究方向。
未来的研究可以探索整合更多的市场指标、优化概率预测机制以及实施实时交易策略调整的高级优化技术,以进一步提升执行效果。
结论。
本研究在日内交易量比率预测方面取得了进展,成功将Transformer架构应用于实际交易环境中。