基于AI的增强型日内成交量比率概率预测在美股市场中的表现优于现有的基准

“IVE: Enhanced Probabilistic Forecasting of Intraday Volume Ratio with Transformers”

论文地址:https://arxiv.org/pdf/2411.10956

图片

摘要

本文介绍了一种创新的金融市场成交量比预测技术,特别适用于VWAP(成交量加权平均价格)策略的执行。研究中采用了Transformer模型来预测每分钟级别的日内成交量比例,并通过对数正态变换处理以稳定高波动性的数据。为了增强预测精度,输入的数据集涵盖了成交量统计特征、外部与成交量有关的因素、绝对时间标记以及个股属性。

该模型架构基于编码器-解码器类型的Transformer,并配置了分布头以实现贪婪采样,旨在优化对高流动性股票的预测效果。此外,模型引入了概率性预测机制,用以估计成交量比的期望值和离散程度,从而能够提前识别出重要的日内成交量高峰。在韩国市场使用简化交易逻辑作为代理进行的实际测试表明,相较于传统的VWAP基准,此方法在两个半月的时间段内表现出更佳的性能。研究表明,基于Transformer的概率预测模型在成交量比预测方面展现出了潜力,为后续的研究开辟了新的路径。

简介

本研究开发了一种基于Transformer架构的模型,用于分钟级别的成交量比率预测,以增强VWAP策略的执行准确度。通过对数正态变换的应用,该模型解决了传统方法在预测高波动性成交量比率时遇到的问题。通过整合一个广泛的数据集——包含外部成交量相关特征、时间信息和个股特性——来提升预测的精确性。此外,模型采用了概率预测技术,可以评估成交量比率的平均值和标准差,从而更好地应对市场变化。在韩国市场的实盘交易测试中,此模型的表现超过了VWAP基准,证明了其实际应用的价值。

01   背景

最佳执行和VWAP

在金融交易中,最优执行策略对于减少交易成本至关重要,这通常依赖于交易者的经验直觉或是通过数学模型来达成。成交量加权平均价格(VWAP)作为衡量交易表现的重要标准,受到市场参与者行为的影响,体现了特定时间段内的平均成交价。

VWAP策略的主要挑战来自于市场参与者行为的不可预测性和未来市场订单流的随机性质。为了有效实施VWAP策略,对短期市场状况(如分钟级别的变动)进行精确预测是非常关键的,这有助于实现更高效的订单执行。为此,已经开发了多种VWAP策略,重点在于对成交量占比(POV)、累计成交量占比(POCV)以及周转率进行数学建模,以响应短期市场的变化。在这些策略中,将大额订单拆分成小额订单以最小化对市场的冲击,并利用市场价格波动来降低交易成本是一个核心方法,特别适合处理大规模的订单。

日内成交量预测

历史上,U型日内交易量模式已经通过统计建模(例如ARIMA)和传统机器学习方法进行了预测。研究发现,基于梯度的方法在提高预测精度方面是有效的,而RNN虽然能够在50分钟的时间尺度上成功应用,但在更短时间尺度上的表现受限于梯度消失问题。

本文提出了一种基于Transformer架构的模型,用于进行分钟级别的概率性日内交易量预测,并设计了简化的交易量分布策略,在VWAP目标策略中展现了优越性能。与传统方法不同,本研究特别注重利用对数变换来稳定交易量比率,以解决交易时段内比率数据缺失和高波动性的问题,这与VWAP跟踪策略的复杂需求相匹配。

02    方法

数据集构建和特征工程

交易量分析的复杂性超越了简单统计特征,受多种因素影响,包括日内季节性、非平稳性和绝对时间信息。股票流动性水平导致不同的交易量曲线,强调历史交易数据的重要性。

开发的模型IVE(Intraday Volume Estimator)利用Transformer架构,结合时间编码和标准位置嵌入,处理绝对时间信息。模型上下文长度设为390,涵盖完整交易日的历史数据,包含多种交易量相关特征。采用归一化方法确保不同数据集的一致性,模型中嵌入股票特定的分类信息以捕捉独特的交易量特征。模型架构和训练方法基于Transformer,使用分布头概率预测交易量比率。

模型架构和训练

输入编码方法。

对于高维多变量数据,选择了线性投影方法而不是1D卷积层。

模型架构。

采用了变换器(Transformer)架构,并在输出层使用了T分布,以适应金融市场中常见的厚尾特性。

训练目标。

专注于预测1到3个时间步长,以避免时间序列模型容易出现的简单插值问题。

数据集。

数据集涵盖了2023年1月25日至8月期间韩美市场前100大股票的数据,其中6月的数据用作验证集,而8月的数据作为测试集。

模型配置。

该模型基于变换器架构,包含4层编码器和解码器,设定的时间上下文为一天,优化器选用AdamW,学习率设为3×10^-4。

性能评估。

通过与Bi-LSTM、LSTM、RNN等基线算法对比,采用MAE和RMSE作为评估指标来衡量模型性能。

实验结果。

IVE模型在韩美市场的RMSE和MAE上均优于其他模型,尤其在捕捉交易量动态方面表现出色。在美国市场,IVE模型的RMSE为0.1678,MAE为0.0876,尽管与BiLSTM-HR的差异较小(RMSE 0.1725,MAE 0.1076),但依然证明了其有效性。IVE模型展示了处理美国市场复杂性的能力,体现了设计的稳健性和特征选择的恰当性。IVE模型在不同市场中的一致表现表明它适合多样化的交易环境,特别是在特征融合、时间编码和Transformer架构的应用上。预测三步而非一步的策略提高了对交易量动态的准确描述,进一步增强了模型的性能。

图片

图片

图片

03    日内交易量峰值检测的可能性

本研究开发了一种概率模型,用于预测交易量比率,并同时输出均值和标准差的统计特征,这与以往仅提供点预测的研究有所不同。该研究假设模型预测的标准差对日内交易量比率的增长具有预见性。

实验设计包含两个阶段:第一阶段旨在验证预测标准差与交易量比率之间是否存在线性关系;第二阶段则检验预测标准差的变化(首差)与正值交易量比率变化(首差)之间的线性关联。

在第一阶段,结果显示出极低的p值(3.56390 × 10^−123),R²值为0.07509,回归系数为0.06954,这表明标准差与交易量比率间存在显著的线性关系。

第二阶段的结果同样显示了极低的p值(3.92482 × 10^−52),R²值为0.08087,系数为0.08310,证明了标准差的变动与交易量比率的首次差异之间也存在明显的线性联系。

这些发现指出,预测的标准差可能反映了市场波动性,可以作为投资者识别风险和机遇的信号。尽管p值非常低,但较低的R²值提示模型尚未完全捕捉到影响交易量的所有因素,因此需要考虑其他变量的影响。在实际交易测试中,当交易量比率超过中位数时,模型展示出一定的预测能力,其中标准差的调整因子设定为0.2,并根据观察到的性能进行了经验性调整。

04   现实世界的交易和结果

评估Intraday Volume Estimator (IVE) 模型的实用性,我们进行了实盘交易测试,采用了简单的交易逻辑。测试是在韩国市场通过韩国投资证券公司的API进行的,初始资本为3.5亿韩元。

交易策略与执行

每天从KOSPI前100名股票中随机挑选5只,不包括那些有交易限制的股票。依据预测的交易量比率,在最优买卖价格处下达订单。在市场收盘前30分钟,任何未成交的订单将被取消并改为市价单;而在市场收盘前10分钟,仍未成交的订单会再次取消,并下达最终的市价单。该策略从2023年9月26日实施至11月23日,期间共执行了163个订单,每天涉及3到5只股票。

图片

性能指标

交易执行的表现超过了市场VWAP,平均超出4.82个基点。执行表现的标准差为34.59个基点。市场VWAP超越比率为59%,意味着该策略超过市场VWAP的频率超过了半数。前20%的最佳交易表现优于市场VWAP 15.55个基点,而后20%的最差交易则低于市场VWAP 10.08个基点。大部分的交易执行与市场VWAP相比没有显著差异。

详细的买入/卖出表现

买卖订单的表现差异体现了测试期间的市场状况和波动性。实盘交易测试显示,IVE模型能够有效地执行订单,其性能与VWAP策略相媲美,并且具有合理的稳定性。整体正面的表现指标验证了该模型在实际交易应用中的有效性。

图片

05   总结

模型介绍。

本文提出了一种基于Transformer架构的Intraday Volume Estimator (IVE) 模型,用于预测金融市场分钟级别的日内交易量比率。该模型结合了多种特征和分布头,实现了概率预测功能。

概率预测。

IVE模型提供概率性预测,能够有效地预估日内交易量的波动情况。实证分析表明,模型输出的标准差与实际交易量比率之间存在显著关系,这反映了市场的不确定性和波动性。

实用交易应用。

在韩国市场进行的实盘测试中,IVE模型的表现超越了VWAP基准,平均执行效果优于市场VWAP 4.82个基点,胜率为59%。

实验结果。

通过在韩国和美国市场的广泛实验,IVE模型展示了相对于现有方法的改进,表现出良好的稳健性和适应能力。

未来研究方向。

未来的研究可以探索整合更多的市场指标、优化概率预测机制以及实施实时交易策略调整的高级优化技术,以进一步提升执行效果。

结论。

本研究在日内交易量比率预测方面取得了进展,成功将Transformer架构应用于实际交易环境中。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/944289.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Tauri2+Leptos开发桌面应用--Sqlite数据库操作

在之前工作(使用Tauri Leptos开发带系统托盘桌面应用-CSDN博客)的基础上,继续尝试对本地Sqlite数据库进行读、写、删除操作,开发环境还是VS CodeRust-analyzer。 最终程序界面如下: 主要参考文章:Building…

设计模式之状态模式:自动售货机的喜怒哀乐

~犬📰余~ “我欲贱而贵,愚而智,贫而富,可乎? 曰:其唯学乎” 一、状态模式概述 \quad 在我们的日常生活中,很多事物都具有不同的状态。比如我们经常使用的自动售货机,它就具有多种状态…

4.银河麒麟V10(ARM) 离线安装 MySQL

1. 系统版本 [rootga-sit-cssjgj-db-01u ~]# nkvers ############## Kylin Linux Version ################# Release: Kylin Linux Advanced Server release V10 (Lance)Kernel: 4.19.90-52.39.v2207.ky10.aarch64Build: Kylin Linux Advanced Server release V10 (SP3) /(La…

多模态论文笔记——LLaVA

大家好,这里是好评笔记,公主号:Goodnote,专栏文章私信限时Free。本文详细介绍多模态模型:LLaVA。处理包含图像和文本的多模态数据,并生成合理准确的回答。 文章目录 论文模型架构视觉编码器语言模型多模态融…

【Sentinel】初识Sentinel

目录 1.1.雪崩问题及解决方案 1.1.1.雪崩问题 1.1.2.超时处理 1.1.3.仓壁模式 1.1.4.断路器 1.1.5.限流 1.1.6.总结 1.2.服务保护技术对比 1.3.Sentinel介绍和安装 1.3.1.初识Sentinel 1.3.2.安装Sentinel 1.4.微服务整合Sentinel 1.1.雪崩问题及解决方案 1.1.1.…

[A-24][V-09]ARMv8/v9-SMMU工作场景与SMMU的虚拟化架构

ver0.1 [看前序文章有惊喜,关注W\X\G=Z+H=“浩瀚架构师”,可以解锁全部文章] 前言 我们在介绍ARM的内存体系的时候,行文中经常讲MMU比作PE-Cores的带刀护卫。按照这个逻辑,那么SMMU也可以称之为总线上各个Master(设备)的带刀护卫,利刃出鞘之后,任何驱动送过来的地址都…

WebRTC服务质量(10)- Pacer机制(02) RoundRobinPacketQueue

WebRTC服务质量(01)- Qos概述 WebRTC服务质量(02)- RTP协议 WebRTC服务质量(03)- RTCP协议 WebRTC服务质量(04)- 重传机制(01) RTX NACK概述 WebRTC服务质量(…

硬件设计-时钟振荡器

目录 摘要 壳式晶振 正常工作条件 摘要 本章主要介绍了晶振的分类、各项参数的意义、特点,同时也介绍了时钟抖动的成因、测量 方法、消除措施和典型滤波电路,使得我们可以正确地选择和使用晶振。 壳式晶振 如图 所示,壳式晶振的名字来源于…

Redis基础知识分享(含5种数据类型介绍+增删改查操作)

一、redis基本介绍 1.redis的启动 服务端启动 pythonubuntu:~$ redis-server客户端启动 pythonubuntu:~$ redis-cli <127.0.0.1:6379> exit pythonubuntu:~$ redis-cli --raw //(支持中文的启动方式) <127.0.0.1:6379> exit2.redis基本操作 ping发送给服务器…

sql字段值转字段

表alertlabel中记录变字段 如何用alertlabel表得到下面数据 实现的sql语句 select a.AlertID, (select Value from alertlabel where AlertIDa.AlertID and Labelhost) as host, (select Value from alertlabel where AlertIDa.AlertID and Labeljob) as job from (select …

llamafactory报错:双卡4090GPU,训练qwen2.5:7B、14B时报错GPU显存不足(out of memory),轻松搞定~~~

实际问题场景&#xff1a; 使用llamafactory进行微调qwen2.5 7B和14B的大模型时&#xff0c;会出现out of memory的报错。尝试使用降低batch_size&#xff08;原本是2&#xff0c;现在降到1&#xff09;的方式&#xff0c;可以让qwen2.5:7B跑起来&#xff0c;但时不时会不稳定…

【hackmyvm】hacked靶机wp

tags: HMVrootkitDiamorphine Type: wp 1. 基本信息^toc 文章目录 1. 基本信息^toc2. 信息收集2.1. 端口扫描2.2. 目录扫描2.3. 获取参数 3. 提权 靶机链接 https://hackmyvm.eu/machines/machine.php?vmHacked 作者 sml 难度 ⭐️⭐️⭐️⭐️️ 2. 信息收集 2.1. 端口扫描…

.NET平台用C#通过字节流动态操作Excel文件

在.NET开发中&#xff0c;通过字节流动态操作Excel文件提供了一种高效且灵活的方式处理数据。这种方法允许开发者直接在内存中创建、修改和保存Excel文档&#xff0c;无需依赖直接的文件储存、读取操作&#xff0c;从而提高了程序的性能和安全性。使用流技术处理Excel不仅简化了…

应用层1——C/S、P2P、DNS域名系统

目录 一、网络应用模型 1、C/S 2、p2p模型 二、域名解析系统DNS 1、为什么有DNS系统&#xff1f; 2、域名的特点 3、DNS域名系统原理 4、递归查询、迭代查询 5、常用的根域名与顶级域名 一、网络应用模型 1、C/S 客户/服务器模型 客户请求服务&#xff0c;服务器提供…

【疑难杂症】 HarmonyOS NEXT中Axios库的响应拦截器无法拦截424状态码怎么办?

今天在开发一个HarmonyOS NEXT的应用的时候&#xff0c;发现http接口如果返回的状态码是424时&#xff0c;我在axios中定义的拦截器失效了。直接走到了业务调用的catch中。 问题表现&#xff1a; 我的拦截器代码如下&#xff1a; 解决办法&#xff1a; 先说解决办法&#xff…

在Windows上读写Linux磁盘镜像的一种方法

背景 嵌入式开发中&#xff0c;经常会把系统的Linux磁盘镜像保存到Windows上&#xff0c;以便上传到网盘备份或发送给工厂&#xff0c;但是如果想读取/修改镜像中的某个文件&#xff0c;一般有2种方案&#xff1a; 直接访问 就是用虚拟磁盘软件将镜像文件挂载成磁盘&#xf…

ffmpeg之显示一个yuv照片

显示YUV图片的步骤 1.初始化SDL库 目的&#xff1a;确保SDL库正确初始化&#xff0c;以便可以使用其窗口、渲染和事件处理功能。操作&#xff1a;调用 SDL_Init(SDL_INIT_VIDEO) 来初始化SDL的视频子系统。 2.创建窗口用于显示YUV图像&#xff1a; 目的&#xff1a;创建一个…

Windows下播放文件作为麦克风声源的一种方式

近期测试一种外语的ASR识别成功率&#xff0c;样本素材是懂这门语言的同事录制的mp3文件。测试client端原本是从麦克风拾音生成媒体流的。 这样&#xff0c;就需要想办法把mp3文件转换为测试client的输入声音。物理方式上&#xff0c;可以用一根音频线&#xff0c;把电…

如何在网页端使用 IDE 高效地阅读 GitHub 源码?

如何在网页端使用 IDE 高效地阅读 GitHub 源码&#xff1f; 前言什么是 GitHub1s&#xff1f;使用 GitHub1s 阅读 browser-use 项目源码步骤 1: 打开 GitHub 项目页面步骤 2: 修改 URL 使用 GitHub1s步骤 3: 浏览文件结构步骤 4: 使用代码高亮和智能补全功能步骤 5: 快速跳转和…

Microsoft word@【标题样式】应用不生效(主要表现为在导航窗格不显示)

背景 随笔。Microsoft word 2013基础使用&#xff0c;仅做参考和积累。 问题 Microsoft word 2013&#xff0c;对段落标题文字应用【标题样式】不生效&#xff08;主要表现为在导航窗格不显示&#xff09;。 图1 图2 观察图1和图2&#xff0c;发现图1的文字在应用【标题一】样…