“MARS: A FINANCIAL MARKET SIMULATION ENGINE POWERED BY GENERATIVE FOUNDATION MODEL”
项目主页:https://mars-lmm.github.io/
论文地址:https://arxiv.org/pdf/2409.07486
Github地址:https://github.com/microsoft/MarS/
摘要
生成模型在金融领域的应用仍处于初步阶段,其能够模拟市场动态和训练策略,从而降低金融风险。本文介绍了一种名为大型市场模型(LMM)的新型模型,作为金融市场中订单级别的基础生成模型,这类似于数字领域中的语言建模方法。基于LMM的金融市场模拟引擎(MarS)被设计用于创建一个既真实又可互动控制的订单生成环境。
研究旨在评估LMM在金融市场中的扩展能力、MarS的真实模拟效果、平衡生成订单与市场影响的能力,以及探索MarS的各种潜在用途。MarS不仅可以用作预测工具或检测系统,还能作为一个分析平台和代理训练环境。本文致力于开拓金融市场的生成模型新天地,通过设计满足特定需求的MarS展示其在行业中的应用潜力。
简介
生成模型的目标是模拟各种行为在不同场景中的实际效果,涵盖从文本生成到视觉表现的各个领域。真实世界模拟器通过支持人机交互、机器人学习和生成训练数据等方式,提供帮助,但在虚拟环境中的潜力尚未被完全发掘。金融市场作为一个典型的虚拟环境,可以通过生成模型来模仿市场动态,让使用者能够在不承担风险的情况下学习交易策略和生成数据。这一模拟过程依赖于特定领域的结构化数据,例如订单和限价单簿(LOB)。
本文介绍了一种名为大型市场模型(LMM)的新方法,试图将大型语言模型的成功复制到金融市场中。基于LMM的金融市场模拟引擎(MarS)专注于订单对市场影响的建模以及高保真的生成能力。研究的主要目标包括评估LMM的扩展性、MarS的真实模拟效果、控制生成与市场影响之间的平衡,并展示MarS的各种潜在应用。作为首个聚焦于金融市场核心要素的生成模型,MarS有望引发金融任务处理方式的重大变革。其关键应用场景有四个:预测工具、风险检测系统、分析平台和代理训练环境。通过设计满足生成特定场景需求和订单市场影响建模要求的MarS,展示了它在行业内的多种应用前景,彰显了该模型的巨大潜力。
01MarS
MarS模拟系统需在以下三个方面表现出色:
- 高分辨率:通过详细重现交易订单和订单批次,精确模拟金融市场的动态变化,确保能够准确再现历史市场轨迹。
- 可控性:具备模拟多种市场情景的能力,适用于研究市场趋势、监测风险以及优化交易策略。
- 互动性:提供用户直接与模拟市场互动的平台,便于评估市场影响、分析交易策略的有效性及识别系统性风险。
有条件交易订单生成
订单序列 x = (x 0 , . . . , x n ) 的生成受四个因素的影响:
- 市场情景描述(DES TEXT):提供对市场情景的宽泛描述(如“价格波动”),以实现模拟的可控性。
- 交互订单:用户在生成过程中添加的订单,这些订单反映了用户的直接互动,增强了互动性。
- 起始序列:采用最新的真实订单作为种子,以此为基础生成后续订单,确保模拟的真实性。
- 匹配规则(MTCH R):设定订单执行的可行范围,保证模拟过程符合特定金融市场的特征。
金融市场模型——大市场模型
大市场模型的框架设计如下:
- 框架设计:整合订单序列建模和订单批次序列建模,创建一个集成模型来模拟市场。
- 订单序列建模:采用因果变换器来捕捉市场动态变化,确保能够保留每个订单的上下文信息。
- 订单批次序列建模:利用自回归变换器分析在聚合时间段内的市场模式,以理解更广泛的市场趋势。
- 集成模型:结合上述两种方法的优点,既保证了对单个订单进行细致控制,又能反映整体市场的动态变化。
- 信号生成接口:提供一种机制,将模糊的市场情景描述转化为具体的控制信号,以增强模型的可控性。此接口特别适用于压力测试和交易策略优化等场景。
- 大市场模型中的缩放定律
设计了四个基础模型组件,分别使用自回归变换器处理订单批次序列和因果变换器处理订单序列,并且都采用了标准预训练技术。大型市场模型(LMM)显示,随着数据规模和模型大小的增长,其性能显著增强,这与其它基础模型的扩展特性相符。目前的实现仅利用了部分金融市场订单数据,未来有望通过引入更大规模的数据集和更强大的计算资源进一步提升模型性能。MarS工具能够挖掘金融市场中的海量数据,为实现更加全面和深入的市场模拟提供了可能。
订单生成与模拟票据交换所相结合
预训练的大型市场模型(LMM)生成模拟市场的订单流,而清算所则实时匹配这些生成的订单和用户的交互订单,并提供如限价订单簿等相关信息。清算所在接收到生成的订单后会等待可能的交互订单进行顺序匹配,并将匹配结果反馈给LMM以供生成下一个订单使用。在MarS中,市场影响与控制信号之间的平衡对于实现其高分辨率、可控性和互动性这三个特性至关重要。
遵循两个主要原则来优化这一过程:
- “基于已实现的现实塑造未来”:意味着每个时间步生成的订单批次都依赖于最近从清算所获取的数据;
- “从每个可能的未来中选择最佳”:指的是生成多个预测订单批次,并从中挑选出最符合当前控制信号的订单批次。
通过这种方式,订单级变换器能够学习并模拟市场影响,同时集成模型对订单生成的影响确保了模拟的真实性,实现了市场模拟中细节控制与整体真实感的良好平衡。
02实验
本文旨在评估MarS在现实性、可控性和互动性方面的能力。为了验证MarS的现实性,通过对比历史市场数据与模拟数据的统计特征进行评估。可控性的评估则涉及到生成特定场景来测试MarS,这对于压力测试和策略优化特别有用。互动性方面,利用时间加权平均价格(TWAP)代理来探索MarS中的互动市场动态,展示用户在订单层面上的互动情况。研究还探讨了控制与互动之间的平衡,评估MarS在创建受控场景以及反映市场影响方面的能力。文中使用“重放”一词描述在MarS中重现历史市场数据的过程,以此来检验模拟的真实性和准确性。
现实模拟
MarS的市场模拟通过与历史市场数据的关键特征进行对比来评估其现实性。主要观察结果包括:
- 当时间间隔从1分钟延长至5分钟时,收益的对数分布逐渐接近正态分布(显示出聚合高斯性)。
- 收益的对数自相关性随着时间间隔的增加而迅速减弱(表明缺乏自相关性)。
- 模拟中体现了高度的波动性自相关性(即波动聚集现象)。
这些结果显示,MarS成功地再现了历史数据中的特性,证明了其市场模拟具有显著的真实性,适用于实际应用场景。
控制模拟
MarS的可控性通过生成与历史数据相似的场景来验证,这些场景基于分钟级别的指导信号生成订单批次。结果显示,集成模型生成的交易订单与历史回放曲线高度吻合,相比之下,仅使用订单模型的相关性较低。经过控制优化后,模拟出的曲线能够更精确地追踪回放曲线,表现出更高的相关性。值得注意的是,即使在只有一个模拟轨迹的情况下,集成模型的相关性仍然超过使用订单模型生成的128个模拟轨迹的相关性,这体现了集成模型在效率和效果上的优越性。
互动市场动态
MarS利用详细的订单数据来模拟市场影响,特别是展示了大宗交易在短时间内对市场的效应。例如,TWAP代理在5分钟内执行了10万股的购买操作,通过图表展示的价格轨迹和交易订单细节表明,MarS能够有效模拟交易策略对市场价格的影响。研究还评估了MarS在控制与交互之间的平衡:当重放数据中的价格变化介于0.3%至0.5%时,模型在控制状态下能精确跟随重放曲线;而在交互模式下,TWAP代理在同一时间段内的销售量占重放量的20%到40%。此外,报告中还比较了不同配置条件下模拟价格与原始重放价格之间的相关性,以进一步验证模型的有效性。
控制与互动之间的权衡
在控制与互动之间需要做出权衡。研究发现,仅控制而没有互动的配置得分最高(0.47),这表明模型在重现历史价格走势时具有较高的精确度。然而,当引入互动机制后,控制的精确度有所下降(从0.47降至0.33)。尽管如此,这种变化允许模型在多种应用和实验中进行更加真实的互动,从而提供更广泛的实用性和灵活性。
03应用
MarS被证实是一个具备现实性、可控性和互动性的金融市场模拟器,能够独立应对金融领域中的各种挑战。它展示了在预测和检测任务上的有效性,并作为其他多种任务的模拟平台展现了其实用性。通过条件交易订单的生成,MarS建立了一个统一的任务接口,可以将复杂的金融信息转化为具体的任务指令。表1总结了任务的输入条件,而当前方法与MarS新方法之间的对比则列于表2,突出了这种“范式转变”。这表明MarS不仅革新了处理金融问题的方式,还为未来的金融模拟设定了新的标准。
预测
在金融应用中,准确预测市场趋势对于捕捉市场动态至关重要。价格变化被定义为从时间t到t+k分钟的变化,并分为上升、下降和保持不变三类。研究表明,LMM模型在理解市场动态方面明显优于DeepLOB模型。拥有1.02亿参数的模型展示了比0.22亿参数模型更好的预测性能,这表明验证损失与预测能力之间存在关联。此外,MarS通过其模拟轨迹能够计算所有预测目标,这种方法比传统模型需要单独训练每个目标更加高效优越。
检测
理解当前和近期的市场状况是金融领域中的关键任务,其中市场滥用监管尤为重要。传统上,检测非法交易活动(如内幕交易和市场操纵)既耗时又费力,需要分析大量数据,投资者也难以确定其持有的金融资产是否处于异常市场环境中。
本文以市场操纵检测为例,展示了MarS如何帮助监管机构和投资者。通过在正常市场中评估MarS的真实性来实现这一目标,如果模拟出的某些典型事实的真实感下降,则可能指示潜在的市场异常。研究中收集了中国证券监督管理委员会公布的市场操纵案例,并对比了操纵发生前后相同数量的交易日样本进行了模拟分析。这种方法为识别市场异常提供了一种新的途径。
价差作为衡量市场流动性的重要指标,其增大往往反映出市场的流动性减弱。在疑似市场操纵期间,观察到MarS模型效率降低,特别是在价差的变动达到δ=1000时出现了显著的峰值,这表明了不寻常的市场状况。操纵者利用其资金优势来影响股票价格,消耗市场中的流动性,从而导致价差增加。这种现象在正常的市场环境下非常罕见,并且与之伴随的是模型准确度的下降。通过监控MarS模型表现的突然变化,可以有效地识别出如市场操纵等异常行为,有助于投资者避开这些异常情况,有利于维护市场的稳定性和公平性。
“如果”分析对市场的影响
市场影响分析是金融领域内一个关键的“假设”研究主题,关注交易活动如何影响资产价格。以往的研究大多基于严格的假设条件和经验公式,且通常局限于成本高昂且风险较高的在线实验。
本文展示了MarS作为分析平台在“假设”情景分析中的应用,尤其是针对市场影响的研究。首先,我们验证了MarS生成的市场影响数据与真实市场模式之间的一致性。其次,基于这些生成的数据,我们构建了一个数据驱动的流程,用于探索市场影响的新规律及其复杂的序列效应。这种方法不仅降低了研究成本和风险,还为深入理解市场动态提供了新的视角。
- 探索和验证产生的市场影响
通过四种不同配置(L1-P0.1, L1-P0.9, L5-P0.1, L5-P0.9)使用TWAP策略生成市场影响数据,模拟了624,000条交易轨迹。研究发现市场影响遵循平方根法则模型:∆ = α × σ Q V,这表明了交易活动与价格变动之间的关系。较为激进的配置(如L5-P0.1和L5-P0.9)显示出更大的市场影响以及更高的执行率。代理不仅能够生成短期市场影响,还能产生长期影响,其中具有较大被动成交量比率的代理在交易结束后产生的动量较小。这些结果验证了MarS的稳健性,并展示了合成数据在市场影响分析中的可靠性和便捷性。
- 发现市场影响的新规律
通过MarS生成的合成数据,我们建立了一个数据驱动的流程来探索市场影响的新解释规律,旨在发现超出平方根法则之外的影响因素。运用符号回归和遗传算法,我们识别出三种新的影响因素:韧性、订单簿压力和订单簿深度,这些都对市场冲击有影响。传统方法大多依赖经验公式来模拟市场冲击的二阶动态,难以全面捕捉其复杂性。
在我们的研究中,使用生成的市场冲击数据,采用常微分方程(ODE)模型来描述市场冲击随时间的衰减过程,并整合了各种影响因素及其衰减函数。Y(t) 表示交易后市场影响的时间变化,X ∈ R^m 代表包括交易量和价格在内的关键影响因素,而F_decay(t) 包含了如1/t或1/sqrt(t)这样的衰减函数。根据领域知识,可以定制X和F_decay(t),XT ⊗ F_decay(t) 形成了一个R^n × m矩阵,表示不同因素与衰减模式之间的交互作用。W ∈ R^n × m 是一个可学习的权重矩阵,用于学习这些交互作用如何影响市场冲击的二阶效应。
实验中,我们设置了两种不同的衰减函数和七个具体因素。左侧图展示了合成市场影响随时间衰减的自相关性以及由学习得到的ODE预测的轨迹,右侧图则展示了学习到的权重W,这反映了各个交互对相对的重要性。这种方法提供了一种新的视角来理解市场冲击的动态变化及其背后复杂的交互机制。
强化学习环境
MarS环境非常适合用于训练强化学习交易代理,因为它提供了真实的奖励机制和高度的互动性。交易代理的目标是在5分钟内以最优的履约率和价格优势购买大量资产。状态特征包括剩余时间、剩余需购资产量、限价订单簿的不平衡情况以及交易策略是被动还是主动。
行动基于可配置的时间加权平均价格(TWAP)策略进行调整,包括最大被动成交量比率(PVR)和主动价格(AP)。奖励函数与履约率和价格优势挂钩,当履约率低于0.95时,α设为1,并随着履约率接近1而逐渐减小。
在训练过程中,使用了批量大小为8192和学习率为4×10^-5的简单策略梯度算法。性能评估标准是相对于最佳TWAP代理的价格优势,在训练期间,该优势从-6个基点(BP)提升到了2至6个基点(BP),这种波动主要是由于探索不同策略所致。MarS展示了其能够从零开始有效训练交易代理的能力,未来有望通过更全面的训练设计进一步提高性能表现。
04相关工作
金融市场模拟的潜力早已被学者们所认识,尤其是利用多智能体系统来模拟订单驱动市场的情况。随着深度学习技术的进步,基于世界模型的时间序列分布生成限价订单簿(LOB)的方法逐渐增多,其中生成对抗网络(GAN)的应用尤为突出。近期的研究开始关注市场微观结构数据的应用,例如Nagy等(2023)使用深度状态空间网络来生成LOB和消息流,但这些研究大多集中在LOB建模本身,并未深入评估其在实际金融任务中的表现。
本文介绍MarS,一种基于生成基础模型的金融市场模拟引擎,旨在通过模拟复杂的金融行为及其市场影响,将多种金融市场任务转化为条件交易订单生成问题来处理。基础模型的概念由Stanford研究所首次提出,指的是通过大量数据训练出来的、适用于多个下游任务的模型。GPT-3的成功展示了大规模自回归语言模型的巨大潜力,促使计算机视觉和多模态领域的类似模型相继出现。当前,现实世界模拟器及特定行业的大型模型成为研究热点,前者专注于视频生成,后者则涵盖生物医学、法律和金融等领域。
在金融领域,多数大型模型是金融LLM,它们通过预训练或微调来处理各种金融自然语言处理任务。考虑到交易订单作为金融信息的重要来源,我们提出了大型市场模型(LMM),这是首次揭示了交易订单背后的规模法则。我们的目标是开发一个基于订单级数据的金融市场生成基础模型,强调这种数据作为关键资源的重要性。
05总结
本文介绍了MarS,一种基于大型市场模型(LMM)的金融市场模拟器,专注于实现订单级别的精细生成。这是首次对金融订单生成的扩展能力进行评估,展示了LMM在扩展性方面的潜力。文中总结了金融下游任务应具备的三个关键特性:真实性、可控性和互动性,并为此设计了相应的框架。通过展示四种不同的下游任务应用实例,本文旨在激励学术界和工业界进一步探索金融世界模型与模拟的广阔前景。