AAPM:基于大型语言模型代理的资产定价模型,夏普比率提高9.6%

“AAPM: Large Language Model Agent-based Asset Pricing Models”

论文地址:https://arxiv.org/pdf/2409.17266v1

Github地址:https://github.com/chengjunyan1/AAPM

摘要

这篇文章介绍了一种利用LLM代理的资产定价模型(AAPM),该模型融合了定性的投资分析与定量的金融经济参数,以预测超出常规的资产收益。实验结果表明,相较于传统的机器学习基准,这种方法在优化投资组合和减少资产定价误差方面表现更优,具体表现为夏普比率和异常投资组合的平均绝对阿尔法值(|α|)分别提升了9.6%和10.8%。

简介

金融资产定价对资本的有效配置至关重要,传统方法通常基于宏观经济状况和公司特定因素来预测超额收益,但这些方法受到有效市场假说的质疑。在投资决策中,语言数据扮演着关键角色,因为它承载了社会和市场的信息流动,同时,主观的投资管理依旧占有重要地位。定性分析能够提供那些经济指标和市场数据未能揭示的定价见解,然而,现有的自然语言处理技术未能完全掌握此类洞察。将语言信息与定量模型相结合的挑战在于需要具备金融推理能力和追踪长期事件的记忆能力,不恰当的模型设计可能会引入噪音。

本文介绍了一种基于LLM代理的资产定价模型(AAPM),它整合了定性投资分析与定量因子策略的优点。通过解读最新的新闻报道和历史研究报告,LLM代理能够编写分析报告以预估未来的超额资产收益。实验结果表明,AAPM实现了夏普比率9.6%的增长以及资产定价误差平均|α| 10.8%的改善。该研究的主要贡献在于:开发了LLM代理架构、提出了一种混合资产定价框架,并进行了详尽的实验评估。

01相关工作

证券资产定价

资产定价的核心在于确定金融资产的公正价值。1964年,Sharpe提出的资本资产定价模型(CAPM)将资产预期回报视为市场回报的一个线性函数。随后,Merton在1973年的研究中引入了财富作为状态变量,Lucas Jr于1978年考虑了消费风险对定价的影响。CAPM从单因子模型发展为多因子框架,Fama和French在1992年提出了三因子模型,并于2015年扩展至五因子模型。此外,Carhart在1997年增加了动量因子,而Ross于1976年提出不考虑套利机会的套利定价理论(APT)。随机贴现因子(SDF)通过随机定价核计算未来现金流的现值,这一方法由Cochrane在2009年详细阐述。这些理论和模型的发展共同推动了资产定价领域的进步。

金融机器学习

机器学习技术被用于探索“因子动物园”中的非线性相互作用(Feng等人,2020)。Kelly等人(2020)提出了工具主成分分析(IPCA)以估计潜在因子及其负载。Gu等人(2020)则采用深度神经网络来模拟这些复杂的相互作用。进一步地,Gu等人(2021)引入了条件自编码器,将潜在因子和资产特征作为协变量纳入考量。Chen等人(2024)利用生成对抗网络训练神经SDF来改进模型。Bybee等人(2021)通过分析《华尔街日报》评估经济状态,而Bybee等人(2023)建议利用LDA分析新闻主题作为定价因素。近期的NLP方法(Xu和Cohen, 2018;Xie等人, 2022)被应用于预测股票动向,但未能明确解释超额收益的因素。相比之下,我们的基于LLM的方法通过深入分析报告提供了一种替代性的解释途径。

大型语言模型代理

LLM代理擅长推理、规划和工具使用,其核心机制为提示编程。

  • 提示策略包括:
    • 链式思考(Chain-of-Thoughts, CoT):通过逐步推理解决问题。
    • ReAct提示:根据先前结果优化输出,并能调用外部工具增强功能。

  • 记忆对LLM代理至关重要:
    • 数据库作为符号记忆存储信息。
    • 对话则保存在长短期记忆中,便于处理和回顾。

Cheng和Chin(2024)开发的代理能够基于输入的信息和知识库做出投资决策。该代理结合了定性和定量资产定价方法,提高了投资决策的质量。

02方法

给定状态向量V ta,用于预测资产a在时间点t的超额收益r ta,该过程基于市场、社会和资产的状态信息。传统因子模型依赖手动挑选的经济指标和市场数据来构建这个状态向量V ta。

Bybee等人(2021, 2023)的研究表明,商业新闻可以作为宏观经济状况的替代表达方式,并提出利用LDA从新闻中提取特征以作为定价预测因子。通过使用分析报告的平均嵌入来代表社会、经济和市场的状态。尽管主要媒体的商业新闻提供了关键的市场见解,但这类信息通常需要读者自行解读并进行额外分析。值得注意的是,商业事件之间相互关联,特别是长期事件如美联储加息、新冠疫情以及通胀担忧等,对市场有着显著影响。这些因素共同作用,为理解和预测市场动态提供了更加全面的视角。

本文介绍了AAPM,它利用具备长期记忆功能的LLM代理来分析新闻并生成分析报告。然后,将这些定性分析报告与手动挑选的定量因子结合,一并输入到混合资产定价网络中。这样一来,通过整合定性和定量的方法,提高了资产定价的准确性。

使用LLM代理进行分析

代理通过分析最新的新闻和由GPT-3.5-Turbo1106初始化的宏观经济笔记来生成分析报告,提供必要的宏观经济背景。每次生成报告后,笔记都会更新,记录新的投资想法和市场趋势,确保信息的实时更新且不泄露给第三方。数据集从知识截止日期之后开始收集,确保整合了最新信息。

首先生成简洁的新闻摘要x' t以控制输入长度和格式,并将其与笔记n t结合形成输入I t。代理评估新闻是否含有投资相关信息,若无相关内容则跳过;若有,则创建初步分析报告R t0。此报告随后经过N轮迭代优化,每轮优化过程中都会查询外部记忆M t以获取信息支持。使用BGE嵌入模型将文本转换为向量进行查询,找到最相关的K条记录。每轮迭代中生成的报告R ti都更加精确,最终的报告R t不仅更新了笔记n t',还会被添加到记忆M t'中。最后,定价网络利用所有经过筛选的新闻分析报告来进行资产定价。

混合资产定价网络

利用嵌入模型将PN报告转换为嵌入形式,并计算每日平均嵌入以反映经济市场状况。采用滑动窗口技术生成平滑的每日嵌入,通过指数衰减核对最近几天的嵌入进行加权处理。接着,将这种平滑状态与手动挑选的金融经济因素向量结合,形成混合状态。对于特定资产,其混合状态是通过查找该资产的嵌入并与下采样的混合状态连接来获得的。

预测次日超额收益时使用一个多层全连接预测网络,训练的目标是最小化预测收益与实际收益之间的均方误差。在模型训练初期,为了更好地初始化参数,会先使用历史因子数据进行预训练,期间用占位符嵌入代替实际数据。这种方法有助于提高模型的准确性和稳定性。

03实验

实验设置

数据集涵盖了从2021年9月29日至2023年9月29日的《华尔街日报》文章,排除了与旅行、生活方式和谜题无关的内容以避免信息泄露问题。每日资产收益数据来源于CRSP,而风险-free收益和市场收益则取自Kenneth French的数据集。根据Jensen等(2023)的方法构建金融经济因子,并解决了因子更新频率不一致的问题。缺失的数据通过计算截面中位数来填补。

研究采用了前9个月的数据作为训练集,随后3个月的数据作为验证集,最后1年的数据用于测试集。选定了五种近期在顶级金融经济学期刊上提出的资产定价基准模型,这些模型符合当前实证金融的标准。所选模型包括:

  • NN(Gu等人,2020),利用深度神经网络进行资产定价;
  • IPCA(Kelly等人,2020),一种识别潜在因子的工具主成分分析方法;
  • CA(Gu等人,2021),使用条件自编码器;
  • NF(Bybee等人,2023),通过LDA分析《华尔街日报》新闻作为隐含因子;
  • CPZ(Chen等人,2024),采用生成对抗网络处理随机贴现因子。

所有选定的模型均按照其原始论文中的配置和因子设置进行了复现,并对每个模型执行了超参数搜索,以便比较它们的最佳性能表现。这种方法确保了不同模型之间的公平对比,并有助于识别出最优模型配置。

投资组合优化

我们通过计算测试投资组合的夏普比率(SR),公式为

,评估风险调整后的表现。同时通过最大回撤(MDD)来衡量潜在的风险损失公式为

实验中采用了三种不同的投资组合构建策略:

  • 切点投资组合(TP),它根据预测的超额收益来决定资产权重,适用于理想化的无交易成本市场;
  • 长短头寸十位组合,即买入预期收益最高的前十名资产并卖空后十名;
  • 资产加权方式:“等权重”(EW)和“市值加权”(VW)。

结果显示,我们的方法在所有三种投资组合中均实现了最高的夏普比率,分别提升了6.8%、8.9%和13.2%,平均提升达到了9.6%。在切点投资组合(TP)和等权重(EW)组合中,我们的方法也取得了最优或次优的最大回撤成绩,分别改善了2.9%和2.3%。对于市值加权(VW)组合,其最大回撤比最佳基准模型CA减少了10.9%。此外,将模型从GPT-3.5升级到GPT-4-0613后,夏普比率进一步提高了8.5%、13.6%和16.2%,而在最大回撤方面,改进分别为1.3%和3.5%,但有一个例外情况下降了-2.4%。这表明更新的模型版本能够更有效地提升投资组合的表现。

资产定价误差

采用Bybee等人(2023)的方法,我们分析了78个异常投资组合的资产定价误差,这些组合是根据78种不同的特征构建的。为了处理各组合间收益的差异,我们计算了平均绝对阿尔法(avg.|α|),并通过归一化进行了调整。

统计显著性方面,我们计算了平均t值以及t值超过1.96的比例,并进行了Gibbons、Ross和Shanken(GRS)检验。结果显示,我们的方法表现优异:相较于CPZ模型,使用GPT-3.5和GPT-4分别降低了平均|α|达10.8%和13.5%,同时t值提高了1.6%和3.3%。与IPCA相比,GRS检验的结果也提升了0.6%和1.6%。

对十分位组合进行定价的结果表明,各分位组合的超额收益排名清晰,这证明了我们的方法在预测收益方面的有效性。这种方法能够准确识别不同分位组合中的超额收益,显示出其在资产定价中的应用潜力。

消融分析

进行消融研究以评估各个模块对代理设计的影响,通过检验各模块的性能来分析架构的深度和宽度。研究从一个“简单”代理开始,该代理直接根据精炼新闻生成分析报告,其定价网络仅使用每日嵌入作为输入。随后逐步添加更多组件,每一步都构建出一个更强大的基线模型,直至最终实现我们提出的完整方法。这种方法允许详细考察每个新增组件所带来的改进,确保整体设计的有效性。

代理体系结构设计

  • 与NF基线(基于33年《华尔街日报》新闻数据)相比,我们的模型仅使用2年的新闻数据。
  • “简单”基线的夏普比率(SR)提高了2.2%,且定价误差与NF基线相当。
  • 引入外部记忆后,SR进一步提升了4.3%,平均绝对阿尔法(avg.|α|)降低了5.7%,强调了上下文信息的重要性。
  • 资产嵌入的加入使SR增加了2.1%,avg.|α|减少了2.3%。
  • 构建的“Memory”基线相较于“简单”基线,SR提高了6.0%,avg.|α|降低了8.0%。
  • 手动因素的引入使SR轻微上升1.3%,avg.|α|减少2.5%;然而,NF在添加手动因素后的表现有所下降。
  • “Hybrid”基线通过结合手动因素和LLM生成的报告,实现了SR提升5.0%,avg.|α|降低9.9%,展示了两者间的协同效应。
  • 最终,通过迭代优化,“Hybrid”基线的SR再次提升了4.8%,avg.|α|减少了9.6%,验证了代理架构设计的有效性。

分析深度和宽度

分析的深度通过迭代次数N来控制,而宽度则取决于每次检索的相关信息量K。实验结果显示,增加迭代轮次和相关信息量总体上是有益的,但在K × N = 15之后,边际收益显著减少,表明此时已获取足够的信息。在极端情况下,当N=1且K=15时,夏普比率(SR)降至3.12,这说明迭代精炼是必要的。不同轮次的检索能够提供多样化的信息,而单次检索可能导致信息过于集中于某些主题,额外的信息价值迅速下降,并可能引入噪声。因此,适当的迭代和检索策略对于提高模型性能至关重要。

04 总结

AAPM模型融合了LLM代理的定性分析和资产定价的定量因素。在投资组合优化和资产定价误差等多方面的评估中,AAPM表现超越了传统的资产定价方法。研究深入分析了代理设计的各个组件,目的在于加深对自由裁量投资与定量因子模型之间相互作用的理解,从而推动经济效率的提升。此方法论的改进有助于更好地结合主观投资判断与客观量化分析,为市场提供更精确的价格发现机制。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/962040.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

新版231普通阿里滑块 自动化和逆向实现 分析

声明: 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 逆向过程 补环境逆向 部分补环境 …

Autosar-Os是怎么运行的?(时间保护)

写在前面: 入行一段时间了,基于个人理解整理一些东西,如有错误,欢迎各位大佬评论区指正!!! 1.功能概述 AUTOSAR OS 的四大可定制类型凸显了时间保护(Timing Protection)…

vue框架技术相关概述以及前端框架整合

vue框架技术概述及前端框架整合 1 node.js 介绍:什么是node.js Node.js就是运行在服务端的JavaScript。 Node.js是一个事件驱动I/O服务端JavaScript环境,基于Google的V8引擎。 作用 1 运行java需要安装JDK,而Node.js是JavaScript的运行环…

玩转大语言模型——使用langchain和Ollama本地部署大语言模型

系列文章目录 玩转大语言模型——使用langchain和Ollama本地部署大语言模型 玩转大语言模型——ollama导入huggingface下载的模型 玩转大语言模型——langchain调用ollama视觉多模态语言模型 玩转大语言模型——使用GraphRAGOllama构建知识图谱 玩转大语言模型——完美解决Gra…

亚博microros小车-原生ubuntu支持系列:15 激光雷达巡逻

一 TF坐标转换 ros2 -5.1 坐标变化工具介绍_ros怎么发布坐标变化-CSDN博客 ros2笔记-5.3 C中地图坐标系变换_c变换坐标系-CSDN博客 header:stamp:sec: 1737893911nanosec: 912000000frame_id: odom_frame child_frame_id: base_footprint pose:pose:position:x: 0.053831271…

C++并发编程指南06

文章目录 4.4 简化代码与同步工具同步工具作为构建块 4.4.1 使用Future的函数化编程函数化编程简介C支持函数化编程 快速排序 - FP模式快速排序串行版快速排序并行版 spawn_task函数结论快速排序 - 串行版快速排序 - 并行版spawn_task函数使用 spawn_task 实现并行快速排序详细…

ios swift画中画技术尝试

继上篇:iOS swift 后台运行应用尝试失败-CSDN博客 为什么想到画中画,起初是看到后台模式里有一个picture in picture,去了解了后发现这个就是小窗口视频播放,方便用户执行多任务。看小窗口视频的同时,可以作其他的事情…

C++,STL 六大组件:容器、迭代器、算法、函数对象、适配器、分配器

文章目录 引言一、容器(Containers)主要分类 二、迭代器(Iterators)三、算法(Algorithms)四、函数对象(Functors)五、适配器(Adapters)六、分配器&#xff08…

STM32项目分享:智能鱼缸

目录 一、前言 二、项目简介 1.功能详解 2.主要器件 三、原理图设计 四、PCB硬件设计 PCB图 五、程序设计 六、实验效果 七、包含内容 项目分享 一、前言 项目成品图片: 哔哩哔哩视频链接: STM32智能鱼缸/水族箱 (资料分享见文末…

基于MinIO的对象存储增删改查

MinIO是一个高性能的分布式对象存储服务。Python的minio库可操作MinIO,包括创建/列出存储桶、上传/下载/删除文件及列出文件。 查看帮助信息 minio.exe --help minio.exe server --help …

14-6-1C++STL的list

(一)list容器的基本概念 list容器简介: 1.list是一个双向链表容器,可高效地进行插入删除元素 2.list不可以随机存取元素,所以不支持at.(pos)函数与[ ]操作符 (二)list容器头部和尾部的操作 list对象的默…

汽车网络信息安全-ISO/SAE 21434解析(中)

目录 第七章-分布式网络安全活动 1. 供应商能力评估 2. 报价 3. 网络安全职责界定 第八章-持续的网络安全活动 1. 网路安全监控 2. 网络安全事件评估 3. 漏洞分析 4. 漏洞管理 第九章-概念阶段 1. 对象定义 2. 网路安全目标 3. 网络安全概念 第十章 - 产品开发 第十…

C#分页思路:双列表数据组合返回设计思路

一、应用场景 需要分页查询(并非全表查载入物理内存再筛选),返回列表1和列表2叠加的数据时 二、实现方式 列表1必查,列表2根据列表1的查询结果决定列表2的分页查询参数 三、示意图及其实现代码 1.示意图 黄色代表list1的数据&a…

YOLOv8源码修改(4)- 实现YOLOv8模型剪枝(任意YOLO模型的简单剪枝)

目录 前言 1. 需修改的源码文件 1.1添加C2f_v2模块 1.2 修改模型读取方式 1.3 增加 L1 正则约束化训练 1.4 在tensorboard上增加BN层权重和偏置参数分布的可视化 1.5 增加剪枝处理文件 2. 工程目录结构 3. 源码文件修改 3.1 添加C2f_v2模块和模型读取 3.2 添加L1正则…

【Block总结】DynamicFilter,动态滤波器降低计算复杂度,替换传统的MHSA|即插即用

论文信息 标题: FFT-based Dynamic Token Mixer for Vision 论文链接: https://arxiv.org/pdf/2303.03932 关键词: 深度学习、计算机视觉、对象检测、分割 GitHub链接: https://github.com/okojoalg/dfformer 创新点 本论文提出了一种新的标记混合器(token mix…

设计模式Python版 原型模式

文章目录 前言一、原型模式二、原型模式示例三、原型管理器 前言 GOF设计模式分三大类: 创建型模式:关注对象的创建过程,包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式:关注类和对…

一文讲解Java中的BIO、NIO、AIO之间的区别

BIO、NIO、AIO是Java中常见的三种IO模型 BIO:采用阻塞式I/O模型,线程在执行I/O操作时被阻塞,无法处理其他任务,适用于连接数比较少的场景;NIO:采用非阻塞 I/O 模型,线程在等待 I/O 时可执行其…

使用 postman 测试思源笔记接口

思源笔记 API 权鉴 官方文档-中文:https://github.com/siyuan-note/siyuan/blob/master/API_zh_CN.md 权鉴相关介绍截图: 对应的xxx,在软件中查看 如上图:在每次发送 API 请求时,需要在 Header 中添加 以下键值对&a…

AWTK 骨骼动画控件发布

Spine 是一款广泛使用的 2D 骨骼动画工具,专为游戏开发和动态图形设计设计。它通过基于骨骼的动画系统,帮助开发者创建流畅、高效的角色动画。本项目是基于 Spine 实现的 AWTK 骨骼动画控件。 代码:https://gitee.com/zlgopen/awtk-widget-s…

新年手搓--本地化部署DeepSeek-R1,全程实测

1.环境准备安装ollma ollma官网链接: Download Ollama on Linux ubuntu命令行安装: curl -fsSL https://ollama.com/install.sh | sh 选择运行模型,用7b模型试一下(模型也差不多5G): ollama run deepseek-r1:7b 运行qwen: ollama run qwen2.5:7b 2.为方便运行…