GPT-4 的决策在股市中进行量化投资

论文题目:
Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection

论文链接:
https://arxiv.org/abs/2401.03737

博客地址:
https://www.marketsense-ai.com/


从本质上来说,股票选择是个价格发现机制,在股票投资中,市场参与者通过理解和使用各种信息做出决策。然而,自从 08 年的金融危机后,资本市场的结构和功能发生了重大变化,对价格发现产生了持久的影响。因素共同扰乱了价格发现的正常运作,导致投资者减少准确评估风险和资产价值的动力。然而,相较于拥有专业团队和全面分析工具的财富管理公司来说,由于分析信息的能力有限、易受行为偏见的影响以及缺乏健全的风险管理技能,个人投资者通常难以分析股票。

而基于 GPT-4 进行决策的 MarketSenseAI 也许能破除这个困境,与传统股票分析方法相比,MarketSenseAI 具有以下优势:

  • 分析全面性:能够整合多种数据类型,包括公司新闻、基本面、市场动态和宏观经济信息,为投资者提供全面的分析。

  • 基于 AI 的决策:利用 GPT-4 模型进行决策,具有更高的分析能力和更强的适应性。

  • 可解释性:生成的投资建议附带详细解释,帮助投资者更好地理解分析结果。

  • 灵活性:可广泛应用于不同的金融资产,特别是在传统分析较少的市场中,可能发挥更大的优势。

MarketSenseAI

MarketSenseAI 的框架如图 1 所示,该架构整合了负责处理数据输入四个核心组件,以及用于促进最终投资建议(即买入、持有或卖出)的第五个组件,该组件综合了所有信息,并为相应的决策提供简明扼要的解释。其中每个组件都建立在 GPT-4 的 API 上,利用一次性提示和上下文学习来执行不同任务。

图片

▲图1 MarketSenseAI 的架构图

该框架可以模拟专业投资团队的决策过程,旨在提供全面而深入的投资决策支持,涵盖市场各个方面的信息。具体而言,该框架通过多个核心组件来实现这一目标。

  1. 新闻摘要器:追踪公司或其部门的最新发展,以保持对市场动态的敏感性。

  2. 基本面摘要器:对公司的最新财务报表进行分析,以评估其财务健康状况

  3. 宏观和价格动态摘要器:结合了对价格行为动态的考虑,对当前环境进行宏观经济分析。

渐进式新闻摘要器

渐进新闻摘要器负责新闻获取、压缩和制作股票最具影响力新闻的渐进性摘要。如图 2 所示,获取与特定股票对应的每日新闻。

图片

▲图2 渐进新闻摘要器

首先,对每日新闻进行预处理,剔除了与公司无关的文本,并确保其以适当的格式输入系统。接着,通过 API 访问 GPT-4,系统有序地提供提示,以生成每日新闻的简明摘要,并将其集中储存。

为了弥补特定日期摘要的不足,引入了渐进式新闻摘要器,通过将最新的新闻摘要与之前的渐进摘要集成,确保全面包含公司相关新闻内容,这对于在公司决策过程中仍具有重要意义的旧新闻(如并购或法律纠纷)尤为关键。

基本面摘要器

基本面摘要器的目标是提供公司财务状况的事实性概览,而非直接提供投资建议。

在预测性金融分析中,至关重要的基本数据能提供反映公司当前健康状况和未来走势的关键量化指标。如图 3 所示,作者使用 EODHD 的基本数据 API 获取这些关键的季度信息。为了方便对财务数据进行比较,作者在将数据输入提示之前进行了预处理:采用数字缩写技术,使用诸如“百万”和“亿”等单位来表示大数,并将来自不同季度的数据以表格形式合并。作者通过将最近两个季度的财务报表输入到 GPT-4 中进行比较,深入研究了企业利润能力、收入轨迹、债务指标和现金流动态。

图片

▲图3 股票的基本面摘要

股价动态摘要器

股价动态摘要器在 MarketSenseAI 中扮演着关键角色,它对股票的价格趋势和财务指标进行深入分析和上下文处理。如图 4 所示,该组件不仅关注目标股票本身,还通过与其他相似公司的比较,以及考虑整个市场的背景,提供了更全面的分析和情境化,以更好地理解目标股票在行业和市场整体中的表现。

图片

▲图4 股价动态摘要

识别相似股票的方法如算法 1 概述,利用 MPNet 语言模型生成 Embedding 并计算相似性分数。

图片

▲算法1 相似股票识别算法

摘要器获取了目标股票、与其相似的其他股票以及 S&P 500 指数的市场数据。接着,它对这些数据进行深入分析,关注关键的财务指标,其中包括 3、6 和 12 个月的累积回报和夏普比率,并进行了波动性和最大回撤的计算。其中:

  • 夏普比率:提供了有关股票在市场下行期间的风险调整回报的信息。

  • 最大回撤:反映了股票在某一时期内可能承受的最大损失。

这种全面的分析使我们能够深入了解目标股票相对于同行和更广泛市场的表现,包括其在市场波动和风险方面的应对能力。

宏观经济环境摘要器

进行深入的宏观经济分析对于做出明智的投资决策和有效的资本配置至关重要,因为它提供了对整体经济健康和绩效的关键见解,这有助于投资者及时获取关键信息,更好地理解当前经济环境并做出明智的投资决策。

由此,MarketSenseAI 包含了一个名为市场摘要(MarketDigest)的组件,每两周综合一次投资报告和研究文章,提供复杂经济数据和趋势的简明摘要。它通过搜集各大银行和投资机构的各种公开报告,从而确保了从多个权威来源获取信息,而且能将多种观点和分析融入连贯叙述中。具体地:

  1. 将这些报告和文章转化为文本形式,然后利用 GPT-4 对每份报告进行摘要。

  2. 将这些个别摘要浓缩成一个全面的概述。

图片

▲图5 宏观经济环境摘要

信号生成

信号生成器是 MarketSenseAI 流程的最后一步,可以整合分析多种金融数据(包括公司新闻、基本面、市场动态和宏观经济信息),从而生成投资决策信号(买入、卖出或持有),以及对这个选择背后的推理的清晰、逐步的解释。其中,GPT-4 采用思维链方法(CoT),通过多步分析引导模型做出关于下个月投资组合分配的决策,提示结构为:

  • 新闻分析:评估与目标公司相关的最新新闻摘要,以评估它们对股票绩效的潜在影响。

  • 价格动态分析:将股票的价格动态与相关股票和整体市场进行比较,提供相对绩效的视角。

  • 宏观经济环境分析:评估更广泛的宏观经济格局及其对目标公司的影响,考虑全球经济趋势和事件。

  • 基本面分析:对公司基本的财务数据进行审查,分析其当前的财务状况和未来前景。

图片

▲图6 MarketSenseAI 组件与信号的文本相似性

图 6 展示了 MarketSenseAI 内部的文本相似性分析,而表 1 则提供了详细说明,这表明模型的决策过程与不断变化的输入信息相一致,对于生成每月的投资信号至关重要。

图片

▲表1 信号与组件之间的文本相似性统计

  • 新闻和价格动态摘要有高相似性分数,表明模型强调了这些迅速变化的因素,以及它们对股价的即时影响。这对于短期、每月的预测至关重要,因为当前的发展和价格趋势很大程度上可以影响市场行为。

  • 相反,基本面和宏观组件的平均相似性分数较低,对模型每月决策的直接影响较小。基本面每季度更新一次,提供了对公司财务健康的稳定但不经常变化的视角,而宏观经济数据则更为广泛和通用,对短期投资决策的影响更小。

实验

Bootstrapping 评估结果

自举法(Bootstrapping)是一种统计学中的重抽样方法,用于估计统计量的分布或标准误差。其基本思想是通过从原始样本中有放回地抽取大量的随机样本,来近似得到原始样本的分布情况。

图片

▲表2 MarketSenseAI vs 自举投资组合

表 2 显示了实验结果,该评估对比了 MarketSenseAI 与各种自举投资组合的有效性。对 MarketSenseAI 在去趋势化收益方面的性能进行评估,从而提供了对其信号生成能力的精细分析。

实验结果表明 MarketSenseAI 的交易信号在各种信号类别中的累积收益和命中率明显优于随机机会。即使在去趋势化收益的评估中,相比于随机信号生成方法,MarketSenseAI 的表现更出色,有力地证明了其交易信号明显超出了单纯偶然的预期,这表明它在辨别具有利润潜力的投资机会方面具备较高能力。

市场表现评估结果

基本策略

图片

▲表3 MarketSenseAI 基本策略的表现

对 MarketSenseAI 的基本策略进行评估,从表 3 和图 9 的结果来看,揭示了使用 LLM 推动的投资策略的效果,总体而言,MarketSenseAI 的全部信号(MS)和仅考虑“买入”信号的长期版本(MS-L)的策略都显示出相对良好的回报

图片

▲图9 等权重投资组合的表现

结果表明,MarketSenseAI 的基本策略在总体和风险调整回报方面明显优于等权重的 S&P 100 指数,相较于市场参与者通常采用的天真的趋势跟随策略,MarketSenseAI 在 2023 年取得了更显著的结果。

基于市值加权的表现方面,MS-LCap 策略在夏普比率、Sortino 比率以及总回报方面均表现出色,总回报达到惊人的 40.27%,这相较于 S&P100 ETF 超过了约 12.6%,如图 10 所示。

图片

▲图10 基于市值加权的投资组合的表现

基于排名的策略

图片

▲表4 MarketSenseAI 基于排名的策略的表现

表 4 和图 11 的研究重点放在了实际应用这些信号的投资组合上。结果表明,融入 GPT-4 排名的策略在总回报和风险调整指标方面明显优于其他变体。此外,MS-HighGPT 与 MS-Low-GPT 策略之间存在显著差异,突显了 MarketSenseAI 信号附加解释的价值,以及作为传统风险/回报为基础的股票排名方法的较好替代方法。

图片

▲图11 排名投资组合的表现

GPT 排名

借鉴了 GPT-4 对 MarketSenseAI 信号排名的洞察后,其买入信号在评估期间有很高的解释质量。图 12 展示了每个月每只股票的买入信号频率,并通过散点图描绘了 GPT-4 分配的评估分数,这些分数基于每个买入建议的解释深度和相关性。从图中可以观察到,技术和人工智能相关的股票得分较高,反映了这些领域在 2023 年市场上的炒作。这不仅证明了 MarketSenseAI 的买入信号的相关性,还突显了该模型在解释中捕捉和传达当前市场情绪和潜力的能力

图片

▲图12 由 GPT-4 排名的信号

总结

通过综合多种来源、多种模态的信息,MarketSenseAI 提供了对金融领域更全面的视角,带来更加明智和数据驱动的投资决策。这个以 AI 为基础的框架为个人和专业投资者提供了一种独特工具,可处理和分析庞大的数据集,实现生成可扩展、可操作的投资信号。该创新性方法已经通过验证,超越基准指数,这证明了在当今复杂的市场环境中的有效性。今后将有望实现:

  • 分析股票:模拟顶尖投资团队,能够提供相对专业的资产洞察,为更明智的财务决策提供全面分析。

  • 投资信号:提供可行、可解释、透明的投资信号。

  • 个性化投资组合:根据用户独特的投资目标和风险偏好,量身定制投资组合策略。

目前为了防范资金风险,还需要进行持续研究和长期试验,以确认 MarketSenseAI 在不同市场周期和情景中的效率和灵活性。然而,相较于之前量化方案中简单地用时间序列的相关网络处理股票数据,MarketSenseAI  还综合了股票市场的其他模态信息,进行了详细而又全面地分析解读,避免了单纯地使用黑盒神经网络在股票信息中寻找特征。也许未来它能够成为一名优秀的 AI 基金经理,让相对小白的投资人士也能通过全面的分析来读懂市场。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/338929.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

深入解析ESP32C3(2)- 存储类型和地址空间

ESP32C3芯片的存储资源 • 384 KB 的ROM:用于程序启动和内核功能调用 • 400 KB 片上SRAM:用于数据和指令存储,时钟频率可配置,最大160 MHz。400 KB SRAM 中,有16 KB 配置为cache 专用 • RTC 快速存储器:…

VC++中使用OpenCV进行形状和轮廓检测

VC中使用OpenCV进行形状和轮廓检测 在VC中使用OpenCV进行形状和轮廓检测,轮廓是形状分析以及物体检测和识别的有用工具。如下面的图像中Shapes.png中有三角形、矩形、正方形、圆形等,我们如何去区分不同的形状,并且根据轮廓进行检测呢&#…

初学python系列: pandas操作excel

媳妇工作中经常用到excel处理,想用python处理excel更高效,所以自学了python,觉得python比Java还是简单多了,没有变量类型声明,比Java也就多了元组,各种库很丰富。 需求是: 汇总两个excel中 列&…

【MySQL】一文总结MVCC多版本并发控制

目录 MVCC 介绍当前读和快照读当前读快照读 MVCC 原理解析隐式字段Undo Log版本链Read ViewRead View 可见性原则 RC 和 RR 下的 Read ViewRC 下的 Read ViewRR 下的 Read View小结RR 级别下能否防止幻读总结 MVCC 介绍 在当今高度并发的数据库环境中,有效的并发控…

系统架构设计师教程(十二)信息系统架构设计理论与实践

信息系统架构设计理论与实践 12.1 信息系统架构基本概念及发展12.1.1 信息系统架构的概述12.1.2 信息系统架构的发展12.1.3 信息系统架构的定义 12.2 信息系统架构12.2.1 架构风格12.2.2 信息系统架构分类12.2.3 信息系统架构的一般原理12.2.4 信息系统常用4种架构模型12.2.5 企…

flink结合Yarn进行部署

1. 什么是Yarn模式部署Flink 独立(Standalone)模式由 Flink 自身提供资源,无需其他框架,这种方式降低了和其他第三方资源框架的耦合性,独立性非常强。但我们知道,Flink 是大数据计算框架,不是资…

[娱乐]索尼电视安装Kodi

索尼电视不能直接apk安装kodi应用 android studio安装后附带 abd, 路径 C:\Users\[yourname]\AppuoData\Local\Android\Sdk\platform-tools\adb.exe安卓电视点击内部版本号,启用开发者模式 adb 连接索尼安卓电视,记得电视上运行调试 abi选…

Vue——计算属性

文章目录 计算属性computed 计算属性 vs methods 方法计算属性完整写法 综合案例:成绩案例 计算属性 概念:基于现有的数据,计算出来的新属性。依赖的数据变化,自动重新计算 语法: ①声明computed配置项中,一个计算属性…

stable diffuison的安装和使用

stable diffuison的安装和使用 简单介绍 Stable Diffusion是一个深度学习文本到图像的生成模型,它可以根据文本描述生成详细的图像。这个模型主要应用于文本生成图像的场景中,通过给定的文本提示词,模型会输出一张与提示词相匹配的图片。 S…

C++提高编程---模板---类模板

目录 一、类模板 1.模板 2.类模板的作用 3.语法 4.声明 二、类模板和函数模板的区别 三、类模板中成员函数的创建时机 四、类模板对象做函数参数 五、类模板与继承 六、类模板成员函数类外实现 七、类模板分文件编写 八、类模板与友元 九、类模板案例 一、类模板 …

HTML CSS 发光字头特效

效果展示&#xff1a; 代码&#xff1a; <html><head> </head><style>*{margin: 0;padding: 0;}body {text-align: center;}h1{/* border: 3px solid rgb(201, 201, 201); */margin-bottom: 20px;}.hcqFont {position: relative;letter-spacing: 0.07…

数据结构【DS】Ch8 排序

文章目录 插入排序选择排序归并&基数外部排序 插入排序 交换排序 选择排序 归并&基数 外部排序

电脑可以连接wifi,甚至可以qq聊天,但就是不能用浏览器上网,一直显示未检测出入户网线的解决方案

今天回到家&#xff0c;准备办公却发现电脑可以连接wifi&#xff0c;甚至可以qq聊天&#xff0c;但就是不能用浏览器上网&#xff0c;一直显示未检测出入户网线的解决方案&#xff0c;小白也可以看懂 以下有几种解决方案&#xff0c;不妨都试试&#xff0c;估计可以解决95%的相…

【C语言基础篇】结构控制(下)转向语句break、continue、goto、return

文章目录 一、break语句 1. break在 while 循环中 2. break在 for 循环中 3. break在 do…while 循环中 4. break在 switch 语句中 5. break 总结 二、continue语句 1. continue在 while 循环中 2. continue在 for 循环中 3. continue在 do...while 循环中 4. con…

PY调包侠——Collections高效库

一、【写在前面】 PY是一个调包侠语言&#xff0c;多学一个库可以提高计算速度。Collections提供了各种数据类型和集合工具&#xff0c;可以很方便的处理各种数据结构。如果您有刷力扣的习惯&#xff0c;可以经常看到Collections和itertools的身影&#xff0c;经常用这两个可以…

【数据结构】二叉树相关oj题(一)

目录 1、二叉树的构建及遍历 1.1、题目介绍 1.2、解题思路 1.3、代码描述 1.4、完整代码 2、二叉树的层次遍历 2.1、题目介绍 2.2、解题思路 2.3、代码描述 2.4、完整代码 1、二叉树的构建及遍历 1.1、题目介绍 原题链接&#xff1a;KY11 二叉树构建及遍历_牛客题霸…

ElasticSearch 7.x现网运行问题汇集1

问题描述&#xff1a; 现网ElasticSearch health状态变为red&#xff0c;有分片无法assign。如下摘录explain的结果部分&#xff1a; "note": "No shard was specified in the explain API request, so this response explains a randomly chosen unassigned s…

docker 部署 sentinel

docker 部署 sentinel 环境安装 拉取镜像 目前稳定的版本是1.8.0 docker pull bladex/sentinel-dashboard:1.8.0启动服务 docker run --name sentinel -p 8858:8858 -td bladex/sentinel-dashboard:1.8.0登录 登录的时候账号和密码都是sentinel

openGauss学习笔记-203 openGauss 数据库运维-常见故障定位案例-修改索引时只调用索引名提示索引不存在

文章目录 openGauss学习笔记-203 openGauss 数据库运维-常见故障定位案例-修改索引时只调用索引名提示索引不存在203.1 修改索引时只调用索引名提示索引不存在203.1.1 问题现象203.1.2 原因分析203.1.3 处理办法 openGauss学习笔记-203 openGauss 数据库运维-常见故障定位案例-…

modelscope下载模型

# 私有模型下载&#xff0c;前提是您有响应模型权限 方法1 git lfs install git clone http://oauth2:your_git_tokenwww.modelscope.cn/<namespace>/<model-name>.git 如何获取git token 用您的账号登录https://www.modelscope.cn &#xff0c;在个人中心->访…