COLING 2024 | AlphaFin:基于LLM的股票预测大模型,显著提高预测能力

COLING 2024 | AlphaFin:基于LLM的股票预测大模型,显著提高预测能力

发布于 2024-06-13 18:31:49

目前,机器学习和深度学习算法(ML&DL)已被广泛应用于股票趋势预测,并取得了显著进展。然而,这些方法未能为预测提供理由,缺乏可解释性和推理过程。此外,它们无法整合如财经新闻或报告等文本信息。与此同时,大型语言模型(LLMs)具有出色的文本理解和生成能力。但由于金融训练数据集稀缺以及与实时知识的整合有限,LLMs仍然存在幻觉问题,并且无法跟上最新信息。

本文介绍一篇 COLING 2024 的工作,研究者提出了一个名为 AlphaFin 的金融分析框架,它结合了机器学习和深度学习算法(ML&DL)以及大型语言模型(LLMs)来提高股票趋势预测和金融问题回答的准确性和可解释性。

【论文标题】AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework

【论文地址】https://arxiv.org/abs/2403.12582

【论文源码】https://github.com/AlphaFin-proj/AlphaFin

论文概述

目前,基于时间序列数据的 ML&DL 已被广泛用于股票趋势预测,对行业产生了积极影响。然而,ML&DL 算法的性能有限,只能提供不确定的结果,并且无法处理复杂的文本数据。同时,它们不能为投资者提供有效的理由和分析潜在原因,这可能会破坏他们的投资信心。

为解决上述问题,研究者做了以下4个工作:

  1. 正式定义了金融分析任务,旨在完成股票趋势预测以及相应的金融问答。这一任务的明确为金融领域的研究和应用提供了清晰的方向。
  2. 提出了 AlphaFin 数据集,其中包含传统研究数据集、实时金融数据和手写链式思考(CoT)数据。这些数据集的引入增强了大型语言模型(LLMs)在金融分析方面的能力,使它们能够更准确地理解和处理金融信息。
  3. 基于AlphaFin数据集微调了一个名为 StockGPT 的模型,并将其集成到 Stock-Chain 框架中。Stock-Chain 框架进一步通过检索增强生成(RAG)与实时金融数据库进行集成。通过与 RAG 的结合,研究者解决了 LLMs 输出中的幻觉现象和无法生成实时内容的问题,提高了模型的准确性和实用性。
  4. 在 AlphaFin 数据集上进行了广泛的实验,结果表明 Stock-Chain 在所有基线方法中都表现出色,并在金融分析任务中展现出有效性。这些实验验证了 Stock-Chain 的优越性和实用性,为金融领域的研究和应用提供了新的思路和工具。

AlphaFin数据集

研究者首先发布了 AlphaFin 数据集,如图1所示,它包含四个部分:研究数据集、StockQA、财经新闻和财务报告。AlphaFin 的数据来源于十几个数据源。从表1中可以看出,传统的研究数据集表现出相对较短的标签长度,这阻碍了金融长语言模型(FinLLMs)的训练。因此,AlphaFin 解决了传统研究数据集中质量低和长度短的问题。

  • 研究数据集:使用传统的金融数据集,如 FPB、FinQA、convFinQA 和 Headline,来增强模型的信息提取和总结能力。
  • StockQA 数据集:包含从 Tushare 和 AKshare 获取的股票价格和其他金融数据。
  • 金融新闻数据集:整合在线新闻来源,如 CCTV 和 Wall Street CN 的金融板块,提供实时金融知识。
  • 财务报告数据集:通过 DataYes 构建,包含机构对公司的专业化分析和知识

图1 提出的AlphaFin数据集的数据来源和预处理过程

表1 AlphaFin数据集的详细情况。“Input”和“Label”分别表示它们的文本长度

Stock-Chain框架

研究者将金融分析任务视为两个相辅相成的部分,即股票趋势预测和相应的金融问答。因此,提出的 Stock-Chain 框架分为两个阶段,如图2所示。

图2 Stock-Chain 框架

01

问题定义

  • 第一阶段:股票趋势预测。给定一组公司和相应的知识文档,预测股票趋势。
  • 第二阶段:金融问答。将多轮对话会话视为查询-响应对的序列,基于当前查询、对话历史和相关文档获得响应。

02

股票趋势预测

如图2的左半部分所示,第一阶段是股票趋势预测。这一阶段使用 LLMs 和 AlphaFin 数据集来维护一个股票预测系统,以给出公司股票趋势的预测。

1)知识处理
  • 检索相关文档。
  • 设计提示模板(Prompt1),将提示与文档连接,形成输入 Ii。
2)StockGPT 微调
  • 使用 AlphaFin 的所有财务报告数据集进行训练。
  • 使用手动创建的报告 CoT 数据集引导模型逐步思考。
  • 通过两步微调,获得 StockGPTstage1,它能够更准确地基于文档

预测公司

的股票趋势,并提供详细分析和解释。

3)预测和后处理
  • 使用 StockGPT 预测股票的涨跌。
  • 手动提取预测结果,并选择所有预测为“上涨”的股票作为投资组合。

03

金融问答

除了股票趋势预测外,提出的 Stock-Chain 还具有金融问答的能力,这对投资者来说可能更有建设性。给定一个对话历史、用户查询,以及与相关的检索文档,对话系统可以给出响应。研究者采用 RAG(Retriever-Augmented Generation)来增强 LLMs 的问答能力,这通常包括三个部分:向量数据库(DB)构建、知识检索和响应生成

1)向量数据库构建
  • 知识提取:使用 ChatGPT 进行文档级总结和 RefGPT 进行实体级对话生成。
  • 知识嵌入:使用句子嵌入模型获得嵌入向量并存储在数据库中。
  • 持续更新:通过在线数据回流不断更新数据库中的报告、市场数据和金融新闻。
2)知识检索
  • 使用相同的句子嵌入模型获取用户查询的嵌入向量,并选择与查询余弦相似度最高的文档作为外部知识。
3)LLMs 微调
  • 在第一阶段的基础上,继续在 AlphaFin 的研究数据集、金融新闻和 StockQA 数据集上训练 StockGPTstage1,获得 StockGPTstage2。
4)响应生成
  • 给定对话历史、用户查询和相关文档,使用提示模板 Prompt2 生成响应

实验情况

研究者在 AlphaFin 数据集上进行了广泛实验,以验证 Stock-Chain 完成财务分析任务的能力。由于框架的结构影响,实验可以分为两个部分:一是主要考察模型的年化收益率和准确性;二是通过人类与 GPT-4 的偏好评估、消融研究和案例研究来展示 Stock-Chain 的性能。

图3:从2020年1月到2023年7月,财务报告数据集测试集下每个基准模型的累积回报(AR)。该图显示了部分基准模型的曲线。

如图3所示,曲线代表每种方法的年化收益率(AR)。StockChain 实现了最高的年化收益率,并从 2023 年开始保持上升趋势,这表明 StockChain 在投资中的有效性。

表2:AlphaFin-Test数据集上的主要实验结果

参考表2,Stock-Chain 实现了最高的 30.8% 的年化收益率(ARR),这进一步证明了其有效性。因此,研究者得出以下结论:

  • 机器学习和深度学习在股票趋势预测方面具有一定的分析能力,取得了较出色的年化收益率。
  • 在将报告数据与市场数据相结合后,大型语言模型(LLMs)普遍超越了机器学习和深度学习,提高了股票趋势预测能力。ChatGPT 实现了 14.3% 的年化收益率。尽管 LLMs 在大量文本数据上进行训练,但它们缺乏对金融领域的优化。因此,通过针对金融领域进行微调,金融领域的大型语言模型(FinLLMs)可以提高股票趋势预测能力。FinGPT 模型实现了 17.5% 的年化收益率。
  • 基于财务报告内容数据对 StockChain 进行微调后,实现了 30.8% 的年化收益率和 55.63% 的准确率(ACC)。AlphaFin 数据集在 LLMs 的训练中发挥了关键作用。通过利用全面的金融数据进行微调,提高了预测准确率和收益率,从而验证了 StockChain 的性能。

总结

在这项工作中,研究者正式定义了财务分析的任务,并提出用 AlphaFin 数据集来增强大型语言模型(LLMs)的能力,并在其基础上对 StockGPT 进行了微调。然后,又提出了 Stock-Chain 框架,该框架通过实时金融数据库(RAG)进行集成,以解决 LLMs 输出中的幻觉问题以及 LLMs 无法生成实时内容的问题。研究者在提出的 AlphaFin 数据集上进行了广泛的实验,以及一些补充实验,如消融研究、GPT4 与人类偏好评估以及案例研究,以揭示 Stock-Chain 在所有基线方法中的卓越表现,并展示了其在财务分析任务中的有效性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/799881.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

小霸王游戏卡是用什么编程的?

小霸王游戏卡曾经很流行。以超级马里奥为例,超级马里奥免费在线网址:https://supermarioplay.com/cn 游戏画面如下图: 这款游戏的编程语言是什么了? 汇编6502

【雷丰阳-谷粒商城 】【分布式高级篇-微服务架构篇】【25】【分布式事务】

持续学习&持续更新中… 守破离 【雷丰阳-谷粒商城 】【分布式高级篇-微服务架构篇】【25】【分布式事务】 本地事务事务的基本性质事务的隔离级别(下面四个越往下,隔离级 别越高,并发能力越差)事务的传播行为(是否…

Linux系统调优与日志管理全面指南

文章目录 一、文件存储基础1.1 文件与硬盘存储单位1.2 文件数据与元信息1.3 inode机制查看文件名对应的inode号码有两种方式: 1.4 inode与硬盘空间1.5 特有现象 二、inode节点耗尽故障处理2.1 模拟inode节点耗尽故障 三、恢复误删除的文件3.1 恢复误删除的ext3文件EXT类型文件恢…

Zynq7000系列FPGA中的DDRI和DDRC

在AXI接口设计中,主端口(Master Port)和从端口(Slave Port)的交互是通过仲裁器(Arbiter)来管理的,以确保多个主设备能够有序地访问共享资源(如DDR内存)。这个…

C++20中的constinit说明符

constinit说明符断言(assert)变量具有静态初始化,即零初始化和常量初始化(zero initialization and constant initialization),否则程序格式不正确(program is ill-formed)。 constinit说明符声明具有静态或线程存储持续时间(thread storage duration)的…

捷配笔记-PCB阻焊颜色对产品有什么影响?

阻焊层也称为阻焊层或阻焊剂。它是一种薄的聚合物层,应用于(PCB)。阻焊层的目的是保护PCB表面,并有助于防止焊桥。焊桥是两个导体之间的无意连接,通常是由于存在一小块焊料。需要注意的是,阻焊层被视为其单…

书生大模型实战营--L0关卡-Linux

一、SSH登录并完成nvidia-smi查看显卡以及安装pip install gradio4.29.0 二、完成vscode连接远程服务器 三、运行http://127.0.0.1:7860/

HTML表格表单及框架标签

一.表格标签 1.<table></table> 创建表格 2.<caption></caption> 表格的标题 3.<tr></tr>Table Row&#xff08;表格行&#xff09; 4.<td></td>Table Data&#xff08;表格数据&#xff09;其中有属性rowspan"2&quo…

单点触摸屏和多点触摸屏介绍以及原理简略

单点和多点触摸屏技术是现代触摸设备的基础&#xff0c;下述简单解释这两种技术及其差异。 单点触摸屏 单点触摸屏只能在某一时刻检测一个触摸点的位置。这种触摸屏适用于简单的触摸交互&#xff0c;如点击和拖动。 工作原理 单点触摸屏主要通过以下几种技术实现&#xff1…

SQL server 练习题2

课后作业 作业 1&#xff1a;自己查找方法&#xff0c;将 homework_1.xls 文件数据导入到 SQLServer 的 homework 数据库中。数据导入完成后&#xff0c;把表名统一改为&#xff1a;外卖表 如下所示&#xff1a; 作业 2&#xff1a;找出所有在 2020 年 5 月 1 日至 5 月 31 …

【Redis从0到1进阶】Redis 持久化

笔记内容来自B站博主《遇见狂神说》&#xff1a;Redis视频链接 Redis 是内存数据库&#xff0c;如果不将内存中的数据库状态保存到磁盘&#xff0c;那么一旦服务器进程退出&#xff0c;服务器中的数据库状态也会消失。所有Redis 提供了持久化功能&#xff01; 一、RDB&#xff…

【256 Days】我的创作纪念日

目录 &#x1f33c;01 机缘 &#x1f33c;02 收获 &#x1f33c;03 日常 &#x1f33c;04 成就 &#x1f33c;05 憧憬 最近收到官方来信&#xff0c; 突然发现&#xff0c;不知不觉间&#xff0c;距离发布的第一篇博客已过256天&#xff0c;这期间我经历了春秋招、毕业答辩…

AV1 编码标准熵编码技术概述

AV1熵编码 AV1编码技术是一种开源的视频编解码标准&#xff0c;由开放媒体联盟&#xff08;AOMedia&#xff09;开发&#xff0c;旨在提供高效的视频压缩&#xff0c;同时避免复杂的专利授权问题。在熵编码方面&#xff0c;AV1采用了一种多符号上下文自适应算术编码技术&#x…

在 PostgreSQL 里如何实现数据的实时监控和性能瓶颈的快速定位?

&#x1f345;关注博主&#x1f397;️ 带你畅游技术世界&#xff0c;不错过每一次成长机会&#xff01;&#x1f4da;领书&#xff1a;PostgreSQL 入门到精通.pdf 文章目录 在 PostgreSQL 里如何实现数据的实时监控和性能瓶颈的快速定位一、数据实时监控的重要性二、PostgreSQ…

数据库:基本操作

SQL struct query language 关系型数据库 非关系 芒果db ddl data defination language 建表 dml 新增 修改 删除一行 data modifty dql 查询 data query language 查询 select 数据库 sun solaris gnu 1、分类&#xff1a; 大型 中型 …

MySQL学习记录 —— 이십 常用工具包

文章目录 1、总览2、mysqlcheck - 表维护程序1、作用2、注意事项3、语法4、命令选项下面每块都大致有这四个部分 3、Mysqldump - 数据库备份程序4、mysqladmin - MySQL 服务器管理程序5、mysqlshow - 显示数据库、表和列信息6、mysqldumpslow - 总结慢查询日志文件7、mysqlbinl…

内存ECC基础纠错算法有哪些?

3.1 基础纠错算法 3.1.1 SECDED纠错算法 SECDED&#xff08;Single Error Correction Double Error Detection&#xff09;是一种经典的ECC方案&#xff0c;能够纠正单比特错误并检测出双比特错误。在图4(a)中&#xff0c;展示了SECDED的编码过程。在这个过程中&#xff0c;使…

STM32之八:IIC通信协议

目录 1. IIC协议简介 1.1 主从模式 1.2 2根通信线 2. IIC协议时序 2.1 起始条件和终止条件 2.2 发送一个字节 2.3 接收一个字节 2.4 应答信号 1. IIC协议简介 IIC协议是一个半双工、同步、一主多从、多主多从的串行通用数据总线。该通信模式需要2根线&#xff1a;SCL、…

mysql(5.5)启动服务和环境配置

正常启动 参考&#xff1a;Javaweb基础之mysql回溯笔记(一) 总的来说就是在mysql的安装目录下&#xff0c;找到bin下面的msyqld.exe&#xff0c;双击即启动了mysql服务&#xff1b; 启动方式二 也可以直接找到windows的服务项进行启动&#xff0c;操作如下&#xff1a; 打开…

opencascade AIS_InteractiveContext源码学习8 trihedron display attributes

AIS_InteractiveContext 前言 交互上下文&#xff08;Interactive Context&#xff09;允许您在一个或多个视图器中管理交互对象的图形行为和选择。类方法使这一操作非常透明。需要记住的是&#xff0c;对于已经被交互上下文识别的交互对象&#xff0c;必须使用上下文方法进行…