热门金融大模型整理

FinRobot (开源)

  • FinRobot: An Open-Source AI Agent Platform for Financial Applications using Large Language Models

FinRobot,一个支持多种金融专用 AI 代理的开源平台,每个代理均由 LLM 驱动。平台架构包括:金融 AI 代理层,将复杂问题逻辑分解以形成金融思维链;金融 LLM 算法层,为任务定制模型策略;LLMOps 和 DataOps 层,利用相关数据进行模型训练和微调;以及多源 LLM 基础模型层,整合各类 LLM 资源。FinRobot 不仅服务于专业分析师,也让普通用户能够利用 AI 技术进行深入的金融分析。

项目:https://github.com/AI4Finance-Foundation/FinRobot
论文网址:https://arxiv.org/abs/2405.14767

FinGPT

  • FinGPT: Open-Source Financial Large Language Models

FinGPT项目由AI4Finance-Foundation开发,是一个开源的金融大型语言模型(FinLLM)
FinGPT通过专注于顶级开源LLMs的轻量级改编,它不仅提高了透明度,还允许用户定制,以适应个性化金融咨询服务的兴起趋势。FinGPT集成了多个模型,如Llama-

FinGPT的特色模块包括FinGPT-RAG,专门用于金融情感分析,通过外部知识检索优化信息深度和背景,以及FinGPT-FinNLP,提供金融领域LLM训练和微调的完整流程。FinGPT-Forecaster是一个股价预测工具,可以快速适应新数据,与传统模型相比具有较高的成本效益。

FinGPT提供了多种数据集和多任务金融LLM模型,用于情感分析、金融关系提取和问答等任务,并能够有效、低成本地适应金融领域的动态变化,并利用“人类反馈强化学习(RLHF)”技术进行个性化学习。此外,FinGPT引入了新的指令调整范式,增强了模型适应多样化金融数据集的能力,并促进了开源大型语言模型在金融数据集中的系统性基准测试和成本效益

项目:https://github.com/AI4Finance-Foundation/FinGPT
论文网址:https://arxiv.org/abs/2310.04793

FinGLM

FinGLM 是一个致力于构建开放、公益和持久的金融大模型项目,旨在促进「AI+金融」的开源项目。该项目通过开源的方式探索金融领域中人工智能的应用边界。它主要关注于深度解析上市公司年报,利用AI技术实现专家级别的金融分析,面对金融文本中的专业术语与隐含信息,简化并提高对上市公司年报的解读准确性,帮助投资者更好地理解公司的经营状况、财务状况和未来规划。项目包括数据准备、模型微调、问答等多个流程,并提供了ChatGLM-6B 模型相关课程内容,涵盖PPT、视频和技术文档。

项目:https://github.com/MetaGLM/FinGLM

XuanYuan,轩辕(度小满中文金融对话大模型)

轩辕是国内首个开源的千亿级中文对话大模型,同时也是首个针对中文金融领域优化的千亿级开源对话大模型。轩辕在BLOOM-176B的基础上针对中文通用领域和金融领域进行了针对性的预训练与微调,它不仅可以应对通用领域的问题,也可以解答与金融相关的各类问题,为用户提供准确、全面的金融信息和建议。千亿级BLOOM-176B的模型已可以在Huggingface中申请下载。

2023年9月22日,度小满宣布“轩辕70B”金融大模型开源,所有用户均可自由下载和试用,并公布了“轩辕70B”在C-Eval、CMMLU两大权威大语言模型评测基准的成绩。

轩辕70B(度小满中文金融对话大模型)是由度小满金融开发的中文金融对话大模型,基于Llama2-70B模型进行中文增强。该模型融合了大量中英文语料的增量预训练,包括底座模型和使用高质量指令数据对齐的聊天模型。特别针对金融场景中的长文本业务,它将上下文长度扩展到了8k和16k。轩辕70B大模型在保持中英文通用能力的同时,显著提高了金融理解能力。该项目还包括了通用能力评测和金融领域评测,使用多种客观评测基准,以确保模型在金融领域的有效性和通用性。

项目:https://github.com/Duxiaoman-DI/XuanYuan
论文网址:https://arxiv.org/abs/2305.12002

FinanceIQ:中文金融领域知识评估数据集

在金融行业中,目前缺乏统一和完善的大模型评估标准。现有的通用框架如C-Eval和CMMLU在金融领域的适用性有限。FinanceIQ,作为轩辕项目的一部分,是一个中文金融领域知识评估数据集。它旨在有效评估模型在金融环境中的表现。该项目提出建立专为金融领域设计的评估体系,分为通用能力、专业知识和场景应用三部分。通用能力评估覆盖语言、数学等方面;专业知识评估重点关注金融领域的具体知识,如寿险、投资等;场景应用则侧重于模型在实际业务环境的表现。

该数据集涵盖了10个金融大类及36个金融小类,包含总计7173个单项选择题,包括CPA、税务师等多个金融领域考试,并且使用GPT4对题目进行改写以测试模型的泛化能力,保证评估的客观性和多样性。为了确保客观公正的评估,所有模型均放在“同一起跑线”上进行测试,题目经过改写和人工校对,以验证模型的泛化能力。FinanceIQ为轩辕项目提供了一个全面且细致的金融领域模型性能评估工具,这一体系旨在更精确评估模型在金融环境的表现,同时降低实际应用的试错成本。

项目:https://github.com/Duxiaoman-DI/XuanYuan/tree/main/FinanceIQ

Cornucopia(聚宝盆):基于中文金融知识的LLaMA微调模型

该项目是一系列中文金融大模型的开源项目,提供了一套针对金融垂直领域的高效大语言模型训练框架,包括预训练、SFT、RLHF、量化等方法。项目基于LLaMA系列基模型,通过中文金融知识的指令微调(Instruct-tuning)进行了优化,使用中文金融公开问答数据和爬取的金融问答数据构建指令数据集,提高了模型在金融领域的问答效果。此外,项目还计划使用GPT3.5/4.0 API构建更高质量的数据集,并在中文知识图谱-金融、CFLEB金融数据集等基础上扩充指令数据集。近期,项目已发布了基于Chinese-LLaMA和Meta-LLaMA与中文金融数据进行指令微调的模型。

项目:https://github.com/jerry1993-tech/Cornucopia-LLaMA-Fin-Chinese

Auto-GPT MetaTrader,量化交易插件

Auto-GPT-MetaTrader-Plugin是一款连接MetaTrader交易账户至Auto-GPT的软件工具,使交易者能够利用GPT-4的强大功能进行金融交易。该插件支持执行和管理交易、获取账户信息、提供市场数据等功能,为交易者提供自动化和智能化的交易体验。这不仅展示了AI技术在金融交易中的应用潜力,还为交易者带来了更加高效、便捷的交易方式,进一步推动了金融科技领域的发展。

项目:https://github.com/isaiahbjork/Auto-GPT-MetaTrader-Plugin

PIXIU貔貅:开源金融大语言模型

PIXIU貔貅是一个面向金融领域的综合性框架。它包括基于LLaMA模型微调得到的首个金融领域大型语言模型(FinMA)、首个包含136K数据样本的指令数据,以及一个涵盖5个任务和9个数据集的评估基准。FinMA模型经过多任务指令调整,能够处理各种金融任务。与此同时,研究团队提出了一个标准化的金融语言模型评估基准,涵盖关键的金融任务,包括五个金融自然语言处理(NLP)任务和一个金融预测任务。实验结果表明FinMA在大多数任务上性能优于现有的LLMs,如BloombergGPT、ChatGPT和GPT-4,尤其是在金融情感分析、新闻标题分类、命名实体识别和股票运动预测方面。这证明了专为金融领域量身定制的LLMs的重要性。此外,所有相关的模型、数据集、基准和实验结果都已开源,以便于未来金融AI的研究。

项目:https://github.com/The-FinAI/PIXIU
论文:https://arxiv.org/abs/2306.05443

DISC-FinLLM,中文金融大语言模型

DISC-FinLLM 是一个专门针对金融场景下为用户提供专业、智能、全面的金融咨询服务的金融领域大模型,由复旦大学数据智能与社会计算实验室 (Fudan-DISC) 开发并开源。这个项目通过集成四个模组——金融咨询、金融文本分析、金融计算、金融知识检索问答,构成了一个多专家智慧金融系统。每个模组专注于不同的金融NLP任务,包括与用户就金融话题进行多轮对话、在金融文本上完成信息抽取、情感分析、文本分类、文本生成等任务,以及帮助用户完成数学计算和提供基于金融新闻、研报的投资建议等

项目:https://github.com/FudanDISC/DISC-FinLLM
论文:http://arxiv.org/abs/2310.15205

BBT-FinCUGE-Applications

项目“BBT-FinCUGE-Applications”致力于提升中文金融领域自然语言处理(NLP)的能力。它包括BBT-FinCorpus,这是一个大规模多样性的中文金融领域开源语料库,以及BBT-FinT5,这是一个基于T5模型架构的中文金融领域预训练语言模型。此外,项目还提供了一套金融领域自然语言处理评测基准CFLEB,涵盖了六种不同的NLP任务。这些成果有助于提高中文金融NLP的性能和泛化能力,尤其对信息抽取等关键任务表现出显著的优化效果。

该项目构建了目前最大规模的中文金融领域开源语料库,包含大约300GB的文本,源自四种不同类型的金融相关数据,如公司公告、研究报告、财经新闻和社交媒体内容。这一丰富多样的语料库有助于提高预训练语言模型的性能和泛化能力。

论文地址:

论文:https://arxiv.org/abs/2302.09432
评测基准网站:https://bbt.ssymmetry.com/index.html
项目地址:https://github.com/supersymmetry-technologies/BBT-FinCUGE-Applications

WeaverBird (织工鸟)

介绍:这是一个专为金融领域设计的智能对话系统。该系统采用了经过大量金融相关文本调整的GPT架构大型语言模型。这一项目由蚂蚁集团、芝加哥大学和TTIC的研究人员共同开发。这个项目的意义在于为金融领域提供了一个高度专业化和定制化的智能对话系统,有助于提高金融决策的效率和准确性,推动金融科技领域的发展。

论文:https://arxiv.org/abs/2308.05361
项目地址:https://github.com/ant-research/fin_domain_llm

FLANG (Financial LANGuage model)

介绍:FLANG (Financial LANGuage model) 是一个针对金融领域特定的预训练语言模型。该项目旨在利用金融关键词和短语进行更有效的掩码处理,同时采用跨度边界目标和内部填充目标。FLANG的架构基于ELECTRA训练策略,使用金融特定数据集和常规英语数据集(如Wikipedia和BooksCorpus)。该项目还包括FLUE(Financial Language Understanding Evaluation),这是一个综合性且多样化的金融领域基准测试,由5个不同的金融领域特定数据集构成。

项目地址:https://github.com/SALT-NLP/FLANG

InvestLM

介绍:InvestLM是由香港科技大学工商管理学院研究团队开发的一个项目,它是本港首个专为金融界设计的生成式人工智能(AI)开源大语言模型。InvestLM能就金融相关问题与用户进行对话,其回应质量可媲美知名的商业聊天机器人,例如OpenAI的ChatGPT。该模型是通过指令微调技术和精选的财经问答文本对LLaMA-65B模型进行训练得到的,旨在提高金融专业人士的工作效率,例如提供投资建议、写作财经文章等。InvestLM的性能被评为可与最先进的商用大语言模型相媲美,并且在理解金融文本方面展现了强大的能力。此外,研究团队还发现使用领域特定的高质量指令对模型进行训练比使用通用指令更有效果。

项目:https://github.com/AbaciNLP/InvestLM
论文:https://arxiv.org/abs/2309.13064

参考推文:https://zhuanlan.zhihu.com/p/699893457
https://zhuanlan.zhihu.com/p/676166489

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/923416.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

STM32F103外部中断配置

一、外部中断 在上一节我们介绍了STM32f103的嵌套向量中断控制器,其中包括中断的使能、失能、中断优先级分组以及中断优先级配置等内容。 1.1 外部中断/事件控制器 在STM32f103支持的60个可屏蔽中断中,有一些比较特殊的中断: 中断编号13 EXTI…

解决SSL VPN客户端一直提示无法连接服务器的问题

近期服务器更新VPN后,我的win10电脑一致无法连接到VPN服务器, SSL VPN客户端总是提示无法连接到服务端。网上百度尝试了各种方法后,终于通过以下设置方式解决了问题: 1、首先,在控制面板中打开“网络和共享中心”窗口&…

从零开始:Linux 环境下的 C/C++ 编译教程

个人主页:chian-ocean 文章专栏 前言: GCC(GNU Compiler Collection)是一个功能强大的编译器集合,支持多种语言,包括 C 和 C。其中 gcc 用于 C 语言编译,g 专用于 C 编译。 Linux GCC or G的安…

小程序-基于java+SpringBoot+Vue的网上花店微信小程序设计与实现

项目运行 1.运行环境:最好是java jdk 1.8,我们在这个平台上运行的。其他版本理论上也可以。 2.IDE环境:IDEA,Eclipse,Myeclipse都可以。推荐IDEA; 3.tomcat环境:Tomcat 7.x,8.x,9.x版本均可 4.硬件环境&#xff1a…

Transformer:一种革命性的序列到序列学习框架

目录 ​编辑 引言 Transformer模型的基本结构 1. 自注意力机制 2. 前馈神经网络 3. 位置编码 Transformer的工作原理 Transformer的应用 机器翻译 文本摘要 问答系统 文本分类 语音识别 图像识别 结论 引言 Transformer模型,自2017年由Vaswani等人提…

轮转数组(java)

题目描述 给定一个整数数组 nums,将数组中的元素向右轮转 k 个位置,其中 k 是非负数 示例 1: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解释: 向右轮转 1 步: [7,1,2,3,4,5,6] 向右轮转 2 步: [6,7,1,2,3,4,5] 向右轮转 3 步: [5,6,7,…

【vue3实现微信小程序】每日专题与分页跳转的初步实现

快速跳转: 我的个人博客主页👉:Reuuse博客 新开专栏👉:Vue3专栏 参考文献👉:uniapp官网 免费图标👉:阿里巴巴矢量图标库 ❀ 感谢支持!☀ 前情提要 &#x…

【优先算法学习】双指针--结合题目讲解学习

目录 1.有效三角形的个数 1.2题目解题思路 1.3代码实现 2.和为s的两个数 2.1刷题链接-> 2.2题目解题思路 2.3代码实现 1.有效三角形的个数 1.1刷题链接-> 力扣-有效三角形的个数https://leetcode.cn/problems/valid-triangle-number/description/ 1.2题目解…

云服务器部署WebSocket项目

WebSocket是一种在单个TCP连接上进行全双工通信的协议,其设计的目的是在Web浏览器和Web服务器之间进行实时通信(实时Web) WebSocket协议的优点包括: 1. 更高效的网络利用率:与HTTP相比,WebSocket的握手只…

前端---HTML(一)

HTML_网络的三大基石和html普通文本标签 1.我们要访问网络,需不需要知道,网络上的东西在哪? 为什么我们写,www.baidu.com就能找到百度了呢? 我一拼ping www.baidu.com 就拼到了ip地址: [119.75.218.70]…

网络基础 - IP 隧道篇

在一个如图所示的网络环境里,网络 A、B 使用 IPv6,如果处于中间位置的网络 C 支持使用 IPv4 的话,网络 A 与网络 B 之间将无法直接进行通信,为了让它们之间正常通信,这时必须得采用 IP 隧道的功能,IP 隧道中…

1.1、Python 安装与开发环境设置指南

作为你的 Python 导师,我将带领你一步步完成 Python 的安装和开发环境的设置,让你顺利开启 Python 学习之旅。 1. Python 安装 1.1 下载 Python 安装包 首先,我们需要从 Python 官网下载 Python 的安装包。 打开你的浏览器,访…

【Redis篇】String类型命令详讲以及它的使用场景

目录 前言: 基本命令: setnx/setxx FLUSHALL mest mget 计数命令 INCR / INCRBY DECR/DECYBY INCRBYFLOAT 其他命令 APPEND GETRANGE SETRANGE STRLEN String的典型使用场景 缓存(Cache)功能 计数(…

【2024】前端学习笔记19-ref和reactive使用

学习笔记 1.ref2.reactive3.总结 1.ref ref是 Vue 3 中用来创建响应式引用的一个函数,通常用于基本数据类型(如字符串、数字、布尔值等)或对象/数组的单一值。 ref特点: ref 可以用来创建单个响应式对象对于 ref 包裹的值&…

构造函数的相关

文章目录 一、构造函数 今天我们要来讲解类的默认成员函数之一的构造函数。 一、构造函数 构造函数是特殊的成员函数,需要注意的是,构造函数虽然名称叫构造,但是构造函数的主要任务并不是开空间创建对象(我们常使用的局部对象是栈帧创建时&…

C嘎嘎探索篇:栈与队列的交响:C++中的结构艺术

C嘎嘎探索篇:栈与队列的交响:C中的结构艺术 前言: 小编在之前刚完成了C中栈和队列(stack和queue)的讲解,忘记的小伙伴可以去我上一篇文章看一眼的,今天小编将会带领大家吹奏栈和队列的交响&am…

Xcode15(iOS17.4)打包的项目在 iOS12 系统上启动崩溃

0x00 启动崩溃 崩溃日志,只有 2 行,看不出啥来。 0x01 默认配置 由于我开发时,使用的 Xcode 14.1,打包在另外一台电脑 Xcode 15.3 Xcode 14.1 Build Settings -> Asset Catalog Compliter - Options Xcode 15.3 Build S…

【Python爬虫实战】深入解析 Scrapy:从阻塞与非阻塞到高效爬取的实战指南

🌈个人主页:易辰君-CSDN博客 🔥 系列专栏:https://blog.csdn.net/2401_86688088/category_12797772.html ​ 目录 前言 一、阻塞和非阻塞 (一)阻塞 (二)非阻塞 二、Scrapy的工作…

01 [51单片机 PROTEUS仿真设计]基于温度传感器的恒温控制系统

目录 一、主要功能 二、硬件资源 三、程序编程 四、实现现象 一、主要功能 五个按键,分别为启动按键,则LCD1602显示倒计时,音乐播放 设置按键,可以设置倒计时的分秒,然后加减按键,还有最后一个暂停音乐…

途普科技企业知识中台完成华为昇思MindSpore技术认证

近日,北京途普科技有限公司(以下简称“途普科技”)作为华为昇腾大模型方向的应用软件伙伴,核心产品企业知识中台已成功与华为AI框架昇思MindSpore完成相互兼容性认证。这一成就标志着途普科技在AI领域与华为的合作进一步加深&…