2024:RAG年

如果 2023 年都是关于 ChatGPT 和 Llama-2 等基础LLM,那么我的预测是 2024 年将是关于检索增强一代(RAG)的。

在这篇博文中,我阐述了为什么 RAG 将在 2024 年飞速发展,不仅是企业采用率,而且消费者采用率也将飙升。

言归正传,让我们开始吧。

1、什么是RAG?

这里给出了 RAG 的简单定义,感谢 IBM 的朋友们。

RAG 是一个人工智能框架,用于从外部知识库检索事实,以最准确、最新的信息为基础的大型语言模型 (LLM),并让用户深入了解 LLM 的生成过程。

最近,RAG 是一种在提供你自己的数据的同时从 ChatGPT 等 LLM 获得回复的方法。 这可能是与你的提示相关的小知识片段,也可能是来自数据库或事务的用户特定数据。

2、为什么RAG会暴涨?

至此,像ChatGPT这样的LLM的发展已经达到了极其成熟和有益的水平。 LLM似乎已经跨过了门槛,进入了后 BC(ChatGPT 之前)时代。 有些人称之为新的“生成时代”——又名:GE。

今天的公司就是明天的产品和下周的特色。 — 塞萨尔·布雷亚

这意味着LLM现在已经足够成熟,可以与特定于业务的数据(例如知识库和数据库以及由此产生的用例)相结合。

与基础LLM相比,RAG 对企业和消费者的影响要大得多。 这几乎相当于将石油转化为为汽车提供动力的天然气。

是的,石油很酷,但是为汽车提供动力的精炼油要酷得多,并且有利于运送人员。

同样,当LLM的力量与知识相结合时,企业的真正好处就开始释放出来。

这就是企业和消费者开始意识到其影响的时候。

从客户支持到员工生产力,再到人工智能增强的工作流程,LLM与知识(又名:RAG)相结合的力量将为企业(以及消费者等!)创造巨大的收入和生产力收益。

3、谁将成为赢家?

基本上,RAG 的三个类别将在 2024 年成为明显的赢家。

第一类:无代码系统

像 ChatGPT GPT 这样面向消费者和个人的无代码系统。 随着对基于 RAG 的业务用例的需求猛增,面向业务的“自定义 GPT”将成为明显的赢家。

这些无代码系统允许日常非技术人员仅通过浏览器构建复杂的生成式人工智能功能,无需任何编码。参阅这篇文章:英语是新的编程语言。

进入的摩擦和障碍几乎为零,即使是非技术人员也能够创建复杂的生成人工智能聊天机器人(参见案例研究)

第二类:RAG API

随着 OpenAI 的新 Assistants API 的发布,该 API 具有一些非常有限的内置 RAG 和其他更复杂的 RAG API(例如 CustomGPT API),企业只需很少的努力就可以使用自己的数据创建复杂的生成 AI 聊天机器人功能和工作流程, 网站内容和帐户特定数据。

这些类型的项目过去都是复杂的、耗时数月、耗资数百万美元的项目,涉及大型软件开发团队。 但现在,你可以使用 Upwork 自由职业者在不到一天的时间和不到 100 美元的时间内创建一个复杂的基于 RAG 的聊天机器人。

相信我,我雇佣了 Upwork 自由职业者,他们以 100 美元的价格在不到一天的时间内构建了复杂的工作流程。

我甚至能够以非常低的成本和快速的周转时间创建一些 Streamlit 应用程序。 随着越来越多的开发人员开始了解这些 API 的强大功能,更多基于 RAG 的系统和工作流程将开始出现。

如果说 2023 年是 OpenAI 包装应用程序的一年,那么 2024 年将是 RAG 包装应用程序的一年。

它们可能有复杂的名称,例如“自定义 GPT”或“增强 GPT”,或者某些思想领袖或记者甚至可能想出一个更好的名称。

第 三类:工作流程

到 2023 年底,我看到 Salesforce 和 Zoho 等云平台都将基于 API 的工作流程整合到他们的系统中。

通过这些工作流程,利用帐户级数据并拥有基于 RAG 的工作流程变得更加容易。

这可以像捕获 HTML 表单输入并根据该输入生成 PDF 文档一样简单。

想象一下动态生成旅行行程或发票 PDF,这将需要某种生成式 AI 组件。

但 PDF 生成只是其中之一。 想象一下任何类型的工作流程,其中基本数据流现在正在通过生成人工智能内容进行增强。

2023 年,人们对大型语言模型 (LLM) 的热情是巨大的,但最终用户的实际应用和收益预计将在 2024 年呈指数级增长。

4、结束语

请记住:Main Street 上的 Joe Blow 不太关心 ChatGPT 或 LLM,但当这些基于 RAG 的应用程序在 2024 年开始接触到他时,这一切就变成了现实。

再次使用我的石油比喻,没有人关心石油。 他们关心的是他们的车从 A 点移动到 B 点。

那就是事情开始变得令人兴奋的时候。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/479174.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

BigDecimal类的使用,用于精确计算任意精度的数字

BigDecimal类 BigDecimal 是 Java 中用于精确表示任意精度的十进制数的类。在很多情况下,使用基本数据类型(如 double 或 float)进行浮点数计算可能会导致精度丢失或舍入错误。BigDecimal 提供了一种更精确的解决方案,可以处理需要高精度计算的场景,比如财务应用或科学计算…

记录解决问题--activiti8.2 流程图图片由png改为svg前端不显示图片问题

1.说明 如果是vue svg显示,请查阅其他标准资料,类似使用svg标签。我这里讲的另外一种情况,链接返回的是svg文件,需要用v-html显示图片。 2.activiti6流程图图片格式 ①png格式。可以查看链接返回,以png开头。 ②前端…

蓝桥杯练习——神秘咒语——axios

目标 完善 index.js 中的 TODO 部分,通过新增或者修改代码,完成以下目标: 点击钥匙 1 和钥匙 2 按钮时会通过 axios 发送请求,在发送请求时需要在请求头中添加 Authorization 字段携带 token,token 的值为 2b58f9a8-…

适合新生儿的奶瓶有哪些?五款高分新生儿奶瓶分享!

每一个有新生儿的家庭都一定会挑选奶瓶,但是因为市面有太多品牌和款式,让大家难以挑选,更为重要的是还有可能会不小心选到劣质的产品,不仅奶嘴的仿真度差、易胀气,还可能高温消毒后散发有害物质!那么新生儿…

力扣 字符串解码

维护一个放数字的栈&#xff0c;一个放字母的栈 遇到[把数字和字母入栈&#xff0c;遇到]把当前字母循环加上数字栈头遍的字母栈头 class Solution { public:string decodeString(string s) {string ans"";stack<int>sz;stack<string>zm;里面是string …

2024 年 AI 辅助研发趋势将更加强调智能化、自动化和个性化

目录 前言 AI辅助研发的技术进展 行业应用案例 医药行业 汽车行业 电子行业 面临的挑战与机遇 技术挑战 伦理问题 数据安全 机遇和解决方案 未来趋势预测 1. 深度融合AI与研发流程 2. 智能研发平台的崛起 3. 强化AI与人类智慧的融合 前言 当谈到人工智能&#xff…

论文笔记:Llama 2: Open Foundation and Fine-Tuned Chat Models

导语 Llama 2 是之前广受欢迎的开源大型语言模型 LLaMA 的新版本&#xff0c;该模型已公开发布&#xff0c;可用于研究和商业用途。本文记录了阅读该论文的一些关键笔记。 链接&#xff1a;https://arxiv.org/abs/2307.09288 1 引言 大型语言模型&#xff08;LLMs&#xff…

Linux:http协议初步认识

文章目录 OSI七层模型http协议域名路径信息请求和响应 编写一个httpserver OSI七层模型 在结束了前面对于序列化反序列化等内容的学习后&#xff0c;重新回到对于OSI模型的部分 如上所示的是对于OSI接口的示意图&#xff0c;在这当中可以看到会话层的概念&#xff0c;会话层的…

CMake学习(下)

1. 嵌套的CMake 如果项目很大&#xff0c;或者项目中有很多的源码目录&#xff0c;在通过CMake管理项目的时候如果只使用一个CMakeLists.txt&#xff0c;那么这个文件相对会比较复杂&#xff0c;有一种化繁为简的方式就是给每个源码目录都添加一个CMakeLists.txt文件&#xff…

携程旅行web逆向

声明: 本文章中所有内容仅供学习交流使用&#xff0c;不用于其他任何目的&#xff0c;抓包内容、敏感网址、数据接口等均已做脱敏处理&#xff0c;严禁用于商业用途和非法用途&#xff0c;否则由此产生的一切后果均与作者无关&#xff01;wx a15018601872 本文章…

C语言:volatile关键字讲解

读音&#xff1a;vaoletail C语言中的volatile关键字是一个重要的类型修饰符&#xff0c;它用于声明一个变量具有“易变性”&#xff0c;即可能在编译器无法察觉的情况下被改变其值。Volatile意思是“易变的”&#xff0c;应该解释为“直接存取原始内存地址”比较合适。 “易变…

【高质快刊】中科院1区TOP,最新案例仅2个月14天录用!进展超顺,即将截稿!

&#xff08;一&#xff09;期刊简介概况 【期刊类型】能源工程类SCIE&EI 【出版社】ELSEVIER出版社 【期刊概况】IF&#xff1a;11.0-12.0&#xff0c;JCR1区&#xff0c;中科院1区TOP 【预警情况】2020-2024年无预警记录 【收录年份】1977年被WOS数据库收录 【年发…

【python绘图colorbar对齐】

[Toc]# 1、问题描述 python在绘图过程中&#xff0c;可能会出现colorbar高度与主图不匹配情况&#xff0c;需要进行调整&#xff0c;使得与主图高度对齐&#xff0c;使图像更美观。示例&#xff1a;colorbar位置高于主图 2、解决方法 通过调整shrink参数匹配对齐,pad调整x轴…

【CPP】C++11多线程

thread类 在C11之前&#xff0c;涉及到多线程问题&#xff0c;都是和平台相关的&#xff0c;比如windows和linux下各有自己的接口&#xff0c;这使得代码的可移植性比较差。C11中最重要的特性就是对线程进行支持了&#xff0c;使得C在并行编程时不需要依赖第三方库&#xff0c…

ARM中断实验

key_inc.c #include"key_inc.h"void key1_it_config(){//使能GPIOF外设时钟RCC->MP_AHB4ENSETR | (0x1<<5);//将PF9设置为输入模式GPIOF->MODER & (~(0x3<<18));//设置由PF9管脚产生EXTI9事件EXTI->EXTICR3 & (~(0XFF<<8));EXTI-…

Linux-线程同步

文章目录 前言一、为什么要线程同步&#xff1f;二、线程同步pthread_cond_initpthread_cond_destroypthread_cond_wait、pthread_cond_signal和 pthread_cond_broadcast 三、示例代码 前言 上节课学习了线程互斥&#xff0c;这节课针对线程互斥内容在做进一步的补充和完善&am…

鸿蒙Harmony应用开发—ArkTS(@State装饰器:组件内状态)

State装饰的变量&#xff0c;或称为状态变量&#xff0c;一旦变量拥有了状态属性&#xff0c;就和自定义组件的渲染绑定起来。当状态改变时&#xff0c;UI会发生对应的渲染改变。 在状态变量相关装饰器中&#xff0c;State是最基础的&#xff0c;使变量拥有状态属性的装饰器&a…

Elasticsearch:让你的 Elasticsearch 索引与 Python 和 Google Cloud Platform 功能保持同步

作者&#xff1a;来自 Elastic Garson Elasticsearch 内的索引 (index) 是你可以将数据存储在文档中的位置。 在使用索引时&#xff0c;如果你使用的是动态数据集&#xff0c;数据可能会很快变旧。 为了避免此问题&#xff0c;你可以创建一个 Python 脚本来更新索引&#xff0…

VMWare虚拟机使用openmediavault搭建NAS服务器完整步聚

下载: gopenmediavault - The open network attached storage solution 下载好openmediavault的ISO镜像后,打开虚拟机并安装 系统类型选择Debian 启动虚拟机并安装openmediavault 选择中文 地区选中国 键盘配置选汉语 开始安装 配置网络信息 配置root密码 确认密码 系统安装中…

LeetCode # 199. 二叉树的右视图

199. 二叉树的右视图 题目 给定一个二叉树的 根节点 root&#xff0c;想象自己站在它的右侧&#xff0c;按照从顶部到底部的顺序&#xff0c;返回从右侧所能看到的节点值。 示例 1: 输入: [1,2,3,null,5,null,4] 输出: [1,3,4] 示例 2: 输入: [1,null,3] 输出: [1,3] 示例 3…