如果 2023 年都是关于 ChatGPT 和 Llama-2 等基础LLM,那么我的预测是 2024 年将是关于检索增强一代(RAG)的。
在这篇博文中,我阐述了为什么 RAG 将在 2024 年飞速发展,不仅是企业采用率,而且消费者采用率也将飙升。
言归正传,让我们开始吧。
1、什么是RAG?
这里给出了 RAG 的简单定义,感谢 IBM 的朋友们。
RAG 是一个人工智能框架,用于从外部知识库检索事实,以最准确、最新的信息为基础的大型语言模型 (LLM),并让用户深入了解 LLM 的生成过程。
最近,RAG 是一种在提供你自己的数据的同时从 ChatGPT 等 LLM 获得回复的方法。 这可能是与你的提示相关的小知识片段,也可能是来自数据库或事务的用户特定数据。
2、为什么RAG会暴涨?
至此,像ChatGPT这样的LLM的发展已经达到了极其成熟和有益的水平。 LLM似乎已经跨过了门槛,进入了后 BC(ChatGPT 之前)时代。 有些人称之为新的“生成时代”——又名:GE。
今天的公司就是明天的产品和下周的特色。 — 塞萨尔·布雷亚
这意味着LLM现在已经足够成熟,可以与特定于业务的数据(例如知识库和数据库以及由此产生的用例)相结合。
与基础LLM相比,RAG 对企业和消费者的影响要大得多。 这几乎相当于将石油转化为为汽车提供动力的天然气。
是的,石油很酷,但是为汽车提供动力的精炼油要酷得多,并且有利于运送人员。
同样,当LLM的力量与知识相结合时,企业的真正好处就开始释放出来。
这就是企业和消费者开始意识到其影响的时候。
从客户支持到员工生产力,再到人工智能增强的工作流程,LLM与知识(又名:RAG)相结合的力量将为企业(以及消费者等!)创造巨大的收入和生产力收益。
3、谁将成为赢家?
基本上,RAG 的三个类别将在 2024 年成为明显的赢家。
第一类:无代码系统
像 ChatGPT GPT 这样面向消费者和个人的无代码系统。 随着对基于 RAG 的业务用例的需求猛增,面向业务的“自定义 GPT”将成为明显的赢家。
这些无代码系统允许日常非技术人员仅通过浏览器构建复杂的生成式人工智能功能,无需任何编码。参阅这篇文章:英语是新的编程语言。
进入的摩擦和障碍几乎为零,即使是非技术人员也能够创建复杂的生成人工智能聊天机器人(参见案例研究)
第二类:RAG API
随着 OpenAI 的新 Assistants API 的发布,该 API 具有一些非常有限的内置 RAG 和其他更复杂的 RAG API(例如 CustomGPT API),企业只需很少的努力就可以使用自己的数据创建复杂的生成 AI 聊天机器人功能和工作流程, 网站内容和帐户特定数据。
这些类型的项目过去都是复杂的、耗时数月、耗资数百万美元的项目,涉及大型软件开发团队。 但现在,你可以使用 Upwork 自由职业者在不到一天的时间和不到 100 美元的时间内创建一个复杂的基于 RAG 的聊天机器人。
相信我,我雇佣了 Upwork 自由职业者,他们以 100 美元的价格在不到一天的时间内构建了复杂的工作流程。
我甚至能够以非常低的成本和快速的周转时间创建一些 Streamlit 应用程序。 随着越来越多的开发人员开始了解这些 API 的强大功能,更多基于 RAG 的系统和工作流程将开始出现。
如果说 2023 年是 OpenAI 包装应用程序的一年,那么 2024 年将是 RAG 包装应用程序的一年。
它们可能有复杂的名称,例如“自定义 GPT”或“增强 GPT”,或者某些思想领袖或记者甚至可能想出一个更好的名称。
第 三类:工作流程
到 2023 年底,我看到 Salesforce 和 Zoho 等云平台都将基于 API 的工作流程整合到他们的系统中。
通过这些工作流程,利用帐户级数据并拥有基于 RAG 的工作流程变得更加容易。
这可以像捕获 HTML 表单输入并根据该输入生成 PDF 文档一样简单。
想象一下动态生成旅行行程或发票 PDF,这将需要某种生成式 AI 组件。
但 PDF 生成只是其中之一。 想象一下任何类型的工作流程,其中基本数据流现在正在通过生成人工智能内容进行增强。
2023 年,人们对大型语言模型 (LLM) 的热情是巨大的,但最终用户的实际应用和收益预计将在 2024 年呈指数级增长。
4、结束语
请记住:Main Street 上的 Joe Blow 不太关心 ChatGPT 或 LLM,但当这些基于 RAG 的应用程序在 2024 年开始接触到他时,这一切就变成了现实。
再次使用我的石油比喻,没有人关心石油。 他们关心的是他们的车从 A 点移动到 B 点。
那就是事情开始变得令人兴奋的时候。