企业如何正确地利用LLM大模型?

大型语言模型 (LLM) 不值得信任。就是这样。

考虑到它们先进的 AI 能力以及当今强大的基础模型的普遍知识,这似乎是一件令人惊讶的事情。然而,问题的关键在于 LLM 无法解释其输出。你不能信任 LLM 的结果,不是因为它不准确,而是因为它令人费解。没有办法审核答案或检查其工作。

这类似于接受一个人的话,却没有能力验证他们的主张;这对于关键的业务决策来说是行不通的。健康的关系建立在信任的基础上。企业与其 ML 模型的关系也不例外。那么你如何克服你的信任问题呢?

你可能听过这样一句话:“信任,但要核实”。这句古老的谚语是否预示着LLM的到来?虽然你不能完全信任大型语言模型,但这并不意味着你应该完全放弃它们。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

1、是否有可能超越 LLM 响应猜测?

LLM 在统计概率领域运行,没有确定性边界。它们生成解决方案而不引用任何预定义的数据库或“真相来源”。因此,不可能交叉检查 LLM 输出或要求他们证明他们的答案。这就像试图检查一个人的大脑内容一样——你做不到。

用于生成每个 LLM 响应的配方成分无法追踪或解构;配方本质上是一个黑匣子。但这并不是绝望的理由。

LLM 响应上下文中固有的不信任并不意味着组织应该放弃它们。 LLM 就像你听说的那样强大;你只需要正确使用它们。

如果使用得当,它们可以作为自主智能代理的组成部分,用于回答企业问题。诀窍是使用 LLM 将自然语言问题重新定义为结构化查询。当针对受管理和可审计的数据源执行这些查询时,它们会产生准确的答案——最重要的是,可证明的准确答案。

在这个场景中,用户的回答是透明且可审计的,而不是隐藏在黑匣子里。答案满足了用户的需求,但背后一切都是可追溯和可验证的。就像老师要求学生“展示你的作品”一样,答案和答案的路径都是完全可见的。

2、真实用例:人力资源数据代理

假设你是公司的人力运营经理。你无法询问 ChatGPT,“哪些员工受我们的薪资范围政策约束?”

ChatGPT 不知道如何回答这个问题;它不知道你有多少员工,你的薪资范围政策是什么,以及它应该考虑哪些其他参数。这些信息在你组织的数据存储中是分散的;其中一些是私密的,ChatGPT 无法获取。

当然,你可以努力在数据库上训练 ChatGPT;向其提供有关你的薪资范围政策以及员工名册等的信息。但是,你无法验证它的响应是否准确;它们只是最佳猜测。

现在,重新构建你的方法。使用像上面这样的自主代理架构来重新构建你的查询过程。

你问代理,“哪些员工受我们的薪资范围政策约束?”代理可以在知识图谱中查找你的策略,并了解策略的定义方式。

假设此示例为“必须每年审查工资高于其工资范围最高工资 95% 的每个员工”。它可以利用这些知识将问题重新定义为“哪些员工的工资高于其工资范围最高工资的 95%?” 这个问题可以转化为结构化查询。

代理可以运行该查询并得到答案 - 它对问题的答案包含完整而全面的上下文路径以“显示工作”并得出事实的、有数据支持的响应。你(最终用户可以)可以验证它是否查找了正确的策略、正确解释了它并运行了正确的查询。

3、克服 LLM 信任问题

自主代理方法将 AI 问答的强大功能与强大的可解释性和可审计性结合在一起。因此,公司可以依靠这些智能代理进行决策,并确保他们的 AI 驱动的见解是受规则控制且值得信赖的。

尽管 LLM 在管理大量数据和复杂查询方面具有显著优势,但必须严格管理其使用,以确保透明度、可验证性和信任度。归根结底,不仅仅是 LLM,自主代理加上知识图谱和强大的治理框架,才能成为企业可靠的 AI 解决方案。

4、最后的想法

LLM 既不是你可以完全信任的魔盒,也不是混乱的潘多拉魔盒。通过正确的方法和严格的治理,可以有效地利用它们。

通过将自然语言问题重新定义为结构化查询,我们可以确保 AI 驱动的企业解决方案的准确性、可解释性和治理。这不是要丢弃盒子,而是要学习如何明智地补充它。


原文链接:企业利用LLM的正确方法 - BimAnt

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/645369.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何解决mfc110udll丢失的问题,7个方法可解决mfc110udll丢失

mfc110u.dll是一个动态链接库文件,属于Microsoft Visual C 2012 Redistributable Package的一部分。它是Microsoft Foundation Classes (MFC) 库的一个版本,专门用于支持基于MFC开发的应用程序运行。MFC是一个用于Windows操作系统上使用C进行本机应用程序…

[书生·浦语大模型实战营]——第二节:轻松玩转书生·浦语大模型趣味 Demo

1. 部署InternLM2-Chat-1.8B 模型进行智能对话 1.1配置环境 创建开发机 Intern Studio 官网网址:https://studio.intern-ai.org.cn/ 进入官网后,选择创建开发机,填写 开发机名称 后,点击 选择镜像 使用 Cuda11.7-conda 镜像&am…

JVM堆分配中TLAB分配方案

个人博客 JVM堆分配中TLAB分配方案 | iwts’s blog Java对象的内存分配过程如何保证线程安全 对象的内存分配过程中,主要流程是将对象的引用指向一个具体的内存区域,然后进行初始化操作。 但是,因为堆是全局共享的,因此在同一…

自建公式,VBA在Excel中轻松获取反义词

自建公式,VBA在Excel中轻松获取反义词 文章目录 前言一、爬取网站数据二、代码1.创建数据发送及返回方法2.汉字转UTF8编码2.获取反义词 三、运行效果截图 前言 小学语文中,近义词、反义词是必考内容之一。家长不能随时辅导怎么办?有VBA&…

谷歌浏览器安装devtools工具

在浏览器中输入极简插件,然后打开如下的网页,在搜素框中输入vue 出现下图 点击推荐下载 (地址:https://chrome.zzzmh.cn/info/nhdogjmejiglipccpnnnanhbledajbpd) 打开谷歌浏览器如图 选择“扩展程序” 点开之后&…

Python实现xml解析并输出到Excel上

1.编写xml文件 2.使用Python的ElementTree模块来解析XML import xml.etree.ElementTree as ET from openpyxl import Workbook # 解析XML函数 def parse_xml(xml_file):tree ET.parse(xml_file)root tree.getroot() --打开根节点data []for user in root.findall(Users/Us…

微信小程序毕业设计-学生知识成果展示与交流系统项目开发实战(附源码+演示视频+LW)

大家好!我是程序猿老A,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:微信小程序毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计…

python文件处理之os模块和shutil模块

目录 1.os模块 os.path.exists(path):文件或者目录存在与否判断 os.path.isfile(path):判断是否是文件 os.path.isdir(path):判断是否是文件夹 os.remove(path):尝试删除文件 os.rmdir(path):尝试删除目录 os.m…

程序员分享好用的工具,用来用去还是觉得这几款软件最实用

大家好,我是程序员大猩猩。 作为一个程序员,除了经常要使用到的开发工具,如:Jetbrains家的IntelliJ IDEA以及它家族工具,如WebStorm、PhpStorm和GoLand都是非常好的语言开发工具。 相对于语言开发工具,我…

【LLM多模态】综述Visual Instruction Tuning towards General-Purpose Multimodal Model

note 文章目录 note论文1. 论文试图解决什么问题2. 这是否是一个新的问题3. 这篇文章要验证一个什么科学假设4. 有哪些相关研究?如何归类?谁是这一课题在领域内值得关注的研究员?5. 论文中提到的解决方案之关键是什么?6. 论文中的…

民宿bug

前端 后端 1 订单管理 订单日期已过,状态没有变成已完成

Scikit-Learn朴素贝叶斯

Scikit-Learn朴素贝叶斯 1、朴素贝叶斯1.1、贝叶斯分类1.2、贝叶斯定理1.3、贝叶斯定理的推导1.4、朴素贝叶斯及原理1.5、朴素贝叶斯的优缺点2、Scikit-Learn朴素贝叶斯2.1、Sklearn中的贝叶斯分类器2.2、Scikit-Learn朴素贝叶斯API2.3、Scikit-Learn朴素贝叶斯实践(新闻分类与…

..堆..

堆 堆是完全二叉树,即除了最后一列之外,上面的每一层都是满的(左右严格对称且每个节点都满子节点) 最后一列从左向右排序。 默认大根堆:每一个节点都大于其左右儿子,根节点就是整个数据结构的最大值 pr…

解决Vue3+TS+vite,VSCode 高亮语法错误

一般像这种提示,有可能就是TypeScript语法的识别问题, 一般我们重装一下Vue - Official插件 或者将tcconfig.json中的moduleResolution改为node模式, 基本都是TypeScript无法识别vue文件中的TypeScript语句导致的

一行代码实现UI拖拽的效果

演示 先来看效果吧! 实现方式 1.首先创建一个你想拖动的UI图片 2.创建一个C#的脚本 3.编写控制脚本(代码按我的敲就行) 付上代码片段 public void OnDrag(PointerEventData eventData){transform.position eventData.position;} 4.添加脚…

21.2zabbix低级自动发现-mysql多实例

配置mysql多实例 注释:自动发现:创建监控主机;低级自动发现:创建监控项 mysql单实例是直接yum安装,开启mysql多实例 准备配置文件 #mysql3307实例 cp /etc/my.cnf /etc/my3307.cnf vim /etc/my3307.cnf [mysqld] dat…

FPGA实现多路并行dds

目录 基本原理 verilog代码 仿真结果​ 基本原理 多路并行dds,传统DDS的局限性在于输出频率有限。根据奈奎斯特采样定理,单路DDS的输出频率应小于系统时钟频率的一半。但是在很多地方,要使采样率保持一致,所以,为了…

蓝桥杯备赛——DP【python】

一、小明的背包1 试题链接:https://www.lanqiao.cn/problems/1174/learning/ 问题描述 输入实例 5 20 1 6 2 5 3 8 5 15 3 3 输出示例 37 问题分析 这里我们要创建一个DP表,DP(i,j)表示处理到第i个物品时消耗j体…

Java8Stream

目录 什么是Stream? IO流: Java8Stream: 什么是流? stream图解 获取流 集合类,使用 Collection 接口下的 stream() 代码 数组类,使用 Arrays 中的 stream() 方法 代码 stream,使用 Stream 中的…

牛客网刷题 | BC100 直角三角形图案

目前主要分为三个专栏,后续还会添加: 专栏如下: C语言刷题解析 C语言系列文章 我的成长经历 感谢阅读! 初来乍到,如有错误请指出,感谢! 描述 KiKi学习了循环&am…