生成式人工智能重置:从初期热潮到战略扩展

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

“是时候对生成式人工智能(生成 AI)进行重置了。随着企业意识到捕捉生成 AI 的巨大潜在价值比预期更困难,2023 年的最初热情和一阵忙碌的活动正在让位于重新思考和重新校准。

2024 年即将成为生成 AI 证明其价值的一年,企业应牢记在数字和 AI 转型中学到的艰难教训:竞争优势来自于建立组织和技术能力,以广泛创新、部署和改进大规模解决方案——实际上,是为了分布式的数字和 AI 创新重新构建业务。

让我们简要看看这对一家太平洋地区的电信公司意味着什么。该公司聘请了一位首席数据和 AI 官,任务是“使组织能够通过数据和 AI 创造价值。”首席数据和 AI 官与业务部门合作,制定了战略愿景并实施了用例的路线图。经过对企业内部领域(即客户旅程或功能)和用例机会的扫描,领导层优先选择了家庭服务/维护领域作为试点,并作为更大一系列举措的一部分进行扩展。他们特别针对开发生成 AI 工具,以帮助调度员和服务操作员更好地预测服务家庭时所需的呼叫类型和零件。

领导层设立了具有共享目标和激励措施的跨职能产品团队来构建生成 AI 工具。作为提升整个企业更好地使用数据和生成 AI 工具技能的一部分,他们还设立了一个数据和 AI 学院,调度员和服务操作员作为培训的一部分报名参加。为了为生成 AI 提供技术和数据基础设施,首席数据和 AI 官还选择了一个大型语言模型(LLM)和能够满足该领域需求并服务于企业其他部分的云提供商。首席数据和 AI 官还监督了数据架构的实施,以便快速且负责任地提供构建生成 AI 工具所需的干净可靠的数据(包括服务历史和库存数据库)。打破生成 AI 机会的关键是公司需要以下列方式重新构建工作方式。

找出生成 AI 助理可以为您提供真正竞争优势的地方


围绕生成 AI 的广泛兴奋及其相对易用性导致了组织内一阵实验热潮。然而,这些举措中的大多数不会产生竞争优势。例如,一家银行购买了数万份 GitHub Copilot 许可证,但由于对如何使用该技术没有清晰的认识,进展缓慢。我们经常看到的另一个无重点的努力是公司试图将生成 AI 纳入其客户服务能力。对于大多数公司而言,客户服务是一种商品能力,而不是核心业务的一部分。尽管生成 AI 可能在此类情况下有助于提高生产力,但它不会创造竞争优势。

要创造竞争优势,公司应首先理解成为“接受者”(使用可用工具,通常通过 API 和订阅服务)、“塑造者”(将可用模型与专有数据集成)和“制造者”(构建 LLM)的区别。目前,对于大多数公司而言,制造者方法成本太高,因此企业的最佳选择是在提高生产力的同时实施接受者模式,并构建塑造者应用以获得竞争优势。

生成 AI 近期价值的很大一部分与其帮助人们更好地完成当前工作的能力密切相关。通过这种方式,生成 AI 工具充当助理,与员工并肩工作,例如创建一个开发人员可以调整的初始代码块,或者起草一个新零件的采购申请单,供现场维护人员审核和提交。这意味着公司应专注于助理技术在其优先计划中可以产生最大影响的地方。

一些工业公司,例如,已经确定维护是其业务的关键领域。审查维护报告并与一线工人共度时光可以帮助确定生成 AI 助理在哪些方面可以产生重大影响,例如快速及早识别设备故障问题。生成 AI 助理还可以更快地识别卡车故障的根本原因并推荐解决方案,并作为最佳实践或标准操作程序的持续来源。

挑战在于如何通过提高生产力来创造收入。例如,在客户服务中心,公司可以停止招聘新代理,并通过自然流失实现潜在的实际财务收益。因此,定义如何通过提高生产力来创造收入的计划对于捕捉价值至关重要。

提高现有人才的技能,但要明确生成 AI 特定技能的需求


目前,大多数公司对所需的技术生成 AI 技能有一个大致的了解,例如模型微调、向量数据库管理、提示工程和上下文工程。在许多情况下,这些是可以通过培训现有员工来发展的技能。那些具备现有 AI 和机器学习(ML)能力的公司有很大的优势。例如,数据工程师可以学习多模态处理和向量数据库管理,ML 操作(MLops)工程师可以扩展其技能到 LLMops(LLM 操作),数据科学家可以发展提示工程、偏见检测和微调技能。

学习过程需要两到三个月才能达到一个相当的熟练水平,因为学习不同 LLM 能做什么和不能做什么以及如何最好地使用它们的复杂性。编码人员需要获得构建软件、测试和验证答案的经验。例如,一家金融服务公司花了三个月时间培训其最好的数据科学家达到高水平的熟练度。尽管课程和文档是可用的——许多 LLM 提供商为开发人员提供训练营——我们发现,通过学徒制、大规模培训人员以便培训他人以及建立从业者社区是最有效的能力建设方式。通过在团队之间轮换专家进行培训,定期安排会议分享学习成果,并举办每两周一次的文档审查会议,这些做法在建立从业者社区方面取得了成功。

成功的生成 AI 技能不仅仅是编码熟练度。我们在开发自己生成 AI 平台 Lilli 的过程中发现,最好的生成 AI 技术人才具备设计技能,能够发现需要解决的问题,具备上下文理解能力,确保生成最相关和高质量的答案,具备与知识专家合作的能力(测试和验证答案并制定适当的策划方法),具备强大的取证技能,能够找出故障原因(问题是数据、用户意图的解释、元数据的质量还是其他原因),具备预见能力,能够构思和规划可能的结果并将正确类型的跟踪纳入代码。纯粹的编码人员如果没有这些技能,可能不会是团队中有用的成员。

尽管目前的技能提升主要基于“在职学习”方法,但我们看到市场迅速出现了过去一年学到这些技能的人。技能增长迅速。GitHub 报告称,开发人员正在“大量”参与生成 AI 项目,2023 年在其平台上创建了 65,000 个公共生成 AI 项目,比前一年增长了近 250%。如果您的公司刚刚开始生成 AI 之旅,您可以考虑雇佣两到三名为其公司构建生成 AI 塑造产品的高级工程师。这可以大大加快您的进展。

组建集中团队以建立标准,实现责任扩展


为了确保业务的各个部分都能扩展生成 AI 能力,集中技能是一个自然的第一步。该集中团队的关键重点将是制定并实施支持扩展的协议和标准,确保团队能够访问模型,同时将风险降至最低并控制成本。团队的工作可以包括,例如,采购模型并规定访问方式,制定数据准备标准,建立已批准的提示库,分配资源。

对于开发生成 AI 解决方案的团队,其团队组成将类似于 AI 团队,但会有具有生成 AI 经验的数据工程师和数据科学家,并且风险管理、合规和法律职能的贡献者更多。通常的做法是从不同专业领域分配资源到小组,这种理念不会改变,但生成 AI 密集型小组的技能组成会有所不同。

设置技术架构以扩展


构建生成 AI 模型通常相对简单,但要使其在大规模上全面运行则完全不同。我们见过工程师在一周内构建一个基本的聊天机器人,但发布一个稳定、准确且合规的版本以扩展可能需要四个月时间。这就是为什么我们的经验表明,实际的模型成本可能不到解决方案总成本的 10% 到 15%。

构建扩展不意味着构建新技术架构。但这确实意味着关注一些核心决策,以简化和加快流程,而不会造成巨大开支。以下三项决策尤为重要:

关注重用技术。重用代码可以使生成 AI 用例的开发速度提高 30% 到 50%。一个好的方法是简单地创建一个已批准工具、代码和组件的来源。例如,一家金融服务公司创建了一个生产级工具库,经过安全和法律团队的批准,并在库中提供给团队使用。更重要的是花时间识别和构建在最优先用例中常见的能力。例如,同一家金融服务公司确定了三个组件,可以重用于 100 多个已识别的用例。通过首先构建这些组件,他们能够为所有已识别的用例生成大量代码库——实际上给每个应用程序一个很大的起步。

将架构重点放在使生成 AI 模型与内部系统之间的高效连接上。为了使生成 AI 模型在塑造者原型中有效工作,它们需要访问企业的数据和应用程序。集成和编排框架的进步显著减少了进行这些连接所需的工作量。但关键是要明确这些集成是什么以及如何实现它们,以确保这些模型高效工作,避免复杂性造成的技术债务(公司在解决现有技术问题时支付的时间和资源“税”)。首席信息官和首席技术官可以为其组织定义参考架构和集成标准。关键要素应包括一个模型中心,包含经过训练和批准的模型,可以按需提供;标准 API,充当连接生成 AI 模型与应用程序或数据的桥梁;以及上下文管理和缓存,通过提供来自企业数据源的相关信息加速处理。

建立测试和质量保证能力。我们在构建 Lilli 的过程中,优先考虑了测试而不是开发。我们的团队不仅开发了每个开发阶段的测试协议,还协调了整个团队,例如,明确谁具体需要对每个阶段的过程进行签字。这虽然减慢了最初的开发速度,但通过减少错误和修复错误所需的时间,加快了整体交付速度和质量。

确保数据质量并关注非结构化数据以支持模型


企业能否从生成 AI 模型中生成和扩展价值将取决于其利用自身数据的能力。与技术一样,现有数据架构的针对性升级是为了最大化生成 AI 的未来战略收益:

针对性地提高数据质量和数据增强工作。虽然数据质量一直是一个重要问题,但生成 AI 模型可以使用的数据的规模和范围——特别是非结构化数据——使这个问题变得更加重要。因此,关键是要正确处理数据基础,从明确决策权到定义明确的数据流程,再到建立模型可以访问的数据分类。做得好的公司将其数据质量和增强工作与特定的 AI/生成 AI 应用和用例联系起来——您不需要将这种数据基础扩展到企业的每个角落。这可能意味着,例如,开发一个新的数据存储库,包含所有设备规格和报告的问题,以更好地支持维护助理应用。

了解非结构化数据中锁定的价值。大多数组织传统上专注于结构化数据(可以组织成表格的值,例如价格和特性)。但 LLM 的真正价值来自其处理非结构化数据的能力(例如,PowerPoint 幻灯片、视频和文本)。公司可以绘制哪些非结构化数据源最有价值,并建立元数据标记标准,以便模型可以处理数据,团队可以找到所需的内容(标记尤其重要,有助于公司在必要时从模型中删除数据)。在考虑数据机会时要有创造性。一些公司,例如,在高级员工退休时采访他们,并将捕获的机构知识输入 LLM,以帮助改善其助理性能。

优化以降低大规模成本。企业在数据上的花费与他们优化数据基础设施和基础成本后的花费之间往往有十倍的差距。这一问题通常源于公司在未优化数据方法的情况下扩展概念验证。通常有两项成本突出。一是存储成本,公司将数 TB 的数据上传到云端并希望这些数据 24/7 可用。实际上,公司通常只需要 10% 的数据具有这种可用性水平,而在 24 或 48 小时内访问其余数据是更便宜的选择。另一个成本与需要调用数千个处理器运行的模型计算相关。这尤其适用于公司构建自己的模型(制造者原型),但也适用于使用预训练模型并使用自己的数据和用例运行它们(塑造者原型)。公司可以仔细研究如何在云平台上优化计算成本——例如,将一些模型排队在处理器未使用时运行(例如,当美国人睡觉,Netflix 等计算服务消费减少时)是一种更便宜的选择。

建立信任和可重用性以驱动采用和扩展


由于许多人对生成 AI 有担忧,解释这些工具如何工作比大多数解决方案的要求更高。使用这些工具的人想知道它们如何工作,而不仅仅是它们做什么。因此,投资额外的时间和金钱以通过确保模型准确性和简化检查答案来建立信任非常重要。

例如,一家保险公司创建了一个生成 AI 工具来帮助管理索赔。作为该工具的一部分,它列出了所有已实施的保护措施,并为每个答案提供了指向相关政策文件句子或页面的链接。该公司还使用 LLM 生成了许多相同问题的不同变体,以确保答案的一致性。这些步骤在帮助最终用户建立对工具的信任方面至关重要。

培训使用生成 AI 工具的维护团队的一部分应该是帮助他们了解模型的局限性以及如何最好地获得正确答案。这包括教导工人以更广泛的问题开始然后逐步缩小范围以快速获得最佳答案。这为模型提供了更多的上下文,也有助于消除可能自认为已经知道答案的人的偏见。让模型界面看起来和感觉与现有工具相同也有助于用户在引入新应用程序时不感到压力。

要实现扩展,企业需要停止构建难以用于其他类似用例的单一解决方案。例如,一家全球能源和材料公司将可重用性作为所有生成 AI 模型的关键要求,并在早期迭代中发现其组件的 50% 到 60% 可以重用。这意味着要为开发生成 AI 资产(例如提示和上下文)设置标准,以便其他用例可以轻松重用。

尽管许多与生成 AI 相关的风险问题是已经在讨论中的进化——例如数据隐私、安全、偏见风险、工作替代和知识产权保护——生成 AI 极大地扩展了风险范围。报告 AI 采用的公司中只有 21% 表示他们已经制定了管理员工使用生成 AI 技术的政策。

同样,应该建立一套测试 AI/生成 AI 解决方案的测试,以证明数据隐私、消除偏见和知识产权保护得到了尊重。一些组织实际上建议发布附带性能特征文档的模型。记录您的决策和理由在与监管机构的对话中特别有帮助。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/697666.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

cs61C | lecture4

cs61C | lecture4 C 语言内存布局 ### Stack 在最顶部,向下增长。包含局部变量和 function frame information。 > Each stack frame is a contiguous block of memory holding the local variables of a single procedure. > A stack frame includes: > …

C语言详解(文件操作)2

Hi~!这里是奋斗的小羊,很荣幸您能阅读我的文章,诚请评论指点,欢迎欢迎 ~~ 💥💥个人主页:奋斗的小羊 💥💥所属专栏:C语言 🚀本系列文章为个人学习…

浅析嵌入式实时系统中信号量的概念

目录 概述 1. 认识信号量 1.1 定义信号量 1.2 信号量的类型 1.2.1 二值信号量 1.2.2 计数信号量 1.2.3 互斥信号量 1.2.3.1 认识互斥信号量 1.2.3.2 互斥信号量的其他特性 2 典型信号量的使用 2.1 等待和信号同步 2.2 多任务等待和信号同步 2.3 信用跟踪同步 2.…

C++ - Clion安装Qt msvc2017版本教程,基础环境配置clion+ Qt5.12.12 msvc2017 + VS2019

背景:平时代码开发使用clion,但使用项目要制定mscv2017版本Qt。先装过mingw版本Qt无法运行,但msvc版本依赖装有Visual Studio,本地装的又是2019版。就出现了这个大坑,需要配置好clion Qt msvc2017 VS2019。 文章目录 …

深度学习中embedding层的理解

Embedding层作用 在深度学习领域中,Embedding层扮演着至关重要的角色,尤其在处理文本数据或类别数据。Embedding层的功能有两个: 1. 将高维稀疏的输入数据(如单词、类别标签等)转换为低维稠密的向量表示,…

LNMP配置

文章目录 一、相关概念CGI的由来FastCGIPHP-FPM 二、编译安装编译安装nginxyum安装mysql编译安装php配置nginx支持php解析增加数据库安装论坛 一、相关概念 CGI的由来 最早的Web服务器只能简单地响应浏览器发来的HTTP请求,并将存储在服务器上的HTML文件返回给浏览器…

Python | Leetcode Python题解之第144题二叉树的前序遍历

题目: 题解: class Solution:def preorderTraversal(self, root: TreeNode) -> List[int]:res list()if not root:return resp1 rootwhile p1:p2 p1.leftif p2:while p2.right and p2.right ! p1:p2 p2.rightif not p2.right:res.append(p1.val)…

DeepSpeed MoE

MoE概念 模型参数增加很多;计算量没有增加(gating小FNN,比以前的大FNN计算量要小);收敛速度变快; 效果:PR-MoE > 普通MoE > DenseTransformer MoE模型,可视为Sparse Model&…

手机投屏到电脑时,手机提示连接失败

前言 注意,本方法建立在你已经通过其他帖子等解决了前置条件的情况下,手机提示连接失败情况下,包括但不限于关闭防火墙、安装无线投屏工具、手机和电脑连接在同一个WiFi频段下、关闭杀毒软件等。 具体操作方法 1、请进入设置 > 系统和…

电脑存储设备,固态硬盘介绍,usb接口

简介 存储设备分为两大类主存和辅存,另外还有专门提供存储服务的网络存储 主存储器 随机存取存储器(RAM, Random Access Memory) 特点:高速、易失性存储器,断电后数据丢失。用途:临时存储正在使用的数据…

卷积神经网络 convolution neural network

1.数学卷积:滑动窗口 2.图像具有局部相关性和平移不变性,有许多冗余的特征点,如果用全连接的神经网络会很浪费时间。 3.卷积nn:减少参数,滑动提取特征,特征作为下层卷积的输入,然后放到全连接…

Androidstudio项目加载不出来,显示Connect timed out

Android studio加载不出来所需要的环境依赖,99%的问题都是网络原因 解决办法有两个: 1.科学上网 2.使用国内的镜像 方法一自行解决,下面重点介绍方法二 在项目目录下找到gradle->wrapper->gradle-wrapper.properties 将项目的distributionUrl改为https://mirrors.cl…

设计模式-装饰器模式(结构型)

装饰器模式 装饰器模式是一种结构模式,通过装饰器模式可以在不改变原有类结构的情况下向一个新对象添加新功能,是现有类的包装。 图解 角色 抽象组件:定义组件的抽象方法具体组件:实现组件的抽象方法抽象装饰器:实现…

Unity 笔试题分享

1. 请回答以下代码片段执行时是否会产生堆内存分配 a. void SetChar(string s){s.Replace(b, d);}b. void Update(Transform t){t.localPosition new Vector3(0, 0, 0);}c、 int Sum(List<int> l){int total 0;foreach (int i in l){total i;} return total;}d…

C++ | Leetcode C++题解之第144题二叉树的前序遍历

题目&#xff1a; 题解&#xff1a; class Solution { public:vector<int> preorderTraversal(TreeNode *root) {vector<int> res;if (root nullptr) {return res;}TreeNode *p1 root, *p2 nullptr;while (p1 ! nullptr) {p2 p1->left;if (p2 ! nullptr) {…

python教程

python解释器的安装 https://www.python.org/ftp/python/3.12.4/python-3.12.4-amd64.exe jetbrains官网 英文 PyCharm 专业的版本 Thank you for downloading PyCharm! 社区 Thank you for downloading PyCharm! 中文 PyCharm 专业的版本 感谢您下载PyCharm&#xff01…

群体优化算法---水波优化算法介绍以及应用于聚类数据挖掘代码示例

介绍 水波优化算法&#xff08;Water Wave Optimization, WWO&#xff09;是一种新兴的群智能优化算法&#xff0c;灵感来自水波在自然环境中的传播和衰减现象。该算法模拟了水波在水面上传播和碰撞的行为&#xff0c;通过这些行为来寻找问题的最优解。WWO算法由三种主要的操作…

【JavaEE】Spring Boot MyBatis详解(一)

一.MyBatis的基本概念与相关配置. 1.基本概念 MyBatis是一款优秀的持久层框架&#xff0c;用于简化JDBC的开发。MyBatis本是Apache的一个开源项目iBatis&#xff0c;2010年这个项目由apache迁移到了google code&#xff0c;并且改名为MyBatis. 2013年11月迁移到Github.持久层…

区间预测 | Matlab实现GRU-ABKDE门控循环单元自适应带宽核密度估计多变量回归区间预测

区间预测 | Matlab实现GRU-ABKDE门控循环单元自适应带宽核密度估计多变量回归区间预测 目录 区间预测 | Matlab实现GRU-ABKDE门控循环单元自适应带宽核密度估计多变量回归区间预测效果一览基本介绍程序设计参考资料 效果一览 基本介绍 1.Matlab实现GRU-ABKDE门控循环单元自适应…

[Vue3:组件通信)子组件props接收和watch监听,emit发送父组件 (添加修改设置成绩,添加、删除选课记录)

文章目录 一&#xff1a;系统功能&#xff1a;设置成绩&#xff08;添加或修改&#xff09;交互逻辑&#xff1a;涉及页面 Page02.vue&#xff0c;ModalEdit.vue主页面Page.vue注入子页面&#xff0c;使用子页面标签属性主页面对子页面做通信&#xff0c;子页面ModalEdit接收参…