华为大咖说 | 企业应用AI大模型的“道、法、术” —

本文作者：郑岩（华为云AI变革首席专家）全文约3554字，阅读约需9分钟

上周，我们探讨了企业应用AI大模型的“道、法、术”——法：落地篇“AI变革五阶八步法”的前四步内容（华为大咖说 | 企业应用AI大模型的“道、法、术” -- 法：落地篇（上））。今天，我们将继续深入解析“五阶八步法”剩余的要点。

第4阶数据

⑤ 知识数据治理

这里的知识数据治理，完全是for AI的，大致可以分成两个部分，“垂域知识”和“标注数据”。类比一下，垂域知识相当于是课本，标注数据就是考卷。

1、垂域知识治理

为了让AI大模型能“懂行”，我们需要把我们的垂域知识整理出来，“喂给”AI大模型，不管是通过训练的方式，还是通过ICL的方式。（ICL，In-context Learning，是一种让大型语言模型（LLMs）通过少量标注样本在特定任务上进行学习的方法。）

大家都说，AI大模型需要大量的数据来训练，这里有个歧义，此“数据”非彼“数据”。AI大模型能消费的，就是语义化的数据，也就是非结构化数据，或者某种意义上的“知识”。而传统意义上的结构化数据，不能绝对地说对AI大模型啥用也没有，但是利用起来成本和效率确实非常低，需要很多额外的处理和还原，但原始的信息损失是不能弥补的。

在华为传统IT应用设计和构建中，会遵循4A集成原则，数据部分由IA（信息架构）负责。而在构建AI应用时，虽然也会涉及4A集成，但数据部分仅靠IA是远远不够的，还要加入KMer（知识经理）的力量，甚至KMer的作用相比IA更为关键，他们负责确保AI模型基于高质量、精准的数据进行训练和优化。（*4A集成原则是指在企业架构设计中，围绕业务架构（Business Architecture, BA）、信息架构（Information Architecture, IA）、应用架构（Application Architecture, AA）、技术架构（Technology Architecture, TA）四个关键方面进行集成架构的设计，以支持企业的数字化转型。）

如此一来，我们要做成一个AI大模型的应用，具体治理的方法，大致步骤如下：

梳理知识资产清单
建立KOS体系（KOS，Knowledge Organization Systems，知识组织体系）
划分知识责任田
建立知识运营机制
知识入湖、索引、切片、向量化

2、标注数据治理

反馈数据，也是AI大模型改进的关键。对于标注数据的管理，目前是没有标准方法的。

这里简单分享一下我们的做法：

1、需要有一个标注平台，来辅助AI训练师来标注，标注平台要尽可能详尽的把整个AIGC的过程体现出来，包括上下文、使用的知识片、意图理解情况、提示词等等；

2、需要对原始的标注数据进行清洗，包括错误的标注、低质量的标注，都会干扰我们非常有限的AI训练师资源。这里引入AI大模型来评估内容质量，是一种不错的方法；

3、需要对标注结果进行质量评估，千万不要高估人的“一致性”，哪怕是有流程、规范、指导书，都很难让不同的人对相同的答案做出一致的判断，而且我们也没有这么多资源来交叉评分。这里有几个小经验，一个是用AI大模型对人肉书写的反馈做标准化，另一个是尽可能让人做选择题，而不是评分。

第5阶IT

⑥ 模型训练

模型训练，其实是之前传统IT应用建设里比较少涉及的。一般哪怕是引入了AI（小模型），也都是交给专业的AI团队来完成。

但是这波AI大模型的革命，就是标准化掉了一个东西，叫Foundation Model，也就是基模型。我们所做的训练，其实就是在基模型上添砖加瓦，跑跑流水线的事儿。

当然，往细节里说，基模型也有的选，除了不同的尺寸，还有不同的能力偏好以及风格。关于基模型的选择，会涉及到对AI大模型趋势的关注、综合评估，以及IT团队对模型的选型判断。

另外，训练的过程虽然傻瓜化了，但是细节也还是很多：

怎么准备高质量的数据
怎么调超参数
怎么评估模型效果

这里如果展开，每一条也值得深究，而且这三个没有一个确定性的答案，还都在摸索的阶段。

总之，AI大模型的训练，从工程方法上，是已经非常标准化了，但是细节还很多不确定性，适合先默认配置跑一下，慢慢迭代。

⑦ AI服务融入作业平台

这部分在上篇（华为大咖说 | 企业应用AI大模型的“道、法、术” -- 法：落地篇（上））已经讨论过不少，大致逻辑就是要把AI的能力设计到IT系统中。

这里我们有几个做法，可以参考：

触点不新增，就地升级：这里反过来思考，新增触点也就意味着新的应用入口，该应用的定位、运营、推行，都是独立的挑战。而就地升级，不仅可以直接提升到现有触点的用户体验和效率，也能够充分将AI与现有的流程和作业融合在一起，不必割裂。
保持一致的体验和交互设计：整体的AI触点风格、元素和交互的设计，不仅可以避免大家自己搞重复投资，而且有助于对新的LUI（Language UI）交互的用户的心智养成。毕竟，这轮AI大潮才刚刚开始，所有人都需要时间学习和适应。

另外这里其实也是有两个流派的探讨，一个是“AI+”，一个是“+AI”。

AI+ ：所谓“AI+”，就是AI Native的应用，认为AI应用应该以AI为中心，如果拿走AI，应用就不work了。这里有一堆业界大佬给这个方向站台。

+AI ：所谓“+AI”，就是在原有的触点升级，通过AI的能力来改进或改造一部分功能和体验。

其实，我个人觉得都是噱头偏多，若不是AI大模型能力不行、场景受限，我才懒得选，肯定是全都围绕AI大模型来搞。但是现实是残酷的，你真的搞个AI驱动的XX应用，就是跑不起来，目前C端也没见到啥杀手级应用（如果ChatGPT式的问答助手算的话，也行）。所以我觉得不要较真，现阶段就是“+AI”。

不过，我们在设计的时候，因为AI大模型能力还在不断快速迭代，有个终局思维是对的，这样能看得更长远。

最后，就是，不要在AI大模型前进的车轮下“绣花”。这个事儿非常关键，现在因为AI大模型自己的能力不够，我们不得已要做很多工程的“代偿”，但是，“代偿”一时爽，一直“代偿”能不能一直爽，这里有个大大的问号。这里同样也先不过多赘述，可以参考我前面第一篇总结《认知篇》。

⑧ 持续运营

从根本上讲，持续运营不是IT这一阶的内容，而是横跨了流程、组织、数据和IT。为了排版，我就暂且放在这里。

AI应用的持续运营，甚至比AI应用本身的建设还重要。没有持续运营的规划和配套，AI应用就不应该“生”出来。我们甚至提了个说法：“无运营不开工”。

因为我们在对待AI应用的时候，有个前提假定，就是AI大模型默认在大部分企业场景上，只能是及格水平。为了让AI应用做成，我们支撑持续迭代它，在不断地反馈过程中喂养它，才能使之达到80分的水平。

为了做成这件事儿，有这么几个配套：

流程：首先得有个AI应用的运营机制建立并发布出来；
组织：然后得有个团队对持续运营工作负责，里面的核心成员是AI训练师；
数据：需要通过数据驱动、反馈驱动的方式，一方面关注业务指标和技术指标的达成情况，另一方面也关注反馈的质量；
IT：持续运营需要配套的运营平台和工具，包括标注的工具、AI助手各项指标的看板，这块看到Microsoft Copilot Studio也有类似的能力，可以参考。

讲到这里，“五阶八步法”正式分享完毕。“五阶八步法”整体环环相扣，又互相有部分包含。我觉得大家不要纠结这里的字面意义，更多还是理解好我们的设计思想。

最后，实操上还有两个小套路，分享给大家：“Think Big, Start Small”和“低垂的果子先摘”。

Think Big, Start Small ：围绕AI使能的场景，想找到一个完美的端到端适用且价值极高的场景，是非常困难的。与其追求完美主义，不如想想，从哪儿切入，围绕一个场景，可以细分出很多个use case，这里其实又可以分个轻重缓急。

低垂的果子先摘：就是要赢，要先胜，特别是面向AI大模型的应用，非常需要胜利来积累经验和能量，才有机会可以复制到其他场景。不然上来开一枪，哑火了，然后就没有然后了。

举个例子，当我们泛泛地说客服场景的时候，其实里面包含了非常多个细分环节，比如客户工单的分流、定级、信息收集、诊断、处置、反馈、总结，这些use case比流程活动还要细。甚至，单纯的某个use case里，又可以按不同的工单种类来细分，比如咨询类工单与故障类、备案类、投诉类工单的诊断和处置都是不一样的，数量不一样，难度不一样，方案成熟度也不一样。

如此一来，这里的业务痛点识别，会细分到一个或者多个具体可落地的范围。当然，这个范围也会发生变化，可能做着做着发现不合适，就要马上调整，或是如果效果和进度超过预期，就值得多搞点进来。

AI大模型应用的路上，还有非常多不确定性，技术路线也远远未收敛，欢迎大家留言交流，互通有无~~

更多干货，请戳这里：https://shixizhi.huawei.com/