让大模型落地有“技”可循

“2018年,随着Transformer预训练模型的兴起,自然语言处理(NLP)学术圈中形成了一个主流观点——NLP领域的不同技术方向,如文本分类、文本匹配、序列标注等,最终都会被归结到文本生成这一核心任务之下。”这是中关村科金技术副总裁张杰在访谈伊始便提到的一项关键洞察。

作为领先的对话式AI技术解决方案提供商,中关村科金自2014年成立以来便选择聚焦生成式AI技术,专注于企业服赛道提供对话场景服务。并在过去数年中,基于对AI技术栈的全面布局,先后构建了数字化洞察与营销、数字化服务与运营、数“智”底座三大产品矩阵。

ChatGPT引爆大模型热潮后,AI技术积淀深厚的中关村科金也在第一时间选择了全面拥抱大模型,并于2023年11月正式发布了国内首个企业知识大模型、AgentGraph应用开发平台,以及“超级员工”系列AIGC应用,成为了国内大模型应用领域的先行者之一。

本期51CTO技术栈T·TALK访谈栏目,我们特别邀请到了中关村科金技术副总裁张杰,希望能够通过这场对话,了解到这位经验丰富的技术专家对于AI行业发展的认知与判断,以及中关村科金这家头部智能科技企业在大模型技术与应用领域所积累的宝贵经验。

大模型落地的切入点

根据张杰的介绍,此前,行业内普遍会将对话式AI认为是企业与客户沟通的一座桥梁,尤其是在数字化转型的背景下,这座桥梁的主要作用通常会被归结为提升沟通效率与用户体验。

然而随着大模型技术的火爆,业内开始逐渐意识到了对话式AI的更大潜能——“以中关村科金为例,现在我们认为对话式AI在大模型所提供的理解和生成能力加持下,可以通过在对话过程中对企业知识的提取,升级成为企业知识管理甚至是企业群体智能的入口。”

因此在张杰看来,当前很适合大模型落地破冰的切入点,便是面向企业的知识问答场景。常规的企业知识库会包含大量的各式文档,并不利于整理和查询,如今只需要将这些知识信息交给大模型进行处理,便能直接通过对话形式进行关键信息检索。

这不仅能带来成本上的效益,企业不再需要大量人员对文档进行标注整理。且基于大模型的控制,所生成知识信息在合规和可控性上的表现也会更好。更重要的一点是,企业知识中台并非孤立场景,除了赋能内部员工外,对外部客户的触达连接,例如营销、客服等,也都存在着很大的想象空间。

目前,中关村科金AIGC应用知识助手已成功服务银行、证券、财富管理等多个行业客户,包括头部证券公司。在证券行业实践中,基于大模型内容生成能力,为客户经理生成不同对客阶段、多样化的客户营销话术,营销文案撰写时间从10分钟缩短至10秒,高效辅助客户经理展业,提升客户经理对客服务的专业性。在财富管理行业实践中,为智能客服产品赋能,大幅提升客服系统问答意图识别准确率和回复准确率,减少70%以上的系统运营工作,帮助企业实现更加智能、成本更低的客户服务。

“2022年ChatGPT发布后,大模型实现了从学术圈一直到朋友圈的破圈;2023年则是大模型破冰的阶段,无论是基础大模型还是领域大模型厂商,都在积极寻找试点应用场景;而2024年将很有可能会是大模型应用涌现的一年,各种业务场景都会选择拥抱大模型。”张杰如是说。

模型与知识的有机结合

作为国内头部的对话式AI技术解决方案提供商,中关村科金在多年的经营历程中积累了丰富的企业级客户服务经验。在企业数字化转型的过程中,张杰总结到,无论在大模型火爆前后,客户对待产品的态度都无外乎两种——足够新颖亦或是足够实用。

因此,通用大模型并不能成为当下企业服务的统一解决方案。通用大模型更强调泛用性,即便模型综合能力很强,但依然会面临一个法则,便是“通用的不好用,好用的不通用”,所以想要解决企业不同业务场景下的特定问题,还需寻找新的突破口。

中关村科金基于对大模型技术的综合判断,探索出“大模型+领域知识”的发展路径,在领域大模型的基础上又提出了企业知识大模型。由于许多知识密集型企业不允许模型存在幻觉问题,这便需要将特定领域知识和语言模型进行有机结合。

企业知识大模型助力构建“企业知识大脑”。例如在制造业,没必要训练领域大模型记忆特定企业每款零件的各种细节数据,只需要将信息储存在企业知识库,并由企业知识大模型进行信息的挖掘与读取,并从中筛选出用户所需的知识点。

张杰表示:“企业知识大模型不与具体领域绑定,更多用于处理不同结构的数据源,并将非结构化的知识转化为大模型能够快速查找的知识库,没有领域特性的特点,也使其能够被更广泛的应用于不同行业的不同业务场景中。”

软件工程新范式

根据张杰的介绍,随着企业AI应用场景的不断丰富,很多应用创意将产生在业务部门,他们需要更加简易高效的研发平台快速验证idea,而不是将任务全部交由科技部门慢慢立项研发。

而对于如中关村科金这样具备多样产品体系及完备产品矩阵的企业而言,大模型应用开发平台能够帮助交付人员提高产品的研发和迭代效率并降低成本。所以,中关村科金在推出企业知识大模型的同期上线了AgentGraph应用开发平台。

“基于智能体的应用开发平台将会是一个大的趋势,这将可能会带来软件工程的新范式。”在软件工程2.0时代,数据格式都需要人为进行预定义,但在大模型时代,基于模型对多模态数据的理解,预定义数据结构这项沿用许久的传统势必将被颠覆。

关于AgentGraph应用开发平台的特点,张杰也给出了这样的介绍,“AgentGraph平台分为两层,底层为原子能力,场景组件中封装了大量行业KnowHow,上层则采取拖拉拽即可实现的零代码流程编排画布。能够低成本的链接模型能力和应用场景,是AgentGraph的核心优势。”

张杰表示:“我们希望通过AgentGraph构建一个生态开发平台,把应用开发的权限从算法工程师、IT人员手里开放出来,业务专家可以通过低代码、拖拉拽的方式,快速调用AI底层能力,实现场景应用落地。”

产品革命

无论技术亦或是工具的演进,最终所影响的都是产品的迭代和创新。相较于此前基础的AI技术,大模型所能提供的语言理解能力更强,这意味着在大模型的赋能之下,传统AI产品的能力覆盖率将会迎来质的飞跃。

例如在一些客服质检场景,传统方法是利用关键词识别,去判断涉及敏感内容或辱骂性的词句。而依托大模型的语言理解能力,基于大模型所构建的质检系统,一些不含有敏感词但句意为辱骂或涉及违法的内容也将能够被准确识别并抓取。

另外,在我们熟悉的营销领域亦是如此。原先做营销外呼需要将产品话术及对话SOP提前设定好,然而即便如此SOP也没法穷举客户的不同状态,例如客户在开车亦或开会时该怎么做,传统营销系统都难以应付。大模型则只需要通过一些绩优话术的训练,便能够基本达到人类业务员的水准。

目前中关村科金主推的一大产品应用便是能够服务营销、客服、行政、财务等诸多不同业务场景的虚拟员工助手。不同业务场景的虚拟员工都源于同一套技术路径,即底层能力来自大模型及AI原子能力,以支持信息抽取、文本理解及内容生成。

对于企业最关心的大模型落地成本与安全性问题,张杰也总结了一些自己的观点和中关村科金目前所提出的解决方案。在企业私有化部署时,很多场景不需要太大体量的大模型,更没必要从0到1训练基础模型。很多时候几十亿、几百亿参数的小模型就能解决具体问题,加之应用云服务,部署大模型及训练的整体成本并不会过高。

安全层面,中关村科金则提出了一套新的安全体系,通过数据清洗、隐私脱敏、合规加训、提示工程约束与传统合规质检五层安全防护的处理,以确保大模型以及基于大模型所构建的系列应用能够尽可能摆脱幻觉问题的困扰。

大模型的应用高地

“随着技术和应用的不断成熟,大模型的应用场景将变得非常多,知识密集型行业将最有可能率先成为大模型落地的高地,例如金融、制造、政务等。”在回答有关大模型领域未来发展趋势的问题时,张杰提出了自己这样的判断。

金融业有着许多大模型应用落地场景,这是由于金融业拥有较强的数字化基础,且每一点小的突破都能带来可衡量的收益。在银行、保险、证券等行业的营销、服务等业务场景中,大模型都能够对业务人员形成很好的赋能。

此外,如制造、政务等领域,虽然仍在数字化进程中,但它们的共同点便是行业内都存在着海量信息,利用大模型将这些知识碎片收集记忆起来,按需赋能给相关人员,将能够显著提升多种场景下业务人员的工作效率。

张杰强调称:“任何技术从前沿的突破,到工程化、产品落地试点,再到大规模落地,都会有一个技术应用的生命周期。现在大模型技术非常火爆,虽然在应用过程中还需要一段的时间积淀,但在未来三到五年,这一领域将会充满机遇。”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/537763.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【大语言模型】基础:如何处理文章,向量化与BoW

词袋模型(BoW)是自然语言处理(NLP)和机器学习中一种简单而广泛使用的文本表示方法。它将文本文档转换为数值特征向量,使得可以对文本数据执行数学和统计操作。词袋模型将文本视为无序的单词集合(或“袋”&a…

【电控笔记0】稳定度判断

简要概括 现控:原理虚轴,稳定度越高 自控:相位裕度PM 增益裕度GM 开环传函 不稳定条件判断

Proteus 8 的使用记录

创建仿真文件 新建文件:默认下一步,至完成创建。 功能选择如图: 放置器件 常用元器件名称 keywords 常用51单片机 AT89C52 晶振 CRYSTAL 电阻 RES 排阻 RESPACK-8 瓷片电容 CAP 电解电容 CAP-ELEC 单刀单掷开关 S…

【教学类-52-01】20240411动物数独(4宫格)

作品展示 背景需求: 一、下载图片 PS修图(图片长宽一样,把动物图片上下拉长) 二、数独结构分析: 1、这是一个四宫格的数独题, 2、将1234换成了四种小动物图片。 于是我去找到原来做过的一个代码&#xf…

day05-java面向对象(上)

5.1 面向对象编程 5.1.1 类和对象 1、什么是类 类是一类具有相同特性的事物的抽象描述,是一组相关属性和行为的集合。 属性:就是该事物的状态信息。 行为:就是在你这个程序中,该状态信息要做什么操作,或者基于事物…

web安全-SSH私钥泄露

发现主机 netdiscover -r 192.168.164.0 扫描端口 看到开放80和31337端口都为http服务 浏览器访问测试 查看80端口和31337端口网页和源代码并无发现有用信息 目录扫描 扫描出80端口并无有用信息 扫描31337端口 发现敏感文件robots.txt和目录.ssh 访问敏感文件和目录 /.ss…

pugixml C++ 开发者处理 XML 数据的理想选择之一

pugixml 是一个广受好评的 C XML 解析库,其相对优势包括但不限于以下几个方面: pugixml 以其高效、易用、全面的功能和良好的跨平台能力成为 C 开发者处理 XML 数据的理想选择之一。 链接: 使用Pugixml库,轻松处理XML文件-CSDN…

vue 原理【详解】MVVM、响应式、模板编译、虚拟节点 vDom、diff 算法

vue 的设计模式 —— MVVM M —— Model 模型,即数据V —— View 视图,即DOM渲染VM —— ViewModel 视图模型,用于实现Model和View的通信,即数据改变驱动视图渲染,监听视图事件修改数据 初次渲染 将模板编译为 render …

Prometheus报错,查不到数据

Warning: Error fetching server time: Detected 28799.947999954224 seconds time difference between your browser and the server. Prometheus relies on accurate time and time drift might cause unexpected query results. 1.这是因为服务器和本地时间不同步导致的 查…

抖店怎么回复客户消息才能减少差评?分享几个超级实用的话术!

哈喽~我是电商月月 新手入驻抖音小店出单后,或多或少都会遇到差评现象 差评私信不解决,顾客不满意,店铺的体验分下降,差评也能被所有的顾客看见 那之后的顾客就会觉得店铺不可靠,那新手如何避免这一现象呢 今天我就…

SLF4J对lombok类型的对象调用toString()失败--StackOverflowError

PackingDemand.class StatusHistory.class 造成该问题的原因是:PackingDemand与StatusHistory之间的双向引用。这些类中生成的两个toString()方法都会无休止地相互调用导致出现java.lang.StackOverflowError。 解决方法: 1.对于使用ToString.Exclude生…

Redis学习从入门到掌握(基础篇)

文章目录 一、初识Redis1.认识 Redis2.Redis常见命令(1)Redis 数据结构介绍(2)Redis 通用命令(3)String 类型(4)String 类型的常见命令(5)Hash 类型&#xff…

练习6 beach beauty

文章目录 图片展示 图片展示

说说我理解的数据库中的Schema吧

一、SQL标准对schema如何定义? ISO/IEC 9075-1 SQL标准中将schema定义为描述符的持久命名集合(a persistent, named collection of descriptors)。 大部分的网上资料定义Schema如下: schema是用来组织和管理数据的一种方式。它…

【渲染加速秘籍】3D建模不再卡顿:硬件升级、场景优化与云渲染全攻略!

在使用3D建模软件时,我们经常会遇到硬件资源消耗较大的问题,尤其是在进行染操作时。为了解决这一问题,我们可以采取以下几种方法来优化我们的工作流程和提升渲染效率。 1.升级硬件设备 对于经常需要进行渲染工作的用户来说,投资高…

让你的进程24小时在linux上运行

xshell原理 可能我们都在使用xshell时,都会遇到一些问题,就是你在xshell运行了你的服务器。可是你把xshell页面一关,你的服务器就自动关闭了,这是为什么呢?? 本质是因为我们的xshell在登陆服务器时&#…

前端对接fastGPT流式数据+打字机效果

首先在对接api时 参数要设置stream: true, const data {chatId: abc,stream: true,//这里true返回流式数据detail: false,variables: {uid: sfdsdf,name: zhaoyunyao,},messages: [{ content: text, role: user }]}; 不要用axios发请求 不然处理不了流式数据 我这里使用fetch …

细胞世界:4.细胞分化(划区域)与细胞衰老(设施磨损)

(1)细胞凋亡 1. 概念:细胞凋亡可以比作城市的规划者主动拆除某些建筑来更新城市或防止危险建筑对市民的潜在伤害。这是一个有序的过程,由城市(细胞内部)的特定规划(基因)所决定。 2. 特征:细…

特别详细的Spring Cloud 系列教程2:微服务网关gateway的启动

继上一篇:特别详细的Spring Cloud 系列教程1:服务注册中心Eureka的启动 在比较多的教程和书籍里,spring cloud的微服务网关用的Zuul。然而,zuul已经不被官方提倡,现在提倡用的是spring cloud gateway。因为gateway的整…

c++编程(3)——类和对象(1)、类

欢迎来到博主的专栏——c编程 博主ID:代码小豪 文章目录 类对象类的访问权限类的作用域 类 c最初对c语言的扩展就是增加了类的概念,使得c语言在原有的基础之上可以做到信息隐藏和封装。 那么我们先来讲讲“带类的c”与C语言相比有什么改进。 先讲讲类…