大模型之十九-对话机器人

大语言模型的最早应用是Chatbot,其实我最早接触语义理解在2014年,2014年做智能音箱的时候,那时也是国内第一批做智能音箱的,在现在看起来当时的智能音箱比较傻,很多问题无法回答,长下文效果也不好,多轮对话效果就更差了,那时对话使用的主要技术是基于规则+知识图谱,所以主要还是停留在命令词识别基础上的交互,比如放音乐类、操控智能家电以及问天气等有限的几个范畴,更多的扮演的事assistent角色,开放式聊天做的并不好。
当时是设计阶段就决定了对话的上限,虽然我们当时模仿的Amazon Alexa如今“进化”出了数以万计的技能,但是相对于LLM,这些技能显得有些过时,如何将LLM接入Alex也是亚马逊不得不面临的事。

时至今日大型预训练的语言模型(如GPT、BERT等)使得对话机器人取得了显著的进展。这些模型通过在大规模文本数据上进行预训练,可以生成具有语法正确性、语义连贯性、具有记忆能力多轮对话的文本回复,除了生成自由对话回复的模型,还有一些任务导向的对话系统,如客服机器人、智能助理等。这时在运行时才会决定对话的上限,聊天机器人再次被认为是客户服务、营销和内部运营的潜在游戏规则改变者。

在训练模型的时候,常常提到模型的泛化能力,泛化能力使得模型可以高质量回复训练集中并不存在的内容,即可以将模型的训练过程看成是记忆+学习的过程,记忆是可以记住训练集中的内容,而学习就是根据训练集中的内容举一反三、触类旁通。在一个训练好的模型,如果触发高质量的记忆+学习能力以获得高质量的回复是信息获取类的核心竞争力之一。

就当前的大语言模型的产品形态而言,基于我所处的行业和工作性质认知,我认为集成大语言模型的工具类应用将是第一波享受大语言模型红利的应用场景。尽管微软基于大语言模型的代码补全github copilot还处在亏损的阶段,但是150万这一庞大的付费用户规模,已经验证了大量用户愿意为此买单,对于copilot生产代码的质量是至关重要的。

大语言模型的用户价值

总结来说,使用大语言模型的目的可以归为一下几类:

1.信息获取:提供及时、准确、可信的信息和答案,用户可以问问题、需求建议获取特定领域的知识,这好处在于可以快速获取信息而不需要再浏览搜索结果或者在工具间切换,突出优势是方便,这在信息爆炸的时代是非常突出的重点的,

2.娱乐和消遣:重点是消遣,这里必须突破的点是如何促进用户的多巴胺分泌,显示生活中黄赌毒都能促进大量的多巴胺分泌,同样一样东西,具有两面性,取决于人怎样使用,好比刷抖音/快手,有些人是获取知识,而有些人就是为了看不费脑子的爽图和短视频,如何在这一个过程中让用户不费脑子的消遣是产品设计的重点,但凡需要一些思考,就可能流失一部分用户,但是如果能够挖掘用户的兴趣点,比如有些小朋友喜欢脑筋急转弯,虽然费脑子,猜不中,但是小朋友却很喜欢玩,并且乐此不疲,虽然猜不中,但是总想征服下一个谜底,这个游戏的设计非常有挑战性。

3.社交互动:这是人的情感需求,需要提供的事情绪价值,高质量的共情是这个点必须突破的核心所在。这是满足人的社交需求,在一些情况下,如孤独感、需要倾诉和陪伴是,对话机器人可以提供一种无压力和包容性的交流环境。

不同用户在不同场景对于时间的看法是不一样的,对于互联网等科技工作者,在工作的时间,需要高质量的信息获取以便提升工作的产出和结果,而在下班之后的时间有些人人用来社交、有些人用来娱乐,有些人用来进修,不同的选择对于时间的价值期许是不一样的。

以高铁候车大厅为例,坐在凳子上等车的人中,约85%都盯着手机,其中以30岁左右的人比例最高,在干的事情,主要为聊天(人面对面聊天),和手机交互,和电脑pad交互(极少),吃喝、带娃以及发呆(盯着大屏或者其他场景看),手机占了90%的时间,主要使用的APP主要为微信、抖音、微博、游戏、电话、购物等这几大类,如果想要占据这些人的时间,那么娱乐类是重点。

如果是办公室的白领场景,那么这些人沟通外界的方式更多的是电脑,且在家也多有个人电脑,办公场景更多的需要高做出高质量选择,高质量的信息获取就至关重要,对于程序员、财务、律师、金融、医疗等不同的类型的白领又需要特定领域的知识。

所以在设计一个ChatBot的时候,需要想清楚服务于什么用户(核心用户),刚性需求是什么(痛点),典型的场景(什么时候用,就是你想吞噬用户什么场景的时间,是高铁候车大厅还是程序员办公室工作场景?)以及竞品优势是什么。

大语言模型现状

像GPT-4这样的LLM的出现彻底改变了聊天机器人的设计格局,这些高级模型利用人工智能来理解上下文并生成类似人类的响应。这种转变对聊天机器人设计具有重大影响。

当前各家的模型还处在初始阶段,基本上是模型即服务的状态,通过测试在模型层面上回复质量就是层次不齐的,而对于相同的模型,采用不同retrieve方法引导生成的回复,质量也是不一样的。这种retrieve方法是交互范式的改变。

很多产品将对话机器人以web主打的形式接入公司的官网或者是浏览器插件的形式提供AI功能,web仍然是构建对话机器人的最简单、最干净的方式,并提供设计对话机器人的最大自由度。围绕着的也会有各类平台的app,以增加对话机器人的触及度。

不同的场景中,用户对对自身时间价值的看法是不一样的,期望产生的价值也是不一样的,当前大一统的对话机器人并不能很好的覆盖通用的日常场景,就目前而言并不认为大语言模型会一统所有场景,比如现在吃饭会打开一个APP,购物会打开一个app,比如饿了么,现在的交互范式是我主动搜索,然后下拉一个个看评分看详细介绍,个性化并不智能,大模型可以做到更了解一个人

商业盈利当前仍不是重点,圈地是重点,但是商业化已经在流量以及会员制付费的模式上尝试,并取得了一些进展。

设计师现在可以更专注于完善聊天机器人的对话能力,在特定领域训练它,并确保它为最终用户提供价值,从而产生更具吸引力和更有效的用户体验。

信息获取类都是如此,信息的质量将是大语言模型之间竞争的核心,为了提升大语言模型的回复质量,由此引出了扩充高质量数据集、Fine-tune、RAG、联网信息获取都是在提升回复质量。

大模型进化的方向

用户将从聊天中获取怎样的价值,或者说聊天机器人给用户在什么场景提供怎样的潜在价值是是出发点,换句话说满足了了人性中哪点或哪几点,相对于本我、自我、超我的马斯洛分层模型,我更喜欢用人性劣根性的七宗罪来提炼价值。

设计对话机器人是艺术和科学的融合,结合了用户界面设计UI、用户体验UX、交互设计ID和大模型训练。是用户针对其痛点场景的第一解决方案,产品自始至终的设计都应该牢记对用户提供价值。最核心的是理解用户需求,用户是不懂技术的,让用户学习如何写好prompt的产品体验是不合理的,如果在用户不感知的情况下帮助用户生成高质量的prompt,表面上式我想要,深挖到最后,都可以归结到人性层面,所以有时候用户的问,并不是用户真正想的问题,所以挖掘背后的问并为用户写出正确的Prompt是产品设计中必须考虑的点。

从表面的形式上看,未来大模型发展的趋势如下:
1.各种插件引入,给大模型补充数据、技能,搜索、地图、财经、天气数据等;增加在数据专业性和时效性;
2.应对隐私和幻觉,隐私包括个人电话、地址相关账号登信息的泄露,也包括公司的一些文档、信息、资料等泄露,幻觉是生成可靠的回复,当前的大语言模型是可能生成实事性的错误或者捏造相关事实。
对于幻觉,当前采用如下两种方法居多。

  •   Fine-Tuning
    
  •   Retrieval Augmented Generation (RAG).
    

在这里插入图片描述
3.由于部分大语言模型对话已经退出,因而当前已经收集到了海量的真实对话数据,理解机器人失败的原因仍然至关重要。分析见解不仅增强了用户体验,还揭示了聊天机器人设计中的潜在陷阱。通过研究机器人在用户旅程或对话流程中的不足之处,我们可以相应地完善和改进设计。
4.头部互联网公司继续领跑,并且在已有业务和通用对话机器人继续尝试,具有行业数据(金融、医疗、法律、软件等)将会构建行业大语言模型并司内尝试使用;
5.预计24年底到25年上半年,头部互联网通公司根据已有对话机器人收集的数据分析后,大概率会反应过来其以前的通用大模型全品类聊天注定是失败的产品,构建个人助理(类似企业高管的个人助理,只不过这里是大语言模型)大模型才是出路,并且即可可能成长为一下阿里、腾讯、字节,如果是上面三家中的一家,那么市值翻个好几倍也不在话下,个所以如何构建好个人场景的衣食住行等相关服务至关重要,这对于大公司是有优势的,比如字节跳动,旗下的抖音有电商、本地生活、休闲娱乐以及住房等多个维度的产品矩阵,当然在一两个领域里能成功已经是非常大的成功了,比如食这个领域里干掉美团,其实美团的体量很大,但是美团的壁垒并不高。
6.当前规模的大模型门槛越来越低,生态会越来越好,更多的中小公司会依靠大模型带来的能力,将企业提升一个等级,这在民营企业中最有可能出现。
7.未来大模型的规模会越来越大,涌现的能力会令人越来越吃惊,全民拥抱大模型的时代将在10年后来临,当前正处于大模型的进化、技术应用普及阶段。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/108497.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

etcd的mvcc源码剖析

mvcc简介 悲观锁 在对于一些临界资源进行读写的时候,为了防止其他人进行同步的修改数据,直接将当前的数据锁住,不让别人使用,来实现并发安全 乐观锁 在对临界资源进行操作的时候,不锁住数据,实现独占&…

网络协议--TCP的交互数据流

19.1 引言 前一章我们介绍了TCP连接的建立与释放,现在来介绍使用TCP进行数据传输的有关问题。 一些有关TCP通信量的研究如[Caceres et al. 1991]发现,如果按照分组数量计算,约有一半的TCP报文段包含成块数据(如FTP、电子邮件和U…

Elasticsearch跨集群检索配置

跨集群检索字面意思,同一个检索语句,可以检索到多个ES集群中的数据,ES集群默认是支持跨集群检索的,只需要动态的增加入节点即可,下面跟我一起来体验下ES的跨集群检索的魅力。 Elasticsearch 跨集群检索推荐的是不同集群…

linux中nginx配置https

一、版本适配 版本一定要适配,否则会报错各种参数定位不到不识别的错误,以下是版本适配信息,各位观客自行按照以下信息匹配版本。 Nginx 1.11.5及以上版本与OpenSSL 1.0.2及以上版本兼容。Nginx 1.15.2及以上版本与OpenSSL 1.1.1及以上版本兼…

redis的bitmap(面试题,待补充)

位图简介 如果我们需要记录某一用户在一年中每天是否有登录我们的系统这一需求该如何完成呢?如果使用KV存储,每个用户需要记录365个,当用户量上亿时,这所需要的存储空间是惊人的。 Redis 为我们提供了位图这一数据结构&#xff…

图神经网络及其在知识图谱的应用

一 应用领域 道路交通,动态预测 自动驾驶,无人机场景 化学,医疗等场景 物理模型相关 二 图基本模块定义 V Vertex点 E Edge 边(向量) U Global 图 (例如:全局向量) 无论事…

msigdbr hallmarks gsea broad研究所

使用msigdbr r包 #BiocManager::install("msigdb") #https://www.gsea-msigdb.org/gsea/msigdb #https://cran.r-project.org/web/packages/msigdbr/vignettes/msigdbr-intro.html #https://bioconductor.org/packages/release/data/experiment/vignettes/msigdb/ins…

RPC远程调用加密方法获取返回值

前言 从混淆的加密JS中还原了加密参数的具体生成流程,结果想从JS转python的过程中第一步就卡住了。开头密钥JS代码如下,但是水平有限不知道如何转为python实现(如果有大佬知道希望可以评论指点)。利用execjsjsdom来执行简化还原后的JS代码依旧无法实现。…

MGRE环境下的OSPF

实验拓扑 需求 1 R6为ISP只能配置IP地址,R1-R5的环回为私有网段 2 R1/4/5为全连的MGRE结构,R1/2/3为星型的拓扑结构,R1为中心站点 3 所有私有网段可以互相通讯,私有网段使用OSPF完成。 IP规划 配置IP R1 # interface GigabitEt…

Flutter FittedBox

🔥 英文单词FittedBox 🔥 Fitted 通过有道翻译如下 : Box 通过有道翻译如下 : 对 FittedBox 的理解 我们可以将 FittedBox 理解为合适的盒子,将其它布局放到FittedBox这样一个盒子中,从而实现 盒子里面的…

C++ list 的使用

目录 1. 构造函数 1.1 list () 1.2 list (size_t n, const T& val T()) 1.3 list (InputIterator first, InputIterator last) 2. bool empty() const 3. size_type size() const 4. T& front() 4. T& back() 5. void push_front (const T& val) 6.…

Elasticsearch核心技术与实战-05-elasticsearch的安装与简单配置-Windows

首先下载elasticsearch的zip包:下载地址 网络不通的解决方法:国内镜像站 es、kibana、logstash均可在华为云开元镜像站自行选择版本下载:下载地址 下载插件包: .\bin\elasticsearch-plugin install analysis-icu .\bin\elasti…

pgbackrest归档目录满,清理后写入仍报错,分析及处理

一、 背景 pgbackrest配置的归档目录/backup被写满 归档报错 No space left on device,wal日志堆积 解决方法直接查看第三部分 二、 问题分析及处理 1. 目录清理 首先想到的就是清理/backup目录,清理后剩余6T空间 但发现pgbackrest归档依旧在报错 No …

dc-5 靶机

1.扫描ip地址 2.网页 3.dirb 爆破目录 没有用 4.爆破端口 没有用 5. 文件上传漏洞 上传点 写一句话木马 蚁剑连接 1.shell反弹 蚁剑反弹 提权 使用命令 命令"find / -perm -us -type f 2>/dev/null"在整个文件系统 ("/") 中搜索设置了SUID权…

基于白鲸优化算法BWO优化的VMD-KELM光伏发电短期功率预测MATLAB代码(含详细算法介绍)

微❤关注“电气仔推送”获得资料(专享优惠) VMD适用于处理非线性和非平稳信号,例如振动信号、生物信号、地震信号、图像信号等。它在信号处理、振动分析、图像处理等领域有广泛的应用,特别是在提取信号中的隐含信息和去除噪声方面…

Capacitor 打包 h5 到 Android 应用,uniapp https http net::ERR_CLEARTEXT_NOT_PERMITTED

Capacitor 打包 h5 到 Android 应用,uniapp https http net::ERR_CLEARTEXT_NOT_PERMITTED capacitor 官网: https://capacitorjs.com/docs/ 项目上需要做一个 app,而这个 app 是用 uniapp 做的,里面用到了一个依赖 dom 的库&…

【Mysql】数据库三大范式

数据库三范式 :数据库三范式是指关系型数据库设计中的三种规范化设计原则,旨在减少数据冗余、提高数据一致性和可维护性。 第一范式:规定表中的每一列都应该是不可分割的最小单元。 为什么要这样实现呢? :举个栗子…

Kotlin(八) 数据类、单例

目录 一:创建数据类 二:单例类 一:创建数据类 和Java的不同,kotlin的数据类比较简单,New→Kotlin File/Class,在弹出的对话框中输入“Book”,创建类型选择“Data”。如图: 然后编…

VMware Horizon 8 2309 Enterprise虚拟桌面

VMware Horizon 8 2309 Enterprise虚拟桌面 一、虚拟桌面二、产品发布三、VMware Horizon 8 2309 Enterprise1.VMware Horizon 8 2309 Enterprise产品清单2.安装部署3. 优化工具总结 一、虚拟桌面 利用虚拟桌面和应用随时随地进行访问。 从云端进行管理 使用云端控制台和 Saa…

Docker swarm集群之compose启动多服务

Docker swarm集群之compose启动多服务 本篇文章是在搭建过Swarm集群基础上进行的,如未搭建过请移步 : [Docker swarm 集群搭建 - Wanwan’s Blog (wanwancloud.cn)] 环境信息 主机名IP主机配置master10.10.10.32c2gnode0110.10.10.42c2gnode0210.10.…