绿野仙踪不仅是童话,还是便宜又好用的产品测试法!

以 ChatGPT 为代表的大语言模型爆火后,推动了对话类人工智能产品的高速发展,我们已经看到了如智能助理、问答系统、自动写作等多种类型的个性化对话类 AI 服务。 AI 能力的提升让人们对智能 AI 产品的期望越来越高,相关产品的用户体验也因此变得重要起来。而用户测试是保障产品用户体验的重要方法,对于 AI 类产品也不例外。

但与传统使用图形界面的产品不同,以自然语言作为输入的对话类 AI 产品的用户测试仍然面临着一定的挑战。

图片

在传统图形界面中,用户的交互指令是相对有限的,因为界面中的按钮、菜单选项等都是有固定数量的,我们可以预期单个任务的用户交互路径数量。

然而,因人类语言系统的开放性,在对话类的 AI 产品中,用户为使用一个功能所给出的语音指令是无限的,这大大增加了测试的难度。尤其是在产品概念期和设计早期,在 AI 系统尚未实现全部功能时,如何通过有限的系统能力,应对无限的用户指令进行测试,了解用户对 AI 系统的真实、有效反馈就成为了问题。

在 AI 产品有了大量数据和长时间的训练,并达到稳定有效时,产品设计和开发者已经投入了大量的时间成本和人力成本,如果这时再进行用户测试发现体验不好,就会造成很大的损失。

那有没有什么办法提前验证 AI 驱动的产品,并提前了解它的用户体验呢?这时,绿野仙踪测试就派上用场了。

图片

这个名字来源于经典童话《绿野仙踪》(the Wizard of Oz),故事中的主角们遇到了一个无所不能的魔法师——奥兹国王,但这个国王其实只是一个没有任何法术的普通人,大家看到的一切都是他躲在帘子后面操作机器完成的。

图片

绿野仙踪测试法就是来自这,由真人在幕后扮演 AI ,从而使在前台的用户相信产品是通过人工智能技术来实现他们指定任务的。它的好处是用低成本的方式测试开发成本高的项目,非常适合用来在早期测试 AI 驱动的产品。

图片

早在 1984 年,就有人使用了绿野仙踪测试法,进行了经典的智能语音输入实验,成功展示了如何测试一个还不存在的系统。

图片

被试者被告知可以使用语音输入的方式在电脑上录入,但实际上他看见的所有呈现在电脑上的字,都是在另一间屋子中研究者输入的。即研究者能听到被试者说了什么,然后用键盘帮他打字。但整个过程,被试者都以为是电脑自动化完成的。

图片

一般我们需要两位研究者进行测试,一位担任主持人向参与的测试者介绍测试的大体流程,并在测试过程中进行观察和记录,另一位研究者在幕后担任“魔法师”。

测试开始前,要先确定被测试产品的概念,为它创建必要的图像、元素。同时,在测试的前期,需要明确“魔法师”与测试者的交互方式,即测试中使用哪些设备、技术?通过什么操控产品原型?

其他就如同传统的用户测试一样,需要准备用于测试的,能代表产品核心功能的任务,并准备好预演,确保研究员在测试现场能根据用户的各类语言指令迅速做出有效的响应。需要注意的是,绿野仙踪法对于“魔法师”有一定的要求,需要扮演这个角色的研究者训练有素,只可针对研究相关的特定场景和指令类型有所回应。

图片

通过这样的方式,在系统还未完善前,我们就能了解到用户对于这些功能的体验如何,以及使用这些功能时的心理模型、期望和用于下达交互指令的词汇。

例如让智能助手类 AI 创建一个群聊,用户会有多少类表达方式,这些在目前我们的产品功能定义中是否都覆盖了?或者在某些聊天场景中,有没有因机器人的智能程度不足,阻碍了用户的使用,这对于用户体验的影响是否严重。这些信息都可以通过绿野仙踪法在正式开发前就提前获得的。

图片

对于很多使用自然交互类的 AI 产品来说,绿野仙踪法是强大的测试工具。它让产品设计者可以不需要等到产品功能齐全,在低成本、低风险的环境中测试和完善用户界面。

同时,"绿野仙踪法"有助于建立更深入的用户参与度。通过在测试中使用虚拟环境和故事情节,测试参与者可以更好地理解产品的用途和潜在价值。他们能够更容易地将自己投入到产品的使用情境中,从而提供更为真实和有代表性的反馈。这有助于发现产品的潜在问题和改进点,使产品更符合用户的需求和期望。

换句话说,它加速了产品的开发过程,提高了产品的质量,同时使测试过程更富有创意和吸引力。通过这种方法,产品设计者可以更好地满足用户需求,创造出更具吸引力和竞争力的产品。

鼎道智联一直以 AI-Native 为目标,DingOS 也在努力为用户们带来更安全、绿色、便捷的操作体验,为开发者带来更开放的合作环境,为所有的使用者如果你也认可我们的想法,欢迎关注我们加入鼎道生态~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/105948.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于springboot实现校友社交平台管理系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现校友社交平台管理系统演示 摘要 校友社交系统提供给用户一个校友社交信息管理的网站,最新的校友社交信息让用户及时了解校友社交动向,完成校友社交的同时,还能通过论坛中心进行互动更方便。本系统采用了B/S体系的结构,使用了java技…

PPT文档图片设计素材资源下载站模板源码/织梦内核(带用户中心+VIP充值系统+安装教程)

源码简介: PPT文档图片设计素材资源下载站模板源码,作为织梦内核素材资源下载站源码,它自带了用户中心和VIP充值系统,也有安装教程。 织梦最新内核开发的模板,该模板属于素材下载、文档下载、图库下载、PPT下载、办公…

疯狂java 三-六章

第三章 数据类型和运算符 Java语言是强类型语言,意思是每个变量和每个表达式都有一个在编译时就确定的类型,所有的变量都必须显式声明类型 标识符就是类,变量、方法命名的符号 标识符不能包含空格 标识符只能包含美元符($),不…

python自动化测试平台开发:自动化测试平台简介

一.测试平台简介 为什么需要测试平台 已有的开源测试平台不能满足需要,不要轻易造轮子 需要公司级别的定制 需要整合公司内部的多套平台 例子:DevOps平台、精准化测试平台、质量监控平台等等 常见的测试平台开发模式 大一统模式(适合简单的…

基于springboot实现校友社交平台管理系统项目【项目源码+论文说明】

基于springboot实现校友社交平台管理系统演示 摘要 校友社交系统提供给用户一个校友社交信息管理的网站,最新的校友社交信息让用户及时了解校友社交动向,完成校友社交的同时,还能通过论坛中心进行互动更方便。本系统采用了B/S体系的结构,使用了java技…

STM32-程序占用内存大小计算

STM32中程序占用内存容量 Keil MDK下Code, RO-data,RW-data,ZI-data这几个段: Code存储程序代码。 RO-data存储const常量和指令。 RW-data存储初始化值不为0的全局变量。 ZI-data存储未初始化的全局变量或初始化值为0的全局变量。 占用的FlashCode RO Data RW Data; 运行消…

如何为你的地图数据设置地图样式?

地图样式设置是GIS系统中非常重要的功能模块,水经微图Web版本最近对符号样式功能模块进行了升级。 你可以通过以下网址直接打开访问: https://map.wemapgis.com 现在我们为大家分享一下水经微图Web版中,如何为你标注的地图数据设置地图样式…

微信小程序——后台交互

目录 后台准备 pom.xml 配置数据源 整合mtbatis 前后端交互 method1 method2 后台准备 pom.xml <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0" xmlns:xsi"http://www.w3.org…

postgresSQL 数据库本地创建表空间读取本地备份SQL文件

使用pgAdmin4&#xff0c;你安装PG得文件夹****/16/paAdmin 4 /runtime/pgAdmin4.exe 第一步&#xff1a;找到Tablespaces 第二步&#xff1a;创建表空间名称 第三步&#xff1a;指向数据文件 第四步&#xff1a;找到Databases&#xff0c;创建表空间 第五步&#xff1a;输入数…

Jmeter性能测试:高并发分布式性能测试

​一、为什么要进行分布式性能测试 当进行高并发性能测试的时候&#xff0c;受限于Jmeter工具本身和电脑硬件的原因&#xff0c;无法满足我们对大并发性能测试的要求。 基于这种场景下&#xff0c;我们就需要采用分布式的方式来实现我们高并发的性能测试要求。 二、分布式性能…

Zeth:首个Type 0 zkEVM

1. 引言 一年前&#xff0c;V神博客The different types of ZK-EVMs中指出&#xff1a; 以太坊初始设计未围绕ZK友好性&#xff0c;因此&#xff0c;以太坊协议的很多部分都需要大量计算来做ZK-prove。Type 1 zkEVM致力于精准复制以太坊&#xff0c;因此它没有办法减轻这些低…

台积电2纳米黑科技 - 晶背供电 | 百能云芯

近期&#xff0c;台积电总裁魏哲家在一次法说会中透露了有关2纳米芯片的最新进展&#xff0c;并提到了“晶背供电”技术&#xff0c;这个领域的神秘黑科技正逐渐引起人们的兴趣。 在最近的台积电法说会上&#xff0c;总裁魏哲家不仅提到了2纳米制程的进展&#xff0c;还透露&am…

向量检索库Milvus架构及数据处理流程

文章目录 背景milvus想做的事milvus之前——向量检索的一些基础近似算法欧式距离余弦距离 常见向量索引1&#xff09; FLAT2&#xff09; Hash based3&#xff09; Tree based4&#xff09; 基于聚类的倒排5&#xff09; NSW&#xff08;Navigable Small World&#xff09;图 向…

Linux-安装docker-compose

前言&#xff1a;本文建立在服务器中已经存在docker环境的基础上&#xff0c;总结了安装docker-compose过程&#xff0c;以及安装过程中遇到的问题和解决方案。 一、下载docker-compose 在网上找了两种&#xff0c;一种是github官方的&#xff0c;一种是国内的镜像 gitbub官…

2023年9月青少年机器人技术(五级)等级考试试卷-实操题

2023.09青少年机器人技术&#xff08;五级&#xff09;等级考试试卷-实操题 主题&#xff1a;串口交互数字滚动循环显示 器件&#xff1a;ESP32主控板1块&#xff0c;四位数码管1个&#xff0c;74HC595移位寄存器芯片&#xff08;或模块&#xff09;及相应辅件。以上模块也可…

ubuntu 安装串口工具和添加虚拟串口

目录 一、串口工具安装 二、使用Windows本身虚拟的串口 &#xff08;一&#xff09;添加串口 1、保证虚拟机是关闭状态&#xff0c;打开“虚拟机设置”&#xff0c;点击“添加”。 2、选中“串行端口”&#xff0c;点击“完成”。 3、选中刚添加的串口&#xff0c;下拉选…

分享119个ASP.NET源码总有一个是你想要的

分享119个ASP.NET源码总有一个是你想要的 链接&#xff1a;https://pan.baidu.com/s/1Mp0RugMnIJbS8Hrja4sCOQ?pwd8888 提取码&#xff1a;8888 项目名称 asp.net core 微服务 项目 ASP.NET Core 项目日志解决方案 Serilog Log4net ASP.NET Core分布式项目实战 asp.n…

智能矩阵,引领商业新纪元!拓世方案:打破线上线下界限,开启无限营销可能!

在科技赋能商业大潮中&#xff0c;一切行业都在经历巨大变革&#xff0c;传统的营销策略被彻底改变&#xff0c;催生着无数企业去打造横跨线上线下、多维度、全方位的矩阵营销帝国。无数的成功案例已经告诉我们&#xff0c;营销不再只是宣传&#xff0c;而是建立品牌与消费者之…

第15届蓝桥杯Scratch选拔赛中级(STEMA)真题2023年8月

第15届蓝桥杯Scratch选拔赛中级&#xff08;STEMA&#xff09;真题2023年8月 一、单选题 第 1 题 单选题 点击以下积木块&#xff0c;生成的随机数是一个&#xff08; &#xff09;。 A.整数 B.小数 C.整数或小数 D.以上都不对 第 2 题 单选题 运行以下程序&#xff0…

DeepSpeed: 大模型训练框架 | 京东云技术团队

背景&#xff1a; 目前&#xff0c;大模型的发展已经非常火热&#xff0c;关于大模型的训练、微调也是各个公司重点关注方向。但是大模型训练的痛点是模型参数过大&#xff0c;动辄上百亿&#xff0c;如果单靠单个GPU来完成训练基本不可能。所以需要多卡或者分布式训练来完成这…