AI玩具来了,它怎么样?

90后的我们,是AI时代的见证者。20后的小孩,才是AI时代的原著民。当ChatGPT们改变着大人的工作方式,我觉得,是时候让孩子们的玩具也更聪明些了吧。于是,在六一前夕,我用市面上的AI语音对话套件给娃DIY了一套她人生中首款搭载了语言大模型的对话玩具,并在深度体验后对AI玩具有了一些新看法。

AI对话玩具的原理类似于智能音箱,以STT + LLM + TTS架构为主。玩具会先把用户的语音转换成文字信息(STT),该文字信息交由语言大模型后生成反馈性的文字信息(LLM),文字最终又会被转换成语音信息发送给用户(TTS)。这就是基本的工作流程。

我选用的是FoloToy设计的八爪鱼AI套件。该套件提供了一个小型电路板以及成熟的AI语音对话方案。用户可以根据自己喜好设计适配的玩具外壳、定制专属的提示词。需要说明的是,该套件出厂前已经内置了若干卡通形象,用户根据其官网的步骤是可以直接进行对话体验的。而更为灵活,更具个性化的配置,例如,定制人物形象的“角色提示词”、定制人物的开场白、定制人物的音色、选择AI大模型类型等,才需要用户进入到“自建服务器”模式下进行操作。此模式才是最具趣味性的,我的玩具定制也是基于此。

我的想法很简单:在“自建服务器”模式下写入专属提示词,首先让玩具记住我孩子的名字,这样玩具和孩子交流的时候就会显得相互很熟络也有互动感;其次,让玩具“伪装”成孩子最喜欢的一个动画角色,并且以该角色的立场来回答问题,这样就增加了孩子对玩具本身的热爱程度。

但就是这个“自建服务器”模式,对非技术人员非常不够友好。它需要用户会独立进行服务器部署。虽然官网提供了详细的教程材料,但是文章里全是黑话和暗语。"VPS"、"Debian"、"全局使用"、"TCP端口"......正常人就不可能看懂嘛。市面上很多类似的教程都是如此,它们都是建立在一定专业知识储备基础上的,而从过往的经历来看,这个壁垒就是我获取新知过程里最大的阻碍。       

当然,现在不一样了,AI帮我踏平了这个鸿沟。我利用国产“ChatGPT”的王者:Kimi,很容易就搞清楚了FoloToy教程里各类名词以及它们之间的关系,不需要花里胡哨的提示词,直接问某个名词是什么意思即可。如若还不理解,让其用类比的手法来解释下就基本能满足临时学习的需要。遇到某些确实复杂的知识点,再加上一些追问就更易理解了。余下的就是根据视频教程傻瓜式的模仿操作,具体过程不再赘述。结果就是,熬了两个晚上,我几乎是一次性完成了服务器的部署。尽管如此,我依旧建议,如果能让用户以更简单的形式定制prompt:优化说明文档、降低定制prompt的使用门槛,必定会扩宽更大的用户群体。

按住对讲按钮,冰冷的电路板突然就可以让我和AI进行对话了,作为小白,这进度也直接惊艳到了我自己。AI时代,知识壁垒真的正在消失,阻碍人类获取新知最大的障碍可能只是自己的意愿。

完成了服务器部署基本就是解决了整个DIY过程里最难的一部分。剩下的就是根据设想写一段独一无二的提示词,最后再配上一个喜欢的玩具外壳。新一代的AI玩具就诞生了。

作为初代的AI玩具,我对其效果还是很满意的。体验下来,它是真“聪明”。不仅能轻松招架孩子的十万个为什么,还在于,它的答案不乏风趣和童真,比大部分成人回答的都好。相较于某某兔们极为有限的对话空间,AI玩具甚至在对话过程中会带出孩子的小名,这让其更显人性。当然瑕疵也存在,如延迟高、说话没有任何感情,这些从技术角度上讲后面都能解决。反而我发现,当前通用语言大模型固有的一些缺点:无法处理复杂流程、“七秒钟”的记忆、文本长度的限制等,在AI玩具的场景下,反而不会是问题。短文本、低轮询是对话类玩具的特点,这样的场景非常契合语言大模型的功能特点。语言大模型真的很适合“对话”型玩具,玩具搭载AI大模型将是一个必然的趋势。

但语言大模型本身也并不是灵丹妙药,因为prompt决定了玩具到底灵不灵。现在我手里的初代AI玩具的效果强依赖于提示词。但有过AI使用经验的人都知道,语言大模型并不是一个有着清晰逻辑的线性控制系统。虽然你给它设定了一堆约束,但模型依旧会“跑题”,我在使用过程中就不止一次碰到了“会讲故事的老师”说自己“我是Kimi,你的人工智能助手”。这说明,普通用户用提示词将模型固定成单一的形象这个行为本身并不太靠谱。更不用说,提示词没优化好出现token不够用的健忘行为。当号称智能的玩具一旦失手一次,就很难挽回挑剔的小孩。从这个角度讲,更具商业化的AI玩具应需要微调过的垂直类大语言模型和更专业的提示词来保证效果的一致性。这些可能需要大厂或者大资金的参与,而未来,开放prompt词可能不会是一个主流的做法。

AI玩具的核心竞争力也不是大模型而是差异化。其实,当终于可以在玩具上定制我想要的形象时,我反而不知道该如何制定一个与众不同的prompt了。无外乎是,会讲故事的叔叔、能解惑的老师、可以讲笑话的姐姐等传统儿童对话机已有的或包含的形象。而从孩子的角度,这个AI玩具似乎没有什么特别的改变,她可能甚至都没能感受出这个玩具更“聪明”了。低龄孩子本身就处在善恶对错的探索期,让他们感知到“聪明”一点似乎还有点强人所难。于是,当我将“用心”调教过的玩具拿给我孩子后,和大多数传统玩具一样,她先是好奇地玩了几次,后来就再没有碰过。

玩具的变革,AI技术是底层驱动力,创新才是最直接的推力。简单的语音对话,只能是AI玩具最初级的形态,可以预想到,搭载了AI大模型的智能硬件在未来还有很大的发展空间。市场上已经出现的虚拟女友、亲人数字分身等应用,在赋予其硬件真身后,会充满了想象,这些都可能是未来AI玩具丰富形态的一种。简单模仿和改变,是初期时的探索和试验,想做出好的AI玩具可能还需要时间和想象。

但我依然觉得,大模型驱动下的玩具产业大有搞头。技术上,需要更多微调过、适用儿童教育的可控模型。产品上,则需要更多传统产品人进来“蹚浑水”。当前,AI玩具的技术门槛其实并不高,FoloToy是敏锐的先行者,凭借几款经典产品在圈内已是风头十足。值得警惕的是,面对拥有更多资金和用户基础的传统厂商,留给它的时间真不多了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/715323.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

简单谈谈云服务器私网IP的存在意义及优势

云服务器是基于虚拟化技术的计算资源,可以在云平台上灵活创建和管理。为了满足不同用户的需求,云服务提供商在云服务器上分配了两种类型的IP地址:公网IP和私网IP。其中,私网IP是指在局域网内使用的内部IP地址,无法通过…

“Dream Machine“震撼登场!免费推出的AI电影级巨制在网络上引爆热潮

"巅峰初现!视频AI新星‘梦幻制造者’华美登场! 在视频生成技术的赛道上,Luma AI昨日骄傲地揭开了其旗舰创新——梦幻制造者(Dream Machine)的神秘面纱,凭借无与伦比的文本到视频及图像到视频转换技术…

ARIMA模型与ARIMA-GARCH模型预测时间序列

上世纪 70 年代初,Ljung 等人提出 ARIMA 模型,又称求和自回归移动平均模型。其思想 是针对于非平稳时间序列进行数学建模,将其通过差分运算后 进行相关数据刻画 ,变为一个平稳的新序列,进而进行相关数据的刻画。 自 1…

[SWPUCTF 2022 新生赛]善哉善哉(隐写,新佛曰,MD5)

题目: 我们看到:题目就是一张图片便联想到隐写术。、 首先查看图片的详细信息我们看到 又看到有关MD5加密。 我们利用小鲨鱼(Stegsolve)破解得到: 小鲨鱼下载可参考:CSDN小鲨鱼下载安装配置 最后面有一段摩斯密码,破…

纯C实现的ymodem库,无额外依赖

本文目录 1、引言2、理论2.1 YMODEM协议的主要特点2.2 YMODEM的工作原理 3、代码3.1 main.cpp3.2 ymodem.c 3.3 ymodem.h 4、验证4.1 ymodem发送4.2 ymodem接收 5、移植说明 文章对应视频教程: 暂无,可以关注我的B站账号等待更新。 点击图片或链接访问我…

会评答辩ppt制作_杰青_长江学者_优青_海外优青_青拔_青年长江学者上会ppt模板

国家杰出青年科学基金 (英文:The National Science Fund for Distinguished Young Scholars,简称:杰青基金),是中国为促进青年科学和技术人才的成长,鼓励海外学者回国工作,加速培养造就一批进入世界科技前沿的优秀学术带头人而特…

【CTF Web】CTFShow 探针泄露 Writeup(PHP+探针泄露+信息收集)

探针泄露 10 对于测试用的探针,使用完毕后要及时删除,可能会造成信息泄露 解法 查看网页源代码。 view-source:https://11170dfe-84c7-4fde-b1ca-5d1ec3dd7570.challenge.ctf.show/没有找到有用的信息。 用 dirsearch 扫描。 dirsearch -u https://1…

【MySQL】(基础篇十三) —— 联结

联结 本文介绍什么是联结,为什么要使用联结,如何编写使用联结的SELECT语句。介绍如何对被联结的表使用表别名和聚集函数。 SQL最强大的功能之一就是能在数据检索查询的执行中联结(join)表。联结是利用SQL的SELECT能执行的最重要…

Python学习笔记10:入门知识(十)

函数 什么是函数 简单来说就是具备某些特定功能的带有名称的代码块。比如之前我们讲过的列表的增删改查函数,排序函数等等。 函数的作用 代码复用。函数作为具备某些特定功能的代码块,当你的程序需要多次使用同一段业务逻辑的时候,使用函…

Vite使用unplugin-auto-import实现vue3中的自动导入

unplugin-auto-import 是基于 unplugin 写的,支持 Vite、Webpack、Rollup、esbuild 多个打包工具。我们可以使用unplugin-auto-import实现依赖的自动导入,不用再频繁导入依赖包,从而提交我们的开发效率。如下,以vue3vite中使用改插…

Linux基础I/O之文件描述符fd 重定向(上)

目录 一、预备知识 二、C语言中的文件接口 三、系统调用中的文件接口 一、预备知识 首先我们要明确的一个观点是 --- 文件 内容 属性。而且我们之前也还将过一个概念,那就是Linux下一切皆文件。 内容是数据,属性也是数据 --- 那么也就是说我…

戴尔第十一代十二代十三代处理器重装系统找不到驱动程序

一、戴尔第十一代十二代十三代处理器重装系统找不到驱动程序 VMD(Volume Management Device)是针对下一代存储推出的部署方案。这套方案支持从 PCIe 总线对 NVMe 固态盘进行热升级和更换,而无需关闭系统,同时标准化 LED 管理可帮助…

梦想编织者Luna:COZE从童话绘本到乐章的奇妙转化

前言 Coze是什么? Coze扣子是字节跳动发布的一款AI聊天机器人构建平台,能够快速创建、调试和优化AI聊天机器人的应用程序。只要你有想法,无需有编程经验,都可以用扣子快速、低门槛搭建专属于你的 Chatbot,并一键发布…

JavaFX 节点

JavaFX Node类javafx.scene.Node是添加到JavaFX 场景图的所有组件 的基类(超类) 。JavaFX Node 类是抽象的,因此你只需将 Node 类的子类添加到场景图中。场景图中的所有 JavaFX Node 实例共享一组由 JavaFX Node 类定义的公共属性。本 JavaFX…

快速搭建Jenkins自动化集成cicd工具

一、简介 jenkins是一款优秀的自动化持续集成运维工具,可以极大的简化运维部署的步骤。 传统的项目部署需要手动更换最新的项目代码,然后打包并运行到服务器上。 使用Jenkins可以自动化实现,当代码编写完成并提交到git后,Jenki…

【单片机毕业设计选题24009】-基于单片机的智能窗帘控制系统设计

系统功能: 采用STM32最小系统板控制,采集传感器数据显示在OLED上并可通过按键或红外遥控器控制两路继电器和步进电机。 1. 使用DHT11模块采集环境温湿度 2. 使用光敏传感器采集光照强度 3. 继电器模拟加温(采集温度小于设定温度时) 4. 继…

定点数的加减法以及浮点数的表示

加减法运算是计算机中最基本的计算,由于减法可以看成是负值是加法,因此计算机中使用补码表示有符号数之后,可以将减法运算和加法运算合并在一起讨论。 1.补码的加减运算 补码加减运算的规则简单,公式如下(设机器字长为n)&#x…

【Windows11 安装 Detectron2】

Windows11 安装 Detectron2 1. 创建虚拟环境2.配置Pytorch环境3. 安装cocoapi4. 下载detectron24.1 修改setup.py4.2 修改 nms_rotated_cuda.cu(detectron2\detectron2\layers\csrc\nms_rotated\nms_rotated_cuda.cu) 5. 开始下载依赖库以及编译环境6.测…

【权威出版/投稿优惠】2024年智慧城市与信息化教育国际会议(SCIE 2024)

2024 International Conference on Smart Cities and Information Education 2024年智慧城市与信息化教育国际会议 【会议信息】 会议简称:SCIE 2024 大会时间:点击查看 大会地点:中国北京 会议官网:www.iacscie.com 会议邮箱&am…