向机器人传授人类社会同步的艺术

在数字时代,社交机器人正迅速成为主流社会的一部分,从培训医生和教育儿童到提供谈话疗法和客户服务。现在,这是一个价值数十亿美元的全球产业,对具有类似人类社交智能的机器人的需求不断增长,这标志着我们技术史上的一个重要里程碑。由于人工智能 (AI) 的快速发展,机器人——曾经主要局限于沉闷、肮脏和危险的工作,例如放货架、清洁地板和停用炸弹——现在被提升到加入人类社会世界,为社会带来巨大的变革潜力 (1)。此外,作为人类数字孪生,这种机器人可以作为科学探究的宝贵工具,使研究人员能够模拟、研究和更好地理解复杂的人类社会行为和认知过程(2)。
但是,如果您与社交机器人互动过,您可能很快就会意识到这种潜力的局限性。尽管他们的外表越来越令人印象深刻,但他们的互动往往笨拙、生硬和尴尬。感觉有些不对劲。为什么?一个关键的局限性是,当前的社交机器人缺乏社交同步的艺术,在这种艺术中,点头、微笑、手势和语音都是在对话伙伴之间精心策划的(3)。虽然这种轮流对我们大多数人来说似乎毫不费力,但它是一项高度复杂的技能,涉及快速处理他人的言语、声调、面部表情和手势,并精确计划何时以及如何做出回应(4)。这些复杂的交流动态存在于每一种语言中,包括口语和手语,被广泛认为是成功社交互动的基本“引擎”(5)。因此,对于社交机器人来说,要进行人类的社交互动,这种社交同步技能是必不可少的。然而,与许多其他人类社交行为一样,为社交机器人配备复杂的类人社交智能具有挑战性(6)。
在他们最近的论文中,胡等人(7)通过赋予一个人形社交机器人Emo来讨论社会同步的艺术。Emo 是一款皮肤柔软的拟人化面部机器人,可以使用 26 个磁力控制的面部执行器显示各种细微的面部表情。它的眼眶中还有高分辨率摄像头,可以检测不同类型的面部表情。尽管 Emo 可以模仿它检测到的人类面部表情,但参与社会同步涉及更精细的计划和执行响应。为了实现这一目标,胡及其同事使用神经网络训练Emo,根据人类对话者早期的面部动作预测他们的面部表情。例如,检测到嘴角上扬表明将显示快乐的面部表情。Emo 的预测能力使其能够计划和执行自己的面部表情作为响应,从而实现更像人类的社交同步。胡及其同事还升级了Emo的处理能力,使其在轻量级计算设施上运行,从而释放了处理能力,用于开发其他功能,如语音和听力。
使用这种简单而优雅的方法,胡及其同事将Emo的社交互动技能从单纯的模仿(图1A)提升到社交同步的艺术(图1B)。这样的发展对社交机器人的未来有着深远的影响。例如,即使在这种仅基于面部表情的新生形式中,这些轮流技能也可以从根本上改善人机交互中的信任和融洽关系,使社交机器人更接近发挥其潜力。重要的是,Emo新技能的成功将取决于其人类对话伙伴对它们的看法。这些新技能是否改善了与人类用户的社交交流,产生了信任和同理心?还是有些东西还没关?如果是这样,它是什么?鉴于 Emo 的面部表情可以精确控制,解决这个问题的一个富有成效的方法是使用来自人类行为科学的数据驱动的社会心理物理学方法 (8)。具体来说,Emo表情的不同特征,例如它们开始的确切时间或特定的面部运动成分,将被实验操纵,以测试它们如何影响人类用户行为,例如参与者对Emo的信任或参与程度。通过确定促进或阻碍人类用户参与的特定功能,这些反馈可用于提高 Emo 的一般用途和定制应用(包括跨文化互动)的社交沟通技巧 (9),从而提高其实用性、可访问性和适销性 (10)。
在这里插入图片描述

图 1.机器人与人类互动中的面部表情模仿与面部表情社交同步。
(A)在面部表情模仿中,社交机器人复制人类的面部表情,这不可避免地涉及明显的延迟和随后的异步。例如,在时间点 3 时,当人类展示他们的面部表情时,机器人保持中立,从而在机器人和人类之间产生不匹配。(B)在面部表情社会同步中,机器人可以从早期的面部动作中预测人类的面部表情(见时间点2)。这使机器人能够将其面部表情与人类的面部表情同步。例如,在时间点 3,机器人和人类同时显示相同的面部表情。信用:改编自胡等人。(7)
最后,人类的社交互动本质上是多模态的,涉及视觉和听觉信号的复杂组合,如点头、“嗯”和“啊”、扬起眉毛、回避目光、长时间眨眼和手势。在这里,胡及其同事专注于单一模式 - 面部表情 - 但他们的结果为开发具有更复杂多模态信号的社交同步技能铺平了道路。这样的壮举,虽然是一个复杂的跨学科努力,但可以真正使社交机器人加入人类的社会世界。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/500210.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

CavalierContours 二维线操作

CavalierContours 二维线操作 2D polyline library for offsetting, combining, etc. 用于偏移、交并补等组合等操作的 2D 多折段线库。 Polyline Structure 多段线结构 Polylines are defined by a sequence of vertexes and a bool indicating whether the polyline is cl…

深度学习入门简单实现一个神经网络

实现一个三层神经网络 引言测试数据 代码 引言 今天我们实现一个简单的神经网络 俩个输入神经元 隐藏层两个神经元 一个输出神经元 激活函数我们使用sigmoid 优化方法使用梯度下降 我们前期准备是需要把这些神经元的关系理清楚 x1:第一个输入 x2:第二个…

Linux系统----------探索mysql数据库MHA高可用

目录 一、MHA概述 1.1 什么是 MHA 1.2MHA 的组成 1.2.1MHA Node(数据节点) 1.2.2MHA Manager(管理节点) 1.3MHA 的特点 1.4MHA工作原理 1.5数据同步的方式 1.5.1同步复制 1.5.2异步复制 1.5.3半同步复制 二、搭建 MySQ…

8.6 循环神经网络的简洁实现

每个步长共用参数 加载数据 虽然 8.5节 对了解循环神经网络的实现方式具有指导意义,但并不方便。 本节将展示如何使用深度学习框架的高级API提供的函数更有效地实现相同的语言模型。 我们仍然从读取时光机器数据集开始。 import torch from torch import nn from…

华为流量整形配置

组网需求 如图1所示,企业网内部LAN侧的语音、视频和数据业务通过Switch连接到RouterA的Eth2/0/0上,并通过RouterA的GE3/0/0连接到WAN侧网络。 不同业务的报文在LAN侧使用802.1p优先级进行标识,在RouterA上根据报文的802.1p优先级入队列&…

Flutter环境搭建及版本管理

前言 Flutter已成为移动应用开发的主流选择,其跨平台优势日益凸显,使学习Flutter成为现代开发者的必备技能。越来越多的公司和团队选择Flutter构建应用,这为开发者提供了更广阔的就业机会和职业发展空间。Flutter的热度源自其强大的特性和生…

【动手学深度学习-pytorch】-9.3深度循环神经网络

到目前为止,我们只讨论了具有一个单向隐藏层的循环神经网络。 其中,隐变量和观测值与具体的函数形式的交互方式是相当随意的。 只要交互类型建模具有足够的灵活性,这就不是一个大问题。 然而,对一个单层来说,这可能具有…

WebCopilot:一款功能强大的子域名枚举和安全漏洞扫描工具

关于WebCopilot WebCopilot是一款功能强大的子域名枚举和安全漏洞扫描工具,该工具能够枚举目标域名下的子域名,并使用不同的开源工具检测目标存在的安全漏洞。 工具运行机制 WebCopilot首先会使用assetsfinder、submaster、subfinder、accumt、finddom…

layui laydate日期初始化的一些坑

layui laydate日期初始化的一些坑 背景坑一:利用class属性初始化时间控件失败坑二:后加载页面时间控件初始化失败坑三:结束时间需要默认追加23:59:59 背景 在日常开发中,总是会不可避免的用到日期插件,不同的日期插件…

IoT网关在智能制造工厂生产线监控与管理中的应用-天拓四方

随着工业4.0时代的到来,智能制造已成为工业发展的重要方向。IoT网关在智能制造工厂中扮演着关键角色,它能够实现设备间的互联互通、数据的实时采集与处理,以及生产线的智能监控与管理。本案例将详细介绍IoT网关在智能制造工厂生产线监控与管理…

100 个 Kotlin 面试问题及答案(其二)

尤其是在Android开发中,Kotlin已经成为一种流行的编程语言。为了帮助您在 Kotlin 面试中取得成功,我们为您简化了 100 个最常见的面试问题。本指南涵盖了广泛的主题,包括基本语言概念和高级功能。每个问题都附有简单的答案和实际示例&#xf…

Spring原理

这次我们来研究Bean的相关知识和spring boot自动配置的相关流程 1.Bean的作用域 1概念 在SpringIoC&DI阶段,我们学习了Spring是如何帮助我们管理对象的. 1. 通过 Controller ,Service , Repository , Component , Configuration , Bean 来声明…

Android R 广播注册与发送流程分析

静态广播注册时序图 动态广播注册时序图 发送广播时序图 前言 广播接收器可以分为动态和静态,静态广播接收器就是在 AndroidManifest.xml 中注册的,而动态的广播接收器是在代码中通过 Context#registerReceiver() 注册的。 这里先从静态广播的流程开始…

Pygame基础6-旋转

6-旋转 当我们想要旋转一个图片的时候, 我们可以使用pygame.transform.rotozoom获得旋转后的图片: kitten pygame.transform.rotozoom(kitten, angle, 1)问题是,每次旋转都会降低图片的质量。如果旋转很多次后,图片的质量会变得…

农村集中式生活污水分质处理及循环利用技术指南

立项单位:生态环境部土壤与农业农村生态环境监管技术中心、山东文远环保科技股份有限公司、北京易境创联环保有限公司、中国环境科学研究院、广东省环境科学研究院、中铁第五勘察设计院集团有限公司、中华环保联合会水环境治理专业委员会 本文件规定了集中式村镇生活…

【动手学深度学习-pytorch】9.2长短期记忆网络(LSTM)

长期以来,隐变量模型存在着长期信息保存和短期输入缺失的问题。 解决这一问题的最早方法之一是长短期存储器(long short-term memory,LSTM) (Hochreiter and Schmidhuber, 1997)。 它有许多与门控循环单元( 9.1节&…

婚恋交友APP小程序H5源码交付-支持二开!实名制交友,可服务器审核,亦可后台自己审核!同城交友,多人语音!

一、需求分析 在征婚交友网站开发初期,需求分析是至关重要的环节。这需要深入了解目标用户的需求和期望,包括他们的年龄、职业、兴趣爱好、交友条件等方面。通过收集和分析这些信息,开发团队可以明确网站的目标用户,并为他们提供…

东特科技现已加入2024第13届国际生物发酵产品与技术装备展

参展企业介绍 温州东特科技有限公司是一家集设计、生产、销售及服务为一体的卫生级流体设备企业。专业从事各种乳食品、制药、化工、啤酒设备、不锈钢卫生级阀门,管件,视镜,及非标配件定制等产品的销售与服务。先进的设计理念专业的技术优势一…

深度思考:雪花算法snowflake分布式id生成原理详解

雪花算法snowflake是一种优秀的分布式ID生成方案,其优点突出:它能生成全局唯一且递增的ID,确保了数据的一致性和准确性;同时,该算法灵活性强,可自定义各部分bit位,满足不同业务场景的需求&#…

使用html实现图片相册展示设计

<!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>图片&#xff08;相册&#xff09;展示设计</title><link rel"stylesheet" href"./style.css"> </head> <b…