大模型重塑车载语音交互:赛道巨头如何引领新周期?

车载语音交互赛道正进入新一轮竞争周期。

高工智能汽车注意到,传统车载语音交互赛道当前基本已进入成熟期,主要为任务型助手,包括从单轮对话到多轮对话,单音区到多音区,从单一的导航、多媒体娱乐等座舱功能扩展智能驾驶、车身控制等,用户体验逐步面临天花板,缺乏实质性突破。

2023年,经由ChatGPT引爆后,大模型技术崛起(深度学习从原来基于规则驱动的专家模型,转为基于数据驱动),本身即位于深度学习赛道的车载语音交互,迎来新一轮发展周期,向AI虚拟副驾驶/沉浸式驾驶伴侣迈进。且,车载语音交互,被认为是大模型上车的首选赛道。

赛轮思正加码布局。一般而言,算力、数据是大模型竞争的底层基座,具体应用和产生的价值是实现商业化破局的核心,作为全球车载语音交互赛道的巨头,赛轮思正给出自己的赛道突围方式。

2023年12月19日,赛轮思宣布推出由英伟达技术驱动、具有开创性的汽车级大型语言模型CaLLM™(Cerence Automotive Large Language Model),为主机厂当前面临的多个关键挑战提供解决方案:通过与现有嵌入式系统和新生成式AI功能的云集成,部署新的用户体验,加速产品上市周期。

此次合作,英伟达无疑可解决算力的问题,CaLLM™可解决应用与算法的问题。在赛轮思看来,作为全球第一个车载级、专注于车与人机交互的LLM,其核心优势为依赖赛轮思车载智能助手广泛部署以及在车载人机交互领域深入的经验,打造的可深度定制的跨语言跨平台的端云一体的车载智能助手解决方案。

“通过NVIDIA 业界领先的AI框架和平台相配合,结合我们独有的数据集、与汽车制造商的深厚关系以及广泛的市场渗透率,使我们处于领先的位置,更好的发挥开创性、汽车级的LLM、CaLLM™和自研的车载计算平台的优势。” 赛轮思首席技术官 Iqbal Arshad表示。

图片

01

联手英伟达打造汽车级LLM平台

赛道发生剧变之时,往往也意味着巨大的机会窗口。

在赛轮思看来,车载语音交互赛道正面临“从以性能指标为优先,提升为是否可深度定制、是否能快速部署、是否能提供极致的人机交互体验全方位的竞争。大模型(特别是适用于车载领域的大模型),是未来人车交互系统的核心竞争力,这也是赛轮思聚焦的方向”。

“CaLLM™是赛轮思全新车载计算平台的基础,该平台是车载交互的未来”,赛轮思称。

据介绍,传统车载语音解决方案需要多步骤交互作为不同的独立步骤进行,从而导致过多的手动交互并给驾驶者带来很高的认知负担,赛轮思的新平台将用户所有种类的交互整合到一个无缝、直观的对话界面中,帮助主机厂将现有的应用平稳过渡到一个更直接的对话界面,并为用户提供生成式AI驱动的新服务。

其进一步表示,CaLLM™能够支持汽车功能、特性和要求,并可以通过训练、微调和专属的应用,为汽车制造商进行深度定制。此外,它还可以为用户提供个性化以及本地信息检索,例如Cerence Car Knowledge生成式AI应用。

在NVIDIA DRIVE 上运行的CaLLM™,是赛轮思新一代车载计算平台的基础。随着汽车制造商和移动出行OEM应用生成式AI和 LLM以提升用户体验,CaLLM™满足了用户多项关键需求,并拥有独特的汽车级智能答问能力。

一般而言,算力、数据是大模型竞争的核心竞争要素,赛轮思如何破局?

具体来看,CaLLM™尝试集合赛轮思和英伟达两大细分赛道巨头的优势。在算力平台方面,赛轮思利用NVIDIA AI Foundation构建CaLLM™,其中包括NVIDIA AI Foundation Models、 NVIDIA AI Enterprise软件和NVIDIA加速计算。

操作上,其一,赛轮思将首先利用NVIDA DGX Cloud和 NVIDIA DGX系统在其广泛的数据集上训练CaLLM™,然后开发车载用户体验所需的功能;

其二,为了实现响应极快的用户体验,赛轮思将通过NVIDIA AI Enterprise在NVIDIA加速基础设施中部署 CaLLM™,这是一个端到端、云原生、安全的软件平台,可通过NVIDIA NeMo 框架和NVIDIA TensorRT-LLM 优化库,加速对LLM 的训练、微调和推理。

“通过英伟达在云计算和边缘技术方面的核心专长,赛轮思可以在其车载用户体验平台中更快速地训练、扩展和部署这些模型,从而实现更安全、更智能、更愉悦的驾乘体验。” NVIDIA汽车事业部副总裁Ali Kani表示。

数据方面,得益于近25年在汽车行业的深厚积累,赛轮思拥有经过微调、不断增长的、包含数十亿个token的汽车数据集。据悉,其提供的集成车载用户体验,远远超越一般通用LLM。

02

迈向车载语音交互2.0

事实上,赛轮思探索下一代车载语音交互已久。

回溯来看,作为细分赛道的巨头,赛轮思始终致力于车载语音交互的创新和落地。从结果层面,根据赛轮思对外释放的信息,凭借先进的AI技术和全球语言支持,其与全球80多个汽车制造商和一级供应商合作。近5亿辆在道路上行驶的汽车使用了Cerence技术,占全球汽车产量约53%。

产品层面,基于Cerence Assistant,2021年11月,赛轮思即推出Cerence Co-Pilot,核心是主动AI,突破传统基于唤醒词的被动式交互,利用实时数据、内置智能、用户偏好和车辆传感器信息实现一系列创新功能;下一代Cerence Companion,则将实现人机交互新突破,实现多模态、多感官交互。

2022年11月,Open AI发布ChatGPT3.5,2个月时间月活用户突破1亿,引发了贯穿2023年的大模型热潮,车载语音交互赛道玩家纷纷入局。同样在2022年11月,赛轮思发布了“Destination Next” 新战略,欲通过AI驱动的产品,为驾驶者带来更多创新的沉浸式多模态交互体验。

赛轮思首席执行官Stefan Ortmanns 博士在2023年中发表观点称,车载语音正处在“从典型的出行助理解决方案到沉浸式伴侣体验”的过程中,其中离不开 AI 的驱动,而这个过程中间阶段就是虚拟副驾驶 (Co-Pilot)阶段。显然,此次CaLLM™的发布,意味着赛轮思在赛道探索上又迈出实质性一步。

高工智能汽车注意到,作为细分赛道的国际巨头,本地化布局至关重要。

具体来看,赛轮思在持续就加强中国市场的布局。根据赛轮思披露的信息,其全球员工超过1700名,中国总部设于上海,有近500名员工,其中技术研发的占大部分,3个主要的研发基地分别设于上海、成都和北京,包括设于上海的世界级别设计和研发中心,还有6个主要的工程服务中心。

根据介绍,赛轮思在华市场拥有完整的产品、研发、工程、销售和专业服务能力。值得一提的是,Cerence Assistant以及Cerence Co-Pilot都是由中国研发团队负责开发,成果与全球共享,同时参与声学模型和语言模型的建模等,包括策略地利用生成式人工智能和大型语言模型LLMs以及类似ChatGPT的技术。

“中国是赛轮思最重要的战略市场之一,对中国市场的重视、以及对高速增长的中国汽车市场充满信心。未来我们将继续加大对本地客户的支持力度,竭诚为我们的客户提供更好的服务。” 2023年6月,赛轮思首席执行官Stefan Ortmanns 博士再度访华时称。

尤为值得注意的是,赛轮思在赋能车企出海方面的突出优势。

事实上,伴随电动化、智能化浪潮,国内车企正强势突围,出海成为横亘在进一步发展面前的一道必答题,由于世界各地的驾驶者的语言、用车理念各异,车企出海的长期战略,也需要针对不同市场需求开发符合当地用户使用习惯的车载功能和应用。

赛轮思可帮助车企解决这一痛点。作为细分赛道的国际巨头,赛轮思在全球有24个办事处, 在中国、加拿大、欧洲和印度设立了主要的研发中心。具体业务上,在全球语言方面,赛轮思的优势更为明显,目前可以提供34种 “全栈式”语言 、65 种TTS和110种文本IO支持,。

对于车企客户而言,赛轮思拥有丰富的经验、强大的专业服务团队和第三方整合资源,只需要较短的开发周期,通过可扩展的AI核心产品架构,全面满足OEM在集成最新的AI技术、升级嵌入式和云技术的需求,打造品牌的差异化,并大大缩短新产品上市时间。

值得一提的是,基于遍布全球的业务,赛轮思在提供跨越语言、文化和地域的解决方案同时, 还为车企的出口市场提供深入的本地化专业知识,对于国内车企制定扩展海外市场的策略上别具意义,其产品和解决方案均符合欧洲GDPR《通用数据保护条例》标准,并在全球范围内密切关注政府法规。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/359565.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

钢材表面缺陷YOLOV8,OPENCV调用

【免费】钢材表面缺陷YOLOV8资源-CSDN文库 钢材表面缺陷YOLOV8NANO,训练得到PT模型,然后转换成ONNX,OPENCV的DNN调用,支持C,PYTHON,ANDROID

VScode中使用Xdebug调试PHP

君衍. 一、下载VScode与PHPstudy二、配置PHP环境变量三、PHPstudy中启用xdebug扩展四、打开php.ini,修改配置五、修改vscode配置六、VScode安装相关插件七、配置launch.json八、设置断点,开始调试 一、下载VScode与PHPstudy 首先我们自然是需要搭建环境…

C++ 数论相关题目 博弈论 Nim游戏

给定 n 堆石子,两位玩家轮流操作,每次操作可以从任意一堆石子中拿走任意数量的石子(可以拿完,但不能不拿),最后无法进行操作的人视为失败。 问如果两人都采用最优策略,先手是否必胜。 输入格式…

《统计学习方法:李航》笔记 从原理到实现(基于python)-- 第5章 决策树(代码python实践)

文章目录 第5章 决策树—python 实践书上题目5.1利用ID3算法生成决策树,例5.3scikit-learn实例 《统计学习方法:李航》笔记 从原理到实现(基于python)-- 第5章 决策树 第5章 决策树—python 实践 import numpy as np import pand…

Docusaurus 文档侧边栏增加 New 标识

在使用 Docusaurus 搭建文档站点的时候,我们经常要给某个侧边栏菜单增加一些醒目的标识,比如针对新创建的文档给它一个 New 的标识, 以提醒过来看文档的用户这是一个新增加项或者新特性(阅读的时候不要遗漏)。 然而这个…

C#: form 添加窗体最小化事件,添加系统托盘图标,点击后可以打开、最小软件窗口

说明: 1.实现窗体在最小化后触发一个事件,可以去实现需要的功能。 2.最小化后软件图标出现在系统右下角的托盘串口。 3.点击托盘口的图标可以实现软件弹出窗口和最小化的切换。 1.参考办法 以下是判断C#窗体最小化到状态栏的状态的方法:…

[AI]文心一言爆火的同时,ChatGPT带来了这么多的开源项目你了解吗

前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家:https://www.captainbed.cn/z ChatGPT体验地址 文章目录 前言4.5key价格泄漏ChatGPT4.0使用地址ChatGPT正确打开方式最新功能语音助手存档…

Redis核心技术与实战【学习笔记】 - 7.Redis GEO类型 - 面向 LBS 应用的数据类型

前言 前面,介绍了 Redis 的 5 大基本数据类型:String、List、Hash、Set、Sorted Set,它们可以满足绝大多数的数据存储需求,但是在面对海里数据统计时,它们的内存开销很大。所以对于一些特殊的场景,它们是无…

计算机网络-物理层设备(中继器 集线器)

文章目录 中继器中继器的功能再生数字信号和再生模拟信号同一个协议 集线器(多口中继器)不具备定向传输的原因集线器是共享式设备的原因集线器的所有接口都处于同一个碰撞域(冲突域)内的原因 小结 中继器 中继器的功能 中继器的…

JVM 内存模型

1 什么是 JVM 内存模型 JVM 需要使用计算机的内存,Java 程序运行中所处理的对象或者算法都会使用 JVM 的内 存空间,JVM 将内存区划分为 5 块,这样的结构称之为 JVM 内存模型。 2 JVM 为什么进行内存区域划分 随着对象数量的增加&#xff…

基于二值化图像转GCode的单向扫描实现

基于二值化图像转GCode的单向扫描实现 什么是单向扫描单向扫描代码示例 基于二值化图像转GCode的单向扫描实现 什么是单向扫描 在激光雕刻中,单向扫描(Unidirectional Scanning)是一种雕刻技术,其中激光头只在一个方向上移动&a…

【Vue】二、Vue 组件展示控制的优雅解决方案

vue项目中展示的组件,我平常都是通过v-show进行展示控制,类似这样 通常情况下,一个正常展示组件的流程,是通过前端用户点击触发函数,在函数中对data数据进行操作,从而展示不同的页面 showWork: false, sho…

如何用Docker+jenkins 运行 python 自动化?

1.在 Linux 服务器安装 docker 2.创建 jenkins 容器 3.根据自动化项目依赖包构建 python 镜像(构建自动化 python 环境) 4.运行新的 python 容器,执行 jenkins 从仓库中拉下来的自动化项目 5.执行完成之后删除容器 前言 环境准备 Linux 服务器一台(我的是 CentOS7)…

GitHub工作流的使用笔记

文章目录 前言1. 怎么用2. 怎么写前端案例1:自动打包到新分支前端案例2:自动打包推送到gitee的build分支案例3:暂时略 前言 有些东西真的就是要不断的试错不断地试错才能摸索到一点点,就是摸索到凌晨两三点第二天要8点起床感觉要…

通过例子说明-动态规划

选择>行动>思考,好像是个死循环 -song。 动态规划(Dynamic Programming,简称DP)是一种解决问题的数学优化方法,通常用于解决具有重叠子问题和最优子结构性质的问题。它的基本思想是将问题拆分成小的子问题&#…

革新性技术:基于搜索操作的存内计算

文章目录 革新性技术:基于搜索操作的存内计算CSDN首个存内计算开发者社区NVALT:近似查找表的艺术MAP:存内计算的未来SQL-PIM:数据库的未来内存计算架构与技术小结从NVALT到NVQuery:存内计算的探索与前景NVQuery&#x…

242. 有效的字母异位词(力扣)(C语言题解)

✨欢迎来到脑子不好的小菜鸟的文章✨ 🎈创作不易,麻烦点点赞哦🎈 所属专栏:刷题 我的主页:脑子不好的小菜鸟 文章特点:关键点和步骤讲解放在 代码相应位置 题目链接: 242. 有效的字母异位词 …

UE5 C++ 读取本地图片并赋值到UI上

目录 结果图 节点样式 主要代码 调试代码 结果图 节点样式 主要代码 (注释纯属个人理解,可能存在错误) // Fill out your copyright notice in the Description page of Project Settings.#pragma once#include "CoreMinimal.h&q…

Mysql进阶篇

1.Mysql服务架构 连接层: 处理客户端连接请求,对用户进行认证 服务层: 可以接收sql,调用存储过程,优化sql,缓存数据.... 引擎层: 负责实际与文件层进行交互操作的,可以有不同的引擎选择. 物理文件层: 存储表数据 以及 各种日志文件. 2.Mysql引擎 存储引擎就是存储数据&…

TSINGSEE青犀视频智慧电梯管理平台,执行精准管理、提升乘梯安全

一、方案背景 随着城市化进程的不断加快,我国已经成为全球最大的电梯生产和消费市场,电梯也成为人们日常生活中不可或缺的一部分。随着电梯数量的激增,电梯老龄化,维保数据不透明,物业管理成本高,政府监管…