今天分享的是AI大模型系列深度研究报告:《AI大模型专题:大模型赋能座舱,智能座舱新战场》。
(报告出品方:国泰君安证券)
报告共计:19页
大模型技术将给予智能座舱一次深度进化
拥抱大模型技术是智能汽车行业全面且快速形成的共识。现象级大模型 产品 ChatGPT 问世以来受到各行各业广泛关注,产业迅猛发展,正引领 一次新的产业革命。当下汽车行业也正积极布局、拥抱大模型:无论是 百度、商汤等人工智能龙头公司旗下大模型与众多车企官宣合作,还是 蔚来、理想、小鹏等智能汽车头部车企公开自研大模型计划,或是华为等科技巨头宣布将在其汽车问界 M9 上接入盘古大模型,大模型技术正 加速向中国智能汽车行业渗透。
智能座舱将是大模型上车的良好切入点。当前智能座舱作为一个高度自 动化和信息化的环境,存在大量可挖掘利用的数据信息和服务场景,是智能汽车技术革新和竞争的核心领域之一。而大模型背后强大计算处理 能力、生成和多模态交互能力可带给智能座舱更高的智能化水平、更丰富的交互能力,从而提升智能座舱的安全性、效率、用户体验和商业化 潜力。大模型接入智能座舱将从语音识别、多模态交互、定制化服务以 及更多智能应用和娱乐功能场景等多个方面赋能,让智能汽车提供更贴 近消费者需求的体验服务,将汽车智能化向更高发展层次推进。
大模型提供识别更精准、理解力更强大的车载语音助手
众多车企依托语音识别技术,实现大模型上车。由于大模型产品如 ChatGPT 具有明显的对话功能与辅助属性,与智能座舱中的语音助手模 块有高度的适配性。因此众多车企率先从语音助手模块突破,结合大模 型技术,实现智能座舱更准确、强大、丰富的语音助手能力。
首先,大模型能够提供更准确、更流畅的语音识别功能。通过深度 学习和自然语言处理技术,大型模型能够更好地理解和解析用户的 语音指令,提供更高质量的语音识别结果;
其次,大模型具有更丰富的知识储备、更强大的语义理解能力。车 载语音助手可以通过大模型学习用户的语言习惯、上下文信息以及 个性化需求,更好地理解用户的意图和需求,做出更智能、更准确的回应。理想汽车的 Mind GPT 自带记忆网络,可以实现让车载 AI 助手“理想同学”能基于历史对话记住个性化偏好和习惯;
此外,通过模拟人类的语言表达方式和情感,大模型可以使车载语 音助手更加自然、亲切。大模型能够更加自由流畅的对话,提供更 好的用户体验。更关键的是,通过大模型赋能,车载语音助手可以 成为大模型上车的窗口,与用户频繁使用的不同用车场景结合,探 索更多的可能性。
大模型给予智能座舱深度的多模态交互
多模态的大模型技术可以综合处理语音、视觉、触觉等多种类型的数据, 进一步提升汽车领域智能座舱的应用。
在语音识别与自然语言处理方面,大模型可以提供更精准的语音识别功能,深度理解并解析驾驶者的语音指令,将驾驶者的语音指令 转换为文字数据,实现智能的语音交互。
在视觉识别与图像处理领域,大模型可以通过深度学习和计算机视觉技术,对座舱内的图像数据进行分析和处理,识别驾驶者的面部 表情、手势动作等非语言交互信号,并将其转化为相应的指令和反馈。
在触觉感知与反馈方面,大模型可以通过分析座椅传感器数据、振动信号等触觉感知信息,进一步增强座椅的响应能力。例如,根据 驾驶者的体态和行为,智能调节座椅的支撑力和按摩力度,提供更 舒适的驾驶体验。
多模态的大模型技术把舱内外各种不同类型的传感器融合,将不同类型 数据处理分析并综合,全方位地感知乘客和驾驶员的需求,提供专业化 的服务。2023 年 12 月理想汽车发布的 OTA 5.0 通过覆盖全车多音区的 数字硅麦、3D ToF 摄像头、IR 传感器,以及基于空间多模态感知 3M 技 术,“理想同学”可以充分感知舱内空间的多模态信息。例如,当驾驶员 说话的时候,理想汽车将同时进行语音和图像的识别,通过驾驶员头部 向右偏转的角度,判断驾驶员的说话对象是车载语音助手还是副驾驶乘 客,进而做出反馈。将来车内大模型将无处不在,大模型将推进智能座 舱多模态的交互能力,形成极致的用户交互体验,提升驾驶体验感与安全性。
报告共计:19页