OpenAI ChatGPT 高级语音模式已登陆 Windows 和 Mac 平台,对话更自然,拟态更逼真
OpenAI 于10月31日正式宣布,ChatGPT 的高级语音模式(Advanced Voice Mode,简称 AVM)现已登陆 Windows 和 Mac 平台。基于最先进的 GPT-4o 模型,提供了更自然、实时的对话体验。
AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。OpenAI 表示,AVM 提供了更自然、实时的对话体验,能够实时感知和回应用户的情绪。
然而,这一备受期待的功能在今年 7 月首次向测试用户开放,9 月底向付费订阅用户推出。OpenAI 在 10 月的一条推文中透露,免费用户也将有机会体验 AVM,而欧盟地区的 Plus 和 Free 用户则需要耐心等待。
就在一天前,OpenAI 还宣布了另一项新功能:ChatGPT 网页版聊天历史搜索。用户现在可以快速、轻松地调出聊天记录以供参考,或者从上次中断的地方继续聊天。
高级语音模式的主要特点
- 自然对话体验:AVM 允许用户像与真人对话一样与 ChatGPT 进行交流,包括打断、停顿等自然语言行为。
- 实时感知和回应用户情绪:通过情绪感知,AVM 能够提供更个性化的交互体验。
- 多样化的声音选择:新增五种声音,总数达到九种,突出“自然互动”体验。
- 自定义互动和记忆功能:用户可以定制语音交互方式,AVM 具备上下文联想能力,自动调用之前的对话记录。
对不同用户群体的影响
- Plus和Team用户:已优先获得聊天历史搜索功能和高级语音功能。
- Enterprise和Edu用户:将在一周内获得访问权限。
- 免费用户:将在下个月陆续获得访问权限。
应用前景
高级语音模式的加入,让 ChatGPT 不仅仅是一个文本交互的工具,更是一个能够进行深度语音交流的伙伴。这种交互方式更加自然和直观,尤其适用于那些需要快速输入和获取信息的场景,如驾驶时通过语音指令获取导航信息或回复紧急消息。
OpenAI ChatGPT 高级语音模式的推出,标志着 AI 语音交互技术的一个重要进步,为用户提供了更加丰富和自然的交互体验。