GPT-4o已经发布有段时间了,但大众迟迟没有等到成型的产品出来,这会的功夫,法国创业团队抢先OpenAI发布端到端实时音频模型——Moshi。单从响应时效上,体验下来应该比GPT-4o还要快,但是音色及语言多样性的支持上,还比较弱。
Moshi发布即公开免费使用,打开网站就可以直接进行对话交流。https://moshi.chat/?queue_id=talktomoshi
看看效果截图:
输入自己的邮箱,即可以进入对话通道:
Moshi基本没有延迟,未来也准备开源,简直是为大众谋福利。