OpenAI发布新品GPT-4o,电影《HER》演绎的世界真的来了!

5月14日,OpenAI宣布推出最新旗舰生成式AI模型GPT-4o,它可以实时处理音频、视觉、并对文本进行推理。可以说这是一种全新的交互模式,它完美复刻电影《Her》的世界,标志着人工智能全感知时代的到来。

GpuMall智算云 | 省钱、好用、弹性。租GPU就上GpuMall,面向AI开发者的GPU云平台

发布会结束后,OpenAI首席执行官Sam Altman在社交媒体上发表了一个单词“Her”,寓意着GPT-4o有望让科幻电影中演绎的剧情走入现实。#autodl#恒源云#矩池云#算力云#恒源云 实例迁移#autodl 官网#autodi#GpuMall#GPU云#AutoDL#AotuDL 算力云#GpuMall智算云#AI#大数据#算力租赁#大模型#深度学习#人工智能#算力变现

GPT-4o的“o”代表“omni”,意为全能,是迈向更自然人机交互的一步。与现有模型相比,GPT-4o它在视觉和音频理解方面尤其出色,它可以在短至 232 毫秒的时间内响应音频输入,平均为 320 毫秒,与人类的响应时间相似。

在接入GPT-4o后,ChatGPT可接受输入任意文本、音频和图像的组合,并可输出生成文本、音频和图像的任意组合。借助GPT-4oOpenAI跨文本、视觉和音频,端到端地训练了一个新模型,将所有输入和输出都在该模型中交由同一神经网络进行处理。而在API方面,GPT-4o的价格是GPT-4-turbo的一半,速度是GPT-4-turbo的两倍,限制速率高5倍。

发布会上,OpenAI前沿研究部门主管Mark Chen展示了ChatGPT在接入GPT-4o后的实时语音交互能力,如何识别用户语音中的情绪,以及如何用不同的声音朗读AI生成的故事,包括超级戏剧化的朗诵、机器人音调,甚至唱歌。

除了语音情绪识别功能,GPT-4o还具有实时视觉功能,ChatGPT可以变身真实的老师,通过手机摄像头帮助你实时解题。甚至它还能通过前置摄像头观察用户的表情,分析情绪。

GPT-4o还可帮助充当盲人的“第三只眼”,通过GPT-4o模型实时视觉与语音能力,决策辅助能力等,使得盲人和视力受限用户能够通过语音助手的帮助,实时了解周围的环境,帮助用户做出决策,如识别物品、导航指引等。

与传统的AI相比,GPT-4o看起来像是一个朋友,可以更自然亲切的与用户进行交流,它所提供的“陪伴式情绪价值”将AI虚拟陪伴赛道推向了新的维度。于是,针对同一个问题我们也将GPT-4(左)和GPT-4o(右)进行了对比测试,明显看来GPT-4o提供更富有情绪化。

Sam Altmanblog上发文称:“新的语音和视频模式是我用过的最好的电脑界面。这感觉就像电影里的AI,这让我有些惊讶。达到人类反应时间和表达能力是一个很大的变化。”

大家最关心的是什么时候可以在线体验GPT-4o。现在,进入ChatGPT页面,ChatGPT PlusTeam用户可以抢先体验「最新、最先进的模型」GPT-4o。在未来几周内,GPT-4o将分阶段继承在ChatGPT 在内的OpenAI 各个产品中,并免费提供给所有用户使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/626559.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

swiper 点击事件失效问题

在刚开始使用是 swiper 时,点击事件有时失效,这些个问题的原因是:swiper设置looptrue时,会生成虚拟slide进行填充,对这些虚拟slide元素进行操作是无效的。 简单粗暴的方法就是将 loop 置为 false ....................…

JVM面试题:85道JVM虚拟机面试题及答案

面试题 1 .简述Java堆的结构?什么是堆中的永久代(Perm Gen space)? JVM整体结构及内存模型 试题回答参考思路: 1、堆结构 JVM的堆是运行时数据区,所有类的实例和数组都是在堆上分配内存。它在JVM启动的时候被创建。对象所占的堆内存是由自…

开发测试必须知道的 10种 常见软件架构模式

你是否想知道企业大规模系统是如何设计的? 在软件开发开始之前,我们必须选择一个合适的架构,能提供所需的功能和质量特性。因此,在将架构应用到我们的设计之前,我们应该了解各种不同架构的特点。 01 什么是架构模式 根据维基百…

一文分享:抖音外卖城市合伙人如何申请合作?

在当今数字化时代,外卖和团购业务蓬勃发展,商家们纷纷寻求在多个平台上拓宽销售渠道,以获取更多的订单和利润,这也给创业者提供创来机会。在这其中,抖音外卖作为一股新势力,自然吸引了众多创业者的目光&…

解锁客户需求密码:银行业数据分析在业务决策中的关键作用

一、引言 在数字化和大数据时代的浪潮下,银行业正经历着前所未有的变革。作为数据分析领域的资深专家,我深知数据分析在银行业务发展中的重要性和价值。本文将从银行业数据分析的角度出发,深入探讨相关业务场景下的数据分析应用,…

斥巨资!韩国力撑芯片产业

KlipC报道:韩国为加强本国半导体产业竞争力,将推进一项超过10万亿韩元的支持计划。 大型科技公司微软、亚马逊和谷歌为了保持自己大型语言模型的竞争力,投入了大量的资金,全球对可生成AI应用的需求在不断增长,市场上对…

Vision Mamba 代码调试---Pycharm+AutoDL

《AutoDL使用手册》 1. 服务器租用与配置 先上项目链接: GitHub - hustvl/Vim: Vision Mamba: Efficient Visual Representation Learning with Bidirectional State Space Model 1.1 服务器租用与配置 根据环境要求,去租一个服务器:AutoDL算…

Ajax 学习

文章目录 1. 前置知识1.1 ajax 介绍1.2 XML 简介 2. AJAX 学习2.1 AJAX基础学习(1)AJAX的特点(2)AJAX 初体验(3)服务端响应json 数据 2.2 IE 缓存问题2.3 请求超时和网络异常2.4 手动取消请求2.5 重复请求2…

鸿蒙 DevEcoStudio:用户名密码获取保存

【使用首选项实现用户名密码保存获取】 打开src/main/ets/entryability路径下的EntryAbility.ts文件 在 export default class EntryAbility extends UIAbility {onCreate(want, launchParam) {hilog.info(0x0000, testTag, %{public}s, Ability onCreate);下边添加内容&…

【JVM】调优工具

这里简单介绍一下各种调优用到的工具 一,环境准备 首先我们需要准备好Java环境,和win上的jdk环境(图形化界面如jconsole只有jdk中有)。 有这样一个类Prolem,每个线程都会带来100个垃圾对象,线程new完100…

智慧公厕,提升公共厕所管理效率的信息化变革

现代社会中,公共厕所的管理成为一个不可忽视的问题。随着城市化进程的加快,人们对公厕的需求日益增加,但公厕的管理却面临诸多困难。为了解决这一问题,智慧公厕应运而生,通过信息化的变革,提高公厕的管理效…

QT函数整理

目录 1. 适应高分辨率函数 1. 适应高分辨率函数 自动适应调整设备安装QT的UI分辨率: QCoreApplication::setAttribute(Qt::AA_EnableHighDpiScaling); 加载位置:

第四届辽宁省大学生程序设计竞赛

比赛经历:2024.5.14简单vp了一个小时只写出了签到题4个然后跑路了 补题:感觉其他题有点太抽象了主要补了一题,在区间问题中数据结构的使用 比赛链接[点我即可] 目录 A.欢迎来到辽宁省赛 B.胜率 F.隔板与水槽 H.取石子 L.区间与绝对值 …

第188题|幂级数的展开的常规方法(一)|武忠祥老师每日一题

解题思路:求幂级数有两种方法,一种是直接法,这里显然不太好求,还有一种是利用现有展开式展开,我们看到分母 可以分解因式成(x6)(x-1),进而拆解成一次式。拆解成一次式的目的是为了使用一下两个展开式。 第一步&#xf…

NARUTO 复现记录

1 环境配置 下载项目,一定要 git 下载全项目,下载完后要检查third_parities 里面的coslam和neural_slam_eval 文件全不全。 git clone --recursive https://github.com/oppo-us-research/NARUTO.git 环境配置 注意 bash scripts/installation/conda…

【哔哩哔哩下载】Bilidown,B站下载工具网站,永久免费使用NO.98

本文一共:448 个字,需要阅读:2 分钟,更新时间:2024年5 月14日,部分内容具有时效性,如有失效请留言,阅读量:0 输入B站视频网址就可以下载了 除了可以下载视频,还能获取弹幕、查看封面,如果你想解锁1080P画质,就需要扫码登录。 点击右下角的齿…

python “名称空间和作用域” 以及 “模块的导入和使用”

七、名称空间和作用域 可以简单理解为存放变量名和变量值之间绑定关系的地方。 1、名称空间 在 Python 中有各种各样的名称空间: 全局名称空间:每个程序的主要部分定义了全局的变量名和变量值的对应关系,这样就叫做全局名称空间 局部名称…

0508GoodsContent的Maven项目

0508GoodsContent的Maven项目包-CSDN博客 数据库字段 页面需求

OFDM802.11a的FPGA实现(十五)短训练序列:STS(含Matlab和verilog代码)

原文链接(相关文章合集):OFDM 802.11a的xilinx FPGA实现 1.前言 在之前已经完成了data域数据的处理,在构建整个802.11a OFDM数据帧的时候,还剩下前导码和signal域的数据帧,这两部分的内容。 PLCP的前导部分…

八年前端开发之路中遇到的一些实用技巧分享——代码思路及通用场景

在开发中比较有用的代码思路 1. 链式编程2. 高阶函数应用-(添加数据并提供删除方法)3. 利用Promise链切入(延迟执行)4. 通过中间层来解决问题(装饰者模式)5. 单例模式 1. 链式编程 所谓链式编程即是函数调用后返回对象本身 let …