GPT-4o omni全能 openAI新flagship旗舰模型,可以通过音频、视觉、文本推理。自然人机交互,听懂背景噪音、笑声、歌声或表达情感,也能输出。

新旗舰模型GPT-4o

GPT-4o 是openAI新flagship旗舰模型,可以通过音频、视觉、文本推理reason,也能组合输出text, audio, and image。

接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出的任意组合。
速度快 2 倍,价格减半,速率限制高出 5 倍。GPT-4o 在视觉和音频理解方面尤其出色。

自然人机交互,听懂背景噪音、笑声、歌声或表达情感,也能输出这些。

之前语音交互是语音转文本,文本生成文本,文本生成语音输出。会丢失大量信息。GPT-4o,在文本、视觉和音频上端到端地训练了一个新模型,这意味着所有输入和输出都由同一个神经网络处理。因为 GPT-4o 是我们第一个结合了所有这些模式的模型,所以我们仍然只是在探索该模型可以做什么及其局限性的表面。

能力探索

  1. 视觉叙事 - Robot Writer’s Block
  2. 视觉叙事 - 邮递员莎莉
  3. 电影《侦探》海报创作
  4. 角色设计 - Geary the robot
  5. 诗意的排版与迭代编辑 1
  6. 诗意排版与迭代编辑 2
  7. GPT-4o纪念币设计
  8. 照片到漫画
  9. 文本到字体
  10. 3D 对象合成
  11. 品牌展示位置 - 杯垫上的徽标
  12. 诗意的排版
  13. 多行渲染 - 机器人短信
  14. 与多位发言人的会议记录
  15. 讲座总结
  16. 变量绑定 - 多维数据集堆叠
  17. 具体诗歌

模型评估

GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉能力方面创下了新的高水位线。
在这里插入图片描述
token更少

模型安全性和局限性

新的安全护栏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/624445.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【随笔】Git 高级篇 -- 缓存远端数据命令的参数 git fetch(三十八)

💌 所属专栏:【Git】 😀 作  者:我是夜阑的狗🐶 🚀 个人简介:一个正在努力学技术的CV工程师,专注基础和实战分享 ,欢迎咨询! 💖 欢迎大…

数据可视化(十一):Pandas餐饮信息表分析——交叉表、离群点分析,多维分析等高级操作

Tips:"分享是快乐的源泉💧,在我的博客里,不仅有知识的海洋🌊,还有满满的正能量加持💪,快来和我一起分享这份快乐吧😊! 喜欢我的博客的话,记得…

学习古琴律学的好东西,帮您从基因里学古琴

《从基因里学懂古琴》是一本关于古琴律学的著作,作者通过基因的角度来解读古琴音乐的奥秘和美妙。古琴作为我国传统文化的瑰宝之一,具有悠久的历史和独特的音乐风格,但其律学原理一直以来都是一个谜。本书从基因的角度探讨了古琴音乐的律学特…

postman 使用教程

1. get 请求 ?号后为 get 请求的参数 参数之间用符号"&" 分隔。 假设url 为:http://10.71.7.101/cgi-bin/gw-config.cgi?methodgetway_param&t1715658871647 复制进来到postman的地址栏 后 ?后面的参数会自动添加到参…

服务器利用率的神器脚本

在服务器管理的过程中,了解服务器的各项性能指标是至关重要的。无论是CPU的负载情况,内存使用情况,还是硬盘的存储空间以及TCP连接状态,这些都是我们判断服务器健康状态和性能的重要依据。然而,手动一项项去检查这些指…

OpenAI 深夜发布 GPT-4o,强到让人恐怖,这还是AI?!又一批人将面临失业...

文章首发于公众号:X小鹿AI副业 大家好,我是程序员X小鹿,前互联网大厂程序员,自由职业2年,也一名 AIGC 爱好者,持续分享更多前沿的「AI 工具」和「AI副业玩法」,欢迎一起交流~ 看了 OpenAI 最新的…

祝贺誉天杨峰老师率先通过HCIE-openEuler认证!

热烈祝贺誉天教育杨峰老师4月29日成功通过HCIE-openEuler认证! 杨峰老师HCIE-openEuler证书 作为HCIP-openEuler全国首位通过者,杨峰老师凭借他深厚的专业知识、丰富的实践经验和不懈的努力,成功通过了华为认证的HCIE-openEuler专家级认证&a…

Edge(微软)——一款充满创新精神的浏览器

随着科技的不断进步,互联网浏览器已经成为我们日常生活中不可或缺的工具。在这个领域,微软Edge作为一款新型的浏览器,凭借其独特的功能和优秀的性能,逐渐在市场上占据了一席之地。本文将深入探索微软Edge的特点、优势以及它如何改…

渗透神器:burpsuit教程

前言:释疑解惑 《BP使用教程一》发布后,后台收到了许多小伙伴的私信问BP是怎么汉化的,在这里统一为大家解答一下。 BP的汉化依赖于汉化jar包,在启动时引入汉化包即可,废话不多说,直接上命令: …

富锂锰基材料极具发展潜力 我国产业化进程加速

富锂锰基材料极具发展潜力 我国产业化进程加速 富锂锰基材料以锰元素为主,我国锰资源较丰富,相比于铁锂材料、高镍三元材料,富锂锰基材料具有一定的降本潜力。此外富锂锰基材料在能量密度、充放电倍率等方面也具有明显优势。富锂锰基材料是富…

【计算机毕业设计】ssm框架的购物网站

现代经济快节奏发展以及不断完善升级的信息化技术,让传统 数据信息的管理升级为软件存储,归纳,集中处理数据信息的管理方式。本网上超市系统就是在这样的大环境下诞生,其可以帮助管理者在短时间内处理完毕庞大的数据信息&#xff…

Fortran 最全介绍

省流: Fortran (Formula Translator,“公式翻译器”),由John Backus发明。1954年在纽约正式发布,称为FORTRAN Ⅰ。1957年第一个FORTRAN编译器在IBM704计算机上实现,FORTRAN I在IBM704系统上运行…

nodejs里面的 http 模块介绍和使用

Node.js的HTTP模块是一个核心模块,它提供了很多功能来创建HTTP服务器和发送HTTP请求。 http.Server是一个基于事件的http服务器,内部是由c实现的,接口是由JavaScript封装。 http.request是一个http客户端工具。 用户向服务器发送数据。 创…

泰山众筹:创新电商模式引领共赢新潮流

一、泰山众筹模式创新解读 泰山众筹,这一电商领域的创新模式,通过巧妙地将产品销售与积分众筹相结合,为用户和平台带来了双赢的局面。在泰山众筹模式下,用户购买产品的同时能够积累积分,这些积分可以作为参与众筹的筹…

初探 JUC 并发编程:Java 中的并发队列 ConcurrentLinkedQueue 源码级解析

第七部分:Java 并发包中并发队列解析 7.1)ConcurrentLinkedQueue 原理探究 7.1.1)类图结构 ConcurrentLinkedQueue 底层通过单向链表的方式实现,其中有两个 volatile 类型的 Node 节点用来表示队列的首、尾节点。 public Concu…

市场对节能高效电机需求不断增长 变频器具有广阔发展空间

市场对节能高效电机需求不断增长 变频器具有广阔发展空间 变频器是利用变频技术与微电子技术,通过改变电机工作电源频率方式来控制交流电动机的电力控制设备,主要由制动单元、检测单元、微处理单元等部分构成。变频器能够根据需要调整电机的转速&#xf…

如何基于可靠事件模式实现最终一致性?

今天我们一起来探讨一个分布式环境下的常见问题,这个问题与数据的一致性有关。那么,什么是数据一致性呢?要回答这个问题,需要我们回顾一下单块系统和分布式系统中对于数据处理的不同需求。 我们知道,传统的单块系统通常都只与一个数据库进行交互,所有的数据处理过程都位于…

混淆矩阵实战

2.实战 1.加载数据 #加载数据 import pandas as pd import numpy as np data pd.read_csv(data_class_raw.csv) data.head()2.data.loc得到样本属性,并进行样本数据可视化 #可视化数据 %matplotlib inline from matplotlib import pyplot as plt#define X and y…

政安晨:【Keras机器学习示例演绎】(四十一)—— 使用预先训练的词嵌入

目录 设置 简介 下载新闻组 20 数据 让我们来看看这些数据 清洗数据并将数据分成训练集和验证集 创建词汇索引 加载预训练的词嵌入 建立模型 训练模型 导出端到端模型 政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: TensorFlow与…