OpenAI最新发布的文生视频模型Sora到底强在哪?

文章目录

    • 1.Sora到底强在哪?
    • 2. 不足
    • 3. 结尾

在这里插入图片描述
2024年2月16日,当大家沉浸在过年的喜庆氛围中,OpenAI发布首款文生成视频大模型 Sora ,其炸裂登场让人感到惊艳。

Sora官网介绍:https://openai.com/sora
在这里插入图片描述

说起文生视频工具,比如Runway、Pika,用户输入文字就能得到一段几秒到十几秒的视频内容,但因为效果一般,并未被广泛使用。

1.Sora到底强在哪?

此次Sora能够爆火出圈,实在是因为它过于优秀。同样是用户输入提示文字,Sora生产的视频不仅质量高,场景还很逼真丝滑、细节丰富。

其一,Sora可生成60s超长视频。相较于Runway MLGen-2、Pika等文生视频大模型,Sora可生成一镜到底的逻辑顺畅视频,主人物及背景人物均非常稳定,文生视频大模型能力突出。

其二,Sora多角度视频一致性。Sora可以在单个生成视频中创建多个镜头,以准确保留角色和视觉风格。OpenAI官网发布的Demo视频中,有多角度镜头,且主人物保持了完美的一致性。

其三,Sora在尝试理解物理世界。根据OpenAI官网披露,Sora不仅可以理解用户的描述要求,同时亦尝试理解描述的事物在物理世界中的存在方式(即物理规律)。根据OpenAI官网Demo视频中,汽车在山路行驶中的颠簸等动作符合物理世界规律,视频逼真程度进一步提升。
Sora可以用简单的方式模拟影响世界状态的行为。例如,随着时间的推移画家可以在画布上留下新的笔触,或者一个人吃汉堡时留下咬痕。

其四,图像生成功能。Sora还能生成图像,通过在一个时间范围为一帧的空间网格中排列高斯噪声块来实现这一点。该模型可以生成可变大小的图像,最高可达2048 × 2048分辨率。

其五,模拟数字世界。Sora还能够模拟人工过程,比如视频游戏。Sora可以在高保真度渲染世界及其动态的同时,用基本策略控制《我的世界》中的玩家。

2. 不足

Sora官方也指出自己的模型存在的不足和局限性

它不能准确地模拟许多基本相互作用的物理过程,比如玻璃破碎。

可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。例如,一个人可能会咬一口饼干,但之后,饼干可能没有咬痕。

还会混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的摄像机轨迹。

3. 结尾

从Runway MLGen-2、Pika到Sora,文生视频大模型频出,视频长度从3~4秒到60秒,模型对物理世界的理解愈加接近现实,已经具备商业化落地价值,创作内容产业革命来临,AIGC新时代已至。

这意味着什么?以后哪怕普通人,只要具有丰富的想象力,能够将脑海里的画面准确地描述出来,那么就能生成相应的画面视频,甚至是独立创作出一部电影。想想都很震撼!!!
在这里插入图片描述

每次技术的革新,总是惊喜与恐惧并存

恐慌无用的话,不如尽力拥抱

”与时俱进“不应该是一句口号,”拥抱变化“也不应该是一句鸡汤

你可以不屠龙,但不能不磨刀。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/416520.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

openGauss学习笔记-230 openGauss性能调优-系统调优-配置并行查询功能

文章目录 openGauss学习笔记-230 openGauss性能调优-系统调优-配置并行查询功能230.1 适用场景与限制230.2 资源对SMP性能的影响230.3 其他因素对SMP性能的影响230.4 配置步骤 openGauss学习笔记-230 openGauss性能调优-系统调优-配置并行查询功能 openGauss的SMP并行技术是一…

使用面向对象思想去封装实现canvas功能

前言 各种插件/库和一些常规的业务代码,最大的区别就在于编程的思路与方法。 比如我们现在想写一段业务代码,使用js实现一个矩形,那很简单,几行代码就可以了 const canvas document.getElementById(canvas)const mode canvas.getContext(2d)mode.rect(200,200,200,200)mode…

CIM的基本概念知识,以及应用场景介绍

CIM的理念 CIM基本理念总结为:依托先进技术、面向具体需求、融合动态信息、描述实体单元、支撑各类应用。 首先要依托于对 BIM、GIS、IOT技术的透彻理解和深度应用,并与云计算、大数据等技术充分融合。 同时,针对不同区域、不同运行管理对象、…

【dc-dc】AP5101C 高压线性恒流IC 9-19V 500ma LED电源驱动方案 过压保护 抗浪涌线路

产品描述 AP5101C 是一款高压线性 LED 恒流芯片 , 外围简单 、 内置功率管 , 适用于6- 100V 输入的高精度降压 LED 恒流驱动芯片。最大电流2.0A。AP5101C 可实现内置MOS 做 2.0A,外置 MOS 可做 3.0A 的。AP5101C 内置温度保护功能 ,温度保护…

拜登:“一切非 Rust 项目均为非法”,开发界要大变天?

文章目录 科技巨头应为安全漏洞负起责任使用其他语言的开发者​该何去何从? 白宫国家网络总监办公室(ONCD,以下简称网总办)在本周一发布的报告中说道:“程序员编写代码并非没有后果,他们的⼯作⽅式于国家利…

练习 2 Web [ACTF2020 新生赛]BackupFile 1

[ACTF2020 新生赛]BackupFile 1 Web常规题目 首先尝试查找常见的前端页面index.php之类的,没找到 题目有个“BackupFile”——备份文件 尝试用工具遍历查找相关的文件 御剑没扫出来,搜索搭建好dirsearch后,扫出来的index.php.bak 扫描工…

我又上来啦!湖人胜率反超勇士升至第九 勇士降第十

nba直播吧 02月29日讯 湖人今日在洛杉矶德比中116-112逆转击沉快船! 赛后,湖人的战绩来到32胜28负,胜率反超勇士(30胜27负),升至西部第九,勇士降到西部第十。

eBay美国站怎么样?eBay跨境电商卖家开店必知!

在众多跨境电商平台之中,eBay作为全球知名的电商平台之一,为卖家提供了跨境电商的机会。对于中国卖家而言,这是一个充满机遇的市场。那么,eBay美国站怎么样?如何顺利在美国eBay上开店呢?让我们一起来了解一…

Apache SeaTunnel 及 Web 功能部署指南(小白版)

在大数据处理领域,Apache SeaTunnel 已成为一款备受青睐的开源数据集成平台,它不仅可以基于Apache Spark和Flink,而且还有社区单独开发专属数据集成的Zeta引擎,提供了强大的数据处理能力。随着SeaTunnel Web的推出,用户…

证明StringBuilder不是现性安全的

1 理论证明 StringBuilder存放字符串的属性是char value[], 这在其父类AbstractStringBuilder里面可以查看: 数组都是创建在堆中,堆中的内存任意线程都可以访问。而且这个字符数组没有像String类那样用final修饰,所以任意线程都可以修改&am…

八、ActiveMQ持久化

ActiveMQ持久化 一、MQ的高可用二、持久化介绍三、持久化存储方式1.AMQ Mesage Store(了解)2.KahaDB消息存储(默认)2.1 存储原理 3.JDBC消息存储4.LevelDB消息存储(了解)5.JDBC Message Store with ActiveMQ Journal查询持久化存储方式 四、持久化存储使用1.JDBC消息…

【小夏送书 | 第二期】世界顶级名校计算机专业,都在用哪些书当教材?

🌄参与规则 参与方式:关注博主点赞收藏评论,(每人最多评论三次) 本次送书1~3本【取决于阅读量,阅读量越多,送的越多】 活动时间至:2024-3-6 20:00:00 | 随机抽取由博主动态公布抽…

linux centos 挂载磁盘

linux centos 挂载磁盘 未挂载磁盘分区挂载硬盘 背景:客户新加了一块600G的数据盘要挂载使用 未挂载磁盘分区 查看未挂载的磁盘 fdisk -l开始分区 fdisk /dev/sdb按照图示一次输入指令 再次查看 fdisk -l格式化 mkfs -t ext4 /dev/sdb1挂载硬盘 创建数据目录…

Visio使用笔记

记录一下需要的常用操作 圆角矩形的弧度调整 如果一开始创建的是圆角矩形,可以菜单栏先改为矩形 取消箭头的对齐吸附 alt F9,取消勾选 忘记快捷键,可以菜单栏找到视图,点击视觉帮助右下角的小箭头,引出上面的界面…

《Decoupling Representation and Classifier for Long-Tailed Recognition》阅读笔记

论文标题 《Decoupling Representation and Classifier for Long-Tailed Recognition》 用于长尾识别的解耦表示和分类器 作者 Bingyi Kang、Saining Xie、Marcus Rohrbach、Zhicheng Yan、 Albert Gordo、Jiashi Feng 和 Yannis Kalantidis 来自 Facebook AI 和 新加坡国…

推荐一款桌面端redis连接工具, redis desktop manager替代品——another redis desktop manager

下载地址 Another Redis Desktop Manager | 更快、更好、更稳定的Redis桌面(GUI)管理客户端,兼容Windows、Mac、Linux,性能出众,轻松加载海量键值 封面对比 对比redis desktop manager ,ui上有巨大的改进 但是redis desktop ma…

力扣262 行程和用户

如何计算特定时间段内非禁止用户的出租车行程取消率。这个问题可以通过SQL查询来解决,我们需要关联Trips表和Users表来筛选出符合条件的行程记录,并计算取消率。 目录 题目描述 思路整理 完整代码及解释 题目描述 表:Trips -----------…

数据卷(Data Volumes)自定义镜像(Dockerfile)

目录 一.数据卷(Data Volumes) 二.自定义镜像(Dockerfile) 自定义centos 一.数据卷(Data Volumes) 数据卷(Data Volumes)是一个可供一个或多个容器使用的特殊目录,它将主机操作系统目录直接映射进容器,它可以提供很多有用的特性: 1.数据卷…

软件测试如何做到充分性测试?

做软件测试要想保质保量,就要做到测试充分,什么是测试充分,就是把所需要覆盖的场景都要覆盖到。如何做到场景全面覆盖,特别是在时间紧任务重的时候?我把我这些年来工作的一点经验总结一下分享给大家,希望对…

基于springboot实现二手图书交易平台系统项目【项目源码+论文说明】计算机毕业设计

基于springboot实现二手图书交易平台系统演示 摘要 本文讲述了基于B/S模式的校园二手交易网站统的设计与实现。所谓的校园二手交易网站统是通过网站推广互联企业的二手物品和技术服务,并使客户随时可以了解企业和企业的产品,为客户提供在线服务和订单处…