Sora刷爆了,先来了解下基本情况

2月15日,OpenAI发布的Sora模型确实在文生视频领域取得了显著的进步,其特点和创新性表现在以下几个方面:

  1. 视频生成长度:Sora模型能够生成长达1分钟的视频,这相比之前的文生视频模型有了显著的提升。这一长度的视频已经足够涵盖许多实际应用场景,如短视频制作、广告、社交媒体分享等。
  2. 3D空间一致性:Sora模型能够在生成的视频中保持3D空间的一致性,这意味着随着摄像机的移动和旋转,人物和场景元素能够在三维空间中保持连贯运动。这一特性使得生成的视频更加自然和逼真,也拓宽了视频生成的可能性。
  3. 长期连续性和物体持久性:Sora模型能够在单个视频中生成同一物体的多个镜头,并且一个主题即使暂时离开视野也能保持不变。这一特性在视频编辑和制作中非常重要,可以确保视频内容的连贯性和一致性。
  4. 视频扩展能力:Sora模型不仅能够向前后扩展视频,还能够连接两个视频。这一特性使得用户可以轻松地将多个视频片段组合成一个完整的视频,提高了视频制作的灵活性和效率。
  5. 模拟数字世界:Sora模型还能够模拟人工操作,例如控制Minecraft游戏中的玩家。这一特性使得Sora模型不仅局限于静态图像的生成,还能够扩展到动态交互场景的模拟,进一步拓宽了文生视频模型的应用领域。

总的来说,Sora模型的发布标志着文生视频技术在实用生产力工具方面的重大突破。其1分钟长度的视频生成能力有望大规模应用在短视频领域,而其扩展视频的能力也有望制作长视频。这一技术的发展或将带来新一轮内容创作产业的革命,为创作者提供更多的创作手段和可能性。同时,我们也期待看到Sora模型在更多领域的应用和拓展。

先来了解一下官网公布的示例(以下是一些简单的翻译):

1、Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.

提示:一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。 她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。 她戴着太阳镜,涂着红色口红。 她走路自信又随意。 街道潮湿且反光,在彩色灯光的照射下形成镜面效果。 许多行人走来走去。

https://cdn.openai.com/sora/videos/tokyo-walk.mp4


60354cd9afb9da740fcf7b1533a3b8e6.jpeg

01:00

2、Prompt: Historical footage of California during the gold rush.(提示:淘金热期间加利福尼亚州的历史镜头。)

https://cdn.openai.com/sora/videos/gold-rush.mp4


c31a063a0aaf20d4892100f1499d4044.jpeg

00:25

3、Prompt: Reflections in the window of a train traveling through the Tokyo suburbs.(提示:穿过东京郊区的火车车窗上的倒影。)

https://cdn.openai.com/sora/videos/train-window.mp4

e4d5fc331a4ef07843f4ef408e47f5f5.jpeg

00:08

4、Prompt: Tour of an art gallery with many beautiful works of art in different styles.(提示:参观艺术画廊,里面有许多不同风格的美丽艺术品。)

https://cdn.openai.com/sora/videos/art-museum.mp4


81609ef00a074dd7ac173e75a6465641.jpeg

00:20

5、Prompt: The camera directly faces colorful buildings in Burano Italy. An adorable dalmation looks through a window on a building on the ground floor. Many people are walking and cycling along the canal streets in front of the buildings.(提示:相机正对意大利布拉诺岛色彩缤纷的建筑。 一只可爱的斑点狗透过一楼建筑的窗户向外张望。 许多人沿着建筑物前的运河街道步行和骑自行车。)

https://cdn.openai.com/sora/videos/italian-pup.mp4


206063aa556441091ad42eba8d5841a5.jpeg

00:10

6、Prompt: An adorable happy otter confidently stands on a surfboard wearing a yellow lifejacket, riding along turquoise tropical waters near lush tropical islands, 3D digital render art style.

提示:一只可爱的快乐水獭穿着黄色救生衣自信地站在冲浪板上,沿着郁郁葱葱的热带岛屿附近碧绿的热带水域骑行,3D 数字渲染艺术风格。

https://cdn.openai.com/sora/videos/otter-on-surfboard.mp4


b5d4c786dca844cd7ca737a838d8a3e8.jpeg0

7、Prompt: A corgi vlogging itself in tropical Maui.(提示:一只柯基犬在热带毛伊岛拍摄视频博客。)

https://cdn.openai.com/sora/videos/vlogger-corgi.mp4


59bd296403e29ca33cd9d0ed267e7e6b.jpeg0

8、Prompt: Archeologists discover a generic plastic chair in the desert, excavating and dusting it with great care.(提示:考古学家在沙漠中发现了一把普通的塑料椅子,他们小心翼翼地挖掘并除尘。)

https://cdn.openai.com/sora/videos/chair-archaeology.mp4


06fff0851253d38b8bfe5d2c147909e0.jpeg0

下面是官网的一些解读:

我们正在教AI理解和模拟运动中的物理世界,目的是训练模型来帮助人们解决需要现实世界互动的问题。

该模型对语言有深入的理解,使其能够准确地解释提示并生成引人注目的字符来表达充满活力的情感。 Sora 还可以在单个生成的视频中创建多个镜头,准确地保留角色和视觉风格。

Sora 能够生成具有多个角色、特定类型的运动以及主体和背景的准确细节的复杂场景。 该模型不仅了解用户在提示中提出的要求,还了解这些东西在物理世界中的存在方式。

当前的模型存在弱点。 它可能难以准确模拟复杂场景的物理原理,并且可能无法理解因果关系的具体实例。 例如,一个人可能咬了一口饼干,但之后饼干可能没有咬痕。该模型还可能会混淆提示的空间细节,例如混淆左右,并且可能难以精确描述随着时间推移发生的事件,例如遵循特定的相机轨迹。

安全

在 OpenAI 产品中使用 Sora 之前,我们将采取几个重要的安全措施。 我们正在与红队成员合作——“错误信息、仇恨内容和偏见等领域的领域专家”——他们将对模型进行对抗性测试。

我们还在构建工具来帮助检测误导性内容,例如检测分类器,可以判断 Sora 何时生成视频。 如果我们在 OpenAI 产品中部署模型,我们计划将来包含 C2PA 元数据。

除了开发新技术来准备部署之外,我们还利用为使用 DALL·E 3 的产品构建的现有安全方法,这些方法也适用于 Sora。

例如,在 OpenAI 产品中,我们的文本分类器将检查并拒绝违反我们的使用政策的文本输入提示,例如请求极端暴力、性内容、仇恨图像、名人肖像或他人 IP 的文本输入提示。 我们还开发了强大的图像分类器,用于检查生成的每个视频的帧,以帮助确保它在向用户显示之前符合我们的使用政策。

我们将与世界各地的政策制定者、教育工作者和艺术家合作,了解他们的担忧并确定这项新技术的积极用例。 尽管进行了广泛的研究和测试,我们仍无法预测人们将使用我们的技术的所有有益方式,也无法预测人们将滥用我们的技术的所有方式。 这就是为什么我们相信,随着时间的推移,从现实世界的使用中学习是创建和发布越来越安全的人工智能系统的关键组成部分。

不得不说,太强了!至于是否能代替一些职业,目前看对视频剪辑、短视频行业、设计师行业冲击会比较大。

期待公开注册的一天。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/401156.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

后端程序员入门react笔记——react的diff算法(三)

diffing算法 虚拟dom 我们知道,react里面操作的都是虚拟dom,最后经过render渲染为真正的dom,那么为什么要提出虚拟dom这个概念呢?其实就是将逻辑和视图区分开,react的虚拟dom,就相当于mvc的c,…

网络安全实验(三)补充

1.假设内网用户需要通过外网的web服务器和pop3邮件服务器下载文件和邮件,内网的FTP服务器也需要接受外网用户上传的文件。针对该场景进行防病毒的防护。 2.我们需要针对办公区用户进行上网行为管理,要求进行URL过滤,要求在上班时间仅能访问教…

UE蓝图 入口(FunctionEntry)节点和源码

系列文章目录 UE蓝图 Get节点和源码 UE蓝图 Set节点和源码 UE蓝图 Cast节点和源码 UE蓝图 分支(Branch)节点和源码 UE蓝图 入口(FunctionEntry)节点和源码 文章目录 系列文章目录一、FunctionEntry节点功能二、入口节点用法1. 创建函数2. 命名函数3. 定义参数4. 编写函数逻辑5…

http协议工具:apache详解

目录 一、常见的http服务程序 1、 Apache HTTP Server 介绍 1.1 apache 概念 1.2 apache 功能 1.3 apache 特性 2、MPM(multi-processing module)工作模式 2.1 prefork 2.2 worker 2.3 event 二、Apache HTTP Server安装和相关文件 1、安装方…

五种多目标优化算法(MOGWO、MOJS、NSWOA、MOPSO、MOAHA)性能对比,包含6种评价指标,9个测试函数(提供MATLAB代码)

一、5种多目标优化算法简介 1.1MOGWO 1.2MOJS 1.3NSWOA 1.4MOPSO 1.5MOAHA 二、5种多目标优化算法性能对比 为了测试5种算法的性能将其求解9个多目标测试函数(zdt1、zdt2 、zdt3、 zdt4、 zdt6 、Schaffer、 Kursawe 、Viennet2、 Viennet3)&#xff0…

多维时序 | Matlab实现基于VMD-DBO-GRU、VMD-GRU、GRU的多变量时间序列预测

多维时序 | Matlab实现基于VMD-DBO-GRU、VMD-GRU、GRU的多变量时间序列预测 目录 多维时序 | Matlab实现基于VMD-DBO-GRU、VMD-GRU、GRU的多变量时间序列预测预测效果基本介绍程序设计参考资料 预测效果 基本介绍 Matlab实现基于VMD-DBO-GRU、VMD-GRU、GRU的多变量时间序列预测…

AWS安全组是什么?有什么用?

最近看到小伙伴在问,AWS安全组是什么?有什么用?今天我们大家就来简单聊聊,仅供参考哦! AWS安全组是什么?有什么用? 【回答】:AWS安全组是一种虚拟防火墙,用于控制进出…

Eclipse项目间的引用

我们在开发的时候,有时候需要把一个大的项目打散,尤其是现在微服务的架构很流行,一个大的项目往往被拆成很多小的项目,而有的项目作为公共工程被独立出来,比如有个工程专门提供各种Util工具类,有的工程专门…

【hoare优化版】快速排序算法(2)

目录 GitMidi三数取中 整体思想 图解分析 代码实现 Hoare优化 上篇我们介绍了hoare基础版,但是这种代码存在缺陷,所以我们提出了两种解决方案。主流的解决方案就是【三数取中选key】 GitMidi三数取中 在快排的过程中,每一次我们要取一…

Hive--内部表常用操作 全面且详细

文章中关于内部表常用操作目录 一、隔符 二、根据查询结果创建表 ​​​​​​​三、根据已经存在的表结构创建表 ​​​​​​​四、查询表的类型 ​​​​​​​五、删除表 ​​​​​​​一、隔符 create table if not exists stu2(id int ,name string) row format d…

分享:大数据信用查询去什么样的平台查?

在当今社会,大数据信用查询已经成为企业和个人了解自身信用状况的重要途径。然而,面对众多的大数据信用查询平台,如何选择一个可靠的平台进行查询呢?本文将为您介绍一些选择大数据信用查询平台的关键因素。 一、平台信誉度 首先,…

django自定义后端过滤

​ DRF自带的过滤 第一个 DjangoFilterBackend 是需要安装三方库见[搜索:多字段筛选]两外两个是安装注册了rest_framework就有。 如上图,只要配置了三个箭头所指的方向,就能使用。 第一个单字段过滤 用户视图集中加上filterset_fields …

(done) 两个矩阵 “相似” 是什么意思?

参考视频:https://www.bilibili.com/video/BV1zu411673J/?spm_id_from333.337.search-card.all.click&vd_source7a1a0bc74158c6993c7355c5490fc600 参考资料:https://baike.baidu.com/item/%E7%9B%B8%E4%BC%BC%E7%9F%A9%E9%98%B5/10369874?frge_a…

javaSE多态

文章目录 斜体样式1.1 面向对象三大特征 ?1.2 什么是多态 ?*斜体样式*1.3 多态的前提1.4 多态的成员访问特点1.5 多态的优缺点1.6 多态的转型1.7 多态的转型注意1.8 解决转型安全隐患 2 内部类2.1 内部类的分类什么是内部类 ?什么时候使用内部类 ?内部类分类 ? 2.2 成员内…

C#通过继承泛型类来分块显示学生的个人信息以及成绩信息

目录 一、涉及到的知识点 1.泛型类的继承 2.泛型类的可视化 (1)用UML图说明泛型类的可视化 (2)用实例说明泛型类的可视化 二、实例1 1.源码 2.生成效果 三、实例2 再发一个继承泛型类的应用案例。 一、涉及到的知识点 …

mac 安装H3C iNode + accessClient mac版

一、下载安装 官网下载地址 https://www.h3c.com/cn/Service/Document_Software/Software_Download/IP_Management/ 可以使用文末参考博文中的账号 yx800 密码 01230123登录下载 选择版本 下载 下载 H3C_iNode_PC_7.3_E0626.zip 文件后,解压下载到的PC端压缩包…

9.vue学习笔记(组件传递Props校验+组件事件-组件传递数据+组件事件-配合“v-model”使用)

文章目录 1.组件传递Props校验1.1.默认值1.2.必选项1.3.注意事项:props 是只读的 2.组件事件-组件传递数据2.1.温馨提示:组件之间传递数据的方案 3.组件事件-配合“v-model”使用 1.组件传递Props校验 Vue组件可以更细致地声明对传入的 props 的校验要求…

jenkins远程触发构建报:Error 403 No valid crumb was included in the request

最近在跨jenkins触发构建的时候发现不能触发相应的项目,报如下图错误 解决方案: 1、安装Build Authorization Token Root Plugin插件 安装完成后去配置API Token,用户列表,配置用户的API Token,生成后记得保存 2、项…

Linux:Jenkins:GitLab+Maven+Jenkins的部署——离线包rpm版

Linux:Jenkins:GitLabMavenJenkins的部署(1)-CSDN博客https://blog.csdn.net/w14768855/article/details/136157018?spm1001.2014.3001.5501这个是原版文章,均是使用的在线情况,但是不排除会有离线部署&am…

Java Web(七)__Tomcat(一)

JavaWeb 服务器 介绍 为什么需要? Web服务器是一个应用程序(软件),对HTTP协议的操作进行封装,使得程序员不必直接对协议进行操作,让Web开发更加便捷。主要功能是"提供网上信息浏览服务"。Web服…