Sora是否能颠覆视频制作行业?一文带你了解

一个月前OpenAI宣布了一款名为Sora的新生成式人工智能系统,该系统可以根据文本提示生成短视频。虽然Sora尚未向公众开放,但迄今为止发布的高质量样本已经引起了兴奋和担忧的反应。

536f7fae581576258d8317f9654aff27.jpeg

OpenAI发布的样本视频(该公司称这些视频是由Sora直接制作,未经修改)显示了提示的输出,例如“两艘海盗船在一杯咖啡内航行时互相战斗的逼真特写视频”和“加利福尼亚州的历史镜头”淘金热期间”。乍一看,由于视频、纹理、场景动态、摄像机运动的高质量以及良好的一致性,通常很难看出它们是由人工智能生成的。OpenAI首席执行官Sam Altman还在X(以前的Twitter)上发布了一些根据用户建议的提示生成的视频,以展示Sora的功能。

一、Sora如何运作?

Sora在所谓的“扩散变压器模型”中结合了文本和图像生成工具的功能。

Transformer是Google于2017年首次推出的一种神经网络。它们因在ChatGPT和Google Gemini等大型语言模型中的使用而闻名。另一方面,扩散模型是许多人工智能图像生成器的基础。他们的工作原理是从随机噪声开始,迭代到适合输入提示的“干净”图像。一系列图像显示了静态中出现的城堡图片。

Sora使用变压器架构来处理帧之间的关系。虽然Transformer最初被设计为在表示文本的标记中查找模式,但Sora相反使用表示小块空间和时间的标记。

Sora并不是第一个文本转视频模型。早期的模型包括Meta的Emu、Runway的Gen-2、Stability AI的Stable Video Diffusion以及最近Google的Lumiere。几周前发布的Lumiere声称可以制作比其前身更好的视频。但至少在某些方面,Sora似乎比卢米埃更强大。

Sora可以生成分辨率高达1920×1080像素和多种宽高比的视频,而Lumiere仅限于512×512像素。Lumiere的视频长度约为5秒,而Sora的视频长达60秒。Lumiere无法制作由多个镜头组成的视频,而Sora可以。据报道,与其他模型一样,Sora也能够执行视频编辑任务,例如从图像或其他视频创建视频、组合不同视频的元素以及及时扩展视频。

这两种模型都会生成大致真实的视频,但可能会产生幻觉。卢米埃尔的视频可能更容易被认为是人工智能生成的。Sora的视频看起来更有活力,元素之间有更多的互动。然而,在许多示例视频中,仔细检查后就会发现不一致之处。

二、Sora的发展前景

目前,视频内容是通过拍摄现实世界或使用特效来制作的,这两种方式都可能成本高昂且耗时。如果Sora以合理的价格上市,人们可能会开始使用它作为原型设计软件,以更低的成本将想法可视化。根据我们对Sora功能的了解,它甚至可以用于为娱乐、广告和教育领域的某些应用程序创建短视频。

OpenAI关于Sora的技术论文的标题是“视频生成模型作为世界模拟器”。该论文认为,像Sora这样的更大版本的视频生成器可能是“物理和数字世界以及生活在其中的物体、动物和人的有效模拟器”。如果这是正确的,未来的版本可能会在物理、化学甚至社会实验方面具有科学应用。例如,人们也许能够测试不同规模的海啸对不同类型的基础设施以及附近人们的身心健康的影响。实现这种水平的模拟非常具有挑战性,一些专家表示像Sora这样的系统根本无法做到这一点。

一个完整的模拟器需要计算宇宙最详细水平的物理和化学反应。然而,在未来几年内,模拟世界的粗略近似并制作人眼逼真的视频可能是可以实现的。

三、Sora存在的问题

人们对Sora这样的工具的主要担忧是其社会和道德影响。在一个已经被虚假信息困扰的世界中,像Sora这样的工具可能会让事情变得更糟。很容易看出,生成您可以描述的任何场景的逼真视频的能力如何可以用来传播令人信服的假新闻或对真实镜头提出质疑。它可能会危及公共卫生措施,被用来影响选举,甚至可能因潜在的虚假证据而给司法系统带来负担。视频生成器还可能通过深度伪造(尤其是色情内容)对目标个人造成直接威胁。这些可能会对受影响个人及其家人的生活产生可怕的影响。

除了这些问题之外,还存在版权和知识产权问题。生成式人工智能工具需要大量数据进行训练,而OpenAI尚未透露Sora的训练数据来自何处。大型语言模型和图像生成器也因此受到批评。在美国,一群著名作家因可能滥用他们的材料而起诉OpenAI。该案认为,大型语言模型和使用它们的公司正在窃取作者的作品来创建新内容。

近年来,技术超越法律已经不是第一次了。例如,社交媒体平台审核内容的义务问题在过去几年引发了激烈的争论——其中大部分围绕《美国法典》第230条展开。虽然这些担忧是真实存在的,但根据过去的经验,我们预计它们不会停止视频生成技术的开发。OpenAI表示,在向公众开放Sora之前,它正在“采取几项重要的安全措施”,包括与“错误信息、仇恨内容和偏见”领域的专家合作,以及“构建帮助检测误导性内容的工具”。

本文来源:www.sora008.com

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/502854.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

反应式编程(三)什么是粘包、拆包?如何解决?

目录 一、粘包、拆包介绍1.1 什么是 TCP 协议?1.2 什么是粘包、拆包?1.3 粘包、拆包的四种情况1.4 粘包、拆包的原因1)TCP协议中的滑动窗口机制2)传输层的 MSS 与链路层的 MTU3)TCP协议中的 Nagle 算法4)应…

【智能算法】晶体结构算法(CryStAl)原理及实现

目录 1.背景2.算法原理2.1算法思想2.2算法过程 3.结果展示4.参考文献 1.背景 2021年,S Talatahari等人受到晶体自然结构启发,提出了晶体构造算法(Crystal Structure Algorithm , CryStAl)。 2.算法原理 2.1算法思想 CryStAl受…

Python学习笔记-简单案例实现多进程与多线程

Python 的多进程与多线程是并发编程的两种重要方式,用于提高程序的执行效率。它们各自有不同的特点和适用场景。 多进程(Multiprocessing) 概念: 多进程是指操作系统中同时运行多个程序实例,每个实例称为一个进程。…

Jmeter 分布式压测,你的系统能否承受高负载?

‍你可以使用 JMeter 来模拟高并发秒杀场景下的压力测试。这里有一个例子,它模拟了同时有 5000 个用户,循环 10 次的情况‍。 请求默认配置 token 配置 秒杀接口 ​结果分析 ​但是,实际企业中,这种压测方式根本不满足实际需求。下…

java入门学习Day03

本篇文章主要有java中的变量、命名方法、数据类型。 一、java中的变量 数据类型 变量名 数据值;int money 50; public class varibledemo {public static void main(String[] args) {int money 50;//变量的输出System.out.println(money);money 6…

ctfshow-web入门-xxe

什么是xxe? XXE,全称XML External Entity Injection,即XML外部实体注入。这是一种针对应用程序解析XML输入类型的攻击。当包含对外部实体的引用的XML输入被弱配置的XML解析器处理时,就会发生这种攻击。这种攻击通过构造恶意内容&…

bugku-web-alert

这里可以看到flag在页面弹窗内 有两种弹窗 利用Python和bp各自尝试 得到的结果 这里得到一串不知道是什么的加密代码 经过尝试大量解码器后得知,这时unicode编码 进行解码

Linux中的文件操作

共识原理 在讲文件操作之前, 我们先形成一个共识 1 文件 内容 属性 2 文件分为打开的文件 和 没打开的文件 3 打开的文件是谁打开的? 进程!! – 研究文件操作本质是研究进程和文件的关系! 4 没打开的文件&#xff1…

基于ssm的留学生交流互动论坛网站(java项目+文档)

风定落花生,歌声逐流水,大家好我是风歌,混迹在java圈的辛苦码农。今天要和大家聊的是一款基于ssm的留学生交流互动论坛网站。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 留学生交流互动论坛网站…

RUST工程构建工具CARGO及代码编写工具RUSTROVER使用

1.使用cargo创建rust工程 cargo new hello_rust 生成的内容如下: 使用cargo build进行编译工程 编译成功会生成一个target目录 进入target目录运行生成程序 也可直接使用cargo run直接编译并运行 如果要测试工程执行cargo test 如果要为工程创建文档执行cargo doc 也可发布工程…

【MySQL】DQL-基础查询-语句&演示(查询多个字段 / 所有字段/并设置别名/去重)

前言 大家好吖,欢迎来到 YY 滴MySQL系列 ,热烈欢迎! 本章主要内容面向接触过C Linux的老铁 主要内容含: 欢迎订阅 YY滴C专栏!更多干货持续更新!以下是传送门! YY的《C》专栏YY的《C11》专栏YY的…

【Java】MyBatis快速入门及详解

文章目录 1. MyBatis概述2. MyBatis快速入门2.1 创建项目2.2 添加依赖2.3 数据准备2.4 编写代码2.4.1 编写核心配置文件2.4.2 编写SQL映射文件2.4.3 编写Java代码 3. Mapper代理开发4. MyBatis核心配置文件5. 案例练习5.1 数据准备5.2 查询数据5.2.1 查询所有数据5.2.2 查询单条…

学生综合测评系统的设计与实现|Springboot+ Mysql+Java+ B/S结构(可运行源码+数据库+设计文档)

本项目包含可运行源码数据库LW,文末可获取本项目的所有资料。 推荐阅读100套最新项目持续更新中..... 2024年计算机毕业论文(设计)学生选题参考合集推荐收藏(包含Springboot、jsp、ssmvue等技术项目合集) 1. 系统功能…

删除数据操作

注意session.commit()的位置成功

基于SpringBoot + Vue实现的在线装修管理系统设计与实现+毕业论文

介绍 系统包含用户、装修队、管理员三个角色 管理员: 管理员管理:管理其他管理员的账号和权限,确保系统管理的层次化和安全性。 装修队管理:审核装修队的资质,管理装修队的人员信息,监控工程进度&#xff…

云服务器8核32G配置价格115元1个月、345元3个月

腾讯云轻量应用服务器8核32G配置、22M公网带宽,优惠价格115元1个月、345元3个月,系统盘为320GB SSD盘、4500GB月流量,活动链接 txybk.com/go/txy 腾讯云8核32G服务器22M带宽优惠价格 本文8核32G服务器为轻量应用服务器,虽然是22M公…

单链表求集合的交集

#define _CRT_SECURE_NO_WARNINGS #include<stdio.h> #include<stdlib.h> typedef int ElemType; typedef struct LinkNode {ElemType data;LinkNode* next; }LinkNode, * LinkList; //尾插法建立单链表 void creatLinkList(LinkList& L) {L (LinkNode*)mallo…

【JAVA项目】基于SSM+HTML5的【网上跳蚤市场】

目录 背景 技术简介 系统简介 界面预览 背景 在21世纪&#xff0c;中国在上个世纪便已经开始广泛推广互联网技术&#xff0c;这一技术极大地方便了人们的生活。众多企业和机构都建立了自己的信息系统&#xff0c;从传统的管理方式转变为依托互联网的发展模式&#xff0c;因…

一文带你深刻了解控制台console那些事

一、前言 首先感谢小伙伴们访问我的博客&#xff0c;但是你是有多么的无聊才会选择打开我的控制台呢&#xff1f;不过还是很感谢大家通过邮件的形式&#xff0c;给我提出很多的宝贵意见。 借此机会正好和大家唠一唠前端console到底有什么魔法。 二、console.log调试必备 consol…

执行 kubeadm join 报错ERROR FileAvailable--etc-kubernetes-kubelet.conf

执行 kubeadm join 报错ERROR FileAvailable–etc-kubernetes-kubelet.conf [rootk8snode2 ~]# kubeadm join apiserver.demo:6443 --token c4nezq.ecv2kg9ok6gsresw --discovery-token-ca-cert-hash sha256:be1a55bea6b5bb5c8810434d3905a9cd0bbc33181862f7ad601346e1ab0…