免费 逼真:快手“可灵”后又一Sora级选手登场

就在今日,英伟达投资的旧金山初创公司 Luma AI 打出一手王牌,推出新一代 AI 视频生成模型 Dream Machine,可以文生视频,图生视频,人人免费可用。同时,Luma AI 称 Dream Machine 可以从文本和图像生成“高质量”的视频效果堪比OpenAI推出的Sora。

画面逼真,视频质量高

Dream Machine 可在 120 秒生成 120 帧,目前单个视频最长为 5 秒;根据Luma AI官方放出的视频看,其生成的视频具有逼真的流畅运动、电影摄影和戏剧效果;还可以匹配摄像机运动,创造出“惊艳”的画面,虽然高需求可能会导致生成时间和队列延迟,但该模型始终可以很好地表示字符,尽管它在变形、移动和文本呈现方面存在一些限制。根据官方给出的实例,我们可以看到眼部特写清眼球中变幻的色彩,老虎在雪地中行走动作自然,脸部特写光影斑驳、镜头移动自然,人物动作衔接流畅。已有网友在社交平台上放出用Dream Machine制作的视频,画面看上去颇为真实:

401cb676dee3587b4bc11242e1b9e10c.jpeg

除了生成逼真视频外,Dream Machine 也可以尝试不同风格。
比如日本动漫风:

978889ed38033fbc491300f239c6aff9.jpeg

迪士尼风格:

d6bf5ab149a4cd5c98f3d097710abe45.jpeg


热度非常高,使用需排队

据了解,起初官方表示模型可以在120秒内生成120帧视频,但发布后的真实情况是太多人挤入,网站流量过大,现在生成一个视频甚至需要排队几个小时。此外,在推出免费公开测试版前,已经有少数AI视频创作者和电影制作人测试上了Dream Machine,他们也发布了不少作品。

7810f7925e7df2c1d712b5a98db1478d.jpeg

使用的方式也很简单,只要在输入框输入提示词,提出你想要的图像包括理想的画风以及效果,随后等待几分钟后即可;同时输入框下面还有“推荐提示词”以及“提示词强化”的选项功能来助你一臂之力。输入的关键词越详细,生成的视频就越逼真动人。

44868bca1303f8751eab197654df4a6c.jpeg

比如我们在此输入“A teddy bear in sunglasses playing electric guitar, dancing and headbanging in the jungle in front of a large beautiful waterfall”即“一只戴着墨镜的泰迪熊弹着电吉他,在丛林里、在美丽的大瀑布前摇头晃脑地跳舞” 的指令后,在等待大约两分钟后可以得到以下视频:

7580141b53a3e32eeed71e67fd71d837.jpeg


怎么样,很逼真吧!

不过,Luma Ai仍旧存在着一些相关的问题,比如切换视角时汽车会变形,狗的运动没有用到爪子,显示文字会有问题(将 Luma 显示成 Lumma),北极熊在转身时出现了两个头(Janus 是罗马人的门神,具有前后两个面孔),官方表示他们仍将继续优化模型

a16dd57fbe1c1914240724144baa4f39.jpeg

谁创造了它?

Dream Machine的背后是一家新兴Ai智能公司:Luma AI

6aeecfbf7fa965b9ea04e7779c6f3ac1.jpeg

Luma AI 成立于 2021 年,最初只是一家聚焦于 3D 内容生成的技术公司。
首席执行官 Amit Jain 曾是苹果公司的计算机视觉系统工程师,首席技术官 Alex Yu 曾是加州大学伯克利分校的研究生(放弃博士学业创办了 Luma AI )。二人在 3D 视觉、机器学习、实时图形学等领域都有所建树。
据悉,这家公司已经历数轮融资。A 轮融资由 Amplify Partners、Nvidia 投资部门 和 General Catalyst 领投,共筹集 2000 万美元;B 轮融资则由硅谷顶级风投公司 Andreessen Horowitz、英伟达领投,筹集 4300 万美元。截至目前,公司共融资 7000 多万美元,估值在 2 亿到 3 亿美元之间。

而在Dream Machine之前,Luma AI凭借去年发布的一个文本到3D生成的模型Genie 1.0,已经打出了一波知名度。Genie能够在10秒内创建3D物体,可生成四边形网格和材料,支持任意多边形数量的标准格式。Genie现在可以通过网页版、Luma iOS APP以及Discord社区使用,而这次最新推出的Dream Machine,是Luma AI打造的第一个视频生成AI。感兴趣的小伙伴可以亲自试一下。 链接: Luma Dream Machine (lumalabs.ai)

高性价比GPU平台:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_wenzhang_617_shemei



本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/717260.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【会议征稿】第五届物联网、人工智能与机械自动化国际学术会议 (IoTAIMA 2024,7月19-21)

由浙江工业大学主办,第五届物联网、人工智能与机械自动化国际学术会议 (IoTAIMA 2024) 将于2024年7月19-21日在浙江杭州召开。 会议旨在为从事物联网、人工智能与机械自动化的专家学者、工程技术人员、技术研发人员提供一个共享科研成果和前沿技术,了解学…

【SXF2024笔试】

编程题 1. 最长不重复子数组2. 编辑任务所需的最短时间3. 主机连通所需的最短跳数4. 十进制数字的汉诺塔编码 1. 最长不重复子数组 2. 编辑任务所需的最短时间 3. 主机连通所需的最短跳数 4. 十进制数字的汉诺塔编码

STM32在进入main函数之前的准备工作

在大部分嵌入式系统中,在进入main函数之前都需要执行一个系统 初始化序列。这里所说的初始化序列特指的是软件运行环境的初始化。 上图是系统开始运行后,在进入main函数之前的默认初始化序列。从图中可以看出,在左侧有2个函数:__m…

各大APP自动化运行插件开发需要用到的源代码有哪些?

在当今数字化时代,自动化运行插件的开发在各大APP中扮演着至关重要的角色,这些插件不仅提升了APP的功能性和效率,同时也为用户带来了更加便捷的使用体验。 在开发这些自动化运行插件的过程中,源代码的选择与使用显得尤为关键&…

RocketMQ快速入门:集成java客户端实现各类消息发送|异步、同步、顺序、单向、延迟、事务(五)附带源码

0. 引言 前面的章节中,我们已经针对rocketmq的基本概念和消息发送、消费流程进行了讲解,但实际在开发中如何实现rocketmq的接入、实现消息发送、消费还没有落实,那么今天,我们继续来学习如何基于java client集成rocketMQ 1. 集成…

Vue47-修改默认配置webpack.config.js文件

main.js是脚手架项目的入口文件,系统运行时,默认去找src下的main.js文件。这是webpack通过配置文件:webpack.config.js配置的。 脚手架把所有重要的配置文件都隐藏了,方式被开发者修改。 一、查看被隐藏的webpack配置 1-1、webpa…

python基础语法 002 - 3 数据运算

1 运算符 1.1 算术运算符 -*/ 1.1.1 除法:会类型转换、被除数不能为0 #算术运算符a 1 2 print(a) b a - 1 print(b) c b 6 print(c)# 为什么除法得不到整数? #除法可能遇到除不尽 #使用了除法数据类型会转化为浮点数 d c / 2 print(d) print(typ…

SAP 在过账的时候系统提示:被合并的公司 XXXX 和 ‘ ‘ 是不同的解决办法

最近用户反馈在STO的业务模式中交货单过账的时候,报错没有办法过账。查看了一下报错的信息提示:被合并的公司 和1300是不同的 如下图所示: 消息号是F5080 首先根据SAP的消息号找了一下NOTE,发现2091823有详细的说。 主要是财务…

硕士毕业论文《基于磁纹理的磁化动力学研究》

前言 本文是博主的硕士毕业论文,应该也是“自旋电子学(微磁学)”博客专栏的最后一篇博客,该毕业论文预设排版的PDF版本见下载链接:https://download.csdn.net/download/qq_43572058/89447526。若该博客专栏对读者您的…

Linux:生产消费模型 读者写者模型

Linux:生产消费模型 & 读者写者模型 生产消费模型阻塞队列基本结构构造与析构投放任务获取任务总代码 POSIX 信号量基本概念接口 环形队列基本结构构造与析构投放任务获取任务总代码 读者写者模型读写锁 生产消费模型 生产消费模型是一种用于处理多线程之间任务…

「6.18福利」精选大厂真题|笔试刷题陪伴|明天正式开屋啦 - 打卡赢价值288元丰厚奖励

🍰关于清隆学长 大家好,我是清隆,拥有ACM区域赛 银牌🥈,CCCC天梯赛 国一,PTA甲级 98 分。 致力于算法竞赛和算法教育已有 3 年,曾多次 AK 互联网大厂笔试,大厂实习经验丰富。 打卡…

Hive笔记-2

第 3 章 DDL (Data Definition Language) 数据定义 DDL数据定义语言 DML数据操作语言 3.1 数据库 (database) 3.1.1 创建数据库 1) 语法 CREATE DATABASE [IF NOT EXISTS] database_name [COMMENT database_comment] [LOCATION hdfs_path] [WITH DBPROPERTIES (property_…

环信beta版鸿蒙IM SDK发布!深度适配HarmonyOS NEXT系统

环信beta版鸿蒙IM SDK已正式发布!欢迎有需求开发者体验集成! 版本亮点 提供原生鸿蒙 SDK,支持原生 ArkTS 语言,全面拥抱鸿蒙生态提供鸿蒙系统上单聊、群聊、会话等能力和服务覆盖消息管理、用户属性、群租管理、离线推送.多设备…

作者推荐 | 探索分析从起源到现今的巅峰之旅(MySQL存储模型)

探索分析从起源到现今的巅峰之旅 背景介绍MySQL内部组织与结构MySQL的数据层次和关系InnoDB的数据存储模型数据记录的基本单元 — 行页目录(Page Directory)文件头(File Header)决定页面间的关联方式数据页头(Page Hea…

CCAA质量管理【学习笔记】​​ 备考知识点笔记(七)质量相关法律法规及《管理体系审核员准则》2021修订3

5、质量管理体系基础考试大纲 3.3法律法规和其他要求 a)《中华人民共和国民法典》第三编 合同; b)《中华人民共和国消费者权益保护法》 c)《中华人民共和国产品质量法》 d) 中国认证认可协会相关人员注册与管理要求 目 录 前 言 第一章 总则 1.1 引言 1.2 适…

基 CanMV 的 C 开发环境搭建

不论是使用 CanMV 提供的基于 C 语言和 FreeRTOS 的应用开发方式开发应用程序或是编译 CanMV 固件,都需要搭建基于 CanMV 的 C 开发环境,用于编译 CanMV 源码。 1. 开发环境搭建说明 CanMV 提供了基于 C 语言和 FreeRTOS 的应用开发…

药品光照稳定性试验箱如何进行光强度的校准和验证?

药品光照稳定性试验箱是一种用于模拟不同光照条件下药品贮存和稳定性评价的设备,其精准的光强度控制和稳定性对药物质量的保证至关重要。为了确保光照稳定性试验箱的光强度控制精准可靠,以下将介绍光照稳定性试验箱如何进行光强度的校准和验证。 1、设备…

如何使用任意浏览器远程访问本地搭建的Jellyfin影音平台

文章目录 前言1. Jellyfin服务网站搭建1.1 Jellyfin下载和安装1.2 Jellyfin网页测试 2.本地网页发布2.1 cpolar的安装和注册2.2 Cpolar云端设置2.3 Cpolar本地设置 3.公网访问测试4. 结语 前言 本文主要分享如何使用Windows电脑本地部署Jellyfin影音服务并结合cpolar内网穿透工…

基于 VITA57.1 标准的 2 收 2 发射频子卡(国产 ADRV9009子卡)

FMC159 是一款基于 VITA57.1 标准规范,实现 2 收 2 发的射频子模块,该板卡基于国产化 ADRV9009 射频收发器,涵盖了50MHz~6GHz 频段,并集成了双通道收发链路,发送最大实时带宽可到 450MHz,接收最大带宽可以到…

App推广效果监测新篇章:Xinstall引领数据驱动的智能推广时代

在移动互联网时代,App的推广效果监测成为了广告主们关注的焦点。面对复杂多变的市场环境,如何确保广告投放的精准性和效果性,成为了摆在广告主面前的一大难题。Xinstall作为一款专业的App推广效果监测工具,凭借其强大的数据分析和…