AI视频制作的体验分析

突然接到某讯APP的视频制作体验测试的信息弹窗,毫不犹豫加入体验。

经过几次尝试,感觉并不友好,基于没有理解到我们对视频制作的描述期望,生成的内容与需求描述存在较大的差异。

简单的理解,其依旧是通过大语言模型对我们需求语言 进行“编码”,从中提取各种丰富的知识和结构,加权积累与关联生成自己的语言,然后“编码”回内容的一个过程,理解起来并不太复杂。具体可能是基于时空信息的数据的碎片内容,进行拆解组合被用作Transformer的Token来处理和理解需求描述的视觉数据,在说简单点就是个编码器和解码器的深度应用。当然,这种视频的生成感,主要是过于生硬,可以理解其是对碎片信息的组合。但常规理解碎片它通过将图像或视频分解为小块区域,是可以使得复杂的视觉任务更加高效和准确地完成。

对此,尝试了Sora,这个感觉确实“差异过大”。同样是对自然语言理解,其对生成视频文本描述感觉是基于丰富的文本内容作为合成数据训练,  描述内容及语言的精确和关联度更强,可以说在Token与Patch之间形成了统一的“文字”信息。图像视频作为prompts,基于用户提供的图像或视频又可以自然的编码为时空碎片,用于各种图像和视频编辑任务,静态图动画、扩展生成视频、视频连接或编辑等,直接提升的生成视频内容的丝滑程度。

多次对比尝试,还是能够感觉到,基于扩散模型的Transformer,确实从高维的信息碎片中存在一个观察和提取关联信息并演化的动态过程,类似数据信息的采集和视觉观察提炼的动作。

虽然不是很清晰到底是用哪一种方式在背后进行处理,但猜测视频碎片内容可能是假定三维空间的点集的运动形态或者说是个四维时空模型,而基于这个生成模型先去从中实现提取出关键信息,通过表面内容,在视频生成上展现出强大的涌现能力,保障了人景物在三维空间移动一致性,让仿真状态更加融合。

换个角度,基于语言需求的描述,系统并未达到智能,或者说并没有足以产生意识的信息和同时加工的处理过程。由这个体验测试的过程来看,从反馈中进行强化学习是一种训练人工智能系统与人类目标相一致的技术策略,虽然已成为优化大型语言模型的重要方案,但对其缺点的系统化整理感觉相对较少。对于,我们测试体验而言,还是提供了可靠且相对高质量的反馈,应该有利于后续的策略优化内容,或者说选择有代表性的人群并让他们提供高质量的反馈其实是存在困难的,因为部分观察性以及数据收集的本身都容易产生偏见。

虽然是一个很小的体验过程,也尽管AI测试的价值对齐是一项难题,但辩以明志,分析和讨论也将引领我们踏上正确的路。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/949679.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

可以输入的下拉框(下拉框数据过大,页面卡死)

项目场景: 提示:这里简述项目相关背景: 在项目中,有些下拉框的数据过于庞大,这样页面有时候会卡死,在vue3中常用的组件库element-puls中有个组件可以避免 在项目中,有些需求要求下拉框选择的同…

基于Python的音乐播放器 毕业设计-附源码73733

摘 要 本项目基于Python开发了一款简单而功能强大的音乐播放器。通过该音乐播放器,用户可以轻松管理自己的音乐库,播放喜爱的音乐,并享受音乐带来的愉悦体验。 首先,我们使用Python语言结合相关库开发了这款音乐播放器。利用Tkin…

谷粒商城-高级篇完结-Sleuth+Zipkin 服务链路追踪

1、基本概念和整合 1.1、为什么用 微服务架构是一个分布式架构,它按业务划分服务单元,一个分布式系统往往有很多个服务单元。由于服务单元数量众多,业务的复杂性,如果出现了错误和异常,很难去定位 。主要体现在&#…

ollama+FastAPI部署后端大模型调用接口

ollamaFastAPI部署后端大模型调用接口 记录一下开源大模型的后端调用接口过程 一、ollama下载及运行 1. ollama安装 ollama是一个本地部署开源大模型的软件,可以运行llama、gemma、qwen等国内外开源大模型,也可以部署自己训练的大模型 ollama国内地…

pandas系列----DataFrame简介

DataFrame是Pandas库中最常用的数据结构之一,它是一个类似于二维数组或表格的数据结构。DataFrame由多个列组成,每个列可以是不同的数据类型(如整数、浮点数、字符串等)。每列都有一个列标签(column label)…

Unity【Colliders碰撞器】和【Rigibody刚体】的应用——小球反弹效果

目录 Collider 2D 定义: 类型: Rigidbody 2D 定义: 属性和行为: 运动控制: 碰撞检测: 结合使用 实用检测 延伸拓展 1、在Unity中优化Collider 2D和Rigidbody 2D的性能 2、Unity中Collider 2D…

Java实现UDP与TCP应用程序

三、Java实现UDP应用程序 3.1 InetAddress类 java.net.InteAddress类是用于描述IP地址和域名的一个Java类; 常用方法如下: public static InetAddress getByName(String host):根据主机名获取InetAddress对象public String getHostName()…

信号处理-消除趋势项

matlab 版本 python 版本 import numpy as np import matplotlib.pyplot as plt from matplotlib import rcParams# 设置中文字体 rcParams[font.sans-serif] [SimHei] # 设置默认字体为黑体 rcParams[axes.unicode_minus] False # 解决负号显示问题def compute_time(n, f…

Linux 安装 meilisearch

前言 由于项目部分数据需要用到搜索引擎进行检索,但是服务器资源有限,安装elasticsearch过于笨重,不太符合现实情况,所以选择了meilisearch作为搜索引擎来使用,目前使用接近一年,运行良好。 安装 在/usr/…

【C++数据结构——查找】二叉排序树(头歌实践教学平台习题)【合集】

目录😋 任务描述 相关知识 1. 二叉排序树的基本概念 2. 二叉排序树节点结构体定义 3. 创建二叉排序树 4. 判断是否为二叉排序树 5. 递归查找关键字为 6 的结点并输出查找路径 6. 删除二叉排序树中的节点 测试说明 通关代码 测试结果 任务描述 本关任务&a…

TCP与DNS的报文分析

场景拓扑: 核心路由配置: 上(DNS):10.1.1.1/24 下(WEB):20.1.1.1/24 左(client):192.168.0.1/24 右(PC3):192.168.1.1/24Clint2配置&a…

OpenHarmony通过挂载镜像来修改镜像内容,RK3566鸿蒙开发板演示

在测试XTS时会遇到修改产品属性、SElinux权限、等一些内容,修改源码再编译很费时。今天为大家介绍一个便捷的方法,让OpenHarmony通过挂载镜像来修改镜像内容!触觉智能Purple Pi OH鸿蒙开发板演示。搭载了瑞芯微RK3566四核处理器,树…

linux ansible部署

ansible部署完后,执行报错 # ansible one -i hosts -m ping dataos193 | FAILED! > {"msg": "Using a SSH password instead of a key is not possible because Host Key checking is enabled and sshpass does not support this. Please add …

【微服务】3、配置管理

微服务配置管理 已掌握的微服务组件及配置管理问题引出 已掌握注册中心、Openfan、远程调用、负载均衡、网关等组件,具备微服务开发能力,但仍存在其他问题待解决。微服务和网关存在大量配置文件,其中包含很多重复配置,如数据库、日…

C# 事件

目录 1、事件模型的5个组成部分2、使用内置委托类型声明事件2.1 EventHandler2.1.1 &#xff1f;2.1.2 this2.1.3 使用匿名函数和lamda表达式2.1.3.1 匿名函数2.1.3.2 lamda表达式 2.1.4 异常处理 2.2 EventHandler<TEventArgs> 3、使用自定义委托类型声明事件3.1 事件的…

php反序列化原生态 ctfshow练习 字符串逃逸

web262 拿着题审计一下 <?php error_reporting(0); class message{public $from;public $msg;public $to;public $tokenuser;public function __construct($f,$m,$t){$this->from $f;$this->msg $m;$this->to $t;} }$f $_GET[f]; $m $_GET[m]; $t $_GET[t…

【C语言程序设计——循环程序设计】利用循环求数值 x 的平方根(头歌实践教学平台习题)【合集】

目录&#x1f60b; 任务描述 相关知识 一、求平方根的迭代公式 1. 原理 2. 代码实现示例 二、绝对值函数fabs() 1. 函数介绍 2. 代码示例 三、循环语句 1. for循环 2. while循环 3. do - while循环 编程要求 测试说明 通关代码 测试结果 任务描述 本关任务&…

使用 Three.js 创建动态粒子效果

今天&#xff0c;带大家使用粒子实现一个粒子飞毯的效果&#xff0c;我们先来看一下效果。 实现 初始化场景 首先创建一个场景&#xff0c;所有 3D 对象都会被添加到这个场景中。 const scene new THREE.Scene();相机和渲染器 配置相机和渲染器来捕捉和显示场景。 相机…

20250103在Ubuntu20.04.5的Android Studio 2024.2.1.12中跑通Hello World

20250103在Ubuntu20.04.5的Android Studio 2024.2.1.12中跑通Hello World 2025/1/3 14:06 百度&#xff1a;android studio helloworld android studio hello world kotlin helloword kotlin 串口 no run configurations added android studio no run configurations added 1、…

c#使用SevenZipSharp实现压缩文件和目录

封装了一个类&#xff0c;方便使用SevenZipSharp&#xff0c;支持加入进度显示事件。 双重加密压缩工具范例&#xff1a; using SevenZip; using System; using System.Collections.Generic; using System.IO; using System.Linq; using System.Text; using System.Threading.…