Stable Diffusion V3测评

1.引言

3月5号,Stability AI发布了介绍Stable Diffusion V3的研究论文,链接地址:戳我
在这里插入图片描述

这是目前他们发布的最先进、功能最强大的图像生成器,与一年多前发布的令人印象深刻的 Stable Diffusion V2.1 相比有了大幅升级。SD3所带来的新功能如下:支持文本渲染、性能更优、更好的图像生成质量。

外网有博客尝试把SD3 生成的图像与两款最流行、功能最强大的人工智能图像生成器Midjourney V6Dall-E 3 做了比较,这里对测评结果进行了相应的转述。

2.测评一

测试一的文本提示词如下:

Photo of a red sphere on top of a blue cube. Behind them is a green triangle, on the right is a dog, on the left is a cat

一张红色球体位于蓝色立方体之上的照片。后面是一个绿色三角形,右边是一只狗,左边是一只猫

我们先来看下SD3的生成效果:
在这里插入图片描述

让人眼前一亮的是猫和狗脖子上的绿色色调。看来 SD3 能够理解环境并模拟光的反射。

相比之下,Midjourney V6Dall-E 3 的图像虽然给人留下了深刻印象,但却在不同方面有所欠缺。二者根据上述提示词所生成的图像分别如下:

在这里插入图片描述
在这里插入图片描述

对比上述结果,Midjourney V6 奇怪地将动物放在蓝色方块上,而 Dall-E 3 的结果则令人费解,文不对题。在这一轮比赛中,SD3 以实际符合提示要求而获得第一名。

3.测评二

实验二的文本提示词如下所示:

Resting on the kitchen table is an embroidered cloth with the text ‘good night’ and an embroidered baby tiger. Next to the cloth there is a lit candle. The lighting is dim and dramatic

灶台上放着一块刺绣布,上面写着 "晚安 "和一只刺绣小老虎。布的旁边有一支点燃的蜡烛。灯光昏暗而富有戏剧性

按照惯例,我们先来看下SD3的表现:

在这里插入图片描述

这张特写照片非常漂亮。我喜欢它将边缘模糊化,而将重点放在老虎和文字上。刺绣的细节也非常棒。大家几乎可以感觉到针脚的刮擦纹理,以及随着针脚变化所带来的模糊效果。

接下来我们看下竞争对手的效果,依次为MidjourneyDall-E3的效果:
在这里插入图片描述
在这里插入图片描述

Midjourney 一如所料,采用了标志性的暗色调和精准的灯光。Dall-E 3在这方面也做得很好,尽管他们都增加了一些提示中没有的其他元素。

个人看法,SD3严格遵守了提示词的要求,所以这一轮测评中它是赢家…不过, Midjourney 的艺术诠释也很让人着迷。

4.测评三

实验三的文本提示词如下所示:

Photo of an 90’s desktop computer on a work desk, on the computer screen it says “welcome”. On the wall in the background we see beautiful graffiti with the text “SD3” very large on the wall.

办公桌上 90 年代台式电脑的照片,电脑屏幕上写着 “欢迎”。背景墙上有美丽的涂鸦,"SD3 "字样非常醒目。

首先,我们先来看下SD3的表现:
在这里插入图片描述

巨大的文字与背景融合得天衣无缝。注意字体的一致性。看起来就像是直接从 Photoshop 中生成的插图。

现在,让我们看看 Midjourney Dall-E 3 的表现:

在这里插入图片描述
在这里插入图片描述

就风格和细节而言,Midjourney很容易入选。但提示要求在墙上写很大的文字,而Midjourney在细节上没有做到这一点。因此,就连贯性而言,SD3 是最佳选择。Dall-E 3 的结果相对逊色不少。

5.总结

从测试图像来看,SD3 显然在文本生成和提示词连贯性方面表现出色,可以说超越了其强大的竞争对手。不过,就图像质量和风格而言,我仍然认为 Midjourney在一些场景下也不容小觑。 但是,与竞争对手不同,Stable Diffusion 一直是开源的,完全免费!这意味着大家很快就能下载 SD3 并在本地免费运行。但这也有一个巨大的弊端,那就是可能会引发严重的社会伦理问题。试想一下,更令人难以区分的深度伪造图像和视频的危害性有多大。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/434072.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

机器视觉 /从bottle.hdev示例程序开启HalconHDevelop征程

文章目录 概述示例程序bottle.hdev源码Step 0: PreparationsStep 1: Segmentation - 读取并显示图片Step 1: Segmentation - 创建并设置OCR模型Step 1: Segmentation - 文本分割与识别计算结果显示内存释放 导出为C代码导出为C代码配置 VS Halcon 环境VS程序执行结果HTuple hv…

代码随想录day13(1)栈与队列:用栈实现队列(leetcode232)

题目要求:使用栈实现push、pop、empty、peek(返回队列首部元素)。 思路:本题思路比较容易,即用两个栈模拟即可,pop时只需要先判断stackout栈是否为空,如果不空直接弹出,如果空就将s…

数据库-ER图教程

一.什么是E-R图 E-R图全称:“Entity-Relationship Approach”,是一种“实体-联系”方法。 E-R图的优点: 1.自然地描述现实世界。 2.图形结构简单。 3.设计者和用户易理解。 4.是数据库设计的中间步骤,易于向数据模型转换。 …

SSM框架,SSM框架的整合

SSM整合的介绍 微观:将Spring SpringMVC Mybatis框架应用到项目中 SpringMVC框架负责控制层Spring 框架负责整体和业务层的声明式事务管理MyBatis框架负责数据库访问层 宏观:Spring接管一切(将框架核心组件交给Spring进行IoC管理&#xff09…

贝叶斯:最大似然估计与最大后验估计

最大似然估计 最大后验估计 《神经网络与深度学习》 Neural Networks and Deep Learning 邱锡鹏 P36-37

网康科技 NS-ASG 应用安全网关 SQL注入漏洞复现(CVE-2024-2022)

0x01 产品简介 网康科技的NS-ASG应用安全网关是一款软硬件一体化的产品,集成了SSL和IPSec,旨在保障业务访问的安全性,适配所有移动终端,提供多种链路均衡和选择技术,支持多种认证方式灵活组合,以及内置短信认证、LDAP令牌、USB KEY等多达13种认证方式。 0x02 漏洞概述 …

python+django+vue电影票订购系统dyvv4

电影院订票信息管理系统综合网络空间开发设计要求。目的是将电影院订票通过网络平台将传统管理方式转换为在网上操作,方便快捷、安全性高、交易规范做了保障,目标明确。电影院订票信息管理系统可以将功能划分为用户和管理员功能[10]。 语言:…

云原生基础知识:容器技术的历史

容器化的定义: 容器化是一种轻量级的虚拟化技术,将应用程序及其所有依赖项(包括运行时、系统工具、系统库等)打包到一个称为容器的单独单元中。容器提供了一种隔离的执行环境,使得应用程序可以在不同的环境中运行&…

list链表的创建,排序,插入, test ok

1. 链表的建立&#xff0c;打印 #define _CRT_SECURE_NO_WARNINGS #include <stdio.h> #include <stdlib.h> #include <stack> #include <iostream> #include <string.h> #include <string>using namespace std;struct node {int data;s…

一体化对账和结算平台的设计与实现

随着企业规模的扩大和业务的复杂化&#xff0c;对账和结算工作变得愈发繁琐和复杂。为了提高工作效率和降低错误率&#xff0c;许多企业开始寻求一体化对账和结算平台的解决方案。本文将探讨一体化对账和结算平台的设计原则和实施步骤&#xff0c;以及其在企业管理中的重要性。…

jdk安装,配置path系统变量

直接点击安装 不要包含空格&#xff0c;中文字符 3.找到刚刚的路径&#xff0c;看一下&#xff0c;有东西就说明安装对了 配置path winr输入sysdm.cpl点击确定 全部依次点击 确定 即可。 验证jdk是否安装成功 看java、javac是否可用看java、javac版本号是否无问题 win…

about batch[0].new(storage)的问题(VOT)

最近在处理VOT数据集时&#xff0c;遇到了一个奇怪的问题&#xff0c;特此记录。 源代码如下&#xff1a; def ltr_collate_stack1(batch):"""Puts each data field into a tensor. The tensors are stacked at dim1 to form the batch"""error…

Java多线程——synchronized、volatile 保障可见性

目录 引出synchronized、volatile 保障可见性Redis冲冲冲——缓存三兄弟&#xff1a;缓存击穿、穿透、雪崩缓存击穿缓存穿透缓存雪崩 总结 引出 Java多线程——synchronized、volatile 保障可见性 synchronized、volatile 保障可见性 原子性&#xff1a;在一次或者多次操作时…

[动态规划]---part2

前言 作者&#xff1a;小蜗牛向前冲 专栏&#xff1a;小蜗牛算法之路 专栏介绍&#xff1a;"蜗牛之道&#xff0c;攀登大厂高峰&#xff0c;让我们携手学习算法。在这个专栏中&#xff0c;将涵盖动态规划、贪心算法、回溯等高阶技巧&#xff0c;不定期为你奉上基础数据结构…

python基础第二天

世界杯小组赛成绩 注意&#xff1a; 1.循环 1.1while 1.2for 1.3 range 1.4 while else while 循环正常执行完才能执行else语句

算法竞赛基础:树状数组

算法竞赛基础&#xff1a;树状数组 是什么&#xff1f; 树状数组虽然语义上是树状&#xff0c;但是实际上还是一个数组。 树状数组的功能就是单点和区间的修改和查询。 例如&#xff0c;如果想增加一个点的值&#xff0c;那么你需要让其上方所有能对齐的树状数组c全部增加相同…

流畅的Python(十七)-使用future处理并发

一、核心要义 主要以三个模拟网络下载的代码-分别是依序下载、使用concurrent.futures模块中的Executor.map方法、以及使用该模块的executor.submit和futures.as_completed方法&#xff0c;来展示Python实现并发编程的其中一种方式。 二、代码示例 1、依序下载的脚本 #!/us…

JS数组,if等结构语序

目录 浏览器的断点调试&#xff1a; 流程控制&#xff1a; 顺序流程控制&#xff1a;流程代码会逐行向下进行。 分支流程控制&#xff1a; IF语句&#xff1a; Switch语句&#xff1a; Switch和if的区别&#xff1a; 三元表达式&#xff1a; 循环&#xff1a; for循环…

XSS漏洞--概念、类型、实战--分析与详解[结合靶场pikachu]

目录 一、XSS概念简述 1、XSS简介&#xff1a; 2、XSS基本原理&#xff1a; 3、XSS攻击流程&#xff1a; 4、XSS漏洞危害&#xff1a; 二、XSS类型&#xff1a; 1、反射型XSS&#xff1a; 2、存储型XSS&#xff1a; 3、DOM型XSS&#xff1a; 三、靶场漏洞复现(pikach…

数据结构之顺序表及其实现!

目录 ​编辑 1. 顺序表的概念及结构 2. 接口的实现 2.1 顺序表的初始化 2.2 检查顺序表容量是否已满 2.3 顺序表的尾插 ​编辑 2.4 顺序表的尾删 2.5 顺序表的头插 2.6 顺序表的头删 2.7 顺序表在pos位置插入 2.8 顺序表在pos位置删除 2.9 顺序表的查找 2.10 顺…