每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/
最近,谷歌发布了其自主研发的AI图像生成器——Imagen 2.0。这一版本产生的图像逼真得令人咋舌,让人难以辨认真假。在这篇文章中,我想将Imagen 2和另一个大型AI图像生成器——OpenAI的Dall-E 3进行比较,看看这两者都能做些什么。
在比较测试中,我将使用谷歌在Imagen 2发布公告中发布的示例图片,以及用于Dall-E 3的ChatGPT。我还会添加所有图像提示,以便你也可以尝试它们。
让我们开始吧。
提示#1
一个32岁的女性,正在崭露头角的环保主义者,在丛林中;体态健美,短卷发,面带温暖的微笑
显而易见,Imagen 2生成的图像比Dall-E 3更为逼真,特别是在肤质和头发细节上,这些是AI图像生成器常常挣扎的地方。
提示#2
一个橙子放在砧板上的小画布油画。光线穿过橙片,投射在砧板的一部分上,背景有蓝白相间的布。焦散光,反射光,表现力强的笔触
左侧图像的柔和色调赋予了它照片般的现实效果。但Dall-E 3对背景中的蓝白布料的再现更为准确。
提示#3
知更鸟从常春藤的摇摆喷雾中飞到墙顶,它张开嘴唱出了响亮而美妙的颤音,只是为了炫耀。世界上没有什么比炫耀时的知更鸟更可爱了——而且它们几乎总是在做这个。
Imagen 2在这一提示中生成了一只极其逼真的知更鸟,堪比《国家地理》杂志的摄影。然而,Dall-E 3的解读感觉更为异想天开和表现力丰富,捕捉到了描述中的可爱本质。两种不同的处理方法,都令人印象深刻。
提示#4
一杯草莓酸奶,杯侧写着“Delicous”,放在木质桌面上。酸奶杯旁是一盘吐司和一杯橙汁。
这个示例揭示了Dall-E 3在文本生成能力上的不一致性,因为它没有包含提示中指定的“Delicious”细节。Imagen 2在这里的表现则完全准确。
提示#5
代表智能的抽象logo,为一个企业AI平台设计,“Vertex AI”写在logo下方。
这真的很酷。两个AI系统都令人印象深刻地渲染出了“Vertex AI”文字。然而,Imagen 2以其简约、专业的logo设计稍胜一筹,非常适合企业平台。两方面都做得很好。
提示#6
一支牙膏,上面写着“CYMBAL”,放在浴室台面上,用于广告。
与之前的文本示例相似,Dall-E 3在输入正确的“CYMBAL”品牌上出人意料地挣扎,而Imagen 2的表现则准确无误。这表明了Dall-E 3在文本生成能力上的不一致性。
提示#7
一幅以马赛克风格的人像,其特征由一系列小巧、多彩的瓷砖组成。
在这里,两款AI工具都表现出色——马赛克肖像作品色彩鲜艳、引人注目。我个人稍微偏好Imagen 2的构图,但两种解释都富有创造性。
提示#8
深蓝背景下的水母
这是个关于风格口味的问题——Imagen 2达到了水母的照片级真实性,而Dall-E 3则提供了更具艺术感的插画式呈现。你更喜欢哪一个?
提示#9
考虑海洋的微妙之处;它最可怕的生物如何在水下滑行,大部分时候都不显眼,诡秘地隐藏在最美丽的湛蓝色调下
这个提示是《白鲸记》中的一段摘录。因此,Imagen 2生成了一幅鲸鱼的抽象画。而Dall-E 3仅生成了一个随机的水下场景。
最后的想法
看了Imagen 2和Dall-E 3的图像结果,我可以说前者生成的图像更加逼真和一致。当然,现在得出结论还为时过早,因为这些是从Imagen 2中挑选的图像。一旦开放API或测试环境,我将进行更深入的比较并为你们撰写另一篇比较测试文章。
我希望这次比较能让你了解这些AI图像生成器之间的差异。我还将进行Imagen 2和Midjourney V5的比较,因此请务必关注并订阅,以便在发布时获得通知。