AI绘画如何打造高质量数据集?

遇到难题不要怕!厚德提问大佬答!

厚德提问大佬答11

你是否对AI绘画感兴趣却无从下手?是否有很多疑问却苦于没有大佬解答带你飞?从此刻开始这些问题都将迎刃而解!你感兴趣的话题,厚德云替你问,你解决不了的困难,大佬替你来解决!

欢迎各位阅读《厚德提问大佬答》栏目的第11期,这一期我们邀请了一位AI绘画的大佬,他的回答也非常专业!只要你有问题,在文章下方留言,我们会尽可能的邀请相关行业大佬替你解答!

AI绘画大佬 阿屿同学

QQ截图20240607150444.png

这次我们邀请到的是AI绘画大佬 “阿屿同学”大佬的模型在模型平台上拥有着不错的使用量!让我们来看看大佬能给我们带来哪些惊喜吧!

Q&A环节

数据集往往能够决定一张图片的风格、质量以及图片所带有的因素等等,制作一个高质量的数据集也是十分的耗时间,我想知道制作高质量的数据集十分有提高效率的窍门。

阿屿大佬给出了他自己的见解:“获取图片的渠道很多,最简单的就是找到高质量的图库直接进行购买,最省时间也是质量最好的办法,当然了这里也可以提供小窍门,你可以使用来源于Midjourney生成的高质量图像用于AI训练;也可以找找国内各大图库和包图网等创意素材网;但一定要注意版权来源。”

阿屿大佬还说:“如果你需要给你的产品做一个LORA模型,你需要构建一个用于AI训练图像的拍摄计划,主体物在室内白棚场景下的不同角度,正视、侧视、俯视、仰视图;在不同背景下产品的应用图片,在夜晚,在白天,搭配不同的背景数据集可以使模型在出图的时候更具有泛化性且光影随着提示词变幻但仍能保持主体比例统一具有细节。”

new_products_are_on_the_shelves_3.png

如果有一张图片的元素是我所需要的,我又想让这个图片变成另一种画风,AI绘画能够实现这样的操作吗?

阿屿大佬思考了一下回复道:“AI绘画可以实现风格迁移,我在实现风格迁移时我会更多地使用提示词调用大模型里的画风储备,在大模型无法达到目的时,我会选择训练LORA模型来进行稳定的风格出图,最近很火的黏土风转绘大火,在技巧上就是使用了图生图+LORA画风模型的办法。”

new_products_are_on_the_shelves_4.png

大部分模型的作者都会在生成的图片中带入自己的参数,使用作者给的参数能帮助我们生成的图像更接近于作者所生成的图像。大佬是否也会去使用其他作者的参数标准呢?

“我们津津乐道的stable diffusio各种各样的模型都是基于“Stability AI”这家公司开源的大模型进行微调,在开源文档中会提供基本的模型使用方法,比如出图分辨率,合适的VAE以及迭代等,帮助我们进行模型的调用,这一个参数的使用习惯也影响了很多的创作者,在我进行自己的模型训练时也会参考最原始的参数去进行调试,以适应不同创作者的使用习惯,在提示词和参数不变的情况下获得更棒的效果。”阿屿大佬再一次给出了自己的看法。

他说:“当然一些特殊的行业类模型,例如汽车的模型,因为训练时使用的训练集比例特征以及训练参数不同也会影响出图的最优参数,例如 在这个模型里横版图像比竖版图像出图的效果和细节要好很多,在迭代步数>30时候细节会更好,我会针对这一类特殊的模型做文档说明,帮助创作者更好地运用。”

对于一张图片的好与坏的评判标准往往是模糊的,如果站在专业的大佬的视角来看会不会有什么不同呢?大佬对图片好坏的评判标准是什么?

关于这个问题,阿屿大佬笑着回答:“一张图片的好坏还是蛮客观的,但也会有一些基本原则;图像是否忠诚于提示词生成图像有没有意外的噪点,我们俗称鬼图;对于细节的把握,在AI图像当中,人们更多会认为AI出一眼假,画不好手,画不好脸等;其他的更多是个人对于美学的看法不同因地制宜。”

总结

通过这次对阿屿大佬的采访,我们对AI绘画的具体细节又有了进一步的了解与认知,相信这些回答对你们会有一定的帮助!

如果你也对算力感兴趣或是有需求,欢迎搜索我们厚德云官方,又或者你此时有自己解不开的难题,那么可以在文章评论给我们留言,我们也会尽全力去回答帮助你们,我们下期厚德提问再见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/687772.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Windows搭建apache网站

1、官网下载安装包,注意下载服务器对应操作系统的安装包(此案例为64位操作系统) Apache VS17 binaries and modules downloadFor (business) webmasters, developers and home-users who want running always up to date Windows VS17 binar…

【造化弄人:计算机系大学生真的象当年的高速公路收费员一样吗?】

曾经高速公路的收费员是多么的自豪和骄傲,按照常逻辑,车是越来越多,收费员应该越来越多?但现实情况,大家有目共睹! 不论你的车子怎么跑,只要上高速就要交费,那时候的收费员&#xf…

qmt量化交易策略小白学习笔记第18期【qmt编程之获取对应周期的北向南向数据--方式2:原生python】

qmt编程之获取对应周期的北向南向数据 qmt更加详细的教程方法,会持续慢慢梳理。 也可找寻博主的历史文章,搜索关键词查看解决方案 ! 获取对应周期的北向南向数据 提示 该数据通过get_market_data_ex接口获取获取历史数据前需要先用downl…

【数据分析系列】交叉列联表与卡方检验:数据解读与Python实践应用

目录 一、交叉列联表和卡方检验的关系 (一)什么是交叉列联表 (二)什么是卡方检验 (三)除了卡方检验,列联表分析还可以结合其他统计方法 二、列联表只能用于两个分类变量吗? 三、…

解决富文本中抖音视频无法播放的问题——403

问题 富文本中的抖音视频无法播放,资源状态码是403禁止访问打开控制台,可以看到在项目中打开,数据请求的请求头多了一个Referer: http://localhost:3000/而复制链接在新窗口直接打开,请求头中并不会携带Referer 解决方案 在ind…

windows 系统通过 cmd 命令终止进程

windows 系统通过 cmd 命令终止进程 1、使用 netstat 命令查看特定端口的占用情况 例如,要查看端口号为 8015 的情况,可以执行以下命令: netstat -ano | findstr 8105此命令会显示所有占用端口 8105 的网络连接,并列出 PID&…

2009年408真题解析

2009年408真题解析 【2009.1】为解决计算机主机与打印机之间速度不匹配问题,通常设置一个打印数据缓冲区,主机将要输出的数据依次写入该缓冲区,而打印机则依次从该缓冲区中取出数据。该缓冲区的逻辑结构应该是。 A.栈 B.队列 C.树 D.图 …

2024-06-06 问AI: 在深度学习中,什么是欧几里德长度?

文心一言 在深度学习中,欧几里德长度(也称为欧几里得距离或欧氏距离)是一个常用的概念,它衡量的是在多维空间中两个点之间的真实距离,或者说是向量的自然长度(即该点到原点的距离)。以下是关于…

[职场] 缺点范文 #知识分享#经验分享#媒体

缺点范文 回答示范1: 我的公开演讲能力比较差,在公共场合讲话的时候我会感到紧张,不过谈论我熟悉的领域我会比较放松。所以当我需要做公开发言的时候,我必须要准备得很充分。我确实羡慕那些无论什么话题都能够高谈阔论的人。 回…

中国版Wayve决战端到端,等待数据的大力出奇迹

作者 |王博 编辑 |德新 「人工智能的定律只有一个,就是规模定律(Scaling Law),大力出奇迹。端到端是描述方式,更应该去考虑如何去生产更多的自动驾驶合适的数据,来喂养更大更合适的模型,取得更…

多目标应用:NSGA2求解无人机三维路径规划(MATLAB代码)

详细介绍 多目标应用:基于非支配排序的鱼鹰优化算法NSOOA求解无人机三维路径规划(MATLAB代码)-CSDN博客 一次运行结果 完整MATLAB代码 多目标应用:NSGA2求解无人机三维路径规划(MATLAB代码)

香港优才计划线上申请10大步骤,2024年流程截图,diy照做就可以

我是糖爸,已获批香港优才。10个步骤申请香港优才真的很简单,因为现在入境处只接受线上申请啦,你自己上传资料就可以,找中介也是你自己准备资料给他帮忙上传,何不自己动手上传呢,省个几万。 10大步骤分别是&…

吴恩达深度学习笔记:机器学习(ML)策略(1)(ML strategy(1))1.7-1.8

目录 第三门课 结构化机器学习项目(Structuring Machine Learning Projects)第一周 机器学习(ML)策略(1)(ML strategy(1))1.7 什么时候该改变开发/测试集和指…

智能视频监控平台LntonCVS视频融合共享平台保障露营安全解决方案

在当今社会,都市生活的快节奏和压力使得越来越多的人渴望逃离城市的喧嚣,寻求一种短暂的慢生活体验。他们向往在壮丽的山河之间或宁静的乡村中露营,享受大自然的宁静与美好。随着露营活动的普及,露营地的场景也变得更加丰富多样&a…

Three.js和Babylon.js,webGL中的对比效果分析!

hello,今天分享一些three.js和babylon.js常识,为大家选择three.js还是babylon.js做个分析,欢迎点赞评论转发。 一、Babylon.js是什么 Babylon.js是一个基于WebGL技术的开源3D游戏引擎和渲染引擎。它提供了一套简单易用的API,使开发…

UFS Explorer Professional Recovery: 如何从启用了 mSATA 缓存的 Drobo 设备中恢复数据

天津鸿萌科贸发展有限公司是 UFS Explorer Professional Recovery 数据恢复软件的授权代理商。 UFS Explorer Professional Recovery 数据恢复软件提供综合性的解决方案,用于解决复杂的数据恢复案例,包括那些采用特殊存储技术的案例,或介质受…

如何解决访问网站时IP被限制的问题?

在互联网上,用户可能会面临一个令人困扰的问题——当尝试访问某个特定的网站时,却发现自己的IP地址被该网站屏蔽。 IP地址被网站屏蔽是一个相对常见的现象,而导致这种情况的原因多种多样,包括恶意行为、违规访问等。本文将解释IP地…

jupyter notebook默认工作目录修改

jupyter notebook默认工作目录修改 1、问题2、如何修改jupyter notebook默认工作目录 1、问题 anaconda安装好之后,我们启动jupyter notebook会发现其默认工作目录是在C盘,将工作目录放在C盘会让C盘很快被撑爆,我们应该将jupyter notebook默…

日志分析集群最新版

日志分析集群-8版本 作者:行癫(盗版必究) 第一部分:Elasticsearch 一:环境准备 1.简介 ​ 部署模式:es集群采用无主模式 ​ es版本:8.13.4 ​ jdk版本:使用es内嵌的jdk21&#x…