OneDiff加速“图生生”,解锁电商AI图像处理新范式

2024年,电商领域正目睹生成式AI软件工具的飞速发展,AI Generated Content (AIGC) 技术在电商应用中的普及率正在显著提升,这类技术能够显著提高商业运营的效率,并促进业绩的稳步增长。

硅基流动研发的图片/视频生成推理引擎OneDiff能够以高性能和低成本的优势为AIGC应用程序提供支持。因其加速性能突出、部署简单、稳定性高的特点,南京一言万相网络科技有限公司的图生生团队在实测对比多个推理加速引擎后选择了OneDiff,并在AI图像智能擦除工具中率先应用,显著提高了用户体验。

作者|图生生团队

“图生生”是为电商行业量身打造的一体化人工智能解决方案,运用先进的AI技术,为商家提供高效且成本低廉的高质量图片制作服务。我们平台的主要功能包括:AI商品图自动生成、AI基础绘图、AI图片编辑以及AI模型训练等。

图生生能够为电商商家提供商品实拍图模特及场景替换解决方案,多维赋能商家低成本、分钟级生成多元风格的高清商品图,以便批量产出新的营销物料,尤其面向国内、海外市场千万家以上中小型电商企业与广告主,主要解决传统实拍成本高与周期慢的痛点。

1

业务挑战与技术选型

我们专为电商环境打造的AI图像智能擦除工具,旨在帮助用户迅速去除商品图片中不必要的内容。该工具经过深度训练和优化,能够轻松去除图片中的文字、人物等元素。用户仅需用画笔在想要清除的区域轻轻涂抹,即可高效完成擦除,并自动生成与原背景和谐相融的内容。

在该项目的开发过程中,我们面临两大主要挑战:首先是构建高质量的训练数据集。在数据集构建环节,我们投入了大量的工作,涵盖了数据的清洗和标注等多个方面。其次是开发可信赖的训练代码。在训练阶段,我们充分利用了多卡训练资源,进行了大量的超参数优化(HPO)实验。此外,在产品上线后,用户反馈响应速度较慢,这直接影响了用户体验。

我们的技术团队早期就跟进过OneFlow的产品进展,了解到袁进辉老师的新创业方向硅基流动(SiliconFlow)后,得知了OneDiff的产品讯息,决定进行尝试。


结果证明,团队的AI图像智能擦除工具引入OneDiff后,显著提高了用户体验,同时保持了擦除效果的稳定性,为业务发展带来了正面效益。

a1b99fe9fbde8f86e13a624c53d45c4b.png

相较于其他加速引擎,OneDiff在加速效果和使用体验上都表现出色,不仅在大多数使用场景下都展现出优于其他引擎的加速效果,而且对现有代码的侵入性极低,只需简单几行代码即可实现推理加速。此外,OneDiff直接兼容PyTorch,简化了整个部署流程,提高了团队的开发效率。

5ac6f1de04108025162e5a71895d4723.png

尤其在优化产品中的图像生成推理性能时,我们对比测试了多个框架,发现OneDiff在加速性能上的表现最为突出,同时它保证了图像质量和原生PyTorch的一致性(注:DeepCache是有损加速。如果效果可接受,那么OneDiff可组合DeepCache一起使用,性能最高加速3倍)。

这进一步证明,OneDiff是产品优化过程中的理想选择。目前,我们已经计划在后续阶段开始试用OneDiff企业版。

2

业务场景展示

1.商品背景图:只需一张SKU产品图,快速生成千人千面产品场景图

使用图生生生成AI商品背景图,无需等待,出图效率高,出错率低。

功能支持:

(1)推荐场景:挑选合适的推荐场景生成商品图

e2a7d1713f730e630f685b2c2509a5fc.png

(2)参考场景:上传参考商品图,一键即可生成相似风格商品图

d30ec48d71e76b6c2cb501dc2efe111b.png

(3)自定义描述:根据特定描述语,也可同时配合参考图,生成高度可控的,多种风格的商品图

cc272216d2fdf977c41eff00aef2bfd2.png

2. 文生图:简单的文字描述,AI直接生图

图生生在简单易用性与专业生成效果之间取得平衡,以模块化的场景图模版代替传统视觉大模型流行的文生图。描述出一个专业的商品图场景需要专业的提示词表达,而大多数普通商家并不具备相关能力。

我们可以将适用在各个品类中的通用的部分加以提炼,按照不同品类的出图需求和特点,采用个性化的方式(算法、工程)区别对待,形成针对各个细分和垂直领域的专属解决方案。

224c65c0acba86960c8ee687fcebf9c7.png

3. AI图片编辑工具:自动化后期修图,高精度还原商品细节

该系列工具可以用于自动化生成电商主图,能够基于商品的属性、特点、评价等信息,创作高质量的商品图,增强商品的展示效果和吸引力。告别Photoshop中复杂的钢笔工具抠图,该工具允许用户仅用简单几笔勾勒出对象轮廓,随后一键实现智能抠图,操作简便,小白也能轻松上手。

97f6fa2c0538eaa563b9f9a897b6a556.png

4. 企业服务:提供贴合企业需求的定制方案,包含算力、模型、产品的一站式解决方案

对于初创公司而言,无论是训练模型还是图片后期的优化,都离不开语料库的积累、高质量数据输入以及对特定场景和行业的深入理解。客户方、平台方联合共创在初期是必经之路。通过专门为不同行业构建高效的数据集,并对模型参数进行持续的训练和优化,我们实现了对人工智能生成图片效果的更精确和成本效益的控制。

a1b7659648f28aa9255d0fcd26dfb564.png

3

结语

AI图像擦除工具是我们首次在生产环境中尝试OneDiff,我们计划将OneDiff的应用场景扩展到更多领域,包括文本生成图像、商品图像处理以及图像局部重绘等多个方面,以进一步提升我们产品的效率和性能。我们期待OneDiff能够提供更迅速而稳定的加速效果,并及时整合新的开源算法,支持更多种类的算法应用。

电商行业拥有庞大的市场容量和多样化的目标客户群。电商企业通常具有较高的数字化水平,对新科技的接纳能力强。在确保数据合规与安全的前提下,图生生团队致力于满足各行业和不同场景对AIGC的需求,高效地解决商家在图片素材处理上的需求,同时显著减少产品开发的时间和成本投入。未来,我们将不断提升模型的精度、扩展功能和适应更广泛的应用场景。

【OneDiff v0.12.1 正式发布(生产环境稳定加速SD&SVD)】本次更新包含以下亮点,欢迎体验新版本:github.com/siliconflow/onediff

*  SDXL 和 SVD 的 SOTA 性能更新

*  全面支持SD和SVD动态分辨率运行

*  编译/保存/加载HF Diffusers的pipeline

*  HF Diffusers的快速LoRA加载和切换

*  加速了 InstantID(加速1.8倍)

*  加速了 SDXL Lightning

b673bf7a205d394d4d5126d048380c2f.png

(SDXL E2E Time)

aa49c324f5f4f1e535a65346119b0b46.png

(SVD E2E Time)

更多详情:https://www.reddit.com/r/StableDiffusion/comments/1b8t3cu/onediff_v0121_is_releasedstable_acceleration_of/

其他人都在看

  • 800+页免费“大模型”电子书

  • 揭示语言大模型的采样过程

  • 混合输入矩阵乘法的性能优化

  • 强化学习之父:通往AGI的另一种可能

  • 好久不见!OneFlow 1.0全新版本上线

  • LLM推理入门指南:文本生成的初始化与解码

  • AIGC效率利器:OneDiff让图片/视频生成加速3倍

3e5eac7303dee6822577f376d1a44e1a.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/497153.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

近线数仓优化改造

近线数仓优化改造 1. 背景2. 优化3. 改造3.1. 重构3.2. 优化 1. 背景 大概就是有那么一个数仓,然后简略结构如下: #mermaid-svg-PVoUzuQhj2BK7Qge {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid…

Linux系统中的软件管理

如何让虚拟机上网 # 1.Linux中软件包的类型 # (1)DEB #UBlinux DEBlinux (2)RPM #redhat centOS fadora (3)bz2|gz|xz #1.需要源码安装需要编译 #2.绿色软件&…

PDFgear:一款免费的PDF编辑、格式转化软件

日常办公中,很多朋友都会接触到PDF文件。把文件转化成PDF是保留文件格式、防范别人修改常用的方法。但是很多人会为PDF文件的生成、压缩、编辑和格式转化而头疼,还有人为了能把PDF转化成Word还购买了不少付费的软件。 为了解决大家这个痛点,…

2024 ccfcsp认证打卡 2023 03 02 垦田计划

import java.util.*;public class Main {public static void main(String[] args) {Scanner input new Scanner(System.in);int N 100100; // 定义一个较大的常数Nlong[] t new long[N]; // 存储任务的耗时long[] c new long[N]; // 存储每块区域投入资源的数量long[] c…

【推导结果】如何得到 回归均方误差 估计系数的标准误

对线性回归模型系数标准差标准误的理解 1.生成数据 yxe3.610.633.42-1.387.631.017.44-1.0111.651.3811.46-0.63 2.回归 y β 0 β 1 x ϵ y \beta_{0}\beta_{1}x\epsilon yβ0​β1​xϵ y i β 0 β 1 x i e i y_{i}\beta_{0}\beta_{1} x_{i}e_{i} yi​β0​β1​xi…

Linux第84步_了解Linux中断及其函数

1、中断号 中断号又称中断线&#xff0c;每个中断都有一个中断号&#xff0c;通过中断号即可区分不同的中断。 2、Linux中断API函数 需要包含头文件“#include <linux/interrupt.h>” 1)、在使用某个中断功能的时候&#xff0c;需要执行“申请中断” int request_irq(…

如何压缩视频到最小?教会你压缩原理~

在网上上传视频时&#xff0c;经常会遇到因为视频体积过大上传失败等情况发生&#xff0c;怎么降低视频体积呢&#xff1f;科普一个小知识&#xff1a;视频体积和视频的时长、编码格式、分辨率和比特率&#xff08;又称码率&#xff09;有关。视频文件大小计算公式&#xff1a;…

掼蛋怎么开牌

一、强牌出单张 1、只有打完小单张&#xff0c;才能争得头游。特别是有两三手小牌&#xff0c;必须要先出掉一两手。 2、首发单张&#xff0c;特别是5以下的小单牌&#xff0c;即先打小牌。表明是强牌。尤其是在贡牌后首发小单牌&#xff0c;属于“明知山有虎&#xff0c;偏向…

13.Java能干什么?以及Java的三大平台

文章目录 一、JavaSE二、JavaME三、JavaEE JAVA从95年以来&#xff0c;已经问世了20多年了&#xff0c;可能比部分同学的年龄还大。 Java到底能干嘛呢&#xff0c;此时就需要讲到Java的三大平台&#xff0c;其实也就是它的三个分类&#xff1a;JavaSE、JavaME、JavaEE。 一、Ja…

【Web应用技术基础】CSS(5)——表格样式

第一题&#xff1a;表格边框 .html <!DOCTYPE html> <html><head><meta charset"UTF-8" /><title>HTML – 简单表格</title><link rel"stylesheet" href"step1/CSS/style.css"></head><bod…

Git 命令总览

Git Git 是一个版本控制系统&#xff0c;用于管理项目代码。通过 Git 可以轻松地进行代码的提交、更新和合并&#xff0c;确保项目代码的安全性和稳定性。同时&#xff0c;Git 还提供了丰富的工具和功能&#xff0c;如分支管理、代码审查、版本回退等&#xff0c;帮助开发更好…

docker容器内存检测排查

查询容器使用内存 在运维当中&#xff0c;你会发现内存很彪的高&#xff0c;但是如何判断为什么会高&#xff0c;是什么样的程序造成的呢&#xff1f;赶快使用 top&#xff0c;或者 free -h或者 ps -v。是吗&#xff1f;道理是对的。 但是你会发现&#xff0c;全部都是docker…

Java_19 罗马数字转整数

罗马数字转整数 罗马数字包含以下七种字符: I&#xff0c; V&#xff0c; X&#xff0c; L&#xff0c;C&#xff0c;D 和 M。 字符 数值 I 1 V 5 X 10 L 50 C 100 D 500 M 1…

如何扫码登记信息?二维码登记信息更加简单快捷

现在很多场所会通过生成二维码的方式来做人员信息登记或者人员签到&#xff0c;那么这种扫描二维码填写信息的制作技巧是什么样的呢&#xff1f;想要做出这种效果&#xff0c;那么需要生成表单二维码&#xff0c;准备好问题和说明&#xff0c;通过专业工具的功能就可以轻松完成…

Redis中的LRU算法分析

LRU算法 概述 Redis作为缓存使用时&#xff0c;一些场景下要考虑内容的空间消耗问题。Redis会删除过期键以释放空间&#xff0c;过期键的删除策略 有两种: 1.惰性删除:每次从键空间中获取键时&#xff0c;都检查取得的键是否过期&#xff0c;如果过期的话&#xff0c;就删除…

轻松上手,小白也能免费部署自己的炫酷静态网站!(如何免费搭建个人网站)

文章目录 📖 介绍 📖🏡 演示环境 🏡📒 使用方法 📒📝 操作步骤📝 更换主题⚓️ 相关链接 ⚓️📖 介绍 📖 在互联网时代,拥有一个个人网站无疑是展示自我、分享知识或建立品牌形象的有效途径。然而,许多人在追求这一目标的过程中,常常因为成本、时间和技…

【C++】1320. 时钟旋转(1)

问题 类型&#xff1a;整数运算 题目描述&#xff1a; 时钟上面的时针从 m 时走到 n 时旋转了多少度&#xff1f;&#xff08;m≤n&#xff0c;且 m 和 n 都是1∼12之间的整数&#xff09;。 输入&#xff1a; 2 个整数 m 和 n。 输出&#xff1a; 1 个整数代表时针旋转的…

[数据结构]插入和希尔排序

一、插入排序 插入排序的代码实现虽然没有冒泡排序和选择排序那么简单粗暴&#xff0c;但它的原理应该是最容易理解的了&#xff0c;因为只要打过扑克牌的人都应该能够秒懂。插入排序是一种最简单直观的排序算法&#xff0c;它的工作原理是通过构建有序序列&#xff0c;对于未排…

全球金融市场的汇率与政策利率演变:历史与未来的交汇

根据国际货币基金组织&#xff08;IMF&#xff09;等平台的数据&#xff0c;整理了全球各国的兑美元汇率&#xff0c;短期利率、长期利率、政策利率数据&#xff0c;时间范围最新至2024年3月&#xff0c;希望对大家有所帮助 一、数据介绍 数据名称&#xff1a;全球各国汇率、短…

O2OA(翱途)开发平台-快速入门开发一个门户实例

O2OA(翱途)开发平台[下称O2OA开发平台或者O2OA]拥有门户页面定制与集成的能力&#xff0c;平台通过门户定制&#xff0c;可以根据企业的文化&#xff0c;业务需要设计符合企业需要的统一信息门户&#xff0c;系统首页等UI界面。本篇主要介绍通过门户管理系统如何快速的进行一个…