- SVG 生成系列论文(一) 和 SVG 生成系列论文(二) 分别介绍了 StarVector 的大致背景和详细的模型细节。
- SVG 生成系列论文(三)和 SVG 生成系列论文(四)则分别介绍实验、数据集和数据增强细节。
- SVG 生成系列论文(五)介绍了从光栅图像(如 PNG、JPG 格式)转换为矢量图形(如 SVG、EPS 格式)的关键技术-像素预过滤(pixel prefiltering), Diffvg 这篇论文也是 SVG 生成与编辑领域中 “基于优化”方法的开创性研究。
- SVG 生成系列论文(六) 和 SVG 生成系列论文(七) 简要介绍了 IconShop 的背景、应用和部分细节。
- SVG 生成系列论文(八)则介绍了模型架构和具体的训练技巧。SVG 生成系列论文(九)详细地介绍了模型推理代码。
- SVG 生成系列论文(十)介绍了分层的矢量路径生成的算法。
- 本文则是(十)的前置工作,重点介绍通过 SVG 图像+文本的输入,实现 SVG 的定制化生成,如下图所示(a)是被定制化的对象(SVG 图像),(b)则是基于该输入 SVG 进一步生成的定制化图像,保留了原输入的主要特征。
-
背景:矢量图形在数字艺术中被广泛使用,并因其可扩展性和逐层拓扑特性而受到设计师的重视。
-
问题:然而,创建和编辑矢量图形需要创意和设计专业知识,因此是一个耗时的过程。
-
本文提出了一种新颖的流程,可以根据文本提示生成高质量的定制矢量图形,同时保留给定的示例 SVG 特征和逐层信息。
-
具体方法:
(1)该方法利用了大型预训练文生图模型的能力。通过微调模型的交叉注意力层,作者生成了基于文本提示的定制光栅图像(像素图像)。
(2)为了初始化SVG,作者引入了一种基于语义的路径对齐方法,该方法保留并转换了示例SVG中的关键路径。
(3)此外,作者使用图像级和矢量级损失来优化路径参数,重建目标图像,确保在与定制光栅图像对齐的同时实现平滑的形状变形,以保留路径的规则性。 -
评估:作者使用来自矢量级、图像级和文本级的多种指标对该方法进行了广泛评估。评估结果证明了该流程在生成多样化定制矢量图形方面的卓越质量和有效性。
具体算法细节:
- 给定一个示例SVG和一个文本提示词作为输入(a)
- (b)概念微调:通过微调预训练的 T2I 模型(Diffusion Model),根据文本提示生成定制光栅图像。
- (c)路径对齐:根据与定制光栅图像的语义对应,调整示例SVG中的重要路径,提供初始定制SVG。
- (d)路径优化:使用图像级和矢量级损失(Image-Level Loss, Vector-Level Loss)优化路径参数,以生成最终的定制 SVG(e)。
与现有方法的对比如下:
更多的示例如下: