【SVG 生成系列论文(十一)】如何定制化地生成 SVG 图案?Text-Guided Vector Graphics Customization

  • SVG 生成系列论文(一) 和 SVG 生成系列论文(二) 分别介绍了 StarVector 的大致背景和详细的模型细节。
  • SVG 生成系列论文(三)和 SVG 生成系列论文(四)则分别介绍实验、数据集和数据增强细节。
  • SVG 生成系列论文(五)介绍了从光栅图像(如 PNG、JPG 格式)转换为矢量图形(如 SVG、EPS 格式)的关键技术-像素预过滤(pixel prefiltering), Diffvg 这篇论文也是 SVG 生成与编辑领域中 “基于优化”方法的开创性研究。
  • SVG 生成系列论文(六) 和 SVG 生成系列论文(七) 简要介绍了 IconShop 的背景、应用和部分细节。
  • SVG 生成系列论文(八)则介绍了模型架构和具体的训练技巧。SVG 生成系列论文(九)详细地介绍了模型推理代码。
  • SVG 生成系列论文(十)介绍了分层的矢量路径生成的算法。
  • 本文则是(十)的前置工作,重点介绍通过 SVG 图像+文本的输入,实现 SVG 的定制化生成,如下图所示(a)是被定制化的对象(SVG 图像),(b)则是基于该输入 SVG 进一步生成的定制化图像,保留了原输入的主要特征。

在这里插入图片描述

  • 背景:矢量图形在数字艺术中被广泛使用,并因其可扩展性和逐层拓扑特性而受到设计师的重视。

  • 问题:然而,创建和编辑矢量图形需要创意和设计专业知识,因此是一个耗时的过程。

  • 本文提出了一种新颖的流程,可以根据文本提示生成高质量的定制矢量图形,同时保留给定的示例 SVG 特征和逐层信息

  • 具体方法:
    (1)该方法利用了大型预训练文生图模型的能力。通过微调模型的交叉注意力层,作者生成了基于文本提示的定制光栅图像(像素图像)。
    (2)为了初始化SVG,作者引入了一种基于语义的路径对齐方法,该方法保留并转换了示例SVG中的关键路径。
    (3)此外,作者使用图像级和矢量级损失来优化路径参数,重建目标图像,确保在与定制光栅图像对齐的同时实现平滑的形状变形,以保留路径的规则性。

  • 评估:作者使用来自矢量级、图像级和文本级的多种指标对该方法进行了广泛评估。评估结果证明了该流程在生成多样化定制矢量图形方面的卓越质量和有效性。

在这里插入图片描述
具体算法细节:

  • 给定一个示例SVG和一个文本提示词作为输入(a)
  • (b)概念微调:通过微调预训练的 T2I 模型(Diffusion Model),根据文本提示生成定制光栅图像。
  • (c)路径对齐:根据与定制光栅图像的语义对应,调整示例SVG中的重要路径,提供初始定制SVG。
  • (d)路径优化:使用图像级和矢量级损失(Image-Level Loss, Vector-Level Loss)优化路径参数,以生成最终的定制 SVG(e)。

与现有方法的对比如下:
在这里插入图片描述
更多的示例如下:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/679536.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

《2024年DDoS趋势报告》:DDoS攻击规模飙升233.33%

2023年,数字领域面临着分布式拒绝服务(DDoS)攻击的变革浪潮,攻击速度创纪录地达到了每秒700 Gbps和8000万数据包。这些事件跨越了从游戏到金融服务的各个行业,突显了DDoS是一种普遍存在的风险。 值得注意的是&#xf…

关于家储用防逆流电流互感器AKH-0.66/K K-φ16 100A/40mA详细介绍-安科瑞 蒋静

1.产品特点 产品外形美观,安装、接线方便,专用于通讯机房 100A 及以下配电系统改造,可与 AMC16 多回路监控仪表配合使用。 2.型号说明 3.外形尺寸(公差:2mm) 4.规格参数对照表 5.使用环境 (1)额定工作…

2024年能源、电力电气与机电工程国际学术会议(ICEPEME 2024)

全称:2024年能源、电力电气与机电工程国际学术会议(ICEPEME 2024) 2024 International Conference on Civil Engineering and Architectural Planning 会议网址:http://www.icepeme.com会议时间:2024/7/10截稿时间:20…

【传知代码】时序预测:多头注意力+宽度学习(论文复现)

前言:近年来,随着人工智能技术的飞速发展,尤其是深度学习领域的突破,时序预测领域也迎来了新的变革。传统的预测方法,如线性回归、时间序列分析等,虽然在某些场景下表现良好,但在面对复杂、非线…

FPGA - 4位数值比较器电路

4位数值比较器电路 描述 某4位数值比较器的功能表如下。 请用Verilog语言采用门级描述方式,实现此4位数值比较器 输入描述: input [3:0] A , input [3:0] B 输出描述: output wire…

嵌入式科普(20)2024瑞萨技术交流日

没有来参加技术交流日的一天,可能就是决定一生的一天。 分享2024瑞萨技术交流日MVP结算画面: 强烈建议点击b站小程序,听背景音乐,感受九子夺嫡结算MVP,四爷王上加白。从此以后写代码再也不出bug 嵌入式科普(20)2024瑞…

深度学习-07-反向传播的自动化

深度学习-07-反向传播的自动化 本文是《深度学习入门2-自製框架》 的学习笔记,记录自己学习心得,以及对重点知识的理解。如果内容对你有帮助,请支持正版,去购买正版书籍,支持正版书籍不仅是尊重作者的辛勤劳动&#xf…

解决 clickhouse jdbc 偶现 failed to respond 问题

背景 Clickhouse集群版本为 Github Clickhouse 22.3.5.5, clickhouse-jdbc 版本为 0.2.4。 问题表现 随着业务需求的扩展,基于Clickhouse 需要支持更多任务在期望的时效内完成,于是将业务系统和Clickhouse交互的部分都提交给可动态调整核心…

Python中如何打开网页

幸好思念无声,可惜思念无声 ——24.6.4 Python打开前端网页 1.导入webbrowser库 用webbrowser.open(传入网址),打开网页 import webbrowser webbrowser.open("Index.html") 2.用flask框架 from wsgiref.simple_server import make_serve…

九、从0开始卷出一个新项目之瑞萨RZN2L生产烧录固件(jflash擦写读外挂flash)

目录 七、生产烧录固件(jflash擦/写/读外挂flash) 7.1 flash母片读写 7.2 jflash擦/写/读外挂flash 九、从0开始卷出一个新项目之瑞萨RZN2L 七、生产烧录固件(jflash擦写读外挂flash) 七、生产烧录固件(jflash擦/写/读外挂flash) 7.1 flash母片读写 略 7.2 jflash擦/写/读…

文件上传漏洞之upload-labs

前提: 本文中的以xshell命名的均为以密码为admin的一句话木马,而shell命名的则是由冰蝎工具生成的木马。 pass-01:js前端验证 测试性的上传一个一句话木马,发现被拦截了,而且根据推测大概率是前端检测,于…

uniapp小程序开发 | 从零实现一款影视类app (横向滚动和下拉刷新的实现)

uniapp小程序开发实战系列,完整介绍从零实现一款影视类小程序。包含小程序前端和后台接口的全部完整实现。系列连载中,喜欢的可以点击收藏。 这里介绍下我的电影小程序的完整实现过程。这个系列将会详细讲解每个步骤,包括接口设计、数据结构优…

720云「3D空间漫游」功能爆发!户型标注、自动导览、切换视图…

一、新增 [开场封面] 支持图片、视频开场 作品第一印象必须惊艳!使用频率极高的功能,终于给3D漫游安排上啦~你可以自定义上传一张图片或一段视频,支持对桌面端、移动端分别进行设置并预览,完美适配不同终端。 二、升级模型交互体验…

Docker安装MySQL8.0报错记录

Linux已知有docker MySQL5.6版本,再安装MySQL8.0,报错信息记录如下 Docker安装MySQL8.0报错记录 Linux已知有docker MySQL5.6版本,再安装MySQL8.0,报错信息记录如下 问题1 :ls: cannot access ‘/docker-entrypoint…

HarmonyOS鸿蒙应用开发——ArkUI组件封装最佳实践

文章目录 背景与案例描述静态注册属性-封装UI组件动态注册属性-封装UI组件总结 背景与案例描述 在应用开发中,对一些频繁使用的业务UI组件常常会进行一层封装,提取到公共基础库中实现组件的复用,避免类似的逻辑重复编写,减少代码…

Excel中高级筛选多个条件怎么做?

高级筛选关键点就在条件设置,筛选条件可以设置多行多列,同一行之间的条件是“并且”的关系,同一列之间的条件是“或者”的关系。 我们以筛选厂家通用、大众,在北京、上海、成都,1月的数据为例来演示条件设置 一、按字…

React - 实现走马灯组件

一、实现效果 二、源码分析 import {useRef, useState} from "react";export const Carousel () > {const images [{id: 3, url: https://sslstage3.sephorastatic.cn/products/2/4/6/8/1/6/1_n_new03504_100x100.jpg}, {id: 1, url: https://sslstage2.sephor…

一个月飙升 9k star!打破常规的 git 客户端

作为一名程序员,想必大家每天都要使用 git 来管理自己的代码吧。有些大佬喜欢使用命令行来进行 git 的操作,有些新入门的小白程序员则比较喜欢使用各种 git 客户端来可视化的管理代码,而有些程序员则喜欢使用 IDE 中集成的 git 功能来做代码的…

【机器学习】Softmax回归探索

从零开始探索Softmax回归:深度学习的入门之旅 一、Softmax回归的原理与关键步骤二、研究准备:GPU环境下的PyTorch安装与配置三、研究内容:使用PyTorch实现Softmax回归 随着人工智能和机器学习的迅猛发展,深度学习技术逐渐成为了科…

Codeforces Round 950 (Div. 3)(A~D题)

A. Problem Generator 思路:暴力模拟,对于每个字母&#xff0c;如果不足m mm&#xff0c;就加入最终答案. 实现代码: #include<bits/stdc.h> using namespace std; #define N 2000005 #define mod 100003 typedef long long ll; ll n, m, t, cnt, ans, sum1,sum2, maxx…