DeepSeek R1生成图片总结2(虽然本身是不能直接生成图片,但是可以想办法利用别的工具一起实现)

DeepSeek官网

目前阶段,DeepSeek R1是不能直接生成图片的,但可以通过优化文本后转换为SVG或HTML代码,再保存为图片。另外,Janus-Pro是DeepSeek的多模态模型,支持文生图,但需要本地部署或者使用第三方工具。还有第三方AI工具结合DeepSeek生成的提示词来生成图片。

DeepSeek 虽然本身并非多模态模型(如 R1 系列),但通过多种方法仍可实现文字生成图片或处理图片的需求。以下是我综合目前多个来源总结的具体方法及步骤:

一、直接生成 SVG 图片

DeepSeek R1 支持直接生成 SVG 格式的矢量图代码,用户可将其保存为 .svg 文件并通过浏览器查看。具体步骤:

优化文本内容:使用“背景颜色+页面元素需求+约束条件”模板或模仿特定风格优化原始文本。

  • 示例提问:帮我生成图片:生成一个高端一点的,纯色,渐变的背景图,不要有其他元素,图片风格为清新,尺寸为16:9,主色调:科技蓝(#007BFF)或环保绿(#28A745),渐变过渡,体现科技感和环保主题
  1. 转换为 SVG:要求 DeepSeek 将优化后的文本转为 SVG 代码,并指定配色、布局等要求。

  • 示例指令:“将上述内容转为 SVG 图片,要求配色简约,布局清晰。”
  • 这样生成的代码可直接保存为 .svg 文件,或通过在线工具调整样式。

  • 如果觉得生成的样式是满意的样式,则复制整块内容,创建一个新文件,修改后缀名为 svg,再将内容贴进去就行了。
  • 如果你觉得样式还需要调整,则根据 DeepSeek 提示的配色方案,布局结构等继续调整,直至满意为止。

二、利用html代码完成布局,生成 PNG/JPG 效果图片

  • 若需生成常见格式(如 PNG、JPG),可通过以下两种方式:

  • 生成 HTML 代码并转换
    要求 DeepSeek 输出包含文本内容的 HTML 文件,并嵌入下载按钮(生成图片时隐藏按钮)。例如:先生成一篇
    “将回答以攻略卡片风格展示为 HTML,每块文本对应一个卡片,配色简约。”
    运行 HTML 后,通过浏览器截图或使用工具(如 Puppeteer)导出为图片。

  • 结合 Python 库
    利用 DeepSeek 生成调用 Pillow 或 Matplotlib 的代码脚本,自动将文本转换为图片。


三、生成 Mermaid 图表

  • DeepSeek 支持 Mermaid 语法生成流程图、思维导图等图表。步骤:

  • 要求生成特定主题的 Mermaid 代码(如书籍思维导图)。

    • 示例指令:
      “生成《悲惨世界》的思维导图,使用 Mermaid 格式。”

  • Mermaid数据粘贴至 Mermaid Live 编辑器 渲染并导出为 PNG/SVG


四、结合第三方 AI 工具

DeepSeek 非常擅长生成提示词。所以可以通过 DeepSeek 先生成高质量的提示词,再借助专业文生图工具完成创作:

生成提示词

  • 要求 DeepSeek 输出英文提示词(效果优于中文),例如:
    “生成一段英文提示词,描述‘鲸鱼跃出海面喷水’的场景,包含细节和艺术风格。”

  • 使用工具生成图片
    推荐工具包括 Midjourney(速度快、质量高)、Stable Diffusion(开源可定制)、即梦 AI(支持中文)、Bing Image Creator(基于 DALL·E 3)等。

五、使用多模态模型 Janus-Pro

  1. 部署步骤

  • 从 GitHub 克隆仓库,安装依赖并运行脚本(需 CUDA 支持)。
  • 修改配置加载 7B 模型(需 8GB 以上显存)。
  1. 生成图片

    输入文本指令(如“生成现代风格的城市天际线”),模型会输出图片。实测显示其生成速度较慢,但指令跟随能力优于 Stable Diffusion。

六、图片处理与代码生成

  • 示例
    “生成 HTML 代码,将上传的图片转为像素圆点风格。”
    需多次调试代码并配合工具(如 Photoshop 脚本)实现效果。

总结与建议

  • 优先场景:直接生成 SVG 或 Mermaid 图表适合快速可视化;复杂图片建议结合第三方工具。

  • 性能考量:Janus-Pro 适合本地部署用户,但对硬件要求较高;普通用户推荐即梦 AI 或 Midjourney。

  • 提示词优化:通过 DeepSeek 优化提示词可显著提升生成质量,尤其是英文提示词

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/972802.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【达梦数据库】dblink连接[SqlServer/Mysql]报错处理

目录 背景问题1:无法测试以ODBC数据源方式访问的外部链接!问题分析&原因解决方法 问题2:DBLINK连接丢失问题分析&原因解决方法 问题3:DBIINK远程服务器获取对象[xxx]失败,错误洋情[[FreeTDS][SQL Server]Could not find stored proce…

【从0做项目】Java搜索引擎(4)——性能优化~烧脑~~~

本篇文章将对项目搜索引擎(1)~(3)进行性能优化,包括测试,优化思路,优化前后对比 目录 一:文件读取 二:实现多线程制作索引 1:代码分析 2:代码…

YOLOv12推理详解及部署实现

目录 前言一、YOLOv12推理(Python)1. YOLOv12预测2. YOLOv12预处理3. YOLOv12后处理4. YOLOv12推理 二、YOLOv12推理(C)1. ONNX导出2. YOLOv12预处理3. YOLOv12后处理4. YOLOv12推理 三、YOLOv12部署1. 源码下载2. 环境配置2.1 配置CMakeLists.txt2.2 配置Makefile 3. ONNX导出…

在VS-qt的程序中,后期增加PCH预编译功能,提高编译速度

由于前期创建qt程序的时候未勾选pch功能,导致没有启动预编译的功能. 这种情况下需要增加pch功能应该怎么做? 在项目中增加2个文件 stdafx.h和stdafx.cpp文件 stdafx.h增加qt常用头文件 #pragma once //windows #include <windows.h>//qt常用 #include <QObject&g…

校园网架构设计与部署实战

一、学习目标 掌握校园网分层架构设计原则 理解多业务VLAN规划方法 学会部署认证计费系统 实现基础网络安全防护 二、典型校园网场景 需求分析&#xff1a;某中学需建设新型校园网络 覆盖教学楼/宿舍/图书馆三区域 区分教师/学生/访客网络权限 满足2000终端并发接入 …

阐解WiFi信号强度

WiFi信号强度是指无线网络信号的强度&#xff0c;通常以负数dB&#xff08;分贝&#xff09;来表示。信号越强&#xff0c;dB值越接近零。WiFi信号强度直接影响你的网络速度、稳定性和连接的可靠性。简单来说&#xff0c;WiFi信号越强&#xff0c;你的设备与路由器之间的数据传…

【Quest开发】全身跟踪

软件&#xff1a;Unity 2022.3.51f1c1、vscode、Meta XR All in One SDK V72 硬件&#xff1a;Meta Quest3 最终效果&#xff1a;能像meta的操作室沉浸场景一样根据头盔移动来推断用户姿势&#xff0c;实现走路、蹲下、手势匹配等功能 需要借助UnityMovement这个包 GitHub …

用Chrome Recorder轻松完成自动化测试脚本录制

前言 入门自动化测试,录制回放通常是小白测试首先用到的功能。而录制回放工具也一直是各大Web自动化测试必然会着重提供的一块功能。 早期WinRunner、QTP这样的工具,自动化测试可以说是围绕录制回放开展的。近年像Selenium也提供有录制工具 Selenium IDE,Playwright也包含…

延迟任务的11种实现方式(下)!!

接上文&#xff1a; Redisson的RDelayedQueue Redisson他是Redis的儿子&#xff08;Redis son&#xff09;&#xff0c;基于Redis实现了非常多的功能&#xff0c;其中最常使用的就是Redis分布式锁的实现&#xff0c;但是除了实现Redis分布式锁之外&#xff0c;它还实现了延迟…

大型语言模型训练与优化实战指南(2025最新版)

一、大模型训练四部曲 1.1 预训练&#xff1a;构建语言理解的基石 预训练是模型获取通用语言能力的核心阶段&#xff0c;主流方法包括&#xff1a; 自回归生成&#xff08;如GPT系列&#xff09;&#xff1a;预测下一个词&#xff0c;参数规模可达1.8T掩码语言建模&#xff…

【前端】使用WebStorm创建第一个项目

文章目录 前言一、步骤1、启动2、创建项目3、配置Node.js4、运行项目 二、Node.js介绍 前言 根据前面文章中记录的步骤&#xff0c;已经安装好了WebStorm开发软件&#xff0c;接下来我们就用这个IDE开发软件创建第一个项目。 一、步骤 1、启动 启动软件。 2、创建项目 新建…

QML Image 圆角设置

Image 默认是没有圆角的&#xff0c;但是为了让ui看起来美观&#xff0c;有时需要加上圆角&#xff0c;这里分享一种利用遮罩实现的方法。 import QtQuick 2.15 import QtQuick.Controls 2.15 import QtGraphicalEffects 1.15 import Movie 1.0Card {id:rootwidth: 325height:…

计算机网络抄手 运输层

一、运输层协议概述 1. 进程之间的通信 从通信和信息处理的角度看&#xff0c;运输层向它上面的应用层提供通信服务&#xff0c;它属于面向通信部分的最高层&#xff0c;同时也是用户功能中的最低层。当网络边缘部分的两台主机使用网络核心部分的功能进行端到端的通信时&…

Ubuntu22.04 Deepseek-R1本地容器化部署/内网穿透/OPENWEBUI,打造个人AI助手!

1. 前言 本地部署DeepSeek并实现内网穿透&#xff0c;为家庭成员提供强大的AI支持。通过使用Ollama、Docker、OpenWebUI和Nginx&#xff0c;内网穿透&#xff0c;我们可以轻松实现快速响应和实时搜索功能。 2.软硬件环境 系统&#xff1a;ubuntu22.04, cuda12GPU: RTX3080Ti …

Word接入DeepSeek(API的作用)

1.打开”Word”&#xff0c;点击“文件”。 2.点击“选项”。 3.点击“信任中心”——“信任中心设置”。 4. 勾选”启用所有宏“&#xff0c;点击”确定“。 5.点击“自定义功能区”&#xff0c;勾选上“开发工具”&#xff0c;点击“确定”。 6.返回“文件——开发工具“下的…

有向图的强连通分量: Kosaraju算法和Tarjan算法详解

在上一篇文章中, 我们了解了图的最小生成树算法. 本节我们来学习 图的强连通分量(Strongly Connected Component, SCC) 算法. 什么是强连通分量? 在 有向图 中, 若一组节点内的任意两个节点都能通过路径互相到达(例如 A → B A \rightarrow B A→B 且 B → A B \rightarro…

本地部署MindSearch(开源 AI 搜索引擎框架),然后上传到 hugging face的Spaces——L2G6

部署MindSearch到 hugging face Spaces上——L2G6 任务1 在 官方的MindSearch页面 复制Spaces应用到自己的Spaces下&#xff0c;Space 名称中需要包含 MindSearch 关键词&#xff0c;请在必要的步骤以及成功的对话测试结果当中 实现过程如下&#xff1a; 2.1 MindSearch 简…

网络安全中的机器学习

当涉及到网络安全时&#xff0c;技术一直是保护系统免受攻击和数据泄露的关键。在这篇论文中&#xff0c;我将介绍一些当前在网络安全领域使用的关键技术&#xff0c;包括加密&#xff0c;身份验证和防火墙。 首先&#xff0c;加密是网络安全中最常见的技术之一。加密是指使用算…

从猜想终结到算法革新,弹性哈希开启数据存储新篇章

目录 哈希表的前世今生基本原理从传统到现代&#xff1a;哈希表的演变历程 安德鲁 克拉皮文及其团队的创作历程弹性哈希详解基本原理优点技术细节 漏斗哈希解析基本原理优点技术细节 新算法的实际应用案例电子商务推荐系统金融交易监控系统社交媒体内容过滤物联网设备管理 结论…

STM32 外部中断和NVIC嵌套中断向量控制器

目录 背景 外部中断/事件控制器(EXTI) 主要特性 功能说明 外部中断线 嵌套向量中断控制器 特性 ‌中断线&#xff08;Interrupt Line&#xff09; 中断线的定义和作用 STM32中断线的分类和数量 优先级分组 抢占优先级&#xff08;Preemption Priority&#xff09; …