AI全栈之logo生成:执文,描摹,妙哉~

前言

前几日体验了国产的AI-Agents产品coze

它是一种能够自主执行任务、与环境进行交互并根据所获取的信息做出决策和采取行动的软件程序

并且可以自己去创建属于自己的AIBot,还是很有意思的,大家可以去体验体验

在体验过程中,我发现在创建bot的时候,需要我们输入bot名称,以及相关描述,并且可以根据内容生成头像

这也就是本文的由来~

动画.gif

实现

效果

动画.gif

前端

—html讲解

接下来我来讲解这个效果是如何实现的

首先我们通过bootstrap生成一个简单的表格

<!DOCTYPE html>
<html lang="en">
  <head>
    <meta charset="UTF-8" />
    <meta name="viewport" content="width=device-width, initial-scale=1.0" />
    <title>AI生成头像</title>
    <link
      href="https://cdn.bootcdn.net/ajax/libs/twitter-bootstrap/3.3.0/css/bootstrap.min.css"
      rel="stylesheet"
    />

    <style>
      #logo{
        display: flex;
      }
      #logo img {
        display: block;
        width: 200px;
        height: 200px;
        
      }
    </style>
  </head>
  <body>
    <!-- 网页布局 -->
    <div class="container">
      <div class="row">
        <div class="col-md-6 col-md-offset-3">
          <form name="logoForm">
            <div class="form-group">
              <label for="titleInput">Bot名称:</label>
              <input
                type="text"
                class="form-control"
                id="titleInput"
                name="title"
                placeholder="Bot名称"
                requried
              />
            </div>
            <div class="form-group">
              <label for="descInput">Bot介绍:</label>
              <textarea
                class="form-control"
                name="desc"
                id="descInput"
                placeholder="请输入Bot介绍"
              >
              </textarea>
            </div>
            <div class="form-group">
              <button type="submit" class="btn btn-primary">生成图标</button>
            </div>
          </form>
        </div>
      </div>
      <div class="row" id="logo">
      </div>
    </div>
    <script>
    </script>
  </body>
</html>

效果如下:

image.png

这里引入了 Bootstrap 的 CSS 样式表,主体部分有一个容器,里面包含了一行,这一行又分为两部分,一部分是包含 Bot 名称和介绍输入框以及生成图标按钮的表单,另一部分是预留用于展示生成图标的区域

—js讲解

<script>
      const oForm = document.forms["logoForm"];
      const oLogo = document.getElementById("logo");

      oForm.addEventListener("submit", function (e) {
        e.preventDefault();
        const title = this["title"].value.trim();
        const desc = this["desc"].value.trim();
        // console.log(title, desc);
        if (title) {
          const data = {
            title,
            desc,
          };
          // post 提交表单
          fetch("http://localhost:3000/logo", {
            method: "POST",
            headers: {
              "Content-Type": "application/json",
            },
            // 请求体 字符串或者文件二进制
            body: JSON.stringify(data),
          })
            .then((res) => res.json())
            .then((data) => {
              // console.log(data);
              if (data.code == 200) {
                const { msg } = data;
                const oImg = document.createElement("img");
                oImg.classList.add("col-md-6", "col-md-offset-3");
                oImg.src = msg;
                // 图片加载完成,将图片添加到页面
                oImg.onload = function () {
                  oLogo.appendChild(oImg);
                };
              } else {
                console.log("错误");
              }
            });
        }
      });
    </script>

首先获取了页面中的表单(logoForm)和用于展示生成头像的区域(logo)。

然后为表单添加了submit事件的监听。当表单提交时,先阻止默认的提交行为,之后获取表单中输入的 Bot 名称和介绍,并进行了去空格处理。如果 Bot 名称不为空,就将这些数据封装为一个对象。

通过fetch函数以POST方法向http://localhost:3000/logo发送请求,请求体为包含 Bot 名称和介绍的 JSON 数据。

在接收到响应后,将响应解析为 JSON 格式。如果响应中的code值为 200,表示成功,就创建一个新的图片元素,设置其类名和源地址,并在图片加载完成后将其添加到logo区域;如果code值不为 200,则在控制台输出错误信息

后端(重点讲解)

首先肯定是需要创建一个后端服务咯

那么这里我们采用koa框架去搭建一个后端服务,Koa 是一个基于 Node.js 的 Web 应用框架,是目前最好的,最火的,最简单的一个框架了

首先 npm i koa 安装好依赖以后

import Koa from "koa";

现在我们就可以启动一个后端服务了

import Koa from "koa";

const app = new Koa();

// 启动http服务 3000端口
app.listen(3000, () => {
  console.log("server is running at http://localhost:3000");
});

image.png

接下来我们需要添加路由功能

使用 npm i koa-router 安装好依赖

import Router from "koa-router"; // 引入路由

然后就可以使用路由功能了

import Koa from "koa";
import Router from "koa-router"; // 引入路由

const app = new Koa();
const router = new Router();

// 创建 /logo 路由
router.post("/logo", async (ctx) => {
    console.log('logo');
    ctx.body = {
      code: 200,
      msg: 'logo',
    };

})

// 启动http服务 3000端口
app.listen(3000, () => {
  console.log("server is running at http://localhost:3000");
});

现在就创建好了一个简单的/logo路由了

但是现在通过前端去访问这个路由,会出现一个问题

image.png

这是一个跨域问题,来自于前端js的同源策略,同源指的是协议、域名和端口都相同。如果两个 URL 的协议、域名和端口不完全相同,就被认为是不同源。

这里我们就需要解决这个问题,通过添加npm i @koa/cors

将cors添加到项目即可解决

import cors from "@koa/cors";
app.use(cors());

但是我们需要拿到访问的参数才行啊

于是我们引入npm i @koa/bodyparser

import { bodyParser } from "@koa/bodyparser";
app.use(bodyParser());

现在我们可以通过ctx.request.body拿到前端给我们返回的数据了

接下来我们就需要添加openai的依赖了 npm i openai并引入

import OpenAI from "openai";

同时使用dotenv管理我们的openai的key,安装npm i dotenv,并在同级目录创建一个名为.env的目录
放入key

image.png

通过

import dotenv from "dotenv";// 管理key值

dotenv.config({
  path: ".env",
});
// key
process.env.OPENAI_KEY

可以拿到我们的key值

接下来就需要创建我们与ai的窗口了

const client = new OpenAI({
  apiKey: process.env.OPENAI_KEY,
  baseURL: "https://api.gptsapi.net/v1",
});

通过client就可以向其发送指令,我们使用client.images.generate,向其发送一个图片的请求

router.post("/logo", async (ctx) => {
  // console.log(ctx.request.body);
  const { title, desc } = ctx.request.body;
  const prompt = `我要开发标题为${title}的一款bot,功能细节是${desc}?`;

  let response;
  let url;
  try {
    response = await client.images.generate({
      model: "dall-e-3",
      prompt: prompt,
      n: 1,
      size: "1024x1024",
    });
    console.log(response.data);
    url = response.data[0].url;

    console.log(url, "111111111111111111111");

    ctx.body = {
      code: 200,
      msg: url,
    };
  } catch (e) {
    console.log("服务不可用");
    ctx.body = {
      code: 500,
      msg: "出错了",
    };
  }
});
  1. const { title, desc } = ctx.request.body;:从请求的主体中解构获取 titledesc 两个属性的值。这意味着客户端在发送 POST 请求时,请求体中应该包含这两个键值对。

  2. const prompt = 我要开发标题为的一款,功能细节是{desc}?;:通过模板字符串将获取到的 titledesc 嵌入到一个新的字符串 prompt 中,用于后续的图像生成操作。

  3. let response; let url;:声明了两个变量 responseurl ,用于存储后续操作的结果。

  4. try {...} 块:

    • response = await client.images.generate({...});:使用 await 关键字异步等待图像生成的结果。传递的参数包括模型名称、提示信息、生成数量和尺寸等。
    • console.log(response.data);:打印生成的响应数据。
    • url = response.data[0].url;:从响应数据中获取第一个图像的 URL 并赋值给 url 变量。
    • ctx.body = {...};:成功生成图像后,设置响应的主体。状态码为 200 表示成功,msg 字段中包含生成的图像 URL
  5. catch (e) {...} 块:如果在图像生成过程中发生异常(可能是服务不可用、网络问题或其他错误),会捕获这个异常

    • console.log("服务不可用");:在控制台打印错误提示。
    • ctx.body = {...};:向客户端返回状态码为 500 的错误响应,msg 字段说明出错了

接下来我们就可以实现通过coze的功能啦

动画.gif

总结

随着时代的发展,AI 与人类将更加紧密地融合,共同工作和生活,成为人类的重要伙伴

本文讲解了如何使用前后端实现一个简易的通过ai去生成一个头像的功能,相信看到这里的你一定会有所收获的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/730513.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

肾虚学习实验第T1周:实现mnist手写数字识别

>- **&#x1f368; 本文为[&#x1f517;365天深度学习训练营](https://mp.weixin.qq.com/s/0dvHCaOoFnW8SCp3JpzKxg) 中的学习记录博客** >- **&#x1f356; 原作者&#xff1a;[K同学啊](https://mtyjkh.blog.csdn.net/)** 目录 一、前言 作为一名研究牲&#xff0…

数据库复习——模式分解

模式分解这边主要包括无损分解和保持函数依赖的分解两种形式&#xff0c;简单整理一下。 无损分解 把一个 R R R 分成 ρ { R 1 , R 2 , ⋯ , R k } \rho \{R_1,R_2,\cdots,R_k\} ρ{R1​,R2​,⋯,Rk​}&#xff0c;然后通过自然连接 R 1 ⋈ R 2 ⋈ ⋯ ⋈ R k R_1\bowtie R…

可视化数据科学平台在信贷领域应用系列七:自动机器学习(下篇)

在当今金融科技迅速发展的时代&#xff0c;自动机器学习&#xff08;AutoML&#xff09;逐步成为了信贷风控领域的重要工具。随着大数据和人工智能技术的进步以及信贷风险环境的快速变化&#xff0c;传统人工建模模式的时效性已经难以应对复杂多变的挑战。自动机器学习框架将数…

AI创作音乐引发的深思

在最近一个月中&#xff0c;音乐大模型的迅速崛起让素人生产音乐的门槛降到了最低。这一变革引发了关于AI能否彻底颠覆音乐行业的广泛讨论。在初期的兴奋过后&#xff0c;人们开始更加理性地审视AI在音乐领域的应用&#xff0c;从版权归属、原创性、创作质量、道德层面以及法律…

【linux】dup文件描述符复制函数和管道详解

目录 一、文件描述符复制 1、dup函数&#xff08;复制文件描述符&#xff09; ​编辑 2、dup2函数&#xff08;复制文件描述符&#xff09; ​编辑 二、无名管道pipe 1、概述 2、无名管道的创建 3、无名管道读写的特点 4、无名管道ps -A | grep bash实现 三、有名管道FI…

没有超头、最低价的视频号618战况如何?有何趋势变化?| 视频号618观察

转眼618大促已接近尾声&#xff0c;今年的你有剁手哪些好物吗&#xff1f;对618的整体感觉又是如何呢&#xff1f; 这是12年来&#xff0c;第一个电商平台没有预售付定金的618&#xff0c;当然或许此后的双11、每一次大促也将逐渐回归传统&#xff0c;回归本质。 而对于视频号来…

普通变频器位置闭环控制(S7-1200PLC工艺对象模拟量轴)

1、S7-1200PLC控制V90总线伺服通过工艺对象实现定位控制 S7-1200PLC和V90总线伺服通过工艺对象实现定位控制(标准报文3应用)_1200报文3控制v90-CSDN博客文章浏览阅读182次。V90伺服驱动器调试软件SINAMICS V-ASSISTANT Commissioning tool下载地址如下:西门子官网选型|资料CS…

linux下的进程通讯

一. 实验内容 1&#xff0e;编写一个程序&#xff0c;实现在两个进程之间运用管道进行通讯。程序中创建一个子进程&#xff0c;然后父、子进程各自独立运行。父进程不断地在标准输入设备上读入小写字母&#xff0c;写入管道。子进程不断地从管道中读取字符&#xff0c;转换为大…

Qt坐标系统

目录 概述 渲染 逻辑表示 锯齿绘制 坐标转换 模拟时钟示例 Window-Viewport转换 概述 坐标系统由QPainter类控制。与QPaintDevice和QPaintEngine类一起&#xff0c;QPainter构成了Qt绘画系统的基础。QPainter用于执行绘制操作&#xff0c;QPaintDevice是一个二维空间的抽…

10地!2024年一级造价师报名通知发布!

各位考生注意&#xff0c;西藏、四川、江西、新疆&#xff0c;辽宁、江苏、云南、新疆兵团、海南10个地区已经发布了关于2024年度一级造价工程师职业资格考试报名工作的通知&#xff1a; 浙江 辽宁 江苏 云南 报名时间&#xff1a;6月28日9:00—7月8日17:00&#xff1b; 缴费时…

基于Python+Django+MySQL+HTML的创新创业平台

DjangoMySQLHTML 基于PythonDjangoMySQLHTML的创新创业平台 用户管理 系统监控 角色管理 资源管理 参数设置 角色管理 简介 学生创新创业平台是一个功能丰富的在线教育或协作系统&#xff0c;支持中文语言环境。它提供用户管理、系统监控、多角色权限控制、资源管理、参…

手写方法实现字符串例如:“123“与整型例如:123相互转化(面试必会)

目录 二、字符串类型转化为整型 1. 初始化变量 2.定义字符串索引值 3.思考如何将字符1转化为数字1 4. 转化思路 5.考虑字符串转化负数例&#xff1a;-123456 6.完整代码 四、最后 一、前言 在c语言和c中&#xff0c;有许许多多的数据类型相互转化的方法&#xff0c;这里…

算法篇-排序

快排 算法思想&#xff1a;每次找一个基数&#xff0c;然后对数组左右遍历&#xff0c;将小于基数的数据放到左边&#xff0c;大于基数的数放到右边&#xff0c;然后将基数左边&#xff0c;右边进行迭代再排序。 public static void quickSort(int[] nums, int left, int ri…

openeuler一个服务异常占用cpu的排查过程

1 环境 硬件环境&#xff1a;LS1046A arm64 系统环境&#xff1a;openEuler release 22.03 (LTS-SP1) Linux kernel 4.19.26 2 问题说明 我的硬件平台需要适配一下 openEuler release 22.03 (LTS-SP1) 但是目前只能使用原来硬件平台的内核&#xff0c;在适配的过程中…

phar反序列化及绕过

目录 一、什么是phar phar://伪协议格式&#xff1a; 二、phar结构 1.stub phar&#xff1a;文件标识。 格式为 xxx; *2、manifest&#xff1a;压缩文件属性等信息&#xff0c;以序列化存 3、contents&#xff1a;压缩文件的内容。 4、signature&#xff1a;签名&#…

开放式耳机哪个品牌质量比较好?五大公认性能之王推荐!

作为一名热爱音乐的DJ爱好者&#xff0c;我当然知道一款适合DJ使用的开放式耳机应该具备哪些特点。最近&#xff0c;我深入评测了几款热门开放式耳机&#xff0c;从音质、舒适度、耐用性到混音功能等方面进行了全面评估。今天&#xff0c;我想为大家分享我的评测结果&#xff0…

【jdk】jdk11 jdk17 jdk21的新特性

前言&#xff1a;按照博主的个人理解&#xff0c;一般来说 除了jdk8时代 说jdk8的新特性是特指jdk8这一个版本的特性&#xff0c;之后例如jdk11 jdk17新特性 都是泛特性 什么意思呢&#xff1f; 比如jdk11新特性&#xff0c;一般是指jdk9——jdk11 这一个泛版本的所有新特性&am…

机器学习第四十四周周报 SAMformer

文章目录 week44 SAMformer摘要Abstract1. 题目2. Abstract3. 网络架构3.1 问题提出3.2 微型示例3.3 SAMformer 4. 文献解读4.1 Introduction4.2 创新点4.3 实验过程 5. 结论6.代码复现小结参考文献 week44 SAMformer 摘要 本周阅读了题为SAMformer: Unlocking the Potential…

智谱AI GLM-4V-9B视觉大模型环境搭建推理

引子 最近在关注多模态大模型&#xff0c;之前4月份的时候关注过CogVLM&#xff08;CogVLM/CogAgent环境搭建&推理测试-CSDN博客&#xff09;。模型整体表现还不错&#xff0c;不过不支持中文。智谱AI刚刚开源了GLM-4大模型&#xff0c;套餐里面包含了GLM-4V-9B大模型&…

HTTP 状态码详解及使用场景

目录 1xx 信息性状态码2xx 成功状态码3xx 重定向状态码4xx 客户端错误状态码5xx 服务器错误状态码 HTTP思维导图连接&#xff1a;https://note.youdao.com/s/A7QHimm0 1xx 信息性状态码 100 Continue&#xff1a;表示客户端应继续发送请求的其余部分。 使用场景&#xff1a;客…