Spring Boot集成Spring Ai框架【详解 搭建Spring Ai项目,以及简单的ai大模型智能体应用,附有图文+示例代码】

文章目录

  • 一.Spring Ai介绍
    • 1.0 认识Spring Ai
    • 1.1 特征
    • 1.1 大模型专业名字介绍
      • 1.1.1 RAG(检索增强生成)
        • RAG 的基本原理
        • RAG 的关键技术
        • RAG 的优势
        • RAG 的应用场景
      • 1.1.2 fine-tuning(微调)
      • 1.1.3 function-call(函数调用)
    • 1.2 创建简单的Spring Ai项目
  • 二.Spring Ai简单的智能应用
    • 2.1 智能提问实现
    • 2.2 角色预设
    • 2.3 流式响应
    • 2.4 ChatClient和ChatMode区别
    • 2.5 文生图(gpt-4模型和deepseek-r1模型)
    • 2.6 文生语音
    • 2.7 语音翻译
    • 2.8 多模态
    • 2.9 function-call请求
    • 持续待更新...........

一.Spring Ai介绍

Spring Ai 官方:https://spring.io/projects/spring-ai

1.0 认识Spring Ai

Spring AI 是一个用于 AI 工程的应用程序框架。 其目标是将 Spring 生态系统设计原则(如可移植性和模块化设计)应用于 AI 领域,并将使用 POJO 作为应用程序的构建块推广到 AI 领域。

在这里插入图片描述

Spring AI 的核心是解决了 AI 集成的根本挑战:将您的企业数据和 APIAI 模型连接起来。

1.1 特征

Spring AI 提供以下功能:

  • 支持所有主要的 AI 模型提供商,例如 Anthropic、OpenAI、Microsoft、Amazon、Google 和 Ollama。支持的模型类型包括:
    • 聊天完成
    • 嵌入
    • 文本到图像
    • 音频转录
    • 文本到语音
    • 适度
  • 支持跨 AI 提供商对同步和流式处理 API 选项的可移植 API 支持。此外,还可以访问特定于模型的特征。
  • 结构化输出 - AI 模型输出到 POJO 的映射。
  • 支持所有主要的矢量数据库提供商,例如 Apache Cassandra、Azure Vector Search、Chroma、Milvus、MongoDB Atlas、Neo4j、Oracle、PostgreSQL/PGVector、PineCone、Qdrant、Redis 和 Weaviate
  • 跨 Vector Store 提供商的可移植 API,包括一种新颖的类似 SQL 的元数据过滤器 API。
  • 工具/函数调用 - 允许模型请求执行客户端工具和函数,从而根据需要访问必要的实时信息。
  • 可观察性 - 提供对 AI 相关作的见解。
  • 用于数据工程的文档注入 ETL 框架。
  • AI 模型评估 - 帮助评估生成的内容并防止幻觉响应的实用程序。
  • ChatClient API - 用于与 AI 聊天模型通信的 Fluent API,惯用性类似于 WebClient 和 RestClient API。
  • Advisors API - 封装重复的生成式 AI 模式,转换发送到和传出语言模型 (LLM) 的数据,并提供跨各种模型和用例的可移植性。
  • 支持 Chat Conversation Memory and Retrieval Augmented Generation (RAG)。
  • Spring Boot 所有 AI 模型和向量存储的自动配置和启动器 - 使用 start.spring.io 选择所需的模型或向量存储。

上述内容摘自:Spring Ai 官网。

1.1 大模型专业名字介绍

1.1.1 RAG(检索增强生成)

在这里插入图片描述

大致思路:假如有个智能客服,它会优先去查询向量数据中数据,将查到的相关数据给 prompt对象 ,然后通过大模型响应给应用程序。

RAG 的基本原理

RAG 主要由 两个阶段 组成:

  1. 检索阶段(Retrieval)

    • 在生成文本之前,模型会从一个 外部知识库(如向量数据库、文档集合等)检索出相关的信息。
    • 这种检索通常使用 向量搜索(如 FAISS、Milvus)或基于搜索引擎(如 Elasticsearch)。
  2. 生成阶段(Generation)

    • 结合检索到的内容,大语言模型(如 GPT、LLaMA)使用这些外部信息来生成更准确、符合事实的回答。
    • 这种方式可以减少幻觉(hallucination),让生成的内容更加可信。
RAG 的关键技术

向量数据库

  • 用于存储和检索文本嵌入(text embeddings)。
  • 常见的向量数据库:
    • FAISS(Facebook AI Similarity Search)
    • Milvus
    • Pinecone
    • Weaviate

文本嵌入(Embedding)

  • 使用模型(如 OpenAI Embeddings、BERT、Sentence-BERT)将文本转换为向量,便于相似度搜索。

检索策略

  • 稠密检索(Dense Retrieval):基于神经网络(如 DPR、ColBERT),效果更优,但计算成本较高。
  • 稀疏检索(Sparse Retrieval):如 BM25,传统的基于关键词的检索方法。
RAG 的优势
  • 减少幻觉:模型基于真实检索到的内容生成回答,降低胡编乱造的概率。
  • 增强知识:即使预训练数据缺乏某些信息,模型仍可动态检索外部知识库。
  • 实时更新:相比 LLM 需要重新训练,RAG 只需更新知识库,适用于动态领域(如法律、医学等)。
  • 更精准回答:相比纯 LLM,RAG 结合检索数据,可提供更精确的参考来源。
RAG 的应用场景
  • 智能问答系统(如企业知识库问答、金融/法律咨询)
  • 代码自动补全(检索 GitHub 代码库,提高准确性)
  • 医疗辅助诊断(结合医学文献,提高生成答案的专业性)
  • 法律法规检索(查询法律条文,生成更符合规范的解读)
  • 客服机器人(实时检索 FAQ,提升客服效率)

1.1.2 fine-tuning(微调)

在这里插入图片描述

1.1.3 function-call(函数调用)

在这里插入图片描述

1.2 创建简单的Spring Ai项目

  • 官方提示:Spring AI 支持 Spring Boot 3.2.x 和 3.3.x
  • jdk17+
    (☞本地安装多个JDK版本自由切换)

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

二.Spring Ai简单的智能应用

(延续使用1.2中创建的Spring Ai 应用。)

2.1 智能提问实现

【yml配置】

spring:
  ai:
    openai:
      api-key: you_api_key
      base-url: 你的api_key的请求路径
      chat:
        options:
          model: gpt-3.5-turbo  # 调用的哪个模型名称

由于调用 的是国外的open ai 大模型,需要“魔法”,所以我这里搞了中转站,请求中转站的 api-key和base-url,具体的做法 淘宝 搜 open api key

【controller】

package com.hz.controller;

import org.springframework.ai.chat.client.ChatClient;
import org.springframework.beans.factory.annotation.Value;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;

/**
 * @Author: weiyi
 * @Description:
 * @Date 2025/2/28 21:24
 * @ClassName AiController
 * @Version 1.0
 */

@RestController
@RequestMapping("/ai")
public class AiController {


    //智能对话的客户端
    private final ChatClient chatClient;

    public AiController(ChatClient.Builder chatClientBuilder) {
        this.chatClient = chatClientBuilder.build();
    }

    @GetMapping("/ai01")
    public String generation(
            @RequestParam(value = "message", 
                          defaultValue = "给我讲个笑话")
            String message) {
      
        return this.chatClient.prompt()  // prompt:提示词
                .user(message) // message:用户输入的信息
                .call() // 调用大模型 远程请求大模型
                .content(); // 获取大模型的返回结果
    }
}

上述代码是 参考的spring Ai 官方文档

在这里插入图片描述

【测试】

http://localhost:8080/ai/ai01?message=列出spring中的重点概念

在这里插入图片描述

这个场景模拟的是在大模型如deepseek等对话窗口的提问。

2.2 角色预设

假如你希望是一个特定场景下的智能体对话,可以进行角色预设。

在项目中的config包中创建AiConfig配置类

/**
 * @Author: weiyi
 * @Description:
 * @Date 2025/2/28 21:40
 * @ClassName AiConfig
 * @Version 1.0
 */
@Configuration
public class AiConfig {

    @Bean
    ChatClient chatClient(ChatClient.Builder builder) {
        return builder
                .defaultSystem("你现在不是 chat gpt 了," +
                        "你是一个精通古代诗人的智能助手,有个诗人叫维一,知识渊博")
                .build();

    }

}

【修改controller】

在这里插入图片描述

/**
 * @Author: weiyi
 * @Description:
 * @Date 2025/2/28 21:24
 * @ClassName AiController
 * @Version 1.0
 */

@RestController
@RequestMapping("/ai")
public class AiController {

    //智能对话的客户端
    @Autowired
    private  ChatClient chatClient;

    // public AiController(ChatClient.Builder chatClientBuilder) {
    //     this.chatClient = chatClientBuilder.build();
    // }

    @GetMapping("/ai01")
    public String generation(
            @RequestParam(value = "message", defaultValue = "给我讲个笑话")
            String message) {
        // prompt:提示词
        return this.chatClient.prompt()
                .user(message) // message:用户输入的信息
                .call() // 调用大模型 远程请求大模型
                .content(); // 获取大模型的返回结果
    }
}

测试

在这里插入图片描述

2.3 流式响应

通俗点说流式响应就是将生成的文本内容一个字一个字的显示出来。

/**
     * @description: 流式响应
     * @author: weiyi
     * @date: 2025/3/1 19:08
     * @param: [message]
     * @return: reactor.core.publisher.Flux<java.lang.String>
     **/
    @GetMapping(value = "/ai02", 
                produces = "text/html;charset=utf-8")
    public Flux<String> generation02(String message){
        Flux<String> output = chatClient.prompt()
                .user(message)
                .stream()
                .content();
        return output;
    }

如果不设置 produces = “text/html;charset=utf-8” 输出内容会出现中文乱码。

在这里插入图片描述

2.4 ChatClient和ChatMode区别

ChatClient Api 里是大模型通用的功能。

ChatMode Api 是大模型特有功能。假如用deepseek特有的模型功能需要用ChatMode Api

在这里插入图片描述

如:用open ai 下模型:

在这里插入图片描述


 @Autowired
 private ChatModel chatModel;

@GetMapping(value = "/ai03", 
            produces = "text/html;charset=utf-8")
    public String generation03(
      @RequestParam(value = "message",
            defaultValue = "给我讲个笑话") String message){
        ChatResponse response = chatModel.call(
                new Prompt(
                        message, // new UserMessage(message)
                        OpenAiChatOptions.builder()
                                .model("gpt-3.5-turbo")
                                .temperature(0.4)//让生成文字更有温度
                                .build()
                ));
        //等同于 .content
        return response.getResult().getOutput().getText();
    }

在这里插入图片描述

2.5 文生图(gpt-4模型和deepseek-r1模型)

在这里插入图片描述
在这里插入图片描述

spring:
  ai:
    openai:
      api-key: xxxxx
      base-url: xxxxxx
      chat:
        options:
          model: gpt-4-32k

@GetMapping(value = "/ai05")
    public String generation05(
      @RequestParam(value = "message",
            defaultValue = "画个龙") String message) {
        ImageResponse response = openaiImageModel.call(
                new ImagePrompt(message, // 图片提示词
                        OpenAiImageOptions.builder()
                                .quality("hd") // 图片质量
                                .withModel(OpenAiImageApi.DEFAULT_IMAGE_MODEL) // 图片模型
                                .N(1) // 生成图片数量
                                .height(1024)
                                .width(1024).build())

        );
        return response.getResult().getOutput().getUrl();
    }

会生成图片的url地址:

在这里插入图片描述

将生成的图片地址粘贴浏览器地址栏:
(这是调用gpt4模型生成的)
在这里插入图片描述
【换成deepseek-r1模型】
☞deepseek官网文档
在这里插入图片描述

在这里插入图片描述
这是调用deepseek-r1模型生成。
在这里插入图片描述

2.6 文生语音

持续待更新…

2.7 语音翻译

持续待更新…

2.8 多模态

持续待更新…

2.9 function-call请求

持续待更新…

持续待更新…

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/981554.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

51c自动驾驶~合集53

我自己的原文哦~ https://blog.51cto.com/whaosoft/13431196 #DriveTransformer 上交提出&#xff1a;以Decoder为核心的大一统架构写在前面 & 笔者的个人理解 当前端到端自动驾驶架构的串行设计导致训练稳定性问题&#xff0c;而且高度依赖于BEV&#xff0c;严重限…

【C语言】联合体 `union` 的妙用

C 语言联合体的妙用:结合 . 和 -> 操作符与 typedef 的深入剖析 在 C 语言中,联合体(union)是一种独特的复合数据类型,因其内存共享特性而在内存优化、类型切换和底层操作中展现出妙用。与结构体(struct)不同,联合体允许同一块内存存储不同类型的数据,提供高效且灵…

UDP协议(20250303)

1. UDP UDP:用户数据报协议&#xff08;User Datagram Protocol&#xff09;&#xff0c;传输层协议之一&#xff08;UDP&#xff0c;TCP&#xff09; 2. 特性 发送数据时不需要建立链接&#xff0c;节省资源开销不安全不可靠的协议 //一般用在实时性比较高…

自动化学习-使用git进行版本管理

目录 一、为什么要学习git 二、git是什么 三、git如何使用 1、git的下载安装和配置 2、git常用的命令 3、gitee远程仓库的使用 &#xff08;1&#xff09;注册 &#xff08;2&#xff09;创建仓库 &#xff08;3&#xff09;配置公钥&#xff08;建立电脑和git…

20250301在chrome中安装CRX猫抓

20250301在chrome中安装CRX猫抓 2025/3/1 18:08 百度&#xff1a;猫抓 CRX https://www.crx4chrome.com/crx/49597/ 猫抓 (cat-catch) Crx File 2.5.9 for Chrome (Latest Version) Get Latest Version of 猫抓 (cat-catch) from Web Store Developer Tools > cat-catch / E…

[LeetCode]day33 150.逆波兰式求表达值 + 239.滑动窗口最大值

逆波兰式求表达值 题目链接 题目描述 给你一个字符串数组 tokens &#xff0c;表示一个根据 逆波兰表示法 表示的算术表达式。 请你计算该表达式。返回一个表示表达式值的整数。 注意&#xff1a; 有效的算符为 ‘’、‘-’、‘*’ 和 ‘/’ 。 每个操作数&#xff08;运…

pnpm+monorepo实现前端公共函数、组件库

一、前言 1. pnpm pnpm 是前端包管理工具之一&#xff0c;常见的还有npm、yarn等&#xff0c;但pnpm由于安装速度快、磁盘占用低、内置支持monorepo等优势&#xff0c;所以更推荐使用。 1-1 包管理工具核心特点对比 特性pnpmnpmyarn安装速度&#x1f680; 快&#xff08;基…

【计算机网络入门】初学计算机网络(八)

目录 1. S-W协议的信道利用率 2. GBN、SR协议的信道利用率 3.术语补充 3.1 滑动窗口协议 3.2 ARQ协议、连续ARQ协议 4. 信道划分介质访问控制 4.1 时分复用&#xff08;TDM&#xff09; 4.2 统计时分复用&#xff08;STDM&#xff09; 4.3 频分复用&#xff08;FDM&a…

JVM基本概念及内存管理模型

一、JVM基本概念 JVM&#xff08;Java Virtual Machine&#xff0c;Java 虚拟机&#xff09;是 Java 程序运行的核心组件。它负责将 Java 字节码转换为特定平台的机器指令&#xff0c;并提供内存管理、垃圾回收、安全性等功能。JVM 的主要功能包括以下&#xff1a; 加载和执行…

Docker 学习(三)——数据管理、端口映射、容器互联

一、数据管理 容器中的管理数据主要有两种方式&#xff1a; 数据卷 &#xff08;Data Volumes&#xff09;&#xff1a; 容器内数据直接映射到本地主机环境&#xff1b; 数据 卷容器&#xff08; Data Volume Containers&#xff09;&#xff1a; 使用特定容器维护数据卷 1.…

解锁Egg.js:从Node.js小白到Web开发高手的进阶之路

一、Egg.js 是什么 在当今的 Web 开发领域&#xff0c;Node.js 凭借其事件驱动、非阻塞 I/O 的模型&#xff0c;在构建高性能、可扩展的网络应用方面展现出独特的优势 &#xff0c;受到了广大开发者的青睐。它让 JavaScript 不仅局限于前端&#xff0c;还能在服务器端大展身手&…

我的ChatGPT怎么登不上?

近期&#xff0c;不少用户反馈在使用ChatGPT时遇到登录困难、连接超时等问题。本文将从技术角度分析常见原因&#xff0c;并提供合规、安全的解决方案&#xff0c;同时结合开发者实际需求推荐实用工具&#xff0c;助您高效应对登录障碍。 ChatGPT登录失败的常见原因 网络环境限…

小米手机如何录制屏幕?手机、电脑屏幕录制方法分享

大家最近有没有遇到想记录手机屏幕操作的情况&#xff1f; 比如精彩的游戏瞬间、有趣的视频教程&#xff0c;或者需要录制屏幕来制作演示材料。小米手机在这方面可是个好帮手&#xff0c;今天就来给你好好唠唠&#xff0c;小米手机如何录制屏幕&#xff0c;以及后续如何处理这…

【jenkins配置记录】

全局工具配置&#xff1a; D:\Program Files\Java\jdk1.8.0_281 D:\Program Files\Git\bin\git.exe E:\allure-2.13.2 2. GIT 3. 定时任务 H 8 * * 1-5 4. 构建触发器 5. 构建后操作 Allure Report 吐血记录&#xff1a;报告路径可以为 workspace 相对路径 6. 系统配置 em…

修改hosts文件,修改安全属性,建立自己的DNS

初级代码游戏的专栏介绍与文章目录-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代码都将会位于ctfc库中。已经放入库中我会指出在库中的位置。 这些代码大部分以Linux为目标但部分代码是纯C的&#xff0c;可以在任何平台上使用。 源码指引&#xff1a;github源…

详解LSM树

目录 什么是LSM树 磁盘结构与顺序IO LSM树结构 LSM树的写入 SSTable合并 LSM树的读取 LSM树的删除 总结 什么是LSM树 LSM 树全名日志结构合并树&#xff08;Log-Structured Merge Tree&#xff09;&#xff0c;是一种用于存储和管理数据的树状数据结构&#xff0c;常用…

3d投影到2d python opencv

目录 cv2.projectPoints 投影 矩阵计算投影 cv2.projectPoints 投影 cv2.projectPoints() 是 OpenCV 中的一个函数&#xff0c;用于将三维空间中的点&#xff08;3D points&#xff09;投影到二维图像平面上。这在计算机视觉中经常用于相机标定、物体姿态估计、3D物体与2D图…

Spring Boot集成Minio笔记

一、首先配置MinIO 1、MinIO新建Bucket&#xff0c;访问控制台如图 创建访问密钥(就是账号和密码) 二、集成mino添加Minio客户端依赖 1.maven构建方式在pom.xml引入jar <dependency><groupId>io.minio</groupId><artifactId>minio</artifactI…

github进不去,一直显示错误

1、进入网址Dns检测|Dns查询 - 站长工具 2、复制检测出来的任意一个ip 3、打开电脑的文件夹&#xff1a;C:\Windows\System32\drivers\etc 下的hosts文件下复制这个ip地址 20.205.243.166 4、winr 打开cmd&#xff0c;输入ipconfig/flushdns ipconfig/flushdns出现这个就可以…

【商城实战(2)】商城架构设计:从底层逻辑到技术实现

【商城实战】专栏重磅来袭&#xff01;这是一份专为开发者与电商从业者打造的超详细指南。从项目基础搭建&#xff0c;运用 uniapp、Element Plus、SpringBoot 搭建商城框架&#xff0c;到用户、商品、订单等核心模块开发&#xff0c;再到性能优化、安全加固、多端适配&#xf…