5分钟跑起来:Java构建的AI人工智能智能问答系统_springboot_spring ai_LLM_人工智能_开源免费使用

Agenda:

1)介绍一下AI支持下的智能问答系统有哪些主要模块

2)一个可以跑起来的代码样例,说明怎么用Java构建这个AI智能问答系统

AI人工智能智能问答系统简介

智能问答系统是一种利用人工智能技术理解并回答用户提问的应用。该系统通过自然语言处理技术分析问题的含义,并在知识库中查找相关信息,以生成一个或多个可能的答案。这些答案基于对问题的理解及知识库中的数据生成。智能问答系统适用于多种场景,如在线客服、智能助手和教育辅导等,能够显著提升信息获取速度与用户体验。其关键组成部分包括:自然语言处理(NLP),用于解析问题;知识库,存储了丰富的结构化和非结构化信息;检索和匹配算法,负责从知识库中找出相关资料;答案生成机制,依据找到的信息形成回复;以及评估和反馈模块,不断优化答案质量。

我们可以看到,随着大语言模型的落地,问答系统完全可以使用大语言模型来做,里面的自然语言处理,答案生成部分,就可以用大模型来做,而知识库和检索匹配算法,则可以用RAG检索增强技术来做。
后面的例子,我们使用 spring ai alibaba + 通义千问Qwen api 来构建这个智能问答系统 , qwen有100万免费Token额度,可以快速实现需求。同时,因为qwen 也是个开源的模型,我们可以自己搭建模型来实现免费使用

Spring AI Alibaba框架介绍

Spring AI Alibaba 是由Spring官方团队维护的一个框架,专为集成阿里云的AI服务设计。它提供了统一的接口,让开发者能够轻松接入多种生成式模型(如对话、文生图等),并通过简单的配置切换不同的AI实现,极大地简化了开发流程。此外,该框架还支持Java RAG(检索增强生成)功能,结合阿里云的最佳实践,使得在企业级应用中快速部署和利用强大的AI能力变得更为便捷。

通义千问大模型:在多基准测试中超越Llama 3 70B

通义千问大模型在多个基准测评中表现出色,超越了Llama 3 70B。它在MMLU、TheoremQA和GPQA等客观评测指标上取得了优异成绩,这些指标被广泛认为是评估语言模型能力的重要标准。此外,在Hugging Face开源大模型排行榜Open LLM Leaderboard上,通义千问大模型更是荣登榜首,展示了其卓越的性能和广泛的应用前景。

另外,在真人参与评测的arena里面,它不仅在思南平台 CompassArena 上仅次于国际知名的GPT和Claude系列,还在 Hugging Face的视觉模型竞技场 https://huggingface.co/spaces/lmarena-ai/chatbot-arena-leaderboard 中稳居中国首位。

检索增强生成:结合检索与生成模型提高文本准确性

检索增强生成(RAG)是一种结合了检索模型和生成模型的技术,旨在通过私有知识库的信息来提高文本生成的准确性。它解决了大模型在使用时常见的两个问题:一是模型可能产生不准确或虚构的答案,即“幻觉”现象;二是由于缺乏对企业自有数据的掌握,导致回答过于泛化而不精准。通过引入私有知识库作为信息源,RAG增强了生成内容的相关性和准确性。

基于检索增强技术的后端代码开发

要通过检索增强(RAG)的方式读取名为“智能问答的问题集.docs”的PDF文件,构建向量索引,并对外提供服务,按照我了解的信息中给出的信息和步骤,可以遵循以下详细流程。

前置要求

  • 确保您的JDK版本为17或更高。
  • Spring Boot版本应至少为3.3.x。
  • 在阿里云上获取通义千问的API Key。这可以通过访问阿里云百炼页面并按照指示完成来实现。
  • 配置环境变量 AI_DASHSCOPE_API_KEY 或者直接在项目的application.properties里设置 spring.ai.dashscope.api-key: ${AI_DASHSCOPE_API_KEY} 来指定API Key。
  • 将Spring仓库添加到项目配置中,以便能够引用尚未发布到Maven中央仓库的依赖包。
  • 添加必要的Spring AI Alibaba依赖至您的项目。

RAG服务的具体实现

1. 修改pom.xml文件以添加所需依赖

确保包含对spring-ai-alibaba-starter以及Spring Boot父级项目的正确引用。

<parent>
    <groupId>org.springframework.boot</groupId>

    <artifactId>spring-boot-starter-parent</artifactId>

    <version>3.3.4</version>

    <relativePath/> <!-- lookup parent from repository -->
</parent>

<dependencies>
    <dependency>
        <groupId>com.alibaba.cloud.ai</groupId>

        <artifactId>spring-ai-alibaba-starter</artifactId>

        <version>1.0.0-M2</version>

    </dependency>

    ...其他依赖...
</dependencies>

<repositories>
    <repository>
      <id>sonatype-snapshots</id>

      <url>https://oss.sonatype.org/content/repositories/snapshots</url>

      <snapshots>
        <enabled>true</enabled>

      </snapshots>

    </repository>

    <repository>
      <id>spring-milestones</id>

      <name>Spring Milestones</name>

      <url>https://repo.spring.io/milestone</url>

      <snapshots>
        <enabled>false</enabled>

      </snapshots>

    </repository>

    <repository>
      <id>spring-snapshots</id>

      <name>Spring Snapshots</name>

      <url>https://repo.spring.io/snapshot</url>

      <releases>
        <enabled>false</enabled>

      </releases>

    </repository>

</repositories>
2. 实现RAGService类

创建一个RagService类用于处理文档读取、向量存储及查询逻辑。

public class RagService {
    private final ChatClient chatClient;
    private final VectorStore vectorStore;
    private final DashScopeApi dashscopeApi = new DashScopeApi("您的API_KEY");
    DocumentRetriever retriever;

    public RagService(ChatClient chatClient, EmbeddingModel embeddingModel) {
        this.chatClient = chatClient;
        vectorStore = new DashScopeCloudStore(dashscopeApi, new DashScopeStoreOptions("问题集"));
        retriever = new DashScopeDocumentRetriever(dashscopeApi, DashScopeDocumentRetrieverOptions.builder().withIndexName("问题集").build());
    }

    public String buildIndex() {
        String filePath = "路径/智能问答的问题集.docs";
        DocumentReader reader = new DashScopeDocumentCloudReader(filePath, dashscopeApi, null);
        List<Document> documentList = reader.get();
        vectorStore.add(documentList);
        return "索引构建成功";
    }

    public StreamResponseSpec queryWithDocumentRetrieval(String message) {
        return chatClient.prompt().user(message).advisors(new DocumentRetrievalAdvisor(retriever, DEFAULT_USER_TEXT_ADVISE)).stream();
    }
}
3. 创建控制器暴露接口

定义一个REST控制器以供外部调用。

@RestController
@RequestMapping("/ai")
public class RagController {
    private final RagService ragService;

    public RagController(RagService ragService) {
        this.ragService = ragService;
    }

    @GetMapping("/steamChat")
    public Flux<String> generate(@RequestParam("input") String message, HttpServletResponse httpResponse) {
        StreamResponseSpec response = ragService.queryWithDocumentRetrieval(message);
        httpResponse.setCharacterEncoding("UTF-8");
        return response.content();
    }

    @GetMapping("/buildIndex")
    public String buildIndex() {
        return ragService.buildIndex();
    }
}

此方案允许您先通过访问http://localhost:8080/ai/buildIndex来初始化PDF文件的索引,之后便可通过http://localhost:8080/ai/steamChat?input=您的问题进行查询。注意调整实际文件路径和API密钥等敏感信息。

增强前端代码以支持流式输出

在构建一个基于React的支持流式输出的前端项目时,首先需要确保后端接口能够返回flux<String>类型的数据,并且支持CORS(跨源资源共享),以便前端能够顺利访问该接口。本示例将指导你如何创建这样一个简单的聊天应用,其中前端通过发送请求到指定的后端URL http://localhost:8080/ai/steamChat?input=... 来获取流式响应。

构建项目并填写代码

  1. 初始化React项目首先,你需要安装Node.js和npm(如果尚未安装)。接着使用以下命令行来创建一个新的React应用:
npx create-react-app frontend
cd frontend
npm install
  1. 编辑HTML模板修改位于public/index.html中的文件以适应你的项目需求。这里保持默认配置即可满足基本要求。
  1. 设置React入口点更新src/index.js为应用程序的主要渲染点:
import React from 'react';
import ReactDOM from 'react-dom';
import App from './App';

ReactDOM.render(
  <React.StrictMode>
    <App />
  </React.StrictMode>,
  document.getElementById('root')
);
  1. 创建主组件编写src/App.js作为应用程序的核心布局容器:
import React from 'react';
import ChatComponent from './components/ChatComponent';

function App() {
  return (
    <div className="App">
      <ChatComponent />
    </div>

  );
}

export default App;
  1. 实现聊天组件src/components/ChatComponent.js中编写处理用户输入及显示消息逻辑的组件。此组件会向服务器发送GET请求并将接收到的流数据逐块添加至显示区域:
import React, { useState } from 'react';

function ChatComponent() {
  const [input, setInput] = useState('');
  const [messages, setMessages] = useState('');

  const handleInputChange = (event) => {
    setInput(event.target.value);
  };

  const handleSendMessage = async () => {
    try {
      const response = await fetch(`http://localhost:8080/ai/steamChat?input=${input}`);
      const reader = response.body.getReader();
      const decoder = new TextDecoder('utf-8');
      let done = false;

      while (!done) {
        const { value, done: readerDone } = await reader.read();
        done = readerDone;
        const chunk = decoder.decode(value, { stream: true });
        setMessages((prevMessages) => prevMessages + chunk);
      }
      
      // 添加分隔符以区分不同消息
      setMessages((prevMessages) => prevMessages + '\n\n---------------------\n\n');
    } catch (error) {
      console.error('Failed to fetch', error);
    }
  };

  const handleClearMessages = () => {
    setMessages('');
  };

  return (
    <div>
      <input
        type="text"
        value={input}
        onChange={handleInputChange}
        placeholder="Enter your message"
      />
      <button onClick={handleSendMessage}>Send</button>

      <button onClick={handleClearMessages}>Clear</button>

      <div>
        <h3>Messages:</h3>

        <pre>{messages}</pre>

      </div>

    </div>

  );
}

export default ChatComponent;

运行项目

完成以上步骤之后,可以通过下面的命令启动你的React开发服务器:

cd frontend
npm start

这将在本地环境运行你的React应用,并打开浏览器展示结果页面。每当用户点击“Send”按钮时,它会向指定的后端地址发起请求,并实时更新界面上的消息内容。请确保后端服务已经正确配置并且可访问。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/910290.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

如何基于pdf2image实现pdf批量转换为图片

最近为了将pdf报告解析成为文本和图片&#xff0c;需要将大量多页的pdf文件拆分下单独的一页一页的图像&#xff0c;以便后续进行OCR和图像处理&#xff0c;因此就需要实现将pdf2image&#xff0c;本文主要结合开源的pdf2image和poppler&#xff0c;实现了pdf转换为png格式图片…

Pytorch用BERT对CoLA、新闻组文本数据集自然语言处理NLP:主题分类建模微调可视化分析

原文链接&#xff1a;https://tecdat.cn/?p38181 原文出处&#xff1a;拓端数据部落公众号 自然语言处理&#xff08;NLP&#xff09;领域在近年来发展迅猛&#xff0c;尤其是预训练模型的出现带来了重大变革。其中&#xff0c;BERT 模型凭借其卓越性能备受瞩目。然而&#…

Kaggle:免费 GPU 使用指南,Colab 的理想替代方案

如果电脑显卡性能不足&#xff0c;又无法访问 Colab 的免费 GPU&#xff0c;那该怎么开始之后的学习呢&#xff1f; 答案是 Kaggle。 Kaggle 不仅提供免费的 GPU 计算资源&#xff0c;还可以直连而无需翻墙&#xff0c;同时不需要海外手机号验证。接下来&#xff0c;文章将详细…

Zookeeper 简介 | 特点 | 数据存储

1、简介 zk就是一个分布式文件系统&#xff0c;不过存储数据的量极小。 1. zookeeper是一个为分布式应用程序提供的一个分布式开源协调服务框架。是Google的Chubby的一个开源实现&#xff0c;是Hadoop和Hbase的重要组件。主要用于解决分布式集群中应用系统的一致性问题。 2. 提…

神经网络基础--什么是神经网络?? 常用激活函数是什么???

前言 本专栏更新神经网络的一些基础知识&#xff1b;案例代码基于pytorch&#xff1b;欢迎收藏 关注&#xff0c; 本人将会持续更新。 神经网络 1、什么是神经网络 人工神经网络&#xff08; Artificial Neural Network&#xff0c; 简写为ANN&#xff09;也简称为神经网络…

大模型也要“私人定制“?最新综述带你解锁AI的个性化服务 | 综述!扩散模型:AI艺术创作背后的“魔法引擎“

大模型领域的发展日新月异&#xff0c;每天都有许多有趣的论文值得深入品读。下面是本期觉得比较有意思的论文&#xff1a; 1、大模型也要"私人定制"&#xff1f;最新综述带你解锁AI的个性化服务 2、综述&#xff01;扩散模型&#xff1a;AI艺术创作背后的"魔法…

【MySQL 保姆级教学】深层理解索引及其特性(重点)--上(11)

MySQL与磁盘 1. MySQL与内存和磁盘的联系2. 认识磁盘2.1 MySQL与存储2.2 磁盘结构2.3 扇区2.4 定位扇区 3. MySQL与磁盘交互基本单位4. 建立共识5. 索引的理解5.1 建立一个表并查询5.2 为何 I/O 交互要是Page 6. B树 Vs B 树数6.1 不同存储引擎支持的索引结构类型6.2 B树 Vs B树…

1分钟教你利用ai工具免费制作养生视频,自动化批量操作,效率提升10倍!

养生这个是未来比较火爆的一个赛道,很多人越来越注重养生&#xff0c;你会发现抖音各种健身操博主&#xff0c;视频播放数据都很不错。很多人上一秒说的养生&#xff0c;下一秒又熬起了夜。年纪轻轻就喝起了枸杞续命。 有想做视频号带货的家人&#xff0c;其实可以考虑养生赛道…

思通数科纸质档案扫描与识别与档案馆应用场景介绍

在传统档案馆中&#xff0c;纸质文件的处理和管理是一个重要且繁琐的环节&#xff0c;特别是面对庞大的历史资料库。思通数科的AI能力平台提供了一种高效的数字化解决方案&#xff0c;利用OCR技术将纸质档案中的信息自动提取并转化为数字文本&#xff0c;具体过程包括以下几个步…

AutoCAD的Dwg版本代号、R版本参数值以及二次开发时VS、.NET版本关系

Dwg的AC版本代号 出处&#xff1a;https://www.autodesk.com.cn/support/technical/article/caas/sfdcarticles/sfdcarticles/CHS/drawing-version-codes-for-autocad.html 以下是AutoCAD图形的不同版本代号&#xff1a; MC0.0 - DWG Release 1.1 AC1.2 - DWG R1.2 AC1.4 - DW…

微服务day02

教学文档&#xff1a; 黑马教学文档 Docker Docker的安装 镜像和容器 命令解读 常见命令 案例 查看DockerHub&#xff0c;拉取Nginx镜像&#xff0c;创建并运行容器 搜索Nginx镜像&#xff1a;在 www.hub.docker.com 网站进行查询 拉取镜像&#xff1a; docker pull ngin…

脉冲全闭环EtherCAT运动控制器的固件升级

本文导读 随着产品的发展&#xff0c;正运动技术产品的固件也在不断更新与完善&#xff0c;新固件较老固件会解决一些客户的新需求与软件上的bug&#xff0c;增加了一些指令和功能&#xff0c;添加了更多的 EtherCAT从站与io模块。因此&#xff0c;升级固件是常用功能。推荐优…

用 Python 爬取淘宝商品价格信息时需要注意什么?

用 Python 爬取淘宝商品价格信息时&#xff0c;需要注意以下方面&#xff1a; 一、法律和道德规范&#xff1a; 遵守法律法规&#xff1a;网络爬虫的行为应在法律允许的范围内进行。未经淘宝平台授权&#xff0c;大规模地爬取其商品价格信息并用于商业盈利等不当用途是违法的…

三周精通FastAPI:35 最常用的模板引擎Jinja2

官方文档&#xff1a;https://fastapi.tiangolo.com/zh/advanced/templates/ 模板 FastAPI 支持多种模板引擎。 Flask 等工具使用的 Jinja2 是最常用的模板引擎。 在 Starlette 的支持下&#xff0c;FastAPI 应用可以直接使用工具轻易地配置 Jinja2。 安装依赖项 安装 ji…

AI 搜索来势汹汹,互联网将被颠覆还是进化?

最近&#xff0c;美国新闻集团起诉了知名 AI 搜索引擎 Perplexity AI。也许你会想&#xff0c;这不就是又一起“AI 惹官司”吗&#xff1f;其实&#xff0c;这次情况不太一样&#xff0c;甚至可能会改变我们未来上网的方式&#xff01; 争议的焦点是什么&#xff1f;是未来的 …

微信小程序官方评价组件wxacommentplugin下线后如何巧妙调用

在前一段时间微信小程序官方下线了评价组件后&#xff0c;无法再申请到了&#xff0c; 先来说说小程序什么情况下弹出评价&#xff1f; 1.官方邀请用户评价 用户通过搜索使用过小程序后&#xff0c;官方会邀请用户对小程序的使用体验进行评价。这个是系统随机的&#xff0c;…

Nat Med 病理AI系列|人工智能在肝病临床试验中的应用·顶刊精析·24-11-06

小罗碎碎念 今天分析Nature Medicine病理AI系列的第6篇文章——《AI-based automation of enrollment criteria and endpoint assessment in clinical trials in liver diseases》。 这篇文章介绍了一种基于人工智能的测量工具AIM-MASH&#xff0c;它能够提高非酒精性脂肪性肝…

AWG5200系列-美国泰克AWG5202/5204/5208任意波形

AWG5200系列-美国泰克AWG5202/5204/5208任意波形 美国泰克AWG5202/5204/5208任意波形发生器AWG5200可满足苛刻的信号生成需求&#xff0c;具有高信号保真度&#xff0c;支持多台同步&#xff0c;可扩展到zui多32条及以上通道&#xff0c;高性价比。是高级研究、电子测试和雷达、…

SpringBoot在城镇住房保障系统中的应用案例

摘要 随着信息技术在管理上越来越深入而广泛的应用&#xff0c;管理信息系统的实施在技术上已逐步成熟。本文介绍了城镇保障性住房管理系统的开发全过程。通过分析城镇保障性住房管理系统管理的不足&#xff0c;创建了一个计算机管理城镇保障性住房管理系统的方案。文章介绍了城…

无需专业技能,快速上手本地部署Llama3:让你的个人电脑也能高效运行

大家好&#xff0c;我是斜杠君。今天手把手教大家如何在本地部署Llama3&#xff0c;打造一个属于自己的本地大模型助手。 在教大家部署Llama3之前&#xff0c;先要带大家了解一个概念&#xff1a;Ollama。 Ollama是什么&#xff1f; Ollama是一个用于在本地计算机上运行大型语言…