Milvus x DeepSeek 搭建低成本高精度 RAG 实战

为什么手握海量数据,却用不出真正的“智能”?要么 AI 模型学艺不精,答非所问;要么技术门槛太高,让普通开发者望而却步。现在,使用阿里云 Milvus 向量检索服务、DeepSeek 大模型和 PAI LangStudio 开发工具,只需像搭积木一样,将其进行简易拼接,就能轻松搭建一套‘能查会想’的 RAG 系统。接下来将基于阿里云的人工智能平台 PAI LangStudio,结合阿里云向量检索Milvus版的强大能力,并以 DeepSeek-R1-Distill 模型为例,为您详细介绍大模型 RAG 检索增强解决方案。当然如您需要更高配置的 DeepSeek R1 模型来满足使用需求,也可以复用以下技术链路来进行实现。

阿里云 Milvus+DeepSeek + PAI LangStudio 搭建智能问答助手,支持私域知识库和联网功能

Step 1: 创建阿里云 Milvus 实例的实例

可根据指引完成创建:快速创建Milvus实例_向量检索服务 Milvus 版(Milvus)-阿里云帮助中心

请注意,Milvus 实例和后续通过 PAI LangStudio 创建的 Embedding 服务、LLM 服务须在相同地域内。

Step 2 : 将 RAG 知识库上传至 OSS 中

本文针对金融、医疗场景提供以下示例语料:

  • 金融新闻:数据为 PDF 格式,主要内容为公开新闻网站上的新闻报道。

  • 疾病介绍:数据为 CSV 格式,主要内容为维基百科上的疾病介绍。

Step 3 :部署 DeepSeek 模型和 Embedding 模型

1. 前往 PAI 控制台的快速开始 > ModelGallery,分别按场景选择大语言模型及 **Embedding **分类,并部署指定的模型。本文以 **DeepSeek-R1-Distill-Qwen-7B **和 bge-m3 通用向量模型为例进行部署。(链接:https://pai.console.aliyun.com/#/quick-start/models)

如果您想完整体验 DeepSeek 模型,请选择 DeepSeek-R1 或 DeepSeek-V3。

2. 前往任务管理,单击已部署的服务名称,在服务详情页签下单击查看调用信息,分别获取前面部署的 DeepSeek 大预言模型和 Embedding 模型服务的 VPC 访问地址和 Token,供后续创建连接时使用。(链接:阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台)

Step 4 : 创建连接

4.1 创建 LLM 服务连接

  1. 进入 LangStudio,选择工作空间后,在连接管理页签下单击新建连接。(链接:阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台)

  2. 创建通用 LLM 模型服务连接。单击EAS 服务,从弹出的抽屉中选择已部署的服务,会自动填充base_urlapi_key

4.2. 创建 Embedding 模型服务连接

同创建 LLM 服务连接,创建通用 Embedding 模型服务连接。其中 **base_url **和 **api_key **分别对应部署 DeepSeek 大语言模型和 Embedding 模型中 Embedding 模型的 VPC 访问地址和 Token。

4.3 创建向量数据库连接

同创建 LLM 服务连接,创建 Milvus 数据库连接。

关键参数说明:

  • uri:Milvus 实例的访问地址,格式为http://<Milvus内访问地址>

您可以在阿里云Milvus控制台的 Milvus 实例的实例详情页面查看。例如,http://c-b1c5222fba****-internal.milvus.aliyuncs.com

  • token:登录 Milvus 实例的用户名和密码,填写格式为<yourUsername>:<yourPassword>

  • database:数据库名称,本文使用默认数据库default

Step 5.:创建离线知识库

新建知识库索引,将语料经过解析、分块、向量化后存储到向量数据库,从而构建知识库。新建知识库索引详细配置请参见:https://help.aliyun.com/zh/pai/user-guide/knowledge-base-index-management。

Step 6: 创建并运行RAG应用流

  1. 进入 LangStudio,选择工作空间后,在应用流页签下单击新建应用流,模板类型选择 RAG,创建 RAG 应用流。

2. 启动运行时:单击右上角启动运行时并进行配置。注意:在进行 Python 节点解析或查看更多工具时,需要保证运行时已启动。

注意专有网络配置:选择创建 Milvus 实例时的专有网络。

3. 开发应用流。应用流中的其余配置保持默认或根据实际需求进行配置,关键节点配置如下:

  • index_lookup:在知识库中检索与用户问题相关的文本。
    • registered_index:配置为已创建的知识库索引。
    • query:用户问题。

    • top_k:返回 top_k 条匹配的数据。

  • generate_answer:使用过滤后的文档作为上下文,与用户问题一起发送给大语言模型,生成回答。

    • connection:选择创建 LLM 服务连接中创建的连接。

    • model:输入 default。connection也可选择的是百炼大模型服务连接。

    • max_tokens:设置最大 token 数,本例设置为1000。

4. 调试/运行:单击右上角对话, 开始执行应用流。

5. 查看链路:单击生成答案下的查看链路,查看 Trace 详情或拓扑视图。

Step 7: 部署应用流

在应用流开发页面,单击右上角部署,部署参数其余配置保持默认或根据实际需求进行配置,关键参数配置如下:

  • 资源部署信息 > 实例数:配置服务实例数。本文部署仅供测试使用,因此实例数配置为1。在生产阶段,建议配置多个服务实例,以降低单点故障的风险。

  • 专有网络配置 > VPC:配置 Milvus 实例所在的专有网络。

更多部署详情,请参见https://help.aliyun.com/zh/pai/user-guide/application-flow-deployment。

Step 8: 调用服务,进行对话

部署成功后,跳转到 PAI-EAS,在在线调试页签下配置并发送请求。请求参数中的 Key 与应用流中输入节点中的"Chat 输入"字段一致,本文使用默认字段question。输入以下内容。

{
    "question":"请根据最新的新闻报道,分析美国科技行业目前投资分管性如何,是否存在泡沫,给出是或否的具体回答"
}

更多调用方式(如API调用)及详细说明,请参见将应用流部署为EAS服务_人工智能平台 PAI(PAI)-阿里云帮助中心。

开启联网搜索

如果您希望使用 DeepSeek-R1模型,快速构建具备联网搜索与 RAG(检索增强生成)功能的智能应用流,可以参见 Chatbot with RAG and Web Search。(链接:Chatbot with RAG and Web Search_人工智能平台 PAI(PAI)-阿里云帮助中心)

立即体验

我们诚邀您立即体验阿里云向量检索服务 Milvus 版的强大功能!您只需登录阿里云账号,进入向量检索服务 Milvus 版产品控制台(阿里云登录 - 欢迎登录阿里云,安全稳定的云计算服务平台 ),即可创建阿里云 Milvus 实例,开箱即用。

此外,为回馈新老用户,阿里云 Milvus 推出了重大优惠:

向量检索服务 Milvus 版产品全部规格,年付通通5折!

阿里云向量检索服务 Milvus 版,将持续打磨产品,不断优化产品的功能、性能和使用体验,为用户提供更加专业、灵活、高效的向量搜索引擎服务,助力企业轻松应对海量非结构化数据管理挑战,实现业务价值最大化,欢迎大家体验!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/977722.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Unity Shader 学习13:屏幕后处理 - 使用高斯模糊的Bloom辉光效果

目录 一、基本的后处理流程 - 以将画面转化为灰度图为例 1. C#调用shader 2. Shader实现效果 二、Bloom辉光效果 1. 主要变量 2. Shader效果 &#xff08;1&#xff09;提取较亮区域 - pass1 &#xff08;2&#xff09;高斯模糊 - pass2&3 &#xff08;3&#xff…

学习路程五 向量数据库Milvus操作

前序 前面安装好了docker且成功拉取Milvus镜像&#xff0c;启动。通过python成功连接上了数据。接下来就继续更多Milvus的操作 在开始之前&#xff0c;先来简单了解一下向量数据库内一些东西的基本概念 概念描述数据库&#xff08;Database&#xff09;类似与MySQL的database…

pycharm安装教程-PyCharm安装破解步骤【MAC版】

pycharm安装教程-PyCharm2023安装破解步骤【MAC版】 破解安装安装包获取 今天来给大家分享 Mac 系统安装 PyCharm&#xff0c;附带资源 破解安装&#xff0c; PyCharm 相关就不叙述了&#xff0c;直接开始安装&#xff01; 破解安装 打开下载的安装包 PyCharm2023.dmg&#x…

简单介绍 SSL 证书类型: DV、OV、EV 的区别

SSL证书类型DV、OV、EV 区别&#xff1a; DV(域名验证型)SSL证书 OV(组织验证型)SSL证书 EV(扩展验证型)SSL证书

NLP的预处理数据

处理文本数据的主要工具是Tokenizer。Tokenizer根据一组规则将文本拆分为tokens。然后将这些tokens转换为数字&#xff0c;然后转换为张量&#xff0c;成为模型的输入。模型所需的任何附加输入都由Tokenizer添加。 如果您计划使用预训练模型&#xff0c;重要的是使用与之关联的…

[Web 安全] PHP 反序列化漏洞 —— PHP 序列化 反序列化

关注这个专栏的其他相关笔记&#xff1a;[Web 安全] 反序列化漏洞 - 学习笔记-CSDN博客 0x01&#xff1a;PHP 序列化 — Serialize 序列化就是将对象的状态信息转化为可以存储或传输的形式的过程&#xff0c;在 PHP 中&#xff0c;通常使用 serialize() 函数来完成序列化的操作…

国科大——数据挖掘(0812课程)——课后作业

前沿&#xff1a; 此文章记录了2024年度秋季学期数据挖掘课程的三次课后作业&#xff0c;答案仅供参考。 第一次作业 1 假定数据仓库中包含4个维&#xff1a;date, product, vendor, location&#xff1b;和两个度量&#xff1a;sales_volume和sales_cost。 1&#xff09;画…

从电子管到量子计算:计算机技术的未来趋势

计算机发展的历史 自古以来人类就在不断地发明和改进计算工具,从结绳计数到算盘,计算尺,手摇计算机,直到1946年第一台电子计算机诞生,虽然电子计算机至今虽然只有短短的半个多世纪,但取得了惊人的发展吗,已经经历了五代的变革。计算机的发展和电子技术的发展密切相关,…

Redis核心数据结构与底层实现

5种基础数据结构 String 字符串list 列表hash 字典set 集合zset 有序集合 deepseek的回答 String 内部编码 redis根据当前值的类型和长度决定使用哪种内部编码&#xff0c;共3种内部编码&#xff1a; int &#xff1a;value为整数时embstr : 短字符串&#xff08;长度<…

【我的Android进阶之旅】Android Studio SDK Update Site 国内的腾讯云镜像配置指南

一、腾讯云的镜像 https://mirrors.cloud.tencent.com/AndroidSDK/ 二、 打开 Android Studio‌的SDK Manager 路径:Tools–>SDK Manager 在右侧找到 SDK Update Sites 列表‌‌,添加如下链接,像下面一样,一个一个添加 将下面几个链接都加上去 https:

C++知识整理day9——继承(基类与派生类之间的转换、派生类的默认成员函数、多继承问题)

文章目录 1.继承的概念和定义2.基类与派生类之间的转换3.继承中的作用域4.派生类的默认成员函数5.实现一个不能被继承的类6.继承与友元7.继承与静态成员8.多继承和菱形继承问题8.1 继承分类及菱形继承8.2 虚继承 1.继承的概念和定义 概念&#xff1a; 继承(inheritance)机制是⾯…

OpenCV计算摄影学(2)图像去噪函数denoise_TVL1()

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 原始-对偶算法是用于解决特定类型变分问题&#xff08;即&#xff0c;寻找一个函数以最小化某个泛函&#xff09;的算法。特别地&#xff0c;图像…

【Kimi】自动生成PPT-并支持下载和在线编辑--全部免费

【Kimi】免费生成PPT并免费下载 用了好几个大模型&#xff0c;有些能生成PPT内容&#xff1b; 有些能生成PPT&#xff0c;但下载需要付费&#xff1b; 目前只有Kimi生成的PPT&#xff0c;能选择模板、能在线编辑、能下载&#xff0c;关键全部免费&#xff01; 一、用kimi生成PP…

SQL注入(order by,limit),seacms的报错注入以及系统库的绕过

1&#xff1a;如果information_schema被过滤了&#xff0c;该怎么绕过 1.1&#xff1a;介绍一下information_schema这个库 information_schema 是一个非常重要的系统数据库&#xff0c;它在SQL标准中定义&#xff0c;并且被许多关系型数据库管理系统&#xff08;RDBMS&#x…

猿大师播放器:交通水利、公安消防Web端Vue网页播放20路RTSP H.265 1080P监控视频流

随着互联网技术的飞速发展&#xff0c;视频监控已成为各行各业不可或缺的一部分。无论是交通物流、公安消防&#xff0c;还是水利农业、园区校园&#xff0c;视频监控都扮演着至关重要的角色。然而&#xff0c;传统的视频监控解决方案往往依赖于特定的客户端软件&#xff0c;这…

Vue3 + Spring WebMVC 验证码案例中的跨域问题与解决方法

最近在基于vue3 SpringWebMVC前后端分离的开发环境中实现一个验证码的案例&#xff0c;在开发过程中遇到了一些复杂的跨域问题&#xff0c;现已解决&#xff0c;故将解决方法分享&#xff0c;希望能帮到有需要的人。 出现的问题&#xff1a; 对于验证码的实现&#xff0c;我选…

Mac 版 本地部署deepseek ➕ RAGflow 知识库搭建流程分享(附问题解决方法)

安装&#xff1a; 1、首先按照此视频的流程一步一步进行安装&#xff1a;(macos版&#xff09;ragflowdeepseek 私域知识库搭建流程分享_哔哩哔哩_bilibili 2、RAGflow 官网文档指南&#xff1a;https://ragflow.io 3、RAGflow 下载地址&#xff1a;https://github.com/infi…

蛋白质研究常用数据库系列1

一系列常用的蛋白质研究数据库 一 蛋白综合数据库 1.1 Uniprot UniProt&#xff08;Universal Protein Resource&#xff0c;https://www.uniprot.org/&#xff09;是一个免费开放的综合性蛋白质数据库。该数据库蛋白信息来源于EMBL、GenBank、DDBJ等公共数据库&#xff08;非…

minio作为K8S后端存储

docker部署minio mkdir -p /minio/datadocker run -d \-p 9000:9000 \-p 9001:9001 \--name minio \-v /minio/data:/data \-e "MINIO_ROOT_USERjbk" \-e "MINIO_ROOT_PASSWORDjbjbjb123" \quay.io/minio/minio server /data --console-address ":90…

深圳南柯电子|医疗设备EMC测试整改检测:零到一,保障医疗安全

在当今医疗科技飞速发展的时代&#xff0c;医疗设备的电磁兼容性&#xff08;EMC&#xff09;已成为确保其安全、有效运行的关键要素之一。EMC测试整改检测不仅关乎设备的性能稳定性&#xff0c;更是保障患者安全、避免电磁干扰引发医疗事故的重要措施。 一、医疗设备EMC测试整…