AI知识库 - Cherry Studio

1 引言:

最近 DeepSeek 很火啊,想必大家都知道,DeepSeek 这个开源的模型出来后,因其高质量能力和R1 的思维链引发了大家本地部署的热潮。我也不例外,本地部署了一个 14B 的模型,然后把,感觉傻傻的,可能是参数量太少了,然后发现大家都有类似的感觉。所以大家都打消了本地部署的想法吧,只能满血版的 671B 参数量的才是我们理解的 DeepSeek ,而这个参数量级的基本上不适合个人电脑。

然后想体验 R1 思维链的方式就局限在了 DeepSeek 官网 、 三方平台、 API 调用。最近很多云服务平台也上线了满血版的 DeepSeek,大家可以去体验下。接下来主要会从 API 调用和 Cherry Studio 方向来讲。

这里的初衷是:

  • 体验满血版 R1 的思维链,相比输出的结果,这个思考过程对我来说价值会更高一点。
  • Cherry Studio 提供了知识库搭建的功能,想看看效果怎么样,是否能找到一些价值。

2 项目介绍

2.1 Cherry Studio

Cherry Studio 是一款集多模型对话、知识库管理、AI 绘画、翻译等功能于一体的全能 AI 助手平台。 Cherry Studio 的高度自定义的设计、强大的扩展能力和友好的用户体验,使其成为专业用户和 AI 爱好者的理想选择。无论是零基础用户还是开发者,都能在 Cherry Studio 中找到适合自己的AI功能,提升工作效率和创造力。

2.2 SiliconFlow

SiliconFlow 致力于建立一个可扩展,标准化和高性能的 AI Infra 平台。它提供硅云(型号作为服务),硅LLM推理引擎)和 Onediff (高性能图像/视频生成库)。这些解决方案都可以帮助公司和独立开发人员以轻松且经济高效的方式部署AI模型。

SiliconFlow 现在有活动,用户注册就是 14 元,也就是 2000 万的 Tokens ,同时邀请一个用户注册也会送 14 元。

这是俺的 邀请链接 ,👏🏻 欢迎大家点击注册。

3 本地使用方法

3.1 下载 Cherry Studio

从 Cherry Studio 官网 去下载对应的版本在电脑上安装就好。

3.2 获取 SiliconFlow ApiKey

成功注册后在 API 秘钥菜单栏中中新建密钥,然后复制出来。

3.3 配置 Cherry Studio

image.png

打开 Cherry Studio 的设置界面,然后选中模型服务,在硅基流动的模型中粘贴刚刚复制的 密钥,把顶部的开关打开,然后点击检查,选中 DeepSeek 的模型就好,如果弹窗显示连接成功,这表示可以使用了。

image.png

点击左侧的菜单回到聊天界面,然后点击上方的模型,选择想要体验的模型就好,这里我选择的 R1,主要来体验思维链。

image.png

这是相关的思考过程,这样就可以通过 Cherry Studio 来使用 DeepSeek R1 模型了,不用再去官网体验 服务器繁忙,请稍后再试。

3.4 知识库搭建

3.4.1 添加嵌入型模型
  1. 在模型管理服务中查找模型,可以点击“嵌入模型”快速筛选;
  2. 找到需要的模型,添加到我的模型。

image.png

[注意]

  1. 嵌入类模型、对话类模型、绘画类模型等各自有各自的功能,其请求方式跟返回内容、结构都有所不同,请勿强行将其他类别的模型作为嵌入模型使用;
  2. 嵌入类模型 Cherry Studio 会自动分类显示在嵌入模型列表中(如上图),如果确认为嵌入模型但未被正确分类,可到模型列表中点击对应模型后方的设置按钮勾选嵌入选项;
  3. 如果无法确认哪些模型是嵌入模型可到对应服务商查询模型信息。
3.4.2 创建知识库
  1. 知识库入口:在 Cherry Studio 左侧工具栏,点击知识库图标,即可进入管理页面;
  2. 添加知识库:点击添加,开始创建知识库;
  3. 命名:输入知识库的名称并添加嵌入模型,以 bge-m3 为例,即可完成创建。

image.png

3.4.3 添加文件并向量化
  1. 添加文件:点击添加文件的按钮,打开文件选择;
  2. 选择文件:选择支持的文件格式,如 pdf,docx,pptx,xlsx,txt,md,mdx 等,并打开;
  3. 向量化:系统会自动进行向量化处理,当显示完成时(绿色 ✓),代表向量化已完成。

image.png

Cherry Studio 支持多种添加数据的方式:

  1. 文件夹目录:可以添加整个文件夹目录,该目录下支持格式的文件会被自动向量化;
  2. 网址链接:支持网址 url,如https://www.laughingzhu.cn;
  3. 站点地图:支持 xml 格式的站点地图](https://docs.siliconflow.cn/sitemap.xml);
  4. 纯文本笔记:支持输入纯文本的自定义内容。

这里有很多种方式添加,我选了一个自己博客的网站。

3.4.4 搜索知识库

当文件等资料向量化完成后,即可进行查询:

  1. 点击页面下方的搜索知识库按钮;
  2. 输入查询的内容;
  3. 呈现搜索的结果;
  4. 并显示该条结果的匹配分数。

3.4.5 对话中引用知识库生成回复
  1. 创建一个新的话题,在对话工具栏中,点击知识库,会展开已经创建的知识库列表,选择需要引用的知识库;
  2. 输入并发送问题,模型即返回通过检索结果生成的答案 ;
  3. 同时,引用的数据来源会附在答案下方,可快捷查看源文件。

image.png

效果如下:

image.png

下边是没使用知识库的结果:

image.png

可以看到二者对比还是很明显的,对于一些需要聚合或者私有知识库的用户来说,这个还是比较有用的,可以把知识库中的内容聚合起来,最近飞书文档也接入了 DeepSeek ,可以实现类似的功能了。

这个知识库的需求应该还是有很大需求的,特别是一些私有的知识库,期望不对外开放的内容,都可以通过这个方式来实现。

当然有条件的话可以在自己的服务器上跑一些本地模型,这个数据就都在自己手里了,也可以实现一些私有化的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/970065.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Ai笔记本-Ainote(IOS 应用)帮助支持页面

简介 一个 iCloud 实时同步的笔记工具,支持markdown 格式解析、分享 PDF文件。 方便存储各种AI生成的markdown 格式回答,自动保存到 iCloud 永不丢失,支持分享为 PDF 格式笔记。 联系方式 如果您在使用过程中有任何问题或建议,…

1、Prometheus 监控系统(上)

Prometheus 监控系统(上) 认识一下 PrometheusPrometheus 的特点Prometheus 的生态组件Prometheus 的工作模式Prometheus 的工作流程Prometheus 的局限性: 部署 PrometheusPrometheust Server 端安装和相关配置部署 Exporters部署 Node Expor…

【设计模式】-工厂模式(简单工厂、工厂方法、抽象工厂)

工厂模式(简单工厂、工厂方法、抽象工厂) 介绍 简单工厂模式 简单工厂模式不属于23种GoF设计模式之一,但它是一种常见的设计模式。它提供了一种创建对象的接口,但由子类决定要实例化的类是哪一个。这样,工厂方法模式让类的实例化推迟到子类…

应急响应(linux 篇,以centos 7为例)

一、基础命令 1.查看已经登录的用户w 2.查看所有用户最近一次登录:lastlog 3.查看历史上登录的用户还有登录失败的用户 历史上所有登录成功的记录 last /var/log/wtmp 历史上所有登录失败的记录 Lastb /var/log/btmp 4.SSH登录日志 查看所有日志:…

【实测】用全志A733平板搭建一个端侧Deepseek算力平台

随着DeepSeek 的蒸馏技术的横空出世,端侧 SoC 芯片上运行大模型成为可能。那么端侧芯片跑大模型的效果如何呢?本文将在全志 A733 芯片平台上部署一个 DeepSeek-R1:1.5B 模型,并进行实测效果展示。 端侧平台环境 设备:全志A733平板…

nuxt中引入element-ui组件控制台报错问题

在使用element-ui组件的外层加一层 <client-only placeholder"Loading..."><van-button type"primary">主要按钮</van-button> </client-only> 实际使用&#xff1a; <div class"tab"><client-only placehol…

数据结构(考研)

线性表 顺序表 顺序表的静态分配 //线性表的元素类型为 ElemType//顺序表的静态分配 #define MaxSize10 typedef int ElemType; typedef struct{ElemType data[MaxSize];int length; }SqList;顺序表的动态分配 //顺序表的动态分配 #define InitSize 10 typedef struct{El…

【广州大学主办,发表有保障 | IEEE出版,稳定EI检索,往届见刊后快至1个月检索】第二届电气技术与自动化工程国际学术会议 (ETAE 2025)

第二届电气技术与自动化工程国际学术会议 (ETAE 2025) The 2nd International Conference on Electrical Technology and Automation Engineering 大会官网&#xff1a;http://www.icetae.com/【更多详情】 会议时间&#xff1a;2025年4月25-27日 会议地点&#xff1a…

【弹性计算】弹性计算的技术架构

弹性计算的技术架构 1.工作原理2.总体架构3.控制面4.数据面5.物理设施层 虽然弹性计算的产品种类越来越多&#xff0c;但不同产品的技术架构大同小异。下面以当前最主流的产品形态 —— 云服务器为例&#xff0c;探查其背后的技术秘密。 1.工作原理 云服务器通常以虚拟机的方…

EasyRTC轻量级SDK:智能硬件音视频通信资源的高效利用方案

在智能硬件这片广袤天地里&#xff0c;每一份资源的精打细算都关乎产品的生死存亡。随着物联网技术的疾速演进&#xff0c;实时音视频通信功能已成为众多设备的标配。然而&#xff0c;硬件资源的捉襟见肘&#xff0c;让开发者们常常陷入两难境地。EasyRTC&#xff0c;以它的极致…

Linux | 进程相关概念(进程、进程状态、进程优先级、环境变量、进程地址空间)

文章目录 进程概念1、冯诺依曼体系结构2、进程2.1基本概念2.2描述进程-PCB2.3组织进程2.4查看进程2.5通过系统调用获取进程标识符2.6通过系统调用创建进程-fork初识fork の 头文件与返回值fork函数的调用逻辑和底层逻辑 3、进程状态3.1状态3.2进程状态查看命令3.2.1 ps命令3.2.…

【ESP32接入国产大模型之Deepseek】

【ESP32接入国产大模型之Deepseek】 1. Deepseek大模型1.1 了解Deepseek api1.2 Http接口鉴权1.3. 接口参数说明1.3.1 请求体(request)参数1.3.2 模型推理 2. 先决条件2.1 环境配置2.2 所需零件 3. 核心代码3.1 源码分享3.2 源码解析3.3 连续对话修改后的代码代码说明示例输出注…

OSI 参考模型和 TCP/IP 参考模型

数据通信是很复杂的&#xff0c;很难在一个协议中完成所有功能。因此在制定协议时经常采用的思路是将复杂的数据通信功能由若干协议分别完成&#xff0c;然后将这些协议按照一定的方式组织起来。最典型的是采用分层的方式来组织协议&#xff0c;每一层都有一套清晰明确的功能和…

C# CultureInfo 地区影响字符串

问题 线上遇到有玩家资源加载异常&#xff0c;发现资源路径出现异常字符&#xff1a; 发现是土耳其语下字符串转小写不符合预期&#xff1a; "I".ToLower() -> ı 解决方案 String.ToLower 改成 String.ToLowerInvariant 全局修改禁用文化差异&#xff1a;ht…

蓝桥与力扣刷题(108 将有序数组转换成二叉搜索树)

题目&#xff1a;给你一个整数数组 nums &#xff0c;其中元素已经按 升序 排列&#xff0c;请你将其转换为一棵 平衡二叉搜索树。 示例 1&#xff1a; 输入&#xff1a;nums [-10,-3,0,5,9] 输出&#xff1a;[0,-3,9,-10,null,5] 解释&#xff1a;[0,-10,5,null,-3,null,9]…

python学opencv|读取图像(六十二)使用cv2.morphologyEx()形态学函数实现图像梯度处理

【1】引言 前序已经学习了腐蚀和膨胀的单独作用函数&#xff0c;还研究了按照不同顺序调用腐蚀和膨胀函数调整图像效果&#xff0c;相关文章包括且不限于&#xff1a; python学opencv|读取图像&#xff08;六十一&#xff09;先后使用cv2.dilate()函数和cv2.erode()函数实现图…

(萌新入门)如何从起步阶段开始学习STM32 —— 0.碎碎念

目录 前言与导论 碎碎念 所以&#xff0c;我到底需要知道哪些东西呢 从一些基础的概念入手 常见的工具和说法 ST公司 MDK5 (Keil5) CubeMX 如何使用MDK5的一些常用功能 MDK5的一些常见的设置 前言与导论 非常感谢2301_77816627-CSDN博客的提问&#xff0c;他非常好奇…

线程池-抢票系统性能优化

文章目录 引言-购票系统线程池购票系统-线程池优化 池化 vs 未池化 引言-购票系统 public class App implements Runnable {private static int tickets 100;private static int users 10000;private final ReentrantLock lock new ReentrantLock(true);public void run() …

soular基础教程-使用指南

soular是TikLab DevOps工具链的统一帐号中心&#xff0c;今天来介绍如何使用 soular 配置你的组织、工作台&#xff0c;快速入门上手。 &#xfeff; 1. 账号管理 可以对账号信息进行多方面管理&#xff0c;包括分配不同的部门、用户组等&#xff0c;从而确保账号权限和职责…

大数据SQL调优专题——Hive执行原理

引入 Apache Hive 是基于Hadoop的数据仓库工具&#xff0c;它可以使用SQL来读取、写入和管理存在分布式文件系统中的海量数据。在Hive中&#xff0c;HQL默认转换成MapReduce程序运行到Yarn集群中&#xff0c;大大降低了非Java开发者数据分析的门槛&#xff0c;并且Hive提供命令…