使用LobeChat+Ollama快速搭建本地大模型，离线可用

使用LobeChat+Ollama快速搭建本地大模型，离线可用

article2025/2/23 6:07:57/文章来源:https://blog.csdn.net/weixin_35770067/article/details/140470525

文章目录

准备工作
下载Ollama
- 什么是Ollama
参考文献

分享一下如何部署本地大模型，让它成为你的离线助手。

准备工作

服务器或者电脑一台，配置越高越好， Windows和Mac皆可，Widows最好内存8G以上而且带一块好一点的显卡；Mac的话建议M系列芯片，内存建议16G以上

下载好docker桌面版:https://www.docker.com/products/docker-desktop/

下载好Ollama:https://ollama.ai/

注意：运行 7B 模型时，您应至少有 8 GB 的可用内存，运行 13B 模型时应有 16 GB 的可用内存，运行 33B 模型时应有 32
GB 的可用内存。

M系列MacBook采用统一内存架构，这意味着CPU和GPU可以共享同一内存池。这种设计减少了数据在不同处理单元之间传输的需要，从而可以显著提高大型数据集处理的速度和效率。

下载Ollama

在这里插入图片描述
在官网进行下载，也可以使用docker进行安装。

什么是Ollama

在这里插入图片描述
Ollama 是一个轻量级、可扩展的框架，旨在在本地计算机上构建和运行大型语言模型（LLM）。它支持多种模型架构，如 Llama 3、Phi 3、Mistral 和 Gemma 2，并提供了简洁的 API 以创建、运行和管理这些模型。Ollama 可以在 macOS、Linux 和 Windows 上运行，适合于需要在本地运行大模型的应用场景 (Ollama) (GitHub)。

Ollama 的主要特点包括：

易用性：API设计简洁，用户可以轻松上手，即使是没有经验的用户也能快速使用 (腾讯云 - 产业智变云启未来)。
性能：运行速度快，占用资源少，即使在配置较低的机器上也能流畅运行 (腾讯云 - 产业智变云启未来)。
功能多样性：支持多种任务，如文本翻译、问答、代码生成等，可以满足用户的多种需求 (腾讯云 - 产业智变云启未来)。
社区支持：拥有一个活跃的社区，用户可以分享经验和获得帮助 (腾讯云 - 产业智变云启未来)。

此外，Ollama 提供了一个丰富的模型库，用户可以轻松地拉取和运行预训练模型，并且支持从 PyTorch 或 Safetensors 导入模型进行自定义 (Ollama)。

如果你想在自己的电脑上运行如 GPT-3 这样的大型人工智能模型，而不是通过互联网连接到它们，那么 Ollama 是一个实现这一目标的工具。

Ollama支持非常多的开源模型，比如：
在这里插入图片描述
更多支持的模型可以看这边：https://ollama.com/library

当然它还支持自定义模型，这边就不深入了，有兴趣的可以研究：https://github.com/ollama/ollama

装好之后，命令行运行:

ollama -v

查看到版本号说明安装好了。

接下来我们下载一个llama3 8B的模型：

ollama run llama3

这边可能需要比较长的时间，取决于你的网速。

下载好了就可以进行交互了：

其实现在已经搞定了，你可以让它帮你干活了，但是每次都要用命令行，有些人觉得不方便，而且也不能给别人用，下面我们就给它搞一个图形化界面，扩展一下功能，也能让局域网里的其他小伙伴也用上你的这个模型（注意多人同时访问会导致机器负载飙升，具体取决于你机器的性能和模型参数的大小）

参考文献

https://ollama.com/library
https://blog.laoda.de/archives/lobechat-ollama-deploy-offline

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/803522.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

AI伦理议题：从隐私保护到算法公平

AI伦理议题：从隐私保护到算法公平

文章目录 🍊1 人工智能兴起背后的伦理及道德风险1.1 算法偏见与歧视1.2 数据隐私侵权1.3 透明度受限1.4 决策失衡1.5 AI生成内容的危险性 🍊2 建构AIGC伦理观：实现人机共创的永续提升2.1 技术手段与伦理预防2.2 即时警告与紧急关停措施2.3 法…

阅读更多...

Qt 使用Installer Framework制作安装包

Qt 使用Installer Framework制作安装包

Qt 使用Installer Framework制作安装包引言一、下载安装 Qt Installer Framework二、简单使用2.1 创建目录结构 (文件夹结构)2.2 制作程序压缩包2.3 制作程序安装包引言 Qt Installer Framework (安装程序框架)是一个强大的工具集，用于创建自定义的在线和离线安装…

阅读更多...

【Outlook】从Outlook新版回归经典版全攻略

【Outlook】从Outlook新版回归经典版全攻略

引言在微软宣布计划于2024年底淘汰邮件应用（Mail app）之后，许多用户发现新版Outlook应用（Outlook (new)）在他们的Windows 11/10系统上自动启动。如果您更倾向于使用经典版Outlook（Outlook (classic)&…

阅读更多...

【tomcat】Tomcat如何扩展Java线程池原理

【tomcat】Tomcat如何扩展Java线程池原理

池化技术在后端中，对于经常使用池化就是来提升系统性能，比如数据库连接池、线程池连接池等，本质都是利用空间换时间的来提升性能，用来避免资源的频繁创建和销毁，以此提高资源的复用率，所以合理设置系统所…

阅读更多...

Python | Leetcode Python题解之第233题数字1的个数

Python | Leetcode Python题解之第233题数字1的个数

题目： 题解： class Solution:def countDigitOne(self, n: int) -> int:# mulk 表示 10^k# 在下面的代码中，可以发现 k 并没有被直接使用到（都是使用 10^k）# 但为了让代码看起来更加直观，这里保留了 kk,…

阅读更多...

成为CMake砖家(5): VSCode CMake Tools 插件基本使用

成为CMake砖家(5): VSCode CMake Tools 插件基本使用

大家好，我是白鱼。之前提到过，白鱼的主力编辑器/IDE 是 VSCode， 也提到过使用 CMake Language Support 搭配 dotnet 执行 CMakeLists.txt 语法高亮。对于阅读 CMakeLists.txt 脚本， 这足够了。而在 C/C 开发过程中&#xff…

阅读更多...

完美的用户体验：如何设计一个直观和有效的网站导航？

完美的用户体验：如何设计一个直观和有效的网站导航？

APP的顶部导航栏对我们来说很熟悉。导航栏是UI设计中不可或缺的一部分，几乎每个页面都使用导航栏。虽然导航栏看起来很简单，不需要太多精力，但是设计一个与产品需求和客户目标高度匹配的导航栏并不是那么容易的。导航栏的设计标准有很多细节需…

阅读更多...

qt 创建一个左侧边线拖拽的矩形

qt 创建一个左侧边线拖拽的矩形

1.概要 2.代码 2.1 代码第一版在Qt中，要创建一个可以向左侧拖拽边线的矩形，你需要自定义一个QGraphicsRectItem的子类，并重写其事件处理函数来响应鼠标的拖拽动作。以下是一个简单的实现示例： #include <QApplication>…

阅读更多...

Python酷库之旅-第三方库Pandas(028)

Python酷库之旅-第三方库Pandas(028)

目录一、用法精讲 71、pandas.tseries.api.guess_datetime_format函数 71-1、语法 71-2、参数 71-3、功能 71-4、返回值 71-5、说明 71-6、用法 71-6-1、数据准备 71-6-2、代码示例 71-6-3、结果输出 72、pandas.util.hash_array函数 72-1、语法 72-2、参数 72…

阅读更多...

快速排序及归并排序的实现与排序的稳定性

快速排序及归并排序的实现与排序的稳定性

目录快速排序一. 快速排序递归的实现方法 1. 左右指针法步骤思路为什么要让end先走？ 2. 挖坑法步骤思路 3. 前后指针法步骤思路二. 快速排序的时间和空间复杂度 1. 时间复杂度 2. 空间复杂度三. 快速排序的优化方法 1. 三数取中优化 2. 小区…

阅读更多...

昇思25天学习打卡营第13天|munger85

昇思25天学习打卡营第13天|munger85

文本解码原理–以MindNLP为例重要的就是怎么样把数字最后转化成真正的文字。而且自回归模型它会一个字给一个字的预测，下一个字应该是什么？ 如果这个模型下载很慢，你就可以通过这种方式从摩大社区进行下载。这种方式， 每一次候…

阅读更多...

AI+文娱，人工智能助力文娱行业智能化之路！

AI+文娱，人工智能助力文娱行业智能化之路！

近些年来，我国文化产业领域对于人工智能等高新科技愈发重视，呈现出文化和科技深度有机融合的发展态势。科技与文化碰撞带来的火花，让我们对历史的表达有了更多可能。这既是高新技术的具体应用和不断落地，也是提升文化产品数字化、…

阅读更多...

MFC CRectTracker 类用法详解

MFC CRectTracker 类用法详解

CRectTracker 类并非 Microsoft Foundation Class (MFC) 库中应用很广泛的一个类，一般教科书中很少有提到。在编程中如果需编写选择框绘制以及选择框大小调整、移动等程序时，用CRectTracker 类就会做到事半而功倍。下面详细介绍MFC CRectTracker 类。 M…

阅读更多...

小熊猫C++与Dev-C++：两款C++开发环境的对比

小熊猫C++与Dev-C++：两款C++开发环境的对比

引言在C编程的世界中，选择合适的开发环境是至关重要的。今天，我们将对比两款流行的C开发工具：小熊猫C和Dev-C。这两款软件各有特色，适合不同的编程需求和偏好。本文将从多个方面对它们进行详细的比较，帮助开发者做出…

阅读更多...

如何追查一个packet在linux 系统哪里丢失

如何追查一个packet在linux 系统哪里丢失

要想追一个包在系统哪里丢失了， 就要了解一个应用层的包在送出时要经历那些检查点和被丢掉的点。 1. 在传输层，如果是 tcp 包会有contrack 的 buf 的限制可能会导致 packets 的丢失。 > 检查办法：查看dmesg日志有报错：k…

阅读更多...

输入网址到网页显示的过程

输入网址到网页显示的过程

输入网址到网页显示的过程 1. 浏览器解析 URL2. 域名解析解析的流程 3. TCP通过三次握手建立连接4. 生成TCP段：在数据的前面加上 TCP 头部，生成TCP段TCP 头部 5. 生成IP数据报：在TCP段的前面加上 IP包头，生成IP数据报IP包头 6. 在…

阅读更多...

【时时三省】tessy 集成测试：小白入门指导手册

【时时三省】tessy 集成测试：小白入门指导手册

目录 1，创建集成测试模块且分析源文件 2，设置测试环境 3，TIE界面设置相关函数 4，SCE界面增加用例 5，编辑数据 6，用例所对应的测试函数序列 7，添加 work task 函数 8，为测试场景添加函数 9，为函数赋值 10，编辑时间序列的数值 11，执行用例 12，其他注意事项…

阅读更多...

EXCEL VBA工程密码破解工作表保护破解

EXCEL VBA工程密码破解工作表保护破解

这里写目录标题破解Excel宏工程加密方法一新建破解宏文件方法二修改二进制文件破解工作表保护引用破解Excel宏工程加密如图所示白料数据处理已工程被加密。方法一新建破解宏文件 1 创建一个XLSM文件，查看代码 ALTF11 2 新建一个模块，“插…

阅读更多...

35.UART（通用异步收发传输器）-RS232（2）

35.UART（通用异步收发传输器）-RS232（2）

（1）RS232接收模块visio框图： （2）接收模块Verilog代码编写: /* 常见波特率： 4800、9600、14400、115200 在系统时钟为50MHz时，对应计数为： (1/4800) * 10^9 /20 -1 10416 …

阅读更多...

基于springboot+vue+uniapp的超市购物系统小程序

基于springboot+vue+uniapp的超市购物系统小程序

开发语言：Java框架：springbootuniappJDK版本：JDK1.8服务器：tomcat7数据库：mysql 5.7（一定要5.7版本）数据库工具：Navicat11开发软件：eclipse/myeclipse/ideaMaven包&#…

阅读更多...

最新文章