️ 在 Windows WSL 上部署 Ollama 和大语言模型的完整指南20241206

🛠️ 在 Windows WSL 上部署 Ollama 和大语言模型的完整指南

📝 引言

随着大语言模型(LLM)和人工智能的飞速发展,越来越多的开发者尝试在本地环境中部署大模型进行实验。然而,由于资源需求高、网络限制多以及工具复杂性,部署过程常常充满挑战。

本指南基于实际经验,详细讲解如何在 Windows WSL(Windows Subsystem for Linux) 上部署 Ollama 和大语言模型,同时解决端口转发等常见痛点,实现局域网内多设备访问。
无论您是 AI 技术新手、行业从业者,还是 经验丰富的专家,这篇文章都能提供全面的指南、实践经验与优化建议。

在这里插入图片描述

⭐ 1.为什么选择 WSL 部署大模型?

1.1 性能优势

👉 WSL 的设计目标是高效:

  • WSL 利用 Windows 内核直接运行 Linux 环境,性能接近原生 Linux。
  • 支持 NVIDIA GPU 加速(如 4070 Super),运行大语言模型毫无压力。

1.2 易用性

  • 轻量级:无需像 VMware 或 VirtualBox 那样安装完整的虚拟机。
  • 集成度高:与 Windows 文件系统和网络无缝结合。
  • 简单维护:直接通过 Windows Store 更新 WSL。

1.3 实际适用性

  • 开发者首选:对于想快速部署和运行模型的开发者,WSL 是简单且高效的选择。

⚙️ 2. 实现目标的挑战与应对策略

2.1 核心目标

🌟 最终实现的核心目标如下:

  1. 在 WSL 中成功部署 Ollama 服务并加载千问大语言模型。
  2. 配置 OpenWebUI,提供直观的交互界面,方便用户使用。
  3. 实现局域网访问,支持家庭设备通过浏览器与服务交互。

2.2 挑战分析

🚧 在实际联网部署中面临的关键挑战包括:

  1. 大模型下载与镜像获取

    • 模型文件和 Docker 镜像较大,需确保网络环境稳定。
    • 在线下载过程中可能因网络波动导致超时或中断。
  2. 端口转发和局域网访问

    • WSL 默认服务绑定到 127.0.0.1,局域网设备无法直接访问。
    • 动态 IP 问题会导致端口转发规则失效,需频繁手动调整。
  3. 服务性能与配置

    • 模型加载占用大量内存与显存,需合理优化系统资源。
    • Docker 容器与 Ollama 服务同时运行时,可能出现资源竞争问题。

2.3 应对策略

在线获取资源,避免复杂的手动传输

  • 直接通过 ollama 命令下载模型,无需额外离线准备。
  • 使用 Docker 官方镜像仓库,确保高效获取最新镜像。

优化端口转发,实现动态调整

  • 编写自动化脚本,动态获取 WSL 的当前 IP,并更新转发规则。
  • 利用 Windows 的 Nginx 反向代理,将服务映射到局域网内可用地址。

服务绑定到 0.0.0.0,开放外部访问

  • 修改服务绑定地址为 0.0.0.0,允许外部设备通过 IP 地址直接访问。
  • 配置 OpenWebUI 的 Web 服务,提供直观的交互界面。

2.3 应对策略

在线获取资源,避免复杂的手动传输

  • 直接通过 ollama 命令下载模型,无需额外离线准备。
  • 使用 Docker 官方镜像仓库,确保高效获取最新镜像。

优化端口转发,实现动态调整

  • 编写自动化脚本,动态获取 WSL 的当前 IP,并更新转发规则。
  • 利用 Windows 的 Nginx 反向代理,将服务映射到局域网内可用地址。

服务绑定到 0.0.0.0,开放外部访问

  • 修改服务绑定地址为 0.0.0.0,允许外部设备通过 IP 地址直接访问。
  • 配置 OpenWebUI 的 Web 服务,提供直观的交互界面。## 📋 3.实践:在 WSL 上部署 Ollama 和千问模型(联网版)

3.1 准备资源与环境

环境准备📂

1.windows电脑安装WSL
   wsl --install
   wsl --set-default-version 2
2. 在WSL 中安装 Docker:
sudo apt update
sudo apt install -y docker.io
sudo service docker start

友情提示:
可以通过如下命令实现将windows宿主机资源传输到 WSL:

cp /mnt/c/Users/<your_username>/Downloads/docker-images-openwebui.tar ~/
3. 配置非 root 用户运行 Docker:
sudo usermod -aG docker $USER
newgrp docker

验证 Docker 是否可用

加载 Docker 镜像

docker run hello-world```

3.2部署 Ollama 和千问模型

1.下载并安装 Ollama
curl -O https://ollama.com/downloads/ollama-linux-amd64
chmod +x ollama-linux-amd64
sudo mv ollama-linux-amd64 /usr/local/bin/ollama
2.启动 Ollama 服务
ollama serve
3.下载并运行千问模型

通过 ollama 工具直接在线下载并运行模型:

ollama run qwen2.5

3.3 部署 OpenWebUI

1. 拉取 OpenWebUI 的 Docker 镜像
docker pull ghcr.io/open-webui/open-webui:main
2. 启动 OpenWebUI 容器
docker run -d --name openwebui \
  -p 8080:8080 \
  -v ~/.ollama:/app/backend/data \
  ghcr.io/open-webui/open-webui:main
3. 验证 OpenWebUI 是否运行正常
docker ps

访问服务
确保容器状态为 Up,然后
• 本地访问:http://localhost:8080
• 局域网访问:通过端口转发或绑定所有地址实现http://<WIndows_IP>:8080。

3.4 设置局域网访问

获取 WSL 的 IP 地址

hostname -I

例如,返回的 IP 地址可能是 172.22.203.210。

在 Windows 中设置端口转发
1. 打开 PowerShell(管理员权限),运行以下命令:

netsh interface portproxy add v4tov4 listenaddress=0.0.0.0 listenport=8080 connectaddress=<WSL_IP> connectport=8080	

替换 <WSL_IP> 为实际的 WSL IP 地址。
2. 在局域网中的设备上访问:

http://<Windows_IP>:8080

🔧4. WSL 的端口转发问题及优化解决方案

4.1 动态 IP 的困扰

WSL 的 IP 地址可能每次重启后变化,可以在 /etc/wsl.conf 文件中固定 WSL 子网:

[network]
generateResolvConf = false
subnet = 192.168.50.0/24

重启 WSL 后验证新 IP 是否生效。

wsl --shutdown
wsl

验证新 IP 是否生效:

hostname -I

4.2 自动化脚本

每次启动 WSL 自动更新端口转发规则:
创建脚本 setup_portproxy.sh:

#!/bin/bash
wsl_ip=$(hostname -I | awk '{print $1}')
powershell.exe -Command "netsh interface portproxy add v4tov4 listenaddress=0.0.0.0 listenport=8080 connectaddress=$wsl_ip connectport=8080"

赋予执行权限:

chmod +x setup_portproxy.sh

在每次 WSL 启动后运行脚本。

4.3 使用反向代理

在 Windows 主机上安装 Nginx,配置反向代理到 WSL 的服务地址:

1. 安装 Nginx

下载并安装 Nginx for Windows,编辑 conf/nginx.conf 文件,添加以下内容:

server {
    listen 80;
    server_name localhost;

    location / {
        proxy_pass http://172.22.203.210:8080;
        proxy_set_header Host $host;
        proxy_set_header X-Real-IP $remote_addr;
        proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for;
    }
}
2. 重新启动 Nginx

在命令行中执行:


nginx -s reload

📊 对比分析:WSL vs VMware vs VirtualBox

特性WSLVMware WorkstationVirtualBox
性能⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
GPU 支持⭐⭐⭐⭐⭐⭐⭐⭐
易用性⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐
免费使用⭐⭐⭐⭐⭐⭐⭐⭐⭐⭐

📝 结论与展望

🌟 总结

通过联网直接使用 ollama 下载并运行千问等大语言模型,同时结合 OpenWebUI 提供的便捷交互界面,用户可以快速搭建 AI 实验环境。借助反向代理和端口转发的优化配置,还能够轻松实现局域网内访问,从而为开发和实验提供更高效的支持。未来可以通过进一步优化自动化脚本和硬件配置,让 WSL 成为本地 AI 部署的最佳选择。


补充亮点

  1. 增加了 OpenWebUI 的 Docker 镜像加载和启动步骤
  2. 强调局域网访问 OpenWebUI 的方法,使得模型在本地和局域网中都能灵活使用。
  3. 整体简化流程,无离线依赖,完全基于网络操作。

🔍 展望

  • 为开发者提供解决问题的思路

    • 聚焦实际开发中的痛点问题,例如 WSL 的端口转发不稳定、资源调度困难等,提供清晰的解决步骤。
    • 通过脚本化、自动化配置和硬件资源优化,减少开发者的重复性工作。
  • 启发具体问题的解决方案

    • 针对端口映射问题,提出动态脚本更新的方案,避免配置失效。
    • 在 GPU 和模型加载方面,利用量化技术降低资源消耗,为硬件条件受限的开发者提供有效的策略。

本文旨在通过分享实践心得与创新思考,助力你在技术探索的征途中,轻松跨越障碍,加速实验进程,让创意与成果璀璨绽放。🎯

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/932073.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

1-1 ESP32开发环境配置

前言&#xff1a; 基于Arduio配置ESP32开发环境... 目录 前言&#xff1a; 1.0 安装Python 2.0 安装VSCode 3.0 VSCode实用插件 4.0 替换VSCode配置&#xff08;可选&#xff09; 后记 1.0 安装Python 在windows操作系统的搜索框中搜索Microsoft Store 点击获取 安装完成…

【k8s 深入学习之 event 聚合】event count累记聚合(采用 Patch),Message 聚合形成聚合 event(采用Create)

参考 15.深入k8s:Event事件处理及其源码分析 - luozhiyun - 博客园event 模块总览 EventRecorder:是事件生成者,k8s组件通过调用它的方法来生成事件;EventBroadcaster:事件广播器,负责消费EventRecorder产生的事件,然后分发给broadcasterWatcher;broadcasterWatcher:用…

AURIX TC3xx学习笔记2 GTM模块

文章目录 引言功能改进一些缩写 功能细节GTM Clock and Time Base Management (CTBM)Clock Management Unit (CMU)External Generation Unit (EGU)Configurable Clock Generation sub-unit (CFGU)Fixed Clock Generation (FXU) Time Base Unit (TBU) Cluster Configuration Mod…

在CentOS上无Parallel时并发上传.wav文件的Shell脚本解决方案

在CentOS上无Parallel时并发上传.wav文件的Shell脚本解决方案 背景概述解决方案脚本实现脚本说明使用指南注意事项在CentOS操作系统环境中,若需并发上传特定目录下的.wav文件至HTTP服务器,而系统未安装GNU parallel工具,我们可通过其他方法实现此需求。本文将介绍一种利用Sh…

QT通过在线安装器安装【详细】

在线安装器地址&#xff1a; 官方在线安装器&#xff1a;Index of /official_releases/online_installers (qt.io) 通过命令行启动安装页面 直接双击qt安装程序&#xff0c;在线安装会非常慢&#xff0c;甚至安装失败&#xff0c;所以通过命令行页面启动安装页面。点击wind…

保姆级教学 uniapp绘制二维码海报并保存至相册,真机正常展示图片二维码

一、获取二维码 uni.request({url: https://api.weixin.qq.com/wxa/getwxacode?access_token${getStorage("token")},responseType: "arraybuffer",method: "POST",data: {path: "/pages/index/index"},success(res) {// 转换为 Uint…

Unity类银河战士恶魔城学习总结(P166 Ailments FX 异常状态伤害粒子特效)

【Unity教程】从0编程制作类银河恶魔城游戏_哔哩哔哩_bilibili 教程源地址&#xff1a;https://www.udemy.com/course/2d-rpg-alexdev/ 本章节创建了三种粒子特效&#xff0c;火焰&#xff0c;寒冰&#xff0c;雷电 主场景创建/特效/粒子 初始的例子特效 火焰 寒冰 雷电 En…

Java基于SpringBoot的网上订餐系统,附源码

博主介绍&#xff1a;✌Java老徐、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;&…

[笔记] Windows 上 Git 安装详细教程:从零开始,附带每个选项解析

Git 是目前最流行的分布式版本控制系统之一&#xff0c;广泛应用于软件开发和项目管理中。对于 Windows 用户来说&#xff0c;正确安装和配置 Git 是开始使用 Git 的第一步。本文提供一份详细的指南&#xff0c;帮助你在 Windows 系统上顺利安装 Git&#xff0c;并解释每个安装…

JavaScript编写css自定义属性

一、自定义属性 是在 CSS 中定义的变量&#xff0c;以 --开头。它们可以存储颜色、尺寸、字体等任何 CSS 值&#xff0c;并且可以在整个文档中重复使用。 :root {--primary-color: #3498db;--font-size: 16px; }body {color: var(--primary-color);font-size: var(--font-siz…

项目开发之Jenkins

文章目录 思考基础概述JenkinsMavenGit集成开发部署GitLab服务安装 实战1 新建任务需要的配置pipeline最后 思考 jenkis怎么连接github仓库&#xff1f; jenkis的作用是什么&#xff1f;基础 概述 定义&#xff1a;Jenkins是一款开源的持续集成(Continuous Integration&…

core Webapi jwt 认证

core cookie 验证 Web API Jwt 》》》》用户信息 namespace WebAPI001.Coms {public class Account{public string UserName { get; set; }public string UserPassword { get; set; }public string UserRole { get; set; }} }》》》获取jwt类 using Microsoft.AspNetCore.Mvc…

TCP/IP协议详解(小白)

TCP/IP协议详解 TCP/IP协议包含了一系列的协议&#xff0c;也叫TCP/IP协议族&#xff08;TCP/IP Protocol Suite&#xff0c;或TCP/IP Protocols&#xff09;&#xff0c;简称TCP/IP。TCP/IP协议族提供了点对点的连结机制&#xff0c;并且将传输数据帧的封装、寻址、传输、路由…

Java项目实战II基于微信小程序的旅游社交平台(开发文档+数据库+源码)

目录 一、前言 二、技术介绍 三、系统实现 四、核心代码 五、源码获取 全栈码农以及毕业设计实战开发&#xff0c;CSDN平台Java领域新星创作者&#xff0c;专注于大学生项目实战开发、讲解和毕业答疑辅导。 一、前言 随着移动互联网的迅猛发展&#xff0c;旅游已经成为人…

jmeter配置

单接口运行没问题&#xff0c;但是批量执行100个线程数发现总是提示请求不合法 最后发现 需要将配置改成 正好回归一下这个配置&#xff1a; Ramp-Up时间&#xff08;秒&#xff09;的定义&#xff1a; Ramp-Up时间是指在JMeter测试中&#xff0c;所有指定的线程&#xff08…

SpringBoot 项目如何集成 JWT

SpringBoot 项目如何集成 JWT JWT JSON Web Token (JWT) 是一个开放标准(RFC 7519)&#xff0c;它定义了一种紧凑的、自包含的方式&#xff0c;用于作为 JSON 对象在各方之间安全地传输信息。 在 Oauth2 中&#xff0c;其实就是返回访问令牌 &#xff08;access_token&#…

【innodb阅读笔记】之 Innodb行记录格式 (Compact 行格式)

一、Innodb行记录格式 innodb 存储引擎同大多数数据库一样&#xff0c;记录是以行的形式存储的。这意味着页中保存的一行行的数据。在 mysql 5.7 版本中&#xff0c;默认格式为 Dynamic&#xff0c;可以通过命令查看当前表的行格式&#xff0c;其中 row_format 表示当前表行记录…

交易所 Level-2 历史行情数据自动化导入攻略

用户部署完 DolphinDB 后&#xff0c;需要将历史股票数据批量导入数据库&#xff0c;再进行数据查询、计算和分析等操作。DolphinDB 开发了 ExchData 模块&#xff0c;主要用于沪深交易所 Level-2 行情原始数据的自动化导入&#xff0c;目前已支持的数据源包括&#xff1a; 沪…

加载内核映像文件

将kernel转换成elf文件格式&#xff0c;不能直接从loader直接跳转到0x100000&#xff0c;需要解析&#xff0c;提取出代码和数据出来&#xff0c;放到0x10000&#xff08;64kb&#xff09;的位置&#xff0c;1M的位置只是存放elf文件的位置。 4.10加载内核映像文件2 common/el…