windows操作系统本地部署开源语言模型ChatGLM3-6b,超详细

前言

首先感谢智谱AI和清华大学 KEG 实验室联合开源的ChatGLM3对话预训练模型,让我们国人有属于自己的AI聊天机器人。

ChatGLM3-6B 的基础模型 ChatGLM3-6B-Base 采用了更多样的训练数据、更充分的训练步数和更合理的训练策略。在语义、数学、推理、代码、知识等不同角度的数据集上测评显示,ChatGLM3-6B-Base 具有在 10B 以下的基础模型中最强的性能。

默认情况下,模型以 FP16 精度加载,测试运行需要大概 16GB 显存。如果你的 GPU 显存有限,可以尝试以量化方式加载模型,或者CPU运算方式测试运行模型,下面流程是基于GPU的。

ChatGLM2和ChatGLM3性能对比

与二代模型相比,其效果平均提升了超过 50%

安装流程

1 部署python>=3.10运行环境(使用conda)

2 安装duda和cudnn(比较麻烦,cudnn需要登录NVIDIA,cudnn下载我是科学上网通过的

3 安装torch和torch.cuda

4 chatGML3源码下载

5 chatGML3-6b-8k模型下载

6 修改测试代码模型的路径为本地

下载安装conda

conda是什么不过多介绍了,自行百度。。

下载地址:Free Download | Anaconda

安装对应版本的CUDA 和 cuDNN

好吧,先说一下cuda是什么还有cuDNN是什么

CUDA 是 NVIDIA 公司推出的一种通用并行计算架构,全称为 Compute Unified Device Architecture。它旨在让软件开发人员能够利用 NVIDIA GPU(图形处理器)的强大并行计算能力来解决复杂的计算问题,尤其是在那些原本由 CPU(中央处理器)执行时效率较低或耗时较长的任务上。

cuDNN 是 NVIDIA 提供的用于深度神经网络的 GPU 加速库,它高效实现了深度学习中常见的运算原语(如卷积、池化、归一化和激活函数),旨在提升深度学习模型训练和推理的性能、易用性和内存效率。

注意:CUDA和cuDNN在模型测推理和下载pytorch版本时候都是相关联的

查看自己电脑对应的cuda版本号

按住win + R 调出命令终端,输出cmd

nvidia-smi

 

上图红色框内的12.4就是cuda的版本

CUDA的安装链接: CUDA 

 

本地和软件下载都一样不要纠结。。。。。这个文件也比较大,需要一些时间。

这是一个很详细的cuda和cuDNN安装教程,包括一些环境变量的配置:链接: CUDA安装教程.

创建虚拟环境

 conda create -n chatglm3 python=3.10

 conda activate chatglm3

 conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

注意:python版本需要>=3.10 

pytorch-cuda版本的查看地址: pytorch

注意:pytorch-cuda=12.1   12.1要修改为您自己对应的版本,而且版本一定要和cuda的版本对应!

验证torch.cuda是否安装成功

import torch
print(torch.cuda.is_available())


返回true代表成功 

ChatGLM3源码安装

切换到conda

模型基础运行代码已经上传到 github 和 SwanHub 两个平台,两个平台的信息同步。开发者通过以下方式下载模型代码。

从 github 下载源码

git clone https://github.com/THUDM/ChatGLM3.git

从 SwanHub 下载源码

git clone https://swanhub.co/ZhipuAI/ChatGLM3.git

 安装扩展

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple --trusted-host pypi.tuna.tsinghua.edu.cn

下载预训练好的基础模型文件 

Huggingface 下载

git lfs install
git clone https://huggingface.co/THUDM/chatglm3-6b.git

Modelscope 下载

git lfs install
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

SwanHub 下载

git lfs install
git clone https://swanhub.co/ZhipuAI/chatglm3-6b.git

注意:这里文件比较大,需要一些时间的,下载好就是下面的样子

 测试模型demo

MODEL_PATH 是模型文件存储的地方,也就是预训练的基础文件目录
TOKENIZER_PATH 是分词器目录,和MODEL_PATH一样就可以

注意:我的显卡是4090 24G显存,如果你的低于这个配置,最好模型量化测试,不然不知道显卡会不会烧坏。。。。

模型量化 

量化方式加载模型,使用方法如下:

model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True).quantize(4).cuda()

CPU 部署 

如果你没有 GPU 硬件的话,也可以在 CPU 上进行推理,但是推理速度会更慢。

注意:除了慢还需要至少32G以上内存

model = AutoModel.from_pretrained("THUDM/chatglm3-6b", trust_remote_code=True).float()

 运行测试
 

测试文件在basic_demo目录下 

python cli_demo.py

 当出现一下画面,就可以和chatglm3对话了!!!兄弟,点个赞吧!!!!

web_demo_gradio.py 是页面的demo,python  web_demo_gradio.py 运行。

关注我:后续还会更新如何微调 chatglm3 ,也就是让它成为你的个性化ai智能语言模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/505203.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

mysql 用户管理-权限管理

学习了用户管理,再学习下权限管理。 3,权限管理 权限管理主要是对登录到MySQL的用户进行权限验证。所有用户的权限都存储在MySQL的权限表中,不合理的权限规划会给MySQL服务器带来安全隐患。数据库管理员要对所有用户的权限进行合理规…

C++练级之路——C++入门

1、命名空间 在C/C中会出现大量的变量&#xff0c;函数&#xff0c;起名字是一个很大的问题&#xff0c;为了防止命名重复&#xff0c;就出现了命名空间的概念&#xff0c;使用命名空间的目的是对标识符的名称进行本地化&#xff0c;以避免命名冲突和名字污染 #include <st…

黄金涨是商品牛市的领先信号

自2022年11月以来&#xff0c;黄金价格持续上涨&#xff0c;目前已经突破历史新高&#xff0c;历史上黄金上涨&#xff0c;大多是商品全面牛市的领先信号。在2008年Q4、2019年也出现过&#xff0c;黄金比其他商品更强&#xff0c;但随后的2009年和2020年均是商品的全面牛市。同…

AI副业拆解:使用Suno生成你的专属歌曲

大家好我是在看&#xff0c;记录普通人学习探索AI之路。 今天和大家拆解Suno的定制个性化音乐&#xff0c;Suno应用程序热度非凡&#xff0c;其独特之处在于&#xff0c;用户仅需提供歌词内容与期望的歌曲风格&#xff0c;即可一键生成专属曲目。 Suno的诞生&#xff0c;无疑…

考研数学|零基础张宇全年复习规划+资料分享

可以全程张宇老师的高等数学&#xff0c;张宇老师的拿手绝活是 但是其他科目&#xff0c;还有更好的选择&#xff0c;比如线性代数&#xff0c;汤家凤老师还有李永乐老师讲的都不错&#xff0c;概率论&#xff0c;余丙森老师还有方浩老师讲的很好。下面我就讲清楚&#xff0c;…

FPGA时序优化之Reduce MUXF Mapping

我们都知道&#xff0c;FPGA中的拥塞有&#xff1a;全局拥塞&#xff0c;短线拥塞和长线拥塞。 今天我们就来看短线拥塞的一种解决方案&#xff1a;Reduce MUXF Mapping。 UltraScale的CLB资源 在介绍Reduce MUXF Mapping&#xff0c;我们需要知道什么是MUXF&#xff0c;这就…

MongoDB Atlas维护指南:常见类型、注意事项与窗口设置

为了给Atlas用户更好的产品体验&#xff0c;MongoDB产品团队会进行定期维护。 本文将会介绍&#xff1a; 常见维护项目种类及频率&#xff0c;注意事项维护期间的影响及建议维护窗口设置说明维护告警设置和邮件通知范例 维护窗口常见项目 定期SSL证书轮换软件升级&#xff…

内网渗透-(黄金票据和白银票据)详解(一)

目录 一、Kerberos协议 二、下面我们来具体分析Kerberos认证流程的每个步骤&#xff1a; 1、KRB_AS-REQ请求包分析 PA-ENC-TIMESTAMP PA_PAC_REQUEST 2、 KRB_AS_REP回复包分析&#xff1a; TGT认购权证 Logon Session Key ticket 3、然后继续来讲相关的TGS的认证过程…

基于springboot+vue+Mysql的篮球论坛系统

开发语言&#xff1a;Java框架&#xff1a;springbootJDK版本&#xff1a;JDK1.8服务器&#xff1a;tomcat7数据库&#xff1a;mysql 5.7&#xff08;一定要5.7版本&#xff09;数据库工具&#xff1a;Navicat11开发软件&#xff1a;eclipse/myeclipse/ideaMaven包&#xff1a;…

【最全详细解读】Sora都有哪些不足与缺陷?

Sora介绍 Sora是一个能以文本描述生成视频的人工智能模型&#xff0c;由美国人工智能研究机构OpenAI开发。 Sora这一名称源于日文“空”&#xff08;そら sora&#xff09;&#xff0c;即天空之意&#xff0c;以示其无限的创造潜力。其背后的技术是在OpenAI的文本到图像生成模…

win11运行vmware报错“此平台不支持虚拟化的 amd-v/rvi”问题(已解决)

背景&#xff1a; Windows11 安装vmware17 player运行eve需要打开there &#xff08;reference:https://docs.vmware.com/cn/VMware-Workstation-Player-for-Windows/17.0/com.vmware.player.win.using.doc/GUID-3140DF1F-A105-4EED-B9E8-D99B3D3F0447.html&#xff09; 但是…

Java数据结构链表

物理上不一定连续&#xff0c;但逻辑上连续 链表是由一个一个的节点组织起来的&#xff0c;整体就叫做链表。 public class MySingleLinkedList {//将节点定义为内部类class ListNode{//节点有两个域public int val;public ListNode next;//next为引用类型public ListNode(int…

【C++入门】输入输出、命名空间、缺省参数、函数重载、引用、内联函数、auto、基于范围的for循环

目录 命名空间 命名空间的定义 命名空间的使用 输入输出 缺省参数 函数重载 引用 常引用 引用的使用场景 内联函数 auto 基于范围的for循环 命名空间 请看一段C语言的代码&#xff1a; #include <stdio.h> #include <stdlib.h>int rand 10;int main…

机器学习-关联规则算法Apriori及编码实现

一、前置知识 在了解关联规则之前首先了解一些相关概念&#xff0c;包含项集、频繁项集、支持度、置信度、提升度等基础概念。假如我们在经营一家商品超市&#xff0c;顾客进行购买商品的订单信息如下&#xff1a; TID ItemsT1 {耳机&#xff0c;背包}T2{背包&#xff0c;手…

实践笔记-harbor仓库镜像上传与拉取

harbor仓库镜像上传与拉取 1.上传镜像修改 daemon.json 配置文件上传镜像至harbor 2.拉取镜像登录账号&#xff08;跟上传镜像那里一样操作登录步骤就可以了&#xff09;拉取镜像 环境&#xff1a;centos7 1.上传镜像 修改 daemon.json 配置文件 # 编辑daemon.json文件&#…

【Entity Framework】创建并配置模型

【Entity Framework】创建并配置模型 文章目录 【Entity Framework】创建并配置模型一、概述二、使用fluent API配置模型三、分组配置四、对实体类型使用EntityTypeConfigurationAttribute四、使用数据注释来配置模型五、实体类型5.1 在模型中包含类型5.2 从模型中排除类型5.3 …

RabbitMQ--04--发布订阅模式 (fanout)-案例

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 发布订阅模式 (fanout)---案例前言RabbitListener和RabbitHandler的使用 1.通过Spring官网快速创建一个RabbitMQ的生产者项目2.导入项目后在application.yml文件中配…

MSTP环路避免实验(华为)

思科设备参考&#xff1a;MSTP环路避免实验&#xff08;思科&#xff09; 一&#xff0c;技术简介 MSTP&#xff08;多生成树协议&#xff09;&#xff0c;MSTP解决了STP和RSTP没有考虑vlan的问题&#xff0c;STP和RSTP将所有的vlan共享为一个生成树实例&#xff0c;无法实现…

数据链路层之信道:数字通信的桥梁与守护者

✨✨ 欢迎大家来访Srlua的博文&#xff08;づ&#xffe3;3&#xffe3;&#xff09;づ╭❤&#xff5e;✨✨ &#x1f31f;&#x1f31f; 欢迎各位亲爱的读者&#xff0c;感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢&#xff0c;在这里我会分享我的知识和经验。&am…

蓝桥杯刷题第五天(昨天刷了忘记更了)

思路&#xff1a; 用dp来记录最短消耗时间 dp[坐标][zhuangtai] 状态0表示在底部&#xff0c;状态1表示在传送门处&#xff1b; 先初始化dp[1][0] 和dp[1][1]然后循环遍历到dp[n][0] 和dp[n][1]&#xff0c;用动态规划方程去赋值&#xff1b; ps&#xff1a;易错点在于要开…