ChatGLM3本地部署运行(入门体验级)

文章目录

  • 前言
  • 零 硬件
  • 小白基知填坑
    • eForce Game Ready驱动程序
    • CUDA常用命令
  • 环境准备
    • NVIDIA驱动更新
    • CUDA安装
  • 部署
  • 补充内容
  • 体验

前言

  • 学习自B站up主技术爬爬虾,感谢up主提供的整合包!

零 硬件

  • 6GB以上显存的NVIDIA显卡(品质越高,效果越好)

小白基知填坑

eForce Game Ready驱动程序

  • 使用NVIDIA GeForce Game Ready驱动程序可以通过提供更好的图形处理能力和稳定性来增强AI任务的性能。
  • GeForce Game Ready驱动程序的功能:
  1. 性能优化:驱动程序通过针对不同的AI任务优化图形处理单元(GPU)的使用,提供更高效的计算能力,从而提高AI学习和大模型部署的性能。
  2. 兼容性支持:驱动程序经过测试和优化,以确保其与最新的AI框架和库以及相关软件的兼容性。这有助于确保您可以顺利运行和部署AI模型。
  3. 稳定性和可靠性:GeForce Game Ready驱动程序经过严格测试,以确保在AI任务中提供稳定的运行环境,减少崩溃或错误的可能性。
  4. 额外的功能:驱动程序可能包含一些额外的功能或工具,例如GPU性能监控、优化设置和调试工具,可帮助您更好地管理和优化AI任务的执行。

CUDA常用命令

  • 当使用CUDA进行并行计算时,可以使用一些基本的CUDA命令来管理和监控GPU设备。
  1. nvcc:用于编译CUDA源代码并生成可执行文件。
    • 它是CUDA的编译器驱动程序,可以接受CUDA源代码文件(.cu)作为输入,并生成可在GPU上执行的二进制文件。
  2. nvprof:用于性能分析和性能调优。
    • 它可以跟踪CUDA应用程序的运行时间和内存使用情况,并提供详细的性能指标和分析报告,帮助开发者找到性能瓶颈并优化CUDA代码。
  3. nvcc -arch:用于指定CUDA代码的目标架构。
    • 该命令选项后面可以跟随所需的GPU架构代号,例如sm_30(Kepler架构)或sm_61(Pascal架构),以确保CUDA代码能够在指定的GPU上正确编译和运行。
  4. nvidia-smi:用于监视和管理GPU设备。
    • 该命令提供了有关GPU的详细信息,如驱动程序版本、显卡型号、温度、功耗以及当前运行的进程列表等。此外,nvidia-smi还提供了一些选项,如设置GPU的功耗限制等。
  5. cuda-memcheck:用于内存错误检测。
    • 检测CUDA应用程序中的内存访问错误、泄漏以及其他内存相关问题。通过运行cuda-memcheck命令,可以检查CUDA应用程序的内存健康状况并提供详细的错误报告。
  6. cuda-gdb:用于CUDA应用程序的调试。
    • cuda-gdb是一个支持CUDA的调试器,可以通过命令行界面来调试CUDA代码。它提供了一些常见的调试功能,如断点、变量查看、单步执行等。

环境准备

NVIDIA驱动更新

  • 打开GeForce Experience软件,选择更新NVIDIA GeForce Game Ready驱动程序

在这里插入图片描述

CUDA安装

  • CUDA下载地址

  • CUDA(Compute Unified Device Architecture)是由NVIDIA开发的一种并行计算平台和编程模型。CUDA驱动程序是安装在计算机上的软件,用于支持和管理使用CUDA技术的NVIDIA GPU。

  • CUDA驱动程序是一种支持和管理使用CUDA技术的NVIDIA GPU的软件。它提供了GPU管理、并行计算支持、性能优化和兼容性支持等功能,使开发者能够利用GPU的并行计算能力进行高性能的计算任务。

CUDA驱动程序的主要功能:

  1. GPU管理:CUDA驱动程序负责识别和管理计算机中的NVIDIA GPU。它与操作系统交互,为每个GPU分配计算资源,并确保GPU与其他系统组件正确通信。

  2. 并行计算支持:CUDA驱动程序使开发者能够使用CUDA编程模型,通过并行计算在NVIDIA GPU上运行计算密集型任务。它提供了CUDA API和工具,使开发者能够编写并行代码,并在GPU上执行高性能计算。

  3. GPU性能优化:CUDA驱动程序提供了一些功能和工具,用于优化GPU的性能。例如,它可以进行GPU频率调整、内存访问优化和并行任务调度,以最大程度地发挥GPU的计算能力。

  4. 兼容性支持:CUDA驱动程序与CUDA工具包共同工作,为开发者提供了对最新CUDA功能和库的支持。它确保CUDA驱动程序与使用CUDA编写的应用程序和库的兼容性,并提供与操作系统和其他驱动程序的适配。
    在这里插入图片描述

在这里插入图片描述

  • 安装完CUDA后,电脑会自动重启,重启后验证CURD的安装
nvidia-smi
Mon Nov 13 19:56:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 546.01                 Driver Version: 546.01       CUDA Version: 12.3     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                     TCC/WDDM  | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA GeForce RTX 3060      WDDM  | 00000000:03:00.0  On |                  N/A |
|  0%   45C    P8              12W / 170W |    484MiB / 12288MiB |      4%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      7724    C+G   ...ience\NVIDIA GeForce Experience.exe    N/A      |
|    0   N/A  N/A      8376    C+G   ....Search_cw5n1h2txyewy\SearchApp.exe    N/A      |
|    0   N/A  N/A      8880    C+G   C:\Windows\explorer.exe                   N/A      |
|    0   N/A  N/A      9360    C+G   ...GeForce Experience\NVIDIA Share.exe    N/A      |
|    0   N/A  N/A     10120    C+G   ...2txyewy\StartMenuExperienceHost.exe    N/A      |
|    0   N/A  N/A     11156    C+G   ...CBS_cw5n1h2txyewy\TextInputHost.exe    N/A      |
|    0   N/A  N/A     14492    C+G   ...__8wekyb3d8bbwe\WindowsTerminal.exe    N/A      |
+---------------------------------------------------------------------------------------+
  • 结果分析:
    1. 驱动程序版本:当前使用的NVIDIA驱动程序版本为546.01。

    2. CUDA版本:当前使用的CUDA版本为12.3。

    3. GPU信息:

      • NVIDIA GeForce RTX 3060显卡,该显卡处于工作状态(On),温度为45摄氏度,性能状态为P8(较低性能模式),功率使用率为12瓦,总体功率限制为170瓦。
      • 显存使用率为484MB/12288MB(4%),表示显存的使用情况较低。GPU利用率为0%,表示GPU当前未执行计算任务。
    4. 进程信息:列出了当前正在使用GPU的进程列表。

      • 当前有以下进程正在使用GPU:NVIDIA GeForce Experience、Windows搜索、Windows资源管理器、NVIDIA Share、开始菜单体验宿主、文本输入宿主。

部署

  • ChatGLM3 一键部署包
  • 提取码:1234
  • 解压后文件内容如下:一个是model也就是模型文件,第二个ChatGLM3是模型的驱动程序
    在这里插入图片描述

补充内容

  • 内存不够,可以设置虚拟内存
    设置,系统,高级系统设置,性能设置,高级,更改虚拟内存,选中空间充足的固态硬盘设置为系统管理的大小,点设置,重启电脑
    在这里插入图片描述
  • 公告,回车即可
  • 如果您希望收到有用的入职邮件、新闻、优惠、促销信息以及偶尔的赠品,请在下方输入您的电子邮件地址。否则,请将此字段留空。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

体验

  • 整体运行占用显存8G左右,回答速度还可以(毕竟设备也就那样……还要求什么)
    在这里插入图片描述
  • 正常速度
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/140777.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

基于猫群算法优化概率神经网络PNN的分类预测 - 附代码

基于猫群算法优化概率神经网络PNN的分类预测 - 附代码 文章目录 基于猫群算法优化概率神经网络PNN的分类预测 - 附代码1.PNN网络概述2.变压器故障诊街系统相关背景2.1 模型建立 3.基于猫群优化的PNN网络5.测试结果6.参考文献7.Matlab代码 摘要:针对PNN神经网络的光滑…

Redhat7查看时区、修改时区

问题: 安装好redhat7之后,发现时间和物理机上面的网络时间不一致,于是查看本着修改时间的目的,却发现原来是时区的问题。 解决步骤: 查看时区状态信息 timedatectl修改时区到亚洲/上海 timedatectl set-timezone A…

Lasso回归和岭回归详解

当数据特征存在多重共线性,特征矩阵不满秩,或者用普通线性回归过拟合的状况时,我们需要用lasso回归或岭回归来构建模型。 左边是lasso回归,右边是岭回归。 Lasso使用的是系数 的L1范式(L1范式则是系数 的绝对值&#…

会展服务预约小程序的作用如何

不少场景都会有会展服务需求,比如婚宴、年会、展会等,往往需要租订场地,不同地域不同时间地点等,尤其大城市需求频次较高。 但在实际经营中,会员服务企业面临着一些难题。对多数企业来讲,线上是不可或缺的…

在 uniapp 中 一键转换单位 (px 转 rpx)

在 uniapp 中 一键转换单位 px 转 rpx Uni-app 官方转换位置利用【px2rpx】插件Ctrl S一键全部转换下载插件修改插件 Uni-app 官方转换位置 首先在App.vue中输入这个: uni.getSystemInfo({success(res) {console.log("屏幕宽度", res.screenWidth) //屏…

【Linux】你是否还在为安装虚拟机而烦恼?这篇博客将告诉你如何快速搭建Linux环境

👦个人主页:Weraphael ✍🏻作者简介:目前正在学习c和算法 ✈️专栏:Linux 🐋 希望大家多多支持,咱一起进步!😁 如果文章有啥瑕疵,希望大佬指点一二 如果文章对…

【2012年数据结构真题】

41题 (1) 最坏情况下比较的总次数 对于长度分别为 m,n 的两个有序表的合并过程,最坏情况下需要一直比较到两个表的表尾元素,比较次数为 mn-1 次。已知需要 5 次两两合并,故设总比较次数为 X-5, X 就是以 N…

5G网络切片,到底是什么?

网络切片,是5G引入的一个全新概念。 一看到切片,首先想到的,必然是把一个完整的东西切成薄片。于是,切面包或者切西瓜这样的画面,映入脑海。 添加图片注释,不超过 140 字(可选) 然而…

C++类中的const使用

目录 一,const成员函数 1,const成员函数的语法 2,相同限定符之间的调用 3,不同限定符对象与函数的调用 4,不同限定符函数之间的调用 一,const成员函数 1,const成员函数的语法 将const修饰…

分享一个个人博客神器 VanBlog

一、先看效果图 这是前台页面,我已经发布了一篇文章 这是后台页面 一句话,真的好用,各种功能一应俱全,废话不多说,开始吧。 二、 安装docker容器技术 如果你没有安装 docker 和 docker-compose,可以通…

深度学习AIR-PolSAR-Seg图像数据预处理

文章目录 深度学习sar图像数据预处理一.图片预处理操作1.log(1x)处理2.sqrt平方化处理 二.原网络训练效果展示原始数据训练效果展示: 三.对比实验1.采用原始数据2.采用取log(1x)后的数据3.采用取平方后归一化处理: 四.总结:五.思考 深度学习s…

eNSP启动路由器一直出#号、以为是安装配置winpcap的问题。。。。(以为是win10安装winpcap失败的问题。。。)

问题描述:eNSP启动一直出#号的一种参考方法_ensp一直#_Hong的博客-CSDN博客 原因是看了这篇博客,觉得ensp启动路由器的时候一直出现#号是因为winpcap安装的时候出现的问题。查看自己的winpcap安装成功之后的目录是: 然后因为那篇…

2783爱心公益网站的设计与实现JSP【程序源码+文档+调试运行】

一、摘要 本文将详细介绍一个基于Web的爱心公益网站的设计和实现。该网站包括前台用户模块和后台管理员模块,能够满足用户和管理员的不同需求。通过对用户和管理员的功能需求分析,本文将重点阐述数据库设计和界面设计的关键环节,同时介绍如何…

北邮22级信通院数电:Verilog-FPGA(9)第九周实验(1)实现带同步复位功能、采用上升沿触发的D触发器

北邮22信通一枚~ 跟随课程进度更新北邮信通院数字系统设计的笔记、代码和文章 持续关注作者 迎接数电实验学习~ 获取更多文章,请访问专栏: 北邮22级信通院数电实验_青山如墨雨如画的博客-CSDN博客 目录 一.顶层模块的书写 二.两种验证方法 2.1使用…

Azure 机器学习:在 Azure 机器学习中使用 Azure OpenAI 模型

目录 一、环境准备二、Azure 机器学习中的 OpenAI 模型是什么?三、在机器学习中访问 Azure OpenAI 模型连接到 Azure OpenAI部署 Azure OpenAI 模型 四、使用自己的训练数据微调 Azure OpenAI 模型使用工作室微调微调设置训练数据自定义微调参数部署微调的模型 使用…

leetCode 92.反转链表 II + 图解

92. 反转链表 II - 力扣&#xff08;LeetCode&#xff09; 给你单链表的头指针 head 和两个整数 left 和 right &#xff0c;其中 left < right 。请你反转从位置 left 到位置 right 的链表节点&#xff0c;返回 反转后的链表 206. 反转链表 - 力扣&#xff08;LeetCode&am…

python RSA 2048位 已知P,Q计算出E和D

这个软件居然不保存D&#xff0c;吓死宝宝了。刚把公钥【公钥指数&#xff08;E&#xff09;和模数&#xff08;N&#xff09;】发给客户&#xff0c;自己写代码找D【私钥指数&#xff08;E&#xff09;】居然没保存。 试了一个随机的生成的一对key pair&#xff0c;可以找回。…

GPU Microarch 学习笔记【2】Unified Memory

目录 1. M3 Dynamic Caching 2. Unified Memory 3. Unified Memory是如何处理page fault的 4. Unified Memory Page Fault的相关论文 M3 Dynamic Caching 最新的Apple M3 芯片最亮眼的可能是支持dynamic caching&#xff0c;如下图所示。 具体说来就是传统的GPU分配内存时&…

MySQL的SQL预编译及防SQL注入

文章目录 1 SQL语句的执行处理1.1 即时SQL1.2 预处理SQL1.2.1 预编译SQL的实现步骤1.2.2 预编译SQL的C使用举例1.2.3 MYSQL_BIND()函数中的参数类型&#xff1a; 2 SQL注入2.1 什么是SQL注入2.2 如何防止SQL注入 1 SQL语句的执行处理 SQL的执行可大致分为下面两种模式&#xf…

计算机毕业设计选题推荐-课程学习微信小程序/安卓APP-项目实战

✨作者主页&#xff1a;IT研究室✨ 个人简介&#xff1a;曾从事计算机专业培训教学&#xff0c;擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…