LLM大语言模型（一）：ChatGLM3-6B试用

前言

LLM大语言模型工程化，在本地搭建一套开源的LLM，方便后续的Agent等特性的研究。

本机环境

CPU：AMD Ryzen 5 3600X 6-Core Processor

Mem：32GB

GPU：RTX 4060Ti 16G

ChatGLM3代码库下载

# 下载代码库
git clone https://github.com/THUDM/ChatGLM3.git

# 安装依赖
pip install -r requirements.txt

模型文件下载

建议从modelscope下载模型，这样就不用担心网络问题了。

模型链接如下：

chatglm3-6b · 模型库 (modelscope.cn)

git lfs install
git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

修改为从本地模型文件启动

import os
import streamlit as st
import torch
from transformers import AutoModel, AutoTokenizer

# 注意
# 注意
# 注意
# 注意
# 注意 也可以通过修改环境变量MODEL_PATH来实现
MODEL_PATH = os.environ.get('MODEL_PATH', '#注意-你的本地模型文件的文件夹-注意#')
TOKENIZER_PATH = os.environ.get("TOKENIZER_PATH", MODEL_PATH)
DEVICE = 'cuda' if torch.cuda.is_available() else 'cpu'

启动模型网页版对话demo

pip install -U streamlit

可以通过以下命令启动基于 Streamlit 的网页版 demo：

# 进入下载的代码库
cd ChatGLM3

# 用streamlit启动服务
streamlit run basic_demo/web_demo2.py

网页版 demo 会运行一个 Web Server，并输出地址。在浏览器中打开输出的地址即可使用。经测试，基于 Streamlit 的网页版 Demo 会更流畅。

streamlit启动效果：

聊天窗口效果：

GPU资源使用情况（网页对话非常流畅）

模型加载后GPU显存使用情况，约使用14G显存。

推理过程GPU使用情况， GPU使用率约88%

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/213401.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

LLM大语言模型（一）：ChatGLM3-6B试用

前言

本机环境

ChatGLM3代码库下载

模型文件下载

修改为从本地模型文件启动

启动模型网页版对话demo

GPU资源使用情况（网页对话非常流畅）

相关文章

分类预测 | Matlab实现FA-SVM萤火虫算法优化支持向量机的多变量输入数据分类预测

搭建若依框架完成医疗项目 ——业务流程及页面展示

【文末送书】人工智能背景下的C++编程方向

Nginx转发内网Flv视频流

echarts实现全国及各省市地图

【自然语言处理】【大模型】VeRA：可调参数比LoRA小10倍的低秩微调方法

计算机图形学：直线的扫描转换与圆的扫描转换

阿里微服务质量保障系列：性能监控

Swing程序设计（7）JPane面板，滑动面板

iceoryx(冰羚)-共享内存数据传输

Sharding-Jdbc（3）：Sharding-Jdbc分表

基础组件总结（以Element UI组件库为例）

【全网首发】信任的进化深度解析（全文超1500字+超20张配图）

SmartSoftHelp8，应用程序优化，稳定性优化，性能优化，并发承载优化工具

shell命令编写

Linux CentOS7 安装Docker

【Python】tensorflow学习的个人纪录（1）

java后端自学错误总结

Ubuntu22.04无需命令行将软件更新源切换到国内

frida - 3.hook类

LLM大语言模型（一）：ChatGLM3-6B试用

前言

本机环境

ChatGLM3代码库下载

模型文件下载

修改为从本地模型文件启动

启动模型网页版对话demo

GPU资源使用情况 （网页对话非常流畅）

相关文章

GPU资源使用情况（网页对话非常流畅）