本地离线模型搭建指南-本地运行显卡选择

搭建一个本地中文大语言模型(LLM)涉及多个关键步骤,从选择模型底座,到运行机器和框架,再到具体的架构实现和训练方式。以下是一个详细的指南,帮助你从零开始构建和运行一个中文大语言模型。

本地离线模型搭建指南将按照以下四个部分展开

  1. 中文大语言模型底座选择依据
  2. 本地运行显卡选择
  3. RAG架构实现
  4. LLaMA-Factory训练框架及工具

2本地运行显卡选择

在Awesome-Chinese-LLM仓库中,有许多中文大语言模型适合在本地运行。对于需要选择消费级别显卡的用户,可以参考以下信息:

2.1 适合消费级别显卡运行的模型参数大小

  • 大小为6B或7B,部分8B的模型,可以在消费级别的显卡上运行。显存建议8G起步,否则会出现模型加载不成功的问题。
  • 这些模型参数大小同样也可以在CPU上远行,但聊天文字生成速度只有同类型显卡的1/5-1/10。CPU配置最低建议16核心,32G内存。

2.2 推荐消费级别显卡

  • NVIDIA GeForce RTX 4060 至 4090 系列,显存12GB起步。
  • NVIDIA T4卡也可以运行本地模型。

2.3 性能比较

  • T4卡:服务器级别GPU计算图形显卡,本地运行模型推荐12G起步,大致对等评估,T4卡16G的性能和4070T16G显存性能一致。
  • RTX 4060-4090 系列:消费级显卡,性能强劲,显存从12GB到24GB不等,适合高性能计算和深度学习任务,本地运行模型推荐12G起步。
    在这里插入图片描述
    在这里插入图片描述

2.4 消费级显卡配置建议

  1. 优先选择单卡配置:单卡配置简单,易于管理。
  2. 双卡配置:消费级台式机最多支持两张显卡集火(NVIDIA SLI或NVLink)。

若需突破双卡限制:

  • 请查阅并考虑使用华硕 ESC8000-G4 服务器配置,该服务器支持多达8张显卡的集火,适用于更大规模的计算需求。

2.5 本地部署模型实践运行配置

底座包含模型模型参数大小机器配置显存大小是否可运行
ChatGLMChatGLM3-6B6BCPU 16核心 32G内存可以
ChatGLMChatGLM3-6B6B显卡4070Ti16G可以
ChatGLMChatGLM4-9B9B显卡4070Ti16G可以
LLaMAChinese-LlaMA27B显卡3060Ti8G可以
QwenQwen1.57B显卡4070Ti16G可以

注意:以上运行均值单独运行模型后是否可以运行以及显存是否够用,如果后期做RAG架构,ChatGLM4-9B模型在16G显存上不够,刚好差200M的显存,所以如果买新显卡,如果预算够,显存是第一优先考虑选项,之后才是显卡的计算能力。

2.6 相关模型链接

  • ChatGLM
  • ChatGLM2-6B
  • ChatGLM3-6B
  • Chinese-LLaMA-Alpaca
  • Chinese-LLaMA-Alpaca-2
  • Chinese-LlaMA2
  • Llama2-Chinese
  • Qwen/Qwen1.5

选择适合的显卡和配置,可以在本地高效地运行这些中文大语言模型。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/735788.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

WordPress视频主题Qinmei 2.0

WordPress视频主题Qinmei 2.0,简单漂亮的WP视频站源码 主题功能 可以根据豆瓣ID直接获取到其他详细信息,省去慢慢填写的痛苦;播放器支持直链,解析,m3u8格式,同时解析可匹配正则自动更改;新增动…

独立看门狗窗口开门狗

独立看门狗 接线图:按键用于阻塞喂狗。独立看门狗&窗口开门狗接线一样。 第一步,是开启时钟了,只有这个LSI时钟开启了独立看门狗才能运行,所以初始化独立看门狗之前,LSI必须得开启,但是这个开启LSI的…

【机器学习300问】128、简述什么Word2Vec?

一、一句话说明Word2Vec是什么? Word2Vec是一种常见的词嵌入技术。Word2Vec的目标是将每个词表示为一个向量,使得这些向量能够反映出词语之间的相似性和关联性。 word2vec算法通过预测中心词和上下文词的共现概率来学习词向量,能够捕捉词语之…

WordPress软件下载主题Inpandora

Inpandora(中文名为潘多拉)是一款基于软件下载站定制的WordPress主题,帮助站长使用WordPress快速搭建一个专业的WordPress软件博客。Inpandora这款WordPress主题可以说是因软件而生,从UI设计到后台设置功能,都充分体现…

高德地图轨迹回放/轨迹播放

前言 本篇文章主要介绍高德地图的轨迹回放或播放的实现过程,是基于vue2实现的功能,同时做一些改动也是能够适配vue3的。其中播放条是用的是element UI中的el-slider组件,包括使用到的图标也是element UI自带的。可以实现轨迹的播放、暂停、停…

导入别人的net文件报红问题sdk

1. 使用cmd命令 dotnet --info 查看自己使用的SDK版本 2.直接找到项目中的 global.json 文件,右键打开,直接修改版本为本机的SDK版本,就可以用了

【STM32】STM32通过I2C实现温湿度采集与显示

目录 一、I2C总线通信协议 1.I2C通信特征 2.I2C总线协议 3.软件I2C和硬件I2C 二、stm32通过I2C实现温湿度(AHT20)采集 1.stm32cube配置 RCC配置: SYS配置: I2C1配置: USART1配置: GPIO配置&#…

智慧校园综合管理系统的优点有哪些

在当今这个信息化飞速发展的时代,智慧校园综合管理系统正逐步成为教育领域的一股革新力量,它悄然改变着我们对传统校园管理的认知。这套系统如同一个无形的桥梁,将先进的信息技术与学校的日常运作紧密相连,展现出多维度的优势。 …

网络技术原理需要解决的5个问题

解决世界上任意两台设备时如何通讯的?? 第一个问题,pc1和pc3是怎么通讯的? 这俩属于同一个网段,那么同网段的是怎么通讯的? pc1和pc2属于不同的网段,第二个问题,不同网段的设备是…

国企:2024年6月中国移动相关招聘信息 二

在线营销服务中心-中国移动通信有限公司在线营销服务中心 硬件工程师 工作地点:河南省-郑州市 发布时间 :2024-06-18 截至时间: 2024-06-30 学历要求:本科及以上 招聘人数:1人 工作经验:3年 岗位描述 1.负责公司拾音器等音视频智能硬件产品全过程管理,包括但…

【Java】Java基础语法

一、注释详解 1.1 注释的语法: // 单行注释/*多行注释 *//**文档注释 */ 1.2 注释的特点: 注释不影响程序的执行,在Javac命令进行编译后会将注释去掉 1.3 注释的快捷键 二、字面量详解 2.1 字面量的概念: 计算机是用来处理…

干货 | 2024生成式AI产业落地路径研究报告(免费下载)

【1】关注本公众号,转发当前文章到微信朋友圈 【2】私信发送 2024生成式AI产业落地路径研究报告 【3】获取本方案PDF下载链接,直接下载即可。 如需下载本方案PPT/WORD原格式,诚挚邀请您微信扫描以下二维码加入方案驿站知识星球,…

HMI 的 UI 风格,超凡脱俗

HMI 的 UI 风格,超凡脱俗

什么是孪生素数猜想

什么是孪生素数猜想 素数p与素数p2有无穷多对 孪生素数的公式(详见百度百科:孪生素数公式) 利用素数的判定法则,可以得到以下的结论:“若自然数q与q2都不能被任何不大于的素数 整除,则q与q 2都是素数”…

Redis预备知识

一.预备知识 1.基本全局命令 set key value 将key的值设置成value get key 得到key的值 keys [pattern] 查看匹配pattern的所有key 比如h?llo匹配hallo,hbllo,hcllo……只要用一个符号将?代替即可 比如h*llo匹配hllo,heeeello…

Java预约家政5.0服务本地服务源码(APP+小程序+公众号+H5)

预约家政本地服务平台系统:一站式解决家居需求🏠💼 一、引言:开启便捷家居新时代 在快节奏的现代生活中,我们渴望拥有更多的时间和精力去享受生活,而不是被繁琐的家务所困扰。预约家政本地服务平台系统应…

远程医疗软件到底哪个好用?

随着科技进步的不断推进,远程医疗已经成为现代医疗体系的一个重要支柱。远程医疗软件,通过网络通信技术的运用,打破了地理限制,实现了医疗资源的有效整合与共享,为民众提供了前所未有的便捷高效的医疗服务体验。那么&a…

python tarfile解压失败怎么解决

问题原因 在使用tarfile模块解压一份Linux服务器上的打包文件时,出现了错误提示:IOError:[Errno 22] invalid mode (wb) or filename. 经过检查,发现是因为打包文件中有文件名存在“:”符号,而window下的…

上证所抓包实战

第 2 页jsonCallBack 回调函数Request Headers爬取股票列表下载时间戳Initiator在 Network 中抓到的包,有 Headers、Payload、Preview、Response、Initiator、Timing、Cookies 面板,从这些面板中获取有用的信息来写脚本。 上海证券交易所 https://www.sse.com.cn/assortment…

一款基于WordPress开发的高颜值的自适应主题Puock

主题特性 支持白天与暗黑模式 全局无刷新加载 支持博客与CMS布局 内置WP优化策略 一键全站变灰 网页压缩成一行 后台防恶意登录 内置出色的SEO功能 评论Ajax加载 文章点赞、打赏 支持Twemoji集成 支持QQ登录 丰富的广告位 丰富的小工具 自动百度链接提交 众多页面模板 支持评论…