LLM：deepspeed zero-2时模型训练所占显存分析

LLM：deepspeed zero-2时模型训练所占显存分析

article2025/2/24 14:38:57/文章来源:https://blog.csdn.net/qq_43814415/article/details/143053664

前置：

fp16占2字节，fp32占4字节。换算就是1B的参数量，以fp16表示，占2G的内存。
模型参数为32B

全量微调：

模型参数：fp16的模型前向传播副本。fp32的模型的优化参数副本。这就是322+324=192G
梯度：fp16的模型梯度。322=64G
优化器状态：fp32的一阶动量和二阶矩。324+32*4=256G
总计：512G

lora：

上面是全量微调的，如果用lora，r为8，则
在这里插入图片描述

冻结的模型参数（FP16）：32*2=64 GB
LoRA 增量参数：fp16的参数：87.36 M×2 字节≈174.72 MB；fp32的参数（：87.36 M×4 字节≈349.44 MB
LoRA 参数的梯度（FP16）：87.36 M×2 字节≈174.72 MB
lora参数的优化器状态：87.36 M×4 字节 + 87.36 M×4 字节 ≈ 698.88 MB

总占用：65.4G
冻结的模型参数（FP16）：64 GB
LoRA 参数及其 FP32 副本：524.16 MB
梯度（LoRA 参数，FP16）：174.72 MB
优化器状态（LoRA 参数，FP32 一阶和二阶动量）：698.88 MB

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/894124.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

Jmeter简介

Jmeter简介

基础介绍 Jmeter录制脚本的原始是配置一个HTTP代理，然后浏览器通过这个代理访问测试页面从而完成脚本录制。一、下载安装 jmeter本身不需要安装，需要配置环境变量JDK，然后打开bin文件夹中的jmeter.vbs即可。建议jdk 1.7及以上版本。基本祖…

阅读更多...

CVE-2024-22120：Zabbix低权限SQL注入至RCE+权限绕过

CVE-2024-22120：Zabbix低权限SQL注入至RCE+权限绕过

所有利用代码： GitHub - W01fh4cker/CVE-2024-22120-RCE: Time Based SQL Injection in Zabbix Server Audit Log --> RCE 一、漏洞环境搭建 1.1 下载vmware镜像并设置直接懒人一键搭建： https://cdn.zabbix.com/zabbix/appliances/stable/6.0/6.0…

阅读更多...

得物App3D创新应用引关注，世界设计之都大会启幕

得物App3D创新应用引关注，世界设计之都大会启幕

近日，2024世界设计之都大会（WDCC）在上海盛大启幕。此次大会以“设计无界新质生长”为主题，汇聚了全球设计领域的精英与前沿成果，展现了设计作为新质生产力的巨大潜力。主场展览占据了整整3个楼面，总面积达…

阅读更多...

k8s-对命名空间资源配额

k8s-对命名空间资源配额

对k8s命名空间限制的方法有很多种，今天来演示一下很常用的一种用的k8s对象就是ResourceQuota 一：创建命名空间 kubectl create ns test #namespace命名空间可以简写成ns 二： 对命名空间进行限制创建resourcequota vim resourcequ…

阅读更多...

基于Javaweb的医院挂号预约管理系统

基于Javaweb的医院挂号预约管理系统

系统展示用户前台界面管理员后台界面医生后台界面系统背景在现代社会，随着医疗需求的不断增长，病患挂号成为医院面临的一大挑战。传统的挂号方式不仅耗时耗力，还容易引发混乱和不满。病患需要排队等候，挂号过程繁琐&#xff…

阅读更多...

Nginx(Linux)：启动停止Nginx

Nginx(Linux)：启动停止Nginx

目录 1、理解Nginx后台进程2、停止Nginx(方式一：使用信号源)2.1 获取master进程号2.1 设置信号源 3、停止Nginx(方式二：使用命令行) 1、理解Nginx后台进程 Nginx后台进程包含master和worker两类进程。 master进程：主要用来管理worker进程&am…

阅读更多...

Docker 教程四（Docker 镜像加速）

Docker 教程四（Docker 镜像加速）

Docker 镜像加速国内从 DockerHub 拉取镜像有时会遇到困难，此时可以配置镜像加速器。目前国内 Docker 镜像源出现了一些问题，基本不能用了，后期能用我再更新下。* Docker 官方和国内很多云服务商都提供了国内加速器服务，例如…

阅读更多...

C++ | Leetcode C++题解之第479题最大回文数乘积

C++ | Leetcode C++题解之第479题最大回文数乘积

题目： 题解： class Solution { public:int largestPalindrome(int n) {if (n 1) {return 9;}int upper pow(10, n) - 1;for (int left upper;; --left) { // 枚举回文数的左半部分long p left;for (int x left; x > 0; x / 10) {p p * 10 x %…

阅读更多...

Maxwell 底层原理详解

Maxwell 底层原理详解

Maxwell 是一个 MySQL 数据库的增量数据捕获（CDC, Change Data Capture）工具，它通过读取 MySQL 的 binlog（Binary Log）来捕获数据变化，并将这些变化实时地发送到如 Kafka、Kinesis、RabbitMQ 或其他输出端。…

阅读更多...

信息搜集 --前端js打点

信息搜集 --前端js打点

前端js打点什么是js渗透测试在Javascript中也存在变量和函数，当存在可控变量及函数调用即可参数漏洞JS开发的WEB应用和PHP，JAVA,NET等区别在于即没有源代码，也可以通过浏览器的查看源代码获取真实的点。获取URL，获取Js敏感信息&…

阅读更多...

永磁同步电机控制算法--非线性自抗扰NLADRC转速环控制器(1)

永磁同步电机控制算法--非线性自抗扰NLADRC转速环控制器(1)

一、原理介绍 ADRC由跟踪微分器(TD)、扩张状态观测器(ESO)和非线性状态误差反馈控制律(NLSEF)三部分组成。其中SMC-LSEF表达式为: e3v1-z1u0ζsign(s)-ks-ce3u(u0-z2)/b 二、仿真验证在MATLAB/simulink里面验证所提算法，采用和实验中一致的控制周期1e-4&#…

阅读更多...

Navigation2 算法流程

Navigation2 算法流程

转自 https://zhuanlan.zhihu.com/p/405670882 此文仅作学习笔记启动流程在仿真环境中启动导航包的示例程序，执行nav2_bringup/bringup/launch/tb3_simulation_launch.py文件。ROS2的launch文件支持采用python语言来编写以支持更加复杂的功能，本文件…

阅读更多...

性能测试工具JMeter

性能测试工具JMeter

本次使用的博客系统的url： http://8.137.19.140:9090/blog_edit.html 1. JMeter介绍环境要求：要求java，jdk版本大于8； Apache JMeter 是 Apache 组织基于 Java 开发的压⼒测试⼯具，⽤于对软件做性能测试&#xff1b…

阅读更多...

请问：ESModule 与 CommonJS 的异同点是什么？

请问：ESModule 与 CommonJS 的异同点是什么？

前言本篇文章不会介绍模块的详细用法，因为核心是重新认识和理解模块的本质内容是什么，直奔主题，下面先给出最后结论，接下来在逐个进行分析。 ECMAScript Module 和 CommonJS 的相同点： 都拥有自己的缓存机制&#…

阅读更多...

分布式链路追踪原理：

分布式链路追踪原理：

我的后端学习大纲 SpringCloud学习大纲假定三个微服务调用的链路如下图所示：Service 1 调用 Service 2，Service 2 调用 Service 3 和 Service 4 1、完整的调用链路： 1.1.原理分析： 1.那么一条链路追踪会在每个服务调用的时候加…

阅读更多...

在PC端使用微信浏览器的调试功能

在PC端使用微信浏览器的调试功能

首先，此功能只限自己开发网页，其次，这是为了帮助使用了微信的相关JS SDK功能，比如微信登录，在不方便使用电脑上的浏览器时使用的的。方法： 在网页中插入 <script src"https://unpkg.com/vconso…

阅读更多...

Java根据word 模板，生成自定义内容的word 文件

Java根据word 模板，生成自定义内容的word 文件

Java根据word 模板，生成自定义内容的word 文件背景1 使用技术2 实现方法依赖啊 3 问题4 背景主要是项目中需要定制化一个word，也就是有一部分是固定的，就是有一个底子，框架，里面的内容是需要填充的。然后填充的内容…

阅读更多...

WPF常见容器全方位介绍

WPF常见容器全方位介绍

Windows Presentation Foundation (WPF) 是微软的一种用于构建Windows桌面应用程序的UI框架。WPF的布局系统基于容器，帮助开发者以灵活、响应的方式组织用户界面 (UI) 元素。本篇文章将详细介绍WPF中几种常见的容器，包括Grid、StackPanel、WrapPanel、Do…

阅读更多...

基于51单片机的proteus数字时钟仿真设计

基于51单片机的proteus数字时钟仿真设计

注意：本项目是本人大学时期的课设项目，不得在未经本人允许下进行转载或商用数字钟设计项目背景与意义在信息化时代，时间管理成为了我们日常生活中不可或缺的一部分。数字钟作为一种常见的时间显示设备，因其精确、直观、易读等…

阅读更多...

如何捕捉行情爆发的前兆

如何捕捉行情爆发的前兆

在金融市场的激烈角逐中，每一次行情的爆发都是投资者获取丰厚回报的关键时刻。然而，如何识别并把握这些时刻，却是一门需要深厚金融专业知识和敏锐洞察力的艺术。今天，我们就来深入探讨行情爆发的初期信号，揭示那些能够…

阅读更多...

最新文章