昇腾Ascend之npu-smi工具在Atlas 200I DK A2的简单使用

一、参考资料

npu-smi工具

二、测试环境

设备型号:Atlas 200 DK(Model: 3000)
Operating System + Version: Ubuntu 22.04 LTS
CPU Type: 4核TAISHANV200M处理器
AI CPU number: 1
control CPU number: 3
RAM: 4GB 
miscroSD: 128GB
root@davinci-mini:~# npu-smi info -t cpu-num-cfg -i 0 -c 0
        Current AI CPU number          : 1
        Current control CPU number     : 3
        Current data CPU number        : 0

三、npu-smi工具的常用操作

信息查询(info)

查询所有芯片的AI CPU、control CPU和data CPU数量

npu-smi info --help

root@davinci-mini:~# npu-smi info --help
Usage: npu-smi info <watch|proc|-h|-m|-l|-t type> [Options...]

Commands:
       watch          Show all device's status in scrolling format
       proc           Show device's matrix process status in scrolling format
       -h, --help     Show this help text and exit
       -m             Show all device's mapping information
       -l             Show all device's topology information
       -t type        Show information for type
                      type: board, flash, memory, usages, sensors, temp, power, volt, mac-addr,
                            common, health, product, ecc, ip, sys-time, i2c_check, work-mode,
                            ecc-enable, p2p-enable, ssh-enable, license, customized-info,
                            device-share, nve-level, aicpu-config, pcie-err, mcu-monitor,
                            err-count, boot-area, vnpu-mode, info-vnpu, vnpu-svm, cpu-num-cfg,
                            first-power-on-date, proc-mem, phyid-remap, vnpu-cfg-recover, key-manage,
                            template-info, pkcs-enable, p2p-mem-cfg, pwm-mode, pwm-duty-ratio,
                            boot-select, topo.

Options:
       -i %d          Card ID
       -c %d          Chip ID
       -p %d          Chip Physical ID
参数描述
-ttype: board, flash, memory, usages, sensors, temp, power, volt, mac-addr,
common, health, product, ecc, ip, sys-time, i2c_check, work-mode,
ecc-enable, p2p-enable, ssh-enable, license, customized-info,
device-share, nve-level, aicpu-config, pcie-err, mcu-monitor,
err-count, boot-area, vnpu-mode, info-vnpu, vnpu-svm, cpu-num-cfg,
first-power-on-date, proc-mem, phyid-remap, vnpu-cfg-recover, key-manage,
template-info, pkcs-enable, p2p-mem-cfg, pwm-mode, pwm-duty-ratio,
boot-select, topo.
-iNPU设备id。通过 npu-smi info -l 命令查出的NPU ID即为设备id。

查询基本信息

# 每秒刷新一次
watch -n 1 npu-smi info
Every 1.0s: npu-smi info                                               davinci-mini: Wed Apr 10 09:50:12 2024

+--------------------------------------------------------------------------------------------------------+
| npu-smi 23.0.rc3                                 Version: 23.0.rc3                                     |
+-------------------------------+-----------------+------------------------------------------------------+
| NPU     Name                  | Health          | Power(W)     Temp(C)           Hugepages-Usage(page) |
| Chip    Device                | Bus-Id          | AICore(%)    Memory-Usage(MB)                        |
+===============================+=================+======================================================+
| 0       310B4                 | OK              | 8.2          68                15    / 15            |
| 0       0                     | NA              | 0            3076 / 3513                             |
+===============================+=================+======================================================+
字段描述说明
npu-sminpu-smi 工具版本
Version驱动版本
NPUNPU 设备id
Name芯片名称,目前支持310B1和310B4两种芯片名称。
310B1:表示芯片算力规格为20T。
310B4:表示芯片算力规格为8T。
Health芯片的健康状态,有如下五种状态:
OK:正常
Warning:一般告警
Alarm:重要告警
Critical:紧急告警
UNKNOWN:该设备不存在或未启动
Power(W)芯片功率
Temp©芯片温度(单位°C)
Hugepages-Usage(page)大页占比(单位page),每一个page的大小是2048KB。
Chip芯片id
Device芯片编号
Bus-IdBUS id
AICore(%)AICore占用率
Memory-Usage(MB)内存占比

查询所有芯片监测数据

# 查询所有设备上所有芯片的监测数据
npu-smi info watch  

# 查询指定设备上所有芯片的监测数据
npu-smi info watch -i <npu_id> 
root@davinci-mini:~# npu-smi info watch
NpuID(Idx)  ChipId(Idx) Pwr(W)      Temp(C)     AI Core(%)  AI Cpu(%)   Ctrl Cpu(%) Memory(%)   Memory BW(%)
0           0           8.2         69          0           0           25          87          1
0           0           8.2         69          0           0           18          87          1
0           0           8.2         68          0           0           23          87          2
0           0           8.2         68          0           0           17          87          1
0           0           8.2         68          0           0           22          87          3
0           0           8.2         69          0           0           22          87          1
0           0           8.2         68          0           0           17          87          2

参数解释

字段描述说明
NpuID(Idx)设备id
ChipId(Idx)芯片id
Pwr(W)功率(单位W)
Temp©温度(单位°C)
AI Core(%)AI Core占用率
AI Cpu(%)AI Cpu占用率
Ctrl Cpu(%)Ctrl Cpu占用率
Memory(%)内存占用率
Memory BW(%)内存带宽占用率

查询所有NPU设备

npu-smi info -l
root@davinci-mini:~# npu-smi info -l
        Card Count                     : 1

        NPU ID                         : 0
        Product Name                   : IT22MMDB
        Serial Number                  : 102357609442
        Chip Count                     : 1
字段说明描述
Card CountNPU卡个数
NPU IDNPU设备id
Product Name产品名称
Serial Number产品序列号
Chip Count芯片个数

查询所有芯片统计信息

npu-smi info -t usages -i <npu_id>
root@davinci-mini:~# npu-smi info -t usages -i 0
        NPU ID                         : 0
        Chip Count                     : 1

        Chip ID                        : 0
        Memory Capacity(MB)            : 3513
        Memory Usage Rate(%)           : 87
        Hugepages Total(page)          : 15
        Hugepages Usage Rate(%)        : 100
        Aicore Usage Rate(%)           : 0
        Aicpu Usage Rate(%)            : 0
        Ctrlcpu Usage Rate(%)          : 16
        Memory Bandwidth Usage Rate(%) : 2
字段描述说明
NPU ID设备id
Chip ID芯片id
Chip Count芯片个数
Memory Capacity(MB)内存容量(单位MB)
Memory Usage Rate(%)内存占用率
Hugepages Total(page)大页容量(单位page),每一个page的大小是2048KB
Hugepages Usage Rate(%)大页占用率
Aicore Usage Rate(%)Aicore占用率
Aicpu Usage Rate(%)Aicpu占用率
Ctrlcpu Usage Rate(%)Ctrlcpu占用率
Memory Bandwidth Usage Rate(%)内存带宽占用率

查询指定芯片信息

npu-smi info -t board -i <npu_id> -c <chip_id>
root@davinci-mini:~# npu-smi info -t board -i 0 -c 0
        NPU ID                         : 0
        Chip ID                        : 0
        Chip Type                      : Ascend
        Chip Name                      : 310B4
        Chip Version                   : V1
        Board ID                       : 0xc79c
        Module Board ID                : 0x44
        PCB ID                         : NA
        BOM ID                         : 1
        Die ID                         : V1, 77420E14 02010A20 A0771917 4B69090A 65E00000

参数解释

字段解释说明
NPU IDNPU 设备id
Chip ID芯片id
Chip Type芯片类型
Chip Name芯片名称,目前支持310B1和310B4两种芯片名称。
310B1:表示芯片算力规格为20T。
310B4:表示芯片算力规格为8T。
Chip Version芯片版本
Board ID整机类型
PCB IDPCB版本编号
BOM IDBOM版本编号
Die ID芯片Die编号

查询详细信息

npu-smi info -t board -i <npu_id>
root@davinci-mini:~# npu-smi info -t board -i 0
        NPU ID                         : 0
        Product Name                   : IT22MMDB
        Model                          : Model=
        Manufacturer                   : Huawei
        Serial Number                  : 102357609442
        Software Version               : 23.0.rc3
        Firmware Version               : 7.0.0.5.242
        Board ID                       : 0x45
        PCB ID                         : B
        BOM ID                         : 1
        Chip Count                     : 1
        Faulty Chip Count              : 0

查询所有芯片常用信息

npu-smi info -t common -i <npu_id>
root@davinci-mini:~# npu-smi info -t common -i 0
        NPU ID                         : 0
        Chip Count                     : 1

        Chip ID                        : 0
        Memory Usage Rate(%)           : 87
        Aicore Usage Rate(%)           : 0
        Temperature(C)                 : 68
        Rated Power Dissipation(W)     : 8.2

查询产品类型

npu-smi info -t product -i <npu_id>
root@davinci-mini:~# npu-smi info -t product -i 0
        NPU ID                         : 0
        Chip Count                     : 1

        Chip ID                        : 0
        Product Type                   : Atlas 200I A2

查询所有芯片的功率

npu-smi info -t power -i <npu_id>
root@davinci-mini:~# npu-smi info -t power -i 0
        NPU ID                         : 0
        Chip Count                     : 1

        Chip ID                        : 0
        NPU Real-time Power(W)         : 8.2

查询指定芯片的算力档位

npu-smi info -t nve-level -i <npu_id> -c <chip_id>
root@davinci-mini:~# npu-smi info -t nve-level -i 0 -c 0
        nve level                      : 8T_1.0GHz

1.0GHz和1.6GHz表示TaiShan核CPU主频,Atlas 200I DK A2 开发者套件和8T的Atlas 200I A2 加速模块默认算力档位为8T_1.0GHz。

查询AI CPU数量

npu-smi info -t cpu-num-cfg -i <npu_id> -c <chip_id>
root@davinci-mini:~# npu-smi info -t cpu-num-cfg -i 0 -c 0
        Current AI CPU number          : 1
        Current control CPU number     : 3
        Current data CPU number        : 0

配置功能(set)

设置指定芯片的算力档位

npu-smi set -t nve-level -i <npu_id> -c <chip_id> -d <value>
字段描述说明
value8T的Atlas 200I A2 加速模块分为两档:
0:8T_1.0GHz
1:4T_1.0GHz

设置AI CPU数量

npu-smi set -t aicpu-config -i <npu_id> -c <chip_id> -d <value>
字段描述说明
value芯片的AI CPU数量。可设置为0、2、4。
root@davinci-mini:~# npu-smi set -t aicpu-config -i 0 -c 0 -d 2
        Status                         : OK
        Message                        : The aicpu-config of the chip is set successfully. Please reboot system.

使用说明

  • 若当前环境模型中无AICPU算子,且运行业务时通过查询芯片统计信息查询当前AICPU占用率持续为0,则可以配置为0。
  • 设置CPU数量后,需要复位(重启)系统生效。

CPU压力测试

# 4个CPU压力测试,实际仅使用3个CPU
# AI CPU number: 1
# control CPU number: 3

stress --cpu 4

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/531060.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

OpenSSH 安全漏洞(CVE-2023-51385) 升级v9.7

漏洞编号&#xff1a;OpenSSH 安全漏洞(CVE-2023-51385) openssh9.7文件获取 https://f.ws59.cn/f/dtv9atef3io 复制链接到浏览器打开 处理方式 ##注释掉的根据实际情况处理 #查询原openssh9.4p1是否有安装openssh-askpass&#xff0c;若有需先删除 rpm -qa | grep openss…

Chemical Science 山东师范大学唐波课题组关于核靶向探针的综述

文献来源&#xff1a;Fluorescent probes for organelle-targeted bioactive species imaging - Chemical Science (RSC Publishing) 一、 基于RONSS的探针设计&#xff1a; 1.基于ROS的探针设计&#xff1a; ROS&#xff08;包括, , , , , &#xff09;可以扩散到细胞核内&am…

Redis 常用的基本命令

&#x1f525;博客主页&#xff1a;fly in the sky - CSDN博客 &#x1f680;欢迎各位&#xff1a;点赞&#x1f44d;收藏⭐️留言✍️&#x1f680; &#x1f386;慢品人间烟火色,闲观万事岁月长&#x1f386; &#x1f4d6;希望我写的博客对你有所帮助,如有不足,请指正&#…

MUNK电源维修GmbH高频电源E230 G60/45 WRG-TFMYCT24

德国MUNK电源维修主要系列&#xff1a;ΡKA2&#xff0c;DCAC100&#xff0c;AS100&#xff0c;HS100&#xff0c;ESA2000&#xff0c; HSG2000&#xff0c;E230 G60/45&#xff1b;E230 G100&#xff0c;D400 G100全系列型号。 常见维修型号包括&#xff1a;D400 G100/75WRG-…

wsl下Linux使用chatglm.cpp记录

前言 Linux之前用的少&#xff0c;多数还是在Windows下操作&#xff0c;导致对Linux很陌生&#xff0c;而且思维定势的&#xff0c;一有什么操作&#xff0c;还是习惯性在Windows下操作。 在chatglm.cpp操作上也是如此&#xff0c;但是代码可不管你这些&#xff0c;该报错就报…

【面试题】微博、百度等大厂的排行榜如何实现?

背景 现如今每个互联网平台都会提供一个排行版的功能&#xff0c;供人们预览最新最有热度的一些消息&#xff0c;比如百度&#xff1a; 再比如微博&#xff1a; 我们要知道&#xff0c;这些互联网平台每天产生的数据是非常大&#xff0c;如果我们使用MySQL的话&#xff0c;db实…

Git 解决分支冲突

一、前言 一直习惯于 add commit push 的三步走&#xff0c;偶然间看到了一个评论说在 push 之前还有一个 pull&#xff0c;小小的疑问就埋在了我的心里。于是我就先了解了 pull 的工作原理&#xff0c;就是先拉取代码&#xff08;fetch&#xff09;再合并分支&#xff08;mer…

【Qt 学习笔记】QWidget的enable属性 | API的介绍

博客主页&#xff1a;Duck Bro 博客主页系列专栏&#xff1a;Qt 专栏关注博主&#xff0c;后期持续更新系列文章如果有错误感谢请大家批评指出&#xff0c;及时修改感谢大家点赞&#x1f44d;收藏⭐评论✍ QWidget的enable属性 文章编号&#xff1a;Qt 学习笔记 / 15 文章目录…

【IC前端虚拟项目】验证环境方案思路和文档组织

【IC前端虚拟项目】数据搬运指令处理模块前端实现虚拟项目说明-CSDN博客 对于mvu的验证环境,从功能角度就可以分析出需要搭建哪些部分,再看一下mvu的周围环境哈: 很明显验证环境必然要包括几个部分: 1.模拟idu发送指令; 2.模拟ram/ddr读写数据; 3.rm模拟mvu的行为; …

小白学Java成长日记特别篇

晚上好&#xff0c;各位小伙伴。今天给大家带来的是Java的输出补充篇&#xff0c;前两篇说了输出和输入的大概&#xff0c;但我没有详细讲它俩&#xff0c;因此这篇文章来详细的聊一聊它俩。那么废话不多说&#xff0c;我们赶紧进入正题。 首先讲一讲这个Java的输出吧。 输出格…

IP协议中的四大支柱:DHCP、NAT、ICMP和IGMP的功能剖析

DHCP动态获取 IP 地址 我们的电脑通常都是通过 DHCP 动态获取 IP 地址&#xff0c;大大省去了配 IP 信息繁琐的过程。 客户端首先发起 DHCP 发现报文&#xff08;DHCP DISCOVER&#xff09; 的 IP 数据报&#xff0c;由于客户端没有 IP 地址&#xff0c;也不知道 DHCP 服务器的…

【C++第二阶段】文件操作

以下内容仅为当前认识&#xff0c;可能有不足之处&#xff0c;欢迎讨论&#xff01; 文章目录 文件操作文件写入流程简单的demo写操作 文件读流程二进制写文件二进制读文件 文件操作 文件写入流程 写文件包括以下几个步骤 1.包含头文件 2.创建流对象 3.打开文件&#xff0…

重装系统前备份笔记

一、点查看自定义快捷键可以定义一些快速启动方式 然后用不习惯的快捷键也能在这里改 二、android studio 快捷键导出备份 导入方法&#xff1a; android studio &#xff0d;>file->import setting ->选择jar包即可 导出studio的设置方法&#xff1a; android …

【行业资讯】AI算力的需求推动光模块行业快速迭代

近期&#xff0c;由OpenAI发布的人工智能文生视频大模型Sora再次引起了不小的轰动&#xff0c;继ChatGPT之后&#xff0c;Sora的推出让AIGC&#xff08;生成式人工智能&#xff09;再度成为行业焦点&#xff0c;AI大模型的快速迭代升级对网络架构提出了更高要求&#xff0c;推动…

SpringBoot学习笔记三-原理分析

SpringBoot学习笔记三-原理分析 SpringBoot自动装配1.1 案例1.2 通过注解方式管理Bean1.3 小结1.4 Enable注解1.5 Import注解1.5.1 ImportSelector实现类1.5.2 导入ImportBeanDefinitionRegistrar 1.5 EnableAutoConfiguration1.6 案例 SpringBoot自动装配 当再pom.xml中导入对…

ceph集群搭建

一、前言 本次搭建ceph集群&#xff0c;使用centos7版本的系统&#xff0c;最高支持ceph版本为15.2.13&#xff0c;如需更高的版本需要使用centos8版本以上的系统&#xff0c;使用cephadm进行搭建&#xff0c;Cephadm 是一个用于部署、管理和监控 Ceph 集群的工具&#xff0c;它…

Towards IP Geolocation Using Delay and TopologyMeasurements(TBG)(2006年)

下载地址:Towards IP geolocation using delay and topology measurements | Proceedings of the 6th ACM SIGCOMM conference on Internet measurement 被引次数:492 Katz-Bassett E, John J P, Krishnamurthy A, et al. Towards IP geolocation using delay and topology …

【鸿蒙开发】系统组件Column

Column组件 Column沿垂直方向布局的容器。 接口&#xff1a; Column(value?: {space?: string | number}) 参数&#xff1a; 参数名 参数类型 必填 参数描述 space string | number 否 纵向布局元素垂直方向间距。 从API version 9开始&#xff0c;space为负数或者…

洪水预警:如何通过数据可视化提前应对灾害

数据可视化在应对洪涝灾害问题中发挥着重要作用。洪涝灾害是一种常见而严重的自然灾害&#xff0c;给人们的生命、财产和生活带来了巨大的威胁和损失。而数据可视化技术通过将海量的数据转化为直观、易懂的图表、图像或地图等形式&#xff0c;帮助人们更好地理解洪涝灾害的发生…

PostgreSQL入门到实战-第十三弹

PostgreSQL入门到实战 PostgreSQL数据过滤(六)官网地址PostgreSQL概述PostgreSQL中IN命令理论PostgreSQL中IN命令实战更新计划 PostgreSQL数据过滤(六) 使用PostgreSQL IN运算符来检查值是否与列表中的任何值匹配 官网地址 声明: 由于操作系统, 版本更新等原因, 文章所列内容…