mellanox HCA IB网卡固件更新

注意事项:

1.如果PSID以SGN开头,说明该产品是曙光的OEM产品,可以向HPC高速网络部获取固件。如果PSID以MT开头,说明该产品是Mellanox或nvidia的标准产品,可以通过官网下载固件。

2.通过官网获取固件,一定要保证和查询出来的PSID一致。

3.有一些型号,使用的mutilhost卡,刷新固件的时候,只需要在主节点上刷新固件即可。另外重启节点的时候,一定要把同刀节点都关闭了,然后再开启。否则,hca卡不会掉电,进而导致新版本的固件无法加载。

4.集群内部的固件版本,尽可能的保持一致。否则可能会会出现降速,带宽不稳定等情况。如果是不同类型的卡,尽可能的保证后面的号码一致。

5.如果遇到刷新固件,重启不生效的情况,就断电重启。

6.对于fdr、edr和hdr兼容的项目,保证同一类型的卡的固件版本一致,尽可能的使用最新的固件。

前提条件:

安装ib网卡的服务器,必须预先安装驱动,驱动里面应该包含MFT工具,如果没有mft工具需要到官网下载

NVIDIA Firmware Tools (MFT)

MFT包是一套固件管理工具,用于:生成标准的或自定义的NVIDIA固件镜像查询固件信息,刻录固件映像,通过查询,此包包含以下工具及功能

MFT Tools

工具

描述

mst

该工具提供如下功能:

*启动/停止寄存器访问驱动程序

*列出可用的mst设备

mlxburn

该工具提供如下功能:

生成用于刻录的标准或自定义NVIDIA固件映像(二进制或。mlx格式)

*将图像刻录到连接到NVIDIA HCA或开关设备的Flash/EEPROM

*查询NVIDIA网卡上加载的固件版本

*显示NVIDIA网络适配器的VPD(重要产品数据)

flint

该工具将固件二进制映像或扩展ROM映像刻录到NVIDIA网卡/网关/交换设备的Flash设备上。它包括对烧录固件映像和二进制映像文件的查询功能。

Debug utilities

一组调试工具(例如,itrace、fwtrace、mlxtrace、mlxdump、mstdump、mlxmcg、wqdump、mcra、mlxi2c、i2c、mget_temp和pckt_drop)

最新版本为4.28,支持以下设备的管理

Device Type

Product Name

HW Access Method

PCI

I2C

In-Band

HCA (InfiniBand)

NVIDIA Connect-IB

V

V

V

IB/ETH Network Adapter

NVIDIA ConnectX-3 Pro

V

V

V

NVIDIA ConnectX-4

V

V

V

NVIDIA ConnectX-5

V

V

V

NVIDIA ConnectX-5 Ex

V

V

V

NVIDIA ConnectX-6

V

V

V

NVIDIA ConnectX-6 Dx

V

V

V

NVIDIA ConnectX-7

V

V

V

NVIDIA BlueField-2

V

V

V

NVIDIA BlueField-3

V

V

V

Ethernet Adapter (NIC)

NVIDIA ConnectX-4 Lx

V

V

NVIDIA ConnectX-6 Dx

V

V

NVIDIA ConnectX-6 Lx

V

V

NVIDIA ConnectX-7

V

V

NVIDIA BlueField-2

V

V

Switch

NVIDIA Switch-IB®

V1

V

V

NVIDIA Switch-IB 2

V1

V

V

NVIDIA Spectrum™

V

V

NVIDIA Spectrum-2

V

V

NVIDIA Spectrum-3

V

V

NVIDIA Quantum

V

V

V

此包里每个工具更为详细的使用请看官网NVIDIA Firmware Tools (MFT) Documentation v4.28文档

User Manual - NVIDIA Docs

注意:此工具版本选择需要根据查询到的支持管理的设备清单来选择,并不是最新版的就合适,因此下载工具前应该清除交换机型号及网卡型号是哪一代产品

一、查看hca卡固件版本

说明:计算节点查看网卡的固件版本,方法有很多。最简单的方式是通过ibstat命令。也可以通过flint命令获取固件版本。

方法一:通过ibstat命令获取固件版本

方法二:通过flint命令获取固件版本。

第一步:启动mst服务。mst start

第二步:查看hca设备的固件版本。flint -d /dev/mst/mt4123_pciconf0 q

二、查看 hca卡 PSID

第一步:查看本机的hca设备的PSID。flint -d /dev/mst/mt4123_pciconf0 q

三、更新hca固件

第一步:准备好上面查到的PSID

第二步:登录https:Firmware for ConnectX®-6 VPI下载固件,根据PSID号下载对应的固件

第三步:启动mst服务:mst start;

第四步:烧写固件:flint -d /dev/mst/mt4123_pciconf0 -i ${hca固件地址} -y b;

第五步:重启节点:reboot

或使用

mlxfwreset -d /dev/mst/mt4119_pciconf0 -y r

mlxfwreset -d /dev/mst/mt4113_pciconf0 reset重置pci设备

第六步:验证固件版本。ibstat

更为详细的操作步骤请看官网NVIDIA Firmware Tools (MFT) Documentation v4.28文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/719719.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Qt项目学习-20240617

Qt项目学习 1.0 文件构建 1.1 预处理命令 C预处理命令是编译过程中的第一步,发生在编译器进行实际编译之前。预处理器(preprocessor)执行这些命令,它们不是C语言的一部分,但对源代码的编译过程至关重要。以下是一些常…

强大的视角:介绍 MinIO 企业对象存储可观察性

可观测性革命推动了计算、安全、基础设施和可审计性方面的巨大进步。企业可观测性提供对云原生系统的全面和精细的可见性,以更快地识别和解决问题。遥测数据(指标、日志、跟踪、运行状况检查)可以实时显示和关联,从而提供从最高管…

一季度直播6000场,同比增长60%,遥望科技透露重要信息

6月17日,经由深圳证券交易所许可,遥望科技(股票代码:002291)正式对《年报问询函》进行公开回复,就经营的多个维度做出解释和回应。 在回复中,遥望科技预测2024年毛利率为14.4%,相比…

web系统数据库敏感数据处理

一、前言 web系统数据库中保存的公民信息不允许明文存储,比如手机号,身份证号,收货地址等。 二、处理方式 数据库中密文存储,web通过注解的方式对数据加解密处理,下面是处理方法 1、编写接口 public interface E…

高考志愿填报,是选好专业,还是选好学校?过来人给你说说

分数限制下,选好专业还是选好学校? 到底是先选专业还是先选学校,是让考生及家长一直拿不准、辨不清的问题,是优先考虑学校还是专业,上了好学校,专业不喜欢就业前景不理想,怎么办?为…

【二】【QT开发应用】QMake和CMake介绍,GN,QT三个窗口类的区别,QMainWindow, QWidget,QDialog

QMake和CMake介绍 qmake:qt独有的代码构建工具, 是一种简洁的构建工具,主要用于生成 Qt 项目的跨平台编译配置文件,语法简单,适合小型和中型项目。 cmake:C通用的代码构建工具,绝大部分C开源项目都使用cm…

【Ubuntu服务器】Ubuntu服务器用户添加及samba用户配置

前言 本文章描述ubuutu服务器上用户添加方式、sudo权限配置及samba用户配置 用户添加 用户添加 该操作是需要 root账户 或者 有sudo权限的普通账户 操作。 例如,添加名为test的用户。 rootanon:~# adduser test Adding user test ... Adding new group test (1…

文心一言 VS 讯飞星火 VS chatgpt (284)-- 算法导论21.2 2题

二、对定理 21.1 的整体证明进行改造,得到使用链表表示和加权合并启发式策略下的 MAKE-SET 和 FIND-SET 的摊还时间上界为 O(1),以及 UNION 的摊还时间上界为 O(lgn)。如果要写代码,请用go语言。 文心一言: 在Go语言中实现使用链…

二进制数转字符串

题目链接 二进制数转字符串 题目描述 注意点 32位包括输出中的 “0.” 这两位题目保证输入用例的小数位数最多只有 6 位 解答思路 将小数转为二进制的思路是将小数乘2,如果整数部分为1,则说明第i位是1(第i位则乘了2的几次方)…

Linux UFW防火墙设置、案例教程及注意事项

背景 远程连接服务器时,发现SSH远程登录服务器失败,但是又可以Ping通,故服务器的是开启的。 sudo systemctl status sshd查看sshd的状态发现其是active,所以为什么一直SSH失败呢? 最后知道是有人启动了防火墙&#x…

今年的618,似乎很平淡!

电商平台取消预售制度的第一个大促,快递业表现如何? 今年的618大促与往年有些不同,自4月起,天猫、京东、快手等主流平台相继官宣取消预售,打出“现货开卖”标签,这意味着消费者不用再被“烧脑”的优惠计算…

AI绘画-Stable Diffusion三次元人物模型训练(炼丹)教程,你也可以定制你的三上youya老师!

大家好,我是设计师阿威 (Stable diffusion生成的三上youya老师) 用AI进行画出不同人物,我们需要训练自己Lora模型。除了训练二次元人物之外,也常常要训练三次元人物。 比如福利姬老师可以训练自己然后穿上各种美美的…

使用搜索引擎--下载压缩软件

百度搜索必应 或者 bing 必应搜索 解压软件下载 前面的都是广告,不能下载 找到www的这种官网 点到下载专区,下载对应系统的压缩包 还有7zip也可以 对应下载就行 下载wps

轻松办公新神器!自动粘贴文本,一键复制固定号码,让您的工作效率翻倍提升!

在信息爆炸的时代,无论是工作还是生活,我们都需要处理大量的文本和号码。但是,手动复制粘贴的过程往往繁琐而耗时,大大降低了我们的工作效率。有没有一种方法能够让我们轻松复制粘贴,从此告别繁琐操作呢?答…

用户上下文打通与Feign的调用

在前几篇中已经将微信,网关与鉴权微服务全部打通,这次我们进行用户上下文打通,与微服务之间的调用。 用户上下文打通: 首先先思考一下,当我们成功登录的时候,网关会获取到当前用户相关的信息,…

IEEE754、linear11、linear16浮点数应用原理

IEEE754、linear11、linear16浮点数应用原理 1 浮点数应用1.1 IEEE754 浮点数标准1.2 PMBUS浮点数格式 2 浮点数原理2.1 IEEE754 浮点数解析2.2 PMBUS浮点数解析 3 浮点数代码应用3.1 IEEE754 浮点数应用3.1.1 将浮点变量赋值,直接打印整型(32位&#xf…

Python兴趣编程百例:手把手带你开发一个图片转字符图的小工具

在数字世界的无尽探索中,我们时常被那些看似平凡的技术所启发,它们如同星辰般点缀着我们的创意天空。今天,我突发奇想,想要用Python开发一个将图片转化为字符画的小工具。这不仅是一次技术的实践,更是一场艺术与科技的…

STM32学习笔记(三)--EXTI外部中断详解

(1)配置步骤1.配置RCC 打开外设时钟2.配置GPIO 选择端口输入模式3.配置AFIO 选择要用的一路GPIO 连接至EXTI 4.配置EXTI 选择边沿触发方式 上升沿 下降沿 双边沿 选择触发响应方式 中断响应 事件响应 5.配置NVIC 选择一个合适的优先…

乡村养老服务管理系统的设计

管理员账户功能包括:系统首页,个人中心,医疗人员管理,乡村志愿者管理,文娱活动管理,活动报名管理,医疗保健管理 前台账户功能包括:系统首页,个人中心,文娱活…

运维技术栈总结

文章目录 Linux CommandBasecd/lschmod/chown/chgrpvi/vimscptarsudf Installrpmyumdeb/apt Filtertailgrepawkfindnetstatechotelnetwhereistouch/mkdirgzip/rar/tar Statistics Linux MonitorCPUtophtopsar Memoryfreevmstat I/Oiostatpidstatiotop Networknetstatiftoptcpdu…