目录
一、确认 OpenSM 服务端故障的步骤
1. 检查客户端与服务器的连通性
2. 检查客户端 InfiniBand 接口状态
3. 检查子网管理器状态
4. 检查拓扑信息
5. 检查路由表
二、客户端日志位置及查看方法
1. 系统日志
2. OpenSM 客户端日志
3. 内核日志
4. 性能计数器日志
三、常见故障场景及解决方法
1. 服务器端 OpenSM 未启动
2. 服务器端 OpenSM 配置错误
3. 网络链路故障
4. 客户端驱动或固件问题
四、总结
当 OpenSM 服务端故障时,客户端可能无法正常访问 InfiniBand 网络。以下是排障步骤,帮助确认是否是服务器故障,以及如何查看客户端日志。