ORACLE ODA一体机存储节点电源故障的分析处理

近期,某用户的ORACLE ODA一体机在例行机房巡检时出现亮黄灯告警;用户反馈次问题后我们立刻通过远程方式,登陆ODA的控制台进行查看;

对于ODA一体机(2个计算节点+1个存储节点),计算节点可以通过ilom管理界面登陆进行详细的硬件信息查看和管理,当然通过命令行也可以。

对于存储节点,是没有图形界面可以看,可以通过ODA管理台(7093/mgmt/index.html)或者命令查看;

本次问题查看为存储节点的1个电源故障,由于双电源配置,系统仍然可以正常工作;并且电源的更好工作是可以在线进行的。

如下为排查分析过程:

1、故障灯及系统中查看故障原因

[root@TEST2 ~]# odaadmcli show enclosure

        NAME        SUBSYSTEM         STATUS      METRIC   

        _FAN0       Cooling           OK          4910 rpm 
        _FAN1       Cooling           OK          4540 rpm 
        _FAN2       Cooling           OK          4920 rpm 
        _FAN3       Cooling           OK          4530 rpm 
        _IOM0       Encl_Electronics  OK          -        
        _IOM1       Encl_Electronics  OK          -        
        _PSU0       Power_Supply      Critical    -       ===>>>显示故障    
        _PSU1       Power_Supply      OK          -        
        _TEMP0      Amb_Temp          OK          23 C     
        _TEMP1      Midplane_Temp     OK          22 C     
        _TEMP2      PCM0_Inlet_Temp   OK          30 C     
        _TEMP3      PCM0_Hotspot_Temp OK          24 C     
        _TEMP4      PCM1_Inlet_Temp   OK          42 C     
        _TEMP5      PCM1_Hotspot_Temp OK          39 C     
        _TEMP6      IOM0_Temp         OK          22 C     
        _TEMP7      IOM1_Temp         OK          22 C 

4 、更换电源(可以先尝试插拔电源线,电源线松动是可能的,插拔后也可能就恢复了)

更换的步骤MOS文档(How to confirm power supply status about storage shelf on ODA X7-2 (Doc ID 2419846.1),How To Replace an ODA (Oracle Database Appliance) X6-2HA, X7-2HA, X8-2HA, X9-2HA DE3-24C Power Supply/Cooling Unit [VCAP] (Doc ID 2960220.1))有视频和步骤,没有特殊的难度,参考如下:

WHAT ACTION DOES THE FIELD ENGINEER/ADMINISTRATOR NEED TO TAKE?:
1. Locate the PSU by amber LED

The following LEDs are lit when a power supply fault is detected:

* Front and rear Service Required LEDs
* Rear PS Failure LED on the bezel of the server
* Failure LED on the faulty power supply

2. Verify the PSU part number in the System Handbook and re-confirm.

3. Removing the PSU as follows.
3.1 Clear access to the PSU of any cables harnesses or assemblies.
3.2 Ensure the PSU  On/Off switch is in the 'Off' Position.
3.3 Disconnect the power cord tie strap from the power cord, and unplug the power cord from the PSU.
3.4 Remove installed PSU by, Grasping the PSU handle, push the release button and slide out PSU.

4. Installing the Power Supply as follows or use the "online" Help Guide.

4.1 On the replacement PSU verify that the Release button is open .
4.2 Align PSU with empty bay in chassis and slide in .
4.3 Push the lever fully closed until you hear or feel a click.
4.4 Connect AC power cord to new PSU. Use the power cord retaining clips.
4.4 If required , place cable harness or assemblies back into normal position.
4.5 Turn the On/OFF switch to the On position .

5. Verify the replacement by checking for Green LED

IMPORTANT NOTE :
PSUs have a 3 minute Service time limit . When you remove a PSU the
fans on the remaining PSU go to 100 % duty cycle . Testing has shown that
HDD temperatures can exceed their operating temperature when a PSU has
been removed for 3 minutes.

5、检查最终状态(注意次命令的输出,ODA 的2个计算节点的的输出是不一致的,简单说是检测到恢复正常是有时间差的,如节点1显示OK,节点2可能过几分钟才显示OK)

[root@TEST2 ~]# odaadmcli show enclosure

        NAME        SUBSYSTEM         STATUS      METRIC   

        _FAN0       Cooling           OK          4910 rpm 
        _FAN1       Cooling           OK          4540 rpm 
        _FAN2       Cooling           OK          4910 rpm 
        _FAN3       Cooling           OK          4540 rpm 
        _IOM0       Encl_Electronics  OK          -        
        _IOM1       Encl_Electronics  OK          -        
        _PSU0       Power_Supply      OK          -        
        _PSU1       Power_Supply      OK          -        
        _TEMP0      Amb_Temp          OK          23 C     
        _TEMP1      Midplane_Temp     OK          22 C     
        _TEMP2      PCM0_Inlet_Temp   OK          29 C     
        _TEMP3      PCM0_Hotspot_Temp OK          24 C     
        _TEMP4      PCM1_Inlet_Temp   OK          41 C     
        _TEMP5      PCM1_Hotspot_Temp OK          39 C     
        _TEMP6      IOM0_Temp         OK          22 C     
        _TEMP7      IOM1_Temp         OK          28 C  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/624940.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

USB3.0接口——(3)协议层(包格式)

7.协议层 7.1.超高速传输事务 超高速事务(SuperSpeed transactions)由主机对设备端点请求或发送数据开始,并在端点发送数据或确认收到数据时完成。超高速总线上的数据传输(transfer)是主机请求设备应用程序生成的数据…

在做题中学习(58):和为K的子数组

560. 和为 K 的子数组 - 力扣(LeetCode) 因为是判断子数组的和 要返回 k 的次数,所以 解法:前缀和 哈希表 提出一个概念:以下标i为结尾的所有子数组 那要找出所有和 k的子数组 就相当于:找出所有值为…

高端智能终端RK3399主板在配送机器人项目的应用,支持免费定制

基于高端智能终端主板IoT-3399E推出了系列配送机器人,面向各类线下门店的配送服务。配送机器人可实现智能识别、精准配送、自动避障、自主调度系统、语音播报、信息互动等功能,大幅提升服务效率,为消费者带来更加便捷、智能的服务体验。 核心…

Zab之光:照亮分布式系统数据一致性迷宫的智慧火把

关注微信公众号 “程序员小胖” 每日技术干货,第一时间送达! 引言 在构建大型分布式系统时,数据一致性是我们必须面对的挑战之一。随着业务的增长和系统规模的扩大,如何保证在多个节点间复制的数据保持一致,成为了一…

keepalived双机热备超详细入门介绍

keepalived 一、keepalived入门介绍 1.keepalived简介 2.keepalived服务的三个重要功能 2.1.管理LVS负载均衡软件 2.2.实现对LVS集群节点健康检查功能 2.3.作为系统网络服务的高可用功能 3.keepalived高可用故障切换转移原理 4.keepalived安装及主配置文件介绍 …

图搜索算法-最短路径算法-贝尔曼-福特算法

相关文章: 数据结构–图的概念 图搜索算法 - 深度优先搜索法(DFS) 图搜索算法 - 广度优先搜索法(BFS) 图搜索算法 - 拓扑排序 图搜索算法-最短路径算法-戴克斯特拉算法 贝尔曼-福特算法(Bellman-Ford&#…

OpenAI春季发布会, GPT-4o引爆科技圈 |千字文全面解读

今天,OpenAI再一次引爆了科技圈。这次的核心亮点无疑是他们的全新模型:GPT-4o,以及基于此模型构建的全新ChatGPT版本。 GPT-4o是什么? OpenAI 最新推出的 GPT-4o,“o”代表“Omni”,这一拉丁词根在英语中常…

CentOS报错: Fontconfig head is null, check your fonts or fonts configuration

错误 解决方案 这个报错的原因时java读取本地字体时发现字体损坏或者缺失,只需要补充一下字体就可以了,解决方法安装FontConfig组件即可: sudo yum install fontconfig

弥合孤岛:克服构建 DevOps 文化的挑战

持续变革正在发生软件开发行业。DevOps 因其对自动化、协作和持续改进的关注而成为优化软件交付并弥合开发和运营团队之间鸿沟的重要方法。然而,过渡到真正的 DevOps 文化并非没有挑战。本文探讨了您在追求 DevOps 时可能面临的障碍并提供了解决方案。 01 了解 Dev…

JINGWHALE 数字认证体系 · 进阶知识库

JINGWHALE 数字认证体系 是 JINGWHALE 数字科学艺术创新中心 的数字认证服务。 ◢◤ 宗旨 致力于数字化知行合一的知识赋能! ◥ 数字化人才培养 培养数字化思维,传播数字化知识,赋能各行业数字化。 ◥ 职业人才发展 无缝衔接学校高等…

Databend 开源周报第 144 期

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。 Whats On In Databend 探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。 了解 Databend …

有一个21年的前端vue项目,死活安不上依赖

在公司开发的时候遇到的一个很玄幻的问题,这个项目是21年开发的,现在我是24年中途二开增加新功能 这个项目经过多人之手,现在已经出现了问题------项目依赖安不上,我能启动完全是因为在23年的时候写这个项目的时候将依赖费九牛二虎之力下载好后打成了压缩包发给另外一个安不上依…

分析 vs2019 c++ 中的 decltype 与 declval

(1) decltype 可以让推断其参数的类型。按住 ctrl 点击 decltype ,会发现无法查阅 其定义 : (2) 但 STL 库里咱们可以查阅函数 declval 的 定义,很短,摘抄如下: templat…

PostgreSQL源码安装

文章目录 一、先决条件检查二、源码安装1、获取源代码2、编译安装1.运行 configure2.运行make 3、PostgreSQL的配置4、安装contrib目录下的工具 三、初始化数据库1、创建数据库管理员2、创建数据库实例3、启动和停止数据库4、设置数据库密码 四、PostgreSQL的简单配置1、pg_hba…

Java项目实现报文数据校验注解方式(必输项、值大小)

普通项目 导入校验依赖 <dependency><groupId>org.hibernate</groupId><artifactId>hibernate-validator</artifactId><version>4.1.0.Final</version></dependency><dependency><groupId>javax.validation</…

系统定期执行命令的方法

系统定期执行命令的方法 一、进入超级用户下 执行命令&#xff1a;sudo su 二、添加要执行的命令 例子&#xff1a;每天0点执行一次myapp.sh命令 先后输入&#xff1a;crontab -e、 1、 回车 设置每天0点执行一次myapp.sh操作&#xff0c;需要写绝对路径 含义&#xff1…

RK3576 Camera:资源介绍

RK3576是RK今年上市的中高端旗舰芯片&#xff0c;定位弱于RK3588。这篇文章主要分享一下RK3576这颗主控芯片的camera资源。 &#xff08;1&#xff09;RK3576 camera资源 ①RK3576 camera硬件框图 RK3576的camera硬件框图如图所示&#xff0c;拥有一路4lane的DCPHY&#xff…

Spring Cloud Consul 4.1.1

该项目通过自动配置和绑定到 Spring 环境和其他 Spring 编程模型习惯用法&#xff0c;为 Spring Boot 应用程序提供 Consul 集成。通过一些简单的注释&#xff0c;您可以快速启用和配置应用程序内的常见模式&#xff0c;并使用基于 Consul 的组件构建大型分布式系统。提供的模式…

银河麒麟v10 重装系统恢复原home分区

现象&#xff1a;系统还原后在锁屏状态下输入密码后闪退回锁屏 ctrl alt f1切到命令行模式&#xff0c;查看/home目录下的用户文件夹里无文件 1、blkid找到data分区的uuid和设备编号&#xff0c;记录下来&#xff1b; 2、sudo mount /dev/sda5 3、sudo vi /etc/fstab&#xf…

JAVA中类和对象(承接上次的补充)

目录&#xff1a; 一.static修饰成员方法 二.static成员变量初始化 三.代码块 一.static修饰成员方法: 1.一般类中的数据成员都设置为 private &#xff0c;而成员方法设置为 public &#xff0c; 问&#xff1a;那设置之后&#xff0c;Student类中&#xff0c;被Student修饰…