目录
1、概述
1.1 概述
1.2 环境介绍
2、使用备份集的恢复方法
2.1 实验准备
2.2 误删除“用户表空间数据文件”
2.3 误删除SYSTEM.DBF
2.4 误删除ROLL.DBF
2.5 REDO日志文件
3、无备份集的恢复方法
3.1 误删除“表空间数据文件”
3.2误删除控制文件
3.3 误删除ROLL.DBF
3.4 误删除REDO日志文件
3.5 误删除TEMP.DBF
1、概述
1.1 概述
本文介绍了达梦数据库文件损坏或误删除后的恢复方法。这里的数据库文件包括,表空间数据文件、重做日志文件、UNDO文件、TEMP文件、控制文件等。介绍了两种恢复场景,第一种场景是使用备份集恢复,第二种场景是在没有备份集的情况下尝试恢复。
1.2 环境介绍
数据库版本:DM Database 64 V8 03134284094-20231108-207962-20067
操作系统版本:Linux version 4.19.90-24.4.v2101.ky10.x86_64
2、使用备份集的恢复方法
本章模拟了几种故障场景及还原、恢复方法,不介绍备份还原理论,学习备份还原理论知识可以参考官方文档《DM8备份与还原》。
2.1 实验准备
联机备份
SQL> backup database backupset '/dm8/backup/fullbak_20241126_002' compressed level 1;
2.2 误删除“用户表空间数据文件”
1) 制造故障
表空间数据文件损坏:
rm /dm8/data/DAMENG/MAIN.DBF
2)还原方法
数据文件误删除,如果数据库没有关闭,应该优先考虑从操作系统找回,优点是不需要关闭数据库,相关方法我们在第3章介绍。这里介绍的是用备份集还原的方法。
dmrman
RESTORE DATABASE '/dm8/data/DAMENG/dm.ini' TABLESPACE MAIN FROM BACKUPSET '/dm8/backup/fullbak_20241126_002';
RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' TABLESPACE MAIN;
2.3 误删除SYSTEM.DBF
系统表空间数据文件故障,不能使用2.2节还原表空间的方法,需要全库还原。
全库还原有两种方法,方法1是重新初始化一个新库,在这个新库上做还原;方法2是将备份集还原到指定目录。
1)制造故障,删除SYSTEM.DBF
rm /dm8/data/DAMENG/SYSTEM.DBF
2)恢复SYSTEM.DBF
如果磁盘空间充足,可以考虑将数据库目录备份出来
mv /dm8/data/DAMENG /dm8/data/DAMENG_BAK
方法1:重新初始化一个新库,在这个新库上做还原
dminit path=/dm8/data/
RESTORE DATABASE '/dm8/data/DAMENG/dm.ini' FROM BACKUPSET '/dm8/backup/fullbak_20241126_002';
RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' FROM BACKUPSET '/dm8/backup/fullbak_20241126_002';
RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' UPDATE DB_MAGIC;
方法2:数据库还原到指定目录
RESTORE DATABASE TO '/dm8/data/DAMENG/' OVERWRITE FROM BACKUPSET '/dm8/backup/fullbak_20241126_002';
RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' FROM BACKUPSET '/dm8/backup/fullbak_20241126_002';
RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' UPDATE DB_MAGIC;
2.4 误删除ROLL.DBF
1)制造故障,删除ROLL.DBF
rm /dm8/data/DAMENG/ROLL.DBF
2)使用备份集还原
dmrman
RESTORE DATABASE '/dm8/data/DAMENG/dm.ini' TABLESPACE ROLL FROM BACKUPSET '/dm8/backup/fullbak_20241126_002';
RECOVER DATABASE '/dm8/data/DAMENG/dm.ini' TABLESPACE ROLL;
2.5 误删除REDO日志文件
REDO文件损坏,需要使用备份集全库还原,可以参考2.3节SYSTEM.DBF恢复方法。
3、无备份集的恢复方法
3.1 误删除“表空间数据文件”
LINUX 系统中被删除的文件,只要其句柄没有被关闭,可以在/proc/<pid>/fd 中找到其对应的文件副本。其中<pid>指打开该文件的进程 id。
利用该方法,结合 OS 命令,DM 提供失效文件的恢复方案如下:
1、 调用系统过程 SP_TABLESPACE_PREPARE_RECOVER(表空间名称)准备进行恢复;
2、 如果使用过程中 DM 报错表空间数据文件被删除,通过操作系统的 ps 命令找到当前 dmserver 的 PID:ps -ef|grep dmserver;
3、 使用操作系统 ll 命令查看被删除文件对应的副本:ll /proc/<PID>/fd,会发现被删除的文件后有(deleted)字样;
4、 使用操作系统的 cp 命令将文件复制到原位置:cp 源路径 目的路径;
5、 复制成功后,调用系统过程 SP_TABLESPACE_RECOVER(表空间名称)完成表空间失效文件的恢复。注意,要保证数据文件正确修复,需要保证在 SP_TABLESPACE_PREPARE_RECOVER后进行数据文件的复制。
故障模拟:
一、制造故障
1、查看表空间对应的数据文件
select t.name,d.path from SYS.V$TABLESPACE t
left join SYS.V$DATAFILE d on(d.GROUP_ID=T.ID);
2、模拟误删除数据文件
rm /dm8/data/DAMENG/DMHR.DBF
二、恢复方法
1、 表空间失效文件恢复准备
SP_TABLESPACE_PREPARE_RECOVER('DMHR');
2、 查找dmserver 进程号
ps -ef|grep dmserver
dmdba 1798 1 0 09:14 ? 00:00:05 /dm8/dmdbms/bin/dmserver path=/dm8/data/DAMENG/dm.ini -noconsole
3、 查看进程目录下的文件
ll /proc/1798/fd
4、 还原文件
cp -p /proc/1798/fd/17 /dm8/data/DAMENG/DMHR.DBF
5、 修复表空间文件
SP_TABLESPACE_RECOVER('DMHR');
6、验证
SELECT count(*) FROM DMHR.EMPLOYEE;
恢复成功!
3.2 误删除控制文件
控制文件恢复方法:
到ctl_bak目录,找到时间最近的备份,名称改为dm.ctl即可。
3.3 误删除ROLL.DBF
1)制造故障,删除ROLL.DBF
rm /dm8/data/DAMENG/ROLL.DBF
2)使用其他数据库的ROLL文件冒充误删除的文件
使用其他数据库的ROLL文件冒充误删除的文件。
修改 dm.ini 参数 PSEG_RECV 为 0,可以选择跳过 ROLL.DBF 启动数据库临时启动数据库(危险操作,可能破坏事务的原子性)。
PSEG_RECV 参数释意: 系统故障重启时,对活动事务和已提交事务的处理方式。 0:跳过回滚活动事务和 PURGE 已经提交事务的步骤。 1:回滚活动事务并 PURGE 已经提交事务; 2:延迟 PURGE 已提交事务,延迟回滚活动事务; 3:回滚活动事务,延迟 PURGE 已提交事务。
vi dm.ini
PSEG_RECV =0
拷贝其他数据库ROLL.DBF冒充误删除的文件
cp /dm8/data/PROD/ROLL.DBF /dm8/data/DAMENG/ #拷贝其他库的ROLL.DBF
启动数据库
dmserver ./dm.ini
数据库启动,恢复成功!
3.4 误删除REDO日志文件
重做日志文件损坏,推荐使用备份集恢复。
在没有备份的情况下,可以尝试使用没损坏的redo文件或使用新建相同配置数据库的redo文件冒充损坏的redo文件。通常要用dmmdf工具修改db_magic、pemnt_magic。不过这么做是有问题的,首先如果成功了,存在数据不一致的风险;其次,不一定能成功,至少在本文涉及的版本上,博主没有恢复成功。
3.5 误删除TEMP.DBF
1)制造故障,删除TEMP.DBF
rm /dm8/data/DAMENG/TEMP.DBF
2)临时表空间数据文件误删除后不用还原,重启数据库后会重新生成TEMP.DBF文件
数据库启动后重新创建了TEMP.DBF。
本文结束!
2024.11.28