《硬件历险》之Mac抢救出现问题的时间机器硬盘中的数据

本文虽然使用“抢救”一词,但是运气比较好,远没有达到访问和修改底层的信息来抢救的地步。如果你是需要通过访问和修改底层信息来抢救数据,建议阅读刘伟的《数据恢复技术深度揭秘(第二版)》或者寻找专业人士的帮助。

《数据恢复技术深度揭秘(第二版)》并没有提及如何修复现在 macOS 使用的 APFS,最新只有 HFS+。APFS 的结构要复杂一些,但是也是个尝试。

问题的前因后果

之前买过一块 3TB 的 SMR 盘用来专门时间机器备份,但是有次将其接到显示器上的 USB 接口,备份的时候显示器黑屏连接断开了,再次打开之后无法连接,等待相当长时间自检修复之后,弹出窗口显示“无法修复磁盘”,需要赶快抢救这些文件。

我当时要崩溃了,因为我的时间机器一直是手动备份的,所以从 2019 年一直到 2022 年四年的备份都在其中,这要是没了挺烦的。

好在这时候是可以正常访问硬盘内容的,只是整个硬盘都是只读的,无法再次使用时间机器来操作这个硬盘。

请添加图片描述

其中,我看到了那个被打断的备份(下图高亮):

请添加图片描述

这部分也没什么有用的内容,所以后面也不需要复制他们(由于现在是整个硬盘都是只读也没法删除)。

跳过系统的修复

上面看到了系统的修复是没啥用的,但是每次插上这个硬盘之后,需要很长时间才能看到卷宗。这是因为系统发现这个卷宗出现问题了,在使用fsck尝试修复。如果此时你在活动监视器中搜索fsck可以看到如下(_hfs后缀表示修复的文件系统是 HFS 格式的):

请添加图片描述

这时候强行退出这个进程就会弹出提示窗口,然后就能看到卷宗内容了。(命令行使用PS -A |grep fsck搜索,然后kill杀死进程即可)

这是为了节约时间。因为此时我们已经确定文件系统出现了问题,我们需要尽快将数据导出。有的时候fsck尝试修复只需要几分钟、十几分钟就会弹出修复失败的信息,但是有些时候会达到十几个小时(我遇到过),甚至数天(我在论坛看有人遇到过)。

诊断问题

首先得确定到底是硬盘坏了,还是文件系统坏了。前者的话抢救完数据就不能用了,而且得减少操作防止进一步恶化。后者的话格式化就好了,也不用担心操作太多导致更大的问题。

我知道很多人由于 SMR 结构的问题,会直接认为硬盘损坏,但是正如我上面所说,我基本没有复写操作,都是增量写入。这也是 SMR 的适合使用场景(一次写入,多次读取,尽量别再次复盖写入),所以不能简单地认为就是硬盘的问题。

我们在 Linux 或 Windows 上查看到这个硬盘(虽然无法读取,但是我们只需要检查),本文使用 Windows。

为什么不使用 Mac 来查看和检测?
这是因为 macOS 不支持对外部硬盘查看 SMART 信息,你可以使用 smartmontools 中的smartctl试一下,这点在 smartmontools 官方问答中也有列出 OSX - External USB / FireWire drive diagnostics support,机翻如下

请添加图片描述

连接上之后使用查看 SMART 信息的工具,以及其他一些检查工具(DiskInfo 等等)看看硬盘有没有问题。

好消息是硬盘没坏。加上能正常访问,用测速软件发现速度也没下降。也就是说只有文件系统出现了问题,这样只要抢救完文件就没有什么损失了。

抢救数据

根据上面的情况,个人猜测是时间机器相关的结构出现了问题,而不是 EFI 分区。因为是可以正常访问的,打开一些文件也没有问题,不然连硬盘卷宗都看不到。

由于整个硬盘是只读的,无法使用时间机器迁移到新硬盘,所以只能复制需要的内容。

接下来就是抢救这些文件了。

一些不能复制的文件和目录

如果你直接拖Backups.backupdb到新的硬盘中,会发现弹出:

请添加图片描述

这并不是因为目标硬盘是 APFS,和时间机器的 HFS+ 不一样,而是有一些隐藏文件作为时间机器的文件系统。所以同时按下“Command + Shift + .”三个键来显示所有的隐藏文件:

请添加图片描述

这里高亮的.RecoverySets目录是用来恢复 Mac 的。当然并不是只有这一个目录或者文件用来组成时间机器的文件系统,所以这时候也不要直接拖拽最下面没被隐藏的文件夹。

需要复制的文件和目录

实际需要复制的是下面这两个目录中的内容:

请添加图片描述

第一个目录下存放的是系统的东西,比如说系统自带的应用程序等等;第二个目录下则存放的是用户的数据和应用程序。

只复制一部分文件

如果你只需要一些数据文件,那么复制第二个目录下的内容即可。Macintosh HDMacintosh HD - 数据都对应的是系统的根目录/,前者存放的是系统相关的,后者是用户和使用相关的(可以想象一下将真正的根目录拆分成两部分)。

这点与实际系统上的结构完全不同,因为实际的系统上的Macintosh HD才是根目录,而Macintosh HD - 数据是挂载在/System/Volumes/Data的,需要注意这点。

比如说“照片”App 的内容一般在"Macintosh HD - 数据/Users/用户名/Pictures/照片图库.photoslibrary"(双引号防止在空格中断)。你只需要将其复制到其他地方,直接打开就能在“照片”中看到了。

“Pictures”在“访达”中可能因为本地化显示为“图片”,其他这些文件同理。很多人会将东西放在桌面,就可以在“桌面”或“Desktop”中看到。

对于开发人员来说,可能还需要复制一些配置文件或者二进制文件,这些都可以在对应位置找到。

复制所有的内容

通过上面我们知道了有些目录和文件是不能复制的,以及对我们有用的文件都在哪。

所以理所当然的,我们想可以在新的硬盘中创建对应目录,然后将Macintosh HDMacintosh HD - 数据依次拖到对应的目录下就行。

但是新的问题总是一个个冒出来:某些文件的直接拖拽复制可能会出现问题,比如说库乐队(GarageBand):

请添加图片描述

我一开始以为是硬盘坏块或者什么(我的魅族MX3上的一些照片就是闪存问题丢失了一些照片),但是尝试了多个备份中的库乐队,发现还是这样,说明不是硬盘的问题。

类似的还有 iMovie 和 Xcode,但是库乐队是一种特殊情况,像 iMovie 和 Xcode 的图标上都有所显示,但是库乐队没有这个符号(如下),却也无法复制成功:

请添加图片描述

这是因为库乐队找不到的是下载到乐器资源这些后期才有的资源,而不是程序本身的依赖项(比如 Xcode 使用的编译器、动态连接库等),所以图标上并没有显示,而它的记录是有这些的,但是这个时候找不到,就导致复制失败(因为在本机上找的)。

这里不展开去说其他程序的,因为不同的程序出现问题的原因不同,但是简而言之就是复制的时候破坏了软链接

解决方案也很明显,就是不破坏软链接来进行复制,这时候就不能使用拖拽的方法了,实践表明这会破坏软链接,所以需要使用rsync -l来保留软链接进行复制(速度有时差不多)。注意不要使用cp -RPcp -a来复制,某些文件会复制失败(按理说是等价的,但是可能因为某些原因导致出现问题,如果后面发现了我会在这贴出来)。

我们先尝试复制一次备份的内容,如果可以的话再使用脚本自动复制所有的备份即可。

命令如下:

sudo rsync -av \
"/Volumes/时间机器/Backups.backupdb/XXX的Macmini/2019-11-19-142257/Macintosh HD - 数据/" \
"/Volumes/10TB/时间机器手动导出/Macintosh HD - 数据/"

其中:

  • a是存档模式,这会递归读取目录,不破坏符号链接、权限等信息。a等价于rlptgoD,所以我们不需要再使用l选项。rsync默认(无选项)是存档模式的,但是我们使用了其他选项,所以需要再使用一下。
  • v会打印传输完成的文件。使用这个是为了让看到是否在传递文件(可能会降低一点速度)。
  • 第二行是源地址。
  • 第三行是目标地址。时间机器手动导出这个目录需要手动创建一下。

创建文件列表需要一段时间,然后就可以看到在复制文件了,如下:
请添加图片描述

v选项几乎不会影响速度,如下:

请添加图片描述

速度最高速度如上图(5400 RPM 的消费级机械硬盘这速度差不多满速了),速度低的话就几十 KB/s 都有可能。

现在单个复制完成之后,就可以开始写脚本了。下面的脚本仅供参考,因为不同的人可能有所不同,我只是根据我的情况编写的。

#!/bin/bash
#
for dir in $(ls); do
	# 忽略三个不需要的文件和目录名,防止路径出现问题
    if [ $dir == *.inProgress ]||[ $dir == Latest ]||[ $dir == "com.apple.TimeMachine.inheritance.plist" ]; then
    echo "Skip this directory"
    else
    # 在目标位置创建对应目录
    mkdir "/Volumes/10TB/时间机器手动导出/$dir"
    # 复制两个目录
    sudo rsync -av "$dir/Macintosh HD/" "/Volumes/10TB/时间机器手动导出/$dir/Macintosh HD/"
    # 排除.DocumentRevisions-V100文件会快很多
    sudo rsync -av --exclude '.DocumentRevisions-V100' "/Volumes/时间机器/Backups.backupdb/XXX的Macmini/$dir/Macintosh HD - 数据/" "/Volumes/10TB/时间机器手动导出/$dir/Macintosh HD - 数据/"
    fi
done;

希望能帮到有需要的人~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/465332.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

卷积篇 | YOLOv8改进之C2f模块融合SCConv | 即插即用的空间和通道维度重构卷积

前言:Hello大家好,我是小哥谈。SCConv是一种用于减少特征冗余的卷积神经网络模块。相对于其他流行的SOTA方法,SCConv可以以更低的计算成本获得更高的准确率。它通过在空间和通道维度上进行重构,从而减少了特征图中的冗余信息。这种…

留学生课设|R语言|研究方法课设

目录 INSTRUCTIONS Question 1. Understanding Quantitative Research Question 2. Inputting data into Jamovi and creating variables (using the dataset) Question 3. Outliers Question 4. Tests for mean difference Question 5. Correlation Analysis INSTRUCTIO…

深度学习 精选笔记(13.1)卷积神经网络-LeNet模型

学习参考: 动手学深度学习2.0Deep-Learning-with-TensorFlow-bookpytorchlightning ①如有冒犯、请联系侵删。 ②已写完的笔记文章会不定时一直修订修改(删、改、增),以达到集多方教程的精华于一文的目的。 ③非常推荐上面(学习参考&#x…

SAR ADC教程系列5——FFT频谱泄露以及相干采样

频谱泄露的出现以及如何规避? 为什么要相干采样? 1.分析ADC输出信号的频谱工具:DFT(Discrete Fourier Transform) 重点:DFT相邻频谱频率间隔为fs/N 如何规避频谱泄露? 对于DFT,它对于接收到的信…

Qt文件读写

做一个简单的文件读写,我们把一个结构体内的数据写入到二进制文件中,并重新读取解析。代码结构如下: 项目名称随便起就好了。main.cpp是主函数;DataHandler实现文件的写与读,还要模拟过程;Definition.h放置…

机器学习-绪论

机器学习致力于研究如何通过计算的手段、利用经验来改善系统自身的性能。在计算机系统中,“经验”通常以“数据”的形式存在,因此,机器学习所研究的主要内容,是关于在计算机上从数据中产生“模型”的算法,即“学习算法…

NPM 仓库的超集 JSR 来了!

引言 今天在 Deno 博客中看到了一篇文章,介绍了一个叫 JSR 的包管理注册中心,简单尝试了一下觉得还不错,本文将结合原文章和个人体验对 JSR 进行一个详细的介绍。 在现如今的前端开发中,包管理注册中心 (如 npmjs.com) 扮演着至…

Git——本地使用详解

目录 Git1、开始版本控制1.1、初始化Repository1.2、使目录脱离Git控制 2、把文件交给Git管控2.1、创建文件后交给Git2.2、git add之后再次修改文件2.3、git add "--all"与"."参数区别2.4、把暂存区的内容提交到存储库里存档 3、工作区、暂存区与存储库3.1…

Epuck2机器人固件更新及IP查询

文章目录 前言一、下载固件更新软件包:二、查询机器人在局域网下的IP 前言 前面进行了多机器人编队仿真包括集中式和分布式,最近打算在实物机器人上跑一跑之前的编队算法。但由于Epuck2机器人长时间没使用,故对其进行固件的更新,…

软考高级:软件架构本质和作用概念和例题

作者:明明如月学长, CSDN 博客专家,大厂高级 Java 工程师,《性能优化方法论》作者、《解锁大厂思维:剖析《阿里巴巴Java开发手册》》、《再学经典:《Effective Java》独家解析》专栏作者。 热门文章推荐&am…

【PyTorch】进阶学习:一文详细介绍 torch.save() 的应用场景、实战代码示例

【PyTorch】进阶学习:一文详细介绍 torch.save() 的应用场景、实战代码示例 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程…

Vue组件封装方案对比——v-if方式与内置component方式

近期在准备搭建一个通用组件库,而公司现有的各个系统也已有自己的组件库只是没抽离出来,但是目前有两套不同的组件封装方案,所以对于方案的选择比较困惑,于是对两种方式进行了对比,结合网上找到的一些开源组件库进行分…

wireshark解析https数据包

Debian11环境: 在linux环境下抓取访问某个https的网址时抓取的数据包都是加密的,导致无法跟踪到数据包流,现在尝试将抓取的https包进行解密。 1、解密https数据包需要设置SSLKEYLOGFILE变量,推荐写入配置文件中。 echo "exp…

Mysql的行级锁

MySQL 中锁定粒度最小的一种锁,是 针对索引字段加的锁 ,只针对当前操作的行记录进行加锁。 行级锁能大大减少数据库操作的冲突。其加锁粒度最小,并发度高,但加锁的开销也最大,加锁慢,会出现死锁。行级锁和存…

Ps:文字工具

工具箱里的文字工具组中包含了四种工具: 横排文字工具 Horizontal Type Tool 直排文字工具 Vertical Type Tool 横排文字蒙版工具 Horizontal Type Mask Tool 直排文字蒙版工具 Vertical Type Mask Tool 快捷键:T 横排文字蒙版工具和直排文字蒙版工具…

C++第六弹---类与对象(三)

✨个人主页: 熬夜学编程的小林 💗系列专栏: 【C语言详解】 【数据结构详解】【C详解】 目录 1、类的6个默认成员函数 2、构造函数 2.1、概念 2.2、特性 3、析构函数 3.1、概念 3.2、特性 3.3、调用顺序 总结 1、类的6个默认成员函数…

力扣hot100:33. 搜索旋转排序数组(二分的理解)

33.搜索旋转排序数组 ​ 这是一个非常有趣的问题,如果不要求使用O(logn)应该没人会想到吧。。 方法一: 极致的分类讨论。旋转排序数组,无非就是右边的增区间的数小于左边的增区间的数,然后依次排序。因此我们只需要分三类讨论即可…

【测试开发学习历程】MySQL数据类型 + MySQL表创建与操作

前言: 半夜梦到自己没有写今天的博客,结果惊醒起来看一看。 得,真的没写。QWQ 可谓垂死病中惊坐起了。 看看发博的时间6:16,而不是什么整点的,就知道我4点就起来了,不是定时发布&#xff01…

知识积累(五):Transformer 家族的学习笔记

文章目录 1. RNN1.1 缺点 2. Transformer2.1 组成2.2 Encoder2.2.1 Input Embedding(嵌入层)2.2.2 位置编码2.2.3 多头注意力2.2.4 Add & Norm 2.3 Decoder2.3.1 概览2.3.2 Masked multi-head attention 2.4 Transformer 模型的训练和推理2.4.1 训练…

C语言学习过程总结(16)——指针(4)

一、数组名的理解 我们直接使用%p打印出地址来看看&arr【0】 和 arr的不同: int main() {int arr[10] { 1,2,3,4,5,6,7,8,9,10 };printf("&arr[0] %p\n", &arr[0]);printf("arr %p\n", arr);} 、 很容易看出来两者的输出…