初始mach-o文件及在项目中应用

5cd0250c241087a65429248759cdc015.jpeg

c360278f5a3d3a043cbc61e3c3079172.gif

本文字数:2250

预计阅读时间:15分钟

3600e827f24e4809cc31403e3df1c660.png

01

认识mach-o的必要性

了解mach-o的结构可以帮助认识系统加载二进制文件的动态链接和静态链接。应用层面,使用initialize的c++函数计算启动时间耗时也需要以mach-o的结构知识为铺垫。还可以用在使用clang自注册启动任务上。后续会一一展开说明。

02

mach-o的定义

mach-o是mach object的缩写,是存储程序或库的标准格式。app的mach-o又称为可执行文件,静态库的.a文件也为mach-o文件,还有诸如此类的一些文件。

  • .o目标文件:MH_OBJECT

  • 静态库文件.a : MH_OBJECT

  • 可执行文件:MH_EXECUTE

  • 动态库:MH_DYLIB

  • dyld:MH_DYLINKER

  • 符号信息:MH_DSYM。可在loader.h的源码中看到全部的mach-o文件。

    181bde3cbfa57d6cbd89c4bb613e3dcf.png

想要深入了解mach-o,可以自己创建一个,在xocde的build setting --> mach-o type 下选择类型,依据xcode的提示步骤可以创建出。如果已经有了文件,想知道是否为mach-o,也可以使用xcode打开文件,在build setting --> mach-o type下查看属于哪种类型。xcode的查看示意见下图:e84c518d9dce2dd02f3dffc8cef7eb43.pngbd1c450ac00a4ee92780e264372d3f3e.png

03

mach-o的结构

查看mach-o的内部结构需要借助于工具mach-o View下载地址。目前下载下来之后需要在mac上运行使用。举例,使用mach-o View查看app的可执行文件,首先需要编译项目,这样会生成.app文件,然后项目中搜索.app:

0dfd1f8761b0cc8bb0c09b22a073dce7.png

右键show in finder,就会找到app包。如下图:

49afc6001b0137c2f219c173545199f1.png

查找可执行文件,文件以项目名称命名的。下图中第一个就是:

0e59a10c02c12c6df426e55b0613b62f.png

通过打开mach-o View可以看到,mach-o分为三大部分,无论是什么类型的mach-o文件,都分为3大部分。

  • mach-o header 描述了Mach-o的cpu框架以及加载命令等信息;

  • load Commands 记录虚拟内存中的布局例如有哪些段,段从哪开始,段占用多大空间;

  • data 记录段的具体数据。如下图,三大部分在mach-o中分布:

a8b41a8d434e02d2bc28611992c63c41.png

1、第一部分:mach-o Header 详解

mach-o header 的结构如下图中红框展示:

15c173552496d94c81c0a61682742d45.png

  • magic number :系统加载器通过该字段判断文件适用于32位还是64位;

  • cpu type:cpu类型,该字段确保系统可以将合适的二进制文件在当下架构下进行,为x86,arm64等;

  • file type :说明文件类型(可执行文件、库文件、核心转储文件、内核扩展文件、DYSM文件、动态库等)mach-o为MH-EXECUTE.;

  • number of load command 说明加载命令的条数;

  • size of load commands 表示加载命令的大小;

如上所述,header介绍了文件的基础信息。

2、第二部分:mach-o内容

mach-o的内容部分分为load commands和 data。

  • load commands 如图所示:

    3ca3a357bac9c3c3c1c60813948aadd7.jpeg

每一个命令的含义下表:

命令名称命令含义
LC_SEGMENT_64将文件中的段映射到进程地址空间
LC_DYLD_INFO_ONLYdyld相关信息
LC_SYMTAB加载全局符号表信息
LC_DYSYMTAB动态链接符号表信息
LC_DYLD_INFO_ONLYdyld相关信息
LC_LOAD_DYLINKER加载一个动态链接器,也就是加载dyld
LC_UUIDapp的uuid
LC_VERSION_MIN_IPHONEOS支持最低系统版本
LC_MAIN设置程序主线程的入口地址
LC_LOAD_DYLIB(动态库名称)加载相应的动态库
LC_FUNCTION_STARTS函数启示地址表
LC_CODE_SIGNATURE代码签名

loader.h文件中可查看命令的官方注释。

  • data部分的内容如图所示:

4a1e4ceb7730b64da618ed5462e2c43e.png如图所示,data有2种段数据,一种为__TEXT段,一种为__DATA段。__text段是Mach-O文件中存储代码的一个特定段,它包含了程序的实际可执行代码。在__text段中,存储了程序的实际指令和函数定义。当程序被加载到内存中并执行时,操作系统会将__text段中的代码加载到内存中,并按照指令逐条执行,从而实现程序的功能。 __text段通常是以只读方式存储在Mach-O文件中,以确保代码的完整性和安全性。这意味着在程序运行时,__text段中的代码是不可被修改的,这有助于防止恶意软件对程序代码进行篡改。__data段是用来存储程序的静态数据的一个特定段。__data段包含了程序中的静态全局变量、静态局部变量和其他静态数据,这些数据在程序运行时需要被初始化和使用。与代码段__text不同,__data段存储的是程序运行时需要进行读写操作的数据。

__text各个段的含义:

名称作用
TEXT.text只有可执行的机器码
TEXT.cstring去重后的C字符串
TEXT.const初始化过的常量
TEXT.stubs符号桩。本质上是一小段会直接跳入lazybinding的表对应项指针指向的地址的代码。
TEXT.stub_helper辅助函数。上述提到的lazybinding的表中对应项的指针在没有找到真正的符号地址的时候,都指向这。
TEXT.unwind_info用于存储处理异常情况信息
TEXT.eh_frame调试辅助信息
_objc_classname类名称
objc_methlist方法列表

__text段在mach-o中的释义:

e2d012b6f303b8f6b192caa18e9ddaec.png

__data 各个段的含义:

名称作用

DATA.data

初始化过的可变的数据

DATA.nl_symbol_ptr

非lazy-binding的指针表,dyld 加载会立即绑定

DATA.la_symbol_ptr

lazy-binding的指针表,每个表项中的指针一开始指向stub_helper

DATA.const

没有初始化过的常量

DATA.mod_init_func

初始化函数,在main之前调用

DATA.mod_term_func

终止函数,在main返回之后调用

DATA.bss

没有初始化的静态变量

DATA.common

没有初始化过的符号声明

DATA.__objc_nlclslist

实现了 load 方法的类

__data 在mach-o中的展示:

a01ee2784cb4cbbfb4c219bcd76f63f6.png

04

mach-o的应用

认识了mach-o,可以将其运用在统计启动时期c++ static initializer 阶段耗时。c++ static initializer 阶段系统做了什么,一个是c++的构造函数属性函数,一个是非基础类型的c++静态全局变量的创建(通常是类或结构体)。在构造函数上打断点,可以得到如图:29ca5184dfc85f454a1aa7cecbcbf527.png

从dyld的源码中可以看到doModeInitFunction()的具体执行。如下图所示:a5ddaa5b3e7a1d5af59bd8ff917089d9.png从dyld的源码中可以看出,取出mod_init_func section 中的元素并执行。可以看出,mod_init_func section中存储的是函数地址,类型为initialize.了解这些之后,自己写一个带有计时的start和end函数,并在中间调用源函数地址。然后hook mod_init_func 中的所有地址,并替换执行自己的函数。步骤如下:

  • hook mod_init_func中的所有地址 。因为__mod_init_func section 位于__DATAsegment.__DATA segment 是数据段,是可以在运行时被修改的。并且,+load方法的执行是在dyld读取这些initializer之前。所以hook mod_init_func中的所有地址是可行的;

  • 修改mod_init_func数据。利用getsectiondata获取到segment的每一个数据,将自己写的方法替换表中的方法;

  • 调用原来的initializer。自己的Initializer中逐个获取每一个原函数地址,调用并计算耗时获取。

通过以上步骤,我们可以得出这一项的耗时,从而做出优化。

认识mach-o,是注册启动任务的必备知识。做注册启动任务的必要性有两点。

  1. 启动代码集中在AppDelegate中,代码逐渐臃肿,易读性降低,且代码之间耦合度高;

  2. 各个业务方加启动任务,都需要启动业务配合。

我们利用mach-o结构的__DATA可读写性。所以可以通过clang的section函数在编译阶段写入macho文件中一个__DATA段。__DATA段存储函数指针的指针。具体的使用步骤为:

  1. 编写注册方法的宏,提供给外部使用;

  2. 业务方注册任务,注册的每个时机都会在编译期间新增一个__DATA类型section,存储任务函数;

  3. App运行,在注册的时机函数中使用getsectbynamefromheader_64遍历取出相应Section中的函数,并依次执行。

代码如下:

static void Launch_Func_(void);\
__attribute__((used, section("__DATA, "#period""))) static const void * __Func__= Launch_Func_;\
static void Launch_Func_(void)

#define RegisterLaunchTaskOnWillFinishLaunchPeriod\
        RegisterLaunchTask(willFinishLaunch)

#define RegisterLaunchTaskOnDidFinishLaunchPeriod\
        RegisterLaunchTask(didFinishLaunch)

#define RegisterLaunchTaskOnDidFinishADPeriod\
        RegisterLaunchTask(didFinishAD)

#define RegisterLaunchTaskOnDidFinishHomepagePeriod\
        RegisterLaunchTask(didFinishHome)

各个业务的使用代码如下:

RegisterLaunchTaskOnDidFinishHomepagePeriod{
    /*do sth*/
}

参考资料:

1.https://everettjf.github.io/2017/02/06/a-method-of-hook-static-2.initializers/# https://github.com/fangshufeng/MachOView

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/368408.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

css绘制向左三角形_纯css 实现三角形

首先这个思路的讲解 就是用到了 border 边框这个属性 一个div 可以设置四边边框 我们先把其他三条边都去掉 只留下一个边框 其他 在设置底边框的宽度 再把内容区域设置为0 就可以了 下面是代码 <div></div>div {width:0;height:0;border-top:30px solid red ;bor…

机器学习——集成学习

&#x1f4d5;参考&#xff1a;ysu老师课件西瓜书 期末复习笔记 1.集成学习的基本概念 集成学习&#xff08;ensemble learing&#xff09;通过构建并结合多个学习器来完成学习任务。 有时也被称为多分类器系统&#xff08;multi-classifier system&#xff09;、基于委员会的…

Flink实时数仓同步:快照表实战详解

一、背景 在大数据领域&#xff0c;初始阶段业务数据通常被存储于关系型数据库&#xff0c;如MySQL。然而&#xff0c;为满足日常分析和报表等需求&#xff0c;大数据平台采用多种同步方式&#xff0c;以适应这些业务数据的不同存储需求。这些同步存储方式包括离线仓库和实时仓…

1894_透明性以及可显性

1894_透明性以及可显性 全部学习汇总&#xff1a; g_unix: UNIX系统学习笔记 (gitee.com) 这是一个透明性以及可显性的基本描述。 这个是对透明性以及可显性的功能作用的一个基本描述。 做一个简单的小结&#xff0c;从一个软件工程师的角度来看看透明性以及可显性的概念和作用…

[职场] 资信评估是什么? #学习方法#笔记

资信评估是什么&#xff1f; 资信评估是指对个人或机构的信用状况进行评估和分析的过程。它主要通过收集和分析各种相关信息来评估借款人或机构的还款能力、信用历史和风险承受能力&#xff0c;以确定其信用等级或信用评分。 资信评估通常包括以下几个方面的内容&#xff1a; …

2024年【道路运输企业主要负责人】新版试题及道路运输企业主要负责人考试试题

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 道路运输企业主要负责人考试报名是安全生产模拟考试一点通总题库中生成的一套道路运输企业主要负责人理论考试&#xff0c;安全生产模拟考试一点通上道路运输企业主要负责人作业手机同步练习。2024年【道路运输企业主…

gif动图的裁剪实现思路

项目需求(对app的轮播,以及banner和咨询的图片进行裁剪):前期实现使用用vue-cropper插件对图片进行插件,----后续需求需要裁剪gif动图(vue-cropper、微信自带的截图工具,以及fastStone截图工具,都只能截取静态图片,打开动图时只显示某一帧的静态图片),所以需要研究为什么vue-cr…

Blender 与 3ds Max | 面对面的直接较量(2024)

Blender和3ds Max&#xff0c;哪个动画软件更好&#xff1f;作为一个从事动画领域十年的专业人士&#xff0c;Mark McPherson提供了八条最新建议&#xff0c;帮助你了解哪个软件更适合满足你的3D动画需求。 1.建模 获胜者&#xff1a;3ds Max。3ds Max的建模机制已经被证明是…

uniapp H5 px转换rpx

uniapp H5 px转换rpx 安装 px2rpx 重启 HBuilderX在要转换的文件 点击右键 点击 开启px2rpx(1px转成2rpx) 开启成功&#xff01;使用 编辑页面后 按下键盘 Ctrl s 保存&#xff01;转化成功&#xff01;当然 你也需要对使用的插件 进行转换&#xff01;否则可能导致样式出现…

xinput1_3.dll文件缺失的解决方法

在使用计算机的过程中&#xff0c;遇到“找不到xinput1_3.dll”这样的错误提示并不罕见。该问题通常出现在尝试启动某些游戏或应用程序时&#xff0c;特别是那些依赖于Microsoft DirectX接口来处理输入设备&#xff08;如游戏手柄&#xff09;的程序。xinput1_3.dll是DirectX库…

Fink CDC数据同步(二)MySQL数据同步

1 开启binlog日志 2 数据准备 use bigdata; drop table if exists user;CREATE TABLE user(id INTEGER NOT NULL AUTO_INCREMENT,name VARCHAR(20) NOT NULL DEFAULT ,birth VARCHAR(20) NOT NULL DEFAULT ,gender VARCHAR(10) NOT NULL DEFAULT ,PRIMARY KEY(id) ); ALTER TA…

数学建模-退火算法和遗传算法

退火算法和遗传算法 一&#xff0e;退火算法 退火算法Matlab程序如下&#xff1a; [W]xlsread(D:100个目标经度纬度);>> x[W(:,1)];>> y[W(:,2)];>> w[x y];;d1[70, 40];>> w[d1;w;d1]ww*pi/180;%角度化成弧度dzeros(102);%距离矩阵初始化for i1:101…

STL——空间配置器

空间配置器是STL六大组件之一&#xff0c;它和其他五个组件相互配合&#xff0c;起着很关键的作用。 容器&#xff1a;各种数据结构、如vector、list、stack、deque、queue、set、map、unordered_map等等算法&#xff1a;各种算法&#xff0c;如sort、serach、copy、erase 提供…

【vue】报错 Duplicate keys detected 解决方案

错误描述&#xff1a;Duplicate keys detected. This may cause an update error.错误直译&#xff1a;检测到重复的键。这可能会导致错误。错误原因&#xff1a;有相同父元素的多个子元素的v-for有相同的key值。 解决方法&#xff1a; return:{dataList:[{name:张三&#xf…

坚持刷题|二叉树的前、中、后序遍历(递归迭代)

文章目录 题目思考递归实现迭代实现前序遍历后序遍历中序遍历 在前、中、后序的迭代遍历中&#xff0c;为什么都采用栈来模拟递归&#xff0c;而非队列&#xff1f; Hello&#xff0c;大家好&#xff0c;我是阿月。坚持刷题&#xff0c;老年痴呆追不上我&#xff0c;今天刷&…

excel给数据库初始化/旧数据处理(自动sql拼装)

思路&#xff1a; 首先导出数据到excel编写单条数据操作的sql利用excel CONCATENATE 函数自动生成&#xff0c;每一行数据的操作sql 小技巧:对于需要套娃的字段值&#xff0c;可以加一个临时列同样使用CONCATENATE函数进行sql拼装 案例&#xff1a; 1.临时列:CONCATENATE(C2, …

ROS方向第二次汇报(5)

文章目录 1.本方向内学习内容&#xff1a;1.1.自定义msg&#xff1a;1.1.1.定义msg文件&#xff1a;1.1.2.编辑配置文件&#xff1a; 1.2.自定义srv&#xff1a;1.2.1.定义srv文件&#xff1a;1.2.2.编辑配置文件&#xff1a; 1.3.服务通信案例实现&#xff1a;1.3.1.服务端实现…

回溯法:回溯法通用模版汇总以及模版应用

从一个问题开始 给定两个整数 n 和 k&#xff0c;返回 1 ... n 中所有可能的 k 个数的组合。 示例: 输入: n 4, k 2 输出: [ [2,4], [3,4], [2,3], [1,2], [1,3], [1,4] ] 很容易想到 用两个for循环就可以解决。 如果n为100&#xff0c;k为50呢&#xff0c;那就50层for循…

修改Vim编辑器的缩进和显示行数

一、Vim编辑器的缩进和显示行数 1.指令 sudo vi /etc/vim/vimrc2.插入内容 set tabstop4 set shiftwidth4 set nu 注意输入的格式&#xff0c;前后不要留空格 tabstop是输入按下tab缩进4个 shiftwidth是批量缩进4个 nu是显示行数