1.动态链接库的使用
动态库支持以两种模式使用,一种模式下,在程序加载运行时,完成动态链接。一种模式下,在程序运行中,完成动态链接。
1.1.程序加载运行时完成动态链接
我们通过一个实例介绍程序加载运行时,使用动态库的方式
(1). 构建动态库
动态库源文件及makefile位于dynamic
a.t1.cpp
// t1.cpp
int addcnt = 0;
void addvec(int *x, int *y, int *z, int n)
{
int i;
addcnt++;
for (i = 0; i < n; i++)
z[i] = x[i] + y[i];
}
b.t2.cpp
// t2.cpp
int mulcnt = 0;
void multvec(int *x, int *y, int *z, int n)
{
int i;
mulcnt++;
for (i = 0; i < n; i++)
z[i] = x[i] * y[i];
}
c.makefile
main: t1 t2 dynamic
t1:
g++ -fpic -std=c++11 t1.cpp -c
t2:
g++ -fpic -std=c++11 t2.cpp -c
dynamic:
g++ -std=c++11 -shared t1.o t2.o -o libt.so
clean:
rm *.o libt.so *.txt
d.通过执行make完成构建。注意编译动态库源文件时需指定-fpic
,基于.o
得到动态库需指定-shared
。
(2).提供动态库导出符号声明文件
动态库导出符号声明文件放在include。
a.t.h
#ifndef _T_H
#define _T_H
extern int addcnt;
void multvec(int *x, int *y, int *z, int n);
void addvec(int *x, int *y, int *z, int n);
#endif
上述除了导出函数,我们还导出了变量addcnt。变量的声明需加上extern,否则会被视为变量定义。
(3).主程序使用动态库导出符号
a.主程序为main.cpp
#include <stdio.h>
#include "t.h"
int x[2] = {1, 2};
int y[2] = {3, 4};
int z[2];
int main()
{
addvec(x, y, z, 2);
printf("z=[%d %d]\n", z[0], z[1]);
printf("addcnt_%d\n", addcnt);
return 0;
}
我们采用加载运行时完成动态链接方式使用动态库时,在使用动态库导出符号时,需要先声明符号。然后直接使用即可。
上述使用了动态库导出的addvec,addcnt
。
b.构建可执行程序的makefile
main:
g++ main.cpp -std=c++11 -I./include -L./dynamic -lt
clean:
rm a.out *.o *.txt
我们采用加载运行时完成动态链接方式使用动态库时,构建可执行程序时,需通过-L -l
来指定要链接的动态库的位置信息。-I
用于指定编译期间头文件搜索路径。
(4).启动可执行程序
若上述编译完毕后,我们直接在a.out
所在目录通过命令行执行./a.out
是不行的。
因为类似编译链接过程需通过-L -l
来指定要链接的动态库的位置信息。加载运行时,可以通过设置LD_LIBRARY_PATH来指定要链接的动态库的位置信息。上述结构下,我们提供s.sh。
// s.sh
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:./dynamic
./a.out
这样执行./s.sh
即可正常启动。LD_LIBRARY_PATH
用于在程序启动运行时告知搜索程序依赖的动态库的路径。
要查看可执行程序依赖那些动态库,可使用ldd a.out
。
1.2.程序运行期间完成动态链接
我们通过一个实例介绍程序运行期间,使用动态库的方式。
(1). 构建动态库
和1.1部分相同。
(2).主程序中使用动态库导出符号
注意,运行期间使用动态库时,我们并不需要动态库导出符号声明文件。
因为使用导出符号的方式是通过dlsym直接取得导出符号地址后,转换为相应类型后使用。
a.主程序为main.cpp
这里的main.cpp放置在demo下
#include <iostream>
#include <dlfcn.h>
int x[2] = {1,2};
int y[2] = {3,4};
int z[2];
typedef void (*AddVec)(int*, int*, int*, int);
int main()
{
void *handle;
AddVec addvec = nullptr;
char *error;
handle = dlopen("libt.so", RTLD_LAZY);
if(!handle)
{
printf("%s\n", dlerror());
return 0;
}
addvec = (AddVec)dlsym(handle, "addvec");
if((error = dlerror()) != NULL)
{
printf("%s\n", error);
dlclose(handle);
return 0;
}
int* addcnt = (int*)dlsym(handle, "addcnt");
if((error = dlerror()) != NULL)
{
printf("%s\n", error);
dlclose(handle);
return 0;
}
addvec(x, y, z, 2);
printf("z = [%d %d],cnt_%d\n", z[0], z[1], *addcnt);
dlclose(handle);
return 0;
}
我们采用运行期间完成动态链接的方式使用动态库,在使用动态库导出符号时,通过dlsym取得导出符号地址后,转换为匹配类型后,即可使用。上述使用了动态库导出的addvec,addcnt
。
b.构建可执行程序的makefile
makefile放置在demo。
main:
g++ -std=c++11 -rdynamic main.cpp -I../include -ldl
clean:
rm a.out *.o *.txt
我们采用运行期间完成动态链接方式使用动态库时,构建可执行程序时,不需要通过-L -l
来指定要链接的动态库的位置信息。因为编译链接过程尚未用到运行期间要链接的动态库。但需指定-rdynamic -ldl
,因为我们此时需要链接到服务于运行期间动态连接的动态库dl。
(3).启动可执行程序
类似的,我们在启动前需通过LD_LIBRARY_PATH来指定dlopen中搜索动态库的路径信息。
我们的放置在demo下的s.sh为
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:../dynamic
./a.out
但执行./s.sh时,报错了:
因为我们采用c++方式编译动态库时,库内addvec的符号实际编译出的符号名称为:
这是因为c++编译器对编译时,针对函数类型会结合其形参为其构建符号名称。c编译器不会。
c++支持同名函数重载,所以,这样是需要的。c不支持同名函数重载,所以,不需要。
上述报错是因为我们通过dlsym取出addvec符号地址时,通过名称addvec在动态库中找不到匹配的符号。
为了正常使用dlsym取得导出符号地址:
(1).我们要么将dlsym传入的符号名修改为_Z6addvecPiS_S_i
;
(2).要么通过设置使得c++编译时,针对addvec导出符号不要采用符号重新命名机制。我们只需在动态库源文件符号定义处,添加extern "C"
修饰即可。若我们采取了此种方式,应该同步在类库导出符号声明文件中为addvec的声明也添加extern "C"修饰。这样,1.1中使用动态库时,也会直接采用addvec来在动态库中定位符号的定义位置。
针对变量类型导出符号,如addcnt,c++编译器不会对符号执行重新命名。所以,直接使用符号名即可。
值得注意的是,添加extern "C"后由于关闭结合形参重命名机制,所以,此时也就不允许同名符号重载了。
int addcnt = 0;
void addvec(int *x, int *y, int *z, int n)
{
int i;
addcnt++;
for (i = 0; i < n; i++)
z[i] = x[i] + y[i];
}
void addvec(int *x, int *y, int *z)
{
int i;
i = 0;
i++;
}
上述内容,作为t1.cpp内容时,可正常编译。
int addcnt = 0;
extern "C" void addvec(int *x, int *y, int *z, int n)
{
int i;
addcnt++;
for (i = 0; i < n; i++)
z[i] = x[i] + y[i];
}
extern "C" void addvec(int *x, int *y, int *z)
{
int i;
i = 0;
i++;
}
上述内容作为t1.cpp内容时,无法编译通过。因为存在同名符号问题。
2.动态链接库的链接
以下均以程序加载运行时完成动态链接为例说明动态链接过程。
(1). 程序编译时,动态库中被引用的符号定义不会被拷贝到可执行文件,但动态库中相关的符号表和重定位信息会被拷贝到编译得到的可执行文件中。
(2). 程序加载运行时,通过动态链接器将可执行程序依赖的动态库加载到内存中,并映射到进程某个线程区域,再完成对引用符号的重新定位过程。可执行程序中引用的动态库中定义的导出符号需要重定位,动态库中引用的其他动态库导出的符号也需重定位。
某个动态库一旦被加载到物理内存,后续其他进程需要加载此动态库时,可以共享此内存区域,通过虚拟内存映射到自身的一块线性区域即可。
2.1.位置无关代码
我们编译动态库时,对源文件使用了-fpic
选项,告诉编译器采用位置无关方法来编译。位置无关可以认为是无论符号的定义放在线性区域的那个位置均是可以的。而可执行程序的各个部分所在的线性区域位置一般是编译时已经确定了的。
2.2.分析动态链接重定位过程
我们分析实例1.1.中可执行程序中对addvec的动态链接重定位过程。
我们对1.1.中实例的a.out执行:objdum -dx a.out > 1.txt
。
截取输出:
上述代码中,执行 addvec 访问时,将通过 call 跳转到 0x4005b0。
0x4005b0 通过 jmpq 跳转到 0x601030 地址处的值代表的位置。
为了获取到 0x601030 处的内容,我们对 a.out 执行:objdump -sx a.out > 11.txt
。截取输出:
因为采用小端存储数值,故此处的 8 字节数值为:0x4005b6。
从0x4005b6处执行时,先是 pushq $0x3,然后跳到 0x400570。
从0x400570处执行时,先是 pushq 0x200a92(%rip),这是把 0x601008 位置的内容压入栈。
然后执行 jmpq *0x200a94(%rip),这是跳转到 0x601010 处继续执行
我们目前通过objdump -sx a.out > 11.txt
得到的内容里,0x601008 和 0x601010 内容均是0,但是需要明白,在 a.out 被加载运行时, 这两部分分别会被设置为 重定位项起始位置,动态链接器代码段位置。
所以,上述过程实际是通过 两个 pushq 加上一个 jmpq 实现了传参并调用动态链接器。调用的结果是 会通过传参完成对引用符号 addvec 的动态重定位,重定位的结果是 0x601030 处会被写入 addvec 符号的定义位置对应的线性地址。这样,后续再次引用 addvec 时,将在执行jmpq *0x200a7a(%rip) # 601030 <addvec>
时直接跳转到符号定义位置,略过首次调用时的动态链接过程。