前言
之从入坑C++之后,项目中的编译构建就经常跟CMake打交道,但对它缺乏系统的了解,遇到问题又陷入盲人摸象。对C++的编译体系是如何发展的,为什么要用CMake,它的运作原理是如何的比较感兴趣,所以就想系统学习一下,特此整理本篇文章作为入门指引。
GCC 编译流程
GCC,全称GNU Compiler Collection(GNU编译器套件),是由GNU项目开发的一款编译器软件,可以编译多种编程语言,包括C、C++、Objective-C、Fortran、Ada等。
图引自:https://www3.ntu.edu.sg/home/ehchua/programming/cpp/gcc_make.html
C/C++从代码到最终可执行程序的过程大致分为以下几个阶段:
- 预处理(Preprocessing):预处理器处理源代码中的预处理指令,如#define、#include等。预处理器会将#include指令包含的文件内容插入到该指令的位置,处理#define定义的宏等。预处理后的文件通常以.i为后缀。
- 编译(Compilation):编译器将预处理后的文件(.i文件)翻译成汇编语言。编译器会检查代码的语法,进行优化,然后生成汇编代码。生成的汇编代码文件通常以.s为后缀。
- 汇编(Assemble):汇编器将汇编代码转换为机器代码,生成目标文件。目标文件包含了程序的机器代码,但是这些代码可能还不能直接执行,因为它们可能还依赖于其他的目标文件或库。生成的目标文件通常以.o(在Unix-like系统中)或.obj(在Windows系统中)为后缀。
- 链接(Linking):链接器将一个或多个目标文件以及需要的库链接成一个可执行文件或库。链接器会解析目标文件之间的依赖关系,将依赖的目标文件或库链接在一起。如果目标文件之间存在未解决的依赖关系,链接器会报错。
最简单的例子:
//main.c
#include <stdio.h>
int main()
{
printf("Hello World!\n");
return 0;
}
- 预处理:通过
gcc -E main.c
命令可以看到预处理结果 - 编译:通过
gcc -S mian.c
命令可以生成汇编文件main.s
- 汇编:通过
gcc -c main.c
命令可以生成文件main.o
- 链接:通过
gcc main.o
可以生成a.out
可执行文件
编译工具链
编译工具链(Toolchain)是指一组用于将源代码转换为可执行文件或库的工具和程序。一个典型的编译工具链包括编译器、汇编器、链接器、库和调试器等组件。
- Windows 平台主要使用微软提供的工具链——MSVC。
- Linux 平台主要是GCC。
- MacOS 平台主要使用Clang 和 LLVM。
构建系统
随着项目工程越来越复杂,源代码文件越来越多,编译配置项根据场景的不同越来越复杂(例如,Debug模式和Release模式下编译参数不一样)的时候,依然通过直接调用这些命令的时候就会很复杂,我们需要编写大量复杂的命令行才能完成一个复杂项目的编译工作。基于这样的背景,我们诞生了构建系统(Build System)。
在Linux/Unix上的构建系统历史最悠久的就是make工具,而与之配合的就是Makefile配置文件。
Make是命令行工具,Makefiles 配置文件指明了项目中具有哪些源代码、编译的规则逻辑等信息。
当make执行的时候,读取Makefile配置文件,生成GCC相关的调用命令行,再调用GCC的相关命令行工具进行编译构建。
图片引自:https://www.cnblogs.com/w4ngzhen/p/17695080.html
构建系统在底层依赖使用的是编译工具链,只是进行了一定的用户友好的抽象,并降低了项目编译的复杂度。
跨平台构建系统工具
图参考:https://www.cnblogs.com/w4ngzhen/p/17695080.html
CMake 是C++ 中被广泛使用的开源构建系统工具,支持多种编译器和平台。它通过生成本地构建系统(如Makefiles、Visual Studio 项目文件等)来实现跨平台构建。
包管理器
早期阶段
在C++ 早期阶段,开发者主要依赖于手动管理库和依赖项。这通常包括下载源代码或预编译的二进制文件,然后将其集成到项目中。这种方式虽然灵活,但容易出错且难以维护。
Autotools 和 CMake
随着项目规模的扩大和复杂性的增加,构建系统如 Autotools 和 CMake 开始流行。这些工具帮助开发者自动化构建过程,但它们并不是包管理器。它们主要解决的是构建和配置问题,而不是依赖管理。
pkg-config
pkg-config 是一个用于管理编译和链接参数的工具,广泛用于 Unix 系统。虽然它简化了库的使用,但仍然需要手动安装和管理库。
Conan
Conan 是一个现代的、跨平台的 C++ 包管理器,旨在解决依赖管理问题。它支持多种构建系统(如 CMake、Autotools、MSBuild 等),并且可以与 CI/CD 管道集成。Conan 提供了一个中央仓库(Conan Center),开发者可以在其中发布和查找包。
vcpkg
vcpkg 是由微软开发的 C++ 包管理器,专注于简化库的获取和集成。它特别适合 Windows 平台,但也支持 Linux 和 macOS。vcpkg 提供了一个中央仓库,用户可以轻松地安装和管理库
Hunter
Hunter 是另一个 C++ 包管理器,基于 CMake。它通过 CMake 的外部项目功能来管理依赖项,适合那些已经使用 CMake 作为构建系统的项目。
Buckaroo
Buckaroo 是一个基于 Buck 构建系统的 C++ 包管理器。它旨在提供快速、可重复的构建,并支持跨平台开发
CPM
CPM 是一个基于 CMake 的轻量级包管理器,使用 CMake 的 FetchContent 模块来下载和管理依赖项。它适合那些希望最小化外部依赖的项目。
C++ 编译体系演进
总结
本文介绍了 C++ 编译体系从最早期的手工管理依赖,随着项目的复杂性增加演进成不同平台的本地构建系统,随着面对一致性与可维护性的问题发展出跨平台构建系统的工具,后面针对代码仓库的依赖管理的诉求又发展出包管理器。罗马并非一天建成,C++ 编译体系也随着软件工程的发展也逐步演进当中,我们可以针对不同业务诉求来选择相应的工具。通过了解编译体系的发展脉络,能对自己项目的编译构建问题有更深刻的理解,进而提升项目工程化组织能力,提升效能。
附录
- https://cmake.org/
- https://zh.wikipedia.org/zh-cn/CMake
- https://gavinliu6.github.io/CMake-Practice-zh-CN/#/foreword
- https://zhuanlan.zhihu.com/p/62083969
- https://www.cnblogs.com/w4ngzhen/p/17695080.html
- 程序员需要知道的C/C++编译知识
- modern c++ 的 编译工具链、包管理和坑 - mian的技术分享