环境变量
- 写在前面
- 概念
- 查看环境变量
- main函数的参数
- argc & argv
- env
- bash环境变量
写在前面
对于环境变量,本篇主要介绍基本概念及三四个环境变量 —— PATH、HOME、PWD。其中 PATH 作为 “ 敲门砖 ”,我们会更详细讲解;理解环境变量的全局属性 —— 环境变量是可以被子进程继承(注意区分 C++ 里的继承);环境变量的组织方式。其次会介绍命令行参数 —— main 函数的参数。
概念
环境变量一般是指在操作系统中用来指定操作系统运行环境的一些参数
我们在编写 C/C++ 代码的,在链接的时候,从来不知道我们的所链接的动态静态库在哪里,但是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找。
环境变量通常具有某些特殊用途,还有在系统当中通常具有全局特性。
LInux操作系统本身就是一个用C语言写的程序,操作系统可以在运行过程中开辟空间。环境变量的本质,就是在操作系统运行过程中,为自己开辟的空间,存储了一些重要的信息。
为了更好的理解环境变量的作用,现在我们先来思考一个问题,我们在执行指令的过程之中,可以直接输入指令的名字,但是我们自己写的可执行程序,一定要加上绝对路径或者相对路径才可以运行,这是为什么呢?
其实这个过程之中,环境变量的作用就显现出来了。
PATH
:一个环境变量,存储着多个路径,在这些路径下面的可执行程序,可以直接执行。
PATH
是我们讲解的第一个重要的环境变量,我们现在尝试观察这个环境变量。
echo $xxx
:查看xxx
环境变量的内容
可以看出这个环境变量是由多个路径组成的,每个路径由:
分开。
因此我们只需要把自己的可执行程序放在这里面某一个路径下面,我们自己写的可执行程序就也可以当作指令来执行了。而这个工作就是把自己写的软件安装到系统之中。
我们也可以想办法把自己的路径加到PATH
环境变量中。
xxx=
:修改环境变量的值
如果我们当前路径下有一个可执行程序test.exe
并且我们将其路径加到了PATH
中,那么我们就可以直接执行这个程序,但是原来PATH
中的内容会被我们的修改直接覆盖。导致原有的ls,pwd,mkdir
等等指令全部执行不了了。但是不用惊慌,我们只需要关闭xshell
,然后重启,此时PATH
就会恢复原先的值。
我们再来看看几个常用的的环境变量。
USER
:记录当前的用户
PWD
:记录当前路径
HOME
:记录家目录
我们还可以自己定义一些环境变量:
export xxx=
:定义xxx
环境变量
不过我们自己定义的环境变量在重新启动的时候也会失效。
还有一个与环境变量相关的重要指令。
env:输出所有环境变量。
展示部分如下。
查看环境变量
通过之前的认识,我们知道可以通过env
来查看所有的环境变量,也可以通过echo $xxx
查看单个环境变量,但是这些都是在命令行中操作的,如果我们想在可执行程序中查看需要如何做呢?
- getenv
getenv
是一个函数,其定义在<stdlib.h>
中。功能是:输入一个字符串作为参数,该函数输出该字符串对应的环境变量的内容。
当前test.exe程序内容如下:
#include <stdio.h>
#include <stdlib.h>
int main()
{
const char* path = getenv("PATH");
const char* home = getenv("HOME");
printf("PATH = %s\n", path);
printf("HOME = %s\n", home);
return 0;
}
main函数的参数
也许你或许听说过,main
函数也是有参数的,但是在学习C/C++
的过程中,这个参数好像可写可不写,学习环境后,我们就可以了解一下这些变量的意义是什么了。
argc & argv
main的前两参数分别是argc和argv,传参形式如下:
int main(int argc, char* argv[])
{}
可见,argc
是int
类型的变量,而argv
是一个char*
的数组。还记得我们刚刚的env
指令内容吗?其实它们两个的结构是一样的。argv
每个元素都是char*
类型,分别指向一个字符串,argv
的最后一个元素也是NULL
,用于标识argv
的数组结尾。而argc
代表了argv
中元素的个数,所以我们既可以通过NULL
来判断argv
结尾,也可以通过argc
来判断结尾。在test
中执行如下代码,来看看argv
中存储了什么:
#include <stdio.h>
int main(int argc, char* argv[])
{
for(int i = 0; i < argc; i++)
{
printf("argv[%d]: %s\n", i, argv[i]);
}
return 0;
}
现在argv中只有一个元素,即字符串"./test.exe"
。
给./test.exe加几个选项试试,./test.exe -a -b -c
可以得出argv参数内部,存储的是调用可执行程序时,输入的选项。
通过argv
存储的内容我们就可以根据不同选项执行不同的内容。
#include <stdio.h>
#include <string.h>
#include <stdbool.h>
int main(int argc, char* argv[])
{
bool flagA = false, flagB = false, flagC = false;
for(int i = 0 ; i < argc; i++)
{
if (strcmp(argv[i], "-a") == 0)
flagA = true;//说明输入了-a选项
else if (strcmp(argv[i], "-b") == 0)
flagB = true;//说明输入了-b选项
else if (strcmp(argv[i], "-c") == 0)
flagC = true;//说明输入了-c选项
}
printf("正在执行 test.exe\n");
if(flagA)
printf("功能a执行中...\n");
if(flagB)
printf("功能b执行中...\n");
if(flagC)
printf("功能c执行中...\n");
return 0;
}
我们使用的绝大多数指令都是有很多选项的,我们通过输入不同的选项,让程序执行不同的功能,而程序就是通过识别argv
,来判断用户输入了哪些选项,进而执行特定的功能的。
在我们向bash
输入一大段指令的时候,指令本质就是一个字符串,bash
会把字符串拆解为一个个小小的字符串,然后把他们整合到一个叫做命令行参数表
的东西中,命令行参数表
其实就是一个指针数组,而argv
参数可以接收bash
维护的数组,在程序内部使用。
env
main函数的第三个参数叫做env
,其实它也是一个char*
类型的指针数组,类型为char**
。
int main(int argc, char* argv[], char* env[])
{}
这个参数和指令env
的内容完全一致的。存储了所有环境变量,并且以NULL结尾。
#include <stdio.h>
int main(int argc, char* argv[], char* env[])
{
for(int i = 0; env[i] != NULL; i++)
{
printf("env[%d]: %s\n", i, env[i]);
}
return 0;
}
bash环境变量
其实环境变量是可以继承的,可以通过下面的代码证明。
#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>
int main(int argc, char* argv[], char* env[])
{
pid_t id = fork();
if(id == 0)//子进程
{
for(int i = 0; i < 3; i++)
{
printf("child: env[%d]: %s\n", i, env[i]);
}
}
else//父进程
{
for(int i = 0; i < 3; i++)
{
printf("father: env[%d]: %s\n", i, env[i]);
}
}
return 0;
}
通过fork
创建了一个子进程,然后父子进程分别输出env这个数组中的前三个字符串。
输出结果:
可以看到父子进程都可以正常使用env
,说明子进程是可以继承父进程的环境变量表的。而在所有命令行调用的进程中,都是bash
的子进程,因此我们的在命令行调用的进程可以继承bash的环境变量表
。只有我们登录了系统的时候,bash才会被创建,之前我们就知道,bash要维护一张环境变量表,那么bash的环境变量是怎么来的?其实这些环境变量是存储的在磁盘上的,而我们启动bash
的时候,会把这些环境变量从磁盘上拷贝到内存
中,组成一张环境变量表,我们访问环境变量实际上是在访问内存中的环境变量,我们修改环境变量实际上也是在修改内存中的环境变量,不会影响磁盘中的环境变量。
因此当我们重新启动Xhell时,bash都会重新从磁盘中拷贝一次环境变量,这样我们之前所做的修改或者自己添加的环境变量都会被覆盖重置
另:在家目录中,有一个叫做.bash_profile
的隐藏文件 ,其内部存储的就是环境变量。这个就是我们每次重新启动从磁盘拷贝环境变量的文件内容。