linux 进程补充

环境变量


 基本概念
环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数
如:我们在编写C/C++代码的时候,在链接的时候,从来不知道我们的所链接的动态静态库在哪
里,但是照样可以链接成功,生成可执行程序,原因就是有相关环境变量帮助编译器进行查找。
环境变量通常具有某些特殊用途,还有在系统当中通常具有全局特性

常见环境变量

  • PATH : 指定命令的搜索路径
  • HOME : 指定用户的主工作目录(即用户登陆到Linux系统中时,默认的目录)
  • SHELL : 当前Shell,它的值通常是/bin/bash。 

查看环境变量方法
echo $NAME //NAME:你的环境变量名称

命令行传参数

#include <stdio.h>
int main(int argc, char *argv[], char *env[])
{
int i = 0;
for(; env[i]; i++){
printf("%s\n", env[i]);
}
return 0;
}

命令行参数可以通过选项来执行不同的子功能 

 #include<stdio.h>
    2 #include<string.h>
W>  3 int main(int argc,char *argv[])
    4 {
    5 if(argc!=2)
    6 {
    7   printf("usage:%s [-a|-b|-c]\n",argv[0]);
    8 
    9 }
   10 const char *arg=argv[1];
   11 if(strcmp(arg,"-a")==0) printf("这是-a选项 功能1\n");
   12 else if(strcmp(arg,"-b")==0)printf("这是-b选项 功能2\n");
   13 else if(strcmp(arg,"-c")==0)printf("这是-c选项 功能3\n");
   14 else printf("usage:%s [-a|-b|-c]\n",argv[0]);                                                                                                                                          
   15   return 0;                                                                                                                                         
   16 }

 所以类比一下:main函数也是一个进程,所带的命令行参数由bash切分,main函数的命令行参数int main(int argc, char *argv[], char *env[])所带的选项是实现程序不同子功能的方法

进程拥有一张表,argv表,用来支持选项功能!

测试HOME

 其实Linux里面的指令都是二进制文件,然后再链接我们总结写的文件,最后汇到一块一起运行,要运行一个二进制文件,必须先找到它 ./是在文件树下找,但是我把二进制拷贝到home下,系统默认的路径下我们不带./也能跑,这也是其他指令的由来

系统中存在环境变量,来帮助找到二进制文件 就是PATH 系统默认的搜索路径!

测试PATH 

  • 直接覆盖路径

 将二进制文件code的路径覆盖原先的path路径,code可以跑,但是原先的指令跑不了了,因为原先的路径找不到了

  • 添加路径

 这种是在原先路径下加一条路径,自带命令和code都能跑,但是这种不易加太多,自己写的二进制没有经过时间及用户的沉淀一般bug较多,写进去也没关系,以上两种重启xshell就自动复原了

理解argv表 

在bath进程启动的时候,在它自己内部构建出一张表,在用户输入指令时首先被bath拿到,被拆分成若干个字符串放在argv[0],argv[1],argv[3]...指针数组argv指向他们,bath通过argv【0】下的程序名字找到path下的二进制来运行

所以,在bath内部下,有两张表,一个是环境变量表(path),一个是命令行参数表(argv) 

 环境变量的组织方式

 每个程序都会收到一张环境表,环境表是一个字符指针数组,每个指针指向一个以’\0’结尾的环境
字符串

和环境变量相关的命令

  • echo: 显示某个环境变量值
  • export: 设置一个新的环境变量
  • env: 显示所有环境变量
  • unset: 清除环境变量
  • set: 显示本地定义的shell变量和环境变量 

通过代码如何获取环境变量

  • 命令行第三个参数
 #include<stdio.h>
  2 #include<string.h>
  3 int main(int argc,char *argv[],char * env[])
  4 {
  5 (void)argc;
  6 (void)argv;
  7 
  8 for(int i=0;env[i];i++)
  9 {
 10   printf("env[%d]->%s\n",i,env[i]);                                                                                                                                                      
 11 
 12 }
 13   return 0;
 14 }
  •  通过第三方变量environ获取
#include <stdio.h>
int main(int argc, char *argv[])
{
extern char **environ;
int i = 0;
for(; environ[i]; i++){
printf("%s\n", environ[i]);
}
return 0;
}

libc中定义的全局变量environ指向环境变量表,environ没有包含在任何头文件中,所以在使用时 要用
extern声明。

通过系统调用获取或设置环境变量

  • export

获取的是父进程的环境变量,可通过export来新添加环境变量,环境变量可以通过子进程来继承

 

  •  getenv 

通过名字获取环境变量,获取成功返回起始变量地址,否则就是NULL

#include <stdio.h>
#include <stdlib.h>
int main()
{
printf("%s\n", getenv("PATH"));
return 0;
}

 环境变量通常是具有全局属性的
环境变量通常具有全局属性,可以被子进程继承下去

bath有两套变量

  • 本地变量

只在bash内被使用,不会被子进程继承

  • 环境变量 

环境变量在谁里面?bash!

#include <stdio.h>
#include <stdlib.h>
int main()
{
char *env = getenv("MYENV");
if(env){
printf("%s\n", env);
}
return 0;
}

运行结果啥也没有 ,说明该环境变量根本不存在

 导出环境变量 export MYENV="hello world"

注意:环境变量是可以被子进程继承下去的 ,内建命令有bash自己去执行,其他的都是调用子进程

程序地址空间

我们在讲C语⾔的时候,老师给大家画过这样的空间布局图

可是我们对他并不理解!可以先对其进行各区域分布验证 

 #include <stdio.h>
    2 #include <unistd.h>
    3 #include <stdlib.h>
    4 
E>  5 int g_unval;//未初始化全局变量
    6 int g_val = 100;//已初始化全局变量
    7 int main(int argc, char *argv[], char *env[])//命令行参数环境变量
    8 {
    9 const char *str = "helloworld";//临时变量
   10                                                                                                                                                                         
   11 printf("code addr: %p\n", main);                                                                                      
   12 printf("init global addr: %p\n", &g_val);                                                                             
   13 printf("uninit global addr: %p\n", &g_unval);                                                                         
   14                                                                                                 
   15                                                                                                               
   16 static int test = 10;//静态常量                                                                                       
   17 char *heap_mem = (char*)malloc(10);                                                                                   
   18 char *heap_mem1 = (char*)malloc(10);                                                                                  
   19 char *heap_mem2 = (char*)malloc(10);                                                                                  
   20 char *heap_mem3 = (char*)malloc(10);                                                                                  
   21 printf("heap addr: %p\n", heap_mem); //heap_mem(0), &heap_mem(1)                                                      
   22 printf("heap addr: %p\n", heap_mem1); //heap_mem(0), &heap_mem(1)                                                     
   23 printf("heap addr: %p\n", heap_mem2); //heap_mem(0), &heap_mem(1)                                                     
   24 printf("heap addr: %p\n", heap_mem3); //heap_mem(0), &heap_mem(1)                                                     
   25 printf("test static addr: %p\n", &test); //heap_mem(0), &heap_mem(1)                                                  
   26 printf("stack addr: %p\n", &heap_mem); //heap_mem(0), &heap_mem(1)                                                    
   27 printf("stack addr: %p\n", &heap_mem1); //heap_mem(0), &heap_mem(1)                                                  
   28 printf("stack addr: %p\n", &heap_mem2); //heap_mem(0), &heap_mem(1)                                                  
   29 printf("stack addr: %p\n", &heap_mem3); //heap_mem(0), &heap_mem(1)                                                  
   30 printf("read only string addr: %p\n", str);                                                                          
   31 for(int i = 0 ;i < argc; i++)                                                                                        
   32 {                                                                                                                    
   33 printf("argv[%d]: %p\n", i, argv[i]);                                                                                
   34 }                                                                                                                    
   35 for(int i = 0; env[i]; i++)                                                                                          
   36 {                                                                                                                    
   37 printf("env[%d]: %p\n", i, env[i]);                                                                                  
   38 }                                                                                                                    
   39 return 0;                                                                                                            
   40 }                                                                                                                    
  ~     

虚拟地址

 #include <stdio.h>
  2 #include <unistd.h>
  3 #include <stdlib.h>
  4 int gval =100;
  5 int main()
  6 {
  7 
  8 pid_t id =fork();
  9 if(id==0)
 10 {
 11 while(1)
 12 {
 13 printf("子 gval:%d,&gval:%p,pid:%d ppid:%d\n",gval,&gval,getpid(),getppid());
 14 sleep(1);
 15 gval++;
 16 }
 17 }
 18 else
 19 {
 20   while(1)
 21   {
 22  printf("父 gval:%d,&gval:%p,pid:%d ppid:%d\n",gval,&gval,getpid(),getppid());                                                                                                           
 23 sleep(1);
 24 
 25   }
 26 }
 27 return 0;
 28 }

 父进程2847,子进程2848,父进程gval一直是100,而子进程gval不断叠加,但是地址却一样这是为什么呢?

变量内容不一样,所以父子进程输出的变量绝对不是同一个变量,如果打印的地址是内存地址,就出bug了,说明这个地址不是内存地址,而是虚拟地址!C/C++用到的地址全部是虚拟地址,只是为了映射关系OS搞出的一套逻辑而已!

OS必须负责将 虚拟地址 转化成 物理地址 。

 进程地址空间

所以之前说‘程序的地址空间’是不准确的,准确的应该说成 进程地址空间 ,那该如何理解呢?看
图:

分页&虚拟地址空间

每个进程都有页表这个东西,里面存着数据的映射关系,打印的虚拟地址起始是页表中的地址,采用红黑树,类比哈希表的映射方式

子进程发生写实拷贝,将父亲的页表也拷贝过来,页表是存着映射关系,子进程继承了父进程的映射关系,拷贝了一份页表,从此,父子毫不相干,各自操作各自的页表,从此独立,可以完全被子进程继承!

虚拟内存管理

描述linux下进程的地址空间的所有的信息的结构体是 mm_struct (内存描述符)。每个进程只有一个mm_struct结构,在每个进程的task_struct结构中,有一个指向该进程的结构。

struct task_struct
{
/*...*/
struct mm_struct
*mm; //对于普通的⽤⼾进程来说该字段指向他的
虚拟地址空间的⽤⼾空间部分,对于内核线程来说这部分为NULL。
struct mm_struct
*active_mm; // 该字段是内核线程使⽤的。当该
进程是内核线程时,它的mm字段为NULL,表⽰没有内存地址空间,可也并不是真正的没有,这是因为所
有进程关于内核的映射都是⼀样的,内核线程可以使⽤任意进程的地址空间。
/*...*/
}

 可以说,mm_struct结构是对整个用户空间的描述。每一个进程都会有自己独立的mm_struct,这样每一个进程都会有自己独里的地址空间才能互不干扰。先来看看由task_struct到mm_struct,进程的地址空间的分布情况:

 定位mm_struct文件所在位置和task_struct所在路径是⼀样的,不过他们所在文件是不一样的,
mm_struct所在的文件是mm_types.h。

struct mm_struct
{
/*...*/
struct vm_area_struct *mmap;
/* 指向虚拟区间(VMA)链表 */
struct rb_root mm_rb;
/* red_black树 */
unsigned long task_size;
/*具有该结构体的进程的虚拟地址空间的⼤⼩*/
/*...*/
// 代码段、数据段、堆栈段、参数段及环境段的起始和结束地址。
unsigned long start_code, end_code, start_data, end_data;
unsigned long start_brk, brk, start_stack;
unsigned long arg_start, arg_end, env_start, env_end;
/*...*/
 }

那既然每⼀个进程都会有自己独立的mm_struct,操作系统肯定是要将这么多进程的mm_struct组织起来的!虚拟空间的组织方式有两种:
1. 当虚拟区较少时采取单链表,由mmap指针指向这个链表;
2. 当虚拟区间多时采取红黑树进行管理,由mm_rb指向这棵树。
linux内核使用 vm_area_struct 结构来表示一个独立的虚拟内存区域(VMA),由于每个不同质的虚
拟内存区域功能和内部机制都不同,因此一个进程使用多个vm_area_struct结构来分别表示不同类型的虚拟内存区域。上面提到的两种组织方式使用的就是vm_area_struct结构来连接各个VMA,⽅便进程快速访问。

struct vm_area_struct {
unsigned long vm_start; //虚存区起始
unsigned long vm_end;
//虚存区结束
struct vm_area_struct *vm_next, *vm_prev;
//前后指针
struct rb_node vm_rb;
//红⿊树中的位置
unsigned long rb_subtree_gap;
struct mm_struct *vm_mm;
//所属的 mm_struct
pgprot_t vm_page_prot;
unsigned long vm_flags;
//标志位
struct {
struct rb_node rb;
unsigned long rb_subtree_last;
} shared;
struct list_head anon_vma_chain;
struct anon_vma *anon_vma;
const struct vm_operations_struct *vm_ops; //vma对应的实际操作
unsigned long vm_pgoff;
//⽂件映射偏移量
struct file * vm_file;
//映射的⽂件
void * vm_private_data;
//私有数据
atomic_long_t swap_readahead_info;
#ifndef CONFIG_MMU
struct vm_region *vm_region;
/* NOMMU mapping region */
#endif
#ifdef CONFIG_NUMA
struct mempolicy *vm_policy;
/* NUMA policy for the VMA */
#endif
struct vm_userfaultfd_ctx vm_userfaultfd_ctx;
} __randomize_layout;

所以我们可以对上图在进行更细致的描述,如下图所示:

 

为什么要有虚拟地址空间 

这个问题其实可以转化为:如果程序直接可以操作物理内存会造成什么问题?

在早期的计算机中,要运行一个程序,会把这些程序全都装入内存,程序都是直接运行在内存上的,也就是说程序中访问的内存地址都是实际的物理内存地址。当计算机同时运行多个程序时,必须保证这些程序用到的内存总量要小于计算机实际物理内存的大小。
那当程序同时运行多个程序时,操作系统是如何为这些程序分配内存的呢?例如某台计算机总的内存大小是128M,现在同时运行两个程序A和B,A需占用内存10M,B需占用内存110。计算机在给程序分配内存时会采取这样的方法:先将内存中的前10M分配给程序A,接着再从内存中剩余的118M中划分出110M分配给程序B。

 这种分配方法可以保证程序A和程序B都能运行,但是这种简单的内存分配策略问题很多。

安全风险

  • 每个进程都可以访问任意的内存空间,这也就意味着任意⼀个进程都能够去读写系统相关内存区域,如果是⼀个木马病毒,那么他就能随意的修改内存空间,让设备直接瘫痪。

地址不确定

  • 众所周知,编译完成后的程序是存放在硬盘上的,当运行的时候,需要将程序搬到内存当中去运行,如果直接使用物理地址的话,我们无法确定内存现在使用到哪里了,也就是说拷贝的实际内存地址每一次运行都是不确定的,比如:第一次执行a.out时候,内存当中一个进程都没有运行,所以搬移到内存地址是0x00000000,但是第二次的时候,内存已经有10个进程在运行了,那执行a.out的时候,内存地址就不⼀定了

效率低下

  • 如果直接使用物理内存的话,一个进程就是作为一个整体(内存块)操作的,如果出现物理内存不够用的时候,我们一般的办法是将不常用的进程拷贝到磁盘的交换分区中,好腾出内存,但是如果是物理地址的话,就需要将整个进程⼀起拷走,这样,在内存和磁盘之间拷贝时间太长,效率较低。

存在这么多问题,有了虚拟地址空间和分页机制就能解决了吗?当然!

  • 地址空间和页表是OS创建并维护的!是不是也就意味着,凡是想使用地址空间和页表进行映射,也⼀定要在OS的监管之下来进行访问!!也顺便保护了物理内存中的所有的合法数据包括各个进程以及内核的相关有效数据!
  • 因为有地址空间的存在和页表的映射的存在,我们的物理内存中可以对未来的数据进行任意位置的加载!物理内存的分配和进程的管理就可以做到没有关系,进程管理模块和内存管理模块就完成了解耦合。(因为有地址空间的存在,所以我们在C、C++语言上new, malloc空间的时候,其实是在地址空间上申请的,物理内存可以甚至一个字节都不给你。而当你真正进行对物理地址空间访问的时候,才执行内存的相关管理算法,帮你申请内存,构建页表映射关系(延迟分配),这是由操作系统自动完成,用户包括进程完全0感知!!)
  • 因为页表的映射的存在,程序在物理内存中理论上就可以任意位置加载。它可以将地址空间上的虚拟地址和物理地址进行映射,在进程视角所有的内存分布都可以是有序的

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/965018.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

一文解释pytorch 中的 squeeze() 和 unsqueeze()函数(全网最详细版)

&#x1f308; 个人主页&#xff1a;十二月的猫-CSDN博客 &#x1f525; 系列专栏&#xff1a; &#x1f3c0;零基础入门PyTorch框架_十二月的猫的博客-CSDN博客 &#x1f4aa;&#x1f3fb; 十二月的寒冬阻挡不了春天的脚步&#xff0c;十二点的黑夜遮蔽不住黎明的曙光 目录 …

QT:对象树

1.概念 Qt 中的对象树是一种以树形结构组织 Qt 对象的方式。当创建一个QObject&#xff08;Qt 中大多数类的基类&#xff09;或其派生类的对象时&#xff0c;可以为其指定一个父对象&#xff08;parent&#xff09;。这个对象就会被添加到其父对象的子对象列表中&#xff0c;形…

labview通过时间计数器来设定采集频率

在刚接触labview的时候&#xff0c;笔者通常用定时里的等待函数来实现指令的收发&#xff0c;但是当用到的收发消息比较多时就出现了卡顿&#xff0c;卡死的情况&#xff0c;这是因为当用队列框架时&#xff0c;程序卡在了其中的一个分支里&#xff0c;等通过相应的延时后才可以…

2024最新前端面试题(附答案及解析)

文章目录 HTML篇1、HTML5有哪些新特性&#xff1f;2、介绍下 BFC 及其应用3、内元素和块级元素的区别&#xff1f;4、Doctype作用&#xff1f;标准模式与混杂模式如何区分&#xff1f;5、引入样式时&#xff0c;link和import的区别&#xff1f;6、介绍一下你对浏览器内核的理解…

Linux:文件系统(软硬链接)

目录 inode ext2文件系统 Block Group 超级块&#xff08;Super Block&#xff09; GDT&#xff08;Group Descriptor Table&#xff09; 块位图&#xff08;Block Bitmap&#xff09; inode位图&#xff08;Inode Bitmap&#xff09; i节点表&#xff08;inode Tabl…

Java基础面试题50题

1&#xff0c;""空字符串的作用 package com.neuedu.nineteen;public class Test {public static void main(String[] args) {String s"";for (char i a; i < d; i) {ssi;//输出abc // sis;//输出cba}System.out.println(s);} }如题所示&…

【技海登峰】Kafka漫谈系列(二)Kafka高可用副本的数据同步与选主机制

【技海登峰】Kafka漫谈系列(二)Kafka高可用副本的数据同步与选主机制 一. 数据同步 在之前的学习中有了副本Replica的概念,解决了数据备份的问题。我们还需要面临一个设计难题即:如何处理分区中Leader与Follwer节点数据同步不匹配问题所带来的风险,这也是保证数据高可用的…

GB/T 44721-2024 与 L3 自动驾驶:自动驾驶新时代的基石与指引

1.前言 在智能网联汽车飞速发展的当下&#xff0c;自动驾驶技术成为了行业变革的核心驱动力。从最初的辅助驾驶功能&#xff0c;到如今不断迈向高度自动化的征程&#xff0c;每一步都凝聚着技术的创新与突破。而在这一进程中&#xff0c;标准的制定与完善对于自动驾驶技术的规…

大语言模型的个性化综述 ——《Personalization of Large Language Models: A Survey》

摘要&#xff1a; 本文深入解读了论文“Personalization of Large Language Models: A Survey”&#xff0c;对大语言模型&#xff08;LLMs&#xff09;的个性化领域进行了全面剖析。通过详细阐述个性化的基础概念、分类体系、技术方法、评估指标以及应用实践&#xff0c;揭示了…

SpringBoot使用 easy-captcha 实现验证码登录功能

文章目录 一、 环境准备1. 解决思路2. 接口文档3. redis下载 二、后端实现1. 引入依赖2. 添加配置3. 后端代码实现4. 前端代码实现 在前后端分离的项目中&#xff0c;登录功能是必不可少的。为了提高安全性&#xff0c;通常会加入验证码验证。 easy-captcha 是一个简单易用的验…

国产编辑器EverEdit - 工具栏说明

1 工具栏 1.1 应用场景 当用户想显示/隐藏界面的标签栏、工具栏、状态栏、主菜单等界面元素时&#xff0c;可以通过EverEdit的菜单选项进行设置。 1.2 使用方法 选择菜单查看 -> 工具栏&#xff0c;在工具栏的子菜单中选择勾选或去掉勾选对应的选项。 标签栏&#xff1…

Redis的通用命令

⭐️前言⭐️ 本文主要介绍Redis的通用命令 &#x1f349;欢迎点赞 &#x1f44d; 收藏 ⭐留言评论 &#x1f349;博主将持续更新学习记录收获&#xff0c;友友们有任何问题可以在评论区留言 &#x1f349;博客中涉及源码及博主日常练习代码均已上传GitHub &#x1f4cd;内容导…

机器学习专业毕设选题推荐合集 人工智能

目录 前言 毕设选题 开题指导建议 更多精选选题 选题帮助 最后 前言 大家好,这里是海浪学长毕设专题! 大四是整个大学期间最忙碌的时光&#xff0c;一边要忙着准备考研、考公、考教资或者实习为毕业后面临的升学就业做准备,一边要为毕业设计耗费大量精力。学长给大家整理…

Elasticsearch:如何搜索含有复合词的语言

作者&#xff1a;来自 Elastic Peter Straer 复合词在文本分析和标记过程中给搜索引擎带来挑战&#xff0c;因为它们会掩盖词语成分之间的有意义的联系。连字分解器标记过滤器等工具可以通过解构复合词来帮助解决这些问题。 德语以其长复合词而闻名&#xff1a;Rindfleischetik…

【后端开发】系统设计101——通信协议,数据库与缓存,架构模式,微服务架构,支付系统(36张图详解)

【后端开发】系统设计101——通信协议&#xff0c;数据库与缓存&#xff0c;架构模式&#xff0c;微服务架构&#xff0c;支付系统&#xff08;36张图&#xff09; 文章目录 1、通信协议通信协议REST API 对比 GraphQL&#xff08;前端-web服务&#xff09;grpc如何工作&#x…

Spark--如何理解RDD

1、概念 rdd是对数据集的逻辑表示&#xff0c;本身并不存储数据&#xff0c;只是封装了计算逻辑&#xff0c;并构建执行计划&#xff0c;通过保存血缘关系来记录rdd的执行过程和历史&#xff08;当一个rdd需要重算时&#xff0c;系统会根据血缘关系追溯到最初的数据源&#xff…

0205算法:最长连续序列、三数之和、排序链表

力扣128&#xff1a;最长连续序列 给定一个未排序的整数数组 nums &#xff0c;找出数字连续的最长序列&#xff08;不要求序列元素在原数组中连续&#xff09;的长度。 请你设计并实现时间复杂度为 O(n) 的算法解决此问题。 class Solution {public int longestConsecutive(in…

gitea - fatal: Authentication failed

文章目录 gitea - fatal: Authentication failed概述run_gitea_on_my_pkm.bat 笔记删除windows凭证管理器中对应的url认证凭证启动gitea服务端的命令行正常用 TortoiseGit 提交代码备注END gitea - fatal: Authentication failed 概述 本地的git归档服务端使用gitea. 原来的用…

【数学】矩阵、向量(内含矩阵乘法C++)

目录 一、前置知识&#xff1a;向量&#xff08;一列或一行的矩阵&#xff09;、矩阵1. 行向量2. 列向量3. 向量其余基本概念4. 矩阵基本概念5. 关于它们的细节 二、运算1. 转置&#xff08;1&#xff09;定义&#xff08;2&#xff09;性质 2. 矩阵&#xff08;向量&#xff0…

算法与数据结构(合并K个升序链表)

思路 有了合并两个链表的基础后&#xff0c;这个的一种方法就是可以进行顺序合并&#xff0c;我们可以先写一个函数用来合并两个链表&#xff0c;再在合并K个链表的的函数中循环调用它。 解题过程 解析这个函数 首先&#xff0c;可以先判断&#xff0c;如果a为空&#xff0c…