纯理论容器实现的原理

近期在复习容器的原理,希望这篇文章可以帮助到大家。

一、什么是容器?

        容器本质上就是主机上的一个进程。这个进程拥有自己的用户空间并且和主机共享内核空间。

        容器内的进程可以通过系统调用与内核进行交互,使用内核提供的各种功能和资源。

扩展:什么是内核空间以及用户空间?

        Linux 操作系统分为内核空间(Kernel Space)和用户空间(User Space)。内核空间是由操作系统内核使用的内存区域,用于执行核心功能,如设备驱动、内存管理、进程调度等。用户空间则是给用户程序提供的运行环境,用户程序在用户空间中运行,通过系统调用(system call)与内核空间进行交互。

二、namespace是什么?

        1、Namespace简介

Namespace是Linux基于内核实现的资源视图隔离功能,使得不同Namespace的资源彼此不可见。

        2、容器常见的隔离如下:      

  1. PID Namespace(进程隔离): 每个容器都拥有自己的 PID Namespace,使得容器内的进程只能看到自己所属的 PID 命名空间中的进程,从而实现进程的隔离。

  2. Network Namespace(网络隔离): 每个容器都有自己的 Network Namespace,使得容器内的网络栈与宿主机的网络栈相互隔离,每个容器拥有自己的网络接口、IP 地址、路由表等网络资源,从而实现网络的隔离。

  3. Mount Namespace(文件系统隔离): 每个容器都有自己的 Mount Namespace,使得容器内的文件系统与宿主机的文件系统相互隔离,每个容器拥有自己的根文件系统,可以挂载自己的文件系统,从而实现文件系统的隔离。

  4. UTS Namespace(主机名与域名隔离): 每个容器都有自己的 UTS Namespace,使得容器内的主机名与域名与宿主机相互隔离,每个容器拥有自己的主机名和域名,从而实现主机名与域名的隔离。

    1. 重点:

      上述隔离都可以通过很简单的实验来证明。创建容器执行:ps -aux、查看userid、查看ifconfig、查看自己的目录是否和主机的文件目录内容相同、以及修改主机名是否对主机有影响。

三、怎么理解联合文件系统?

        联合文件系统也是容器镜像的文件系统,打包时每一层均作为可读层(LowerDir),如果修改复制可读层到可写层(UpperDir)镜像修改,可读层不可变,用户看到的是可读和可写层合并后的Rootfs.

在Docker中,联合文件系统被广泛应用于容器的镜像管理中。下面是Docker中涉及到的几个重要概念:

  1. LowerDir:LowerDir是指联合文件系统中底层的只读文件系统层。在Docker中,LowerDir通常指的是镜像的分层文件系统,即容器的基础镜像和其上的其他镜像层。

  2. UpperDir:UpperDir是指联合文件系统中的可写层,用于保存容器的修改或新增的文件。在Docker中,UpperDir存储的是容器运行时产生的文件变化。

  3. MergedDir:MergedDir是LowerDir和UpperDir合并后形成的联合文件系统的可见部分。在MergedDir中,会包含LowerDir和UpperDir中的文件,以及它们的修改和新增。

  4. WorkDir:WorkDir是联合文件系统的工作目录,用于处理文件系统的合并操作。在Docker中,WorkDir通常指的是容器运行时的临时工作目录。

  5. Rootfs:Rootfs是指容器的根文件系统,即容器中的文件系统树的顶层目录。在Docker中,Rootfs是由LowerDir和UpperDir合并而成的,它包含了容器中所有的文件和目录。​​​​​​​

四、什么是Mount namespace?

  1. 简单的说就是将目录的挂载点挂载通过系统调用Clone将新的mnt namespace挂载到新的namespace中,来隔离挂点。​​​​​​​

五、怎么实现进程有自己独立的Rootfs?

5.1 容器这个进程为什么有自己的Rootfs?

  1.         因为容器镜像文件系统驱动overlay2以及Mount namespace结合使用来实现进程拥有自己namespace级别的的Rootfs.

        首先容器镜像是基于层级,一层一层只读层叠加最后合并组合为一个镜像。技术叫做联合文件系统,驱动名称为overlay2,在主机上的呈现为一个一个独立的目录。(每一层镜像可读层就是一个目录),编写dockerfile中每一个命令。RUN、COPY、CMD都是一层。

六、容器是怎么挂载和使用主机的Dir的?

        当容器启动时,会使用overlay2存储驱动将容器的LowerDir、UpperDir、WorkDir、MergedDir镜像合并,组成容器的Rootfs(进入容器后看到的就是Rootfs文件系统加上隔离的namespace容器的用户空间),并且在 Docker 中,当你使用 -v 或 --volume 参数将主机上的目录挂载到容器中时,Docker 实际上会在容器的 mount namespace 中创建一个新的挂载点,将主机上的目录挂载到这个新的挂载点上。这样,容器内的进程就能够通过这个挂载点来访问主机上的目录,实现文件共享和交互。

七、Docker 容器运行时组件的简要描述:

1. **Docker Client(Docker 客户端):**
   - Docker 客户端是用户与 Docker 交互的主要方式之一,它可以通过命令行或者 API 来与 Docker 交互。
   - Docker 客户端可以连接到 Docker 守护进程(Dockerd)并发送命令来管理容器、镜像、网络等资源。
   - Docker 客户端可以与 Docker 守护进程通过 REST API 或者 Unix 套接字进行通信。

2. **Dockerd(Docker 守护进程):**
   - Dockerd 是 Docker 的守护进程,负责管理容器的生命周期、镜像的存储和分发、网络的管理等。
   - Dockerd 通过监听 REST API 的请求来接收来自 Docker 客户端的命令,并执行相应的操作。
   - Dockerd 也可以与其他容器运行时组件,如 Containerd,进行交互。

3. **Containerd:**
   - Containerd 是一个用于管理容器生命周期的守护进程,是 Docker 中的一个核心组件。
   - Containerd 负责管理容器的创建、运行、暂停、停止、删除等操作,以及容器与宿主机资源的隔离。
   - Containerd 提供了 REST API,允许其他组件(如 Dockerd)通过 REST API 调用它的功能。

4. **Runc:**
   - Runc 是一个用于运行容器的工具,是 Open Container Initiative(OCI)规范的实现之一。
   - Runc 负责根据 OCI 规范创建和运行容器,它使用 Linux 的原生功能,如 cgroups、namespace 等来实现容器的隔离和运行。
   - Dockerd 使用 Runc 来启动容器,它通过调用 Runc 的接口来创建和管理容器的生命周期。

       下面是创建容器各个组件的交付:

  • Docker Client 使用 Unix 套接字或者 REST API 与 Dockerd 守护进程通信,向 Dockerd 发送命令以管理容器和其他 Docker 资源。

  • Dockerd 守护进程接收来自 Docker Client 的命令,并根据这些命令调用 Containerd 来管理容器的生命周期。

  • Containerd 负责实际的容器管理,包括创建、运行、停止、删除等操作。它通过 REST API 与 Dockerd 通信,接收来自 Dockerd 的命令。

  • 重点:

  • 当 Containerd 需要创建容器时,它会调用 Runc 来实际运行容器。Runc 使用系统调用(如 clone())来创建新的容器进程,并根据需要分配新的命名空间等资源。

八、虽然容器和主机使用不同的namespace,但他们使用相同的主机上的内核空间,就以为着他们共享主机上的物理计算资源。怎么做限制的?

        8.1 Cgroup简单介绍   

Cgroup(Control Groups)是 Linux 内核提供的一个功能,用于管理和限制进程对系统资源的使用。它主要用于计费、监视和限制进程对 CPU、内存、存储 IO、网络 IO 等资源的使用。

Cgroup 使用树状结构来组织资源的管理,每个分支代表一个子系统,而子系统则代表一个特定的资源,如 CPU、内存、存储 IO、网络 IO 等。进程被分配到适当的子系统中,以便对其资源使用进行管理。

在 Cgroup 中,每个进程都被保存在一个名为 tasks 的文件中,该文件位于相应子系统的目录下。通过编辑和配置 /sys/fs/cgroup 目录下的文件,可以对子系统和进程的资源使用进行调整和控制。

        8.2 那么默认情况下新创建的容器是不受资源限制的吗?

默认情况下,新创建的容器是不受资源限制的。当你使用 Docker 创建一个容器时,Docker 默认不会为该容器设置任何资源限制,容器可以使用主机上的所有资源,包括 CPU、内存、磁盘 IO、网络带宽等。

要为容器设置资源限制,你可以通过 Docker 的参数来指定容器的资源限制,如 --cpu--memory--cpus 等。你还可以使用 Docker Compose 文件或者 Kubernetes 的资源配置来设置容器的资源限制。通过设置这些参数,你可以限制容器使用的 CPU 资源数量、内存使用量等,以防止容器占用过多的系统资源。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/696352.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据可视化Python实现超详解【数据分析】

各位大佬好 ,这里是阿川的博客,祝您变得更强 个人主页:在线OJ的阿川 大佬的支持和鼓励,将是我成长路上最大的动力 阿川水平有限,如有错误,欢迎大佬指正 Python 初阶 Python–语言基础与由来介绍 Python–…

【PowerDesigner】创建和管理CDM之新建实体

目录 🌊1. PowerDesigner简介 🌍1.1 常用模型文件 🌍1.2 PowerDesigner使用环境 🌊2. 创建和管理CDM 🌍​​​​​​2.1 新建CDM 🌍2.2 新建实体 🌊1. PowerDesigner简介 🌍1…

Innodb Buffer Pool缓存机制(三)Innodb Buffer Pool内部组成

一、控制块缓存页 Buffer Pool中默认的缓存页大小和在磁盘上默认的页大小是一样的,都是16KB。为了更好的管理这些在Buffer Pool中的缓存页,InnoDB为每一个缓存页都创建了一些所谓的控制信息,这些控制信息包括该页所属的表空间编号、页号、缓存…

11.链表

数组的分类:便于遍历 静态数组:int arr[10]数据过多造成空间溢出,数据过小空间浪费 动态数组:malloc calloc realloc 合理利用空间不能快捷的插入或删除数据(会涉及到大量的数据移动) 知识点一&#xff1…

【Python】使用pip安装seaborn sns及失败解决方法与sns.load_dataset(“tips“)

😎 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。 🤓 同时欢迎大家关注其他专栏,我将分享Web前后端开发、人工智能、机器学习、深…

system 和 exec 的区别

在 linux 中,使用 system 和 exec 都可以执行一个程序或者执行一个命令。两者的区别如下: system 中创建了一个子进程,在子进程中执行用户的命令,子进程执行完毕之后,system 会返回。exec 不会创建子进程,…

pdf的压缩该怎么做?快速在线压缩pdf的方法

pdf文件是现在很常用的一种文件格式,有很多的文件内容都可以通过这种格式来展示内容,比如一些通知文件、设计图、个人信息等等,文件的内容越多就会越大,在使用的时候经常会受到一定的限制。那么有什么方法能够快速的将pdf文件变小…

计算机提示msvcp120.dll如何修复,7个不同方法分享

msvcp120.dll 是 Microsoft Visual C Redistributable 的一个关键组件,它包含了 C 运行时库,这些库对基于 Visual C 编写的应用程序至关重要。当应用程序运行时,msvcp120.dll 会被加载到内存中以提供必要的函数和类支持。 一、msvcp120.dll功…

详解python中的pandas.read_csv()函数

😎 作者介绍:我是程序员洲洲,一个热爱写作的非著名程序员。CSDN全栈优质领域创作者、华为云博客社区云享专家、阿里云博客社区专家博主。 🤓 同时欢迎大家关注其他专栏,我将分享Web前后端开发、人工智能、机器学习、深…

从GPU到ASIC,博通和Marvell成赢家

ASIC市场上,博通预计今年AI收入将达到110亿美元以上,主要来自与Google和Meta的合作;Marvell预计2028年AI收入将达到70亿至80亿美元,主要来自与Amazon和Google的合作。 随着芯片设计和系统复杂性的增加,科技大厂将更多地…

初阶 《函数》 2.C语言中函数的分类

2.C语言中函数的分类 1.库函数 2.自定义函数 2.1 库函数 为什么会有库函数? 1.我们知道在我们学习C语言编程的时候,总是在一个代码编写完成之后迫不及待的想知道结果,想把这个结果打印到我们的屏幕上看看。这个时候我们会频繁的使用一个功能…

排序-快排算法对数组进行排序

目录 一、问题描述 二、解题思路 1.初始化 2.将右侧小于基准元素移到左边 3.将左侧大于基准元素移到右边 4.重复执行上面的操作 5.对分好的左、右分区再次执行分区操作 6.最终排序结果 三、代码实现 四、刷题链接 一、问题描述 二、解题思路 快排算法实现数组排序&am…

配置 JDK 和 Android SDK

目录 一、配置JDK 1. 安装 JDK 2. JDK 环境配置 3. JDK的配置验证 二、配置 adb 和Android SDK环境 1、下载 2、配置 Android SDK 环境 一、配置JDK 1. 安装 JDK 安装链接:Java Downloads | Oracle 我安装的是 .zip ,直接在指定的文件夹下解压就…

产品创新:驱动企业增长的核心动力

在当今快速变化的市场环境中,产品创新已成为企业生存和发展的关键。产品创新不仅涉及全新产品或服务的开发,也包括对现有产品或服务的持续改进和优化。本文将深入探讨产品创新的定义、重要性以及如何通过创新驱动企业增长,并结合实际案例进行…

Redis系列之淘汰策略介绍

Redis系列之淘汰策略介绍 文章目录 为什么需要Redis淘汰策略?Redis淘汰策略分类Redis数据淘汰流程源码验证淘汰流程Redis中的LRU算法Redis中的LFU算法 为什么需要Redis淘汰策略? 由于Redis内存是有大小的,当内存快满的时候,又没有…

IO进程线程(十一)进程间通信 消息队列

文章目录 一、IPC(Inter-Process Communication)进程间通信相关命令 :(一)ipcs --- 查看IPC对象(二)获取IPC键值(三)删除IPC对象的命令(四)获取IPC键值的函数1. 函数定义…

13 RTP包的使用

RTP RTP包最主要的就是Sequence number。 对于发送者来说,视频的每一个帧都有很多包组成。对于接收端来接收的时候是有一个队列进行接收的。这个队列大小都是通过计算的。有了队列之后就会不断的往队列中插入数据。当队列中有的数据超时一直组不成包的时候&#xf…

k8s离线部署Calico网络(2续)

下载离线镜像 百度网盘 链接:https://pan.baidu.com/s/14ReJW-ZyYZFLbwSEBZK6mA?pwdi6ct 提取码:i6ct 1.将离线镜像上传至所有服务器并解压: [rootmaster ~]# tar xf calico.tar.gz [rootmaster ~]# cd calico 2.所有服务器使用for循环导入…

【微服务】springcloud-alibaba 配置多环境管理使用详解

目录 一、前言 二、配置多环境问题概述 2.1 什么是微服务多环境配置管理 2.1.1 微服务多环境配置管理问题起源 2.2 为什么要做多环境配置管理 2.3 微服务多环境配置管理解决方案 三、springboot 配置多环境管理解决方案 3.1 前置准备 3.1.1 搭建一个springboot工程 3.…

IO流(转换流)

InputStreamReader(字符输入转换流 ) 解决不同编码时,字符流读取文本内容乱码的问题 public static void main(String[] args) {try (//1.得到文件的原始字节流(GBK的字节流形式)FileInputStream is new FileInputStream("src/666.tx…