Dockerfile 深入浅出:从基础到进阶全解析

Dockerfile 深入浅出:从基础到进阶全解析

各位同学,大家好!欢迎来到今天的 Dockerfile 课程。Docker 技术在当今的软件开发和部署领域可以说是非常热门,而 Dockerfile 作为构建 Docker 镜像的关键文件,掌握它对于我们进行容器化开发和部署至关重要。今天,我将用最通俗易懂的语言,从基础到进阶,结合常见例子,带大家全面深入地学习 Dockerfile 的编写。这份教程非常实用,建议大家收藏,跟着我一起实操,会更容易理解。

一、Dockerfile基础入门

1. 什么是 Dockerfile?

Dockerfile 是一个文本文件,它包含了构建 Docker 镜像的所有指令。怎么理解呢?我们可以把它类比成菜谱。想象一下,厨师(Docker 引擎)就像是按照菜谱上的步骤来制作菜品(镜像)。Dockerfile 中的每一条指令就像是菜谱中的一个步骤,告诉 Docker 引擎该怎么做。

2. 第一个 Dockerfile 示例:静态网站(Nginx)
需求理解

我们的目标是使用 Docker 和 Nginx 来部署一个静态网站。静态网站通常由 HTML、CSS、JavaScript 文件以及一些图片等资源组成。我们要通过 Dockerfile 构建一个包含 Nginx 服务器和静态网站文件的镜像,然后运行容器来对外提供服务。

所需文件及目录结构

首先,我们需要创建一个项目目录,例如 nginx-static,并在该目录下创建必要的文件和文件夹。来看一下详细的目录结构:

nginx-static/
├── dist
│   ├── index.html
│   ├── script.js
│   └── style.css
└── Dockerfile

1 directory, 4 files
具体文件内容
  • dist/index.html:这是静态网站的主页文件,使用简单的 HTML 代码展示一个基本的页面。其中包含了对 CSS 和 JavaScript 文件的引用。
<!DOCTYPE html>
<html lang="en">

<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <link rel="stylesheet" href="style.css">
    <title>My Static Website</title>
</head>

<body>
    <h1>Welcome to My Static Website</h1>
    <p>This is a simple static website deployed with Docker and Nginx.</p>
    <script src="script.js"></script>
</body>

</html>
  • dist/style.css:这是一个简单的 CSS 文件,用于为页面添加一些基本的样式,比如设置字体、背景颜色、文本对齐方式等。
body {
    font-family: Arial, sans-serif;
    background-color: #f4f4f4;
    text-align: center;
    padding-top: 50px;
}

h1 {
    color: #333;
}

p {
    color: #666;
}
  • dist/script.js:这是一个简单的 JavaScript 文件,在页面加载完成后会弹出一个提示框,让用户知道页面已经加载成功。
window.onload = function () {
    alert('Welcome to my static website!');
};
  • Dockerfile:这个 Dockerfile 用于构建包含 Nginx 服务器和静态网站文件的镜像。让我们来逐行分析一下:
# 使用官方的 Nginx 基础镜像,基于 Alpine 版本,体积较小
FROM nginx:alpine

# 将本地的 dist 目录下的所有文件复制到 Nginx 容器内的 HTML 目录中
COPY dist/ /usr/share/nginx/html

# 暴露容器的 80 端口,这是 Nginx 默认的 HTTP 服务端口
EXPOSE 80

FROM 指令指定了基础镜像,这里我们使用的是官方的 Nginx 基础镜像,基于 Alpine 版本,它的体积比较小,这样构建出来的镜像也会比较小。COPY 指令将本地的 dist 目录下的所有文件复制到 Nginx 容器内的 HTML 目录中,这样 Nginx 就可以找到我们的静态网站文件了。EXPOSE 指令声明了容器使用的端口,这里是 80 端口,这是 Nginx 默认的 HTTP 服务端口。

构建镜像

在项目根目录(nginx-static)下,打开终端并执行以下命令来构建 Docker 镜像:

docker build -t nginx-static-image .
  • -t 选项用于给镜像指定一个标签,这里我们将镜像命名为 nginx-static-image
  • . 表示使用当前目录作为构建上下文。
运行容器

构建完成后,我们可以使用以下命令来运行容器:

docker run -d -p 8080:80 nginx-static-image
  • -d 选项表示在后台运行容器。
  • -p 选项用于将宿主机的端口(这里是 8080)映射到容器的端口(这里是 80)。
  • nginx-static-image 是我们之前构建的镜像名称。
验证网站

打开浏览器,访问 http://localhost:8080,如果一切正常,你应该能够看到静态网站的页面,并且在页面加载完成后会弹出一个提示框。我们也可以使用 curl 命令来验证

[root@C9 Docker]# curl http://localhost:8080
<!DOCTYPE html>
<html lang="en">

<head>
    <meta charset="UTF-8">
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    <link rel="stylesheet" href="style.css">
    <title>My Static Website</title>
</head>

<body>
    <h1>Welcome to My Static Website</h1>
    <p>This is a simple static website deployed with Docker and Nginx.</p>
    <script src="script.js"></script>
</body>

</html>

在这里插入图片描述

二、核心指令详解(打好基础)

1. 镜像构建指令
指令用途示例
FROM指定基础镜像(必须是第一条指令)FROM ubuntu:22.04
COPY复制文件到容器(推荐使用)COPY src/ /app/src
ADD比COPY多支持URL和自动解压tar包(不推荐)ADD https://example.com/file
RUN执行命令(会生成新镜像层)RUN apt-get update && …

FROM 指令用于指定基础镜像,它是 Dockerfile 中必须的第一条指令,因为所有的镜像构建都是基于一个已有的基础镜像。COPY 指令用于将本地文件或目录复制到容器中,它的语法比较简单,只需要指定源路径和目标路径就可以了。ADD 指令虽然比 COPY 多了一些功能,比如支持 URL 和自动解压 tar 包,但是由于它的功能比较复杂,容易引入一些安全问题,所以一般不推荐使用。RUN 指令用于在容器中执行命令,它会生成一个新的镜像层,所以在使用 RUN 指令时要注意尽量合并多个命令,减少镜像层的数量。

2. 容器运行指令
指令用途示例
CMD容器启动时执行的默认命令(可被docker run覆盖)CMD [“python”, “app.py”]
ENTRYPOINT容器启动时执行的固定命令(参数可追加)ENTRYPOINT [“/app/start.sh”]
EXPOSE声明容器使用的端口(需配合docker run -p映射)EXPOSE 80 443
VOLUME创建数据卷(容器外存储数据)VOLUME [“/var/lib/mysql”]

CMD 指令用于指定容器启动时执行的默认命令,它可以被 docker run 命令中的参数覆盖。ENTRYPOINT 指令用于指定容器启动时执行的固定命令,它的参数可以追加。EXPOSE 指令用于声明容器使用的端口,但是它只是一个声明,并不会实际进行端口映射,需要配合 docker run -p 选项来进行端口映射。VOLUME 指令用于创建数据卷,数据卷可以将容器内的数据存储到容器外,这样即使容器被删除,数据也不会丢失。

3. 环境配置指令
指令用途示例
WORKDIR设置当前工作目录(相当于连续执行cd命令)WORKDIR /app && WORKDIR src
ENV设置环境变量ENV FLASK_ENV=production
USER指定运行命令的用户(提高安全性)USER appuser

WORKDIR 指令用于设置当前工作目录,它相当于在容器中连续执行 cd 命令。ENV 指令用于设置环境变量,环境变量可以在容器中被应用程序使用。USER 指令用于指定运行命令的用户,这样可以提高容器的安全性。

三、实战进阶技巧(大厂常用)

1. 构建缓存优化
# 先复制依赖文件,利用Docker缓存
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# 再复制代码(代码修改时不会触发依赖重新安装)
COPY . .

在构建镜像时,Docker 会使用缓存来加速构建过程。如果我们把依赖文件和代码一起复制到容器中,那么只要代码有任何修改,就会导致依赖文件也被重新复制,从而触发依赖重新安装,这样会浪费很多时间。所以我们可以先复制依赖文件,安装依赖,然后再复制代码,这样当代码修改时,依赖安装的步骤就可以利用缓存,不会被重新执行。

2. 多阶段构建(减小镜像体积)
# 第一阶段:编译应用
FROM python:3.10-slim AS builder
WORKDIR /app
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt
COPY . .
RUN python setup.py build

# 第二阶段:最终镜像(仅包含运行时文件)
FROM python:3.10-slim
WORKDIR /app
COPY --from=builder /app/dist /app/dist
CMD ["python", "/app/dist/main.py"]

在构建镜像时,Docker 会使用缓存来加速构建过程。如果我们把依赖文件和代码一起复制到容器中,那么只要代码有任何修改,就会导致依赖文件也被重新复制,从而触发依赖重新安装,这样会浪费很多时间。所以我们可以先复制依赖文件,安装依赖,然后再复制代码,这样当代码修改时,依赖安装的步骤就可以利用缓存,不会被重新执行。

3. 健康检查
HEALTHCHECK --interval=5s --timeout=3s \
  CMD curl -f http://localhost:8000/health || exit 1

健康检查可以帮助我们监控容器的运行状态。HEALTHCHECK 指令用于定义一个健康检查命令,--interval 选项指定检查的间隔时间,--timeout 选项指定检查的超时时间。如果健康检查命令返回非零退出码,Docker 会认为容器不健康。

4. 动态参数(ARG)
ARG APP_VERSION=1.0.0
ENV APP_VERSION=$APP_VERSION

# 构建时指定参数
docker build --build-arg APP_VERSION=2.0.0 -t myapp .

ARG 指令用于定义一个构建时参数,这个参数可以在构建镜像时通过 --build-arg 选项来指定。我们可以使用 ENV 指令将 ARG 定义的参数设置为环境变量,这样应用程序就可以使用这个环境变量了。

四、进阶案例:Python Flask 应用详细部署

1. 需求理解

我们要使用 Docker 来部署一个基于 Python Flask 框架开发的 Web 应用。Flask 是一个轻量级的 Web 框架,非常适合快速开发小型 Web 应用。通过 Dockerfile 构建一个包含 Python 环境和 Flask 应用的镜像,然后运行容器来对外提供服务。

2. 所需文件及目录结构

首先,创建一个项目目录,例如 flask-app,并在该目录下创建必要的文件和文件夹。以下是详细的目录结构:

flask-app/
├── app.py
├── Dockerfile
└── requirements.txt

0 directories, 3 files
4. 具体文件内容
  • app.py:这是 Flask 应用的主文件,定义了一个简单的路由,当访问根路径时返回 “Hello, World!”。
from flask import Flask

app = Flask(__name__)

@app.route('/')
def hello_world():
    return 'Hello, World!'

if __name__ == '__main__':
    app.run(host='0.0.0.0', port=5000)
  • requirements.txt:这个文件记录了项目所需的 Python 依赖包,这里只需要 Flask。
flask
  • Dockerfile:这个 Dockerfile 用于构建包含 Python 环境和 Flask 应用的镜像。
# 使用官方的 Python 3.10 轻量级基础镜像
FROM python:3.10-slim

# 设置工作目录
WORKDIR /app

# 复制依赖文件到工作目录
COPY requirements.txt .

# 安装依赖包,使用 --no-cache-dir 选项避免缓存占用过多空间
RUN pip install --no-cache-dir -r requirements.txt

# 复制项目代码到工作目录
COPY . .

# 暴露容器的 5000 端口,这是 Flask 应用默认的服务端口
EXPOSE 5000

# 定义容器启动时执行的命令
CMD ["python", "app.py"]
5. 构建镜像

在项目根目录(flask-app)下,打开终端并执行以下命令来构建 Docker 镜像:

docker build -t flask-app-image .
  • -t 选项用于给镜像指定一个标签,这里我们将镜像命名为 flask-app-image
  • . 表示使用当前目录作为构建上下文。
6. 运行容器

构建完成后,我们就可以运行容器了。使用以下命令:

docker run -d -p 8081:5000 flask-app-image
  • -d 选项表示在后台运行容器。
  • -p 选项用于将宿主机的端口(这里是 8081)映射到容器的端口(这里是 5000)。
  • flask-app-image 是我们之前构建的镜像名称。
7. 验证应用

打开浏览器,访问 http://localhost:8081,如果一切正常,你应该能够看到页面显示 “Hello, World!”。

进阶优化

多阶段构建

为了减小镜像体积,我们可以使用多阶段构建。来看一下优化后的 Dockerfile:

# 第一阶段:构建环境,安装依赖
FROM python:3.10-slim AS builder
WORKDIR /app
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# 第二阶段:最终镜像,只包含运行所需的文件
FROM python:3.10-slim
WORKDIR /app
COPY --from=builder /usr/local/lib/python3.10/site-packages /usr/local/lib/python3.10/site-packages
COPY . .
EXPOSE 5000
CMD ["python", "app.py"]

这里我们分为两个阶段。第一阶段使用 AS builder 命名为构建环境,安装所需的依赖。第二阶段是最终镜像,只复制第一阶段安装好的依赖和项目代码,这样可以大大减小镜像体积。

健康检查

我们还可以在 Dockerfile 中添加健康检查,确保应用正常运行。

# 第一阶段:构建环境,安装依赖
FROM python:3.10-slim AS builder
WORKDIR /app
COPY requirements.txt .
RUN pip install --no-cache-dir -r requirements.txt

# 第二阶段:最终镜像,只包含运行所需的文件
FROM python:3.10-slim
WORKDIR /app
COPY --from=builder /usr/local/lib/python3.10/site-packages /usr/local/lib/python3.10/site-packages
COPY . .
EXPOSE 5000

# 添加健康检查,每 10 秒检查一次,超时时间为 3 秒,最多重试 3 次
HEALTHCHECK --interval=10s --timeout=3s --retries=3 \
    CMD curl -f http://localhost:5000/ || exit 1

CMD ["python", "app.py"]

通过 HEALTHCHECK 指令,我们可以设置每 10 秒检查一次应用的健康状态,超时时间为 3 秒,最多重试 3 次。如果检查失败,容器会被标记为不健康。

五、避坑指南

在使用 Docker 构建镜像和运行容器的过程中,有一些常见的坑需要我们注意。

  1. 避免安装不必要的包:尽量使用 slimalpine 基础镜像,这样可以减少镜像体积。

  2. 不要使用 root 用户:为了安全起见,我们可以添加普通用户来运行容器。

    RUN useradd -m appuser && chown -R appuser /app
    USER appuser
    
  3. 清理缓存:安装完成后,记得删除包管理器的缓存。

    RUN apt-get update && apt-get install -y wget && rm -rf /var/lib/apt/lists/*
    
  4. 区分 CMD 和 ENTRYPOINT:

    • CMD:容器启动时执行的默认命令,这个命令是可以被覆盖的。
    • ENTRYPOINT:是固定执行的命令,参数可以追加。

总结

最后,我们来总结一下。Dockerfile 的核心原则是分层构建缓存利用。通过合理的指令顺序和镜像优化,我们能显著提升构建效率和镜像安全性。建议大家在实际项目中多尝试不同的配置,观察构建日志中的缓存命中情况,逐步积累经验。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/982831.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

大模型巅峰对决:DeepSeek vs GPT-4/Claude/PaLM-2 全面对比与核心差异揭秘

文章目录 一、架构设计深度解剖1.1 核心架构对比图谱1.2 动态MoE架构实现架构差异分析表 二、训练策略全面对比2.1 训练数据工程对比2.2 分布式训练代码对比DeepSeek混合并行实现GPT-4 Megatron实现对比 2.3 关键训练参数对比 三、性能表现多维评测3.1 基准测试全景对比3.2 推理…

贪心算法二

> 作者&#xff1a;დ旧言~ > 座右铭&#xff1a;松树千年终是朽&#xff0c;槿花一日自为荣。 > 目标&#xff1a;了解什么是贪心算法&#xff0c;并且掌握贪心算法。 > 毒鸡汤&#xff1a;有些事情&#xff0c;总是不明白&#xff0c;所以我不会坚持。早安! >…

【Mac】MacOS系统下常用的开发环境配置2025版

早期版本的一个环境搭建参考 1、brew Mac自带终端运行&#xff1a; /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" Installation successful!成功后运行三行命令后更新环境&#xff08;xxx是mac的username&a…

【JavaEE】SpringMVC简单练习

目录 一、计算器1.1 接口定义1.2 前端代码1.3 后端代码1.4 运行结果 二、⽤⼾登录2.1 需求2.2 接口定义2.3 前端页面2.4 后端代码2.5 结果 三、留⾔板3.1 需求:3.2 接口3.3 前端代码3.4 后端代码3.5 运行结果 四、图书管理系统4.1 需求4.2 接口定义4.3 后端代码 一、计算器 1.…

go 分布式redis锁的实现方式

go 语言以高并发著称。那么在实际的项目中 经常会用到锁的情况。比如说秒杀抢购等等场景。下面主要介绍 redis 布式锁实现的两种高并发抢购场景。其实 高并发 和 分布式锁 是一个互斥的两个状态&#xff1a; 方式一 setNX&#xff1a; 使用 redis自带的API setNX 来实现。能解决…

网络安全等级保护2.0 vs GDPR vs NIST 2.0:全方位对比解析

在网络安全日益重要的今天&#xff0c;各国纷纷出台相关政策法规&#xff0c;以加强信息安全保护。本文将对比我国网络安全等级保护2.0、欧盟的GDPR以及美国的NIST 2.0&#xff0c;分析它们各自的特点及差异。 网络安全等级保护2.0 网络安全等级保护2.0是我国信息安全领域的一…

upload-labs靶场 1-21通关

目录 1.Pass-01 前端绕过 分析 解题 2.Pass-02 服务器端检测--修改IMME 分析 解题 3.Pass-03 黑名单绕过 分析 解题 4.Pass-04 .htaccess绕过 分析 解题 5.Pass-05 . .绕过和.user.ini绕过 分析 解题 6.Pass-06 大小写绕过 分析 解题 7.Pass-07 空格绕过 分…

CInternetToolbar::_CommonHandleFileSysChange函数分析之CReBar::_IDToIndex函数的作用

第一部分&#xff1a; // IMPORTANT: dont change the value of anything between CBIDX_FIRST and CBIDX_LAST. // CInternetToolbar::_LoadUpgradeSettings assumes these values havent changed from // version to version. #define CBIDX_MENU 1 …

为AI聊天工具添加一个知识系统 之138 设计重审 之2 文章学 引言之2 附加符号学附属诠释学附随工程学(联系)

本文要点 要点 符号学大局观&#xff1a; 诠释学&#xff08;当代 加成[0]&#xff1a;“预期”和“预设” 两者的 不期而遇 。“邂逅”&#xff09; 我们在文章学工具设计中 以全局观考虑&#xff1a;嵌入编程工具的逻辑性底&#xff08; 哲学诠释 下确界&#xff09; 并…

VEC系列-RabbitMQ 入门笔记

消息队列&#xff08;MQ&#xff09;对于开发者来说是一个经常听到的词汇&#xff0c;但在实际开发中&#xff0c;大多数人并不会真正用到它。网上已经有很多关于 MQ 概述和原理的详细讲解&#xff0c;官网文档和技术博客也都介绍得很深入&#xff0c;因此&#xff0c;我在这里…

大模型应用开发学习笔记

Huggingface 下载模型&#xff1a; model_dirr"G:\python_ws_g\code\LLMProject\session_4\day02_huggingface\transformers_test\model\uer\uer\gpt2-chinese-cluecorpussmall\models--uer--gpt2-chinese-cluecorpussmall\snapshots\c2c0249d8a2731f269414cc3b22dff021…

使用 Elasticsearch 进行集成测试初始化​​数据时的注意事项

作者&#xff1a;来自 Elastic piotrprz 在创建应该使用 Elasticsearch 进行搜索、数据聚合或 BM25/vector/search 的软件时&#xff0c;创建至少少量的集成测试至关重要。虽然 “模拟索引” 看起来很诱人&#xff0c;因为测试甚至可以在几分之一秒内运行&#xff0c;但它们实际…

高并发内存池 · 基本认识

目录 前言&#xff1a; 项目基础认识 内存碎片 效率问题 定长内存池 切内存 给谁切&#xff1f;怎么切&#xff1f; 怎么管理回收内存&#xff1f; 前言&#xff1a; 本文呢开始搞搞项目咯&#xff0c;于是准备从一个最经典的项目入手--tcmalloc&#xff0c;也就是从谷…

通用信息抽取大模型PP-UIE开源发布,强化零样本学习与长文本抽取能力,全面适配多场景任务

背景与简介 信息抽取&#xff08;information extraction&#xff09;是指&#xff0c;从非结构化或半结构化数据&#xff08;如自然语言文本&#xff09;中自动识别、提取并组织出结构化信息。通常包含多个子任务&#xff0c;例如&#xff1a;命名实体识别&#xff08;NER&am…

游戏引擎学习第140天

回顾并为今天的内容做准备 目前代码的进展到了声音混音的部分。昨天我详细解释了声音的处理方式&#xff0c;声音在技术上是一个非常特别的存在&#xff0c;但在游戏中进行声音混音的需求其实相对简单明了&#xff0c;所以今天的任务应该不会太具挑战性。 今天我们会编写一个…

Goby 漏洞安全通告| Ollama /api/tags 未授权访问漏洞(CNVD-2025-04094)

漏洞名称&#xff1a;Ollama /api/tags 未授权访问漏洞&#xff08;CNVD-2025-04094&#xff09; English Name&#xff1a;Ollama /api/tags Unauthorized Access Vulnerability (CNVD-2025-04094) CVSS core: 6.5 风险等级&#xff1a; 中风险 漏洞描述&#xff1a; O…

Python----数据分析(Matplotlib五:pyplot的其他函数,Figure的其他函数, GridSpec)

一、pyplot的其他函数 1.1、xlabel 在matplotlib中&#xff0c; plt.xlabel() 函数用于为当前活动的坐标轴&#xff08;Axes&#xff09;设置x轴的 标签。当你想要标识x轴代表的数据或单位时&#xff0c;这个函数非常有用。 plt.xlabel(xlabel text) 1.2、ylabel 在matplotl…

构建python3.8的docker镜像,以便解决: dlopen: /lib64/libc.so.6: version `GLIBC_2.28‘

1、简介 在使用pyinstaller打包工具打包应用为二进制的时候&#xff0c;出现了一个“”: dlopen: /lib64/libc.so.6: version GLIBC_2.28”的问题 2、解决方案 2.1、问题原因 由于使用了官方提供的镜像&#xff0c;而官方提供的镜像编译的机器上、glibc的版本过高&#xff…

音频3A测试--AEC(回声消除)测试

一、测试前期准备 一台录制电脑:用于作为近段音源和收集远端处理后的数据; 一台测试设备B:用于测试AEC的设备; 一个高保真音响:用于播放设备B的讲话; 一台播放电脑:用于模拟设备A讲话,和模拟设备B讲话; 一台音频处理器(调音台):用于录制和播放数据; 测试使用转接线若…

MATLAB程序介绍,三维环境下的IMM(交互式多模型),使用CV和CT模型,EKF作为滤波

本文所述的MATLAB代码为三维的交互式多模型&#xff08;IMM&#xff09;滤波器&#xff0c;结合了匀速直线运动&#xff08;CV模型&#xff09;和匀速圆周运动&#xff08;CT模型&#xff09;的状态估计。使用扩展卡尔曼滤波&#xff08;EKF&#xff09;来处理状态更新与观测数…