镜像构建最佳实践
镜像分层
使用 docker image history 命令,您可以看到用于创建镜像中每个层的命令。
使用
docker image history命令查看您创建的getting-started镜像中的层。$ docker image history getting-started您应该会得到类似以下内容的输出。
IMAGE CREATED CREATED BY SIZE COMMENT a78a40cbf866 18 seconds ago /bin/sh -c #(nop) CMD ["node" "src/index.j… 0B f1d1808565d6 19 seconds ago /bin/sh -c yarn install --production 85.4MB a2c054d14948 36 seconds ago /bin/sh -c #(nop) COPY dir:5dc710ad87c789593… 198kB 9577ae713121 37 seconds ago /bin/sh -c #(nop) WORKDIR /app 0B b95baba1cfdb 13 days ago /bin/sh -c #(nop) CMD ["node"] 0B <missing> 13 days ago /bin/sh -c #(nop) ENTRYPOINT ["docker-entry… 0B <missing> 13 days ago /bin/sh -c #(nop) COPY file:238737301d473041… 116B <missing> 13 days ago /bin/sh -c apk add --no-cache --virtual .bui… 5.35MB <missing> 13 days ago /bin/sh -c #(nop) ENV YARN_VERSION=1.21.1 0B <missing> 13 days ago /bin/sh -c addgroup -g 1000 node && addu… 74.3MB <missing> 13 days ago /bin/sh -c #(nop) ENV NODE_VERSION=12.14.1 0B <missing> 13 days ago /bin/sh -c #(nop) CMD ["/bin/sh"] 0B <missing> 13 days ago /bin/sh -c #(nop) ADD file:e69d441d729412d24… 5.59MB每一行都代表镜像中的一个层。这里的显示将基础层放在底部,最新的层放在顶部。通过这个,您还可以快速查看每个层的大小,有助于诊断大镜像。
您会注意到其中几行被截断了。如果您添加
--no-trunc标志,您将获得完整的输出。$ docker image history --no-trunc getting-started
层缓存
现在您已经了解了分层的实际作用,为了帮助减少容器镜像的构建时间,有一个重要的经验需要学习。一旦某个层发生变化,所有下游的层也必须重新创建。
看一下您为入门应用创建的以下 Dockerfile。
# syntax=docker/dockerfile:1
FROM node:lts-alpine
WORKDIR /app
COPY . .
RUN yarn install --production
CMD ["node", "src/index.js"]回到镜像历史输出,您会看到 Dockerfile 中的每个命令都成为镜像中的一个新层。您可能还记得,当您对镜像进行更改时,yarn 依赖项必须重新安装。每次构建时都传输相同的依赖项是没有意义的。
要解决这个问题,您需要重新组织 Dockerfile,以支持依赖项的缓存。对于基于 Node 的应用程序,这些依赖项在 package.json 文件中定义。您可以先只复制该文件,安装依赖项,然后再复制其他所有内容。这样,只有在 package.json 发生变化时,您才需要重新创建 yarn 依赖项。
更新 Dockerfile,先复制
package.json,安装依赖项,然后再复制其他所有内容。# syntax=docker/dockerfile:1 FROM node:lts-alpine WORKDIR /app COPY package.json yarn.lock ./ RUN yarn install --production COPY . . CMD ["node", "src/index.js"]使用
docker build构建一个新镜像。$ docker build -t getting-started .您应该会看到类似以下的输出。
[+] Building 16.1s (10/10) FINISHED => [internal] load build definition from Dockerfile => => transferring dockerfile: 175B => [internal] load .dockerignore => => transferring context: 2B => [internal] load metadata for docker.io/library/node:lts-alpine => [internal] load build context => => transferring context: 53.37MB => [1/5] FROM docker.io/library/node:lts-alpine => CACHED [2/5] WORKDIR /app => [3/5] COPY package.json yarn.lock ./ => [4/5] RUN yarn install --production => [5/5] COPY . . => exporting to image => => exporting layers => => writing image sha256:d6f819013566c54c50124ed94d5e66c452325327217f4f04399b45f94e37d25 => => naming to docker.io/library/getting-started现在,对
src/static/index.html文件进行更改。例如,将<title>更改为“The Awesome Todo App”。现在再次使用
docker build -t getting-started .构建 Docker 镜像。这一次,您的输出应该会有些不同。[+] Building 1.2s (10/10) FINISHED => [internal] load build definition from Dockerfile => => transferring dockerfile: 37B => [internal] load .dockerignore => => transferring context: 2B => [internal] load metadata for docker.io/library/node:lts-alpine => [internal] load build context => => transferring context: 450.43kB => [1/5] FROM docker.io/library/node:lts-alpine => CACHED [2/5] WORKDIR /app => CACHED [3/5] COPY package.json yarn.lock ./ => CACHED [4/5] RUN yarn install --production => [5/5] COPY . . => exporting to image => => exporting layers => => writing image sha256:91790c87bcb096a83c2bd4eb512bc8b134c757cda0bdee4038187f98148e2eda => => naming to docker.io/library/getting-started首先,您应该注意到构建速度快了很多。而且,您会看到有几个步骤正在使用先前缓存的层。推送和拉取此镜像及其更新也会快得多。
多阶段构建
多阶段构建是一个非常强大的工具,可以帮助使用多个阶段来创建一个镜像。它们有几个优点:
- 将构建时依赖项与运行时依赖项分开
- 仅传输应用程序运行所需的内容,从而减少整体镜像大小
Maven/Tomcat 示例
在构建基于 Java 的应用程序时,您需要一个 JDK 来将源代码编译成 Java 字节码。但是,在生产环境中不需要这个 JDK。此外,您可能正在使用像 Maven 或 Gradle 这样的工具来帮助构建应用程序。这些在最终镜像中也是不需要的。多阶段构建可以提供帮助。
# syntax=docker/dockerfile:1
FROM maven AS build
WORKDIR /app
COPY . .
RUN mvn package
FROM tomcat
COPY --from=build /app/target/file.war /usr/local/tomcat/webapps 在此示例中,您使用一个阶段(称为 build)来使用 Maven 执行实际的 Java 构建。在第二个阶段(从 FROM tomcat 开始),您从 build 阶段复制文件。最终的镜像只是创建的最后一个阶段,可以使用 --target 标志覆盖。
React 示例
在构建 React 应用程序时,您需要一个 Node 环境来将 JS 代码(通常是 JSX)、SASS 样式表等编译成静态的 HTML、JS 和 CSS。如果您不进行服务器端渲染,您的生产构建甚至不需要 Node 环境。您可以将静态资源放在一个静态的 nginx 容器中。
# syntax=docker/dockerfile:1
FROM node:lts AS build
WORKDIR /app
COPY package* yarn.lock ./
RUN yarn install
COPY public ./public
COPY src ./src
RUN yarn run build
FROM nginx:alpine
COPY --from=build /app/build /usr/share/nginx/html在之前的 Dockerfile 示例中,它使用 node:lts 镜像来执行构建(最大化层缓存),然后将输出复制到 nginx 容器中。
摘要
在本节中,您学习了一些镜像构建的最佳实践,包括层缓存和多阶段构建。
相关信息
后续步骤
在下一节中,您将了解可用于继续学习容器的其他资源。
接下来做什么