运行容器

Docker 在隔离的容器中运行进程。容器是在主机上运行的进程。主机可以是本地的，也可以是远程的。当您执行 docker run 时，运行的容器进程是隔离的，因为它有自己的文件系统、自己的网络以及与主机分离的独立进程树。

本页详细介绍如何使用 docker run 命令来运行容器。

通用形式

docker run 命令采用以下形式

$ docker run [OPTIONS] IMAGE[:TAG|@DIGEST] [COMMAND] [ARG...]

docker run 命令必须指定一个镜像引用来创建容器。

镜像引用

镜像引用是镜像的名称和版本。您可以使用镜像引用来基于镜像创建或运行容器。

docker run IMAGE[:TAG][@DIGEST]
docker create IMAGE[:TAG][@DIGEST]

镜像标签是镜像版本，如果省略，则默认为 latest。使用标签可以从特定版本的镜像运行容器。例如，要运行 ubuntu 镜像的 24.04 版本：docker run ubuntu:24.04。

镜像摘要

使用 v2 或更高版本镜像格式的镜像具有一个称为摘要的内容可寻址标识符。只要用于生成镜像的输入保持不变，摘要值就是可预测的。

以下示例从具有 sha256:9cacb71397b640eca97488cf08582ae4e4068513101088e9f96c9814bfda95e0 摘要的 alpine 镜像运行一个容器

$ docker run alpine@sha256:9cacb71397b640eca97488cf08582ae4e4068513101088e9f96c9814bfda95e0 date

选项

[OPTIONS] 允许您为容器配置选项。例如，您可以给容器一个名称 (--name)，或将其作为后台进程运行 (-d)。您还可以设置选项来控制资源约束和网络等内容。

命令和参数

您可以使用 [COMMAND] 和 [ARG...] 位置参数来指定容器启动时要运行的命令和参数。例如，您可以将 sh 指定为 [COMMAND]，结合 -i 和 -t 标志，在容器中启动一个交互式 shell（如果您选择的镜像在 PATH 上有 sh 可执行文件）。

$ docker run -it IMAGE sh

注意
根据您的 Docker 系统配置，您可能需要在 docker run 命令前加上 sudo。为避免在使用 docker 命令时使用 sudo，您的系统管理员可以创建一个名为 docker 的 Unix 组并将用户添加到其中。有关此配置的更多信息，请参阅您操作系统的 Docker 安装文档。

前台和后台

当您启动一个容器时，容器默认在前台运行。如果您想在后台运行容器，可以使用 --detach (或 -d) 标志。这会启动容器而不会占用您的终端窗口。

$ docker run -d <IMAGE>

当容器在后台运行时，您可以使用其他 CLI 命令与容器交互。例如，docker logs 让您查看容器的日志，而 docker attach 将其带到前台。

$ docker run -d nginx
0246aa4d1448a401cabd2ce8f242192b6e7af721527e48a810463366c7ff54f1
$ docker ps
CONTAINER ID   IMAGE     COMMAND                  CREATED         STATUS        PORTS     NAMES
0246aa4d1448   nginx     "/docker-entrypoint.…"   2 seconds ago   Up 1 second   80/tcp    pedantic_liskov
$ docker logs -n 5 0246aa4d1448
2023/11/06 15:58:23 [notice] 1#1: start worker process 33
2023/11/06 15:58:23 [notice] 1#1: start worker process 34
2023/11/06 15:58:23 [notice] 1#1: start worker process 35
2023/11/06 15:58:23 [notice] 1#1: start worker process 36
2023/11/06 15:58:23 [notice] 1#1: start worker process 37
$ docker attach 0246aa4d1448
^C
2023/11/06 15:58:40 [notice] 1#1: signal 2 (SIGINT) received, exiting
...

有关与前台和后台模式相关的 docker run 标志的更多信息，请参阅：

docker run --detach：在后台运行容器
docker run --attach：附加到 stdin、stdout 和 stderr
docker run --tty：分配一个伪 TTY
docker run --interactive：即使未附加也保持 stdin 打开

有关重新附加到后台容器的更多信息，请参阅 docker attach。

标识符类型	示例值
UUID 长标识符	`f78375b1c487e03c9438c729345e54db9d20cfa2ac1fc3494b6eb60872e74778`
UUID 短标识符	`f78375b1c487`
名称	`evil_ptolemy`

文件系统挂载

默认情况下，容器中的数据存储在一个临时的、可写的容器层中。移除容器也会移除其数据。如果您想在容器中使用持久性数据，可以使用文件系统挂载将数据持久地存储在主机系统上。文件系统挂载还可以让您在容器和主机之间共享数据。

Docker 支持两种主要的挂载类别

卷挂载
绑定挂载

卷挂载非常适合持久存储容器数据，以及在容器之间共享数据。而绑定挂载则用于在容器和主机之间共享数据。

您可以使用 docker run 命令的 --mount 标志向容器添加文件系统挂载。

以下部分展示了如何创建卷和绑定挂载的基本示例。有关更深入的示例和描述，请参阅文档中的存储部分。

卷挂载

创建卷挂载：

$ docker run --mount source=<VOLUME_NAME>,target=[PATH] [IMAGE] [COMMAND...]

在这种情况下，--mount 标志需要两个参数：source 和 target。source 参数的值是卷的名称。target 的值是卷在容器内的挂载位置。一旦您创建了卷，您写入卷的任何数据都会被持久化，即使您停止或移除容器

$ docker run --rm --mount source=my_volume,target=/foo busybox \
  echo "hello, volume!" > /foo/hello.txt
$ docker run --mount source=my_volume,target=/bar busybox
  cat /bar/hello.txt
hello, volume!

target 必须始终是绝对路径，例如 /src/docs。绝对路径以 /（正斜杠）开头。卷名称必须以字母数字字符开头，后跟 a-z0-9、_（下划线）、.（句点）或 -（连字符）。

绑定挂载

创建绑定挂载：

$ docker run -it --mount type=bind,source=[PATH],target=[PATH] busybox

在这种情况下，--mount 标志需要三个参数。一个类型 (bind) 和两个路径。source 路径是您想要绑定挂载到容器中的主机上的位置。target 路径是容器内的挂载目标。

绑定挂载默认是读写的，这意味着您可以从容器中对挂载位置进行读写操作。您所做的更改，例如添加或编辑文件，都会反映在主机文件系统上。

$ docker run -it --mount type=bind,source=.,target=/foo busybox
/ # echo "hello from container" > /foo/hello.txt
/ # exit
$ cat hello.txt
hello from container

退出状态

docker run 的退出代码提供了有关容器为什么未能运行或为什么退出的信息。以下部分描述了不同容器退出代码值的含义。

125

退出代码 125 表示错误在于 Docker 守护进程本身。

$ docker run --foo busybox; echo $?

flag provided but not defined: --foo
See 'docker run --help'.
125

126

退出代码 126 表示指定的容器命令无法被调用。以下示例中的容器命令是：/etc。

$ docker run busybox /etc; echo $?

docker: Error response from daemon: Container command '/etc' could not be invoked.
126

127

退出代码 127 表示找不到容器命令。

$ docker run busybox foo; echo $?

docker: Error response from daemon: Container command 'foo' not found or does not exist.
127

其他退出代码

除 125、126 和 127 之外的任何退出代码都代表所提供的容器命令的退出代码。

$ docker run busybox /bin/sh -c 'exit 3'
$ echo $?
3

资源运行时约束

操作员还可以调整容器的性能参数

选项	描述
`-m`, `--memory=""`	内存限制（格式：`<number>[<unit>]`）。数字是正整数。单位可以是 `b`、`k`、`m` 或 `g` 中的一个。最小值是 6M。
`--memory-swap=""`	总内存限制（内存 + 交换空间，格式：`<number>[<unit>]`）。数字是正整数。单位可以是 `b`、`k`、`m` 或 `g` 中的一个。
`--memory-reservation=""`	内存软限制（格式：`<number>[<unit>]`）。数字是正整数。单位可以是 `b`、`k`、`m` 或 `g` 中的一个。
`--kernel-memory=""`	内核内存限制（格式：`<number>[<unit>]`）。数字是正整数。单位可以是 `b`、`k`、`m` 或 `g` 中的一个。最小值是 4M。
`-c`, `--cpu-shares=0`	CPU 共享（相对权重）
`--cpus=0.000`	CPU 数量。数字是小数。0.000 表示没有限制。
`--cpu-period=0`	限制 CPU CFS (完全公平调度器) 周期
`--cpuset-cpus=""`	允许执行的 CPU (0-3, 0,1)
`--cpuset-mems=""`	允许执行的内存节点 (MEMs) (0-3, 0,1)。仅在 NUMA 系统上有效。
`--cpu-quota=0`	限制 CPU CFS（完全公平调度器）配额
`--cpu-rt-period=0`	限制 CPU 实时周期。单位为微秒。要求设置父 cgroup 且不能高于父 cgroup。同时检查 rtprio ulimits。
`--cpu-rt-runtime=0`	限制 CPU 实时运行时间。单位为微秒。要求设置父 cgroup 且不能高于父 cgroup。同时检查 rtprio ulimits。
`--blkio-weight=0`	块 IO 权重（相对权重）接受一个介于 10 和 1000 之间的权重值。
`--blkio-weight-device=""`	块 IO 权重（相对设备权重，格式：`DEVICE_NAME:WEIGHT`）
`--device-read-bps=""`	限制从设备的读取速率（格式：`<device-path>:<number>[<unit>]`）。数字是正整数。单位可以是 `kb`、`mb` 或 `gb` 中的一个。
`--device-write-bps=""`	限制向设备写入的速率（格式：`<device-path>:<number>[<unit>]`）。数字是正整数。单位可以是 `kb`、`mb` 或 `gb` 中的一个。
`--device-read-iops=""`	限制从设备的读取速率（IO 每秒）（格式：`<device-path>:<number>`）。数字是正整数。
`--device-write-iops=""`	限制写入设备的速率（IO 每秒）（格式：`<device-path>:<number>`）。数字是正整数。
`--oom-kill-disable=false`	是否为容器禁用 OOM Killer。
`--oom-score-adj=0`	调整容器的 OOM 偏好（-1000 到 1000）
`--memory-swappiness=""`	调整容器的内存交换行为。接受一个介于 0 和 100 之间的整数。
`--shm-size=""`	`/dev/shm` 的大小。格式为 `<number><unit>`。`number` 必须大于 `0`。单位是可选的，可以是 `b` (字节)、`k` (千字节)、`m` (兆字节) 或 `g` (吉字节)。如果省略单位，系统使用字节。如果完全省略大小，系统使用 `64m`。

用户内存约束

我们有四种方式来设置用户内存使用量

选项	结果
memory=inf, memory-swap=inf（默认）	容器没有内存限制。容器可以根据需要使用尽可能多的内存。
memory=L<inf, memory-swap=inf	（指定内存并将 memory-swap 设置为 `-1`）容器不允许使用超过 L 字节的内存，但可以根据需要使用尽可能多的交换空间（如果主机支持交换内存）。
*memory=L<inf, memory-swap=2L**	（指定内存而不指定 memory-swap）容器不允许使用超过 L 字节的内存，交换空间加上内存的使用量是其两倍。
memory=L<inf, memory-swap=S<inf, L<=S	（同时指定内存和 memory-swap）容器不允许使用超过 L 字节的内存，交换空间加上内存的使用量受 S 限制。

示例

$ docker run -it ubuntu:24.04 /bin/bash

我们没有设置任何关于内存的限制，这意味着容器中的进程可以根据需要使用尽可能多的内存和交换内存。

$ docker run -it -m 300M --memory-swap -1 ubuntu:24.04 /bin/bash

我们设置了内存限制并禁用了交换内存限制，这意味着容器中的进程可以使用 300M 内存和尽可能多的交换内存（如果主机支持交换内存）。

$ docker run -it -m 300M ubuntu:24.04 /bin/bash

我们只设置了内存限制，这意味着容器中的进程可以使用 300M 内存和 300M 交换内存，默认情况下，总虚拟内存大小（--memory-swap）将被设置为内存的两倍，在这种情况下，内存 + 交换空间将是 2*300M，所以进程也可以使用 300M 交换内存。

$ docker run -it -m 300M --memory-swap 1G ubuntu:24.04 /bin/bash

我们同时设置了内存和交换内存，所以容器中的进程可以使用 300M 内存和 700M 交换内存。

内存预留是一种内存软限制，允许更大程度的内存共享。在正常情况下，容器可以根据需要使用尽可能多的内存，仅受通过 -m/--memory 选项设置的硬限制约束。当设置了内存预留时，Docker 会检测到内存争用或内存不足，并强制容器将其消耗限制在预留限制内。

始终将内存预留值设置在硬限制之下，否则硬限制将优先。预留值为 0 与不设置预留相同。默认情况下（未设置预留），内存预留与硬内存限制相同。

内存预留是一个软限制功能，不保证不会超过限制。相反，该功能试图确保在内存严重争用时，内存会根据预留提示/设置进行分配。

以下示例将内存（-m）限制为 500M，并将内存预留设置为 200M。

$ docker run -it -m 500M --memory-reservation 200M ubuntu:24.04 /bin/bash

在此配置下，当容器消耗的内存超过 200M 且小于 500M 时，下一次系统内存回收会尝试将容器内存缩小到 200M 以下。

以下示例设置了 1G 的内存预留，但没有硬内存限制。

$ docker run -it --memory-reservation 1G ubuntu:24.04 /bin/bash

容器可以根据需要使用尽可能多的内存。内存预留设置确保容器不会长时间消耗过多内存，因为每次内存回收都会将容器的消耗缩减到预留值。

默认情况下，如果发生内存不足（OOM）错误，内核会终止容器中的进程。要更改此行为，请使用 --oom-kill-disable 选项。仅在您也设置了 -m/--memory 选项的容器上禁用 OOM killer。如果未设置 -m 标志，这可能导致主机内存耗尽，并需要终止主机的系统进程以释放内存。

以下示例将内存限制为 100M，并为此容器禁用 OOM killer

$ docker run -it -m 100M --oom-kill-disable ubuntu:24.04 /bin/bash

以下示例说明了使用该标志的一种危险方式

$ docker run -it --oom-kill-disable ubuntu:24.04 /bin/bash

该容器拥有无限内存，这可能导致主机内存耗尽，需要终止系统进程来释放内存。可以更改 --oom-score-adj 参数来选择当系统内存不足时哪些容器将被杀死的优先级，负分使其不太可能被杀死，正分则更有可能。

内核内存约束

内核内存与用户内存有根本不同，因为内核内存不能被换出。无法交换使得容器可能通过消耗过多内核内存来阻塞系统服务。内核内存包括：

栈页
slab 页
套接字内存压力
tcp 内存压力

您可以设置内核内存限制来约束这些类型的内存。例如，每个进程都会消耗一些堆栈页面。通过限制内核内存，您可以在内核内存使用过高时阻止新进程的创建。

内核内存从来不是完全独立于用户内存的。相反，您是在用户内存限制的背景下限制内核内存。假设“U”是用户内存限制，“K”是内核限制。有三种可能的方式来设置限制

选项	结果
U != 0, K = inf（默认）	这是在使用内核内存之前已经存在的标准内存限制机制。内核内存被完全忽略。
U != 0, K < U	内核内存是用户内存的一个子集。这种设置在每个 cgroup 的总内存量被超额使用的部署中很有用。绝对不建议超额使用内核内存限制，因为机器仍然可能耗尽不可回收的内存。在这种情况下，您可以配置 K，使得所有组的总和永远不会大于总内存。然后，以系统服务质量为代价自由设置 U。
U != 0, K > U	由于内核内存的费用也会计入用户计数器，并且两种内存都会触发容器的回收。这种配置为管理员提供了一个统一的内存视图。它对于那些只想跟踪内核内存使用情况的人也很有用。

示例

$ docker run -it -m 500M --kernel-memory 50M ubuntu:24.04 /bin/bash

我们设置了内存和内核内存，所以容器中的进程总共可以使用 500M 内存，在这 500M 内存中，最多可以是 50M 内核内存。

$ docker run -it --kernel-memory 50M ubuntu:24.04 /bin/bash

我们在没有 -m 的情况下设置了内核内存，所以容器中的进程可以随心所欲地使用内存，但它们只能使用 50M 的内核内存。

交换性约束

默认情况下，容器的内核可以换出一定比例的匿名页面。要为容器设置此百分比，请指定一个介于 0 和 100 之间的 --memory-swappiness 值。值为 0 表示关闭匿名页面交换。值为 100 表示所有匿名页面都可交换。默认情况下，如果您不使用 --memory-swappiness，内存交换值将从父级继承。

例如，您可以设置

$ docker run -it --memory-swappiness=0 ubuntu:24.04 /bin/bash

当您想要保留容器的工作集并避免交换性能损失时，设置 --memory-swappiness 选项是很有帮助的。

默认情况下，所有容器获得相同比例的 CPU 周期。可以通过更改容器的 CPU 共享权重相对于所有其他正在运行的容器的权重来修改此比例。

要将比例从默认的 1024 修改，请使用 -c 或 --cpu-shares 标志将权重设置为 2 或更高。如果设置为 0，系统将忽略该值并使用默认的 1024。

该比例仅在 CPU 密集型进程运行时适用。当一个容器中的任务处于空闲状态时，其他容器可以使用剩余的 CPU 时间。实际的 CPU 时间量将根据系统上运行的容器数量而变化。

例如，考虑三个容器，一个的 cpu-share 是 1024，另外两个的 cpu-share 设置是 512。当所有三个容器中的进程都试图使用 100% 的 CPU 时，第一个容器将获得总 CPU 时间的 50%。如果您添加第四个 cpu-share 为 1024 的容器，第一个容器只能获得 33% 的 CPU。其余容器分别获得 16.5%、16.5% 和 33% 的 CPU。

在多核系统上，CPU 时间的份额分布在所有 CPU 核心上。即使容器被限制在不到 100% 的 CPU 时间，它也可以使用每个独立 CPU 核心的 100%。

例如，考虑一个拥有超过三个核心的系统。如果您启动一个容器 {C0}，设置 -c=512 并运行一个进程，以及另一个容器 {C1}，设置 -c=1024 并运行两个进程，这可能导致以下 CPU 份额划分

PID    container	CPU	CPU share
100    {C0}		0	100% of CPU0
101    {C1}		1	100% of CPU1
102    {C1}		2	100% of CPU2

CPU 周期约束

默认的 CPU CFS（完全公平调度器）周期为 100ms。我们可以使用 --cpu-period 来设置 CPU 的周期，以限制容器的 CPU 使用。通常 --cpu-period 应该与 --cpu-quota 一起使用。

示例

$ docker run -it --cpu-period=50000 --cpu-quota=25000 ubuntu:24.04 /bin/bash

如果有 1 个 CPU，这意味着容器每 50ms 可以获得 50% 的 CPU 运行时间。

除了使用 --cpu-period 和 --cpu-quota 来设置 CPU 周期约束外，还可以指定一个带有浮点数的 --cpus 来达到相同的目的。例如，如果有 1 个 CPU，那么 --cpus=0.5 将达到与设置 --cpu-period=50000 和 --cpu-quota=25000（50% CPU）相同的结果。

--cpus 的默认值为 0.000，表示没有限制。

更多信息，请参阅关于带宽限制的 CFS 文档。

CPU 配额约束

--cpu-quota 标志限制容器的 CPU 使用率。默认值 0 允许容器占用 100% 的 CPU 资源（1 个 CPU）。CFS（完全公平调度器）处理执行进程的资源分配，是内核使用的默认 Linux 调度器。将此值设置为 50000 可将容器限制为 50% 的 CPU 资源。对于多个 CPU，请根据需要调整 --cpu-quota。更多信息，请参阅关于带宽限制的 CFS 文档。

块 IO 带宽 (Blkio) 约束

默认情况下，所有容器获得相同比例的块 IO 带宽（blkio）。此比例为 500。要修改此比例，请使用 --blkio-weight 标志更改容器的 blkio 权重，相对于所有其他正在运行的容器的权重。

注意
blkio 权重设置仅适用于直接 IO。目前不支持缓冲 IO。

--blkio-weight 标志可以将权重设置为 10 到 1000 之间的值。例如，下面的命令创建了两个具有不同 blkio 权重的容器

$ docker run -it --name c1 --blkio-weight 300 ubuntu:24.04 /bin/bash
$ docker run -it --name c2 --blkio-weight 600 ubuntu:24.04 /bin/bash

如果你同时在两个容器中进行块 IO 操作，例如通过以下方式：

$ time dd if=/mnt/zerofile of=test.out bs=1M count=1024 oflag=direct

你会发现，时间比例与两个容器的 blkio 权重比例相同。

--blkio-weight-device="DEVICE_NAME:WEIGHT" 标志设置特定的设备权重。DEVICE_NAME:WEIGHT 是一个包含冒号分隔的设备名和权重的字符串。例如，将 /dev/sda 的设备权重设置为 200

$ docker run -it \
    --blkio-weight-device "/dev/sda:200" \
    ubuntu

如果您同时指定了 --blkio-weight 和 --blkio-weight-device，Docker 会使用 --blkio-weight 作为默认权重，并使用 --blkio-weight-device 在特定设备上用新值覆盖此默认值。以下示例使用默认权重 300，并在 /dev/sda 上覆盖此默认值，将其权重设置为 200

$ docker run -it \
    --blkio-weight 300 \
    --blkio-weight-device "/dev/sda:200" \
    ubuntu

--device-read-bps 标志限制从设备的读取速率（字节/秒）。例如，此命令创建一个容器，并限制从 /dev/sda 读取的速率为每秒 1mb

$ docker run -it --device-read-bps /dev/sda:1mb ubuntu

--device-write-bps 标志限制向设备写入的速率（字节/秒）。例如，此命令创建一个容器，并限制向 /dev/sda 写入的速率为每秒 1mb

$ docker run -it --device-write-bps /dev/sda:1mb ubuntu

两个标志都接受 <device-path>:<limit>[unit] 格式的限制。读取和写入速率都必须是正整数。您可以以 kb (千字节)、mb (兆字节) 或 gb (吉字节) 指定速率。

--device-read-iops 标志限制从设备的读取速率（IO 每秒）。例如，此命令创建一个容器，并限制从 /dev/sda 的读取速率为每秒 1000 IO

$ docker run -it --device-read-iops /dev/sda:1000 ubuntu

--device-write-iops 标志限制向设备写入的速率（IO 每秒）。例如，此命令创建一个容器，并限制向 /dev/sda 的写入速率为每秒 1000 IO

$ docker run -it --device-write-iops /dev/sda:1000 ubuntu

两个标志都采用 <device-path>:<limit> 格式的限制。读取和写入速率都必须是正整数。

附加组

--group-add: Add additional groups to run as

默认情况下，docker 容器进程使用为指定用户查找的补充组来运行。如果想要向该组列表中添加更多内容，可以使用此标志

$ docker run --rm --group-add audio --group-add nogroup --group-add 777 busybox id

uid=0(root) gid=0(root) groups=10(wheel),29(audio),99(nogroup),777

运行时权限和 Linux 能力

选项	描述
`--cap-add`	添加 Linux 能力
`--cap-drop`	删除 Linux 能力
`--privileged`	为此容器授予扩展权限
`--device=[]`	允许您在没有 `--privileged` 标志的情况下在容器内运行设备。

默认情况下，Docker 容器是“非特权的”，例如，不能在 Docker 容器内运行 Docker 守护进程。这是因为默认情况下，容器不允许访问任何设备，但“特权”容器被授予访问所有设备的权限（请参阅有关 cgroups 设备的文档）。

--privileged 标志赋予容器所有能力。当操作员执行 docker run --privileged 时，Docker 启用对主机上所有设备的访问，并重新配置 AppArmor 或 SELinux，以允许容器几乎拥有与主机上容器外运行的进程相同的访问权限。请谨慎使用此标志。有关 --privileged 标志的更多信息，请参阅 docker run 参考。

如果您想限制对特定一个或多个设备的访问，可以使用 --device 标志。它允许您指定一个或多个将在容器内可访问的设备。

$ docker run --device=/dev/snd:/dev/snd ...

默认情况下，容器将能够对这些设备进行 `read`、`write` 和 `mknod` 操作。这可以通过为每个 `--device` 标志使用第三个 `:rwm` 选项集来覆盖

$ docker run --device=/dev/sda:/dev/xvdc --rm -it ubuntu fdisk  /dev/xvdc

Command (m for help): q
$ docker run --device=/dev/sda:/dev/xvdc:r --rm -it ubuntu fdisk  /dev/xvdc
You will not be able to write the partition table.

Command (m for help): q

$ docker run --device=/dev/sda:/dev/xvdc:w --rm -it ubuntu fdisk  /dev/xvdc
    crash....

$ docker run --device=/dev/sda:/dev/xvdc:m --rm -it ubuntu fdisk  /dev/xvdc
fdisk: unable to open /dev/xvdc: Operation not permitted

除了 --privileged 之外，操作员还可以使用 --cap-add 和 --cap-drop 对能力进行精细控制。默认情况下，Docker 有一个默认保留的能力列表。下表列出了默认允许并可以被丢弃的 Linux 能力选项。

能力键	能力描述
AUDIT_WRITE	向内核审计日志写入记录。
CHOWN	对文件 UID 和 GID 进行任意更改（见 chown(2)）。
DAC_OVERRIDE	绕过文件读、写和执行权限检查。
FOWNER	绕过通常要求进程的文件系统 UID 与文件 UID 匹配的操作的权限检查。
FSETID	当文件被修改时，不要清除 set-user-ID 和 set-group-ID 权限位。
KILL	绕过发送信号的权限检查。
MKNOD	使用 mknod(2) 创建特殊文件。
NET_BIND_SERVICE	将套接字绑定到互联网域特权端口（端口号小于 1024）。
NET_RAW	使用 RAW 和 PACKET 套接字。
SETFCAP	设置文件能力。
SETGID	对进程 GID 和补充 GID 列表进行任意操作。
SETPCAP	修改进程能力。
SETUID	对进程 UID 进行任意操作。
SYS_CHROOT	使用 chroot(2)，更改根目录。

下表显示了默认未授予但可以添加的能力。

能力键	能力描述
AUDIT_CONTROL	启用和禁用内核审计；更改审计过滤规则；检索审计状态和过滤规则。
AUDIT_READ	允许通过多播 netlink 套接字读取审计日志。
BLOCK_SUSPEND	允许阻止系统挂起。
BPF	允许创建 BPF 映射，加载 BPF 类型格式（BTF）数据，检索 BPF 程序的 JITed 代码等。
CHECKPOINT_RESTORE	允许检查点/恢复相关操作。在内核 5.9 中引入。
DAC_READ_SEARCH	绕过文件读取权限检查以及目录读取和执行权限检查。
IPC_LOCK	锁定内存（mlock(2)、mlockall(2)、mmap(2)、shmctl(2)）。
IPC_OWNER	绕过对 System V IPC 对象操作的权限检查。
LEASE	在任意文件上建立租约（见 fcntl(2)）。
LINUX_IMMUTABLE	设置 FS_APPEND_FL 和 FS_IMMUTABLE_FL i-node 标志。
MAC_ADMIN	允许 MAC 配置或状态更改。为 Smack LSM 实现。
MAC_OVERRIDE	覆盖强制访问控制 (MAC)。为 Smack Linux 安全模块 (LSM) 实现。
NET_ADMIN	执行各种与网络相关的操作。
NET_BROADCAST	进行套接字广播，并监听多播。
PERFMON	允许使用 perf_events、i915_perf 和其他内核子系统进行系统性能和可观察性特权操作
SYS_ADMIN	执行一系列系统管理操作。
SYS_BOOT	使用 reboot(2) 和 kexec_load(2)，重启并加载一个新内核以供后续执行。
SYS_MODULE	加载和卸载内核模块。
SYS_NICE	提高进程的 nice 值（nice(2)、setpriority(2)），并更改任意进程的 nice 值。
SYS_PACCT	使用 acct(2)，打开或关闭进程记账。
SYS_PTRACE	使用 ptrace(2) 跟踪任意进程。
SYS_RAWIO	执行 I/O 端口操作（iopl(2) 和 ioperm(2)）。
SYS_RESOURCE	覆盖资源限制。
SYS_TIME	设置系统时钟（settimeofday(2)、stime(2)、adjtimex(2)）；设置实时（硬件）时钟。
SYS_TTY_CONFIG	使用 vhangup(2)；在虚拟终端上使用各种特权的 ioctl(2) 操作。
SYSLOG	执行特权的 syslog(2) 操作。
WAKE_ALARM	触发可以唤醒系统的事件。

更多参考信息可在 capabilities(7) - Linux 手册页以及 Linux 内核源代码中找到。

两个标志都支持值 ALL，因此要允许容器使用除 MKNOD 之外的所有能力

$ docker run --cap-add=ALL --cap-drop=MKNOD ...

--cap-add 和 --cap-drop 标志接受以 CAP_ 前缀指定的能力。因此，以下示例是等效的

$ docker run --cap-add=SYS_ADMIN ...
$ docker run --cap-add=CAP_SYS_ADMIN ...

为了与网络堆栈交互，他们应该使用 --cap-add=NET_ADMIN 来修改网络接口，而不是使用 --privileged。

$ docker run -it --rm  ubuntu:24.04 ip link add dummy0 type dummy

RTNETLINK answers: Operation not permitted

$ docker run -it --rm --cap-add=NET_ADMIN ubuntu:24.04 ip link add dummy0 type dummy

要挂载一个基于 FUSE 的文件系统，您需要同时组合使用 --cap-add 和 --device

$ docker run --rm -it --cap-add SYS_ADMIN sshfs sshfs sven@10.10.10.20:/home/sven /mnt

fuse: failed to open /dev/fuse: Operation not permitted

$ docker run --rm -it --device /dev/fuse sshfs sshfs sven@10.10.10.20:/home/sven /mnt

fusermount: mount failed: Operation not permitted

$ docker run --rm -it --cap-add SYS_ADMIN --device /dev/fuse sshfs

# sshfs sven@10.10.10.20:/home/sven /mnt
The authenticity of host '10.10.10.20 (10.10.10.20)' can't be established.
ECDSA key fingerprint is 25:34:85:75:25:b0:17:46:05:19:04:93:b5:dd:5f:c6.
Are you sure you want to continue connecting (yes/no)? yes
sven@10.10.10.20's password:

root@30aa0cfaf1b5:/# ls -la /mnt/src/docker

total 1516
drwxrwxr-x 1 1000 1000   4096 Dec  4 06:08 .
drwxrwxr-x 1 1000 1000   4096 Dec  4 11:46 ..
-rw-rw-r-- 1 1000 1000     16 Oct  8 00:09 .dockerignore
-rwxrwxr-x 1 1000 1000    464 Oct  8 00:09 .drone.yml
drwxrwxr-x 1 1000 1000   4096 Dec  4 06:11 .git
-rw-rw-r-- 1 1000 1000    461 Dec  4 06:08 .gitignore
....

默认的 seccomp 配置文件会根据所选的能力进行调整，以允许使用这些能力所允许的设施，因此您不需要调整它。

覆盖镜像默认值

当您从 Dockerfile 构建镜像或提交镜像时，您可以设置一些默认参数，这些参数在镜像作为容器启动时生效。当您运行镜像时，可以使用 docker run 命令的标志来覆盖这些默认值。

默认入口点
默认命令和选项
暴露端口
环境变量
健康检查
用户
工作目录

默认命令和选项

docker run 的命令语法支持可选地为容器的入口点指定命令和参数，在以下概要示例中表示为 [COMMAND] 和 [ARG...]

$ docker run [OPTIONS] IMAGE[:TAG|@DIGEST] [COMMAND] [ARG...]

这个命令是可选的，因为创建 IMAGE 的人可能已经使用 Dockerfile 的 CMD 指令提供了一个默认的 COMMAND。当你运行一个容器时，你可以通过指定一个新的 COMMAND 来覆盖那个 CMD 指令。

如果镜像还指定了 ENTRYPOINT，那么 CMD 或 COMMAND 会作为参数附加到 ENTRYPOINT 后面。

默认入口点

--entrypoint="": Overwrite the default entrypoint set by the image

入口点指的是运行容器时调用的默认可执行文件。容器的入口点是使用 Dockerfile 的 ENTRYPOINT 指令定义的。它类似于指定一个默认命令，因为它也指定了，但区别在于您需要传递一个显式标志来覆盖入口点，而您可以使用位置参数覆盖默认命令。这定义了容器的默认行为，其理念是当您设置一个入口点时，您可以像运行该二进制文件一样运行容器，带有默认选项，并且您可以将更多选项作为命令传入。但有时您可能想在容器内运行其他东西。这时在运行时覆盖默认入口点就很有用，可以使用 docker run 命令的 --entrypoint 标志。

--entrypoint 标志需要一个字符串值，表示您希望在容器启动时调用的二进制文件的名称或路径。以下示例向您展示了如何在已设置为自动运行某个其他二进制文件（如 /usr/bin/redis-server）的容器中运行 Bash shell

$ docker run -it --entrypoint /bin/bash example/redis

以下示例展示了如何使用位置命令参数向自定义入口点传递附加参数

$ docker run -it --entrypoint /bin/bash example/redis -c ls -l
$ docker run -it --entrypoint /usr/bin/redis-cli example/redis --help

您可以通过传递一个空字符串来重置容器的入口点，例如

$ docker run -it --entrypoint="" mysql bash

注意
传递 --entrypoint 会清除镜像上设置的任何默认命令。也就是说，用于构建它的 Dockerfile 中的任何 CMD 指令都会被清除。

公开的端口

默认情况下，当您运行一个容器时，容器的任何端口都不会暴露给主机。这意味着您将无法访问容器可能正在监听的任何端口。要使容器的端口可从主机访问，您需要发布这些端口。

您可以使用 -P 或 -p 标志启动容器以暴露其端口

-P (或 --publish-all) 标志将所有暴露的端口发布到主机。Docker 将每个暴露的端口绑定到主机上的一个随机端口。
-P 标志只发布那些被明确标记为暴露的端口号，无论是使用 Dockerfile 的 EXPOSE 指令还是 docker run 命令的 --expose 标志。
-p（或 --publish）标志允许您明确地将容器中的单个端口或端口范围映射到主机。

容器内部的端口号（服务监听的端口）不必与容器外部发布的端口号（客户端连接的端口）相匹配。例如，在容器内部，一个 HTTP 服务可能在 80 端口上监听。在运行时，该端口可能被绑定到主机上的 42800 端口。要查找主机端口和暴露端口之间的映射，请使用 docker port 命令。

环境变量

在创建 Linux 容器时，Docker 会自动设置一些环境变量。在创建 Windows 容器时，Docker 不会设置任何环境变量。

以下环境变量是为 Linux 容器设置的

变量	值
`HOME`	根据 `USER` 的值设置
`HOSTNAME`	与容器关联的主机名
`PATH`	包括常用目录，例如 `/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin`
`TERM`	如果容器被分配了伪 TTY，则为 `xterm`

此外，您可以通过使用一个或多个 -e 标志在容器中设置任何环境变量。您甚至可以覆盖上面提到的变量，或者在构建镜像时使用 Dockerfile 的 ENV 指令定义的变量。

如果您命名一个环境变量而不指定值，主机上该命名变量的当前值将被传播到容器的环境中

$ export today=Wednesday
$ docker run -e "deep=purple" -e today --rm alpine env

PATH=/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin
HOSTNAME=d2219b854598
deep=purple
today=Wednesday
HOME=/root

PS C:\> docker run --rm -e "foo=bar" microsoft/nanoserver cmd /s /c set
ALLUSERSPROFILE=C:\ProgramData
APPDATA=C:\Users\ContainerAdministrator\AppData\Roaming
CommonProgramFiles=C:\Program Files\Common Files
CommonProgramFiles(x86)=C:\Program Files (x86)\Common Files
CommonProgramW6432=C:\Program Files\Common Files
COMPUTERNAME=C2FAEFCC8253
ComSpec=C:\Windows\system32\cmd.exe
foo=bar
LOCALAPPDATA=C:\Users\ContainerAdministrator\AppData\Local
NUMBER_OF_PROCESSORS=8
OS=Windows_NT
Path=C:\Windows\system32;C:\Windows;C:\Windows\System32\Wbem;C:\Windows\System32\WindowsPowerShell\v1.0\;C:\Users\ContainerAdministrator\AppData\Local\Microsoft\WindowsApps
PATHEXT=.COM;.EXE;.BAT;.CMD
PROCESSOR_ARCHITECTURE=AMD64
PROCESSOR_IDENTIFIER=Intel64 Family 6 Model 62 Stepping 4, GenuineIntel
PROCESSOR_LEVEL=6
PROCESSOR_REVISION=3e04
ProgramData=C:\ProgramData
ProgramFiles=C:\Program Files
ProgramFiles(x86)=C:\Program Files (x86)
ProgramW6432=C:\Program Files
PROMPT=$P$G
PUBLIC=C:\Users\Public
SystemDrive=C:
SystemRoot=C:\Windows
TEMP=C:\Users\ContainerAdministrator\AppData\Local\Temp
TMP=C:\Users\ContainerAdministrator\AppData\Local\Temp
USERDOMAIN=User Manager
USERNAME=ContainerAdministrator
USERPROFILE=C:\Users\ContainerAdministrator
windir=C:\Windows

健康检查

docker run 命令的以下标志允许您控制容器健康检查的参数

选项	描述
`--health-cmd`	运行以检查健康的命令
`--health-interval`	两次检查之间的时间
`--health-retries`	报告不健康状态所需的连续失败次数
`--health-timeout`	允许一次检查运行的最长时间
`--health-start-period`	容器初始化到开始健康重试倒计时前的启动周期
`--health-start-interval`	在启动期间运行检查的时间间隔
`--no-healthcheck`	禁用任何容器指定的 `HEALTHCHECK`

示例

$ docker run --name=test -d \
    --health-cmd='stat /etc/passwd || exit 1' \
    --health-interval=2s \
    busybox sleep 1d
$ sleep 2; docker inspect --format='{{.State.Health.Status}}' test
healthy
$ docker exec test rm /etc/passwd
$ sleep 2; docker inspect --format='{{json .State.Health}}' test
{
  "Status": "unhealthy",
  "FailingStreak": 3,
  "Log": [
    {
      "Start": "2016-05-25T17:22:04.635478668Z",
      "End": "2016-05-25T17:22:04.7272552Z",
      "ExitCode": 0,
      "Output": "  File: /etc/passwd\n  Size: 334       \tBlocks: 8          IO Block: 4096   regular file\nDevice: 32h/50d\tInode: 12          Links: 1\nAccess: (0664/-rw-rw-r--)  Uid: (    0/    root)   Gid: (    0/    root)\nAccess: 2015-12-05 22:05:32.000000000\nModify: 2015..."
    },
    {
      "Start": "2016-05-25T17:22:06.732900633Z",
      "End": "2016-05-25T17:22:06.822168935Z",
      "ExitCode": 0,
      "Output": "  File: /etc/passwd\n  Size: 334       \tBlocks: 8          IO Block: 4096   regular file\nDevice: 32h/50d\tInode: 12          Links: 1\nAccess: (0664/-rw-rw-r--)  Uid: (    0/    root)   Gid: (    0/    root)\nAccess: 2015-12-05 22:05:32.000000000\nModify: 2015..."
    },
    {
      "Start": "2016-05-25T17:22:08.823956535Z",
      "End": "2016-05-25T17:22:08.897359124Z",
      "ExitCode": 1,
      "Output": "stat: can't stat '/etc/passwd': No such file or directory\n"
    },
    {
      "Start": "2016-05-25T17:22:10.898802931Z",
      "End": "2016-05-25T17:22:10.969631866Z",
      "ExitCode": 1,
      "Output": "stat: can't stat '/etc/passwd': No such file or directory\n"
    },
    {
      "Start": "2016-05-25T17:22:12.971033523Z",
      "End": "2016-05-25T17:22:13.082015516Z",
      "ExitCode": 1,
      "Output": "stat: can't stat '/etc/passwd': No such file or directory\n"
    }
  ]
}

健康状态也会显示在 docker ps 的输出中。

用户

容器内的默认用户是 root (uid = 0)。您可以使用 Dockerfile 的 USER 指令设置一个默认用户来运行第一个进程。启动容器时，您可以通过传递 -u 选项来覆盖 USER 指令。

-u="", --user="": Sets the username or UID used and optionally the groupname or GID for the specified command.

以下示例都是有效的

--user=[ user | user:group | uid | uid:gid | user:gid | uid:group ]

注意
如果您传递一个数字用户 ID，它必须在 0-2147483647 的范围内。如果您传递一个用户名，该用户必须存在于容器中。

工作目录

在容器内运行二进制文件的默认工作目录是根目录 (/)。镜像的默认工作目录是使用 Dockerfile 的 WORKDIR 命令设置的。您可以使用 docker run 命令的 -w (或 --workdir) 标志来覆盖镜像的默认工作目录

$ docker run --rm -w /my/workdir alpine pwd
/my/workdir

如果目录在容器中尚不存在，它将被创建。

运行容器

通用形式

镜像引用

镜像摘要

选项

命令和参数

前台和后台

容器标识

容器网络

文件系统挂载

卷挂载

绑定挂载

退出状态

125

126

127

其他退出代码

资源运行时约束

用户内存约束

内核内存约束

交换性约束

CPU 周期约束

Cpuset 约束

CPU 配额约束

块 IO 带宽 (Blkio) 约束

附加组

运行时权限和 Linux 能力

覆盖镜像默认值

默认命令和选项

默认入口点

公开的端口

环境变量

健康检查

用户

工作目录