当前位置:  首页>> 技术小册>> Kubernetes中文教程(二)

一个 Deployment 为 和提供声明式的更新能力。

你负责描述 Deployment 中的 目标状态,而 Deployment
以受控速率更改实际状态,
使其变为期望状态。你可以定义 Deployment 以创建新的 ReplicaSet,或删除现有 Deployment,
并通过新的 Deployment 收养其资源。

不要管理 Deployment 所拥有的 ReplicaSet 。
如果存在下面未覆盖的使用场景,请考虑在 Kubernetes 仓库中提出 Issue。

用例

以下是 Deployments 的典型用例:

  • [创建 Deployment 以将 ReplicaSet 上线]。ReplicaSet 在后台创建 Pod。
    检查 ReplicaSet 的上线状态,查看其是否成功。
  • 通过更新 Deployment 的 PodTemplateSpec,[声明 Pod 的新状态] 。
    新的 ReplicaSet 会被创建,Deployment 以受控速率将 Pod 从旧 ReplicaSet 迁移到新 ReplicaSet。
    每个新的 ReplicaSet 都会更新 Deployment 的修订版本。

  • 如果 Deployment 的当前状态不稳定,[回滚到较早的 Deployment 版本]。
    每次回滚都会更新 Deployment 的修订版本。

  • [扩大 Deployment 规模以承担更多负载]。
  • [暂停 Deployment 的上线] 以应用对 PodTemplateSpec 所作的多项修改,
    然后恢复其执行以启动新的上线版本。
  • [使用 Deployment 状态]来判定上线过程是否出现停滞。
  • [清理较旧的不再需要的 ReplicaSet] 。

创建 Deployment

下面是一个 Deployment 示例。其中创建了一个 ReplicaSet,负责启动三个 nginx Pod:

在该例中:

  • 创建名为 nginx-deployment(由 .metadata.name 字段标明)的 Deployment。
    该名称将成为后续创建 ReplicaSet 和 Pod 的命名基础。
    参阅[编写 Deployment 规约]获取更多详细信息。
  • 该 Deployment 创建一个 ReplicaSet,它创建三个(由 .spec.replicas 字段标明)Pod 副本。
  • .spec.selector 字段定义所创建的 ReplicaSet 如何查找要管理的 Pod。
    在这里,你选择在 Pod 模板中定义的标签(app: nginx)。
    不过,更复杂的选择规则是也可能的,只要 Pod 模板本身满足所给规则即可。

.spec.selector.matchLabels 字段是 {key,value} 键值对映射。
matchLabels 映射中的每个 {key,value} 映射等效于 matchExpressions 中的一个元素,
即其 key 字段是 “key”,operator 为 “In”,values 数组仅包含 “value”。
matchLabelsmatchExpressions 中给出的所有条件都必须满足才能匹配。

  • template 字段包含以下子字段:
    • Pod 被使用 .metadata.labels 字段打上 app: nginx 标签。
    • Pod 模板规约(即 .template.spec 字段)指示 Pod 运行一个 nginx 容器,
      该容器运行版本为 1.14.2 的 nginx [Docker Hub] 镜像。
    • 创建一个容器并使用 .spec.template.spec.containers[0].name 字段将其命名为 nginx

开始之前,请确保的 Kubernetes 集群已启动并运行。
按照以下步骤创建上述 Deployment :

  1. 通过运行以下命令创建 Deployment :

    1. kubectl apply -f https://k8s.io/examples/controllers/nginx-deployment.yaml
  1. 运行 kubectl get deployments 检查 Deployment 是否已创建。
    如果仍在创建 Deployment,则输出类似于:

    1. NAME READY UP-TO-DATE AVAILABLE AGE
    2. nginx-deployment 0/3 0 0 1s

在检查集群中的 Deployment 时,所显示的字段有:

  • NAME 列出了名字空间中 Deployment 的名称。
  • READY 显示应用程序的可用的“副本”数。显示的模式是“就绪个数/期望个数”。
  • UP-TO-DATE 显示为了达到期望状态已经更新的副本数。
  • AVAILABLE 显示应用可供用户使用的副本数。
  • AGE 显示应用程序运行的时间。

请注意期望副本数是根据 .spec.replicas 字段设置 3。

  1. 要查看 Deployment 上线状态,运行 kubectl rollout status deployment/nginx-deployment

    输出类似于:

    1. Waiting for rollout to finish: 2 out of 3 new replicas have been updated...
    2. deployment "nginx-deployment" successfully rolled out
  1. 几秒钟后再次运行 kubectl get deployments。输出类似于:

    1. NAME READY UP-TO-DATE AVAILABLE AGE
    2. nginx-deployment 3/3 3 3 18s

注意 Deployment 已创建全部三个副本,并且所有副本都是最新的(它们包含最新的 Pod 模板)
并且可用。

  1. 要查看 Deployment 创建的 ReplicaSet(rs),运行 kubectl get rs
    输出类似于:

    1. NAME DESIRED CURRENT READY AGE
    2. nginx-deployment-75675f5897 3 3 3 18s

ReplicaSet 输出中包含以下字段:

  • NAME 列出名字空间中 ReplicaSet 的名称;
  • DESIRED 显示应用的期望副本个数,即在创建 Deployment 时所定义的值。
    此为期望状态;
  • CURRENT 显示当前运行状态中的副本个数;
  • READY 显示应用中有多少副本可以为用户提供服务;
  • AGE 显示应用已经运行的时间长度。

注意 ReplicaSet 的名称格式始终为 [Deployment 名称]-[哈希]
该名称将成为所创建的 Pod 的命名基础。
其中的哈希字符串与 ReplicaSet 上的 pod-template-hash 标签一致。

  1. 要查看每个 Pod 自动生成的标签,运行 kubectl get pods --show-labels
    输出类似于:

    1. NAME READY STATUS RESTARTS AGE LABELS
    2. nginx-deployment-75675f5897-7ci7o 1/1 Running 0 18s app=nginx,pod-template-hash=3123191453
    3. nginx-deployment-75675f5897-kzszj 1/1 Running 0 18s app=nginx,pod-template-hash=3123191453
    4. nginx-deployment-75675f5897-qqcnn 1/1 Running 0 18s app=nginx,pod-template-hash=3123191453

所创建的 ReplicaSet 确保总是存在三个 nginx Pod。

你必须在 Deployment 中指定适当的选择算符和 Pod 模板标签(在本例中为 app: nginx)。
标签或者选择算符不要与其他控制器(包括其他 Deployment 和 StatefulSet)重叠。
Kubernetes 不会阻止你这样做,但是如果多个控制器具有重叠的选择算符,
它们可能会发生冲突执行难以预料的操作。

Pod-template-hash 标签

不要更改此标签。

Deployment 控制器将 pod-template-hash 标签添加到 Deployment
所创建或收留的每个 ReplicaSet 。

此标签可确保 Deployment 的子 ReplicaSets 不重叠。
标签是通过对 ReplicaSet 的 PodTemplate 进行哈希处理。
所生成的哈希值被添加到 ReplicaSet 选择算符、Pod 模板标签,并存在于在 ReplicaSet
可能拥有的任何现有 Pod 中。

更新 Deployment

仅当 Deployment Pod 模板(即 .spec.template)发生改变时,例如模板的标签或容器镜像被更新,
才会触发 Deployment 上线。其他更新(如对 Deployment 执行扩缩容的操作)不会触发上线动作。

按照以下步骤更新 Deployment:

  1. 先来更新 nginx Pod 以使用 nginx:1.16.1 镜像,而不是 nginx:1.14.2 镜像。

    1. kubectl set image deployment.v1.apps/nginx-deployment nginx=nginx:1.16.1

    或者使用下面的命令:

    1. kubectl set image deployment/nginx-deployment nginx=nginx:1.16.1

输出类似于:

  1. deployment.apps/nginx-deployment image updated

或者,可以对 Deployment 执行 edit 操作并将 .spec.template.spec.containers[0].image
nginx:1.14.2 更改至 nginx:1.16.1

  1. kubectl edit deployment/nginx-deployment

输出类似于:

  1. deployment.apps/nginx-deployment edited
  1. 要查看上线状态,运行:

    1. kubectl rollout status deployment/nginx-deployment

输出类似于:

  1. Waiting for rollout to finish: 2 out of 3 new replicas have been updated...

或者

  1. deployment "nginx-deployment" successfully rolled out

获取关于已更新的 Deployment 的更多信息:

  • 在上线成功后,可以通过运行 kubectl get deployments 来查看 Deployment:
    输出类似于:

    1. NAME READY UP-TO-DATE AVAILABLE AGE
    2. nginx-deployment 3/3 3 3 36s
  • 运行 kubectl get rs 以查看 Deployment 通过创建新的 ReplicaSet 并将其扩容到
    3 个副本并将旧 ReplicaSet 缩容到 0 个副本完成了 Pod 的更新操作:

    1. kubectl get rs

输出类似于:

  1. NAME DESIRED CURRENT READY AGE
  2. nginx-deployment-1564180365 3 3 3 6s
  3. nginx-deployment-2035384211 0 0 0 36s
  • 现在运行 get pods 应仅显示新的 Pod:

    1. kubectl get pods

输出类似于:

  1. NAME READY STATUS RESTARTS AGE
  2. nginx-deployment-1564180365-khku8 1/1 Running 0 14s
  3. nginx-deployment-1564180365-nacti 1/1 Running 0 14s
  4. nginx-deployment-1564180365-z9gth 1/1 Running 0 14s

下次要更新这些 Pod 时,只需再次更新 Deployment Pod 模板即可。

Deployment 可确保在更新时仅关闭一定数量的 Pod。默认情况下,它确保至少所需 Pod 的 75% 处于运行状态(最大不可用比例为 25%)。

Deployment 还确保仅所创建 Pod 数量只可能比期望 Pod 数高一点点。
默认情况下,它可确保启动的 Pod 个数比期望个数最多多出 125%(最大峰值 25%)。

例如,如果仔细查看上述 Deployment ,将看到它首先创建了一个新的 Pod,然后删除旧的 Pod,
并创建了新的 Pod。它不会杀死旧 Pod,直到有足够数量的新 Pod 已经出现。
在足够数量的旧 Pod 被杀死前并没有创建新 Pod。它确保至少 3 个 Pod 可用,
同时最多总共 4 个 Pod 可用。
当 Deployment 设置为 4 个副本时,Pod 的个数会介于 3 和 5 之间。

  • 获取 Deployment 的更多信息

    1. kubectl describe deployments

输出类似于:

  1. Name: nginx-deployment
  2. Namespace: default
  3. CreationTimestamp: Thu, 30 Nov 2017 10:56:25 +0000
  4. Labels: app=nginx
  5. Annotations: deployment.kubernetes.io/revision=2
  6. Selector: app=nginx
  7. Replicas: 3 desired | 3 updated | 3 total | 3 available | 0 unavailable
  8. StrategyType: RollingUpdate
  9. MinReadySeconds: 0
  10. RollingUpdateStrategy: 25% max unavailable, 25% max surge
  11. Pod Template:
  12. Labels: app=nginx
  13. Containers:
  14. nginx:
  15. Image: nginx:1.16.1
  16. Port: 80/TCP
  17. Environment: <none>
  18. Mounts: <none>
  19. Volumes: <none>
  20. Conditions:
  21. Type Status Reason
  22. ---- ------ ------
  23. Available True MinimumReplicasAvailable
  24. Progressing True NewReplicaSetAvailable
  25. OldReplicaSets: <none>
  26. NewReplicaSet: nginx-deployment-1564180365
  27. Events:
  28. Type Reason Age From Message
  29. ---- ------ ---- ---- -------
  30. Normal ScalingReplicaSet 2m deployment-controller Scaled up replica set nginx-deployment-2035384211 to 3
  31. Normal ScalingReplicaSet 24s deployment-controller Scaled up replica set nginx-deployment-1564180365 to 1
  32. Normal ScalingReplicaSet 22s deployment-controller Scaled down replica set nginx-deployment-2035384211 to 2
  33. Normal ScalingReplicaSet 22s deployment-controller Scaled up replica set nginx-deployment-1564180365 to 2
  34. Normal ScalingReplicaSet 19s deployment-controller Scaled down replica set nginx-deployment-2035384211 to 1
  35. Normal ScalingReplicaSet 19s deployment-controller Scaled up replica set nginx-deployment-1564180365 to 3
  36. Normal ScalingReplicaSet 14s deployment-controller Scaled down replica set nginx-deployment-2035384211 to 0

可以看到,当第一次创建 Deployment 时,它创建了一个 ReplicaSet(nginx-deployment-2035384211
并将其直接扩容至 3 个副本。更新 Deployment 时,它创建了一个新的 ReplicaSet
(nginx-deployment-1564180365),并将其扩容为 1,等待其就绪;然后将旧 ReplicaSet 缩容到 2,
将新的 ReplicaSet 扩容到 2 以便至少有 3 个 Pod 可用且最多创建 4 个 Pod。
然后,它使用相同的滚动更新策略继续对新的 ReplicaSet 扩容并对旧的 ReplicaSet 缩容。
最后,你将有 3 个可用的副本在新的 ReplicaSet 中,旧 ReplicaSet 将缩容到 0。

Kubernetes 在计算 availableReplicas 数值时不考虑终止过程中的 Pod,
availableReplicas 的值一定介于 replicas - maxUnavailablereplicas + maxSurge 之间。
因此,你可能在上线期间看到 Pod 个数比预期的多,Deployment 所消耗的总的资源也大于
replicas + maxSurge 个 Pod 所用的资源,直到被终止的 Pod 所设置的
terminationGracePeriodSeconds 到期为止。

翻转(多 Deployment 动态更新)

Deployment 控制器每次注意到新的 Deployment 时,都会创建一个 ReplicaSet 以启动所需的 Pod。
如果更新了 Deployment,则控制标签匹配 .spec.selector 但模板不匹配 .spec.template 的 Pod 的现有 ReplicaSet 被缩容。
最终,新的 ReplicaSet 缩放为 .spec.replicas 个副本,
所有旧 ReplicaSets 缩放为 0 个副本。

当 Deployment 正在上线时被更新,Deployment 会针对更新创建一个新的 ReplicaSet
并开始对其扩容,之前正在被扩容的 ReplicaSet 会被翻转,添加到旧 ReplicaSets 列表
并开始缩容。

例如,假定你在创建一个 Deployment 以生成 nginx:1.14.2 的 5 个副本,但接下来
更新 Deployment 以创建 5 个 nginx:1.16.1 的副本,而此时只有 3 个 nginx:1.14.2
副本已创建。在这种情况下,Deployment 会立即开始杀死 3 个 nginx:1.14.2 Pod,
并开始创建 nginx:1.16.1 Pod。它不会等待 nginx:1.14.2 的 5
个副本都创建完成后才开始执行变更动作。

更改标签选择算符

通常不鼓励更新标签选择算符。建议你提前规划选择算符。
在任何情况下,如果需要更新标签选择算符,请格外小心,
并确保自己了解这背后可能发生的所有事情。

在 API 版本 apps/v1 中,Deployment 标签选择算符在创建后是不可变的。

  • 添加选择算符时要求使用新标签更新 Deployment 规约中的 Pod 模板标签,否则将返回验证错误。
    此更改是非重叠的,也就是说新的选择算符不会选择使用旧选择算符所创建的 ReplicaSet 和 Pod,
    这会导致创建新的 ReplicaSet 时所有旧 ReplicaSet 都会被孤立。
  • 选择算符的更新如果更改了某个算符的键名,这会导致与添加算符时相同的行为。
  • 删除选择算符的操作会删除从 Deployment 选择算符中删除现有算符。
    此操作不需要更改 Pod 模板标签。现有 ReplicaSet 不会被孤立,也不会因此创建新的 ReplicaSet,
    但请注意已删除的标签仍然存在于现有的 Pod 和 ReplicaSet 中。

回滚 Deployment

有时,你可能想要回滚 Deployment;例如,当 Deployment 不稳定时(例如进入反复崩溃状态)。
默认情况下,Deployment 的所有上线记录都保留在系统中,以便可以随时回滚
(你可以通过修改修订历史记录限制来更改这一约束)。

Deployment 被触发上线时,系统就会创建 Deployment 的新的修订版本。
这意味着仅当 Deployment 的 Pod 模板(.spec.template)发生更改时,才会创建新修订版本
— 例如,模板的标签或容器镜像发生变化。
其他更新,如 Deployment 的扩缩容操作不会创建 Deployment 修订版本。
这是为了方便同时执行手动缩放或自动缩放。
换言之,当你回滚到较早的修订版本时,只有 Deployment 的 Pod 模板部分会被回滚。

  • 假设你在更新 Deployment 时犯了一个拼写错误,将镜像名称命名设置为
    nginx:1.161 而不是 nginx:1.16.1

    1. kubectl set image deployment/nginx-deployment nginx=nginx:1.161

输出类似于:

  1. deployment.apps/nginx-deployment image updated
  • 此上线进程会出现停滞。你可以通过检查上线状态来验证:

    1. kubectl rollout status deployment/nginx-deployment

输出类似于:

  1. Waiting for rollout to finish: 1 out of 3 new replicas have been updated...
  • 按 Ctrl-C 停止上述上线状态观测。有关上线停滞的详细信息,[参考这里]。
  • 你可以看到旧的副本有两个(nginx-deployment-1564180365nginx-deployment-2035384211),
    新的副本有 1 个(nginx-deployment-3066724191):

    1. kubectl get rs

输出类似于:

  1. NAME DESIRED CURRENT READY AGE
  2. nginx-deployment-1564180365 3 3 3 25s
  3. nginx-deployment-2035384211 0 0 0 36s
  4. nginx-deployment-3066724191 1 1 0 6s
  • 查看所创建的 Pod,你会注意到新 ReplicaSet 所创建的 1 个 Pod 卡顿在镜像拉取循环中。

    1. kubectl get pods

输出类似于:

  1. NAME READY STATUS RESTARTS AGE
  2. nginx-deployment-1564180365-70iae 1/1 Running 0 25s
  3. nginx-deployment-1564180365-jbqqo 1/1 Running 0 25s
  4. nginx-deployment-1564180365-hysrc 1/1 Running 0 25s
  5. nginx-deployment-3066724191-08mng 0/1 ImagePullBackOff 0 6s

Deployment 控制器自动停止有问题的上线过程,并停止对新的 ReplicaSet 扩容。
这行为取决于所指定的 rollingUpdate 参数(具体为 maxUnavailable)。
默认情况下,Kubernetes 将此值设置为 25%。

  • 获取 Deployment 描述信息:

    1. kubectl describe deployment

输出类似于:

  1. Name: nginx-deployment
  2. Namespace: default
  3. CreationTimestamp: Tue, 15 Mar 2016 14:48:04 -0700
  4. Labels: app=nginx
  5. Selector: app=nginx
  6. Replicas: 3 desired | 1 updated | 4 total | 3 available | 1 unavailable
  7. StrategyType: RollingUpdate
  8. MinReadySeconds: 0
  9. RollingUpdateStrategy: 25% max unavailable, 25% max surge
  10. Pod Template:
  11. Labels: app=nginx
  12. Containers:
  13. nginx:
  14. Image: nginx:1.161
  15. Port: 80/TCP
  16. Host Port: 0/TCP
  17. Environment: <none>
  18. Mounts: <none>
  19. Volumes: <none>
  20. Conditions:
  21. Type Status Reason
  22. ---- ------ ------
  23. Available True MinimumReplicasAvailable
  24. Progressing True ReplicaSetUpdated
  25. OldReplicaSets: nginx-deployment-1564180365
  26. NewReplicaSet: nginx-deployment-3066724191
  27. Events:
  28. FirstSeen LastSeen Count From SubObjectPath Type Reason Message
  29. --------- -------- ----- ---- ------------- -------- ------ -------
  30. 1m 1m 1 {deployment-controller } Normal ScalingReplicaSet Scaled up replica set nginx-deployment-2035384211 to 3
  31. 22s 22s 1 {deployment-controller } Normal ScalingReplicaSet Scaled up replica set nginx-deployment-1564180365 to 1
  32. 22s 22s 1 {deployment-controller } Normal ScalingReplicaSet Scaled down replica set nginx-deployment-2035384211 to 2
  33. 22s 22s 1 {deployment-controller } Normal ScalingReplicaSet Scaled up replica set nginx-deployment-1564180365 to 2
  34. 21s 21s 1 {deployment-controller } Normal ScalingReplicaSet Scaled down replica set nginx-deployment-2035384211 to 1
  35. 21s 21s 1 {deployment-controller } Normal ScalingReplicaSet Scaled up replica set nginx-deployment-1564180365 to 3
  36. 13s 13s 1 {deployment-controller } Normal ScalingReplicaSet Scaled down replica set nginx-deployment-2035384211 to 0
  37. 13s 13s 1 {deployment-controller } Normal ScalingReplicaSet Scaled up replica set nginx-deployment-3066724191 to 1

要解决此问题,需要回滚到以前稳定的 Deployment 版本。

检查 Deployment 上线历史

按照如下步骤检查回滚历史:

  1. 首先,检查 Deployment 修订历史:

    1. kubectl rollout history deployment/nginx-deployment

输出类似于:

  1. deployments "nginx-deployment"
  2. REVISION CHANGE-CAUSE
  3. 1 kubectl apply --filename=https://k8s.io/examples/controllers/nginx-deployment.yaml
  4. 2 kubectl set image deployment/nginx-deployment nginx=nginx:1.16.1
  5. 3 kubectl set image deployment/nginx-deployment nginx=nginx:1.161

CHANGE-CAUSE 的内容是从 Deployment 的 kubernetes.io/change-cause 注解复制过来的。
复制动作发生在修订版本创建时。你可以通过以下方式设置 CHANGE-CAUSE 消息:

  • 使用 kubectl annotate deployment/nginx-deployment kubernetes.io/change-cause="image updated to 1.16.1"
    为 Deployment 添加注解。
  • 手动编辑资源的清单。
  1. 要查看修订历史的详细信息,运行:

    1. kubectl rollout history deployment/nginx-deployment --revision=2

输出类似于:

  1. deployments "nginx-deployment" revision 2
  2. Labels: app=nginx
  3. pod-template-hash=1159050644
  4. Annotations: kubernetes.io/change-cause=kubectl set image deployment/nginx-deployment nginx=nginx:1.16.1
  5. Containers:
  6. nginx:
  7. Image: nginx:1.16.1
  8. Port: 80/TCP
  9. QoS Tier:
  10. cpu: BestEffort
  11. memory: BestEffort
  12. Environment Variables: <none>
  13. No volumes.

回滚到之前的修订版本

按照下面给出的步骤将 Deployment 从当前版本回滚到以前的版本(即版本 2)。

  1. 假定现在你已决定撤消当前上线并回滚到以前的修订版本:

    1. kubectl rollout undo deployment/nginx-deployment

输出类似于:

  1. deployment.apps/nginx-deployment rolled back

或者,你也可以通过使用 --to-revision 来回滚到特定修订版本:

  1. kubectl rollout undo deployment/nginx-deployment --to-revision=2

输出类似于:

  1. deployment.apps/nginx-deployment rolled back

与回滚相关的指令的更详细信息,请参考
[kubectl rollout]。

现在,Deployment 正在回滚到以前的稳定版本。正如你所看到的,Deployment
控制器生成了回滚到修订版本 2 的 DeploymentRollback 事件。

  1. 检查回滚是否成功以及 Deployment 是否正在运行,运行:

    1. kubectl get deployment nginx-deployment

输出类似于:

  1. NAME READY UP-TO-DATE AVAILABLE AGE
  2. nginx-deployment 3/3 3 3 30m
  1. 获取 Deployment 描述信息:

    1. kubectl describe deployment nginx-deployment

输出类似于:

  1. Name: nginx-deployment
  2. Namespace: default
  3. CreationTimestamp: Sun, 02 Sep 2018 18:17:55 -0500
  4. Labels: app=nginx
  5. Annotations: deployment.kubernetes.io/revision=4
  6. kubernetes.io/change-cause=kubectl set image deployment/nginx-deployment nginx=nginx:1.16.1
  7. Selector: app=nginx
  8. Replicas: 3 desired | 3 updated | 3 total | 3 available | 0 unavailable
  9. StrategyType: RollingUpdate
  10. MinReadySeconds: 0
  11. RollingUpdateStrategy: 25% max unavailable, 25% max surge
  12. Pod Template:
  13. Labels: app=nginx
  14. Containers:
  15. nginx:
  16. Image: nginx:1.16.1
  17. Port: 80/TCP
  18. Host Port: 0/TCP
  19. Environment: <none>
  20. Mounts: <none>
  21. Volumes: <none>
  22. Conditions:
  23. Type Status Reason
  24. ---- ------ ------
  25. Available True MinimumReplicasAvailable
  26. Progressing True NewReplicaSetAvailable
  27. OldReplicaSets: <none>
  28. NewReplicaSet: nginx-deployment-c4747d96c
  29. Events:
  30. Type Reason Age From Message
  31. ---- ------ ---- ---- -------
  32. Normal ScalingReplicaSet 12m deployment-controller Scaled up replica set nginx-deployment-75675f5897 to 3
  33. Normal ScalingReplicaSet 11m deployment-controller Scaled up replica set nginx-deployment-c4747d96c to 1
  34. Normal ScalingReplicaSet 11m deployment-controller Scaled down replica set nginx-deployment-75675f5897 to 2
  35. Normal ScalingReplicaSet 11m deployment-controller Scaled up replica set nginx-deployment-c4747d96c to 2
  36. Normal ScalingReplicaSet 11m deployment-controller Scaled down replica set nginx-deployment-75675f5897 to 1
  37. Normal ScalingReplicaSet 11m deployment-controller Scaled up replica set nginx-deployment-c4747d96c to 3
  38. Normal ScalingReplicaSet 11m deployment-controller Scaled down replica set nginx-deployment-75675f5897 to 0
  39. Normal ScalingReplicaSet 11m deployment-controller Scaled up replica set nginx-deployment-595696685f to 1
  40. Normal DeploymentRollback 15s deployment-controller Rolled back deployment "nginx-deployment" to revision 2
  41. Normal ScalingReplicaSet 15s deployment-controller Scaled down replica set nginx-deployment-595696685f to 0

缩放 Deployment

你可以使用如下指令缩放 Deployment:

  1. kubectl scale deployment/nginx-deployment --replicas=10

输出类似于:

  1. deployment.apps/nginx-deployment scaled

假设集群启用了[Pod 的水平自动缩放],
你可以为 Deployment 设置自动缩放器,并基于现有 Pod 的 CPU 利用率选择要运行的
Pod 个数下限和上限。

  1. kubectl autoscale deployment/nginx-deployment --min=10 --max=15 --cpu-percent=80

输出类似于:

  1. deployment.apps/nginx-deployment scaled

比例缩放

RollingUpdate 的 Deployment 支持同时运行应用程序的多个版本。
当自动缩放器缩放处于上线进程(仍在进行中或暂停)中的 RollingUpdate Deployment 时,
Deployment 控制器会平衡现有的活跃状态的 ReplicaSets(含 Pod 的 ReplicaSets)中的额外副本,
以降低风险。这称为 比例缩放(Proportional Scaling)

例如,你正在运行一个 10 个副本的 Deployment,其
[maxSurge]=3,[maxUnavailable]=2。

  • 确保 Deployment 的这 10 个副本都在运行。

    1. kubectl get deploy

    输出类似于:

    1. NAME DESIRED CURRENT UP-TO-DATE AVAILABLE AGE
    2. nginx-deployment 10 10 10 10 50s
  • 更新 Deployment 使用新镜像,碰巧该镜像无法从集群内部解析。

    1. kubectl set image deployment/nginx-deployment nginx=nginx:sometag

输出类似于:

  1. deployment.apps/nginx-deployment image updated
  • 镜像更新使用 ReplicaSet nginx-deployment-1989198191 启动新的上线过程,
    但由于上面提到的 maxUnavailable 要求,该进程被阻塞了。检查上线状态:

    1. kubectl get rs

输出类似于:

  1. NAME DESIRED CURRENT READY AGE
  2. nginx-deployment-1989198191 5 5 0 9s
  3. nginx-deployment-618515232 8 8 8 1m
  • 然后,出现了新的 Deployment 扩缩请求。自动缩放器将 Deployment 副本增加到 15。
    Deployment 控制器需要决定在何处添加 5 个新副本。如果未使用比例缩放,所有 5 个副本
    都将添加到新的 ReplicaSet 中。使用比例缩放时,可以将额外的副本分布到所有 ReplicaSet。
    较大比例的副本会被添加到拥有最多副本的 ReplicaSet,而较低比例的副本会进入到
    副本较少的 ReplicaSet。所有剩下的副本都会添加到副本最多的 ReplicaSet。
    具有零副本的 ReplicaSets 不会被扩容。

在上面的示例中,3 个副本被添加到旧 ReplicaSet 中,2 个副本被添加到新 ReplicaSet。
假定新的副本都很健康,上线过程最终应将所有副本迁移到新的 ReplicaSet 中。
要确认这一点,请运行:

  1. kubectl get deploy

输出类似于:

  1. NAME DESIRED CURRENT UP-TO-DATE AVAILABLE AGE
  2. nginx-deployment 15 18 7 8 7m

上线状态确认了副本是如何被添加到每个 ReplicaSet 的。

  1. kubectl get rs

输出类似于:

  1. NAME DESIRED CURRENT READY AGE
  2. nginx-deployment-1989198191 7 7 0 7m
  3. nginx-deployment-618515232 11 11 11 7m

暂停、恢复 Deployment 的上线过程

在你更新一个 Deployment 的时候,或者计划更新它的时候,
你可以在触发一个或多个更新之前暂停 Deployment 的上线过程。
当你准备应用这些变更时,你可以重新恢复 Deployment 上线过程。
这样做使得你能够在暂停和恢复执行之间应用多个修补程序,而不会触发不必要的上线操作。

  • 例如,对于一个刚刚创建的 Deployment:

    获取该 Deployment 信息:

    1. kubectl get deploy

输出类似于:

  1. NAME DESIRED CURRENT UP-TO-DATE AVAILABLE AGE
  2. nginx 3 3 3 3 1m

获取上线状态:

  1. kubectl get rs

输出类似于:

  1. NAME DESIRED CURRENT READY AGE
  2. nginx-2142116321 3 3 3 1m
  • 使用如下指令暂停上线:

    1. kubectl rollout pause deployment/nginx-deployment

输出类似于:

  1. deployment.apps/nginx-deployment paused
  • 接下来更新 Deployment 镜像:

    1. kubectl set image deployment/nginx-deployment nginx=nginx:1.16.1

输出类似于:

  1. deployment.apps/nginx-deployment image updated
  • 注意没有新的上线被触发:

    1. kubectl rollout history deployment/nginx-deployment

输出类似于:

  1. deployments "nginx"
  2. REVISION CHANGE-CAUSE
  3. 1 <none>
  • 获取上线状态验证现有的 ReplicaSet 没有被更改:

    1. kubectl get rs

输出类似于:

  1. NAME DESIRED CURRENT READY AGE
  2. nginx-2142116321 3 3 3 2m
  • 你可以根据需要执行很多更新操作,例如,可以要使用的资源:

    1. kubectl set resources deployment/nginx-deployment -c=nginx --limits=cpu=200m,memory=512Mi

输出类似于:

  1. deployment.apps/nginx-deployment resource requirements updated

暂停 Deployment 上线之前的初始状态将继续发挥作用,但新的更新在 Deployment
上线被暂停期间不会产生任何效果。

  • 最终,恢复 Deployment 上线并观察新的 ReplicaSet 的创建过程,其中包含了所应用的所有更新:

    1. kubectl rollout resume deployment/nginx-deployment

输出类似于这样:

  1. deployment.apps/nginx-deployment resumed
  • 观察上线的状态,直到完成。

    1. kubectl get rs -w

输出类似于:

  1. NAME DESIRED CURRENT READY AGE
  2. nginx-2142116321 2 2 2 2m
  3. nginx-3926361531 2 2 0 6s
  4. nginx-3926361531 2 2 1 18s
  5. nginx-2142116321 1 2 2 2m
  6. nginx-2142116321 1 2 2 2m
  7. nginx-3926361531 3 2 1 18s
  8. nginx-3926361531 3 2 1 18s
  9. nginx-2142116321 1 1 1 2m
  10. nginx-3926361531 3 3 1 18s
  11. nginx-3926361531 3 3 2 19s
  12. nginx-2142116321 0 1 1 2m
  13. nginx-2142116321 0 1 1 2m
  14. nginx-2142116321 0 0 0 2m
  15. nginx-3926361531 3 3 3 20s
  • 获取最近上线的状态:

    1. kubectl get rs

输出类似于:

  1. NAME DESIRED CURRENT READY AGE
  2. nginx-2142116321 0 0 0 2m
  3. nginx-3926361531 3 3 3 28s

你不可以回滚处于暂停状态的 Deployment,除非先恢复其执行状态。

Deployment 状态

Deployment 的生命周期中会有许多状态。上线新的 ReplicaSet 期间可能处于
[Progressing(进行中)],可能是
[Complete(已完成)],也可能是
[Failed(失败)]以至于无法继续进行。

进行中的 Deployment

执行下面的任务期间,Kubernetes 标记 Deployment 为进行中(Progressing)_:

  • Deployment 创建新的 ReplicaSet
  • Deployment 正在为其最新的 ReplicaSet 扩容
  • Deployment 正在为其旧有的 ReplicaSet 缩容
  • 新的 Pod 已经就绪或者可用(就绪至少持续了 [MinReadySeconds] 秒)。

当上线过程进入“Progressing”状态时,Deployment 控制器会向 Deployment 的
.status.conditions 中添加包含下面属性的状况条目:

  • type: Progressing
  • status: "True"
  • reason: NewReplicaSetCreated | reason: FoundNewReplicaSet | reason: ReplicaSetUpdated

你可以使用 kubectl rollout status 监视 Deployment 的进度。

完成的 Deployment

当 Deployment 具有以下特征时,Kubernetes 将其标记为完成(Complete);

  • 与 Deployment 关联的所有副本都已更新到指定的最新版本,这意味着之前请求的所有更新都已完成。
  • 与 Deployment 关联的所有副本都可用。
  • 未运行 Deployment 的旧副本。

当上线过程进入“Complete”状态时,Deployment 控制器会向 Deployment 的
.status.conditions 中添加包含下面属性的状况条目:

  • type: Progressing
  • status: "True"
  • reason: NewReplicaSetAvailable

这一 Progressing 状况的状态值会持续为 "True",直至新的上线动作被触发。
即使副本的可用状态发生变化(进而影响 Available 状况),Progressing 状况的值也不会变化。

你可以使用 kubectl rollout status 检查 Deployment 是否已完成。
如果上线成功完成,kubectl rollout status 返回退出代码 0。

  1. kubectl rollout status deployment/nginx-deployment

输出类似于:

  1. Waiting for rollout to finish: 2 of 3 updated replicas are available...
  2. deployment "nginx-deployment" successfully rolled out

kubectl rollout 命令获得的返回状态为 0(成功):

  1. echo $?
  1. 0

失败的 Deployment

你的 Deployment 可能会在尝试部署其最新的 ReplicaSet 受挫,一直处于未完成状态。
造成此情况一些可能因素如下:

  • 配额(Quota)不足
  • 就绪探测(Readiness Probe)失败
  • 镜像拉取错误
  • 权限不足
  • 限制范围(Limit Ranges)问题
  • 应用程序运行时的配置错误

检测此状况的一种方法是在 Deployment 规约中指定截止时间参数:
([.spec.progressDeadlineSeconds])。
.spec.progressDeadlineSeconds 给出的是一个秒数值,Deployment 控制器在(通过 Deployment 状态)
标示 Deployment 进展停滞之前,需要等待所给的时长。

以下 kubectl 命令设置规约中的 progressDeadlineSeconds,从而告知控制器
在 10 分钟后报告 Deployment 的上线没有进展:

  1. kubectl patch deployment/nginx-deployment -p '{"spec":{"progressDeadlineSeconds":600}}'

输出类似于:

  1. deployment.apps/nginx-deployment patched

超过截止时间后,Deployment 控制器将添加具有以下属性的 Deployment 状况到
Deployment 的 .status.conditions 中:

  • type: Progressing
  • status: "False"
  • reason: ProgressDeadlineExceeded

这一状况也可能会比较早地失败,因而其状态值被设置为 "False"
其原因为 ReplicaSetCreateError
一旦 Deployment 上线完成,就不再考虑其期限。

参考
[Kubernetes API Conventions]
获取更多状态状况相关的信息。

除了报告 Reason=ProgressDeadlineExceeded 状态之外,Kubernetes 对已停止的
Deployment 不执行任何操作。更高级别的编排器可以利用这一设计并相应地采取行动。
例如,将 Deployment 回滚到其以前的版本。

如果你暂停了某个 Deployment 上线,Kubernetes 不再根据指定的截止时间检查 Deployment 上线的进展。
你可以在上线过程中间安全地暂停 Deployment 再恢复其执行,这样做不会导致超出最后时限的问题。

Deployment 可能会出现瞬时性的错误,可能因为设置的超时时间过短,
也可能因为其他可认为是临时性的问题。例如,假定所遇到的问题是配额不足。
如果描述 Deployment,你将会注意到以下部分:

  1. kubectl describe deployment nginx-deployment

输出类似于:

  1. <...>
  2. Conditions:
  3. Type Status Reason
  4. ---- ------ ------
  5. Available True MinimumReplicasAvailable
  6. Progressing True ReplicaSetUpdated
  7. ReplicaFailure True FailedCreate
  8. <...>

如果运行 kubectl get deployment nginx-deployment -o yaml,Deployment 状态输出
将类似于这样:

  1. status:
  2. availableReplicas: 2
  3. conditions:
  4. - lastTransitionTime: 2016-10-04T12:25:39Z
  5. lastUpdateTime: 2016-10-04T12:25:39Z
  6. message: Replica set "nginx-deployment-4262182780" is progressing.
  7. reason: ReplicaSetUpdated
  8. status: "True"
  9. type: Progressing
  10. - lastTransitionTime: 2016-10-04T12:25:42Z
  11. lastUpdateTime: 2016-10-04T12:25:42Z
  12. message: Deployment has minimum availability.
  13. reason: MinimumReplicasAvailable
  14. status: "True"
  15. type: Available
  16. - lastTransitionTime: 2016-10-04T12:25:39Z
  17. lastUpdateTime: 2016-10-04T12:25:39Z
  18. message: 'Error creating: pods "nginx-deployment-4262182780-" is forbidden: exceeded quota:
  19. object-counts, requested: pods=1, used: pods=3, limited: pods=2'
  20. reason: FailedCreate
  21. status: "True"
  22. type: ReplicaFailure
  23. observedGeneration: 3
  24. replicas: 2
  25. unavailableReplicas: 2

最终,一旦超过 Deployment 进度限期,Kubernetes 将更新状态和进度状况的原因:

  1. Conditions:
  2. Type Status Reason
  3. ---- ------ ------
  4. Available True MinimumReplicasAvailable
  5. Progressing False ProgressDeadlineExceeded
  6. ReplicaFailure True FailedCreate

可以通过缩容 Deployment 或者缩容其他运行状态的控制器,或者直接在命名空间中增加配额
来解决配额不足的问题。如果配额条件满足,Deployment 控制器完成了 Deployment 上线操作,
Deployment 状态会更新为成功状况(Status=TrueReason=NewReplicaSetAvailable)。

  1. Conditions:
  2. Type Status Reason
  3. ---- ------ ------
  4. Available True MinimumReplicasAvailable
  5. Progressing True NewReplicaSetAvailable

type: Available 加上 status: True 意味着 Deployment 具有最低可用性。
最低可用性由 Deployment 策略中的参数指定。
type: Progressing 加上 status: True 表示 Deployment 处于上线过程中,并且正在运行,
或者已成功完成进度,最小所需新副本处于可用。
请参阅对应状况的 Reason 了解相关细节。
在我们的案例中 reason: NewReplicaSetAvailable 表示 Deployment 已完成。

你可以使用 kubectl rollout status 检查 Deployment 是否未能取得进展。
如果 Deployment 已超过进度限期,kubectl rollout status 返回非零退出代码。

  1. kubectl rollout status deployment/nginx-deployment

输出类似于:

  1. Waiting for rollout to finish: 2 out of 3 new replicas have been updated...
  2. error: deployment "nginx" exceeded its progress deadline

kubectl rollout 命令的退出状态为 1(表明发生了错误):

  1. echo $?
  1. 1

对失败 Deployment 的操作

可应用于已完成的 Deployment 的所有操作也适用于失败的 Deployment。
你可以对其执行扩缩容、回滚到以前的修订版本等操作,或者在需要对 Deployment 的
Pod 模板应用多项调整时,将 Deployment 暂停。

清理策略

你可以在 Deployment 中设置 .spec.revisionHistoryLimit 字段以指定保留此
Deployment 的多少个旧有 ReplicaSet。其余的 ReplicaSet 将在后台被垃圾回收。
默认情况下,此值为 10。

显式将此字段设置为 0 将导致 Deployment 的所有历史记录被清空,因此 Deployment 将无法回滚。

金丝雀部署

如果要使用 Deployment 向用户子集或服务器子集上线版本,
则可以遵循[资源管理]所描述的金丝雀模式,
创建多个 Deployment,每个版本一个。

编写 Deployment 规约

同其他 Kubernetes 配置一样, Deployment 需要 .apiVersion.kind.metadata 字段。
有关配置文件的其他信息,请参考[部署 Deployment]、
配置容器和[使用 kubectl 管理资源]等相关文档。

当控制面为 Deployment 创建新的 Pod 时,Deployment 的 .metadata.name 是命名这些 Pod 的部分基础。
Deployment 的名称必须是一个合法的
[DNS 子域]值,
但这会对 Pod 的主机名产生意外的结果。为获得最佳兼容性,名称应遵循更严格的
[DNS 标签]规则。

Deployment 还需要
[.spec 部分]。

Pod 模板

.spec 中只有 .spec.template.spec.selector 是必需的字段。

.spec.template 是一个 [Pod 模板]。
它和 的语法规则完全相同。
只是这里它是嵌套的,因此不需要 apiVersionkind

除了 Pod 的必填字段外,Deployment 中的 Pod 模板必须指定适当的标签和适当的重新启动策略。
对于标签,请确保不要与其他控制器重叠。请参考[选择算符]。

只有 [.spec.template.spec.restartPolicy]
等于 Always 才是被允许的,这也是在没有指定时的默认设置。

副本

.spec.replicas 是指定所需 Pod 的可选字段。它的默认值是1。

如果你对某个 Deployment 执行了手动扩缩操作(例如,通过
kubectl scale deployment deployment --replicas=X),
之后基于清单对 Deployment 执行了更新操作(例如通过运行
kubectl apply -f deployment.yaml),那么通过应用清单而完成的更新会覆盖之前手动扩缩所作的变更。

如果一个 [HorizontalPodAutoscaler]
(或者其他执行水平扩缩操作的类似 API)在管理 Deployment 的扩缩,
则不要设置 .spec.replicas

恰恰相反,应该允许 Kubernetes
来自动管理
.spec.replicas 字段。

选择算符

.spec.selector 是指定本 Deployment 的 Pod
[标签选择算符]的必需字段。

.spec.selector 必须匹配 .spec.template.metadata.labels,否则请求会被 API 拒绝。

在 API apps/v1版本中,.spec.selector.metadata.labels 如果没有设置的话,
不会被默认设置为 .spec.template.metadata.labels,所以需要明确进行设置。
同时在 apps/v1版本中,Deployment 创建后 .spec.selector 是不可变的。

当 Pod 的标签和选择算符匹配,但其模板和 .spec.template 不同时,或者此类 Pod
的总数超过 .spec.replicas 的设置时,Deployment 会终结之。
如果 Pod 总数未达到期望值,Deployment 会基于 .spec.template 创建新的 Pod。

你不应直接创建与此选择算符匹配的 Pod,也不应通过创建另一个 Deployment 或者类似于
ReplicaSet 或 ReplicationController 这类控制器来创建标签与此选择算符匹配的 Pod。
如果这样做,第一个 Deployment 会认为它创建了这些 Pod。
Kubernetes 不会阻止你这么做。

如果有多个控制器的选择算符发生重叠,则控制器之间会因冲突而无法正常工作。

策略

.spec.strategy 策略指定用于用新 Pod 替换旧 Pod 的策略。
.spec.strategy.type 可以是 “Recreate” 或 “RollingUpdate”。“RollingUpdate” 是默认值。

重新创建 Deployment

如果 .spec.strategy.type==Recreate,在创建新 Pod 之前,所有现有的 Pod 会被杀死。

这只会确保为了升级而创建新 Pod 之前其他 Pod 都已终止。如果你升级一个 Deployment,
所有旧版本的 Pod 都会立即被终止。控制器等待这些 Pod 被成功移除之后,
才会创建新版本的 Pod。如果你手动删除一个 Pod,其生命周期是由 ReplicaSet 来控制的,
后者会立即创建一个替换 Pod(即使旧的 Pod 仍然处于 Terminating 状态)。
如果你需要一种“最多 n 个”的 Pod 个数保证,你需要考虑使用
[StatefulSet]。

滚动更新 Deployment

Deployment 会在 .spec.strategy.type==RollingUpdate时,采取
滚动更新的方式更新 Pod。你可以指定 maxUnavailablemaxSurge 来控制滚动更新
过程。

最大不可用

.spec.strategy.rollingUpdate.maxUnavailable 是一个可选字段,用来指定
更新过程中不可用的 Pod 的个数上限。该值可以是绝对数字(例如,5),也可以是所需
Pod 的百分比(例如,10%)。百分比值会转换成绝对数并去除小数部分。
如果 .spec.strategy.rollingUpdate.maxSurge 为 0,则此值不能为 0。
默认值为 25%。

例如,当此值设置为 30% 时,滚动更新开始时会立即将旧 ReplicaSet 缩容到期望 Pod 个数的70%。
新 Pod 准备就绪后,可以继续缩容旧有的 ReplicaSet,然后对新的 ReplicaSet 扩容,
确保在更新期间可用的 Pod 总数在任何时候都至少为所需的 Pod 个数的 70%。

最大峰值

.spec.strategy.rollingUpdate.maxSurge 是一个可选字段,用来指定可以创建的超出期望
Pod 个数的 Pod 数量。此值可以是绝对数(例如,5)或所需 Pod 的百分比(例如,10%)。
如果 MaxUnavailable 为 0,则此值不能为 0。百分比值会通过向上取整转换为绝对数。
此字段的默认值为 25%。

例如,当此值为 30% 时,启动滚动更新后,会立即对新的 ReplicaSet 扩容,同时保证新旧 Pod
的总数不超过所需 Pod 总数的 130%。一旦旧 Pod 被杀死,新的 ReplicaSet 可以进一步扩容,
同时确保更新期间的任何时候运行中的 Pod 总数最多为所需 Pod 总数的 130%。

进度期限秒数

.spec.progressDeadlineSeconds 是一个可选字段,用于指定系统在报告 Deployment
[进展失败] 之前等待 Deployment 取得进展的秒数。
这类报告会在资源状态中体现为 type: Progressingstatus: False
reason: ProgressDeadlineExceeded。Deployment 控制器将在默认 600 毫秒内持续重试 Deployment。
将来,一旦实现了自动回滚,Deployment 控制器将在探测到这样的条件时立即回滚 Deployment。

如果指定,则此字段值需要大于 .spec.minReadySeconds 取值。

最短就绪时间

.spec.minReadySeconds 是一个可选字段,用于指定新创建的 Pod
在没有任意容器崩溃情况下的最小就绪时间,
只有超出这个时间 Pod 才被视为可用。默认值为 0(Pod 在准备就绪后立即将被视为可用)。
要了解何时 Pod 被视为就绪,
可参考[容器探针]。

修订历史限制

Deployment 的修订历史记录存储在它所控制的 ReplicaSets 中。

.spec.revisionHistoryLimit 是一个可选字段,用来设定出于回滚目的所要保留的旧 ReplicaSet 数量。
这些旧 ReplicaSet 会消耗 etcd 中的资源,并占用 kubectl get rs 的输出。
每个 Deployment 修订版本的配置都存储在其 ReplicaSets 中;因此,一旦删除了旧的 ReplicaSet,
将失去回滚到 Deployment 的对应修订版本的能力。
默认情况下,系统保留 10 个旧 ReplicaSet,但其理想值取决于新 Deployment 的频率和稳定性。

更具体地说,将此字段设置为 0 意味着将清理所有具有 0 个副本的旧 ReplicaSet。
在这种情况下,无法撤消新的 Deployment 上线,因为它的修订历史被清除了。

paused(暂停的)

.spec.paused 是用于暂停和恢复 Deployment 的可选布尔字段。
暂停的 Deployment 和未暂停的 Deployment 的唯一区别是,Deployment 处于暂停状态时,
PodTemplateSpec 的任何修改都不会触发新的上线。
Deployment 在创建时是默认不会处于暂停状态。

  • 了解 [Pod]。
  • [使用 Deployment 运行一个无状态应用]。
  • Deployment 是 Kubernetes REST API 中的一个顶层资源。
    阅读
    对象定义,以了解 Deployment 的 API 细节。
  • 阅读 [PodDisruptionBudget]
    了解如何使用它来在可能出现干扰的情况下管理应用的可用性。

该分类下的相关小册推荐: