容器生命周期钩子

本页面介绍了 kubelet 管理的容器如何使用容器生命周期钩子框架来运行由其管理生命周期中的事件触发的代码。

概述

类似于许多具有组件生命周期钩子的编程语言框架(例如 Angular),Kubernetes 为容器提供了生命周期钩子。钩子使容器能够感知其管理生命周期中的事件,并在执行相应的生命周期钩子时运行在处理程序中实现的代码。

容器钩子

容器可以使用两种钩子

PostStart

此钩子在容器创建后立即执行。但是,不能保证钩子会在容器 ENTRYPOINT 之前执行。没有参数传递给处理程序。

PreStop

此钩子在容器由于 API 请求或管理事件(例如活跃性/启动探针失败、抢占、资源争用等)而终止之前立即调用。如果容器已处于终止或完成状态,则对 PreStop 钩子的调用将失败,并且钩子必须在发送用于停止容器的 TERM 信号之前完成。Pod 的终止宽限期倒计时在 PreStop 钩子执行之前开始,因此无论处理程序的结果如何,容器最终都会在 Pod 的终止宽限期内终止。没有参数传递给处理程序。

有关终止行为的更详细说明,请参阅Pod 的终止

钩子处理程序实现

容器可以通过为该钩子实现和注册处理程序来访问钩子。可以为容器实现三种类型的钩子处理程序

  • Exec - 在容器的 cgroup 和命名空间内执行特定命令,例如 pre-stop.sh。命令消耗的资源计入容器。
  • HTTP - 对容器上的特定端点执行 HTTP 请求。
  • Sleep - 在指定的时间段内暂停容器。这是一个 Beta 级功能,默认情况下由 PodLifecycleSleepAction 功能门控启用。

钩子处理程序执行

当调用容器生命周期管理钩子时,Kubernetes 管理系统会根据钩子操作执行处理程序,httpGettcpSocketsleep 由 kubelet 进程执行,而 exec 在容器中执行。

在包含容器的 Pod 上下文中,钩子处理程序调用是同步的。这意味着对于 PostStart 钩子,容器 ENTRYPOINT 和钩子是异步触发的。但是,如果钩子运行时间过长或挂起,则容器无法达到 running 状态。

PreStop 钩子不会与停止容器的信号异步执行;钩子必须在发送 TERM 信号之前完成其执行。如果 PreStop 钩子在执行期间挂起,则 Pod 的阶段将为 Terminating 并保持该状态,直到 Pod 在其 terminationGracePeriodSeconds 过期后被终止。此宽限期适用于 PreStop 钩子执行和容器正常停止所需的总时间。例如,如果 terminationGracePeriodSeconds 为 60,并且钩子需要 55 秒才能完成,而容器在收到信号后需要 10 秒才能正常停止,则容器将在其正常停止之前被终止,因为 terminationGracePeriodSeconds 小于这两件事发生的总时间 (55+10)。

如果 PostStartPreStop 钩子失败,它将终止容器。

用户应尽可能使其钩子处理程序轻量级。但是,在某些情况下,长时间运行的命令是有意义的,例如在停止容器之前保存状态。

钩子传递保证

钩子传递旨在*至少一次*,这意味着对于任何给定事件(例如 PostStartPreStop),钩子可能会被调用多次。由钩子实现来正确处理这种情况。

通常,只进行一次传递。例如,如果 HTTP 钩子接收器关闭且无法接收流量,则不会尝试重新发送。但是,在极少数情况下,可能会发生两次传递。例如,如果 kubelet 在发送钩子期间重新启动,则钩子可能会在 kubelet 恢复后重新发送。

调试钩子处理程序

钩子处理程序的日志不会在 Pod 事件中公开。如果处理程序由于某种原因失败,它会广播一个事件。对于 PostStart,这是 FailedPostStartHook 事件,对于 PreStop,这是 FailedPreStopHook 事件。要自己生成失败的 FailedPostStartHook 事件,请修改 lifecycle-events.yaml 文件以将 postStart 命令更改为“badcommand”并应用它。以下是运行 kubectl describe pod lifecycle-demo 后看到的事件输出示例

Events:
  Type     Reason               Age              From               Message
  ----     ------               ----             ----               -------
  Normal   Scheduled            7s               default-scheduler  Successfully assigned default/lifecycle-demo to ip-XXX-XXX-XX-XX.us-east-2...
  Normal   Pulled               6s               kubelet            Successfully pulled image "nginx" in 229.604315ms
  Normal   Pulling              4s (x2 over 6s)  kubelet            Pulling image "nginx"
  Normal   Created              4s (x2 over 5s)  kubelet            Created container lifecycle-demo-container
  Normal   Started              4s (x2 over 5s)  kubelet            Started container lifecycle-demo-container
  Warning  FailedPostStartHook  4s (x2 over 5s)  kubelet            Exec lifecycle hook ([badcommand]) for Container "lifecycle-demo-container" in Pod "lifecycle-demo_default(30229739-9651-4e5a-9a32-a8f1688862db)" failed - error: command 'badcommand' exited with 126: , message: "OCI runtime exec failed: exec failed: container_linux.go:380: starting container process caused: exec: \"badcommand\": executable file not found in $PATH: unknown\r\n"
  Normal   Killing              4s (x2 over 5s)  kubelet            FailedPostStartHook
  Normal   Pulled               4s               kubelet            Successfully pulled image "nginx" in 215.66395ms
  Warning  BackOff              2s (x2 over 3s)  kubelet            Back-off restarting failed container

下一步

上次修改时间:2024 年 2 月 14 日下午 11:48 PST:将 PodLifecycleSleepAction 升级到 Beta 版 (7151fc2534)