配置 cgroup 驱动程序
本页面介绍如何为 kubeadm 集群配置 kubelet 的 cgroup 驱动程序,以匹配容器运行时的 cgroup 驱动程序。
准备工作
您应该熟悉 Kubernetes 容器运行时要求。
配置容器运行时 cgroup 驱动程序
容器运行时 页面解释说,对于基于 kubeadm 的设置,建议使用 systemd
驱动程序,而不是 kubelet 的 默认 cgroupfs
驱动程序,因为 kubeadm 将 kubelet 作为 systemd 服务 管理。
该页面还提供了有关如何默认使用 systemd
驱动程序设置多个不同容器运行时的详细信息。
配置 kubelet cgroup 驱动程序
kubeadm 允许您在 kubeadm init
期间传递 KubeletConfiguration
结构。此 KubeletConfiguration
可以包含 cgroupDriver
字段,该字段控制 kubelet 的 cgroup 驱动程序。
注意
在 v1.22 及更高版本中,如果用户未在 KubeletConfiguration
下设置 cgroupDriver
字段,则 kubeadm 将其默认为 systemd
。
在 Kubernetes v1.28 中,您可以启用 cgroup 驱动程序的自动检测作为 alpha 功能。有关更多详细信息,请参阅 systemd cgroup 驱动程序。
显式配置该字段的最小示例
# kubeadm-config.yaml
kind: ClusterConfiguration
apiVersion: kubeadm.k8s.io/v1beta3
kubernetesVersion: v1.21.0
---
kind: KubeletConfiguration
apiVersion: kubelet.config.k8s.io/v1beta1
cgroupDriver: systemd
然后可以将此类配置文件传递给 kubeadm 命令
kubeadm init --config kubeadm-config.yaml
注意
Kubeadm 对集群中的所有节点使用相同的 KubeletConfiguration
。KubeletConfiguration
存储在 kube-system
命名空间下的 ConfigMap 对象中。
执行子命令 init
、join
和 upgrade
将导致 kubeadm 将 KubeletConfiguration
作为文件写入 /var/lib/kubelet/config.yaml
下,并将其传递给本地节点 kubelet。
使用 cgroupfs
驱动程序
要使用 cgroupfs
并防止 kubeadm upgrade
修改现有设置上的 KubeletConfiguration
cgroup 驱动程序,您必须明确说明其值。这适用于您不希望未来版本的 kubeadm 默认应用 systemd
驱动程序的情况。
有关如何明确说明该值的详细信息,请参阅下面的“修改 kubelet ConfigMap”部分。
如果您希望配置容器运行时以使用 cgroupfs
驱动程序,则必须参考您选择的容器运行时的文档。
迁移到 systemd
驱动程序
要将现有 kubeadm 集群的 cgroup 驱动程序从 cgroupfs
原地更改为 systemd
,需要执行类似于 kubelet 升级的过程。这必须包括下面概述的两个步骤。
注意
或者,可以用使用systemd
驱动程序的新节点替换集群中的旧节点。这需要在加入新节点之前仅执行下面的第一步,并确保在删除旧节点之前,工作负载可以安全地移动到新节点。修改 kubelet ConfigMap
调用
kubectl edit cm kubelet-config -n kube-system
。修改现有的
cgroupDriver
值或添加一个如下所示的新字段cgroupDriver: systemd
此字段必须出现在 ConfigMap 的
kubelet:
部分下。
更新所有节点上的 cgroup 驱动程序
对于集群中的每个节点
- 使用
kubectl drain <node-name> --ignore-daemonsets
驱逐节点 - 使用
systemctl stop kubelet
停止 kubelet - 停止容器运行时
- 将容器运行时 cgroup 驱动程序修改为
systemd
- 在
/var/lib/kubelet/config.yaml
中设置cgroupDriver: systemd
- 启动容器运行时
- 使用
systemctl start kubelet
启动 kubelet - 使用
kubectl uncordon <node-name>
取消隔离节点
一次在一个节点上执行这些步骤,以确保工作负载有足够的时间安排在不同的节点上。
流程完成后,请确保所有节点和工作负载都正常。