为容器和 Pod 分配内存资源

此页面展示了如何为容器分配内存 *请求* 和内存 *限制*。容器保证拥有其请求的内存量,但不能使用超过其限制的内存。

开始之前

您需要拥有一个 Kubernetes 集群,并且 kubectl 命令行工具必须配置为与您的集群通信。建议在至少有两个节点(不充当控制平面主机)的集群上运行本教程。如果您还没有集群,可以使用 minikube 创建一个,或者可以使用以下 Kubernetes 游乐场之一

要检查版本,请输入 kubectl version

集群中的每个节点必须至少拥有 300 MiB 的内存。

本页面上的几个步骤需要您在集群中运行 metrics-server 服务。如果您已运行 metrics-server,则可以跳过这些步骤。

如果您运行的是 Minikube,请运行以下命令以启用 metrics-server

minikube addons enable metrics-server

要查看 metrics-server 是否正在运行,或其他资源指标 API (metrics.k8s.io) 提供者,请运行以下命令

kubectl get apiservices

如果资源指标 API 可用,则输出将包含对 metrics.k8s.io 的引用。

NAME
v1beta1.metrics.k8s.io

创建命名空间

创建一个命名空间,以便您在本练习中创建的资源与集群中的其他资源隔离。

kubectl create namespace mem-example

指定内存请求和内存限制

要为容器指定内存请求,请在容器的资源清单中包含 resources:requests 字段。要指定内存限制,请包含 resources:limits

在本练习中,您将创建一个包含一个容器的 Pod。该容器的内存请求为 100 MiB,内存限制为 200 MiB。以下是 Pod 的配置文件

apiVersion: v1
kind: Pod
metadata:
  name: memory-demo
  namespace: mem-example
spec:
  containers:
  - name: memory-demo-ctr
    image: polinux/stress
    resources:
      requests:
        memory: "100Mi"
      limits:
        memory: "200Mi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "150M", "--vm-hang", "1"]

配置文件中的 args 部分为容器启动时提供参数。"--vm-bytes", "150M" 参数告诉容器尝试分配 150 MiB 的内存。

创建 Pod

kubectl apply -f https://k8s.io/examples/pods/resource/memory-request-limit.yaml --namespace=mem-example

验证 Pod 容器是否正在运行

kubectl get pod memory-demo --namespace=mem-example

查看有关 Pod 的详细信息

kubectl get pod memory-demo --output=yaml --namespace=mem-example

输出显示 Pod 中的单个容器的内存请求为 100 MiB,内存限制为 200 MiB。

...
resources:
  requests:
    memory: 100Mi
  limits:
    memory: 200Mi
...

运行 kubectl top 以获取 Pod 的指标

kubectl top pod memory-demo --namespace=mem-example

输出显示 Pod 正在使用大约 162,900,000 字节的内存,约为 150 MiB。这大于 Pod 的 100 MiB 请求,但在 Pod 的 200 MiB 限制范围内。

NAME                        CPU(cores)   MEMORY(bytes)
memory-demo                 <something>  162856960

删除您的 Pod

kubectl delete pod memory-demo --namespace=mem-example

超过容器的内存限制

如果节点有可用内存,容器可以超过其内存请求。但容器不允许使用超过其内存限制的内存。如果容器分配的内存超过其限制,则该容器将成为终止候选。如果容器继续消耗超过其限制的内存,则该容器将被终止。如果已终止的容器可以重新启动,则 kubelet 会像处理其他类型的运行时故障一样重新启动它。

在本练习中,您将创建一个尝试分配超过其限制的内存的 Pod。以下是包含一个容器的 Pod 的配置文件,该容器的内存请求为 50 MiB,内存限制为 100 MiB

apiVersion: v1
kind: Pod
metadata:
  name: memory-demo-2
  namespace: mem-example
spec:
  containers:
  - name: memory-demo-2-ctr
    image: polinux/stress
    resources:
      requests:
        memory: "50Mi"
      limits:
        memory: "100Mi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "250M", "--vm-hang", "1"]

在配置文件的 args 部分,您可以看到容器将尝试分配 250 MiB 的内存,这远远超过 100 MiB 的限制。

创建 Pod

kubectl apply -f https://k8s.io/examples/pods/resource/memory-request-limit-2.yaml --namespace=mem-example

查看有关 Pod 的详细信息

kubectl get pod memory-demo-2 --namespace=mem-example

此时,容器可能正在运行或已被杀死。重复前面的命令,直到容器被杀死

NAME            READY     STATUS      RESTARTS   AGE
memory-demo-2   0/1       OOMKilled   1          24s

更详细地查看容器状态

kubectl get pod memory-demo-2 --output=yaml --namespace=mem-example

输出显示容器因内存不足 (OOM) 而被杀死

lastState:
   terminated:
     containerID: 65183c1877aaec2e8427bc95609cc52677a454b56fcb24340dbd22917c23b10f
     exitCode: 137
     finishedAt: 2017-06-20T20:52:19Z
     reason: OOMKilled
     startedAt: null

本练习中的容器可以重新启动,因此 kubelet 会重新启动它。重复此命令几次,以查看容器被反复杀死和重新启动

kubectl get pod memory-demo-2 --namespace=mem-example

输出显示容器被杀死、重新启动、再次杀死、再次重新启动,等等

kubectl get pod memory-demo-2 --namespace=mem-example
NAME            READY     STATUS      RESTARTS   AGE
memory-demo-2   0/1       OOMKilled   1          37s

kubectl get pod memory-demo-2 --namespace=mem-example
NAME            READY     STATUS    RESTARTS   AGE
memory-demo-2   1/1       Running   2          40s

查看有关 Pod 历史记录的详细信息

kubectl describe pod memory-demo-2 --namespace=mem-example

输出显示容器反复启动和失败

... Normal  Created   Created container with id 66a3a20aa7980e61be4922780bf9d24d1a1d8b7395c09861225b0eba1b1f8511
... Warning BackOff   Back-off restarting failed container

查看有关集群节点的详细信息

kubectl describe nodes

输出包含容器因内存不足而被杀死的记录

Warning OOMKilling Memory cgroup out of memory: Kill process 4481 (stress) score 1994 or sacrifice child

删除您的 Pod

kubectl delete pod memory-demo-2 --namespace=mem-example

指定节点无法容纳的内存请求

内存请求和限制与容器相关联,但将 Pod 视为具有内存请求和限制很有用。Pod 的内存请求是 Pod 中所有容器的内存请求之和。同样,Pod 的内存限制是 Pod 中所有容器的限制之和。

Pod 调度基于请求。只有当节点有足够的可用内存来满足 Pod 的内存请求时,Pod 才会被调度到该节点上运行。

在本练习中,您将创建一个内存请求如此之大的 Pod,以至于它超过了集群中任何节点的容量。以下是包含一个容器的 Pod 的配置文件,该容器的请求为 1000 GiB 的内存,这很可能超过了集群中任何节点的容量。

apiVersion: v1
kind: Pod
metadata:
  name: memory-demo-3
  namespace: mem-example
spec:
  containers:
  - name: memory-demo-3-ctr
    image: polinux/stress
    resources:
      requests:
        memory: "1000Gi"
      limits:
        memory: "1000Gi"
    command: ["stress"]
    args: ["--vm", "1", "--vm-bytes", "150M", "--vm-hang", "1"]

创建 Pod

kubectl apply -f https://k8s.io/examples/pods/resource/memory-request-limit-3.yaml --namespace=mem-example

查看 Pod 状态

kubectl get pod memory-demo-3 --namespace=mem-example

输出显示 Pod 状态为 PENDING。也就是说,Pod 尚未被调度到任何节点上运行,并且它将无限期地保持在 PENDING 状态

kubectl get pod memory-demo-3 --namespace=mem-example
NAME            READY     STATUS    RESTARTS   AGE
memory-demo-3   0/1       Pending   0          25s

查看有关 Pod 的详细信息,包括事件

kubectl describe pod memory-demo-3 --namespace=mem-example

输出显示容器由于节点内存不足而无法调度

Events:
  ...  Reason            Message
       ------            -------
  ...  FailedScheduling  No nodes are available that match all of the following predicates:: Insufficient memory (3).

内存单位

内存资源以字节为单位。您可以使用以下后缀之一将内存表示为普通整数或定点整数:E、P、T、G、M、K、Ei、Pi、Ti、Gi、Mi、Ki。例如,以下表示近似相同的值

128974848, 129e6, 129M, 123Mi

删除您的 Pod

kubectl delete pod memory-demo-3 --namespace=mem-example

如果您未指定内存限制

如果您未为容器指定内存限制,则以下情况之一适用

  • 容器对使用的内存量没有上限。容器可以使用其运行所在节点上的所有可用内存,这反过来可能会调用 OOM Killer。此外,在发生 OOM Kill 的情况下,没有资源限制的容器更有可能被杀死。

  • 容器运行在具有默认内存限制的命名空间中,并且容器会自动分配默认限制。集群管理员可以使用 LimitRange 为内存限制指定默认值。

内存请求和限制的动机

通过为集群中运行的容器配置内存请求和限制,您可以有效地利用集群节点上可用的内存资源。通过保持 Pod 的内存请求较低,您可以为 Pod 提供一个良好的调度机会。通过设置大于内存请求的内存限制,您可以实现两件事

  • Pod 可以具有内存使用量突发的活动,利用碰巧可用的内存。
  • Pod 在突发期间可以使用的内存量限制在合理范围内。

清理

删除您的命名空间。这将删除您为该任务创建的所有 Pod。

kubectl delete namespace mem-example

下一步

面向应用程序开发人员

面向集群管理员

上次修改时间:2023 年 8 月 24 日下午 6:38 PST:使用 code_sample 短代码代替 code 短代码 (e8b136c3b3)