Kubernetes 指标参考

Kubernetes 组件导出的指标数据的详细信息。

指标 (v1.30)

此页面详细介绍了不同 Kubernetes 组件导出的指标。您可以使用 HTTP 抓取查询这些组件的指标端点,并以 Prometheus 格式获取当前指标数据。

稳定 Kubernetes 指标列表

稳定指标遵守严格的 API 契约,在指标的生命周期内,不会添加或删除任何标签。

apiserver_admission_controller_admission_duration_seconds
准入控制器延迟直方图(以秒为单位),按名称标识,并按每个操作和 API 资源以及类型(验证或准入)细分。
  • 稳定
  • 直方图
  • nameoperationrejectedtype
apiserver_admission_step_admission_duration_seconds
准入子步骤延迟直方图(以秒为单位),按每个操作和 API 资源以及步骤类型(验证或准入)细分。
  • 稳定
  • 直方图
  • operationrejectedtype
apiserver_admission_webhook_admission_duration_seconds
准入 Webhook 延迟直方图(以秒为单位),按名称标识,并按每个操作和 API 资源以及类型(验证或准入)细分。
  • 稳定
  • 直方图
  • nameoperationrejectedtype
apiserver_current_inflight_requests
过去一秒内此 apiserver 每种请求类型使用的最大并发请求数。
  • 稳定
  • 仪表
  • request_kind
apiserver_longrunning_requests
所有活动的长运行 apiserver 请求的仪表,按动词、组、版本、资源、范围和组件细分。并非所有请求都以这种方式跟踪。
  • 稳定
  • 仪表
  • componentgroupresourcescopesubresourceverbversion
apiserver_requested_deprecated_apis
已请求的已弃用 API 的仪表,按 API 组、版本、资源、子资源和 removed_release 细分。
  • 稳定
  • 仪表
  • groupremoved_releaseresourcesubresourceversion
apiserver_response_sizes
每个组、版本、动词、资源、子资源、范围和组件的响应大小分布(以字节为单位)。
  • 稳定
  • 直方图
  • componentgroupresourcescopesubresourceverbversion
apiserver_storage_objects
上次检查时存储对象的数目,按类型细分。如果发生获取错误,则值为 -1。
  • 稳定
  • 仪表
  • resource
apiserver_storage_size_bytes
存储数据库文件物理分配的大小(以字节为单位)。
  • 稳定
  • 自定义
  • storage_cluster_id
container_cpu_usage_seconds_total
容器消耗的累计 CPU 时间(以核心秒为单位)
  • 稳定
  • 自定义
  • containerpodnamespace
container_memory_working_set_bytes
容器的当前工作集(以字节为单位)
  • 稳定
  • 自定义
  • containerpodnamespace
container_start_time_seconds
容器自 Unix 纪元以来的启动时间(以秒为单位)
  • 稳定
  • 自定义
  • containerpodnamespace
cronjob_controller_job_creation_skew_duration_seconds
CronJob 计划运行的时间与相应 Job 创建的时间之间的间隔
  • 稳定
  • 直方图
job_controller_job_pods_finished_total
已完成且完全跟踪的 Pod 的数量
  • 稳定
  • 计数器
  • completion_moderesult
job_controller_job_sync_duration_seconds
同步 Job 所花费的时间
  • 稳定
  • 直方图
  • actioncompletion_moderesult
job_controller_job_syncs_total
Job 同步的次数
  • 稳定
  • 计数器
  • actioncompletion_moderesult
job_controller_jobs_finished_total
已完成的 Job 的数量
  • 稳定
  • 计数器
  • completion_modereasonresult
kube_pod_resource_limit
集群中工作负载的资源限制,按 Pod 细分。这显示了调度程序和 kubelet 预计每个 Pod 的资源使用情况,以及资源的单位(如果有)。
  • 稳定
  • 自定义
  • namespacepodnodeschedulerpriorityresourceunit
kube_pod_resource_request
集群中工作负载请求的资源,按 Pod 细分。这显示了调度程序和 kubelet 预计每个 Pod 的资源使用情况,以及资源的单位(如果有)。
  • 稳定
  • 自定义
  • namespacepodnodeschedulerpriorityresourceunit
kubernetes_healthcheck
此指标记录单个健康检查的结果。
  • 稳定
  • 仪表
  • nametype
kubernetes_healthchecks_total
此指标记录所有健康检查的结果。
  • 稳定
  • 计数器
  • namestatustype
node_collector_evictions_total
自当前 NodeController 实例启动以来发生的 Node 驱逐次数。
  • 稳定
  • 计数器
  • zone
node_cpu_usage_seconds_total
节点消耗的累计 CPU 时间(以核心秒为单位)
  • 稳定
  • 自定义
node_memory_working_set_bytes
节点的当前工作集(以字节为单位)
  • 稳定
  • 自定义
pod_cpu_usage_seconds_total
Pod 消耗的累计 CPU 时间(以核心秒为单位)
  • 稳定
  • 自定义
  • podnamespace
pod_memory_working_set_bytes
Pod 的当前工作集(以字节为单位)
  • 稳定
  • 自定义
  • podnamespace
resource_scrape_error
如果获取容器指标时发生错误,则为 1,否则为 0
  • 稳定
  • 自定义
scheduler_framework_extension_point_duration_seconds
运行特定扩展点的所有插件的延迟。
  • 稳定
  • 直方图
  • extension_pointprofilestatus
scheduler_pending_pods
挂起的 Pod 数量,按队列类型细分。'active' 表示 activeQ 中的 Pod 数量;'backoff' 表示 backoffQ 中的 Pod 数量;'unschedulable' 表示调度程序尝试调度但失败的 unschedulablePods 中的 Pod 数量;'gated' 是调度程序从未尝试调度因为它们被阻止的 unschedulablePods 的数量。
  • 稳定
  • 仪表
  • queue
scheduler_pod_scheduling_attempts
成功调度 Pod 的尝试次数。
  • 稳定
  • 直方图
scheduler_pod_scheduling_duration_seconds
Pod 调度的端到端延迟,可能包括多次调度尝试。
  • 稳定
  • 直方图
  • attempts
  • 1.29.0
scheduler_preemption_attempts_total
集群中迄今为止的抢占尝试总数
  • 稳定
  • 计数器
scheduler_preemption_victims
选定的抢占受害者的数量
  • 稳定
  • 直方图
scheduler_queue_incoming_pods_total
按事件和队列类型细分的添加到调度队列中的 Pod 数量。
  • 稳定
  • 计数器
  • eventqueue
scheduler_schedule_attempts_total
调度 Pod 的尝试次数,按结果细分。'unschedulable' 表示 Pod 无法调度,而 'error' 表示调度程序内部问题。
  • 稳定
  • 计数器
  • profileresult
scheduler_scheduling_attempt_duration_seconds
调度尝试延迟(以秒为单位)(调度算法 + 绑定)
  • 稳定
  • 直方图
  • profileresult

Beta Kubernetes 指标列表

Beta 指标遵守比其稳定版本更宽松的 API 契约。在指标的生命周期内,不会删除任何标签,但是,在指标处于 Beta 阶段时,可以添加标签。这保证了 Beta 指标将遵守现有的仪表板和警报,同时允许将来进行修改。

apiserver_flowcontrol_current_executing_requests
API 优先级和公平性子系统中处于初始(对于 WATCH)或任何(对于非 WATCH)执行阶段的请求数
  • BETA
  • 仪表
  • flow_schemapriority_level
apiserver_flowcontrol_current_executing_seats
API 优先级和公平性子系统中当前正在执行(对于 WATCH 而言是初始阶段,对于其他情况而言是任何阶段)的请求所占用的并发性(座位数)
  • BETA
  • 仪表
  • flow_schemapriority_level
apiserver_flowcontrol_current_inqueue_requests
API 优先级和公平性子系统中当前在队列中等待的请求数
  • BETA
  • 仪表
  • flow_schemapriority_level
apiserver_flowcontrol_dispatched_requests_total
API 优先级和公平性子系统执行的请求数
  • BETA
  • 计数器
  • flow_schemapriority_level
apiserver_flowcontrol_nominal_limit_seats
为每个优先级级别配置的名义执行座位数
  • BETA
  • 仪表
  • priority_level
apiserver_flowcontrol_rejected_requests_total
API 优先级和公平性子系统拒绝的请求数
  • BETA
  • 计数器
  • flow_schemapriority_levelreason
apiserver_flowcontrol_request_wait_duration_seconds
请求在其队列中等待的时间长度
  • BETA
  • 直方图
  • executeflow_schemapriority_level
disabled_metrics_total
已禁用指标的计数。
  • BETA
  • 计数器
hidden_metrics_total
隐藏指标的计数。
  • BETA
  • 计数器
kubernetes_feature_enabled
此指标记录有关 k8s 功能的阶段和启用情况的数据。
  • BETA
  • 仪表
  • namestage
registered_metrics_total
按稳定性级别和弃用版本细分的已注册指标的计数。
  • BETA
  • 计数器
  • deprecated_versionstability_level
scheduler_pod_scheduling_sli_duration_seconds
Pod 调度的端到端延迟,从 Pod 进入调度队列的时间开始,可能包括多次调度尝试。
  • BETA
  • 直方图
  • attempts

Alpha Kubernetes 指标列表

Alpha 指标没有任何 API 保证。使用这些指标需自行承担风险,Kubernetes 的后续版本可能会完全删除这些指标,或以破坏现有仪表盘和警报的方式改变 API。

aggregator_discovery_aggregation_count_total
发现被聚合的次数计数器。
  • ALPHA
  • 计数器
aggregator_openapi_v2_regeneration_count
OpenAPI v2 规范重新生成计数器,按导致的 APIService 名称和原因细分。
  • ALPHA
  • 计数器
  • apiservicereason
aggregator_openapi_v2_regeneration_duration
OpenAPI v2 规范重新生成持续时间的仪表盘,以秒为单位。
  • ALPHA
  • 仪表
  • reason
aggregator_unavailable_apiservice
标记为不可用的 APIService 的仪表盘,按 APIService 名称细分。
  • ALPHA
  • 自定义
  • name
aggregator_unavailable_apiservice_total
标记为不可用的 APIService 的计数器,按 APIService 名称和原因细分。
  • ALPHA
  • 计数器
  • namereason
apiextensions_apiserver_validation_ratcheting_seconds
在 UPDATE 期间,用于比较旧版本和新版本以进行 CRDValidationRatcheting 的时间,以秒为单位。
  • ALPHA
  • 直方图
apiextensions_openapi_v2_regeneration_count
OpenAPI v2 规范重新生成计数器,按导致的 CRD 名称和原因细分。
  • ALPHA
  • 计数器
  • crdreason
apiextensions_openapi_v3_regeneration_count
OpenAPI v3 规范重新生成计数器,按组、版本、导致的 CRD 和原因细分。
  • ALPHA
  • 计数器
  • crdgroupreasonversion
apiserver_admission_match_condition_evaluation_errors_total
准入匹配条件评估错误计数,按包含匹配条件的资源名称标识,并按包含匹配条件的每个类型(webhook 或策略)、操作和准入类型(验证或准入)细分。
  • ALPHA
  • 计数器
  • kindnameoperationtype
apiserver_admission_match_condition_evaluation_seconds
准入匹配条件评估时间,以秒为单位,按名称标识,并按包含匹配条件的每个类型(webhook 或策略)、操作和类型(验证或准入)细分。
  • ALPHA
  • 直方图
  • kindnameoperationtype
apiserver_admission_match_condition_exclusions_total
准入匹配条件评估排除计数,按包含匹配条件的资源名称标识,并按包含匹配条件的每个类型(webhook 或策略)、操作和准入类型(验证或准入)细分。
  • ALPHA
  • 计数器
  • kindnameoperationtype
apiserver_admission_step_admission_duration_seconds_summary
准入子步骤延迟摘要,以秒为单位,按每个操作和 API 资源以及步骤类型(验证或准入)细分。
  • ALPHA
  • Summary
  • operationrejectedtype
apiserver_admission_webhook_fail_open_count
准入 webhook 失败打开计数,按名称标识,并按每个准入类型(验证或变异)细分。
  • ALPHA
  • 计数器
  • nametype
apiserver_admission_webhook_rejection_count
准入 webhook 拒绝计数,按名称标识,并按每个准入类型(验证或准入)和操作细分。其他标签指定错误类型(如果发生错误,则为 calling_webhook_error 或 apiserver_internal_error;否则为 no_error),以及可选的非零拒绝代码(如果 webhook 使用 HTTP 状态代码拒绝请求,则由 apiserver 遵守(当代码大于或等于 400 时)。大于 600 的代码将被截断为 600,以保持指标基数有界。
  • ALPHA
  • 计数器
  • error_typenameoperationrejection_codetype
apiserver_admission_webhook_request_total
准入 webhook 请求总数,按名称标识,并按每个准入类型(验证或变异)和操作细分。其他标签指定请求是否被拒绝以及 HTTP 状态代码。大于 600 的代码将被截断为 600,以保持指标基数有界。
  • ALPHA
  • 计数器
  • codenameoperationrejectedtype
apiserver_audit_error_total
无法正确审核的审核事件计数器。插件标识受错误影响的插件。
  • ALPHA
  • 计数器
  • plugin
apiserver_audit_event_total
生成并发送到审核后端的审核事件计数器。
  • ALPHA
  • 计数器
apiserver_audit_level_total
审核事件的策略级别计数器(每个请求 1 个)。
  • ALPHA
  • 计数器
  • level
apiserver_audit_requests_rejected_total
由于审核日志记录后端错误而被拒绝的 apiserver 请求计数器。
  • ALPHA
  • 计数器
apiserver_authentication_config_controller_automatic_reload_last_timestamp_seconds
上次自动重新加载身份验证配置的时间戳,按状态和 apiserver 标识细分。
  • ALPHA
  • 仪表
  • apiserver_id_hashstatus
apiserver_authentication_config_controller_automatic_reloads_total
身份验证配置自动重新加载的总数,按状态和 apiserver 标识细分。
  • ALPHA
  • 计数器
  • apiserver_id_hashstatus
apiserver_authentication_jwt_authenticator_latency_seconds
JWT 身份验证操作的延迟,以秒为单位。这是仅在缓存未命中时(即当缓存中未找到令牌时)花费在身份验证令牌上的时间。
  • ALPHA
  • 直方图
  • jwt_issuer_hashresult
apiserver_authorization_decisions_total
授权者做出的最终决策总数,按授权者类型、名称和决策细分。
  • ALPHA
  • 计数器
  • decisionnametype
apiserver_authorization_match_condition_evaluation_errors_total
授权 webhook 遇到匹配条件错误时的错误总数,按授权者类型和名称细分。
  • ALPHA
  • 计数器
  • nametype
apiserver_authorization_match_condition_evaluation_seconds
授权匹配条件评估时间,以秒为单位,按授权者类型和名称细分。
  • ALPHA
  • 直方图
  • nametype
apiserver_authorization_match_condition_exclusions_total
由于匹配条件将其排除在外而跳过授权 webhook 时的排除总数。
  • ALPHA
  • 计数器
  • nametype
apiserver_authorization_webhook_duration_seconds
请求延迟,以秒为单位。
  • ALPHA
  • 直方图
  • nameresult
apiserver_authorization_webhook_evaluations_fail_open_total
由于 webhook 超时或错误而导致的 NoOpinion 结果。
  • ALPHA
  • 计数器
  • nameresult
apiserver_authorization_webhook_evaluations_total
到授权 webhook 的往返次数。
  • ALPHA
  • 计数器
  • nameresult
apiserver_cache_list_fetched_objects_total
在提供 LIST 请求的过程中从监视缓存中读取的对象数量。
  • ALPHA
  • 计数器
  • indexresource_prefix
apiserver_cache_list_returned_objects_total
从监视缓存中返回的 LIST 请求的对象数量。
  • ALPHA
  • 计数器
  • resource_prefix
apiserver_cache_list_total
从监视缓存中提供的 LIST 请求数量。
  • ALPHA
  • 计数器
  • indexresource_prefix
apiserver_cel_compilation_duration_seconds
CEL 编译时间,以秒为单位。
  • ALPHA
  • 直方图
apiserver_cel_evaluation_duration_seconds
CEL 评估时间,以秒为单位。
  • ALPHA
  • 直方图
apiserver_certificates_registry_csr_honored_duration_total
已颁发的 CSR 的总数,其请求的持续时间已得到遵守,按签名者细分(仅明确标识 kubernetes.io 签名者名称)。
  • ALPHA
  • 计数器
  • signerName
apiserver_certificates_registry_csr_requested_duration_total
已颁发的 CSR 的总数,其请求的持续时间,按签名者细分(仅明确标识 kubernetes.io 签名者名称)。
  • ALPHA
  • 计数器
  • signerName
apiserver_client_certificate_expiration_seconds
用于身份验证请求的证书的剩余生命周期的分布。
  • ALPHA
  • 直方图
apiserver_clusterip_repair_ip_errors_total
修复循环检测到的 clusterip 错误数量,按错误类型细分:泄漏、修复、完整、超出范围、重复、未知、无效。
  • ALPHA
  • 计数器
  • type
apiserver_clusterip_repair_reconcile_errors_total
clusterip 修复协调循环上的协调失败数量。
  • ALPHA
  • 计数器
apiserver_conversion_webhook_duration_seconds
转换 webhook 请求延迟。
  • ALPHA
  • 直方图
  • failure_typeresult
apiserver_conversion_webhook_request_total
转换 webhook 请求的计数器,包含成功/失败和失败错误类型。
  • ALPHA
  • 计数器
  • failure_typeresult
apiserver_crd_conversion_webhook_duration_seconds
CRD webhook 转换持续时间,以秒为单位。
  • ALPHA
  • 直方图
  • crd_namefrom_versionsucceededto_version
apiserver_current_inqueue_requests
在过去一秒内,每个请求类型的 apiserver 中排队的请求的最大数量。
  • ALPHA
  • 仪表
  • request_kind
apiserver_delegated_authn_request_duration_seconds
请求延迟,以秒为单位。按状态代码细分。
  • ALPHA
  • 直方图
  • code
apiserver_delegated_authn_request_total
按状态代码划分的 HTTP 请求数量。
  • ALPHA
  • 计数器
  • code
apiserver_delegated_authz_request_duration_seconds
请求延迟,以秒为单位。按状态代码细分。
  • ALPHA
  • 直方图
  • code
apiserver_delegated_authz_request_total
按状态代码划分的 HTTP 请求数量。
  • ALPHA
  • 计数器
  • code
apiserver_egress_dialer_dial_duration_seconds
拨号延迟直方图,以秒为单位,按协议(http-connect 或 grpc)、传输(tcp 或 uds)标记。
  • ALPHA
  • 直方图
  • protocoltransport
apiserver_egress_dialer_dial_failure_count
拨号失败计数,按协议(http-connect 或 grpc)、传输(tcp 或 uds)和阶段(连接或代理)标记。阶段指示拨号失败的阶段。
  • ALPHA
  • 计数器
  • protocolstagetransport
apiserver_egress_dialer_dial_start_total
拨号开始,按协议(http-connect 或 grpc)和传输(tcp 或 uds)标记。
  • ALPHA
  • 计数器
  • protocoltransport
apiserver_encryption_config_controller_automatic_reload_failures_total
加密配置自动重新加载失败的总数,按 apiserver 标识细分。
  • ALPHA
  • 计数器
  • apiserver_id_hash
  • 1.30.0
apiserver_encryption_config_controller_automatic_reload_success_total
加密配置自动重新加载成功的总数,按 apiserver 标识细分。
  • ALPHA
  • 计数器
  • apiserver_id_hash
  • 1.30.0
apiserver_envelope_encryption_dek_cache_fill_percent
缓存中当前被缓存的 DEK 占用的插槽百分比。
  • ALPHA
  • 仪表
apiserver_envelope_encryption_dek_cache_inter_arrival_time_seconds
转换请求的到达间隔时间(以秒为单位)。
  • ALPHA
  • 直方图
  • transformation_type
apiserver_envelope_encryption_dek_source_cache_size
数据加密密钥 (DEK) 源缓存中的记录数量。在重新启动时,此值近似于服务器将向 KMS 插件发出的解密 RPC 调用的数量。
  • ALPHA
  • 仪表
  • provider_name
apiserver_envelope_encryption_invalid_key_id_from_status_total
Status RPC 调用返回无效 keyID 的次数,按错误细分。
  • ALPHA
  • 计数器
  • errorprovider_name
apiserver_envelope_encryption_key_id_hash_last_timestamp_seconds
keyID 最后一次使用的时间(以秒为单位)。
  • ALPHA
  • 仪表
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
apiserver_envelope_encryption_key_id_hash_status_last_timestamp_seconds
Status RPC 调用最后一次返回 keyID 的时间(以秒为单位)。
  • ALPHA
  • 仪表
  • apiserver_id_hashkey_id_hashprovider_name
apiserver_envelope_encryption_key_id_hash_total
keyID 使用的次数,按转换类型、提供者和 apiserver 标识细分。
  • ALPHA
  • 计数器
  • apiserver_id_hashkey_id_hashprovider_nametransformation_type
apiserver_envelope_encryption_kms_operations_latency_seconds
KMS 操作持续时间,包含 gRPC 错误代码状态总数。
  • ALPHA
  • 直方图
  • grpc_status_codemethod_nameprovider_name
apiserver_flowcontrol_current_inqueue_seats
API 优先级和公平性子系统队列中当前待处理的座位数。
  • ALPHA
  • 仪表
  • flow_schemapriority_level
apiserver_flowcontrol_current_limit_seats
每个优先级级别可用的当前派生执行座位数。
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_current_r
R(上次更改的时间)。
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_demand_seats
每纳秒结束时,对(每个优先级级别可以使用座位数)/(该级别的标称座位数)的观察结果。
  • ALPHA
  • TimingRatioHistogram
  • priority_level
apiserver_flowcontrol_demand_seats_average
在过去调整周期内,demand_seats 的时间加权平均值。
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_demand_seats_high_watermark
在过去调整周期内,demand_seats 的高水位线。
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_demand_seats_smoothed
平滑的座位需求。
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_demand_seats_stdev
在过去调整周期内,demand_seats 的时间加权标准差。
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_dispatch_r
R(上次调度的时间)。
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_epoch_advance_total
队列集的进度计向后跳跃的次数。
  • ALPHA
  • 计数器
  • priority_levelsuccess
apiserver_flowcontrol_latest_s
S(最近一次分派的请求)
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_lower_limit_seats
为每个优先级配置的可用执行席位的下限
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_next_discounted_s_bounds
队列中 S(队列中最老的等待请求) - 估计的正在进行的工作 的最小值和最大值
  • ALPHA
  • 仪表
  • boundpriority_level
apiserver_flowcontrol_next_s_bounds
队列中 S(队列中最老的等待请求) 的最小值和最大值
  • ALPHA
  • 仪表
  • boundpriority_level
apiserver_flowcontrol_priority_level_request_utilization
每纳秒结束时,观察等待或处于任何执行阶段(但 WATCH 仅限于初始阶段)的请求数量(作为相关限制的比例)
  • ALPHA
  • TimingRatioHistogram
  • phasepriority_level
apiserver_flowcontrol_priority_level_seat_utilization
每纳秒结束时,观察任何执行阶段(但 WATCH 仅限于初始阶段)的席位利用率
  • ALPHA
  • TimingRatioHistogram
  • priority_level
  • phase:executing
apiserver_flowcontrol_read_vs_write_current_requests
每纳秒结束时,观察等待或处于常规执行阶段的请求数量(作为相关限制的比例)
  • ALPHA
  • TimingRatioHistogram
  • phaserequest_kind
apiserver_flowcontrol_request_concurrency_in_use
API 优先级和公平性子系统中当前正在执行(对于 WATCH 而言是初始阶段,对于其他情况而言是任何阶段)的请求所占用的并发性(座位数)
  • ALPHA
  • 仪表
  • flow_schemapriority_level
  • 1.31.0
apiserver_flowcontrol_request_concurrency_limit
为每个优先级级别配置的名义执行座位数
  • ALPHA
  • 仪表
  • priority_level
  • 1.30.0
apiserver_flowcontrol_request_dispatch_no_accommodation_total
由于缺乏可用席位,分派尝试导致无法容纳的次数
  • ALPHA
  • 计数器
  • flow_schemapriority_level
apiserver_flowcontrol_request_execution_seconds
API 优先级和公平性子系统中请求执行的初始阶段(对于 WATCH)或任何阶段(对于非 WATCH)的持续时间
  • ALPHA
  • 直方图
  • flow_schemapriority_leveltype
apiserver_flowcontrol_request_queue_length_after_enqueue
API 优先级和公平性子系统中队列的长度,如每个请求在排队后所见
  • ALPHA
  • 直方图
  • flow_schemapriority_level
apiserver_flowcontrol_seat_fair_frac
服务器并发性的公平比例,分配给可以使用它的每个优先级
  • ALPHA
  • 仪表
apiserver_flowcontrol_target_seats
席位分配目标
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_upper_limit_seats
为每个优先级配置的可用执行席位的上限
  • ALPHA
  • 仪表
  • priority_level
apiserver_flowcontrol_watch_count_samples
API 优先级和公平性中针对突变请求的观察者的数量
  • ALPHA
  • 直方图
  • flow_schemapriority_level
apiserver_flowcontrol_work_estimated_seats
API 优先级和公平性中与请求关联的估计席位数(初始席位和最终席位的最大值)
  • ALPHA
  • 直方图
  • flow_schemapriority_level
apiserver_init_events_total
按资源类型细分的观察缓存中处理的初始化事件计数器。
  • ALPHA
  • 计数器
  • resource
apiserver_kube_aggregator_x509_insecure_sha1_total
计算对服务器的请求数量,这些服务器在其服务证书中具有不安全的 SHA1 签名,或者计算由于不安全的 SHA1 签名导致的连接失败数量(基于运行时环境,任一或两者)
  • ALPHA
  • 计数器
apiserver_kube_aggregator_x509_missing_san_total
计算对服务器的请求数量,这些服务器在其服务证书中缺少 SAN 扩展,或者计算由于缺少 x509 证书 SAN 扩展导致的连接失败数量(基于运行时环境,任一或两者)
  • ALPHA
  • 计数器
apiserver_nodeport_repair_port_errors_total
修复循环检测到的端口错误数量,按错误类型细分:泄漏、修复、已满、超出范围、重复、未知
  • ALPHA
  • 计数器
  • type
apiserver_request_aborts_total
apiserver 可能由于超时而中止的请求数量,针对每个组、版本、动词、资源、子资源和范围
  • ALPHA
  • 计数器
  • groupresourcescopesubresourceverbversion
apiserver_request_body_size_bytes
按资源和动词细分的 apiserver 请求主体大小(以字节为单位)。
  • ALPHA
  • 直方图
  • resourceverb
apiserver_request_filter_duration_seconds
请求过滤器延迟分布(以秒为单位),针对每种过滤器类型
  • ALPHA
  • 直方图
  • filter
apiserver_request_post_timeout_total
跟踪与请求关联的请求处理程序在 apiserver 超时后进行的活动
  • ALPHA
  • 计数器
  • sourcestatus
apiserver_request_sli_duration_seconds
针对每个动词、组、版本、资源、子资源、范围和组件的响应延迟分布(不包括 webhook 持续时间和优先级和公平性队列等待时间)(以秒为单位)。
  • ALPHA
  • 直方图
  • componentgroupresourcescopesubresourceverbversion
apiserver_request_slo_duration_seconds
针对每个动词、组、版本、资源、子资源、范围和组件的响应延迟分布(不包括 webhook 持续时间和优先级和公平性队列等待时间)(以秒为单位)。
  • ALPHA
  • 直方图
  • componentgroupresourcescopesubresourceverbversion
  • 1.27.0
apiserver_request_terminations_total
apiserver 为自卫而终止的请求数量。
  • ALPHA
  • 计数器
  • codecomponentgroupresourcescopesubresourceverbversion
apiserver_request_timestamp_comparison_time
UPDATE 或 PATCH 请求中比较旧对象和新对象所花费的时间
  • ALPHA
  • 直方图
  • code_path
apiserver_rerouted_request_total
由于本地 apiserver 无法提供服务,因此被代理到对等 kube apiserver 的请求总数
  • ALPHA
  • 计数器
  • code
apiserver_selfrequest_total
按每个动词、API 资源和子资源细分的 apiserver 自请求计数器。
  • ALPHA
  • 计数器
  • resourcesubresourceverb
apiserver_storage_data_key_generation_duration_seconds
数据加密密钥 (DEK) 生成操作的延迟(以秒为单位)。
  • ALPHA
  • 直方图
apiserver_storage_data_key_generation_failures_total
数据加密密钥 (DEK) 生成操作失败的总数。
  • ALPHA
  • 计数器
apiserver_storage_db_total_size_in_bytes
存储数据库文件物理分配的总大小(以字节为单位)。
  • ALPHA
  • 仪表
  • endpoint
  • 1.28.0
apiserver_storage_decode_errors_total
按对象类型细分的存储对象解码错误数量
  • ALPHA
  • 计数器
  • resource
apiserver_storage_envelope_transformation_cache_misses_total
访问密钥解密密钥 (KEK) 时缓存未命中的总数。
  • ALPHA
  • 计数器
apiserver_storage_events_received_total
按类型细分的接收到的 etcd 事件数量。
  • ALPHA
  • 计数器
  • resource
apiserver_storage_list_evaluated_objects_total
在为存储提供 LIST 请求的过程中测试的对象数量
  • ALPHA
  • 计数器
  • resource
apiserver_storage_list_fetched_objects_total
在为 LIST 请求提供服务时从存储中读取的对象数量
  • ALPHA
  • 计数器
  • resource
apiserver_storage_list_returned_objects_total
从存储中为 LIST 请求返回的对象数量
  • ALPHA
  • 计数器
  • resource
apiserver_storage_list_total
从存储中提供的 LIST 请求数量
  • ALPHA
  • 计数器
  • resource
apiserver_storage_transformation_duration_seconds
值转换操作的延迟(以秒为单位)。
  • ALPHA
  • 直方图
  • transformation_typetransformer_prefix
apiserver_storage_transformation_operations_total
转换的总数。成功的转换将具有状态“OK”,而转换失败时将具有不同的状态字符串。此状态和 transformation_type 字段可用于使用 transformation_type from_storage(用于解密)和 to_storage(用于加密)对加密/解密失败进行警报
  • ALPHA
  • 计数器
  • statustransformation_typetransformer_prefix
apiserver_stream_translator_requests_total
由 StreamTranslatorProxy 处理的请求总数,该代理处理流式 RemoteCommand/V5
  • ALPHA
  • 计数器
  • code
apiserver_terminated_watchers_total
由于无响应而关闭的观察者计数器,按资源类型细分。
  • ALPHA
  • 计数器
  • resource
apiserver_tls_handshake_errors_total
带有“TLS 握手错误来自”错误而被丢弃的请求数量
  • ALPHA
  • 计数器
apiserver_validating_admission_policy_check_duration_seconds
针对单个验证表达式的验证准入延迟(以秒为单位),按策略标记,并进一步包括绑定、状态和采取的强制执行操作。
  • ALPHA
  • 直方图
  • enforcement_actionpolicypolicy_bindingstate
apiserver_validating_admission_policy_check_total
验证准入策略检查总数,按策略标记,并进一步按绑定、采取的强制执行操作和状态标识。
  • ALPHA
  • 计数器
  • enforcement_actionpolicypolicy_bindingstate
apiserver_validating_admission_policy_definition_total
验证准入策略计数总数,按状态和强制执行操作标记。
  • ALPHA
  • 计数器
  • enforcement_actionstate
apiserver_watch_cache_events_dispatched_total
按资源类型细分的观察缓存中分派的事件计数器。
  • ALPHA
  • 计数器
  • resource
apiserver_watch_cache_events_received_total
按资源类型细分的观察缓存中接收到的事件计数器。
  • ALPHA
  • 计数器
  • resource
apiserver_watch_cache_initializations_total
按资源类型细分的观察缓存初始化计数器。
  • ALPHA
  • 计数器
  • resource
apiserver_watch_cache_read_wait_seconds
等待观察缓存变为新鲜所花费的时间的直方图。
  • ALPHA
  • 直方图
  • resource
apiserver_watch_events_sizes
观察事件大小分布(以字节为单位)
  • ALPHA
  • 直方图
  • groupkindversion
apiserver_watch_events_total
发送到观察客户端的事件数量
  • ALPHA
  • 计数器
  • groupkindversion
apiserver_watch_list_duration_seconds
观察列表请求的响应延迟分布(以秒为单位),按组、版本、资源和范围细分。
  • ALPHA
  • 直方图
  • groupresourcescopeversion
apiserver_webhooks_x509_insecure_sha1_total
计算对服务器的请求数量,这些服务器在其服务证书中具有不安全的 SHA1 签名,或者计算由于不安全的 SHA1 签名导致的连接失败数量(基于运行时环境,任一或两者)
  • ALPHA
  • 计数器
apiserver_webhooks_x509_missing_san_total
计算对服务器的请求数量,这些服务器在其服务证书中缺少 SAN 扩展,或者计算由于缺少 x509 证书 SAN 扩展导致的连接失败数量(基于运行时环境,任一或两者)
  • ALPHA
  • 计数器
attach_detach_controller_attachdetach_controller_forced_detaches
A/D 控制器执行强制分离的次数
  • ALPHA
  • 计数器
  • reason
attachdetach_controller_total_volumes
A/D 控制器中的卷数
  • ALPHA
  • 自定义
  • plugin_namestate
authenticated_user_requests
按用户名细分的已验证请求计数器。
  • ALPHA
  • 计数器
  • username
authentication_attempts
已验证尝试计数器。
  • ALPHA
  • 计数器
  • result
authentication_duration_seconds
按结果细分的身份验证持续时间(以秒为单位)。
  • ALPHA
  • 直方图
  • result
authentication_token_cache_active_fetch_count
  • ALPHA
  • 仪表
  • status
authentication_token_cache_fetch_total
  • ALPHA
  • 计数器
  • status
authentication_token_cache_request_duration_seconds
  • ALPHA
  • 直方图
  • status
authentication_token_cache_request_total
  • ALPHA
  • 计数器
  • status
authorization_attempts_total
按结果细分的授权尝试计数器。它可以是“允许”、“拒绝”、“无意见”或“错误”。
  • ALPHA
  • 计数器
  • result
authorization_duration_seconds
按结果细分的授权持续时间(以秒为单位)。
  • ALPHA
  • 直方图
  • result
cloud_provider_webhook_request_duration_seconds
请求延迟,以秒为单位。按状态代码细分。
  • ALPHA
  • 直方图
  • codewebhook
cloud_provider_webhook_request_total
按状态代码划分的 HTTP 请求数量。
  • ALPHA
  • 计数器
  • codewebhook
cloudprovider_gce_api_request_duration_seconds
GCE API 调用的延迟
  • ALPHA
  • 直方图
  • regionrequestversionzone
cloudprovider_gce_api_request_errors
API 调用的错误数量
  • ALPHA
  • 计数器
  • regionrequestversionzone
container_swap_usage_bytes
容器交换使用量的当前大小(以字节为单位)。仅在非 Windows 系统上报告
  • ALPHA
  • 自定义
  • containerpodnamespace
csi_operations_seconds
容器存储接口操作持续时间,带有 gRPC 错误代码状态总数
  • ALPHA
  • 直方图
  • driver_namegrpc_status_codemethod_namemigrated
endpoint_slice_controller_changes
EndpointSlice 更改数量
  • ALPHA
  • 计数器
  • operation
endpoint_slice_controller_desired_endpoint_slices
在完美端点分配的情况下存在的 EndpointSlice 数量
  • ALPHA
  • 仪表
endpoint_slice_controller_endpoints_added_per_sync
每次服务同步添加的端点数量
  • ALPHA
  • 直方图
endpoint_slice_controller_endpoints_desired
所需的端点数量
  • ALPHA
  • 仪表
endpoint_slice_controller_endpoints_removed_per_sync
每次服务同步删除的端点数量
  • ALPHA
  • 直方图
endpoint_slice_controller_endpointslices_changed_per_sync
每次服务同步更改的 EndpointSlice 数量
  • ALPHA
  • 直方图
  • topologytraffic_distribution
endpoint_slice_controller_num_endpoint_slices
EndpointSlice 数量
  • ALPHA
  • 仪表
endpoint_slice_controller_services_count_by_traffic_distribution
使用特定 trafficDistribution 的服务数量
  • ALPHA
  • 仪表
  • traffic_distribution
endpoint_slice_controller_syncs
EndpointSlice 同步数量
  • ALPHA
  • 计数器
  • result
endpoint_slice_mirroring_controller_addresses_skipped_per_sync
每次 Endpoints 同步时由于地址无效或超过 MaxEndpointsPerSubset 而跳过的地址数量
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_changes
EndpointSlice 更改数量
  • ALPHA
  • 计数器
  • operation
endpoint_slice_mirroring_controller_desired_endpoint_slices
在完美端点分配的情况下存在的 EndpointSlice 数量
  • ALPHA
  • 仪表
endpoint_slice_mirroring_controller_endpoints_added_per_sync
每次 Endpoints 同步时添加的端点数量
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_endpoints_desired
所需的端点数量
  • ALPHA
  • 仪表
endpoint_slice_mirroring_controller_endpoints_removed_per_sync
每次 Endpoints 同步时删除的端点数量
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_endpoints_sync_duration
syncEndpoints() 的持续时间(秒)
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_endpoints_updated_per_sync
每次 Endpoints 同步时更新的端点数量
  • ALPHA
  • 直方图
endpoint_slice_mirroring_controller_num_endpoint_slices
EndpointSlice 数量
  • ALPHA
  • 仪表
ephemeral_volume_controller_create_failures_total
持久卷声明创建请求的数量
  • ALPHA
  • 计数器
ephemeral_volume_controller_create_total
持久卷声明创建请求的数量
  • ALPHA
  • 计数器
etcd_bookmark_counts
etcd 书签(进度通知事件)的数量,按类型分类。
  • ALPHA
  • 仪表
  • resource
etcd_lease_object_counts
附加到单个 etcd 租约的对象数量。
  • ALPHA
  • 直方图
etcd_request_duration_seconds
每个操作和对象类型的 etcd 请求延迟(秒)。
  • ALPHA
  • 直方图
  • operationtype
etcd_request_errors_total
每个操作和对象类型的 etcd 失败请求计数。
  • ALPHA
  • 计数器
  • operationtype
etcd_requests_total
每个操作和对象类型的 etcd 请求计数。
  • ALPHA
  • 计数器
  • operationtype
etcd_version_info
etcd 服务器的二进制版本
  • ALPHA
  • 仪表
  • binary_version
field_validation_request_duration_seconds
每个字段验证值的响应延迟分布(秒)
  • ALPHA
  • 直方图
  • field_validation
force_cleaned_failed_volume_operation_errors_total
在 kubelet 启动期间重建失败后强制清理失败的卷的数量。
  • ALPHA
  • 计数器
force_cleaned_failed_volume_operations_total
在 kubelet 启动期间重建失败后被强制清理的卷的数量。这包括成功和失败的清理。
  • ALPHA
  • 计数器
garbagecollector_controller_resources_sync_error_total
垃圾回收器资源同步错误的数量
  • ALPHA
  • 计数器
get_token_count
对备用令牌源的总 Token() 请求计数器
  • ALPHA
  • 计数器
get_token_fail_count
对备用令牌源的失败 Token() 请求计数器
  • ALPHA
  • 计数器
horizontal_pod_autoscaler_controller_metric_computation_duration_seconds
HPA 控制器计算一个指标所需的时间(秒)。标签“action”应为“scale_down”、“scale_up”或“none”。标签“error”应为“spec”、“internal”或“none”。标签“metric_type”对应于 HPA.spec.metrics[*].type
  • ALPHA
  • 直方图
  • actionerrormetric_type
horizontal_pod_autoscaler_controller_metric_computation_total
指标计算的数量。标签“action”应为“scale_down”、“scale_up”或“none”。此外,标签“error”应为“spec”、“internal”或“none”。标签“metric_type”对应于 HPA.spec.metrics[*].type
  • ALPHA
  • 计数器
  • actionerrormetric_type
horizontal_pod_autoscaler_controller_reconciliation_duration_seconds
HPA 控制器一次协调所需的时间(秒)。标签“action”应为“scale_down”、“scale_up”或“none”。此外,标签“error”应为“spec”、“internal”或“none”。请注意,如果在协调期间同时发生规范和内部错误,则报告在“error”标签中首先发生的错误。
  • ALPHA
  • 直方图
  • actionerror
horizontal_pod_autoscaler_controller_reconciliations_total
HPA 控制器协调的数量。标签“action”应为“scale_down”、“scale_up”或“none”。此外,标签“error”应为“spec”、“internal”或“none”。请注意,如果在协调期间同时发生规范和内部错误,则报告在“error”标签中首先发生的错误。
  • ALPHA
  • 计数器
  • actionerror
job_controller_job_finished_indexes_total
`已完成索引的数量。状态标签的可能值为:“succeeded”、“failed”。backoffLimit 标签的可能值为:“perIndex”和“global”`
  • ALPHA
  • 计数器
  • backoffLimitstatus
job_controller_job_pods_creation_total
`Job 控制器创建的 Pod 的数量,这些 Pod 用 Pod 创建的原因标记。此指标还区分使用不同 PodReplacementPolicy 设置创建的 Pod。原因标签的可能值为:new、recreate_terminating_or_failed、recreate_failed。状态标签的可能值为:succeeded、failed。`
  • ALPHA
  • 计数器
  • reasonstatus
job_controller_jobs_by_external_controller_total
由外部控制器管理的 Job 的数量
  • ALPHA
  • 计数器
  • controller_name
job_controller_pod_failures_handled_by_failure_policy_total
`由失败策略处理的失败 Pod 的数量,相对于基于匹配规则应用的失败策略操作。操作标签的可能值对应于失败策略规则操作的可能值,即:FailJob、Ignore 和 Count。`
  • ALPHA
  • 计数器
  • action
job_controller_terminated_pods_tracking_finalizer_total
`已终止的 Pod(phase=Failed|Succeeded)的数量,这些 Pod 具有最终器 batch.kubernetes.io/job-tracking。事件标签可以是“add”或“delete”。`
  • ALPHA
  • 计数器
  • event
kube_apiserver_clusterip_allocator_allocated_ips
测量为服务分配的 IP 数量的 Gauge
  • ALPHA
  • 仪表
  • cidr
kube_apiserver_clusterip_allocator_allocation_errors_total
尝试分配集群 IP 时发生的错误数量
  • ALPHA
  • 计数器
  • cidrscope
kube_apiserver_clusterip_allocator_allocation_total
集群 IP 分配的数量
  • ALPHA
  • 计数器
  • cidrscope
kube_apiserver_clusterip_allocator_available_ips
测量为服务提供可用 IP 数量的 Gauge
  • ALPHA
  • 仪表
  • cidr
kube_apiserver_nodeport_allocator_allocated_ports
测量为服务分配的 NodePort 数量的 Gauge
  • ALPHA
  • 仪表
kube_apiserver_nodeport_allocator_available_ports
测量为服务提供可用 NodePort 数量的 Gauge
  • ALPHA
  • 仪表
kube_apiserver_pod_logs_backend_tls_failure_total
由于 kubelet 服务器 TLS 验证失败而导致的 pod/logs 请求总数
  • ALPHA
  • 计数器
kube_apiserver_pod_logs_insecure_backend_total
按使用类型切片的 pod/logs 请求总数:enforce_tls、skip_tls_allowed、skip_tls_denied
  • ALPHA
  • 计数器
  • usage
kube_apiserver_pod_logs_pods_logs_backend_tls_failure_total
由于 kubelet 服务器 TLS 验证失败而导致的 pod/logs 请求总数
  • ALPHA
  • 计数器
  • 1.27.0
kube_apiserver_pod_logs_pods_logs_insecure_backend_total
按使用类型切片的 pod/logs 请求总数:enforce_tls、skip_tls_allowed、skip_tls_denied
  • ALPHA
  • 计数器
  • usage
  • 1.27.0
kubelet_active_pods
kubelet 认为处于活动状态并正在考虑在接受新 Pod 时考虑的 Pod 数量。static 为 true 表示 Pod 不是来自 apiserver。
  • ALPHA
  • 仪表
  • static
kubelet_certificate_manager_client_expiration_renew_errors
证书续订错误计数器。
  • ALPHA
  • 计数器
kubelet_certificate_manager_client_ttl_seconds
Kubelet 客户端证书 TTL(生存时间)的 Gauge。该值以秒为单位,表示证书到期前的剩余时间(如果已过期,则为负数)。如果客户端证书无效或未使用,则该值为 +INF。
  • ALPHA
  • 仪表
kubelet_certificate_manager_server_rotation_seconds
之前证书在轮换之前存活的秒数的直方图。
  • ALPHA
  • 直方图
kubelet_certificate_manager_server_ttl_seconds
Kubelet 服务证书的最短 TTL(生存时间)的 Gauge。该值以秒为单位,表示证书到期前的剩余时间(如果已过期,则为负数)。如果服务证书无效或未使用,则该值为 +INF。
  • ALPHA
  • 仪表
kubelet_cgroup_manager_duration_seconds
cgroup 管理器操作的持续时间(秒)。按方法细分。
  • ALPHA
  • 直方图
  • operation_type
kubelet_container_log_filesystem_used_bytes
容器日志在文件系统中使用的字节数。
  • ALPHA
  • 自定义
  • uidnamespacepodcontainer
kubelet_containers_per_pod_count
每个 Pod 的容器数量。
  • ALPHA
  • 直方图
kubelet_cpu_manager_pinning_errors_total
需要固定但失败的 CPU 内核分配数量。
  • ALPHA
  • 计数器
kubelet_cpu_manager_pinning_requests_total
需要固定的 CPU 内核分配数量。
  • ALPHA
  • 计数器
kubelet_credential_provider_plugin_duration
凭据提供程序插件执行的持续时间(秒)
  • ALPHA
  • 直方图
  • plugin_name
kubelet_credential_provider_plugin_errors
凭据提供程序插件的错误数量
  • ALPHA
  • 计数器
  • plugin_name
kubelet_desired_pods
kubelet 被指示运行的 Pod 数量。static 为 true 表示 Pod 不是来自 apiserver。
  • ALPHA
  • 仪表
  • static
kubelet_device_plugin_alloc_duration_seconds
为设备插件分配请求提供服务的持续时间(秒)。按资源名称细分。
  • ALPHA
  • 直方图
  • resource_name
kubelet_device_plugin_registration_total
设备插件注册的累计数量。按资源名称细分。
  • ALPHA
  • 计数器
  • resource_name
kubelet_evented_pleg_connection_error_count
在与 CRI 运行时建立流式连接期间遇到的错误数量。
  • ALPHA
  • 计数器
kubelet_evented_pleg_connection_latency_seconds
与 CRI 运行时的流式连接的延迟,以秒为单位。
  • ALPHA
  • 直方图
kubelet_evented_pleg_connection_success_count
获得流式客户端以接收 CRI 事件的次数。
  • ALPHA
  • 计数器
kubelet_eviction_stats_age_seconds
收集统计信息的时间与基于这些统计信息通过驱逐信号驱逐 Pod 的时间之间的间隔。
  • ALPHA
  • 直方图
  • eviction_signal
kubelet_evictions
按驱逐信号驱逐 Pod 的累计数量
  • ALPHA
  • 计数器
  • eviction_signal
kubelet_graceful_shutdown_end_time_seconds
自 Unix 纪元以来的最后一个优雅关闭开始时间(秒)
  • ALPHA
  • 仪表
kubelet_graceful_shutdown_start_time_seconds
自 Unix 纪元以来的最后一个优雅关闭开始时间(秒)
  • ALPHA
  • 仪表
kubelet_http_inflight_requests
正在进行的 HTTP 请求数量
  • ALPHA
  • 仪表
  • long_runningmethodpathserver_type
kubelet_http_requests_duration_seconds
为 HTTP 请求提供服务的持续时间(秒)
  • ALPHA
  • 直方图
  • long_runningmethodpathserver_type
kubelet_http_requests_total
自服务器启动以来接收到的 HTTP 请求数量
  • ALPHA
  • 计数器
  • long_runningmethodpathserver_type
kubelet_image_garbage_collected_total
kubelet 垃圾回收的图像总数,无论是通过磁盘使用量还是图像年龄。
  • ALPHA
  • 计数器
  • reason
kubelet_image_pull_duration_seconds
拉取图像的持续时间(秒)。
  • ALPHA
  • 直方图
  • image_size_in_bytes
kubelet_lifecycle_handler_http_fallbacks_total
生命周期处理程序成功从 https 回退到 http 的次数。
  • ALPHA
  • 计数器
kubelet_managed_ephemeral_containers
此 kubelet 管理的 Pod 中的瞬态容器的当前数量。
  • ALPHA
  • 仪表
kubelet_memory_manager_pinning_errors_total
需要固定但失败的内存页分配数量。
  • ALPHA
  • 计数器
kubelet_memory_manager_pinning_requests_total
需要固定的内存页分配数量。
  • ALPHA
  • 计数器
kubelet_mirror_pods
kubelet 将尝试创建的镜像 Pod 数量(每个已接受的静态 Pod 一个)
  • ALPHA
  • 仪表
kubelet_node_name
节点的名称。计数始终为 1。
  • ALPHA
  • 仪表
  • node
kubelet_node_startup_duration_seconds
节点启动的总持续时间(秒)。
  • ALPHA
  • 仪表
kubelet_node_startup_post_registration_duration_seconds
注册后节点启动的持续时间(秒)。
  • ALPHA
  • 仪表
kubelet_node_startup_pre_kubelet_duration_seconds
kubelet 启动之前节点启动的持续时间(秒)。
  • ALPHA
  • 仪表
kubelet_node_startup_pre_registration_duration_seconds
注册之前节点启动的持续时间(秒)。
  • ALPHA
  • 仪表
kubelet_node_startup_registration_duration_seconds
注册期间节点启动的持续时间(秒)。
  • ALPHA
  • 仪表
kubelet_orphan_pod_cleaned_volumes
在上次定期扫描中已清理其卷的孤立 Pod 的总数。
  • ALPHA
  • 仪表
kubelet_orphan_pod_cleaned_volumes_errors
在上次定期扫描中其卷未能清理的孤立 Pod 的数量。
  • ALPHA
  • 仪表
kubelet_orphaned_runtime_pods_total
在容器运行时中检测到但尚未为 Pod 工作程序所知的 Pod 的数量。这通常表示 kubelet 在 Pod 在 API 或本地配置中被强制删除时重新启动,这很不寻常。
  • ALPHA
  • 计数器
kubelet_pleg_discard_events
PLEG 中的丢弃事件数量。
  • ALPHA
  • 计数器
kubelet_pleg_last_seen_seconds
PLEG 最后一次被视为活动状态的时间戳(秒)。
  • ALPHA
  • 仪表
kubelet_pleg_relist_duration_seconds
在 PLEG 中重新列出 Pod 的持续时间(秒)。
  • ALPHA
  • 直方图
kubelet_pleg_relist_interval_seconds
PLEG 中重新列出之间的间隔(秒)。
  • ALPHA
  • 直方图
kubelet_pod_resources_endpoint_errors_get
返回错误的 PodResource Get 端点请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_errors_get_allocatable
返回错误的 PodResource GetAllocatableResources 端点请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_errors_list
返回错误的 PodResource List 端点请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_requests_get
PodResource Get 端点的请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_requests_get_allocatable
PodResource GetAllocatableResources 端点的请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_requests_list
PodResource List 端点的请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_resources_endpoint_requests_total
PodResource 端点的累计请求数。按服务器 API 版本细分。
  • ALPHA
  • 计数器
  • server_api_version
kubelet_pod_start_duration_seconds
从 kubelet 首次看到 Pod 到 Pod 开始运行的持续时间(以秒为单位)。
  • ALPHA
  • 直方图
kubelet_pod_start_sli_duration_seconds
启动 Pod 的持续时间(以秒为单位),不包括拉取镜像和运行 init 容器的时间,从 Pod 创建时间戳到所有容器报告为已启动并通过 watch 观察到的时间。
  • ALPHA
  • 直方图
kubelet_pod_start_total_duration_seconds
从创建到启动 Pod 的持续时间(以秒为单位),包括拉取镜像和运行 init 容器的时间,从 Pod 创建时间戳到所有容器报告为已启动并通过 watch 观察到的时间。
  • ALPHA
  • 直方图
kubelet_pod_status_sync_duration_seconds
同步 Pod 状态更新的持续时间(以秒为单位)。从检测到 Pod 状态更改到成功更新该 Pod 的 API 的时间,即使 Pod 状态发生多次中间更改也是如此。
  • ALPHA
  • 直方图
kubelet_pod_worker_duration_seconds
同步单个 Pod 的持续时间(以秒为单位)。按操作类型细分:创建、更新或同步。
  • ALPHA
  • 直方图
  • operation_type
kubelet_pod_worker_start_duration_seconds
从 kubelet 看到 Pod 到启动工作程序的持续时间(以秒为单位)。
  • ALPHA
  • 直方图
kubelet_preemptions
按抢占资源累计的 Pod 抢占次数。
  • ALPHA
  • 计数器
  • preemption_signal
kubelet_restarted_pods_total
由于 kubelet 正在观察它们时被删除并使用相同的 UID 重新创建,因此已重新启动的 Pod 数量(静态 Pod 常见,API Pod 极不常见)。
  • ALPHA
  • 计数器
  • static
kubelet_run_podsandbox_duration_seconds
run_podsandbox 操作的持续时间(以秒为单位)。按 RuntimeClass.Handler 细分。
  • ALPHA
  • 直方图
  • runtime_handler
kubelet_run_podsandbox_errors_total
按 RuntimeClass.Handler 累计的 run_podsandbox 操作错误次数。
  • ALPHA
  • 计数器
  • runtime_handler
kubelet_running_containers
当前正在运行的容器数量。
  • ALPHA
  • 仪表
  • container_state
kubelet_running_pods
具有正在运行的 Pod 沙箱的 Pod 数量。
  • ALPHA
  • 仪表
kubelet_runtime_operations_duration_seconds
运行时操作的持续时间(以秒为单位)。按操作类型细分。
  • ALPHA
  • 直方图
  • operation_type
kubelet_runtime_operations_errors_total
按操作类型累计的运行时操作错误次数。
  • ALPHA
  • 计数器
  • operation_type
kubelet_runtime_operations_total
按操作类型累计的运行时操作次数。
  • ALPHA
  • 计数器
  • operation_type
kubelet_server_expiration_renew_errors
证书续订错误计数器。
  • ALPHA
  • 计数器
kubelet_sleep_action_terminated_early_total
生命周期睡眠处理程序在完成之前被终止的次数。
  • ALPHA
  • 计数器
kubelet_started_containers_errors_total
启动容器时的累计错误次数。
  • ALPHA
  • 计数器
  • codecontainer_type
kubelet_started_containers_total
已启动容器的累计次数。
  • ALPHA
  • 计数器
  • container_type
kubelet_started_host_process_containers_errors_total
启动 hostprocess 容器时的累计错误次数。此指标仅在 Windows 上收集。
  • ALPHA
  • 计数器
  • codecontainer_type
kubelet_started_host_process_containers_total
已启动的 hostprocess 容器的累计次数。此指标仅在 Windows 上收集。
  • ALPHA
  • 计数器
  • container_type
kubelet_started_pods_errors_total
启动 Pod 时的累计错误次数。
  • ALPHA
  • 计数器
kubelet_started_pods_total
已启动 Pod 的累计次数。
  • ALPHA
  • 计数器
kubelet_topology_manager_admission_duration_ms
为 Pod 准入请求提供服务的持续时间(以毫秒为单位)。
  • ALPHA
  • 直方图
kubelet_topology_manager_admission_errors_total
无法对齐资源的准入请求失败次数。
  • ALPHA
  • 计数器
kubelet_topology_manager_admission_requests_total
需要对齐资源的准入请求次数。
  • ALPHA
  • 计数器
kubelet_volume_metric_collection_duration_seconds
计算卷统计信息的持续时间(以秒为单位)。
  • ALPHA
  • 直方图
  • metric_source
kubelet_volume_stats_available_bytes
卷中可用字节数。
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_capacity_bytes
卷的容量(以字节为单位)。
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_health_status_abnormal
异常卷健康状况。计数为 1 或 0。1 表示卷不健康,0 表示卷健康。
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes
卷中 inode 的最大数量。
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes_free
卷中空闲 inode 的数量。
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_inodes_used
卷中已使用 inode 的数量。
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_volume_stats_used_bytes
卷中已使用字节数。
  • ALPHA
  • 自定义
  • namespacepersistentvolumeclaim
kubelet_working_pods
kubelet 实际运行的 Pod 数量,按生命周期阶段细分,以及 Pod 是否为期望的、孤立的或仅运行时(也是孤立的),以及 Pod 是否为静态的。孤立的 Pod 已从本地配置中删除或在 API 中强制删除,并消耗了其他方式不可见的资源。
  • ALPHA
  • 仪表
  • configlifecyclestatic
kubeproxy_network_programming_duration_seconds
集群网络编程延迟(以秒为单位)。
  • ALPHA
  • 直方图
kubeproxy_proxy_healthz_total
代理 healthz HTTP 状态的累计次数。
  • ALPHA
  • 计数器
  • code
kubeproxy_proxy_livez_total
代理 livez HTTP 状态的累计次数。
  • ALPHA
  • 计数器
  • code
kubeproxy_sync_full_proxy_rules_duration_seconds
完全重新同步的 SyncProxyRules 延迟(以秒为单位)。
  • ALPHA
  • 直方图
kubeproxy_sync_partial_proxy_rules_duration_seconds
部分重新同步的 SyncProxyRules 延迟(以秒为单位)。
  • ALPHA
  • 直方图
kubeproxy_sync_proxy_rules_duration_seconds
SyncProxyRules 延迟(以秒为单位)。
  • ALPHA
  • 直方图
kubeproxy_sync_proxy_rules_endpoint_changes_pending
待处理的代理规则端点更改。
  • ALPHA
  • 仪表
kubeproxy_sync_proxy_rules_endpoint_changes_total
代理规则端点更改的累计次数。
  • ALPHA
  • 计数器
kubeproxy_sync_proxy_rules_iptables_last
kube-proxy 在上次同步中写入的 iptables 规则数量。
  • ALPHA
  • 仪表
  • table
kubeproxy_sync_proxy_rules_iptables_partial_restore_failures_total
代理 iptables 部分还原失败的累计次数。
  • ALPHA
  • 计数器
kubeproxy_sync_proxy_rules_iptables_restore_failures_total
代理 iptables 还原失败的累计次数。
  • ALPHA
  • 计数器
kubeproxy_sync_proxy_rules_iptables_total
kube-proxy 拥有的 iptables 规则总数。
  • ALPHA
  • 仪表
  • table
kubeproxy_sync_proxy_rules_last_queued_timestamp_seconds
上次排队同步代理规则的时间。
  • ALPHA
  • 仪表
kubeproxy_sync_proxy_rules_last_timestamp_seconds
上次成功同步代理规则的时间。
  • ALPHA
  • 仪表
kubeproxy_sync_proxy_rules_no_local_endpoints_total
具有本地流量策略但没有端点的服务数量。
  • ALPHA
  • 仪表
  • traffic_policy
kubeproxy_sync_proxy_rules_service_changes_pending
待处理的代理规则服务更改。
  • ALPHA
  • 仪表
kubeproxy_sync_proxy_rules_service_changes_total
代理规则服务更改的累计次数。
  • ALPHA
  • 计数器
kubernetes_build_info
一个值为常数“1”的指标,按 major、minor、git 版本、git 提交、git 树状态、构建日期、Go 版本和编译器(Kubernetes 由此构建)以及运行平台进行标记。
  • ALPHA
  • 仪表
  • build_datecompilergit_commitgit_tree_stategit_versiongo_versionmajorminorplatform
leader_election_master_status
报告系统是否为相关租约的主节点的量规,0 表示备份,1 表示主节点。“name”是用于标识租约的字符串。请确保按名称进行分组。
  • ALPHA
  • 仪表
  • name
leader_election_slowpath_total
在续订领导者租约时使用的慢速路径总数。“name”是用于标识租约的字符串。请确保按名称进行分组。
  • ALPHA
  • 计数器
  • name
node_authorizer_graph_actions_duration_seconds
节点授权程序中图操作持续时间的直方图。
  • ALPHA
  • 直方图
  • operation
node_collector_unhealthy_nodes_in_zone
量规,用于测量每个区域中不处于 Ready 状态的节点数量。
  • ALPHA
  • 仪表
  • zone
node_collector_update_all_nodes_health_duration_seconds
NodeController 更新所有节点健康状况的持续时间(以秒为单位)。
  • ALPHA
  • 直方图
node_collector_update_node_health_duration_seconds
NodeController 更新单个节点健康状况的持续时间(以秒为单位)。
  • ALPHA
  • 直方图
node_collector_zone_health
量规,用于测量每个区域中健康节点的百分比。
  • ALPHA
  • 仪表
  • zone
node_collector_zone_size
量规,用于测量每个区域中已注册节点的数量。
  • ALPHA
  • 仪表
  • zone
node_controller_cloud_provider_taint_removal_delay_seconds
节点创建后 NodeController 删除单个节点的云提供商污点的秒数。
  • ALPHA
  • 直方图
node_controller_initial_node_sync_delay_seconds
节点创建后 NodeController 完成单个节点的初始同步的秒数。
  • ALPHA
  • 直方图
node_ipam_controller_cidrset_allocation_tries_per_request
每次服务同步添加的端点数量
  • ALPHA
  • 直方图
  • clusterCIDR
node_ipam_controller_cidrset_cidrs_allocations_total
计数器,用于测量 CIDR 分配的总数。
  • ALPHA
  • 计数器
  • clusterCIDR
node_ipam_controller_cidrset_cidrs_releases_total
计数器,用于测量 CIDR 释放的总数。
  • ALPHA
  • 计数器
  • clusterCIDR
node_ipam_controller_cidrset_usage_cidrs
量规,用于测量已分配 CIDR 的百分比。
  • ALPHA
  • 仪表
  • clusterCIDR
node_ipam_controller_cirdset_max_cidrs
可以分配的 CIDR 的最大数量。
  • ALPHA
  • 仪表
  • clusterCIDR
node_swap_usage_bytes
节点的当前交换空间使用量(以字节为单位)。仅在非 Windows 系统上报告。
  • ALPHA
  • 自定义
number_of_l4_ilbs
L4 ILB 的数量。
  • ALPHA
  • 仪表
  • feature
plugin_manager_total_plugins
插件管理器中的插件数量。
  • ALPHA
  • 自定义
  • socket_pathstate
pod_gc_collector_force_delete_pod_errors_total
自 Pod GC 控制器启动以来,强制删除 Pod 时遇到的错误数量。
  • ALPHA
  • 计数器
  • namespacereason
pod_gc_collector_force_delete_pods_total
自 Pod GC 控制器启动以来,正在强制删除的 Pod 数量。
  • ALPHA
  • 计数器
  • namespacereason
pod_security_errors_total
阻止正常评估的错误数量。非致命错误可能会导致使用最新的受限配置文件进行评估。
  • ALPHA
  • 计数器
  • fatalrequest_operationresourcesubresource
pod_security_evaluations_total
发生的策略评估次数,不包括被忽略或豁免的请求。
  • ALPHA
  • 计数器
  • decisionmodepolicy_levelpolicy_versionrequest_operationresourcesubresource
pod_security_exemptions_total
豁免请求的数量,不包括被忽略或超出范围的请求。
  • ALPHA
  • 计数器
  • request_operationresourcesubresource
pod_swap_usage_bytes
Pod 交换空间使用量的当前值(以字节为单位)。仅在非 Windows 系统上报告。
  • ALPHA
  • 自定义
  • podnamespace
prober_probe_duration_seconds
探测响应的持续时间(以秒为单位)。
  • ALPHA
  • 直方图
  • containernamespacepodprobe_type
prober_probe_total
容器的存活探测、就绪探测或启动探测的累计次数,按结果细分。
  • ALPHA
  • 计数器
  • containernamespacepodpod_uidprobe_typeresult
pv_collector_bound_pv_count
量规,用于测量当前已绑定的持久卷数量。
  • ALPHA
  • 自定义
  • storage_class
pv_collector_bound_pvc_count
量规,用于测量当前已绑定的持久卷声明数量。
  • ALPHA
  • 自定义
  • namespace
pv_collector_total_pv_count
量规,用于测量持久卷的总数。
  • ALPHA
  • 自定义
  • plugin_namevolume_mode
pv_collector_unbound_pv_count
量规,用于测量当前未绑定的持久卷数量。
  • ALPHA
  • 自定义
  • storage_class
pv_collector_unbound_pvc_count
量规,用于测量当前未绑定的持久卷声明数量。
  • ALPHA
  • 自定义
  • namespace
reconstruct_volume_operations_errors_total
在 kubelet 启动期间,从操作系统重建失败的卷数。
  • ALPHA
  • 计数器
reconstruct_volume_operations_total
在 kubelet 启动期间尝试从操作系统重建的卷数。 这包括成功和失败的重建。
  • ALPHA
  • 计数器
replicaset_controller_sorting_deletion_age_ratio
选定的已删除 Pod 的年龄与当前最年轻 Pod 的年龄(当时)的比率。 应小于 2。 此指标的目的是衡量 LogarithmicScaleDown 特性门对副本集缩减时 Pod 排序(和删除)的影响的粗略效率。 在计算和报告时,这仅考虑 Ready Pod。
  • ALPHA
  • 直方图
resourceclaim_controller_create_attempts_total
ResourceClaims 创建请求数
  • ALPHA
  • 计数器
resourceclaim_controller_create_failures_total
ResourceClaims 创建请求失败数
  • ALPHA
  • 计数器
rest_client_dns_resolution_duration_seconds
DNS 解析器延迟(以秒为单位)。 按主机细分。
  • ALPHA
  • 直方图
  • host
rest_client_exec_plugin_call_total
对 exec 插件的调用次数,按遇到的事件类型(no_error、plugin_execution_error、plugin_not_found_error、client_internal_error)和可选的退出代码进行划分。 仅当插件调用成功时,退出代码才会设置为 0。
  • ALPHA
  • 计数器
  • call_statuscode
rest_client_exec_plugin_certificate_rotation_age
最后一个 auth exec 插件客户端证书在轮换之前存活的秒数的直方图。 如果 auth exec 插件客户端证书未使用,则直方图将不包含任何数据。
  • ALPHA
  • 直方图
rest_client_exec_plugin_ttl_seconds
auth exec 插件管理的客户端证书的最小 TTL(生存时间)的 Gauge。 该值以秒为单位,表示证书过期之前的时间(如果已过期,则为负数)。 如果 auth exec 插件未使用或不管理任何 TLS 证书,则该值将为 +INF。
  • ALPHA
  • 仪表
rest_client_rate_limiter_duration_seconds
客户端侧速率限制器延迟(以秒为单位)。 按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_request_duration_seconds
请求延迟(以秒为单位)。 按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_request_retries_total
请求重试次数,按状态代码、动词和主机进行划分。
  • ALPHA
  • 计数器
  • codehostverb
rest_client_request_size_bytes
请求大小(以字节为单位)。 按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_requests_total
HTTP 请求数,按状态代码、方法和主机进行划分。
  • ALPHA
  • 计数器
  • codehostmethod
rest_client_response_size_bytes
响应大小(以字节为单位)。 按动词和主机细分。
  • ALPHA
  • 直方图
  • hostverb
rest_client_transport_cache_entries
内部缓存中的传输条目数。
  • ALPHA
  • 仪表
rest_client_transport_create_calls_total
获取新传输的调用次数,按操作结果进行划分:hit:从缓存中获取,miss:创建并添加到缓存中,uncacheable:创建但未缓存
  • ALPHA
  • 计数器
  • result
retroactive_storageclass_errors_total
对持久卷声明进行的追溯性 StorageClass 分配失败的总数
  • ALPHA
  • 计数器
retroactive_storageclass_total
对持久卷声明进行的追溯性 StorageClass 分配的总数
  • ALPHA
  • 计数器
root_ca_cert_publisher_sync_duration_seconds
根 CA 证书发布者中发生的命名空间同步次数。
  • ALPHA
  • 直方图
  • code
root_ca_cert_publisher_sync_total
根 CA 证书发布者中发生的命名空间同步次数。
  • ALPHA
  • 计数器
  • code
running_managed_controllers
指示控制器实例当前在何处运行
  • ALPHA
  • 仪表
  • managername
scheduler_goroutines
正在运行的 goroutine 数,按其执行的工作(如绑定)进行划分。
  • ALPHA
  • 仪表
  • operation
scheduler_permit_wait_duration_seconds
等待许可证的持续时间。
  • ALPHA
  • 直方图
  • result
scheduler_plugin_evaluation_total
每个插件和扩展点(仅在 PreFilter、Filter、PreScore 和 Score 中可用)尝试调度 Pod 的次数。
  • ALPHA
  • 计数器
  • extension_pointpluginprofile
scheduler_plugin_execution_duration_seconds
在特定扩展点运行插件的持续时间。
  • ALPHA
  • 直方图
  • extension_pointpluginstatus
scheduler_scheduler_cache_size
调度程序缓存中的节点、Pod 和假定(绑定)Pod 数。
  • ALPHA
  • 仪表
  • type
scheduler_scheduling_algorithm_duration_seconds
调度算法延迟(以秒为单位)
  • ALPHA
  • 直方图
scheduler_unschedulable_pods
无法调度的 Pod 数,按插件名称细分。 一个 Pod 将为导致其无法调度的所有插件增加 Gauge,因此此指标只有在按插件细分时才有意义。
  • ALPHA
  • 仪表
  • pluginprofile
scheduler_volume_binder_cache_requests_total
请求卷绑定缓存的总数
  • ALPHA
  • 计数器
  • operation
scheduler_volume_scheduling_stage_error_total
卷调度阶段错误计数
  • ALPHA
  • 计数器
  • operation
scrape_error
如果获取容器指标时发生错误,则为 1,否则为 0
  • ALPHA
  • 自定义
  • 1.29.0
service_controller_loadbalancer_sync_total
一个指标,统计任何负载均衡器已配置的次数,作为集群中服务/节点更改的影响
  • ALPHA
  • 计数器
service_controller_nodesync_error_total
一个指标,统计任何负载均衡器已配置并出错的次数,作为集群中节点更改的影响
  • ALPHA
  • 计数器
service_controller_nodesync_latency_seconds
一个指标,衡量 nodesync 的延迟,该延迟在集群节点更新时更新负载均衡器主机。
  • ALPHA
  • 直方图
service_controller_update_loadbalancer_host_latency_seconds
一个指标,衡量更新每个负载均衡器主机的延迟。
  • ALPHA
  • 直方图
serviceaccount_invalid_legacy_auto_token_uses_total
累计使用的无效自动生成的旧版令牌
  • ALPHA
  • 计数器
serviceaccount_legacy_auto_token_uses_total
累计使用的自动生成的旧版令牌
  • ALPHA
  • 计数器
serviceaccount_legacy_manual_token_uses_total
累计使用的手动创建的旧版令牌
  • ALPHA
  • 计数器
serviceaccount_legacy_tokens_total
累计使用的旧版服务帐户令牌
  • ALPHA
  • 计数器
serviceaccount_stale_tokens_total
累计使用的过期的投影服务帐户令牌
  • ALPHA
  • 计数器
serviceaccount_valid_tokens_total
累计使用的有效的投影服务帐户令牌
  • ALPHA
  • 计数器
storage_count_attachable_volumes_in_use
衡量正在使用的卷数
  • ALPHA
  • 自定义
  • nodevolume_plugin
storage_operation_duration_seconds
存储操作持续时间
  • ALPHA
  • 直方图
  • migratedoperation_namestatusvolume_plugin
taint_eviction_controller_pod_deletion_duration_seconds
Pod 的污点效应被激活的时间与其通过 TaintEvictionController 删除的时间之间的延迟(以秒为单位)。
  • ALPHA
  • 直方图
taint_eviction_controller_pod_deletions_total
自 TaintEvictionController 启动以来,由 TaintEvictionController 删除的 Pod 的总数。
  • ALPHA
  • 计数器
ttl_after_finished_controller_job_deletion_duration_seconds
自作业有资格删除以来,删除作业所花费的时间
  • ALPHA
  • 直方图
volume_manager_selinux_container_errors_total
kubelet 无法为容器计算 SELinux 上下文时的错误数。 然后 kubelet 无法启动此类 Pod,它将重试,因此此指标的值可能不代表容器的实际数量。
  • ALPHA
  • 仪表
  • access_mode
volume_manager_selinux_container_warnings_total
kubelet 无法为容器计算 SELinux 上下文时的错误数,这些错误被忽略。 当 SELinuxMountReadWriteOncePod 特性扩展到所有卷访问模式时,它们将变为真正的错误。
  • ALPHA
  • 仪表
  • access_mode
volume_manager_selinux_pod_context_mismatch_errors_total
Pod 为使用相同卷的容器定义不同的 SELinux 上下文时的错误数。 然后 kubelet 无法启动此类 Pod,它将重试,因此此指标的值可能不代表 Pod 的实际数量。
  • ALPHA
  • 仪表
  • access_mode
volume_manager_selinux_pod_context_mismatch_warnings_total
Pod 为使用相同卷的容器定义不同的 SELinux 上下文时的错误数。 它们还不是错误,但当 SELinuxMountReadWriteOncePod 特性扩展到所有卷访问模式时,它们将变为真正的错误。
  • ALPHA
  • 仪表
  • access_mode
volume_manager_selinux_volume_context_mismatch_errors_total
Pod 使用已使用与 Pod 所需不同的 SELinux 上下文挂载的卷时的错误数。 然后 kubelet 无法启动此类 Pod,它将重试,因此此指标的值可能不代表 Pod 的实际数量。
  • ALPHA
  • 仪表
  • access_modevolume_plugin
volume_manager_selinux_volume_context_mismatch_warnings_total
Pod 使用已使用与 Pod 所需不同的 SELinux 上下文挂载的卷时的错误数。 它们还不是错误,但当 SELinuxMountReadWriteOncePod 特性扩展到所有卷访问模式时,它们将变为真正的错误。
  • ALPHA
  • 仪表
  • access_modevolume_plugin
volume_manager_selinux_volumes_admitted_total
SELinux 上下文正常的卷数,这些卷将使用 mount -o context 选项挂载。
  • ALPHA
  • 仪表
  • access_modevolume_plugin
volume_manager_total_volumes
卷管理器中的卷数
  • ALPHA
  • 自定义
  • plugin_namestate
volume_operation_total_errors
卷操作总错误数
  • ALPHA
  • 计数器
  • operation_nameplugin_name
volume_operation_total_seconds
存储操作端到端持续时间(以秒为单位)
  • ALPHA
  • 直方图
  • operation_nameplugin_name
watch_cache_capacity
按资源类型细分的监视缓存的总容量。
  • ALPHA
  • 仪表
  • resource
watch_cache_capacity_decrease_total
按资源类型细分的监视缓存容量减少事件的总数。
  • ALPHA
  • 计数器
  • resource
watch_cache_capacity_increase_total
按资源类型细分的监视缓存容量增加事件的总数。
  • ALPHA
  • 计数器
  • resource
workqueue_adds_total
工作队列处理的添加总数
  • ALPHA
  • 计数器
  • name
workqueue_depth
工作队列的当前深度
  • ALPHA
  • 仪表
  • name
workqueue_longest_running_processor_seconds
工作队列的最长运行处理器运行了多少秒。
  • ALPHA
  • 仪表
  • name
workqueue_queue_duration_seconds
一个项目在被请求之前在工作队列中停留了多少秒。
  • ALPHA
  • 直方图
  • name
workqueue_retries_total
工作队列处理的重试总数
  • ALPHA
  • 计数器
  • name
workqueue_unfinished_work_seconds
正在进行且未被 work_duration 观察到的工作量(以秒为单位)。 大值表示线程卡住。 可以通过观察此值增加的速率来推断卡住线程的数量。
  • ALPHA
  • 仪表
  • name
workqueue_work_duration_seconds
处理工作队列中的项目所花费的时间(以秒为单位)。
  • ALPHA
  • 直方图
  • name

此页面是自动生成的。

如果您打算报告有关此页面的问题,请在您的问题描述中提及该页面是自动生成的。 修复可能需要在 Kubernetes 项目的其他地方进行。

最后修改时间:2024 年 4 月 24 日 上午 8:17 PST: 更新 v1.30 文档指标 (991862f012)