状态中的待处理工作负载

获取 ClusterQueue 和 LocalQueue 状态中的待处理工作负载。

此页面将展示如何监控待处理工作负载。

此页面的目标受众是 批处理管理员

从 v0.5.0 版本开始,Kueue 为批处理管理员提供了监控待处理作业管道的功能,并帮助用户估算其作业的启动时间。

开始之前

确保满足以下条件

  • Kubernetes 集群正在运行。
  • kubectl 命令行工具与您的集群进行通信。
  • Kueue 已安装,版本为 v0.5.0 或更高版本。

启用 QueueVisibility 特性

QueueVisibility 是默认情况下禁用的Alpha特性,请查看更改特性门配置部分的安装,了解详细信息。

监控待处理工作负载

特性状态自 Kueue v0.5 起为 Alpha

要安装集群队列的简单设置,请运行以下命令

kubectl apply -f https://raw.githubusercontent.com/kubernetes-sigs/kueue/main/site/static/examples/admin/single-clusterqueue-setup.yaml

例如,让我们在循环中创建 10 个作业

for i in {1..10}; do kubectl create -f https://raw.githubusercontent.com/kubernetes-sigs/kueue/main/site/static/examples/jobs/sample-job.yaml; done

要查看待处理工作负载状态,请运行以下命令

kubectl describe clusterqueues.kueue.x-k8s.io

输出类似于以下内容

Status:
  ...
  Pending Workloads:  10
  Pending Workloads Status:
    Cluster Queue Pending Workload:
      Name:            job-sample-job-gswhv-afff9
      Namespace:       default
      Name:            job-sample-job-v8dwc-ab5b7
      Namespace:       default
      Name:            job-sample-job-lrxbj-a9a91
      Namespace:       default
      Name:            job-sample-job-dj6nb-e6ef8
      Namespace:       default
      Name:            job-sample-job-6hdgw-bb26e
      Namespace:       default
      Name:            job-sample-job-2d268-693a7
      Namespace:       default
      Name:            job-sample-job-bfkd7-5e739
      Namespace:       default
      Name:            job-sample-job-8sbgz-506c6
      Namespace:       default
      Name:            job-sample-job-k2bmq-44616
      Namespace:       default
      Name:            job-sample-job-c724j-50fd2
      Namespace:       default
    Last Change Time:  2023-09-28T09:22:12Z

要配置队列可见性,请按照使用自定义管理器配置安装 Kueue中的说明进行操作。

queueVisibility.clusterQueues.maxCount参数表示 ClusterQueue 状态中显示的待处理工作负载的最大数量。默认情况下,Kueue 会将此参数设置为 10。当值设置为 0 时,则禁用 ClusterQueues 可见性更新。

    queueVisibility:
      clusterQueues: 
        maxCount: 0

queueVisibility.updateIntervalSeconds参数允许控制 Kueue 启动后快照更新的周期。默认为 5 秒。它还可以在 Kueue 配置中更改

    queueVisibility:
      updateIntervalSeconds: 5s