队列故障排除

排查 LocalQueue 或 ClusterQueue 的状态

为什么 LocalQueue 中没有工作负载被接纳?

LocalQueue 的状态包括 LocalQueue 上的任何配置问题详细信息,作为 Active 条件的一部分。

运行以下命令以查看 LocalQueue 的状态

kubectl get localqueue -n my-namespace my-local-queue -o yaml

LocalQueue 的状态将类似于以下内容

status:
  admittedWorkloads: 0
  conditions:
  - lastTransitionTime: "2024-05-03T18:57:32Z"
    message: Can't submit new workloads to clusterQueue
    reason: ClusterQueueIsInactive
    status: "False"
    type: Active

在上面的示例中,Active 条件的状态为 False,因为 ClusterQueue 未处于活动状态。

为什么集群队列中没有工作负载被允许?

集群队列 的状态包括集群队列上任何配置问题的详细信息,作为 活动 条件的一部分。

运行以下命令以查看集群队列的状态

kubectl get clusterqueue my-clusterqueue -o yaml

集群队列的状态将类似于以下内容

status:
  admittedWorkloads: 0
  conditions:
  - lastTransitionTime: "2024-05-03T18:22:30Z"
    message: 'Can''t admit new workloads: FlavorNotFound'
    reason: FlavorNotFound
    status: "False"
    type: Active

在上面的示例中,活动 条件的状态为 False,因为配置的风味不存在。阅读 管理集群队列 以了解如何配置集群队列。

如果集群队列配置正确,则状态将类似于以下内容

status:
  admittedWorkloads: 1
  conditions:
  - lastTransitionTime: "2024-05-03T18:35:28Z"
    message: Can admit new workloads
    reason: Ready
    status: "True"
    type: Active

如果集群队列具有状态为 True活动 条件,并且您仍然不观察到工作负载被允许,那么问题更有可能出在各个工作负载中。阅读 故障排除作业 以了解为什么无法允许各个作业。