队列故障排除
排查 LocalQueue 或 ClusterQueue 的状态
为什么 LocalQueue 中没有工作负载被接纳?
LocalQueue 的状态包括 LocalQueue 上的任何配置问题详细信息,作为 Active
条件的一部分。
运行以下命令以查看 LocalQueue 的状态
kubectl get localqueue -n my-namespace my-local-queue -o yaml
LocalQueue 的状态将类似于以下内容
status:
admittedWorkloads: 0
conditions:
- lastTransitionTime: "2024-05-03T18:57:32Z"
message: Can't submit new workloads to clusterQueue
reason: ClusterQueueIsInactive
status: "False"
type: Active
在上面的示例中,Active
条件的状态为 False
,因为 ClusterQueue 未处于活动状态。
为什么集群队列中没有工作负载被允许?
集群队列 的状态包括集群队列上任何配置问题的详细信息,作为 活动
条件的一部分。
运行以下命令以查看集群队列的状态
kubectl get clusterqueue my-clusterqueue -o yaml
集群队列的状态将类似于以下内容
status:
admittedWorkloads: 0
conditions:
- lastTransitionTime: "2024-05-03T18:22:30Z"
message: 'Can''t admit new workloads: FlavorNotFound'
reason: FlavorNotFound
status: "False"
type: Active
在上面的示例中,活动
条件的状态为 False
,因为配置的风味不存在。阅读 管理集群队列 以了解如何配置集群队列。
如果集群队列配置正确,则状态将类似于以下内容
status:
admittedWorkloads: 1
conditions:
- lastTransitionTime: "2024-05-03T18:35:28Z"
message: Can admit new workloads
reason: Ready
status: "True"
type: Active
如果集群队列具有状态为 True
的 活动
条件,并且您仍然不观察到工作负载被允许,那么问题更有可能出在各个工作负载中。阅读 故障排除作业 以了解为什么无法允许各个作业。