运行 Flux MiniCluster

运行 Kueue 调度的 Flux MiniCluster。

此页面展示了在运行 Flux Operator 的 MiniCluster 时,如何利用 Kueue 的调度和资源管理功能。

本指南适用于对 Kueue 有基本了解的 批量用户。有关更多信息,请参阅 Kueue 概述

开始之前

查看 管理集群配额,了解初始集群设置的详细信息。

查看 Flux Operator 安装指南

MiniCluster 定义

由于 Flux MiniCluster 作为 batch/Job 运行,因此 Kueue 不需要额外组件来管理 Flux MiniCluster。但是,请考虑以下方面

a. 队列选择

目标 本地队列 应在 MiniCluster 配置的 spec.jobLabels 部分中指定。

  jobLabels:
    kueue.x-k8s.io/queue-name: user-queue

b. 配置资源需求

工作负载的资源需求可以在 MiniCluster 配置的 spec.container[*].resources 部分中配置。

spec:
  containers:
    - image: <image>
      resources:
        requests:
          cpu: 4
          memory: "200Mi"

示例 MiniCluster

apiVersion: flux-framework.org/v1alpha1
kind: MiniCluster
metadata:
  generateName: flux-sample-kueue-
spec:
  size: 1
  containers:
    - image: ghcr.io/flux-framework/flux-restful-api:latest
      command: sleep 10 
      resources:
        requests:
          cpu: 4
          memory: "200Mi"
  jobLabels:
    kueue.x-k8s.io/queue-name: user-queue

有关在 Python 中执行此操作的等效说明,请参阅 运行 Python 作业