最新消息:关注人工智能 AI赋能新媒体运营

红帽发布OpenShift 4.21,将AI、容器与虚拟化整合至统一平台,并增强GPU资源调度能力

科技资讯 admin 浏览

开源解决方案供应商红帽(Red Hat)近日宣布推出企业级Kubernetes平台Red Hat OpenShift 4.21。此版本以Kubernetes 1.34与容器运行环境CRI-O 1.34为基础,将AI、容器与虚拟化工作负载整合于同一基础设施,并通过动态资源分配机制强化GPU资源调度能力,以提升混合云环境下的整体资源使用效率。

随着企业逐步将AI应用导入正式运营环境,AI训练与推理工作负载对资源调度与系统整合的需求持续提升。红帽指出,过去AI、容器、虚拟机多分散于不同平台运行,不仅增加系统管理复杂度,也降低资源配置效率。OpenShift 4.21强调在统一运营模型下整合不同类型工作负载,并可根据实际需求自动调整资源配置。

在AI工作负载支持方面,OpenShift 4.21引入红帽构建的Kueue(Red Hat build of Kueue)1.2版本,以及用于OpenShift Container Platform的JobSet Operator。Kueue是Kubernetes上的工作负载调度与队列管理机制,适用于AI训练等批处理任务,并提供任务队列可视化能力,让用户可掌握执行顺序与预计启动时间;JobSet Operator则用于协调多个相互依赖的分布式任务,支持容错与重试机制,使企业可在既有GitOps与权限管控架构下执行大规模分布式计算。

针对AI计算核心的GPU资源管理,红帽在本版本中强化了Dynamic Resource Allocation(DRA)机制。DRA是Kubernetes的动态资源配置功能,允许工作负载根据硬件条件(如GPU内存容量)提出资源需求,由系统自动匹配符合条件的设备,并支持资源优先级与替代策略,以提升资源配置弹性。此外,该机制也提供管理员例外访问能力,便于进行监控与调试。

在核心平台能力方面,OpenShift 4.21针对Hosted Control Plane引入Vertical Pod Autoscaler(VPA)。Hosted Control Plane是将Kubernetes控制层组件集中托管,并与工作节点分离的架构设计,而VPA可根据实际资源使用情况,自动调整Pod(容器运行单元)的CPU与内存配置,降低人工设置负担并提升资源使用效率,从而降低基础设施成本。

在既有企业环境整合方面,OpenShift 4.21支持VMware Cloud Foundation 9,并可部署于Oracle的Oracle Database Appliance,提供软硬件一体化的数据库环境,以增强混合云部署弹性。

在安全机制上,此版本支持在Microsoft Azure环境中运行Confidential Containers,通过硬件级保护机制,确保数据在内存中处理时仍保持隔离状态,以降低云平台或底层系统访问敏感数据的风险。

虚拟化方面,OpenShift Virtualization支持在同一平台上同时运行虚拟机与容器工作负载,并提供跨集群零停机迁移功能,可在不中断服务的情况下进行维护或资源调整。此外,该版本亦支持IPv6专用的控制层与辅助网络,并可在Google Cloud裸机环境运行虚拟化工作负载,以满足低延迟与高性能需求。