KubeCon EU 2026 回顾:HAMi 从展台到主论坛 Keynote Demo
刚刚结束的 KubeCon + CloudNativeCon Europe 2026,释放出一个越来越明确的行业信号:
云原生正在快速从“应用运行平台”演进为 AI 基础设施的运行底座。
在阿姆斯特丹,围绕 Kubernetes、GPU、推理服务、Agentic AI 和异构算力调度的讨论,已经不再停留在概念层面,而是进入到更具体的工程实践、社区协作与基础设施范式演进阶段。
作为 CNCF Sandbox 项目,HAMi 在本届大会上完成了从 Maintainer Summit、Lightning Talk、Project Pavilion 到主论坛 Keynote Demo 的一系列亮相。

Kubernetes 正在进入 AI Infra 阶段
如果说过去 Kubernetes 主要解决的是容器编排、微服务治理和云原生应用交付,那么在这届 KubeCon 上,更受关注的问题已经变成了:
- AI workload 如何更高效地运行在 Kubernetes 上?
- GPU 如何被共享、切分、调度和隔离?
- LLM serving 与底层资源管理如何协同?
- 异构算力如何被统一纳入云原生调度体系?
这些问题背后对应的是一个更本质的变化:
Kubernetes 正在从"编排应用"走向"编排算力"。
这也正是 HAMi 所处的位置。
Maintainer Summit:GPU 调度进入更核心的社区讨论
在大会前的 Maintainer Summit 上,HAMi Maintainer 李孟轩分享了 HAMi 对 AI 工作负载的见解。

随后团队参与了 CNCF 闭门会议,与 CNCF TOC 主席 Karena Angell、Red Hat 以及 vLLM 社区成员 Brian Stevens、Robert Shaw 等进行了深入交流。

这次讨论很有代表性,因为它 并不停留在"某个项目怎么做功能",而是在讨论一个更大的问题:
当 LLM serving、GPU 资源管理和 Kubernetes 在真实生产环境中开始汇合时,基础设施层需要什么样的新抽象?
现场交流中,HAMi 所推动的方向引起了明显关注。大家越来越意识到,GPU 已经不能只被看作一个简单设备,而正在变成一种可以被调度、共享、治理的基础设施资源层。
这也是为什么 HAMi 与 vLLM 等项目之间的协同开始变得越来越自然。在本次活动中,双方已经开始探讨后续的联合内容合作与技术交流,这也说明 AI Infra 生态正在加速从"单点项目"走向"组合式协作"。
另外 HAMi 项目也正在申请 CNCF 孵化,在 TAG workshop 中作为代表项目参与了讨论。

两场技术分享:从社区问题到工程实现
张潇:K8s Issue #52757 - Sharing GPUs Among Multiple Containers
这个问题(#52757)并不是一个新问题,而是在 Kubernetes 社区中存在多年的"未被彻底解决的问 题"。
随着 AI workload 的爆发,这个问题被重新放大:
- 推理服务需要更细粒度的 GPU 使用方式
- 多租户环境要求资源共享
- AI workload 的形态决定了 GPU 不再适合独占
这也是为什么,这个看似底层的问题,开始成为 AI 基础设施的核心问题之一。

HAMi Maintainer 张潇的分享从 Kubernetes 社区长期存在的一个经典问题出发:多个容器如何共享 GPU?
这个问题看似具体,但实际上指向的是整个 AI 基础设施生态共同面临的难题。因为一旦进入推理、批处理、在线服务和多租户混合场景,GPU 就不再适合以"整卡独占"的方式被简单分配。
这场分享的重要性,在于它把 HAMi 所解决的问题放回到了 Kubernetes 社区的原始语境中:不是另起炉灶做一个孤立方案,而是在回应一个长期存在、尚未被彻底解决的 upstream 问题。
李孟轩:Dynamic, Smart, Stable GPU-Sharing Middleware in Kubernetes
HAMi Maintainer 李孟轩的分享聚焦 HAMi 的核心架构与能力,系统介绍了:
- GPU 虚拟化
- GPU 共享与调度机制
- 稳定性与生产可用性设计
- 在 Kubernetes 中实现 AI workload 资源管理的思路