GPU

分类 GPU 下的文章。

GPU 主题下已整理 5 篇文章，重点覆盖概念理解、落地实践与生产场景中的决策要点，方便你按主题连续阅读。

更多主题

其他主题

Kubernetes 34 System 7 GPU 5 Agent 1

本栏精选

2026-03-12

按场景拆开 GPU overprovisioning 的常见实现路径，包括调度超配、时间切片、显存限制、MIG、vGPU、队列回填与准入治理，并分析各自的收益、风险与适用边界。

阅读这篇

2026-03-12

从成本结构、交付速度、性能确定性、运维负担与团队能力出发，分析创业公司在 Serverless GPU 与 Dedicated GPU 之间该如何做阶段性选择。

2026-01-26

按工程落地方式拆解 KAI-Scheduler 的 Reservation Pod 机制，以及 HAMi 的硬隔离路径；对比两者在调度表达、隔离保障、落地成本与适用场景上的差异，并给出可组合的协同思路。

2026-01-20

从工程实践看 hetGPU 系统如何实现 GPU 二进制的跨平台兼容，支持运行时 JIT、SIMT vs MIMD、内存模型、状态捕获与跨 GPU 迁移等。

2026-01-12

围绕 gpu-manager 的启动流程、设备拦截、拓扑感知与分配机制，系统解析 Kubernetes 下 GPU 虚拟化的工程化路径。

归档

按时间倒序查看这个分类下的全部文章。

2026-03-12 · 228 次浏览

阅读这篇 →

2026-03-12 · 166 次浏览

从成本结构、交付速度、性能确定性、运维负担与团队能力出发，分析创业公司在 Serverless GPU 与 Dedicated GPU 之间该如何做阶段性选择。

阅读 →

2026-01-26 · 304 次浏览

阅读 →

2026-01-20 · 254 次浏览

从工程实践看 hetGPU 系统如何实现 GPU 二进制的跨平台兼容，支持运行时 JIT、SIMT vs MIMD、内存模型、状态捕获与跨 GPU 迁移等。

阅读 →

2026-01-12 · 326 次浏览

围绕 gpu-manager 的启动流程、设备拦截、拓扑感知与分配机制，系统解析 Kubernetes 下 GPU 虚拟化的工程化路径。

阅读 →