运维笔记
安全攻防
奇淫技巧
探知未来
赏金猎人
Incipience
Middleware
Kubernetes
Databases
Monitoring
Virtualization
GPU
10月11日 · 2025年
《30% 到 90%:K8s GPU 共享架构演进》
GPU
Kubernetes
1
0
别再为了一个轻量级 API 烧掉整张 A100,那样你的 CFO 会哭的…
5月5日 · 2025年
《算力治理:K8s GPU 切分技术栈全景拆解》
GPU
Kubernetes
MIG
vGPU
4
0
“我们 8 张 A100,跑模型 GPU 利用率死活上不去,一直在 30…
1月29日 · 2025年
《算法是门脸,工程是命门》
AI
GPU
大模型
12
0
为什么你的大模型训练总是卡在“等待资源”?为什么GPU买了一堆,利用率却…
11月27日 · 2024年
《从0到1搭建K8s GPU调度平台》
GPU
Kubernetes
16
0
别再让你的GPU“睡大觉”了,一套完整的调度平台能让算力利用率翻倍。“我…
9月15日 · 2024年
《AI 基建内功:重构大模型底座》
GPU
1
0
大模型训练一般都是用单机 8 卡 GPU 主机组成集群,机型包括 8*{…
7月25日 · 2021年
Kubernetes 集群使用 GPU 节点
AI
GPU
Kubernetes
深度学习
240
0
对于过度依赖 AI 工作的时代,尤其是深度学习,受益于 GPU 提供的优…
1