目前找到的版本实现是 1.13pod-gpu-metrics-exporter,寻求支持 1.12 的采集的开源方案。我好菜,别喷我^_^。
1
richzhu 2019-06-20 10:26:40 +08:00 via iPhone 1
高级,我用的 Prometheus 省事🤪
|
3
choury 2019-06-20 10:41:11 +08:00 via Android 1
用 cadvisor
|
4
vaniot OP @choury 我用了 cadvisor 的得到 mertic:`container_accelerator_memory_used_bytes`,每一个的 value 都是一样的数据,目前只有一个 node 上有 nvidia gpu,这是统计总的信息?
|
9
choury 2019-06-20 11:13:38 +08:00 via Android
@vaniot 怎么分配的呢? mps ? grid ?当前的监控都只能做到卡的粒度,如果你只有一张卡那看到的都是这改卡的使用率
|
11
menyakun 2019-06-20 11:49:52 +08:00
NVIDA 官方提供的 exporter 没有的话,应该也不会有了吧。你用的是 NVIDA GRID ?我记得是要买许可的吧,不知道会不会有闭源的解决方案。
|