Ceph 监控中应用 Prometheus relabel 功能

  • 时间:
  • 浏览:0

工作环境富含还有一个多多多多独立的 Ceph 集群,分别负责对象存储、块存储和文件存储。搭建这好多个 Ceph 集群时,我对 Ceph 重命名 Cluster name 的难度太难足够的了解,全都使用的都不 默认的 cluster name:ceph,不巧的是 Prometheus 的 ceph_exporter 全都 用 cluster name 来区分不同集群,结果是 Grafana 中各个集群的数据无法区分,所有的集群数据都绘制在了还有一个多多多多图标中,非常乱不说,但会 主次数据还无法正常显示。

光是修改 Prometheus 的配置还过低,毕竟大家 时要在界面都能否 体现出来,Grafana 的 dashboard 也要做对应的修改,本文使用的 dashboard 是 Ceph - Cluster

最后多亏 neurodrone,才了解到 Prometheus 的 relabel 功能,都能否 完美的处里这俩 问题图片图片。

修改后的 metric 信息变成这俩 样子,那我 大家 就都能否 区分出不同的 Ceph 集群的数据了。

举还有一个多多多多例子,还有一个多多多多集群的 ceph_pool_write_total 的 label cluster 取值都为 ceph。但在 Prometheus 的配置中,大家 分别是分属于不通 job 的,大家 都能否 通过对 job 进行 relabel 来修改 cluster label 的指,来完成区分。

不过 fsid 这俩 变量太难直观看出来代表的是哪个 Ceph 集群,也都不 还有一个多多多多好的方案。

大家 但会 都能否 在 dashboard 上看多新加的 variable 了:

最终改好的 dashboard json 文件可从如下链接下载到:

ceph-cluster.json

大家 说大家 会说,那就改 Ceph cluster name 不就好了。问题图片图片是 Ceph 修改 Cluster name 没太难简单,ceph 文件存储目录都不 和 Cluster name 有对应关系的,全都全都配置文件和数据都时要修改目录都能否 生效,对于但会 日后开始正式使用的 Ceph 集群,太难做风险很糙大。当然但会 给每个 Ceph 集群单独搭建还有一个多多多多 Prometheus 和 Grafana 环境语录,问题图片图片都能否 处里,但这俩 最好的办法显得太没技术含量了,太难万不得已,真是我想要采用。

首先是要 dashboard 加进 clusters 变量,在界面上操作即可。

先点击 dashboard 的 "settings" 按钮(显示齿轮图标的全都 )

我最日后开始想到的处里最好的办法是修改 ceph_exporter,既然 cluster name 不行,那加进 Ceph 的 fsid 总能区分出来了吧,就像那我 :

具体的配置如下,cluster label 的值就改为了 ceph*,但会 导出到了新 label clusters 中。

接下来每个图表的查询语录也要做对应的修改:

Relabel 的本意真是修改导出 metrics 信息的 label 字段,都能否 对 metrics 做过滤,删除某些并太难的 metrics,label 重命名等,但会 也支持对 label 的值作出修改。

如下图所示加进 clusters variable,最后保存。