关于Doris的prometheus监控指标的问题

Viewed 17

目前公司要做doris的架构标准化工作,确认监控指标是标准化的一部分。 我也阅读了官方文档。 https://doris.apache.org/zh-CN/docs/admin-manual/maint-monitor/monitor-metrics/metrics 了解了其中比较关键的指标。 但有问题。 我一些关注的指标并没有在这里面找到
1: 比如FE BE的宕机指标标识(重要)。
2: 异常物化视图或调度任务的成功与失败。
3: 长查询任务的失败等等。
请帮忙确认我比较关注的指标。谢谢。

1 Answers

1、fe/be的状态基于alive相关的指标
2、异步物化/job相关的任务状态,需要主动去show确认
3、长查询失败可以考虑基于审计日志的慢查询去监控:审计日志插件