目录:
(1)Prometheus基本原理和使用
(2)Springboot中集成Prometheus
Prometheus是一个开源的监控和告警系统,于2016年加入了CNCF(Cloud Native Computing Foundation)基金会,成为了继kubernetes之后的第二个托管项目。
介绍
Prometheus是一个开源的监控和告警系统,于2016年加入了CNCF(Cloud Native Computing Foundation)基金会,成为了继kubernetes之后的第二个托管项目。在Kubernetes容器管理系统中,通常会搭配prometheus进行监控,同时也支持多种exporter采集数据。
Prometheus天然具有对容器的适配性,可非常方便的满足容器的监控需求,也可以用来监控传统资源。近年来随着kubernetes容器平台的火爆,Prometheus的热度也在不断上升,大有超越老牌监控系统Zabbix的趋势,目前已经在众多公司得到广泛使用。
特点
- 多维度数据模型,这些数据是时间有序的,由metric指标名称和一系列键值对组成
- 灵活的查询语言-PromQL,支持对采集到的指标数据进行相加,相乘和连接等操作
- 可以存储在本地,而不依赖于分布式存储
- 可以基于HTTP来pull数据
- 也可以通过中间网关来push数据
- 可通过服务发现或者静态配置方式来发现目标服务对象
- 有多种可视化图形界面,如Grafana
架构
Prometheus生态包含许多组件,主要是:
- Server
用于收集和存储时序数据。 - Client Libraries
客户端库,用于检测应用程序代码,当Prometheus抓取实例的HTTP端点时,客户端库会将所有跟踪的metrics指标的当前状态发送到prometheus服务端。 - Push Gateway
支持短期任务 - Exporter
Prometheus支持多种exporter,通过exporter可以采集到metrics数据并发送到prometheus服务端。所有向prometheus提供监控数据的程序都可以被称为exporter。 - AlertManager
对告警数据进行处理,包括分组,去重,路由给各个不同的接收方,如电子邮件等。 - 可视化工具
监控指标可视化工具,如grafana等。
组件图如下:

其中最主要的是Prometheus Server,负责数据采集和存储,提供PromQL查询语言支持。它包含了三个插件:
- Retrieval: 获取监控数据
- TSDB: Time Series Database, 时间序列数据库,用于储存时序数据
- HTTP Server: 为可视化界面或告警提供查询接口
工作原理
服务发现
Prometheus可通过多种方式发现要监控的资源列表,包括:
- 用户提供的静态资源列表。
- 基于文件的发现。
- 自动发现,如使用DNS SRV记录来生成列表或通过查询Consul等配置中心获取信息。
指标收集
Prometheus根据配置的job定时去拉取各个监控节点的数据,任何组件只要提供对应的HTTP接口就可以接入监控,不需要任务SDK或其他集成过程,非常适合虚拟化环境的监控,如kubernetes、Docker等。
默认的拉取方式为pull,也可以使用pushgateway提供的push方式获取各个监控节点的数据,并将获取到的数据存入TSDB。
数据查询
Prometheus提供一套内置的PromQL语言,其自带的Web-UI查询数据支持按条件表达式的方式查询相关监控数据。
可视化
Prometheus自带的Web-UI可支持图表展示,但功能及界面较简陋,常规方案是接入grafana进行展示和管理。
聚合告警
Prometheus Server没有内置告警工具,程序基于配置的rules发送告警信息到Alertmanager,由AlertManager对告警信息进行统一处理。
Alertmanager支持对告警信息进行聚合和收敛,并通过邮箱、短信、微信等多种告警方式发送给相关接收人。
安装使用
从官网下载并解压,然后进入文件夹,执行./prometheus即可启动。
访问localhost:9090,可以看到ui界面,如下所示:

配置prometheus
prometheus的配

Prometheus是一款开源的监控和告警系统,属于CNCF项目,常用于Kubernetes的监控。它具有多维度数据模型,支持PromQL查询语言,并通过服务发现和定期拉取数据进行监控。PrometheusServer、Exporters、Alertmanager和Grafana等组件共同构成了监控生态。配置包括服务发现、指标收集和告警规则设置。通过静态配置或服务发现动态获取监控目标,使用PromQL查询和可视化监控数据。此外,介绍了如何安装和配置node-exporter以监控主机资源。

7万+

被折叠的 条评论
为什么被折叠?



