阿里云Grafana服务(公测)(grafana数据库)
116
2022-12-08
本文目录一览:
假设我有2种类型的服务器,一种是本地电脑(每个指标名称都存在{nodename='mac-local'}),一种是阿里云服务器(每个指标名称都存在{nodename='aliyun'}),同时每个指标下都存在一个 {instance='具体的服务器的ip地址'}标签。
即我们采集的时间序列大致上都有如下标签:
eg:
node_uname_info{nodename='xxxx',instance='yyyy'}
我们想监控一下每台主机的cpu的使用情况。同时不能在一个图形上显示出所有的机器的cpu使用率,需要根据用户的选择而显示。即要出现下图所示的结果,这个情况我们可以通过grafana的 模板变量 来实现。
从上图可以,instance的出现是根据 服务器类型 的选择而不同的。
1、在Dashboard页面点击小齿轮⚙️图标。
2、点击创建一个变量
注意:
instance 变量的值是根据上一步 nodename 变量的值而来的,及选择不同的 nodename,instance 的值应该是不同的。及在 instance 变量的查询语句中需要引用 nodename 变的值,通过 $nodename 即可引用。
做完上方出现的1,2两步,即可出现需求中出现的画面。
在 grafana 中引入此json串,即可实现上图的效果。 但是要保证每个时间序列都存在 nodename 和 instance的标签。
1、 grafana模板变量的使用
站点用的是 https,付费的证书,所以要嵌入到 web 上也需要grafana是https的。
我们用nginx做反向代理,但是certool 签证一直不成功。
想到以前 用letsencrypt证书手机上访问特别慢,在这种情况下,我们无法使用它。
只能和原来的web整合在一起。
nginx 配置如下:
将 grafana 的root_url 改为 就完成了与 web 的整合。
添加参数如下 cfg:default.server.root_url=
统一监控报警平台
使用Grafana汇聚了,Prometheus,ELK,CloudWatch监控信息.
简单理解 ELK,AWS均可以实现短信和电话报警
1.Grafana支持短信渠道报警和电话渠道报警.
2.对不同微服务的开发团队发送报警信息.
1.阿里云短信电话服务API
2.Jenkins-plugin: Generic Webhook Trigger Plugin
访问jenkins页面
搜索并安装插件 Generic Webhook Trigger Plugin
创建Jenkins Job (下图是几处关键设置)
Url: (此处的sms是jenkins中的token)
在Grafana触发报警后会通过这个Channel 发送一个POST请求到Jenkins.
Jenkins会执行对应的JOB
job执行结果
发表评论
暂时没有评论,来抢沙发吧~