我们公司刚刚买了监控宝,请问如何用监控宝做自动化运维呢?
1
cloudwise 2016-12-16 15:29:55 +08:00
监控宝可以多区域去监控服务器,网站的健康状况,还包含了一些国外节点(我们的业务涉及海外),而且阀值这块可以自己去定义。其中最重要的就是 callback 告警消息。如果我们在服务器网络或者其他原因导致宕机,收到的不是告警消息,而让他们能够根据消息去自动处理是不是会更好呢。给大家一副图来理解下:
![]( ) 根据回调信息,事先将其定义成一些规则,当我们匹配到了告警信息中的特定信息可以自主切换. 监控宝的 URL 回调可以在这里设置: ![]( ) 运维监控的发展: 过去: nagios 、 cacti 、 zabbix 监控单一,对告警后知后觉 现在: API 监控数据聚合、告警信息收敛,自动化感知 未来:挖掘故障信息,制定故障自愈规则,提前感知 所以我们未来要做的就是要收集告警信息进行自动化处理,而不是通知运维上线处理。 我们要脱离那种每天等着告警信息去处理故障,要主动出击,不要等到故障了再去处理,及时处理好了,那么时间成本也是很高的。 |