1 Overview
Thomas Li edited this page Apr 9, 2018
·
1 revision
云平台系统监控报警和自动化管理软件(简称PromAnsible),是一套建立在Google SRE运维实践和业界最流行的ansible自动化工具的基础上的云平台IT管理软件。
它采用时间序列数据来记录和收集企业所有IT设备(包括但不限于服务器,PC,网络设备等)的状态,汇总到中心服务器上,并以动态图表的方式实时显示;
同时,管理员还可以自定义报警规则和对应的自动化处理任务。报警信息会自动发送到管理员的手机微信上,同时预定义的任务处理会在相应的报警发生时,自动运行。
对任何规模的公司和组织,无论他们是自建IT服务还是采购公有云服务,都需要实时的了解到承载公司业务的各种设备的状态,同时能够在出现问题和故障的时候,第一时间收到报警,并能够自动化处理警报。PromAnsible能够充分满足这一需要。
PromAnsible和其它监控报警软件系统不一样的地方在于,
- 报警规则是高度定制化的
- 根据收集到的时间序列数据,管理员可以定义各种指标量。在低于或高于指定指标量的情况下,系统自动发出警报。同时还可以根据时间序列预测公式,可以在物理指标到达警戒值之前几个小时提前报警。
- 任务处理是高度定制和可扩展的
- 利用ansible的模块特性,可以针对每个任务处理编写独立的处理模块。这些模块可以由管理员配置为针对某种警报的自动化处理任务。另外,模块的编写也可以外包,然后通过github的代码管理功能,自动集成到PromAnsible服务器上
- CPU:PIII800以上
- 内存:2G以上
- 硬盘:80G以上
- 显存:128M以上
- 分辨率:800x600或1024x768(推荐)
- 颜色质量:24B,32B(推荐)
- 操作系统:Ubuntu Server 16.04 64 bit
- 浏览器:推荐Google Chrome