Skip to content

1 Overview

Thomas Li edited this page Apr 9, 2018 · 1 revision

介绍

云平台系统监控报警和自动化管理软件(简称PromAnsible),是一套建立在Google SRE运维实践和业界最流行的ansible自动化工具的基础上的云平台IT管理软件。

它采用时间序列数据来记录和收集企业所有IT设备(包括但不限于服务器,PC,网络设备等)的状态,汇总到中心服务器上,并以动态图表的方式实时显示;

同时,管理员还可以自定义报警规则和对应的自动化处理任务。报警信息会自动发送到管理员的手机微信上,同时预定义的任务处理会在相应的报警发生时,自动运行。

适用范围

对任何规模的公司和组织,无论他们是自建IT服务还是采购公有云服务,都需要实时的了解到承载公司业务的各种设备的状态,同时能够在出现问题和故障的时候,第一时间收到报警,并能够自动化处理警报。PromAnsible能够充分满足这一需要。

特点

PromAnsible和其它监控报警软件系统不一样的地方在于,

  • 报警规则是高度定制化的
  • 根据收集到的时间序列数据,管理员可以定义各种指标量。在低于或高于指定指标量的情况下,系统自动发出警报。同时还可以根据时间序列预测公式,可以在物理指标到达警戒值之前几个小时提前报警。
  • 任务处理是高度定制和可扩展的
  • 利用ansible的模块特性,可以针对每个任务处理编写独立的处理模块。这些模块可以由管理员配置为针对某种警报的自动化处理任务。另外,模块的编写也可以外包,然后通过github的代码管理功能,自动集成到PromAnsible服务器上

运行环境

硬件环境

  • CPU:PIII800以上
  • 内存:2G以上
  • 硬盘:80G以上
  • 显存:128M以上
  • 分辨率:800x600或1024x768(推荐)
  • 颜色质量:24B,32B(推荐)

软件环境

  • 操作系统:Ubuntu Server 16.04 64 bit
  • 浏览器:推荐Google Chrome