Skip to content
uhp edited this page Jun 16, 2014 · 4 revisions

web

UHP的提供的web界面。管理员可以通过界面进行方便的集群管理。当前主要分为管理和监控两大部分。

管理:管理集群

当前,web提供以下几个标签页用于管理集群:

  • 服务:添加,管理服务。查看的实例状态。修改配置。

    • 概况:可以一个服务发送集群操作(格式化,初始化,启动,关闭,重启等)
    • 实例:查看实例状态,也可以针对特定的实例发送操作(启动,关闭,重启等)
    • 配置变量:UHP把常用的修改的配置,都用抽取出来,放到配置变量的页面中,方便修改。修改后,重启对应的实例,就会使用新的配置。
    • 配置调度器
    • 配置aux
  • 机器:添加和管理机器,配置服务角色。

    • 机器:添加或者删除机器
    • 角色:为一个服务添加或者删除角色。
    • 分组:编译机器的分组关系。方便对机器进行分组管理。
  • 任务:查看任务的执行状况和执行结果。可以重跑任务或者终止任务。

  • 设置:设置必要的全局配置。

  • 模板:修改配置文件的模板,查看配置生成的配置文件。

监控:展示监控数据,设置告警规则

当前,web提供以下几个标签页用于展示采集的数据。配置页面可以设置告警规则。

  • 概览:概览整个集群的状态

    • 当前状态:计算当前集群的健康状态。
    • 告警列表:查阅以往发送的告警记录。
  • 机器:概览整个集群各个机器的状态分布

    • 概览:当前集群的负载,cpu,网络,内存等使用状态的分布。
    • 重要指标、监控指标、监控机器:展示不同指标的数据
  • 服务:概览整个集群各个服务的运行分布

    • 服务概览:当前集群的服务的数据的展示。
    • 服务指标、服务实体:展示不同服务实例的数据
  • 作业:查看作业相关的数据和运行状态

    • 当前作业:当前集群的正在运行的作业。
    • RM指标:展示Resourcemanager相关的指标
    • NM指标:展示NodeManager相关的指标
    • 应用查询:可以查询所有的采集的作业,及其相关数据
  • 配置:配置告警规则和一些重要的告警配置

    • 告警配置:配置告警规则,可以使用内置的配置表达式,也可以自定义开发相关的配置函数。
    • 告警公共变量:mail_to是配置告警邮件发送的目标邮箱。在开发自定义的回调动作或者告警规则的时候,也可以在这里定义配置。