From dfa5062d02ab120be08698973abf0550d50b0b59 Mon Sep 17 00:00:00 2001 From: mayjiang0203 Date: Thu, 5 Sep 2024 12:05:38 +0800 Subject: [PATCH 1/2] remove by name for alert of TiKV_raftstore_thread_cpu_seconds_total --- alert-rules.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/alert-rules.md b/alert-rules.md index 651c6eece4eb..4a1a4f83fa58 100644 --- a/alert-rules.md +++ b/alert-rules.md @@ -560,11 +560,12 @@ summary: TiDB 集群中各组件的报警规则详解。 * 报警规则: - `sum(rate(tikv_thread_cpu_seconds_total{name=~"raftstore_.*"}[1m])) by (instance, name) > 1.6` + `sum(rate(tikv_thread_cpu_seconds_total{name=~"raftstore_.*"}[1m])) by (instance) > 1.6` * 规则描述: - Raftstore 线程压力太大。 + 代表的是 raftstore CPU 消耗, 如果高代表 Raftstore 线程压力太大。 + 阈值取值为 raftstore.store-pool-size 的 80%, 默认 raftstore.store-pool-size=2, 所以这里设置为 1.6。 * 处理方法: From 61d6918941abee553f5c3564a335726eed9d890c Mon Sep 17 00:00:00 2001 From: mayjiang0203 Date: Thu, 31 Oct 2024 13:39:17 +0800 Subject: [PATCH 2/2] Update alert-rules.md Co-authored-by: Grace Cai --- alert-rules.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/alert-rules.md b/alert-rules.md index 4a1a4f83fa58..55c46528cd47 100644 --- a/alert-rules.md +++ b/alert-rules.md @@ -564,8 +564,9 @@ summary: TiDB 集群中各组件的报警规则详解。 * 规则描述: - 代表的是 raftstore CPU 消耗, 如果高代表 Raftstore 线程压力太大。 - 阈值取值为 raftstore.store-pool-size 的 80%, 默认 raftstore.store-pool-size=2, 所以这里设置为 1.6。 + 监测 raftstore 的 CPU 消耗。如果该值偏大,表明 Raftstore 线程压力很大。 + + 该报警项的阈值为 [`raftstore.store-pool-size`](/tikv-configuration-file.md#store-pool-size) 的 80%。`raftstore.store-pool-size` 默认为 2,所以该阈值为 1.6。 * 处理方法: