From 8be0a6f21b7fc3577dbe709daafdfc6c6623ad46 Mon Sep 17 00:00:00 2001 From: mayjiang0203 Date: Thu, 5 Sep 2024 12:05:38 +0800 Subject: [PATCH 1/2] remove by name for alert of TiKV_raftstore_thread_cpu_seconds_total --- alert-rules.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/alert-rules.md b/alert-rules.md index 89bafcfb14fa..27f9bd1095e6 100644 --- a/alert-rules.md +++ b/alert-rules.md @@ -558,11 +558,12 @@ summary: TiDB 集群中各组件的报警规则详解。 * 报警规则: - `sum(rate(tikv_thread_cpu_seconds_total{name=~"raftstore_.*"}[1m])) by (instance, name) > 1.6` + `sum(rate(tikv_thread_cpu_seconds_total{name=~"raftstore_.*"}[1m])) by (instance) > 1.6` * 规则描述: - Raftstore 线程压力太大。 + 代表的是 raftstore CPU 消耗, 如果高代表 Raftstore 线程压力太大。 + 阈值取值为 raftstore.store-pool-size 的 80%, 默认 raftstore.store-pool-size=2, 所以这里设置为 1.6。 * 处理方法: From 9a16ec388135fe522d3cd444bdffaab02b7d527c Mon Sep 17 00:00:00 2001 From: mayjiang0203 Date: Thu, 31 Oct 2024 13:39:17 +0800 Subject: [PATCH 2/2] Update alert-rules.md Co-authored-by: Grace Cai --- alert-rules.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/alert-rules.md b/alert-rules.md index 27f9bd1095e6..ccda5d2dc884 100644 --- a/alert-rules.md +++ b/alert-rules.md @@ -562,8 +562,9 @@ summary: TiDB 集群中各组件的报警规则详解。 * 规则描述: - 代表的是 raftstore CPU 消耗, 如果高代表 Raftstore 线程压力太大。 - 阈值取值为 raftstore.store-pool-size 的 80%, 默认 raftstore.store-pool-size=2, 所以这里设置为 1.6。 + 监测 raftstore 的 CPU 消耗。如果该值偏大,表明 Raftstore 线程压力很大。 + + 该报警项的阈值为 [`raftstore.store-pool-size`](/tikv-configuration-file.md#store-pool-size) 的 80%。`raftstore.store-pool-size` 默认为 2,所以该阈值为 1.6。 * 处理方法: