From e5aa1fbc54f1db738b3be456823c95bc1b342735 Mon Sep 17 00:00:00 2001 From: mayjiang0203 Date: Thu, 5 Sep 2024 12:05:38 +0800 Subject: [PATCH 1/2] remove by name for alert of TiKV_raftstore_thread_cpu_seconds_total --- alert-rules.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/alert-rules.md b/alert-rules.md index 0f58674eac63..d6bd5757db23 100644 --- a/alert-rules.md +++ b/alert-rules.md @@ -561,11 +561,12 @@ aliases: ['/docs-cn/dev/alert-rules/','/docs-cn/dev/reference/alert-rules/'] * 报警规则: - `sum(rate(tikv_thread_cpu_seconds_total{name=~"raftstore_.*"}[1m])) by (instance, name) > 1.6` + `sum(rate(tikv_thread_cpu_seconds_total{name=~"raftstore_.*"}[1m])) by (instance) > 1.6` * 规则描述: - Raftstore 线程压力太大。 + 代表的是 raftstore CPU 消耗, 如果高代表 Raftstore 线程压力太大。 + 阈值取值为 raftstore.store-pool-size 的 80%, 默认 raftstore.store-pool-size=2, 所以这里设置为 1.6。 * 处理方法: From 25c0d65d530e1e3561d88bcee840005736c09213 Mon Sep 17 00:00:00 2001 From: mayjiang0203 Date: Thu, 31 Oct 2024 13:39:17 +0800 Subject: [PATCH 2/2] Update alert-rules.md Co-authored-by: Grace Cai --- alert-rules.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/alert-rules.md b/alert-rules.md index d6bd5757db23..b18b603d331a 100644 --- a/alert-rules.md +++ b/alert-rules.md @@ -565,8 +565,9 @@ aliases: ['/docs-cn/dev/alert-rules/','/docs-cn/dev/reference/alert-rules/'] * 规则描述: - 代表的是 raftstore CPU 消耗, 如果高代表 Raftstore 线程压力太大。 - 阈值取值为 raftstore.store-pool-size 的 80%, 默认 raftstore.store-pool-size=2, 所以这里设置为 1.6。 + 监测 raftstore 的 CPU 消耗。如果该值偏大,表明 Raftstore 线程压力很大。 + + 该报警项的阈值为 [`raftstore.store-pool-size`](/tikv-configuration-file.md#store-pool-size) 的 80%。`raftstore.store-pool-size` 默认为 2,所以该阈值为 1.6。 * 处理方法: