From 9bbc0d121b71348544f50b27b87f5bd743fd0c5b Mon Sep 17 00:00:00 2001 From: mayjiang0203 Date: Thu, 5 Sep 2024 12:05:38 +0800 Subject: [PATCH 1/2] remove by name for alert of TiKV_raftstore_thread_cpu_seconds_total --- alert-rules.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/alert-rules.md b/alert-rules.md index f10a45a107b7..d5aaeb1df115 100644 --- a/alert-rules.md +++ b/alert-rules.md @@ -575,11 +575,12 @@ summary: TiDB 集群中各组件的报警规则详解。 * 报警规则: - `sum(rate(tikv_thread_cpu_seconds_total{name=~"raftstore_.*"}[1m])) by (instance, name) > 1.6` + `sum(rate(tikv_thread_cpu_seconds_total{name=~"raftstore_.*"}[1m])) by (instance) > 1.6` * 规则描述: - Raftstore 线程压力太大。 + 代表的是 raftstore CPU 消耗, 如果高代表 Raftstore 线程压力太大。 + 阈值取值为 raftstore.store-pool-size 的 80%, 默认 raftstore.store-pool-size=2, 所以这里设置为 1.6。 * 处理方法: From 3748277c758e3b88b8ede62638f47a8a64072bf6 Mon Sep 17 00:00:00 2001 From: mayjiang0203 Date: Thu, 31 Oct 2024 13:39:17 +0800 Subject: [PATCH 2/2] Update alert-rules.md Co-authored-by: Grace Cai --- alert-rules.md | 5 +++-- 1 file changed, 3 insertions(+), 2 deletions(-) diff --git a/alert-rules.md b/alert-rules.md index d5aaeb1df115..b2c1ef5e4159 100644 --- a/alert-rules.md +++ b/alert-rules.md @@ -579,8 +579,9 @@ summary: TiDB 集群中各组件的报警规则详解。 * 规则描述: - 代表的是 raftstore CPU 消耗, 如果高代表 Raftstore 线程压力太大。 - 阈值取值为 raftstore.store-pool-size 的 80%, 默认 raftstore.store-pool-size=2, 所以这里设置为 1.6。 + 监测 raftstore 的 CPU 消耗。如果该值偏大,表明 Raftstore 线程压力很大。 + + 该报警项的阈值为 [`raftstore.store-pool-size`](/tikv-configuration-file.md#store-pool-size) 的 80%。`raftstore.store-pool-size` 默认为 2,所以该阈值为 1.6。 * 处理方法: