You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Copy file name to clipboardExpand all lines: src/common/de/self_monitoring.asciidoc
+16-14Lines changed: 16 additions & 14 deletions
Display the source diff
Display the rich diff
Original file line number
Diff line number
Diff line change
@@ -1,9 +1,8 @@
1
1
// -*- coding: utf-8 -*-
2
2
// IGNORE Realtime
3
-
// SKIPCOMMITS
3
+
// NONASCII
4
4
include::global_attr.adoc[]
5
5
= Das eigene System überwachen
6
-
:revdate: 2025-12-16
7
6
:title: Das eigene System überwachen
8
7
:description: {CMK} kann nicht nur andere Systeme überwachen, auch das Monitoring der eigenen Gesundheit ist möglich. Lesen Sie hier mehr dazu.
9
8
@@ -14,13 +13,15 @@ xref:wato_rules#[Regeln]
14
13
{related-end}
15
14
16
15
16
+
[#intro]
17
17
== Einleitung
18
18
19
19
Im xref:intro_setup_monitor.html#linux[Leitfaden für Einsteiger] haben wir Ihnen gezeigt, wie man die Basis schafft, um den {CMK}-Server zu überwachen.
20
20
Im folgenden Artikel geht es nun darum, diese Überwachung sinnvoll mit Leben zu füllen.
21
21
Schließlich kann {CMK} nicht nur prüfen, ob der {CMK}-Server läuft, sondern es gibt noch weitaus mehr Parameter, die geprüft -- und in der Folge auch optimiert -- werden können.
22
22
23
23
24
+
[#discovery]
24
25
== Prozesserkennung
25
26
26
27
In der Prozesserkennung beispielsweise existieren vorgefertigte Regeln für spezifische Services zur Selbstüberwachung.
@@ -58,13 +59,14 @@ Jede Regel, die Sie nicht benötigen, können Sie sowohl deaktivieren als auch l
58
59
Wir empfehlen, nicht benötigte Regeln zu deaktivieren, insbesondere, wenn Sie keine der Regeln nutzen wollen.
59
60
Denn wenn Sie alle Regeln löschen -- anstatt sie nur zu deaktivieren -- , dann werden beim nächsten Einspielen eines {CMK}-Patches alle Regeln erneut erstellt.
60
61
61
-
Was Sie nun mit diesen Services anfangen können, lesen Sie im Artikel xref:wato_services#[Services verstehen und konfigurieren.]
62
+
Was Sie nun mit diesen Services anfangen können, lesen Sie im Artikel xref:wato_services#[Services verstehen und konfigurieren].
62
63
Was genau die Prozesse leisten, die hier als Services ins Monitoring aufgenommen werden, finden Sie im Artikel über die xref:cmk_processes#[Instanzdienste] beschrieben.
63
64
64
65
66
+
[#plug-ins]
65
67
== Selbstüberwachung des Systems (Plugins)
66
68
67
-
Auch im link:https://checkmk.com/integrations[{CMK} Plugins-Katalog] gibt es diverse Möglichkeiten zur Selbstüberwachung Ihres Systems.
69
+
Auch im link:https://checkmk.com/integrations[Katalog der Check-Plugins^] gibt es diverse Möglichkeiten zur Selbstüberwachung Ihres Systems.
68
70
Teilweise sind diese bereits standardmäßig in Ihrem System aktiviert, so dass Sie kein zusätzliches Plugin benötigen.
69
71
Die folgende Tabelle gibt dennoch eine Gesamtübersicht:
70
72
@@ -73,41 +75,41 @@ Die folgende Tabelle gibt dennoch eine Gesamtübersicht:
73
75
|Plugin-Name / +
74
76
Manual Page Titel | Funktion | Parameter | Ausgabe
75
77
|bi_aggregation / +
76
-
Checkmk: State of BI Aggregation |Gibt den Status einer xref:bi#[BI-Aggregation] aus. Zeigt auch an, ob sich die Aggregation derzeit in einer Wartungszeit befindet oder quittiert wurde. |Name der Aggregation |ein Service pro BI-Aggregation
78
+
Checkmk: State of BI Aggregation |Gibt den Status eines xref:bi#[BI-Aggregats] aus. Zeigt auch an, ob sich das Aggregat derzeit in einer Wartungszeit befindet oder quittiert wurde. |Name des Aggregats |ein Service pro BI-Aggregat
77
79
|bi_aggregation_connection / +
78
-
Checkmk: Status Information for BI Aggregation Connection |Status-Informationen zum Spezialagenten agent_bi. Beinhaltet Verbindungsfehler, fehlende Instanz-Daten und fehlende Aggregationen aufgrund fehlender Daten. | n/a |ein Service pro Verbindung
80
+
Checkmk: Status Information for BI Aggregation Connection |Status-Informationen zum Spezialagenten agent_bi. Beinhaltet Verbindungsfehler, fehlende Instanz-Daten und fehlende Aggregate aufgrund fehlender Daten. | n/a |ein Service pro Verbindung
79
81
|check-mk / +
80
82
Checkmk: Retrieval of Information |Ruft Statusinformationen aus den konfigurierten Datenquellen ab, z.B. von konfigurierten Agenten, Spezialagenten, SNMP, Piggyback-Daten und Management-Boards. Der von den Ergebnissen abhängige Gesamtstatus des Services kann mit dem Regelsatz [.guihint]#Status of the {CMK} services# konfiguriert werden. Aktualisiert auch alle passiven Services und eventuelle Piggyback-Daten des Hosts. |n/a |n/a
81
83
|check-mk-inventory / +
82
84
Checkmk: Discovery Procedure |Wird auf neuen Instanzen automatisch erstellt. Geht automatisch auf {WARN}, sobald sich ein Service der Host-Merkmale ändert. Eine Konfiguration ist über den Regelsatz [.guihint]#Periodic service discovery# möglich. Hier kann auch ein automatisches Update der {CMK}-Konfiguration mit den gefundenen Services aktiviert werden. |n/a |ein Service für jeden Host, der diesen Check unterstützt
83
85
|checkmk_agent / +
84
-
Checkmk Agent: Deployment properties |Stellt die ordnungsgemäße Funktion des {CMK}-Agent-Bereitstellungsmechanismus (falls verwendet) sicher. Überprüft den Zeitpunkt der letzten erfolgreichen Verbindung zum Bereitstellungsserver und das Vorliegen von Fehlermeldungen, zeigt die Anzahl der bereitgestellten Agent-Plugins und lokalen Checks. Weitere Einstellungen sind möglich, siehe link:https://checkmk.com/integrations/checkmk_agent[Plugin-Beschreibung] |n/a |ein Service
86
+
Checkmk Agent: Deployment properties |Stellt die ordnungsgemäße Funktion des {CMK}-Agent-Bereitstellungsmechanismus (falls verwendet) sicher. Überprüft den Zeitpunkt der letzten erfolgreichen Verbindung zum Bereitstellungsserver und das Vorliegen von Fehlermeldungen, zeigt die Anzahl der bereitgestellten Agentenplugins und lokalen Checks. Weitere Einstellungen sind möglich, siehe die link:https://checkmk.com/integrations/checkmk_agent[Plugin-Beschreibung^] |n/a |ein Service
85
87
|cmk_site_statistics / +
86
88
Number of hosts and services per state of Checkmk sites | Überwacht die Anzahl der Hosts und Services von {CMK}-Standorten, meldet die Gesamtzahl der Hosts, die Anzahl der Hosts, die nicht {UP} sind, sowie die Anzahl der Hosts, die {UP}, {DOWN}, in Wartungszeit und {UNREACH} sind. Meldet die Gesamtzahl der Services, die Anzahl der Services, die nicht {OK} sind, sowie die Anzahl der Services, die {OK} sind, sich in Wartungszeit befinden, auf ausgefallenen Hosts laufen, {WARN}, {UNKNOWN} und {CRIT} sind. Der Check ist immer {OK} und nicht vom Benutzer konfigurierbar. |Name der {CMK}-Instanz |ein Service pro laufender {CMK}-Instanz auf einem {CMK}-Server
87
89
|livestatus_status / +
88
-
Checkmk: Performance and Settings |Erhält über xref:livestatus#[Livestatus] verschiedene Performance-Daten eines OMD Monitoring-Kerns. Gibt damit Auskunft über die Leistung des Kerns, die Anzahl der pro Sekunde ausgeführten Checks usw. Stellt fest, ob bestimmte Einstellungen deaktiviert wurden (z. B. Benachrichtigungen). Zustände können über Check-Parameter konfiguriert werden. |Name der OMD-Instanz |ein Service pro laufender OMD-Instanz.
90
+
Checkmk: Performance and Settings |Erhält über xref:glossar#livestatus[Livestatus] verschiedene Performance-Daten eines OMD Monitoring-Kerns. Gibt damit Auskunft über die Leistung des Kerns, die Anzahl der pro Sekunde ausgeführten Checks usw. Stellt fest, ob bestimmte Einstellungen deaktiviert wurden (z. B. Benachrichtigungen). Zustände können über Check-Parameter konfiguriert werden. |Name der OMD-Instanz |ein Service pro laufender OMD-Instanz.
89
91
|mkbackup / +
90
92
Checkmk Appliance: Backup Job State |Prüft den Status von Backup-Aufträgen auf einer {CMK} Appliance. Meldet {CRIT}, wenn der Auftrag fehlschlägt oder seine nächste Ausführung überfällig ist. |ID des Auftrags |ein Service pro Backup-Auftrag
91
93
|mkbackup_site / +
92
94
Checkmk Site: Backup Job State |Prüft den Status der xref:backup#[Backup]-Aufträge einer {CMK}-Instanz. Meldet {CRIT}, wenn der Auftrag fehlschlägt oder seine nächste Ausführung überfällig ist. |ID der Instanz, gefolgt von `{{backup}}`` und der ID des Auftrags |ein Service pro Instanz und Backup-Auftrag
93
95
|mkeventd_status / +
94
-
Checkmk Event Console: Status and Performance |Erhält diverse Performancewerte einer Instanz vom Typ xref:ec#[{CMK} Event Console]. Warnung bei aktiven Ereignislimits, Aufzeichnung von Performance-Metriken bzgl. der Event Console. Der Check ist nicht vom Benutzer konfigurierbar. |Name der {CMK}-Instanz |ein Service pro laufender {CMK}-Instanz
96
+
Checkmk Event Console: Status and Performance |Erhält diverse Performancewerte einer Instanz vom Typ {CMK}xref:glossar#ec[Event Console]. Warnung bei aktiven Ereignislimits, Aufzeichnung von Performance-Metriken bzgl. der Event Console. Der Check ist nicht vom Benutzer konfigurierbar. |Name der {CMK}-Instanz |ein Service pro laufender {CMK}-Instanz
95
97
|mknotifyd_connection_v2 / +
96
-
Checkmk Notification Spooler: Connection |Prüft den Status einzelner TCP-Verbindungen vom {CMK} Notification Spooler zu einem Remote-Spooler. Für jede ein- und ausgehende TCP-Verbindung wird ein Service erstellt. Der Status geht auf {CRIT}, wenn die Verbindung nicht aufgebaut ist. |Name der Instanz, gefolgt vom Namen der verbundenen Remote-Instanz, getrennt durch einen Strich. Gibt es mehr als eine eingehende Verbindung vom gleichen Remote-Host, wird ein Index angehängt. Der Check ist nicht vom Benutzer konfigurierbar. |ein Service pro Instanz und Verbindung
98
+
Checkmk Notification Spooler: Connection |Prüft den Status einzelner TCP-Verbindungen vom {CMK}-Benachrichtigungs-Spooler zu einem Remote-Spooler. Für jede ein- und ausgehende TCP-Verbindung wird ein Service erstellt. Der Status geht auf {CRIT}, wenn die Verbindung nicht aufgebaut ist. |Name der Instanz, gefolgt vom Namen der verbundenen Remote-Instanz, getrennt durch einen Strich. Gibt es mehr als eine eingehende Verbindung vom gleichen Remote-Host, wird ein Index angehängt. Der Check ist nicht vom Benutzer konfigurierbar. |ein Service pro Instanz und Verbindung
97
99
|mknotifyd / +
98
-
Checkmk Notification Spooler: Status |Prüft den Status des xref:notifications#[{CMK} Notification Spooler]. {WARN}, wenn zurückgestellte Spool-Dateien zu lange liegen bleiben oder beschädigte Spool-Dateien gefunden werden. {CRIT}, wenn Spooler nicht läuft. Der Check ist nicht vom Benutzer konfigurierbar. |Name der Instanz | ein Service pro Instanz
100
+
Checkmk Notification Spooler: Status |Prüft den Status des {CMK}-xref:notifications#async[Benachrichtigungs-Spooler]. {WARN}, wenn zurückgestellte Spool-Dateien zu lange liegen bleiben oder beschädigte Spool-Dateien gefunden werden. {CRIT}, wenn Spooler nicht läuft. Der Check ist nicht vom Benutzer konfigurierbar. |Name der Instanz | ein Service pro Instanz
99
101
|omd_apache / +
100
-
Checkmk Sites: Apache Access Statistics |Erstellt Statistiken über die Anfragen, die vom xref:rest_api#[Apache Webserver] auf OMD-Instanzen bearbeitet werden. Er zeichnet die Anzahl der Anfragen, die gesendeten Bytes und die für die Bearbeitung der Anfragen benötigte Zeit auf. Es wird gruppiert nach Art der Anfrage, z. B. {CMK}-Tabellenansichten, NagVis-AJAX-Aufrufe, aber auch nach Typ, z. B. für Bilder, Stylesheets usw. Der Check verwendet eine bestimmte Logdatei, die sich unter `var/log/apache/stats` befinden muss, um die Zugriffsstatistiken zu erfassen. Diese Datei wird bei jeder Überprüfung gekürzt. Der Check ist immer {OK} und nicht vom Benutzer konfigurierbar. |Name der Instanz |ein Service pro Instanz
102
+
Checkmk Sites: Apache Access Statistics |Erstellt Statistiken über die Anfragen, die vom Apache Webserver auf OMD-Instanzen bearbeitet werden. Er zeichnet die Anzahl der Anfragen, die gesendeten Bytes und die für die Bearbeitung der Anfragen benötigte Zeit auf. Es wird gruppiert nach Art der Anfrage, z. B. {CMK}-Tabellenansichten, NagVis-AJAX-Aufrufe, aber auch nach Typ, z. B. für Bilder, Stylesheets usw. Der Check verwendet eine bestimmte Logdatei, die sich unter `~/var/log/apache/stats` befinden muss, um die Zugriffsstatistiken zu erfassen. Diese Datei wird bei jeder Überprüfung gekürzt. Der Check ist immer {OK} und nicht vom Benutzer konfigurierbar. |Name der Instanz |ein Service pro Instanz
101
103
|omd_broker_queues / +
102
104
Checkmk: Site Broker Queues |Überwacht die Anzahl der Benachrichtigungen in Broker-Warteschlangen jeder Instanz-Applikation. Service-Name enthält die Instanz und den Applikationsnamen. Der Check ist immer {OK}. |Instanz und Applikationsname |ein Service pro Instanz-Applikation
103
105
|omd_broker_status / +
104
106
Checkmk: Site Broker Status |Überwacht den allgemeinen Status des Message Brokers auf jeder Instanz. Zeigt den vom Broker belegten Speicher, die Zahl der Warteschlangen und die Zahl der Shovels im Status _running_. Der Check ist immer {OK}. |Name der Instanz |ein Service pro Instanz, auf der ein Broker installiert ist und läuft
105
107
|omd_diskusage / +
106
-
Checkmk: Site disk usage |Überwacht die Festplattenauslastung einer Instanz, um bei Bedarf die Suche nach Anomalien zu erleichtern. Eine Liste der aktuell überwachten Verzeichnisse finden Sie in der link:https://checkmk.com/integrations/omd_diskusage[Plugin-Beschreibung.] Der Check ist immer {OK} und nicht vom Benutzer konfigurierbar. |Name der Instanz |ein Service pro Instanz
108
+
Checkmk: Site disk usage |Überwacht die Festplattenauslastung einer Instanz, um bei Bedarf die Suche nach Anomalien zu erleichtern. Eine Liste der aktuell überwachten Verzeichnisse finden Sie in der link:https://checkmk.com/integrations/omd_diskusage[Plugin-Beschreibung^]. Der Check ist immer {OK} und nicht vom Benutzer konfigurierbar. |Name der Instanz |ein Service pro Instanz
107
109
|omd_status / +
108
110
Checkmk: Site Status |Prüft den Status der OMD-Instanzen, die auf dem System gefunden wurden, mithilfe von `omd status --bare --auto`. Wenn alle Services laufen, ist die Instanz {OK}, andernfalls {CRIT}. Wenn die Instanz nur teilweise läuft, enthält die Check-Ausgabe die Namen der gestoppten Services. In geclusterten Umgebungen listet der Check alle Knoten, auf denen Instanzen laufen, sowie deren Status auf. Der Gesamtstatus des Services ist {CRIT}, wenn eine Instanz auf einem Knoten nur partiell läuft oder alle Instanzen auf allen Knoten gestoppt sind. Der Check ist nicht vom Benutzer konfigurierbar. | Name der Instanz |ein Service je Instanz, auf der die Option [.guihint]#Autostart# auf `ON` gesetzt ist, unabhängig vom aktuellen Instanz-Status
109
111
|site_object_counts / +
110
-
Checkmk: Site Objects |Sammelt Informationen über die Anzahl unterschiedlicher Host-Typen oder genutzter Check-Kommandos auf den {CMK}-Instanzen. Einstellung und Funktionalität des Checks sind umfangreich, weitere Informationen hierzu finden Sie in der link:https://checkmk.com/integrations/site_object_counts[Plugin-Beschreibung.] Der Check ist immer im Status {OK}. |n/a |ein Service
112
+
Checkmk: Site Objects |Sammelt Informationen über die Anzahl unterschiedlicher Host-Typen oder genutzter Check-Kommandos auf den {CMK}-Instanzen. Einstellung und Funktionalität des Checks sind umfangreich, weitere Informationen hierzu finden Sie in der link:https://checkmk.com/integrations/site_object_counts[Plugin-Beschreibung^]. Der Check ist immer im Status {OK}. |n/a |ein Service
0 commit comments