{% hint style="info" %}
naming convention :
cluster resources - dev-node-compute-resources
project ( namespace resources ) - dev-projectName-compute-resources
{% endhint %}
New contact point 클릭
contact point type -> slack 선택
- contact point type -> slack 선택
- name
- slack channel 이름
- webhook URL
- contact point 추가에 필요한 사전 작업 가이드 에서 생성한 webhook URL 입력
- Test 버튼 클릭 후 해당 채널에 알림 왔는 지 테스트
- Optional Slack settings
- Mention Channel
- Every channel member
- 채널 알림 메시지에
@channel
멘션 추가 됨
- 채널 알림 메시지에
- Every channel member
- Disable resolved message
- alert rule 조건이 firing → normal status가 되었을 때 resolved 되었다는 메시지가 오지 않음
- Mention Channel
- Save contact point 버튼 누르고 생성
Notification policies → New mute timing 클릭
- Time range 제외한 값들은 사진과 값을 모두 같게하고
- Time range 값에 원하는 시간대를 UTC 기준으로 넣은 후 생성
Notification policies → New policy 클릭
-
+ Add matcher
클릭종류 Label Value cluster resource cluster dev project resource project project name -
Contact point
- 2. contact point 생성 한 것 선택 ( 선택한 슬랙 채널로 alert-rule 발동 시 알림 전송 )
-
Overide general timings
- Group wait
- 30s
- Group interval
- 1m
- Repeat interval
- 1m
- Group wait
-
Mute timing
- 3. [optional] 시간대 별 알림이 필요한 경우 여기서 생성한 것을 적용하고 싶다면, 선택
Alerting → New alert rule 선택
- cluster resource 또는 project resource 모니터할 건 지 고르기
- Query 작성
- project resource query
query | cpu | memory | disk |
---|---|---|---|
A-query | sum(rate(container_cpu_usage_seconds_total{namespace="your-namespace”}[5m])) by (namespace) | sum(avg_over_time(container_memory_working_set_bytes{namespace="your-namespace"}[10m])) / (1024^3) | 필요없음 |
B-expression | WHEN → 정해야 함 |
WHEN → 정해야 함 |
- cluster resource query
query | cpu | memory | disk |
---|---|---|---|
A-query | (1 - (avg(irate({name=~"node_cpu_seconds_total|windows_cpu_time_total",mode="idle"}[5m])))) * 100 | (1 - sum({name= |
(1 - (((sum(node_filesystem_free_bytes{device! |
B-expression | WHEN → max() |
WHEN → max() |
WHEN → max() |
- Alert evaluation behaivor 작성
- e.g 1m for 2m
- 1분마다 rule 작동 + 2분간 지속 시 알림
- e.g 1m for 2m
- alert detail 설정
- Rule name
- cpu
- name : cpu-max-warning-alert-rule
- memory
- memory-max-warning-alert-rule
- disk
- disk-max-warning-alert-rule
- cpu
- Folder
- 분류하기 위해 초반에 생성한 또는 이미 존재하는 folder 선택
- Group
- cluster
- dev-node
- project인 경우
- project name
- cluster
- summary
- 각자 설명 추가
- (중요) Custom Labels
- 공통
- severity = warning
- 프로젝트 분류 위한 label 추가 ( 4. Notification policy 생성 할 때 add matcher 에 넣은 값을 같이 넣어줘야 해당 채널로 알림이 전송됨 )
- cluster resource 인 경우
- cluster = dev
- project resource 인 경우
- project = projectName
- cluster resource 인 경우
- 공통
- Save 클릭하여 생성
- Rule name