# 📊 Micrometer 메트릭 이름 정리표

## ✅ HTTP 요청 관련

| 메트릭 이름 | 설명 |
|-------------|------|
| `http_server_requests_seconds_count` | HTTP 요청 횟수 (Timer의 count) |
| `http_server_requests_seconds_sum` | 누적 응답 시간 (총합) |
| `http_server_requests_seconds_max` | 최대 응답 시간 |

---

## ✅ JVM 메모리

| 메트릭 이름 | 설명 |
|-------------|------|
| `jvm_memory_used_bytes` | 사용 중인 메모리 (heap, non-heap) |
| `jvm_memory_max_bytes` | 최대 메모리 용량 |
| `jvm_buffer_memory_used_bytes` | Direct/Mapped 버퍼 사용량 |

---

## ✅ JVM 스레드

| 메트릭 이름 | 설명 |
|-------------|------|
| `jvm_threads_live` | 현재 살아있는 스레드 수 |
| `jvm_threads_peak` | 최대 스레드 수 |
| `jvm_threads_daemon` | 데몬 스레드 수 |

---

## ✅ GC (Garbage Collection)

| 메트릭 이름 | 설명 |
|-------------|------|
| `jvm_gc_memory_allocated_bytes_total` | 할당된 메모리 총량 |
| `jvm_gc_memory_promoted_bytes_total` | 프로모션된 메모리 총량 |
| `jvm_gc_pause_seconds_count` | GC 일시정지 횟수 |

---

## ✅ 프로세스 상태

| 메트릭 이름 | 설명 |
|-------------|------|
| `process_uptime_seconds` | 애플리케이션 실행 시간 |
| `process_start_time_seconds` | 애플리케이션 시작 시점 |
| `process_cpu_usage` | CPU 사용률 |

---

## ✅ HikariCP (DB 커넥션 풀)

| 메트릭 이름 | 설명 |
|-------------|------|
| `hikaricp_connections` | 총 커넥션 수 |
| `hikaricp_connections_active` | 활성 커넥션 수 |
| `hikaricp_connections_idle` | 유휴 커넥션 수 |
| `hikaricp_connections_pending` | 대기 중 커넥션 수 |
| `hikaricp_connections_max` | 최대 커넥션 수 |
| `hikaricp_connections_min` | 최소 커넥션 수 |

---

## ✅ Executor (스레드 풀)

| 메트릭 이름 | 설명 |
|-------------|------|
| `executor_active_threads` | 현재 실행 중인 스레드 수 |
| `executor_completed_tasks_total` | 완료된 작업 수 |
| `executor_pool_size_threads` | 풀 내 전체 스레드 수 |
| `executor_queue_remaining_tasks` | 큐 남은 공간 |

---

## ✅ 캐시 메트릭

| 메트릭 이름 | 설명 |
|-------------|------|
| `cache_gets_total` | 캐시 접근 횟수 |
| `cache_hits_total` | 캐시 히트 수 |
| `cache_misses_total` | 캐시 미스 수 |

---

## ✅ 로그(Logback)

| 메트릭 이름 | 설명 |
|-------------|------|
| `logback_events_total` | 로그 발생 수 (INFO, WARN, ERROR 등) |


### 사용예시

# 📌 `http_server_requests_seconds_count`  사용예시

## 🔍 개요

`http_server_requests_seconds_count`는 **Micrometer의 Timer 메트릭**에서 파생된 항목으로,

> Spring Boot 애플리케이션에서 발생한 **HTTP 요청의 횟수**를 누적해서 기록하는 메트릭입니다.

---

## ✅ 메트릭 이름 구조

| 구성 요소 | 의미 |
|-----------|------|
| `http_server_requests` | HTTP 요청 처리 관련 메트릭 그룹 |
| `seconds` | 시간 단위 (Timer 기반임을 나타냄) |
| `count` | 요청이 몇 번 발생했는지 (횟수, 누적) |

---

## 📦 포함된 라벨(Label)

| 라벨 | 설명 |
|------|------|
| `method` | HTTP 메서드 (`GET`, `POST` 등) |
| `status` | 응답 상태 코드 (`200`, `404`, `500` 등) |
| `uri` | 요청 URI (`/api/users`, `/error` 등) |
| `exception` | 예외 이름 (`None`, `IllegalArgumentException` 등) |
| `outcome` | 응답 결과 (`SUCCESS`, `CLIENT_ERROR`, `SERVER_ERROR`) |

---

## 📈 PromQL 예제

```promql
1. 전체 HTTP 요청 횟수 (초당)
rate(http_server_requests_seconds_count[1m])

2. 상태코드별 요청 비율
sum(rate(http_server_requests_seconds_count[1m])) by (status)

3. 특정 URI의 요청 추적
rate(http_server_requests_seconds_count{uri="/api/users"}[5m])


## 🎯 요약

| 항목 | 설명 |
|------|------|
| 메트릭 이름 | `http_server_requests_seconds_count` |
| 측정 대상 | HTTP 요청의 **총 횟수** |
| 메트릭 타입 | `Counter` (증가만 하는 누적 값) |
| 사용 목적 | 요청 빈도 측정 및 상태 코드, URI, 예외 별 분석 |
| 연관 메트릭 | `http_server_requests_seconds_sum` (총 응답 시간), `http_server_requests_seconds_max` (최대 응답 시간) |


================================================================

# 📊 PromQL 핵심 문법 정리표

## ✅ 기본 문법

| 구분 | 예시 | 설명 |
|------|------|------|
| 메트릭 이름 | `http_requests_total` | 메트릭 전체 조회 |
| 조건 필터 | `http_requests_total{method="GET", status="500"}` | 특정 라벨 조건으로 필터링 |
| 비교 연산자 | `up == 0` | 인스턴스가 꺼졌는지 확인 |

---

## 📈 함수(Function)

| 함수 | 예시 | 설명 |
|------|------|------|
| `rate()` | `rate(http_requests_total[1m])` | 1분간 증가율 (Counter용) |
| `irate()` | `irate(http_requests_total[1m])` | 가장 최근 두 샘플 기준 증가율 |
| `increase()` | `increase(http_requests_total[5m])` | 기간 내 총 증가량 |
| `avg()` | `avg(rate(http_requests_total[1m]))` | 평균 |
| `sum()` | `sum(rate(http_requests_total[1m]))` | 합계 |
| `min()` / `max()` | `min(...)` / `max(...)` | 최소값 / 최대값 |
| `count()` | `count(up)` | 시계열 개수 |
| `count_values()` | `count_values("status", http_requests_total)` | 값별 시계열 개수 |
| `topk()` / `bottomk()` | `topk(5, rate(...))` | 상위/하위 N개 |
| `histogram_quantile()` | `histogram_quantile(0.95, sum(...))` | 히스토그램 기반 분포 계산 |

---

## 🔄 Grouping (by / without)

| 구문 | 예시 | 설명 |
|------|------|------|
| `by()` | `sum(rate(http_requests_total[1m])) by (job)` | `job` 기준 그룹화 |
| `without()` | `sum(rate(...) without(instance))` | 특정 라벨 제외하고 그룹화 |

---

## ⏱ 시간 조작

| 구문 | 예시 | 설명 |
|------|------|------|
| 범위 선택 | `[1m]`, `[5m]` | 최근 X분 동안의 데이터 범위 |
| `offset` | `rate(http_requests_total[1m] offset 1h)` | 1시간 전 기준 데이터 조회 |

---

## 🛠 실전 예제

### 🌐 HTTP 요청 속도
```promql
rate(http_server_requests_seconds_count[1m])


```yaml

🧠 JVM 힙 메모리 사용량
jvm_memory_used_bytes{area="heap"}

🔧 HikariCP 커넥션 수
hikaricp_connections_active

🔥 응답시간 상위 5개
topk(5, rate(http_server_requests_seconds_sum[1m]) / rate(http_server_requests_seconds_count[1m]))

🧠 CPU 사용률 (Node Exporter 기준)
100 - (avg by(instance) (rate(node_cpu_seconds_total{mode="idle"}[5m])) * 100)

🛑 Alert 조건 예시
인스턴스 다운 여부 확인
up == 0

요청 실패율이 높은 경우
(rate(http_requests_total{status=~"5.."}[5m]) / rate(http_requests_total[5m])) > 0.1
5xx 오류율이 10% 초과 시 경고

- 참고: UTC 시간대 기준(현재시간 9시간 전) 을 따른다