

# 📘 히든 마르코프 모델 (HMM)이란?

**HMM**은 시간적으로 순차적인 데이터를 대상으로, \*\*관측된 데이터 뒤에 숨겨진 상태(state)\*\*가 존재한다고 가정하고 이 상태 전이 과정을 추론하는 **확률 모델**입니다.

> 즉, **관측값은 보이지만, 그 관측값을 생성한 상태(state)는 보이지 않는다**는 점에서 "히든(hidden)"입니다.

---

## 🧠 기본 구성 요소

HMM은 다음 5가지 구성 요소로 정의됩니다:

| 기호                      | 설명                                                      |
| ----------------------- | ------------------------------------------------------- |
| $S = \{s_1, ..., s_N\}$ | 가능한 **숨겨진 상태 집합** (예: 상태 A, B)                          |
| $O = \{o_1, ..., o_T\}$ | 실제 관측된 **관측값 시퀀스**                                      |
| $A = [a_{ij}]$          | **상태 전이 확률 행렬**: $a_{ij} = P(s_{t+1} = j \mid s_t = i)$ |
| $B = [b_j(k)]$          | **관측 확률 분포**: 상태 $j$에서 관측값 $o_k$ 나올 확률                  |
| $\pi = [\pi_i]$         | **초기 상태 확률**: $\pi_i = P(s_1 = i)$                      |

---

## 📐 동작 개요

1. 초기 상태 $s_1$을 확률 $\pi$에 따라 선택
2. 상태 $s_1$에서 관측값 $o_1$이 확률 $b_{s_1}(o_1)$로 출력
3. $s_1$에서 $s_2$로 확률 $a_{12}$에 따라 전이
4. 상태 $s_2$에서 $o_2$ 관측
5. … 계속 반복하며 전체 시계열을 생성

---

## 🔍 예시: 음성 인식

| 시간 | 실제 단어 상태 | 관측된 특징(스펙트럼) |
| -- | -------- | ------------ |
| 1  | "he"     | MFCC 벡터 1    |
| 2  | "llo"    | MFCC 벡터 2    |

HMM은 이 관측값 시퀀스를 보고 원래의 상태 시퀀스를 추론합니다.

---

## 📊 HMM의 세 가지 핵심 문제

1. **평가 문제 (Evaluation)**

   * 관측값 시퀀스가 주어졌을 때 이 시퀀스가 해당 모델에서 생성될 확률은?
   * → **Forward Algorithm**

2. **추론 문제 (Decoding)**

   * 관측값 시퀀스를 생성한 가장 가능한 상태 시퀀스는?
   * → **Viterbi Algorithm**

3. **학습 문제 (Training)**

   * 관측 시퀀스만 주어졌을 때 모델 파라미터 $A, B, \pi$는 어떻게 추정하는가?
   * → **Baum-Welch Algorithm (EM 알고리즘 기반)**

---

## ✅ Classification에의 적용

HMM은 일반적인 "정적" 분류기가 아니라 **"시계열 패턴"을 기반으로 시퀀스 전체의 클래스를 예측**합니다.

### 💡 적용 방식:

1. **각 클래스마다 별도의 HMM 모델 학습**

   * 예: 단어 "yes" → HMM1, 단어 "no" → HMM2

2. **테스트 시퀀스를 각 모델에 넣어 가장 높은 가능도(likelihood)를 가진 클래스로 분류**

### 📦 예시 분야:

| 분야           | 설명                 |
| ------------ | ------------------ |
| **음성 인식**    | 단어, 문장 등의 연속 패턴 인식 |
| **필기 인식**    | 연속된 필기 선을 상태로 모델링  |
| **유전자 분석**   | DNA 염기서열의 상태 변화 추정 |
| **소매 패턴 분류** | 고객 행동 시퀀스 분석       |

---

## 🔁 다른 분류 모델과의 차이점

| 항목        | HMM            | 일반 분류기 (SVM, RF 등) |
| --------- | -------------- | ------------------ |
| 입력 구조     | 시계열(순차) 데이터    | 독립된 개별 샘플          |
| 시간성 반영    | ✅ (상태 전이 기반)   | ❌                  |
| 클래스 예측 방식 | 시퀀스 전체 기반      | 각 샘플 단일 예측         |
| 모델 학습 방식  | EM 기반 확률 추정    | 손실 함수 최적화          |
| 해석력       | 중간 (상태 시각화 가능) | 낮음 또는 없음           |

---

## 🧪 Python 예제 (`hmmlearn`)

```python
from hmmlearn import hmm
import numpy as np

# 예시: 연속 관측값을 가진 2상태 HMM
model = hmm.GaussianHMM(n_components=2, covariance_type='diag', n_iter=100)

# X: (n_samples, n_features)
model.fit(X)
log_prob = model.score(X)  # 관측 시퀀스의 확률 평가
states = model.predict(X)  # 상태 추정
```

---

## ✅ 장점

* 시간 순서를 고려한 예측 가능
* 비정상적이고 상태 변화가 많은 데이터에 적합
* 각 클래스의 **구조적 패턴** 모델링 가능

---

## ⚠️ 단점

* 대규모 피처에는 확장 어려움 (고차원성 저주)
* 상태 수를 사전에 정해야 함
* 학습 시간이 오래 걸릴 수 있음
* 관측 모델이 가우시안에 국한될 경우 표현력 한계

---

## 🧩 결론

**HMM은 단순한 "현재 입력 → 예측" 구조를 넘어서**,
\*\*"현재 입력은 어떤 상태에서 왔는가"\*\*를 추론함으로써 **시간적 구조와 상태 변화를 함께 고려한 분류 모델**입니다.

> ✅ 시계열 분류에 매우 강력
> ✅ 각 클래스의 동작 패턴을 모델링할 수 있음
> ✅ 음성, 필기, 생물정보학 등 순차 데이터 분야에서 전통적으로 매우 강력한 접근 방식


