# Gated Recurrent Unit (GRU)

LSTM을 단순화한 구조로, 업데이트 게이트와 리셋 게이트만을 사용하여 효율적으로 시퀀스를 처리하는 순환 신경망

## 모델 구조
- 입력(x), 은닉 상태(h), 두 개의 게이트(z, r)

### 순전파 수식
```
# 게이트 계산
z_t = σ(W_z·[h_{t-1}, x_t] + b_z)    # 업데이트 게이트
r_t = σ(W_r·[h_{t-1}, x_t] + b_r)    # 리셋 게이트

# 상태 업데이트
h̃_t = tanh(W·[r_t * h_{t-1}, x_t] + b)  # 후보 은닉 상태
h_t = (1 - z_t) * h_{t-1} + z_t * h̃_t    # 최종 은닉 상태
```

### 게이트 메커니즘
- **업데이트 게이트 (z)**:
  - 이전 상태와 새로운 상태의 조합 비율 결정
  - LSTM의 망각/입력 게이트 역할 통합

- **리셋 게이트 (r)**:
  - 이전 상태를 얼마나 무시할지 결정
  - 새로운 입력과 이전 상태의 관련성 조절

### 특징
- LSTM 대비 단순한 구조
  - 셀 상태(C) 제거
  - 출력 게이트 제거
  - 더 적은 파라미터

## 장점
- LSTM과 유사한 성능
- 더 빠른 학습과 실행 속도
- 더 적은 메모리 사용
- 짧은 시퀀스에서 효과적

## 한계점
- LSTM 대비 복잡한 장기 의존성 학습이 다소 어려움
- 매우 긴 시퀀스에서는 LSTM이 더 유리할 수 있음
- 메모리 제어가 LSTM보다 덜 섬세함