In [None]:
# ----------------------------------------------------------------------
# 정규화 회귀 (Regularized Regression) 정의 및 목적
# ----------------------------------------------------------------------

# 1. 정의:
# - 일반 선형 회귀의 손실 함수(Loss Function)에 '페널티(Penalty)' 항을 추가하여 모델을 학습시키는 기법.
# - 페널티 항은 가중치(회귀 계수, Beta)의 크기를 제한하는 역할을 함.

# 2. 목적:
# - 과적합 (Overfitting) 방지 및 모델의 일반화 성능 향상.
# - 특성(Feature)이 너무 많거나 특성 간 다중 공선성(Multicollinearity)이 높을 때 모델의 안정성 확보.

# 3. 핵심 원리:
# - 정규화 목표 = min(잔차 제곱합 + 람다 * 페널티 항)
# - 람다(λ): 규제 강도를 조절하는 하이퍼파라미터. 람다가 클수록 가중치가 0에 가깝게 줄어듦.

# ----------------------------------------------------------------------
# 주요 정규화 회귀 기법
# ----------------------------------------------------------------------

# 1. Ridge 회귀 (L2 규제)
# - 페널티 항: 가중치의 제곱합 (L2 Norm).  (∑ β_j^2)
# - 특징: 모든 가중치를 0에 '가깝게' 줄이지만, 완전히 0으로 만들지는 않음.
# - 주요 효과: 다중 공선성 문제 해결 및 모델 안정성 확보.

# 2. Lasso 회귀 (L1 규제)
# - 페널티 항: 가중치의 절댓값의 합 (L1 Norm). (∑ |β_j|)
# - 특징: 불필요한 특성의 가중치를 '완전히 0'으로 만듦.
# - 주요 효과: 특성 선택 (Feature Selection) 기능 제공, 모델을 간결하게 만듦.

# 3. ElasticNet (L1 + L2 규제)
# - 페널티 항: L1 규제와 L2 규제를 혼합하여 사용.
# - 특징: Ridge와 Lasso의 장점을 결합하여 특성 선택과 모델 안정화를 동시에 추구.
# - 활용: 상관관계가 높은 특성 그룹이 있을 때, Lasso의 단점(하나만 선택)을 보완하는 데 유용.

# 가중치가 부여되는 예시 (Ridge 회귀 개념 포함)

## 예시 상황
학생들의 **공부시간(x1)**, **수면시간(x2)** 으로 **시험점수(y)** 를 예측한다고 하자.

| 학생 | 공부시간(x1) | 수면시간(x2) | 시험점수(y) |
|------|--------------|--------------|-------------|
| A | 2 | 8 | 70 |
| B | 4 | 7 | 80 |
| C | 6 | 6 | 90 |
| D | 8 | 5 | 95 |

---

## 1. 모델 형태
선형 회귀식:

```
y = w1*x1 + w2*x2 + b
```

- `w1`: 공부시간의 영향도  
- `w2`: 수면시간의 영향도  
- `b`: 기본 점수(절편)

---

## 2. 학습 전 (가중치 초기값은 랜덤)
초기에는 모델이 아무것도 모른다. 예를 들어:

```
w1 = 0.5,  w2 = 0.5,  b = 50
```

| 학생 | 예측 y | 실제 y | 오차 |
|------|---------|--------|------|
| A | 0.5×2 + 0.5×8 + 50 = 54 | 70 | -16 |
| B | 0.5×4 + 0.5×7 + 50 = 55.5 | 80 | -24.5 |
| C | 0.5×6 + 0.5×6 + 50 = 56 | 90 | -34 |
| D | 0.5×8 + 0.5×5 + 50 = 56.5 | 95 | -38.5 |

오차가 크다. 모델이 패턴을 아직 모름.

---

## 3. 경사하강법으로 가중치 조정
모델은 오차를 줄이기 위해 가중치를 조금씩 수정한다.

```
w_new = w_old - η * (∂Loss/∂w)
```

즉, 기울기 방향으로 조금씩 이동하면서 오차를 줄인다.

---

## 4. 학습 후 (가중치가 업데이트된 상태)
여러 번 반복하면 모델이 아래와 같이 학습한다.

```
w1 = 5.0   # 공부시간의 영향이 큼  
w2 = -2.0  # 수면시간이 많을수록 점수가 조금 줄어듦  
b = 60
```

| 학생 | 예측 y | 실제 y | 오차 |
|------|---------|--------|------|
| A | 5×2 + (-2)×8 + 60 = 66 | 70 | -4 |
| B | 5×4 + (-2)×7 + 60 = 74 | 80 | -6 |
| C | 5×6 + (-2)×6 + 60 = 78 | 90 | -12 |
| D | 5×8 + (-2)×5 + 60 = 90 | 95 | -5 |

오차가 줄었고, 모델이 패턴을 이해함.

---

## 5. Ridge 회귀(L2 규제) 적용 시
가중치가 너무 커지지 않도록 벌점을 추가한다.

```
Loss = (예측오차)^2 + α * (w1² + w2²)
```

가중치가 조금 더 안정적인 값으로 수렴함  
예: `w1=4.5`, `w2=-1.8`, `b=60`

---

## 6. 정리

| 단계 | 설명 |
|------|------|
| 초기 | 모델은 가중치를 랜덤하게 정함 |
| 학습 중 | 오차를 보고 가중치를 조금씩 조정 |
| 학습 후 | 데이터의 패턴을 반영한 가중치로 수렴 |
| Ridge 적용 시 | 큰 가중치에는 벌점 → 안정적인 값으로 유지 |

---

## 결론
가중치는 모델이 입력값의 중요도를 스스로 학습한 결과이며,  
Ridge 회귀는 그 가중치가 너무 커지지 않게 제어하는 방법이다.
