# 🎯 From Math to ML: 핵심 계산 실습

## 목차
1. [벡터와 내적 계산](#실습-1-벡터와-내적-계산)
2. [행렬 연산과 변환](#실습-2-행렬-연산과-변환)
3. [고유값과 고유벡터](#실습-3-고유값과-고유벡터)
4. [확률분포와 샘플링](#실습-4-확률분포와-샘플링)
5. [기댓값, 분산, 공분산 계산](#실습-5-기댓값-분산-공분산-계산)
6. [최소제곱법 직접 구현](#실습-6-최소제곱법-직접-구현)
7. [정규방정식 솔루션](#실습-7-정규방정식-솔루션)
8. [단순 선형회귀 전체 구현](#실습-8-단순-선형회귀-전체-구현)
9. [다중 선형회귀와 특성 공학](#실습-9-다중-선형회귀와-특성-공학)
10. [모델 평가와 진단](#실습-10-모델-평가와-진단)

## 필수 라이브러리 설치 및 임포트

In [None]:
# 필수 라이브러리 임포트
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.linear_model import LinearRegression
from sklearn.model_selection import train_test_split, cross_val_score
from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error
from sklearn.preprocessing import StandardScaler
import warnings
warnings.filterwarnings('ignore')

# 시각화 설정
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12
sns.set_style('whitegrid')

print("✅ 모든 라이브러리가 성공적으로 로드되었습니다!")

---
## 실습 1: 벡터와 내적 계산

### 🎯 학습 목표
- 벡터 연산의 기초 이해
- 내적의 기하학적 의미 파악
- 코사인 유사도 계산 방법 학습

### 📖 핵심 개념
내적(Inner Product): $\langle x, y \rangle = x_1y_1 + x_2y_2 + ... + x_ny_n = ||x||||y||\cos(\theta)$

In [None]:
# 1.1 벡터 생성 및 기본 연산
def vector_operations():
    """벡터 기본 연산 실습"""
    # 벡터 생성
    v1 = np.array([3, 4])
    v2 = np.array([1, 2])
    
    # 벡터 연산
    addition = v1 + v2
    scalar_mult = 2 * v1
    
    # 직접 내적 계산
    dot_manual = sum(v1[i] * v2[i] for i in range(len(v1)))
    
    # NumPy 내적
    dot_numpy = np.dot(v1, v2)
    
    print("벡터 v1:", v1)
    print("벡터 v2:", v2)
    print("\n--- 연산 결과 ---")
    print(f"덧셈: {addition}")
    print(f"스칼라 곱: {scalar_mult}")
    print(f"내적 (직접 계산): {dot_manual}")
    print(f"내적 (NumPy): {dot_numpy}")
    print(f"두 방법 일치: {dot_manual == dot_numpy}")
    
    return v1, v2

v1, v2 = vector_operations()

---
## 실습 2: 행렬 연산과 변환

### 🎯 학습 목표
- 행렬 곱셈의 이해와 구현
- 선형 변환의 시각화
- 역행렬과 행렬식의 의미 파악

In [None]:
# 2.1 행렬 곱셈 직접 구현
def matrix_multiplication_comparison():
    """행렬 곱셈을 직접 구현하고 NumPy와 비교"""
    
    # 행렬 생성
    A = np.array([[1, 2], [3, 4]])
    B = np.array([[5, 6], [7, 8]])
    
    # 직접 구현
    def manual_matmul(A, B):
        rows_A, cols_A = A.shape
        rows_B, cols_B = B.shape
        
        if cols_A != rows_B:
            raise ValueError("행렬 크기가 맞지 않습니다")
        
        C = np.zeros((rows_A, cols_B))
        
        for i in range(rows_A):
            for j in range(cols_B):
                for k in range(cols_A):
                    C[i][j] += A[i][k] * B[k][j]
        
        return C
    
    # 계산
    C_manual = manual_matmul(A, B)
    C_numpy = A @ B  # NumPy 행렬 곱셈
    
    print("행렬 A:")
    print(A)
    print("\n행렬 B:")
    print(B)
    print("\n직접 구현한 A×B:")
    print(C_manual)
    print("\nNumPy A×B:")
    print(C_numpy)
    print(f"\n결과 일치: {np.allclose(C_manual, C_numpy)}")
    
    return A

matrix_A = matrix_multiplication_comparison()

---
## 실습 7: 정규방정식 솔루션 (핵심!)

### 🎯 학습 목표
- 정규방정식 (X^T X)^(-1) X^T y 직접 계산
- NumPy로 효율적 구현
- Scikit-learn과 결과 비교

In [None]:
# 7.1 정규방정식 유도 및 구현
def normal_equation_implementation():
    """정규방정식을 단계별로 구현"""
    
    # 데이터 생성
    np.random.seed(42)
    n_samples = 100
    X = np.random.randn(n_samples, 1) * 3
    y = 2 + 3 * X + np.random.randn(n_samples, 1) * 0.5
    
    # Design matrix 생성 (절편 항 추가)
    X_with_intercept = np.c_[np.ones((n_samples, 1)), X]
    
    print("정규방정식: β = (X^T X)^(-1) X^T y")
    print("=" * 50)
    
    # 단계별 계산
    print("\n1단계: X^T 계산")
    X_transpose = X_with_intercept.T
    print(f"   X shape: {X_with_intercept.shape}")
    print(f"   X^T shape: {X_transpose.shape}")
    
    print("\n2단계: X^T X 계산")
    XtX = X_transpose @ X_with_intercept
    print(f"   X^T X shape: {XtX.shape}")
    print(f"   X^T X:\n{XtX}")
    
    print("\n3단계: (X^T X)^(-1) 계산")
    XtX_inv = np.linalg.inv(XtX)
    print(f"   (X^T X)^(-1):\n{XtX_inv}")
    
    print("\n4단계: X^T y 계산")
    Xty = X_transpose @ y
    print(f"   X^T y shape: {Xty.shape}")
    
    print("\n5단계: β = (X^T X)^(-1) X^T y")
    beta = XtX_inv @ Xty
    print(f"   β:\n{beta}")
    
    print("\n" + "=" * 50)
    print(f"최종 결과: β₀ = {beta[0, 0]:.4f}, β₁ = {beta[1, 0]:.4f}")
    
    return X, y, beta

X_data, y_data, beta_normal = normal_equation_implementation()

In [None]:
# 7.2 다양한 방법으로 계산 비교
def compare_regression_methods():
    """정규방정식, NumPy, Scikit-learn 비교"""
    
    print("선형회귀 계산 방법 비교")
    print("=" * 60)
    
    # 방법 1: 정규방정식 직접 구현
    X_with_intercept = np.c_[np.ones((len(X_data), 1)), X_data]
    beta_manual = np.linalg.inv(X_with_intercept.T @ X_with_intercept) @ X_with_intercept.T @ y_data
    print(f"\n방법 1 - 정규방정식 직접 구현:")
    print(f"  β₀ = {beta_manual[0, 0]:.6f}")
    print(f"  β₁ = {beta_manual[1, 0]:.6f}")
    
    # 방법 2: NumPy의 최소제곱법 (lstsq)
    beta_numpy, residuals, rank, s = np.linalg.lstsq(X_with_intercept, y_data, rcond=None)
    print(f"\n방법 2 - NumPy lstsq:")
    print(f"  β₀ = {beta_numpy[0]:.6f}")
    print(f"  β₁ = {beta_numpy[1]:.6f}")
    
    # 방법 3: Scikit-learn
    from sklearn.linear_model import LinearRegression
    reg = LinearRegression()
    reg.fit(X_data, y_data)
    print(f"\n방법 3 - Scikit-learn:")
    print(f"  β₀ = {reg.intercept_[0]:.6f}")
    print(f"  β₁ = {reg.coef_[0, 0]:.6f}")
    
    # 결과 비교
    print("\n" + "=" * 60)
    print("결과 비교:")
    print(f"  방법 1과 2의 차이: β₀={abs(beta_manual[0, 0] - beta_numpy[0]):.10f}, "
          f"β₁={abs(beta_manual[1, 0] - beta_numpy[1]):.10f}")
    print(f"  방법 1과 3의 차이: β₀={abs(beta_manual[0, 0] - reg.intercept_[0]):.10f}, "
          f"β₁={abs(beta_manual[1, 0] - reg.coef_[0, 0]):.10f}")
    
    print("\n✅ 모든 방법이 동일한 결과를 산출합니다!")
    
    return beta_manual, beta_numpy, reg

beta1, beta2, sklearn_model = compare_regression_methods()

---
## 🎯 실습 완료!

### 학습한 내용 정리:

1. **벡터와 행렬 연산**: 내적, 행렬곱 등 기본 연산
2. **정규방정식**: 해석적 해 구하기 - **(X^T X)^(-1) X^T y**
3. **구현 vs 라이브러리**: 직접 구현과 Scikit-learn 비교

### 핵심 통찰:
- 수학적 개념이 어떻게 머신러닝으로 연결되는지 이해
- 정규방정식은 모든 선형회귀의 기초
- NumPy와 Scikit-learn 모두 내부적으로 같은 수학을 사용

### 다음 단계:
- 경사하강법 구현
- 정규화 기법 (Ridge, Lasso)
- 다중 선형회귀로 확장