In [1]:
import torch
import numpy as np
import torch.optim as optim

문제 1 (주관식 - 개념 설명)
- 경사 하강법(Gradient Descent)의 목표와 핵심 원리를 "손실(Loss)"과 "경사(Gradient)"라는 키워드를 사용하여 2~3줄로 간략히 설명하시오

경사하강법은 손실함수를 편미분하여 손실을 최소화하는 머신러닝 알고리즘이다. 경사를 계산하여 가중치(파라메터)를 계속해서 업데이트하여 최적의 경사를 찾는 기능을 핵심으로 한다.



문제 2 (실습 문제 - 코드 작성)

평균 제곱 오차(MSE: Mean Squared Error) 손실 함수를 파이토치 텐서를 사용하여 직접 구현하시오.

- 함수 mse(Yp, Y)는 예측값 텐서 Yp와 실제값 텐서 Y를 입력받아 MSE 손실 값을 계산하여 반환해야 합니다.

- MSE 공식: $\text{loss} = \frac{1}{n} \sum_{i=1}^{n} (Yp_i - Y_i)^2$


In [2]:
import torch

# 아래 함수를 완성하시오
def mse(Yp, Y):
    # Yp: 예측값 텐서, Y: 실제값 텐서
    loss = ((Yp - Y)**2).mean()
    return loss

# --- 테스트 코드 (수정 불필요) ---
Yp_test = torch.tensor([1.0, 2.5, 3.8])
Y_test  = torch.tensor([1.2, 2.0, 4.0])
# 예상 MSE = ((1.0-1.2)^2 + (2.5-2.0)^2 + (3.8-4.0)^2) / 3 = (0.04 + 0.25 + 0.04) / 3 = 0.33 / 3 = 0.11
test_loss = mse(Yp_test, Y_test)
print(f"테스트 MSE 손실: {test_loss:.4f}")

테스트 MSE 손실: 0.1100


문제 3 (실습 문제 - 코드 빈칸 채우기)

아래 코드의 빈칸 ( # TODO: ... 부분)을 채워 파라미터 W와 B를 업데이트하는 과정을 완성하시오.

요구사항

1. loss.backward()를 호출하여 경사를 계산합니다.
2. torch.no_grad() 컨텍스트 내에서 W와 B를 학습률(lr)과 계산된 경사(.grad)를 이용하여 업데이트합니다.
3. 다음 반복을 위해 W와 B의 경사 값을 0으로 초기화합니다 (.grad.zero_()).

- 참고 : first_ml.ipynb)의 경사 하강법 반복 학습 부분을 참고

In [3]:
import torch
import numpy as np # 예시 데이터 생성을 위해 사용

# 예시 데이터 (수정 불필요)
X = torch.tensor([-5.,  5.,  0.,  2., -2.]).float()
Y = torch.tensor([-6.7, 10.3, -3.3, 5.0, -5.3]).float()

# 초기 파라미터 및 학습률 (수정 불필요)
W = torch.tensor(1.0, requires_grad=True).float()
B = torch.tensor(1.0, requires_grad=True).float()
lr = 0.001

# 예측 함수 및 손실 함수 (수정 불필요)
def pred(X): return W * X + B
def mse(Yp, Y): return ((Yp - Y)**2).mean()

# --- 1회 반복 학습 과정 ---
# 예측 계산 (수정 불필요)
Yp = pred(X)

# 손실 계산 (수정 불필요)
loss = mse(Yp, Y)

# TODO: 1. 경사 계산
loss.backward()

# 경사 업데이트 (torch.no_grad() 사용)
with torch.no_grad():
    # TODO: 2. W 파라미터 업데이트
    W -= lr * W.grad
    # TODO: 3. B 파라미터 업데이트
    B -= lr * W.grad

# TODO: 4. W와 B의 경사 초기화
W.grad.zero_()
B.grad.zero_()

# --- 결과 확인 (수정 불필요) ---
print(f"업데이트 후 W: {W.item():.4f}") # 초기 W=1.0, 초기 loss=13.3520, W.grad=-19.04, lr=0.001 -> 1.0 - 0.001*(-19.04) = 1.01904
print(f"업데이트 후 B: {B.item():.4f}") # 초기 B=1.0, B.grad=2.0, lr=0.001 -> 1.0 - 0.001*(2.0) = 0.998
print(f"W의 현재 경사: {W.grad}") # 초기화 후에는 0 또는 None 이어야 함
print(f"B의 현재 경사: {B.grad}") # 초기화 후에는 0 또는 None 이어야 함

업데이트 후 W: 1.0190
업데이트 후 B: 1.0190
W의 현재 경사: 0.0
B의 현재 경사: 0.0


문제 4 (실습 문제 - 코드 빈칸 채우기)
- torch.optim 라이브러리를 사용하여 확률적 경사 하강법(SGD) 옵티마이저를 생성하고, 이를 이용해 파라미터를 업데이트하는 코드의 빈칸을 채우시오

요구사항
1. optim.SGD를 사용하여 W와 B를 업데이트하는 옵티마이저(optimizer)를 생성합니다. 학습률(lr)도 지정해야 합니다.
2. 계산된 경사를 이용하여 파라미터를 업데이트하기 위해 optimizer.step()를 호출합니다.
3. 다음 반복을 위해 옵티마이저에 연결된 파라미터들의 경사도를 0으로 초기화하기 위해 optimizer.zero_grad()를 호출합니다.

In [4]:
import torch
import torch.optim as optim
import numpy as np # 예시 데이터 생성을 위해 사용

# 예시 데이터 (수정 불필요)
X = torch.tensor([-5.,  5.,  0.,  2., -2.]).float()
Y = torch.tensor([-6.7, 10.3, -3.3, 5.0, -5.3]).float()

# 초기 파라미터 및 학습률 (수정 불필요)
W = torch.tensor(1.0, requires_grad=True).float()
B = torch.tensor(1.0, requires_grad=True).float()
lr = 0.001

# 예측 함수 및 손실 함수 (수정 불필요)
def pred(X): return W * X + B
def mse(Yp, Y): return ((Yp - Y)**2).mean()

# TODO: 1. SGD 옵티마이저 생성 (파라미터: [W, B], 학습률: lr)
optimizer = optim.SGD([W,B], lr = lr)

# --- 1회 반복 학습 과정 ---
# 예측 계산 (수정 불필요)
Yp = pred(X)

# 손실 계산 (수정 불필요)
loss = mse(Yp, Y)

# 경사 계산 (수정 불필요)
loss.backward()

# TODO: 2. 옵티마이저를 이용한 파라미터 업데이트
optimizer.step()

# TODO: 3. 옵티마이저 경사 초기화
optimizer.zero_grad()

# --- 결과 확인 (수정 불필요) ---
# 결과는 문제 3과 동일해야 함
print(f"옵티마이저 사용 후 W: {W.item():.4f}")
print(f"옵티마이저 사용 후 B: {B.item():.4f}")
print(f"W의 현재 경사: {W.grad}")
print(f"B의 현재 경사: {B.grad}")

옵티마이저 사용 후 W: 1.0190
옵티마이저 사용 후 B: 0.9980
W의 현재 경사: None
B의 현재 경사: None


문제 5(주관식-개념설명)

모델 학습 시 발생할 수 있는 과소적합(Underfitting)과 과대적합(Overfitting)의 특징을 편향(Bias)과 분산(Variance) 관점에서 각각 설명하시오. (각각 1~2줄)

과소적합은 모델이 너무 단순해서 패턴을 충분히 학습하지 못하는 오류이다. 데이터가 편향될 때 과소적합이 발생한다.
이와 반대로 과대적합은 모델이 너무 복잡해서 노이즈까지 학습하는 오류이다. 데이터가 분산될 때 과대적합이 발생한다.

문제 6 (주관식 - 평가 지표 선택)
- 다음과 같은 두 가지 상황에 가장 적합한 분류 모델 평가 지표를 각각 선택하고 그 이유를 간략히 설명하시오.

- 상황 1: 환자의 의료 데이터를 분석하여 암 진단 여부를 예측하는 모델 (실제 암 환자를 놓치면 안 되는 경우, 즉 FN(False Negative)을 최소화해야 함)

- 상황 2: 이메일 데이터를 분석하여 스팸 메일 여부를 필터링하는 모델 (정상 메일을 스팸으로 잘못 분류하면 안 되는 경우, 즉 FP(False Positive)를 최소화해야 함)

- 선택 가능한 지표: 정확도(Accuracy), 정밀도(Precision), 재현율(Recall), F1-Score

상황1에 적합한 모델은 재현율(Recall)로 Recall = TP / (TP + FN)이다. 실제로
상황2에 적합한 모델은 정밀도(Precision)로 Precision = TP / (TP + FP)이다. 정상메일을 스펨으로 분류하면 안되기 때문이다.

In [5]:
# 한 번에 설치
!pip install torch numpy matplotlib seaborn scikit-learn



In [25]:
"""
4차시 실습 통합 실행파일
모든 실습을 한 번에 실행할 수 있습니다

Part 1: 기본설정 및 모델정의
Part 2: 지도학습(분류와 회귀)
Part 3: 비지도학습과 편향-분산
Part 4: K-Fold 교차검증
Part 5: 평가지표 계산
Part 6: 전체 ML 파이프라인

필수 라이브러리:
pip install torch numpy matplotlib seaborn scikit-learn

"""

import torch
import torch.nn as nn
import torch.optim as optim
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import make_classification, make_regression, make_blobs
from sklearn.model_selection import train_test_split, KFold
from sklearn.preprocessing import StandardScaler, PolynomialFeatures
from sklearn.metrics import (accuracy_score, precision_score, recall_score, f1_score, confusion_matrix, roc_auc_score, roc_curve, mean_absolute_error, mean_squared_error, r2_score)
from sklearn.linear_model import Ridge
from sklearn.cluster import KMeans

# 시드 고정. 재현성
torch.manual_seed(42)
np.random.seed(42)

# 한글 깨짐방지
plt.rcParams["axes.unicode_minus"] = False

print("="*70)
print("4차시 실습: 인공지능 개론 - 통합실행")
print("="*70)

# =====================================================================
# Part 1: 모델 정의
# =====================================================================
print("\n[Part 1] 모델 정의 중...")

class BinaryClassifier(nn.Module):
    """이진분류용 다층 퍼셉트론"""
    """클래스(0/1) 예측 """
    def __init__(self, input_dim):
        super(BinaryClassifier, self).__init__()
        self.layer1 = nn.Linear(input_dim, 64)
        self.layer2 = nn.Linear(64, 32)
        self.layer3 = nn.Linear(32, 1)
        self.relu = nn.ReLU()
        self.dropout = nn.Dropout(0.3)
        self.sigmoid = nn.Sigmoid()

    def forward(self, x):
        x = self.relu(self.layer1(x))
        x = self.dropout(x)
        x = self.relu(self.layer2(x))
        x = self.dropout(x)
        x = self.sigmoid(self.layer3(x))
        return x


class Regressor(nn.Module):
    """회귀용 다층 퍼셉트론"""
    """회귀 MLP """
    def __init__(self, input_dim):
        super(Regressor, self).__init__()
        self.network = nn.Sequential(
            nn.Linear(input_dim, 64),
            nn.ReLU(),
            nn.Linear(64, 32),
            nn.ReLU(),
            nn.Linear(32, 1)
        )

    def forward(self, x):
        return self.network(x)

print("모델 정의 완료")

# =====================================================================
# Part 2: 지도학습
# =====================================================================
print("\n[Part 2] 지도학습 - 분류와 회귀")

# 분류 데이터 생성 및 학습
X_class, y_class = make_classification(
    n_samples=1000, n_features=20, n_informative=15, n_redundant=5, weights=[0.7, 0.3], random_state=42
)

X_train_c, X_temp_c, y_train_c, y_temp_c = train_test_split(
    X_class, y_class, test_size=0.4, random_state=42, stratify=y_class
)
X_val_c, X_test_c, y_val_c, y_test_c = train_test_split(
    X_temp_c, y_temp_c, test_size=0.5, random_state=42, stratify=y_temp_c
)

# 표준화(정규화: 평균 0, 분산 1) 스케일링
scaler_c = StandardScaler()
X_train_c_scaled = scaler_c.fit_transform(X_train_c)
X_val_c_scaled = scaler_c.transform(X_val_c)
X_test_c_scaled = scaler_c.transform(X_test_c)

# 스케일링 데이터를 텐서변환
X_train_c_t = torch.FloatTensor(X_train_c_scaled)
y_train_c_t = torch.FloatTensor(y_train_c).unsqueeze(1)
X_val_c_t = torch.FloatTensor(X_val_c_scaled)
y_val_c_t = torch.FloatTensor(y_val_c).unsqueeze(1)

model_class = BinaryClassifier(input_dim=20)
criterion = nn.BCELoss()
optimizer = optim.Adam(model_class.parameters(), lr=0.001)

print("분류 모델 학습 중...")

best_val_loss = float("inf")
patience_counter = 0
best_model_state = None

for epoch in range(100):
    model_class.train()
    optimizer.zero_grad()
    outputs = model_class(X_train_c_t)
    loss = criterion(outputs, y_train_c_t)
    loss.backward()
    optimizer.step()

    model_class.eval()
    with torch.no_grad():
        val_outputs = model_class(X_val_c_t)
        val_loss = criterion(val_outputs, y_val_c_t)

    if val_loss < best_val_loss:
        best_val_loss = val_loss
        patience_counter = 0
        best_model_state = model_class.state_dict()
    else:
        patience_counter += 1

    if patience_counter >= 10:
        break

model_class.load_state_dict(best_model_state)
print("분류모델 학습완료")

# 회귀 데이터 생성 및 학습
X_reg, y_reg = make_regression(
    n_samples=800, n_features=10, n_informative=8, noise=10.0, random_state=42
)

X_train_r, X_test_r, y_train_r, y_test_r = train_test_split(
    X_reg, y_reg, test_size=0.2, random_state=42
)

scaler_r = StandardScaler()
X_train_r_scaled = scaler_r.fit_transform(X_train_r)
X_test_r_scaled = scaler_r.transform(X_test_r)

X_train_r_t = torch.FloatTensor(X_train_r_scaled)
y_train_r_t = torch.FloatTensor(y_train_r).unsqueeze(1)

model_reg = Regressor(input_dim=10)
criterion_reg = nn.MSELoss()
optimizer_reg = optim.Adam(model_reg.parameters(), lr=0.01)

print("회귀모델 학습 중...")
for epoch in range(100):
    model_reg.train()
    optimizer_reg.zero_grad()
    outputs = model_reg(X_train_r_t)
    loss = criterion_reg(outputs, y_train_r_t)
    loss.backward()
    optimizer_reg.step()

print("회귀모델 학습완료")

# =====================================================================
# Part 3: 비지도학습과 편향-분산
# =====================================================================
print("\n[Part 3] 비지도학습과 편향-분산")

# K-Means 군집화
X_cluster, y_true_cluster = make_blobs(
    n_samples=300, centers=3, n_features=2, cluster_std=1.0, random_state=42
)

# kmeans
kmeans = KMeans(n_clusters=3, random_state=42, n_init=10)
y_pred_cluster = kmeans.fit_predict(X_cluster)

plt.figure(figsize=(15,5))

plt.subplot(1,3,1)
plt.scatter(
    X_cluster[:,0], X_cluster[:, 0], c=y_true_cluster, cmap="viridis", alpha=0.6, edgecolors="k", s=50
    )
plt.title("True Labels", fontsize=12)
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")
plt.colorbar()
plt.grid(alpha=0.3)

plt.subplot(1, 3, 2)
plt.scatter(
    X_cluster[:,0], X_cluster[:, 1], c=y_pred_cluster, cmap="plasma", alpha=0.6, edgecolors="k", s=50
    )
plt.scatter(
    kmeans.cluster_centers_[:,0], kmeans.cluster_centers_[:,0], c="red", marker="X", s=300, edgecolors="black", linewidths=2
            )
plt.title("K-Means Result", fontsize=12)
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")
plt.colorbar()
plt.grid(alpha=0.3)

plt.subplot(1, 3, 3)
cluster_counts = np.bincount(y_pred_cluster)
plt.bar(
    range(len(cluster_counts)), cluster_counts, color=["#440154", "#31688e", "#fde724"], edgecolor="black"
    )

plt.tight_layout()
plt.savefig("result_clustering.png", dpi=150, bbox_inches="tight")
plt.close()
print("저장: result_clustering.png")

# 편향-분산 트레이드오프
np.random.seed(42)
X_bias = np.sort(np.random.rand(100, 1) * 10, axis=0)
y_bias = np.sin(X_bias).ravel() + np.random.randn(100) * 0.5
X_test_bias = np.linspace(0, 10, 200).reshape(-1, 1)
y_test_bias = np.sin(X_test_bias).ravel()

degrees = [1, 3, 9, 20]
colors = ["#e74c3c", "#3498db", "#2ecc71", "#f39c12"]

plt.figure(figsize=(16, 4))

for idx, degree in enumerate(degrees):
    poly = PolynomialFeatures(degree=degree)
    X_poly = poly.fit_transform(X_bias)
    X_test_poly = poly.transform(X_test_bias)

    model_bias = Ridge(alpha=0.01)
    model_bias.fit(X_poly, y_bias)

    train_pred = model_bias.predict(X_poly)
    test_pred = model_bias.predict(X_test_poly)

    train_mse = mean_squared_error(y_bias, train_pred)
    test_mse = mean_squared_error(y_test_bias, test_pred)

    plt.subplot(1, 4, idx +1)
    plt.scatter(X_bias, y_bias, alpha=0.5, s=30, color="gray", edgecolors="black")
    plt.plot(X_test_bias, y_test_bias, "g--", linewidth=2.5)
    plt.plot(X_test_bias, test_pred, color=colors[idx], linewidth=2.5)
    plt.title(f"Degree {degree}\nTrain: {train_mse: .3f} | Test: {test_mse: .3f}")
    plt.ylim(-2.5, 2.5)
    plt.grid(alpha=0.3)

plt.tight_layout()
plt.savefig("result_bias_variance.png", dpi=150, bbox_inches="tight")
plt.close()
print("저장: result_bias_variance.png")

# =====================================================================
# Part 4: K-Fold 교차검증
# =====================================================================
print("\n[Part 4] K-Fold 교차검증")

X_kfold, y_kfold = make_classification(
    n_samples=500, n_features=20, n_informative=15, random_state=42
)

k = 5
kfold = KFold(n_splits=k, shuffle=True, random_state=42)
fold_scores = []

for fold, (train_idx, val_idx) in enumerate(kfold.split(X_kfold)):
    X_train_fold = X_kfold[train_idx]
    y_train_fold = y_kfold[train_idx]
    X_val_fold = X_kfold[val_idx]
    y_val_fold = y_kfold[val_idx]

    scaler_fold = StandardScaler()
    X_train_fold = scaler_fold.fit_transform(X_train_fold)
    X_val_fold = scaler_fold.transform(X_val_fold)

    X_train_fold_t = torch.FloatTensor(X_train_fold)
    y_train_fold_t = torch.FloatTensor(y_train_fold).unsqueeze(1)
    X_val_fold_t = torch.FloatTensor(X_val_fold)

    model_fold = BinaryClassifier(input_dim=20)
    optimizer_fold = optim.Adam(model_fold.parameters(), lr=0.01)
    criterion_fold = nn.BCELoss()

    for epoch in range(30):
        model_fold.train()
        optimizer_fold.zero_grad()
        outputs = model_fold(X_train_fold_t)
        loss = criterion_fold(outputs, y_train_fold_t)
        loss.backward()
        optimizer_fold.step()

    model_fold.eval()
    with torch.no_grad():
        val_pred_prob = model_fold(X_val_fold_t).numpy().flatten()
        val_pred = (val_pred_prob > 0.5).astype(int)

    accuracy = accuracy_score(y_val_fold, val_pred)
    fold_scores.append(accuracy)

print(f"K-Fold 평균 Accuracy: {np.mean(fold_scores): .4f} (std: {np.std(fold_scores): .4f})")


# =====================================================================
# Part 5: 평가 지표
# =====================================================================
print("\n[Part 5] 평가지표 개선")

# 분류평가
model_class.eval()
X_test_c_t = torch.FloatTensor(X_test_c_scaled)

with torch.no_grad():
    y_pred_prob_c = model_class(X_test_c_t).numpy().flatten()
    y_pred_c = (y_pred_prob_c > 0.5).astype(int)

cm = confusion_matrix(y_test_c, y_pred_c)
accuracy = accuracy_score(y_test_c, y_pred_c)
precision = precision_score(y_test_c, y_pred_c, zero_division=0)
recall = recall_score(y_test_c, y_pred_c, zero_division=0)
f1 = f1_score(y_test_c, y_pred_c, zero_division=0)
auc = roc_auc_score(y_test_c, y_pred_prob_c)

print(f"분류 성능: Acc={accuracy: .3f}, Prec={precision: .3f}, Rec={recall: .3f}, F1={f1: .3f}, AUC={auc: .3f}")

fig = plt.figure(figsize=(15,5))

plt.subplot(1, 3, 1)
sns.heatmap(cm, annot=True, fmt="d", cmap ="Blues", cbar=False,
            xticklabels=["Pred 0", "Pred 1"],
            yticklabels=["True 0", "True 1"]
            )
plt.title("Confusion Matrix")

plt.subplot(1, 3, 2)
matrices = ["Accuracy", "Precision", "Recall", "F1", "AUC"]
values = [accuracy, precision, recall, f1, auc]
plt.barh(matrices, values, color=["#3498db", "#2ecc71", "#e74c3c", "#f39c12", "#9b59b6"])
plt.xlim(0, 1.0)
plt.title("Metrics")
plt.grid(axis="y", alpha=0.3)

plt.subplot(1, 3, 3)
fpr, tpr, _ = roc_curve(y_test_c, y_pred_prob_c)
plt.plot(fpr, tpr, linewidth=3, label=f"AUC={auc: .3f}")
plt.plot([0, 1], [0, 1], "k--", linewidth=2)
plt.xlabel("FPR")
plt.ylabel("TPR")
plt.title("ROC Curve")
plt.legend()
plt.legend()
plt.grid(alpha=0.3)

plt.tight_layout()
plt.savefig("result_classification.png", dpi=150, bbox_inches="tight")
plt.close()
print("저장: result_classification.png")

# 회귀평가
model_reg.eval()
X_test_r_t = torch.FloatTensor(X_test_r_scaled)

with torch.no_grad():
    y_pred_reg = model_reg(X_test_r_t).numpy().flatten()

mae = mean_absolute_error(y_test_r, y_pred_reg)
mse = mean_squared_error(y_test_r, y_pred_reg)
rmse = np.sqrt(mse)
r2 = r2_score(y_test_r, y_pred_reg)

print(f"회귀성능: MAE={mae: .2f}, RMSE={rmse: .2f}, R2={r2: .3f}")

fig = plt.figure(figsize=(15, 5))

plt.subplot(1, 3, 1)
plt.scatter(y_test_r, y_pred_reg, alpha=0.6, s=50)
plt.plot([y_test_r.min(), y_test_r.max()],
         [y_test_r.min(), y_test_r.max()], "r--", linewidth=3)
plt.xlabel("True")
plt.ylabel("predicted")
plt.title("prediction vs True")
plt.grid(alpha=0.3)

plt.subplot(1, 3, 2)
residuals = y_test_r - y_pred_reg

plt.scatter(y_pred_reg, residuals, alpha=0.6, s=50)
plt.axhline(y=0, color="r", linestyle="--", linewidth=3)
plt.xlabel("Predicted")
plt.ylabel("Residuals")
plt.title("Residual Plot")
plt.grid(alpha=0.3)

plt.subplot(1, 3, 3)
plt.hist(residuals, bins=30, color="skyblue", edgecolor="black", alpha=0.7)
plt.axvline(x=0, color="red", linestyle="--", linewidth=3)
plt.xlabel("Residuals")
plt.ylabel("Frequency")
plt.title("Distribution")
plt.grid(axis="y", alpha=0.3)

plt.tight_layout()
plt.savefig("result_regression.png", dpi=150, bbox_inches="tight")
plt.close()
print("저장: result_regression.png")

# =====================================================================
# Part 6: ML 파이프라인
# =====================================================================
print("\n[Part 6] ML 파이프라인 실행")

class MLPipeline:
    def __init__(self):
        self.model = None
        self.scaler = None
        self.best_score = 0
        self.baseline_score = 0

    def run(self, X, y):
        print("\nSTEP 1: 문제정의")
        print("목표: 고객 이탈 예측 (F1 > 0.80)")

        print("\nSTEP 2: 데이터 준비")
        X_train, X_temp, y_train, y_temp = train_test_split(
            X, y, test_size=0.3, random_state=42, stratify=y
        )
        X_val, X_test, y_val, y_test = train_test_split(
            X_temp, y_temp, test_size=0.5, random_state=42, stratify=y_temp
        )

        self.scaler = StandardScaler()
        X_train = self.scaler.fit_transform(X_train)
        X_val = self.scaler.transform(X_val)
        X_test = self.scaler.transform(X_test)

        print(f"Train: {len(X_train)}, Val: {len(X_val)}, Test: {len(X_test)}")

        print("\nSTEP 3: 베이스라인")
        majority_class = np.bincount(y_train).argmax()
        baseline_pred = np.full(len(y_test), majority_class)
        self.baseline_score = f1_score(y_test, baseline_pred, zero_division=0)
        print(f"베이스라인 F1: {self.baseline_score: .4f}")

        print("\nSTEP 4: 모델학습")
        self.model = BinaryClassifier(input_dim=X.shape[1])
        criterion = nn.BCELoss()
        optimizer = optim.Adam(self.model.parameters(), lr=0.001)

        X_train_t = torch.FloatTensor(X_train)
        y_train_t = torch.FloatTensor(y_train).unsqueeze(1)
        X_val_t = torch.FloatTensor(X_val)
        y_val_t = torch.FloatTensor(y_val).unsqueeze(1)

        best_val_loss = float("inf")
        patience_counter = 0

        for epoch in range(50):
            self.model.train()
            optimizer.zero_grad()
            outputs = self.model(X_train_t)
            loss = criterion(outputs, y_train_t)
            loss.backward()
            optimizer.step()

            self.model.eval()
            with torch.no_grad():
                val_outputs = self.model(X_val_t)
                val_loss = criterion(val_outputs, y_val_t)

            if val_loss < best_val_loss:
                best_val_loss = val_loss
                best_model_state = self.model.state_dict()
                patience_counter = 0
            else:
                patience_counter += 1

            if patience_counter >= 10:
                break

        self.model.load_state_dict(best_model_state)
        print("학습완료")

        print("\nSTEP 5: 최종평가")
        self.model.eval()
        X_test_t = torch.FloatTensor(X_test)

        with torch.no_grad():
            y_pred_prob = self.model(X_test_t).numpy().flatten()
            y_pred = (y_pred_prob > 0.5).astype(int)

        test_f1 = f1_score(y_test, y_pred, zero_division=0)
        print(f"테스트 F1: {test_f1: .4f}")
        print(f"베이스라인 대비: {test_f1 - self.baseline_score: .4f}")

        if test_f1 > 0.80:
            print("성공! 목표달성")
        else:
            print("목표미달, 추가개선 필요")

X_proj, y_proj = make_classification(
    n_samples=1000, n_features=20, n_informative=15, weights=[0.65, 0.35], random_state=42
)

pipeline = MLPipeline()
pipeline.run(X_proj, y_proj)


# =====================================================================
# 최종 요약
# =====================================================================
print("\n" + "=" * 70)
print("전체 실습 완료")
print("=" * 70)
print("\n생성된 파일:")
print("  1. result_clustering.png     - 군집화 결과")
print("  2. result_bias_variance.png  - 편향-분산 트레이드오프")
print("  3. result_classification.png - 분류 평가")
print("  4. result_regression.png     - 회귀 평가")
print("\n모든 실습이 정상적으로 완료되었습니다.")
print("=" * 70)

4차시 실습: 인공지능 개론 - 통합실행

[Part 1] 모델 정의 중...
모델 정의 완료

[Part 2] 지도학습 - 분류와 회귀
분류 모델 학습 중...
분류모델 학습완료
회귀모델 학습 중...
회귀모델 학습완료

[Part 3] 비지도학습과 편향-분산
저장: result_clustering.png


  return f(*arrays, *other_args, **kwargs)


저장: result_bias_variance.png

[Part 4] K-Fold 교차검증
K-Fold 평균 Accuracy:  0.9320 (std:  0.0075)

[Part 5] 평가지표 개선
분류 성능: Acc= 0.880, Prec= 0.950, Rec= 0.633, F1= 0.760, AUC= 0.960
저장: result_classification.png
회귀성능: MAE= 12.76, RMSE= 15.62, R2= 0.991
저장: result_regression.png

[Part 6] ML 파이프라인 실행

STEP 1: 문제정의
목표: 고객 이탈 예측 (F1 > 0.80)

STEP 2: 데이터 준비
Train: 700, Val: 150, Test: 150

STEP 3: 베이스라인
베이스라인 F1:  0.0000

STEP 4: 모델학습
학습완료

STEP 5: 최종평가
테스트 F1:  0.7961
베이스라인 대비:  0.7961
목표미달, 추가개선 필요

전체 실습 완료

생성된 파일:
  1. result_clustering.png     - 군집화 결과
  2. result_bias_variance.png  - 편향-분산 트레이드오프
  3. result_classification.png - 분류 평가
  4. result_regression.png     - 회귀 평가

모든 실습이 정상적으로 완료되었습니다.
