# 🧮 ADSP 정리 07 - 분류 모델 (Classification Models)

## 1. 분류 모델이란?

- 입력 데이터를 여러 카테고리 중 하나로 분류하는 모델
- 주요 알고리즘:
  - 의사결정트리 (Decision Tree)
  - 나이브 베이즈 (Naive Bayes)
  - 로지스틱 회귀 (Logistic Regression)

## 2. 의사결정트리 (Decision Tree)

- 데이터 속성의 조건을 기준으로 가지(branch)를 나누며 분류
- 장점: 해석이 쉽고 시각화 가능
- 단점: 과적합 위험, 작은 변화에도 결과가 크게 변할 수 있음

In [5]:
from sklearn.datasets import load_iris
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 데이터 준비
iris = load_iris()
X = iris.data
y = iris.target

# 학습/테스트 데이터 분할
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 모델 생성 및 학습
dt = DecisionTreeClassifier(random_state=42)
dt.fit(X_train, y_train)

# 예측 및 정확도 평가
y_pred = dt.predict(X_test)
acc = accuracy_score(y_test, y_pred)
print(f"Decision Tree Test Accuracy: {acc:.2f}")

Decision Tree Test Accuracy: 1.00


## 3. 나이브 베이즈 (Naive Bayes)

- 베이즈 정리를 기반으로 한 확률 분류기
- 독립 가정(각 특성이 서로 독립이라는 가정)을 전제로 함
- 장점: 빠르고 효율적, 소량 데이터에 강함
- 단점: 독립 가정이 현실에 맞지 않을 수 있음

In [7]:
from sklearn.naive_bayes import GaussianNB

# 모델 생성 및 학습
nb = GaussianNB()
nb.fit(X_train, y_train)

# 예측 및 정확도 평가
y_pred_nb = nb.predict(X_test)
acc_nb = accuracy_score(y_test, y_pred_nb)
print(f"Naive Bayes Test Accuracy: {acc_nb:.2f}")

Naive Bayes Test Accuracy: 0.98
