### Support Vector Machine(SVM)

| 알고리즘 | 유형 | 주요 특징 | 주요 하이퍼파라미터 |
|-----------|--------|------------|-------------------------|
| **SVM (Support Vector Machine)** | 분류/회귀 | 고차원 데이터에 유리, 마진 최대화, 커널로 비선형 문제 해결 가능 | `C`, `kernel` (`linear`, `rbf`, `poly` 등), `gamma`|

### 머신러닝 모델 개발 및 평가 단계 (전체 흐름도) <br>
<center>
[1. 데이터 준비 및 X,y 생성]<br>
        ↓<br>
[2. 학습/검증용 데이터 분할 (Train/Test Split)]<br>
        ↓<br>
[3. 전처리 및 모델 pipeline 만들기]
        ↓<br>
[4. 하이퍼파라미터 탐색 및 모델 튜닝 (GridSearchCV)]<br>
        ↓<br>
[5. 모델 학습 (Fit)]<br>
        ↓<br>
[6. 학습 결과 평가 (Best Params, Score)]<br>
        ↓<br>
[7. 테스트셋 최종 평가 (Best Estimator Predict)]
</center>

#### 1. 데이터 준비 및 X,y 생성

In [1]:
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
X, y = load_breast_cancer(return_X_y=True)

#### 2. 학습/검증용 데이터 분할 (Train/Test Split)

In [2]:
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=1)

#### 3. 전처리 및 모델 pipeline 만들기

In [None]:
# SVM : Feature scaling/One Hot Encoding 전처리.
pipeline = Pipeline([
    ("scaler", StandardScaler()), 
    ("svm", SVC(random_state=0, probability=True))
])

#### 4. 하이퍼파라미터 탐색 및 모델 튜닝 (GridSearchCV)

In [None]:
params = {
    "svm__kernel": ["linear", "rbf",  "poly", "sigmoid"],
    "svm__C": [0.01, 0.1, 1, 10, 100], 
    "svm__gamma": [0.01, 0.1, 1, 10, 100], 
}

gs = GridSearchCV(
    pipeline, 
    params,
    scoring=["accuracy", "roc_auc", "average_precision"], 
    refit="accuracy", #accuracy로 판단할거야.
    cv=4,
    n_jobs=-1
)

#### 5. 모델 학습 (Fit)

In [None]:
gs.fit(X_train, y_train)

#### 6. 학습 결과 평가 (Best Params, Score)

In [None]:
gs.best_score_
gs.best_params_

#### 7. 테스트셋 최종 평가 (Best Estimator Predict)

gs.best_estimator_