### 1. 부스팅

- 여러 개의 약한 분류기가 순차적으로 학습을 하면서, 앞에서 학습한 분류기가 예측이 틀린 데이터에 대해 다음 분류기가 가중치를 인가해서 학습을 이어 진행하는 방식
- 예측 성능이 뛰어나서 앙상블 학습을 주도하고 있음
- ex) 그래디언부스트, XGBoost, LightGBM
- 배깅은 한 번에 병렬적으로 결과를 얻음
- 부스팅은 순차적으로 진행됨

### 2. IRIS Using ML

In [1]:
from sklearn.datasets import load_iris
iris = load_iris()

In [2]:
from sklearn.preprocessing import StandardScaler

SS = StandardScaler()
SS.fit(iris.data)

X = SS.transform(iris.data)
y = iris.target

In [3]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = \
                        train_test_split(X, y,
                                        test_size=0.3,
                                        random_state=13)

In [4]:
from sklearn.metrics import confusion_matrix, accuracy_score

def get_clf_eval(y_test, pred):
    acc = accuracy_score(y_test, pred)
    confusion = confusion_matrix(y_test, pred)
    
    print('정확도:', acc)
    print('=> 오차 행렬')
    print(confusion)
    print('==========')

In [5]:
# 로지스틱 회귀 기법

from sklearn.linear_model import LogisticRegression

lr_clf = LogisticRegression(random_state=13, solver='liblinear')
lr_clf.fit(X_train, y_train)
lr_pred = lr_clf.predict(X_test)

get_clf_eval(y_test, lr_pred)

정확도: 0.9111111111111111
=> 오차 행렬
[[14  0  0]
 [ 0 10  2]
 [ 0  2 17]]


In [6]:
# 결정나무 기법

from sklearn.tree import DecisionTreeClassifier

dt_clf = DecisionTreeClassifier(random_state=13, max_depth=3)
dt_clf.fit(X_train, y_train)
dt_pred = dt_clf.predict(X_test)

get_clf_eval(y_test, dt_pred)

정확도: 0.9555555555555556
=> 오차 행렬
[[14  0  0]
 [ 0 12  0]
 [ 0  2 17]]


In [7]:
# 랜덤포레스트 기법

from sklearn.ensemble import RandomForestClassifier

rf_clf = RandomForestClassifier(random_state=13, n_jobs=-1,
                               n_estimators=100)
rf_clf.fit(X_train, y_train)
rf_pred = rf_clf.predict(X_test)

get_clf_eval(y_test, rf_pred)

정확도: 0.9555555555555556
=> 오차 행렬
[[14  0  0]
 [ 0 12  0]
 [ 0  2 17]]


In [None]:
# Light GBM 기법

from lightgbm import LGBMClassifier

lgbm_clf = LGBMClassifier(n_estimators=1000, num_leaves=64, 
                         n_jobs=-1, boost_from_average=False)
lgbm_clf.fit(X_train, y_train)
lgbm_pred = lgbm_clf.predict(X_test)

get_clf_eval(y_test, lgbm_pred)