# Ensemble Basics II : Boosting

**실습 전 복습사항**
1. adaboost를 **얼추** 안다.
2. gradientboost를 **얼추** 안다.

**실습 목표**

1. adaboost를 적용해본다.
2. gradientboost를 적용해본다.
2. XGboost를 적용해본다.
3. randomforest와 각각의 모든 알고리즘 성능을 비교해본다.


**실습 데이터**
* Fashion MNIST 
* MNIST (H.W maybe)


Q. 앙상블의 영역에 온다는 것은 어디에 더 무게추가 기울어져 있을까?

'설명과 해석'   &   '예측 정확도'

---------------------------
Rayleigh Kim <br>
biz.rayleigh@gmail.com


## 1. Adaboost

### 쉬운 데이터에서 일단 사용법을 익히자!

[쉬운데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)로 간다!

![sepal과 petal](https://www.math.umd.edu/~petersd/666/html/iris_with_labels.jpg)

아이리스 데이터!

In [None]:
import time
from sklearn.datasets import load_iris

# 아이리스 데이터셋
iris = load_iris()

In [None]:
iris

In [None]:
# 사용할 것 불러오고!
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import AdaBoostClassifier
from sklearn import metrics

import matplotlib.pyplot as plt
import numpy as np

In [None]:
# 사용할 모델 선언하고!

dtclf_2 = DecisionTreeClassifier(max_depth=2)

dtclf_n = DecisionTreeClassifier(max_depth=None)

abclf_2 = AdaBoostClassifier( DecisionTreeClassifier(max_depth=2), # 사용할 분류 모델 여기에 두자.
                          n_estimators= 100) # 총 몇번 만들래?

abclf_n = AdaBoostClassifier( DecisionTreeClassifier(max_depth=None), # 사용할 분류 모델 여기에 두자.
                          n_estimators= 100) # 총 몇번 만들래?

In [None]:
# 학습을 시킨다!
t1 = time.clock()

dtclf_2.fit(iris.data, iris.target)

t2 = time.clock()

abclf_2.fit(iris.data, iris.target)

t3 = time.clock()

dtclf_n.fit(iris.data, iris.target)

t4 = time.clock()

abclf_n.fit(iris.data, iris.target)

t5 = time.clock()

print("depth 2 나무 학습소요시간 : ", t2-t1)
print("depth 2 adaboost 학습소요시간 : ", t3-t2)
print("depth nonlimited 나무 학습소요시간 : ", t4-t3)
print("depth nonlimited adaboost 학습소요시간 : ", t5-t4)

In [None]:
# depth=2 adaboost안에 나무는 몇그루?

print("총 {}그루".format(len(abclf_2.estimators_)))
print(abclf_2.estimators_)

In [None]:
# depth=None adaboost안에 나무는 몇그루?

print("총 {}그루".format(len(abclf_n.estimators_)))
print(abclf_n.estimators_)

In [None]:
## Bonus

errors = []

for predicted in abclf_2.staged_predict(iris.data) :
    errors.append( 1. - metrics.accuracy_score(predicted, iris.target))
    
plt.plot(range(1, len(abclf_2)+1),
        errors, c = 'black',
        linestyle = 'dashed')
plt.ylabel('Error')
plt.xlabel('the Number of Trees')
plt.show()

In [None]:
# 시각화를 위하여..
from sklearn.tree import export_graphviz

export_graphviz(abclf_2.estimators_[0], out_file = 'first_tree_adaboost.dot', feature_names = iris.feature_names,
               class_names = iris.target_names, rounded = True, proportion = False,
               precision = 3, filled = True)

export_graphviz(abclf_2.estimators_[-1], out_file = 'last_tree_adaboost.dot', feature_names = iris.feature_names,
               class_names = iris.target_names, rounded = True, proportion = False,
               precision = 3, filled = True)

In [None]:
!dot -Tpng first_tree_adaboost.dot -o first_tree_adaboost.png -Gdpi=600
!dot -Tpng last_tree_adaboost.dot -o last_tree_adaboost.png -Gdpi=600

In [None]:
from IPython.display import Image
print('adaboost 첫번째 나무')
Image(filename = 'first_tree_adaboost.png', width = 700)

In [None]:
from IPython.display import Image
print('adaboost 마지막 나무')
Image(filename = 'last_tree_adaboost.png', width = 700)

In [None]:
## Bonus

fi = {}
for i in range(len(iris.feature_names)) :
    fi[iris.feature_names[i]] = abclf_2.feature_importances_[i]


print(fi)

features = iris['feature_names']
importances = abclf_2.feature_importances_
indices = np.argsort(importances)

plt.title('Feature Importances')
plt.barh(range(len(indices)), importances[indices], color='b', align='center')
plt.yticks(range(len(indices)), [features[i] for i in indices])
plt.xlabel('Relative Importance')
plt.show()

### Now your turn!

In [None]:
import tensorflow as tf
import random as rd
import matplotlib.pyplot as plt

(train_x, train_y), (test_x, test_y) = tf.keras.datasets.mnist.load_data()

In [None]:
'''
Ctrl+Enter를 이용하여
반복 실행 해보자!
'''

id = rd.randrange(0,10000)

print('id = {}'.format(id))
print('다음 그림은 숫자 {} 입니다.'.format(test_y[id]))
plt.imshow(test_x[id])
plt.show()

In [None]:
# reshape!
train_x_flatten = train_x.reshape([train_x.shape[0],-1])
test_x_flatten = test_x.reshape([test_x.shape[0],-1])

print(train_x_flatten.shape, train_y.shape)

**Q1. Adaboost 분류기를 4개 만드시오.**

* DecisionTreeClassifier를 사용할 것.
    1. max_depth 3
    2. max_depth 5
    3. max_depth 7
    4. max_depth None

* n_estimators 는 300으로 통일

In [None]:
## Your Code



**Q2. Adaboost 분류기를 각각 학습 시키시오.**
1. 실행 시간도 각각 구하시오.
2. train_x_flatten 과 train_y를 이용합니다.

In [None]:
## Your Code



**Q3. export_graphviz를 이용하여 그래프를 두 개 저장합니다.**

* max_depth 5 짜리를 사용하시오.
* 분류기 이름이 abclf라면...
    1. abclf.estimators_[0] 이 첫번째 나무 입니다.
    2. abclf.estimators_[-1] 이 마지막 나무 입니다.

* 다음의 코드를 수정하여 사용하세요.
```
export_graphviz( 여러분의나무, out_file = '파일명.dot', rounded = True, proportion = False,
               precision = 3, filled = True)
```
* 두 모델 전부 저장하세요

In [None]:
## Your Code


**Q4. !dot 명령어를 사용하여 png 파일로 바꾸어봅시다!**

둘 다 바꾸세요.

!dot -Tpng 파일명.dot -o 파일명.png -Gdpi=600

In [None]:
## Your Code


**Q5. 저장한 그래프파일을 불러오세요.**

* 둘 다 각각 합니다.
* 관찰하기 어렵다면 다운로드 받아서 관찰합니다.
* Discussion :
    1. 나무 마다 샘플사이즈는 어떤가요?
    2. 그 샘플들은 원래 데이터랑 같은걸까요?

In [None]:
## Your Code


In [None]:
## Your Code


**Q6. 성능을 봅시다.**

* 두 모델 전부 각각 시행합니다.
* 아래의 코드를 완성시켜 시각화 하면 됩니다.

```
from sklearn import metrics

predicted_y = 여러분의모델.predict(test_x_flatten)

print("Classification report for classifier {} : \n {}\n".format(여러분의모델, metrics.classification_report(test_y, predicted_y)))

print("Classification accuracy : {}".format(metrics.accuracy_score(test_y,predicted_y)))

print("Confusion matrix : \n{}".format(metrics.confusion_matrix(test_y, predicted_y).transpose()))
```
* 성능에 대하여 고민해봅시다.
* 참고
    1. Precision : 2라고 예측한 것 중 정말 2인 비율
    2. Recall : 정말 2 중에서 2라고 예측한 것의 비율
    3. [Confusion Matrix](https://en.wikipedia.org/wiki/Confusion_matrix)


In [None]:
## Your Code



## 2. Gradient Boost

### 쉬운 데이터에서 일단 사용법을 익히자!

[쉬운데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)로 간다!

![sepal과 petal](https://www.math.umd.edu/~petersd/666/html/iris_with_labels.jpg)

아이리스 데이터!

In [None]:
import time
from sklearn.datasets import load_iris

# 아이리스 데이터셋
iris = load_iris()

In [None]:
iris

In [None]:
# 사용할 것 불러오고!
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import GradientBoostingClassifier
from sklearn import metrics

import matplotlib.pyplot as plt
import numpy as np

In [None]:
# 사용할 모델 선언하고!

dtclf_2 = DecisionTreeClassifier(max_depth=2)

dtclf_n = DecisionTreeClassifier(max_depth=None)

gbclf_2 = GradientBoostingClassifier( n_estimators = 100, # 나무 몇그루 쓸꺼야?
                          subsample = 1.0, # 1.0 미만의 소수가 나오면 stochastic 해진다.
                          max_depth = 2 ) # 나무의 깊이!

gbclf_n = GradientBoostingClassifier( n_estimators = 100, # 나무 몇그루 쓸꺼야?
                          subsample = 1.0, # 1.0 미만의 소수가 나오면 stochastic 해진다.
                          max_depth = None ) # 나무의 깊이!


In [None]:
# 학습을 시킨다!
t1 = time.clock()

dtclf_2.fit(iris.data, iris.target)

t2 = time.clock()

gbclf_2.fit(iris.data, iris.target)

t3 = time.clock()

dtclf_n.fit(iris.data, iris.target)

t4 = time.clock()

gbclf_n.fit(iris.data, iris.target)

t5 = time.clock()

print("depth 2 나무 학습소요시간 : ", t2-t1)
print("depth 2 gradientboost 학습소요시간 : ", t3-t2)
print("depth nonlimited 나무 학습소요시간 : ", t4-t3)
print("depth nonlimited gradientboost 학습소요시간 : ", t5-t4)

In [None]:
# depth=2 gradientboost안에 나무는 몇그루?

print("총 {}그루".format(len(gbclf_2.estimators_)))
print(gbclf_2.estimators_)

In [None]:
# depth=None gradientboost안에 나무는 몇그루?

print("총 {}그루".format(len(gbclf_n.estimators_)))
print(gbclf_n.estimators_)

In [None]:
## Bonus

errors = []

for predicted in gbclf_2.staged_predict(iris.data) :
    errors.append( 1. - metrics.accuracy_score(predicted, iris.target))
    
plt.plot(range(1, len(abclf_2)+1),
        errors, c = 'black',
        linestyle = 'dashed')
plt.ylabel('Error')
plt.xlabel('the Number of Trees')
plt.show()

In [None]:
gbclf_2.estimators_[-1]

In [None]:
# 시각화를 위하여..
from sklearn.tree import export_graphviz

export_graphviz(dtclf_2, out_file = 'dt2.dot', feature_names = iris.feature_names,
               class_names = iris.target_names, rounded = True, proportion = False,
               precision = 3, filled = True)


export_graphviz(gbclf_2.estimators_[0][0], out_file = 'first_tree_gboost1.dot', feature_names = iris.feature_names,
               class_names = iris.target_names, rounded = True, proportion = False,
               precision = 3, filled = True)

export_graphviz(gbclf_2.estimators_[0][-1], out_file = 'last_tree_gboost1.dot', feature_names = iris.feature_names,
               class_names = iris.target_names, rounded = True, proportion = False,
               precision = 3, filled = True)

In [None]:
!dot -Tpng dt2.dot -o dt2.png -Gdpi=600
!dot -Tpng first_tree_gboost1.dot -o first_tree_gboost1.png -Gdpi=600
!dot -Tpng last_tree_gboost1.dot -o last_tree_gboost1.png -Gdpi=600

In [None]:
from IPython.display import Image
print('그냥 나무')
Image(filename = 'dt2.png', width = 700)

In [None]:
from IPython.display import Image
print('gradient boost 첫번째 그룹의 첫번째 나무')
Image(filename = 'first_tree_gboost1.png', width = 700)

In [None]:
from IPython.display import Image
print('gradient boost 첫번째 그룹의 마지막 나무')
Image(filename = 'last_tree_gboost1.png', width = 700)

In [None]:
## Bonus

fi = {}
for i in range(len(iris.feature_names)) :
    fi[iris.feature_names[i]] = gbclf_2.feature_importances_[i]


print(fi)

features = iris['feature_names']
importances = gbclf_2.feature_importances_
indices = np.argsort(importances)

plt.title('Feature Importances')
plt.barh(range(len(indices)), importances[indices], color='b', align='center')
plt.yticks(range(len(indices)), [features[i] for i in indices])
plt.xlabel('Relative Importance')
plt.show()

### Now your turn!

In [None]:
import tensorflow as tf
import random as rd
import matplotlib.pyplot as plt

(train_x, train_y), (test_x, test_y) = tf.keras.datasets.mnist.load_data()

In [None]:
'''
Ctrl+Enter를 이용하여
반복 실행 해보자!
'''

id = rd.randrange(0,10000)

print('id = {}'.format(id))
print('다음 그림은 숫자 {} 입니다.'.format(test_y[id]))
plt.imshow(test_x[id])
plt.show()

In [None]:
# reshape!
train_x_flatten = train_x.reshape([train_x.shape[0],-1])
test_x_flatten = test_x.reshape([test_x.shape[0],-1])

print(train_x_flatten.shape, train_y.shape)

**Q1. Gradientboost 분류기를 4개 만드시오.**

* DecisionTreeClassifier를 사용할 것.
    1. max_depth 3
    2. max_depth 5
    3. max_depth 7
    4. max_depth None

* n_estimators 는 300으로 통일

In [None]:
## Your Code



**Q2. Adaboost 분류기를 각각 학습 시키시오.**
1. 실행 시간도 각각 구하시오.
2. train_x_flatten 과 train_y를 이용합니다.

In [None]:
## Your Code



**Q3. export_graphviz를 이용하여 그래프를 두 개 저장합니다.**

* max_depth 5 짜리를 사용하시오.
* 분류기 이름이 gbclf라면...
    1. gbclf.estimators_[-1][0] 이 마지막 그룹의 첫번째 나무 입니다.
    2. gbclf.estimators_[-1][-1] 이 마지막 그룹의 마지막 나무 입니다.

* 다음의 코드를 수정하여 사용하세요.
```
export_graphviz( 여러분의나무, out_file = '파일명.dot', rounded = True, proportion = False,
               precision = 3, filled = True)
```
* 두 모델 전부 저장하세요

In [None]:
## Your Code


**Q4. !dot 명령어를 사용하여 png 파일로 바꾸어봅시다!**

둘 다 바꾸세요.

!dot -Tpng 파일명.dot -o 파일명.png -Gdpi=600

In [None]:
## Your Code


**Q5. 저장한 그래프파일을 불러오세요.**

* 둘 다 각각 합니다.
* 관찰하기 어렵다면 다운로드 받아서 관찰합니다.
* Discussion :
    1. 나무 마다 샘플사이즈는 어떤가요?
    2. 그 샘플들은 원래 데이터랑 같은걸까요?

In [None]:
## Your Code


In [None]:
## Your Code


**Q6. 성능을 봅시다.**

* 두 모델 전부 각각 시행합니다.
* 아래의 코드를 완성시켜 시각화 하면 됩니다.

```
from sklearn import metrics

predicted_y = 여러분의모델.predict(test_x_flatten)

print("Classification report for classifier {} : \n {}\n".format(여러분의모델, metrics.classification_report(test_y, predicted_y)))

print("Classification accuracy : {}".format(metrics.accuracy_score(test_y,predicted_y)))

print("Confusion matrix : \n{}".format(metrics.confusion_matrix(test_y, predicted_y).transpose()))
```
* 성능에 대하여 고민해봅시다.
* 참고
    1. Precision : 2라고 예측한 것 중 정말 2인 비율
    2. Recall : 정말 2 중에서 2라고 예측한 것의 비율
    3. [Confusion Matrix](https://en.wikipedia.org/wiki/Confusion_matrix)


In [None]:
## Your Code



## 3. XGboost


### 쉬운 데이터에서 일단 사용법을 익히자!

[쉬운데이터](https://en.wikipedia.org/wiki/Iris_flower_data_set)로 간다!

![sepal과 petal](https://www.math.umd.edu/~petersd/666/html/iris_with_labels.jpg)

아이리스 데이터!

In [None]:
import time
from sklearn.datasets import load_iris

# 아이리스 데이터셋
iris = load_iris()

In [None]:
iris

**똑같다!**

In [None]:
# 사용할 것 불러오고!
import xgboost as xgb

import matplotlib.pyplot as plt
import numpy as np

In [None]:
# 사용할 모델 선언한다!

xgb_2 = xgb.XGBClassifier(max_depth = 2, n_estimators = 200,
                        learning_rate = 0.01)
xgb_n = xgb.XGBClassifier(max_depth = 10, n_estimators = 200,
                        learning_rate = 0.01)

In [None]:
# 학습을 시킨다!
t1 = time.clock()

xgb_2.fit(iris.data, iris.target)

t2 = time.clock()

xgb_n.fit(iris.data, iris.target)

t3 = time.clock()

print("depth 2 XGBoost 학습소요시간 : ", t2-t1)
print("depth nonlimited XGBoost 학습소요시간 : ", t3-t2)


In [None]:
# Xgradientboost안에 나무는 몇그루?

print("depth 2짜리,  총 {}그루".format(xgb_2.n_estimators))
print("depth 10짜리,  총 {}그루".format(xgb_n.n_estimators))

In [None]:
## Bonus

fi = {}
for i in range(len(iris.feature_names)) :
    fi[iris.feature_names[i]] = xgb_2.feature_importances_[i]


print(fi)

features = iris['feature_names']
importances = xgb_2.feature_importances_
indices = np.argsort(importances)

plt.title('Feature Importances')
plt.barh(range(len(indices)), importances[indices], color='b', align='center')
plt.yticks(range(len(indices)), [features[i] for i in indices])
plt.xlabel('Relative Importance')
plt.show()

In [None]:
from sklearn import metrics

predicted_y = xgb_2.predict(iris.data)

print("Classification report for classifier {} : \n {}\n".format(xgb_2, metrics.classification_report(iris.target, predicted_y)))

print("Classification accuracy : {}".format(metrics.accuracy_score(iris.target,predicted_y)))

print("Confusion matrix : \n{}".format(metrics.confusion_matrix(iris.target, predicted_y).transpose()))

### Now your turn!.. 이지만 따라하는 걸로!

In [None]:
# 처음엔 주석 해제 안하고 그냥 해보자!

# !pip uninstall xgboost
# !pip install xgboost


In [None]:
import xgboost as xgb

In [None]:
xgb.__version__  ## 0.82이상이어야 한다.

In [None]:
import tensorflow as tf
import xgboost as xgb
import random as rd
import matplotlib.pyplot as plt
import time

(train_x, train_y), (test_x, test_y) = tf.keras.datasets.mnist.load_data()

In [None]:
'''
Ctrl+Enter를 이용하여
반복 실행 해보자!
'''

id = rd.randrange(0,10000)

print('id = {}'.format(id))
print('다음 그림은 숫자 {} 입니다.'.format(test_y[id]))
plt.imshow(test_x[id])
plt.show()

In [None]:
# reshape!
train_x_flatten = train_x.reshape([train_x.shape[0],-1])
test_x_flatten = test_x.reshape([test_x.shape[0],-1])

print(train_x_flatten.shape, train_y.shape)

In [None]:
from sklearn.model_selection import train_test_split

train_x_flatten, valid_x_flatten, train_y, valid_y = train_test_split(train_x_flatten, train_y, test_size = 0.1)

In [None]:
## Parameters.

param_list = [ ('max_depth', 6),
             ('subsample', 0.8),
             ('objective', 'multi:softmax'),
             ('eval_metric', 'merror'), # Multiclass Classification Error
             ('num_class', 10)]

# param_list = [ ('max_depth', 6),
#              ('subsample', 0.8),
#              ('objective', 'multi:softmax'),
#              ('eval_metric', 'merror'), # Multiclass Classification Error
#              ('num_class', 10),
#              ('gpu_id', 0),
#              ('tree_method', 'gpu_hist')]


# n_rounds = 600
# early_stopping = 20

n_rounds = 20
early_stopping = 5


## 속도를 위한 데이터 준비
d_train = xgb.DMatrix(train_x_flatten, label = train_y)
d_val = xgb.DMatrix(valid_x_flatten, label = valid_y)
d_test = xgb.DMatrix(data = test_x_flatten)


# 디스플레이할, 평가 재료들.
eval_list = [(d_train, "train"),
            (d_val, 'validation')]



In [None]:
print('training start')

t1 = time.clock()

xgb_d6 = xgb.train(param_list, d_train, n_rounds,
                  evals = eval_list, early_stopping_rounds = early_stopping,
                  verbose_eval = True)

t2 = time.clock()

print('Training Done, {:.5f} secs'.format(t2-t1))

In [None]:
## 예측값 만들기

predicted_y = xgb_d6.predict(d_test)

In [None]:
## 성능 평가해보기

from sklearn import metrics

print("Classification report for classifier {} : \n {}\n".format(xgb_d6, metrics.classification_report(test_y, predicted_y)))

print("Classification accuracy : {}".format(metrics.accuracy_score(test_y,predicted_y)))

print("Confusion matrix : \n{}".format(metrics.confusion_matrix(test_y, predicted_y).transpose()))

**Q1. XGradientboost 분류기를 1개 만드시오.**

* 필요한 라이브러리들을 전부 불러오시오.

In [None]:
## Your Code



**Q2. 데이터를 reshape 하시오.**



In [None]:
## Your Code


**Q3. Validation Set을 준비하시오.**

In [None]:
## Your Code


**Q4. XGBoost를 위한, parameter들, 사전데이터 준비등을 하시오.**

* max_depth는 5를 권장합니다.
* GPU 쓰세요.
* n_rounds는 더 높여도 됩니다.

In [None]:
## Your Code


**Q5. 학습시키고, 시간을 측정하시오**

In [None]:
## Your Code


**Q6. 예측값을 만드시오.**

In [None]:
## Your Code


**Q7. 성능을 봅시다.**

* 두 모델 전부 각각 시행합니다.
* 아래의 코드를 완성시켜 시각화 하면 됩니다.

```
from sklearn import metrics

predicted_y = 여러분의모델.predict(test_x_flatten)

print("Classification report for classifier {} : \n {}\n".format(여러분의모델, metrics.classification_report(test_y, predicted_y)))

print("Classification accuracy : {}".format(metrics.accuracy_score(test_y,predicted_y)))

print("Confusion matrix : \n{}".format(metrics.confusion_matrix(test_y, predicted_y).transpose()))
```
* 성능에 대하여 고민해봅시다.
* 참고
    1. Precision : 2라고 예측한 것 중 정말 2인 비율
    2. Recall : 정말 2 중에서 2라고 예측한 것의 비율
    3. [Confusion Matrix](https://en.wikipedia.org/wiki/Confusion_matrix)


In [None]:
## Your Code



## 4.Random Forest, Adaboost, Gradientboost, XGboost on Fashion MNIST

네 알고리즘 전부, fashion MNIST위에서 실습해보자..!

1. Random Forest
2. Adaboost
3. Gradient Boost
4. XGBoost

Fashion Mnist 데이터 위에서 실습해보자.

Labels:

0 : T-shirt/top  
1 : Trouser  
2 : Pullover  
3 : Dress  
4 : Coat  
5 : Sandal  
6 : Shirt  
7 : Sneaker  
8 : Bag  
9 : Ankle boot

In [None]:
import tensorflow as tf
import random as rd
import matplotlib.pyplot as plt

(train_x, train_y), (test_x, test_y) = tf.keras.datasets.fashion_mnist.load_data()

labels = {0 : 'T-shirt/top',  
1 : 'Trouser'  ,
2 : 'Pullover'  ,
3 : 'Dress' , 
4 : 'Coat'  ,
5 : 'Sandal'  ,
6 : 'Shirt'  ,
7 : 'Sneaker'  ,
8 : 'Bag'  ,
9 : 'Ankle boot'}

In [None]:
'''
Ctrl+Enter를 이용하여
반복 실행 해보자!
'''

id = rd.randrange(0,10000)

print('id = {}'.format(id))
print('다음 그림은 {} 입니다.'.format(labels[test_y[id]]))
plt.imshow(test_x[id])
plt.show()

In [None]:
# reshape!
train_x_flatten = train_x.reshape([train_x.shape[0],-1])
test_x_flatten = test_x.reshape([test_x.shape[0],-1])

print(train_x_flatten.shape, train_y.shape)

**알고리즘 네개를 전부 학습시켜보자!**

1. RandomForest
2. Adaboost
3. Gradient Boost
4. (+Optional)XGBoost


In [None]:
## Your Code