In [1]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.svm import SVC
from sklearn.ensemble import AdaBoostClassifier
from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.metrics import confusion_matrix
from sklearn import metrics

Primeiramente carregamos o dataset de lírios do Scikit Learn, mais informações deste podem ser encontradas em:

https://scikit-learn.org/stable/auto_examples/datasets/plot_iris_dataset.html

In [2]:
iris = datasets.load_iris()

Em seguida separamos os dados carregados em data (X) e target (y). Estes por sua vez são divididos em conjunto de treinamento e de teste com uma proporção de 60% para o primeiro e 40% para o segundo.

In [3]:
X = iris.data
y = iris.target

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4)

Então, criamos o classificador com Adaboost, o **AdaboostClassfier** tem um DecisionTreeClassifier com profundidade 1 como seu classificador padrão. Porém é possível utilizar outros classificadores como será mostrado mais adiante.

Para mais informações sobre o **AdaboostClassifier**:

https://scikit-learn.org/stable/modules/generated/sklearn.ensemble.AdaBoostClassifier.html

In [4]:
ab_classifier = AdaBoostClassifier(DecisionTreeClassifier(max_depth=1),
                                   n_estimators=50,
                                   learning_rate=1)

Por fim, treinamos o classificador criado com o conjunto de treinamento e o utilizamos para realizar a predição do conjunto de testes.

In [5]:
model = ab_classifier.fit(X_train, y_train)

y_pred = model.predict(X_test)

Para comparação, todo o procedimento anterior foi realizado com o mesmo classificador mas sem Adaboost:

In [6]:
dt = DecisionTreeClassifier(max_depth=1)
dt_model = dt.fit(X_train, y_train)
y_pred_dt = dt_model.predict(X_test)

Abaixo são calculadas a acurácia e a matriz de confusão geradas pelos modelos:

In [7]:
from sklearn.model_selection import cross_val_score

print("Matriz de Confusão sem Adaboost:")
print(confusion_matrix(y_test, y_pred_dt))

print("Matriz de Confusão sem Adaboost:")
print(confusion_matrix(y_test, y_pred))

print("Acurácia sem Adaboost:", metrics.accuracy_score(y_test, y_pred_dt))
print("Acurácia com Adaboost:", metrics.accuracy_score(y_test, y_pred))

Matriz de Confusão sem Adaboost:
[[16  0  0]
 [ 0 19  0]
 [ 0 25  0]]
Matriz de Confusão sem Adaboost:
[[16  0  0]
 [ 0 19  0]
 [ 0  6 19]]
Acurácia sem Adaboost: 0.5833333333333334
Acurácia com Adaboost: 0.9


Como é possível observar, a adição do Adaboost ao classificador melhora muito sua eficiência.

Além disso, abaixo é mostrada a utilização do Adaboost, porém com outro tipo de classificador.

In [8]:
svc = SVC(probability=True, kernel='linear')

# Create adaboost classifer object
ab_classifier = AdaBoostClassifier(svc,
                                   n_estimators=50,
                                   learning_rate=1)
# Train Adaboost Classifer
model = ab_classifier.fit(X_train, y_train)

#Predict the response for test dataset
y_pred = model.predict(X_test)

In [9]:
print("Matriz de Confusão do SVC com Adaboost:")
print(confusion_matrix(y_test, y_pred))

print("Acurácia do SVC com Adaboost:", metrics.accuracy_score(y_test, y_pred))

Matriz de Confusão do SVC com Adaboost:
[[16  0  0]
 [ 0 18  1]
 [ 0  1 24]]
Acurácia do SVC com Adaboost: 0.9666666666666667
