In [1]:
from sklearn.ensemble import StackingClassifier
from sklearn.datasets import load_breast_cancer
from sklearn.linear_model import LogisticRegression
from sklearn.linear_model import SGDClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score


import warnings
warnings.filterwarnings("ignore")

In [2]:
data = load_breast_cancer()
data

{'data': array([[1.799e+01, 1.038e+01, 1.228e+02, ..., 2.654e-01, 4.601e-01,
         1.189e-01],
        [2.057e+01, 1.777e+01, 1.329e+02, ..., 1.860e-01, 2.750e-01,
         8.902e-02],
        [1.969e+01, 2.125e+01, 1.300e+02, ..., 2.430e-01, 3.613e-01,
         8.758e-02],
        ...,
        [1.660e+01, 2.808e+01, 1.083e+02, ..., 1.418e-01, 2.218e-01,
         7.820e-02],
        [2.060e+01, 2.933e+01, 1.401e+02, ..., 2.650e-01, 4.087e-01,
         1.240e-01],
        [7.760e+00, 2.454e+01, 4.792e+01, ..., 0.000e+00, 2.871e-01,
         7.039e-02]]),
 'target': array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 1,
        0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0,
        0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 0, 1, 0, 0, 1, 1, 1, 1, 0, 1, 0, 0,
        1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 0, 0,
        1, 1, 1, 0, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 1, 0, 1, 1, 0, 1,
        1, 1, 1, 1, 1, 1, 1, 0, 0, 0, 1, 0, 0, 1, 1, 1, 0

#Обираємо Х,у для датасету та розбиваємо датасет на навчальну та тренувальну  вибірки

In [3]:
X, y = load_breast_cancer(return_X_y=True)

In [4]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

  ### StackingClassifier
  (стекінг-використовуються кілька неоднорідних алгоритмів, а результати їхнього навчання подаються на вхід певної мета-моделі, що і видає остаточний прогноз)

In [5]:
estimators = [('lg', LogisticRegression(max_iter=10000)), ('dt', DecisionTreeClassifier())]

In [16]:
sc = StackingClassifier(estimators=estimators,final_estimator=SVC())

In [17]:
#Навчаємо модель
sc.fit(X_train, y_train)

In [18]:
y_pred = sc.predict(X_test)

In [19]:
sc_acurancy = accuracy_score(y_test, y_pred)
sc_acurancy

0.9707602339181286

In [20]:
sc_recall = recall_score(y_test, y_pred)
sc_recall

0.9814814814814815

In [21]:
sc_precision = precision_score(y_test, y_pred)
sc_precision

0.9724770642201835

In [22]:
sc_f1 = f1_score(y_test, y_pred)
sc_f1

0.9769585253456222

  ### BaggingClassifier
(беггінг-однорідні алгоритми паралельно навчають на різних сетах даних, загальний прогноз отримують усередненням)

In [31]:
from sklearn.ensemble import BaggingClassifier

In [32]:
bs = BaggingClassifier(estimator=DecisionTreeClassifier(), n_estimators=20, random_state=42)

In [33]:
bs.fit(X_train, y_train)

In [34]:
y_pred = bs.predict(X_test)

In [35]:
bs_acurancy = accuracy_score(y_test, y_pred)
bs_acurancy

0.9590643274853801

In [36]:
bs_recall = recall_score(y_test, y_pred)
bs_recall

0.9722222222222222

In [37]:
bs_precision = precision_score(y_test, y_pred)
bs_precision

0.963302752293578

In [38]:
bs_f1 = f1_score(y_test, y_pred)
bs_f1

0.9677419354838711

  ### AdaBoostClassifier
  (адаптивний бустінг- зниження похибки досягається збільшенням ваги об’єктів навчальної вибірки, при оцінці яких була допущена помилка)

In [39]:
from sklearn.ensemble import AdaBoostClassifier

In [40]:
ab =  AdaBoostClassifier(estimator=LogisticRegression(),n_estimators=10, random_state=42)

In [41]:
ab.fit(X_train, y_train)


In [42]:
y_pred = ab.predict(X_test)

In [43]:
ab_acurancy = accuracy_score(y_test, y_pred)
ab_acurancy

0.9707602339181286

In [44]:
ab_recall = recall_score(y_test, y_pred)
ab_recall

0.9814814814814815

In [45]:
ab_precision = precision_score(y_test, y_pred)
ab_precision

0.9724770642201835

In [46]:
ab_f1 = f1_score(y_test, y_pred)
ab_f1

0.9769585253456222

  ### XGBClassifier
  (градієнтний бустінг-знижує похибку шляхом градієнтного спуску: кожен крок алгоритму виконується у напрямку найшвидшого зменшення похибки)

In [47]:
from xgboost import XGBClassifier

In [49]:
xgb=XGBClassifier(booster='gblinear',learning_rate=0.02,n_estimators=100)

In [50]:
xgb.fit(X_train, y_train)


In [51]:
y_pred = xgb.predict(X_test)

In [52]:
xgb_acurancy = accuracy_score(y_test, y_pred)
xgb_acurancy

0.9239766081871345

In [53]:
xgb_recall = recall_score(y_test, y_pred)
xgb_recall

0.9629629629629629

In [54]:
xgb_precision = precision_score(y_test, y_pred)
xgb_precision

0.9203539823008849

In [55]:
xgb_f1 = f1_score(y_test, y_pred)
xgb_f1

0.9411764705882353

  ### Порівняємо результати класифікацій у таблиці

| Класифікація|Accuracy score|Recall score|Precision score|F1 score|
|:---|:---:|:---:|:---:|:---:|
|StackingClassifier|**0.971**|**0.981**|**0.972**|**0.977**|
|BaggingClassifier|0.959|0.972|0.977|0.963|0.968|
|AdaBoostClassifier |**0.971**|**0.981**|**0.972**|**0.977**|
|XGBClassifier|0.924|0.963|0.920|0.941|
