#### 1. Пример реализации градиентного бустинга вручную

In [1]:
import numpy as np
from sklearn.tree import DecisionTreeRegressor  # Используем для построения деревьев

from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

np.full_like(X, value, dtype=float) - создать массив такой же формы, как X заполненный значением value (КОПИРУЕТ массив X, можем поменять тип, но принудительно)  
np.full(shape, value, dtype=float) - то же что и full_like(), но без копирования... тут просто указываем форму (вектор - можно одним числом) и тип

In [2]:
np.full(10, 1, float)

array([1., 1., 1., 1., 1., 1., 1., 1., 1., 1.])

#### Алгоритм бустинга:
#### 1. Посчитали базовое предсказание
#### 2. Вычли из y сигмоиду предсказания - это остатки
#### 3. Обучились на таргет == остаткам (там дерево регрессии)
#### 4. Сложили предыдущее предсказание с предиктом текущего дерева, получив новое предсказание
#### 5. ... вычли из y сигмоиду обновленного предсказания - это снова остатки... и по новой

In [3]:
class GradientBoostingClassifier:
    def __init__(self, n_estimators=100, learning_rate=0.1, max_depth=3):
        self.n_estimators = n_estimators
        self.learning_rate = learning_rate
        self.max_depth = max_depth
        self.trees = []
        self.initial_prediction = None
    
    #Встроенный декоратор - в данном случае ничего полезного не добавляет функции
    
    @staticmethod
    def sigmoid(x):
        return 1 / (1 + np.exp(-x))

    def fit(self, X, y):
        
        # Инициализация начального предсказания (логиты)
        
        self.initial_prediction = np.log(np.mean(y) / (1 - np.mean(y)))         # посчитали одно число - базовое предсказание
        predictions = np.full_like(y, self.initial_prediction, dtype=float)     # сделали вектор длинны y этого базового предсказания БАЗОВЫЙ ПРЕДИКТ

        for _ in range(self.n_estimators):
            # Вычисляем градиент (производная log loss)
            residuals = y - self.sigmoid(predictions)                           # 1. Считаем сигмоиду для базовых (обновленных) предсказаний и вычитаем это из реальных значений

            # Обучаем дерево на остатках
            tree = DecisionTreeRegressor(max_depth=self.max_depth)
            tree.fit(X, residuals)                                              # 2. Обучаем дерево предсказывать остатки

            # Обновляем предсказания
            predictions += self.learning_rate * tree.predict(X)                 # 3. К базовому предсказанию прибавляем  (learning_rate * predict дерева)   (обновляем предикт)

            # Сохраняем дерево
            self.trees.append(tree)                                             # тут как бы сохраняем возможность докидывать предсказания по дереву

    def predict_proba(self, X):
        predictions = np.full(X.shape[0], self.initial_prediction, dtype=float)
        for tree in self.trees:
            predictions += self.learning_rate * tree.predict(X)
        return self.sigmoid(predictions)

    def predict(self, X, threshold=0.5):
        proba = self.predict_proba(X)
        return (proba >= threshold).astype(int)                                 # True False превращаем в int

In [4]:
# здесь используется декоратор staticmethod, который позволяет использовать функцию sigmoid без привязки к классу, внутри которого находится функция,
#       т.к. сама функция не зависит от состояния экземпляра

# Функция через экземпляр

gb = GradientBoostingClassifier()
print(gb.sigmoid(10))

# Функция вызывается через класс напрямю

print(GradientBoostingClassifier.sigmoid(10))

0.9999546021312976
0.9999546021312976


In [5]:
# Генерация синтетического датасета
X, y = make_classification(n_samples=1000, n_features=10, random_state=42)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [6]:
# y_train

In [7]:
np.mean(y_train) / (1 - np.mean(y_train))

0.9417475728155339

In [8]:
np.log(np.mean(y_train) / (1 - np.mean(y_train)))

-0.06001800972625304

In [9]:
base_predict = np.full_like(y_train, np.log(np.mean(y_train) / (1 - np.mean(y_train))), dtype=float); # base_predict для трейна

In [22]:
# Вектор ошибок в логитах после вычитания базового предикта из реальных классов

# y_train - GradientBoostingClassifier.sigmoid(np.full_like(y_train, base_predict, dtype=float))

In [11]:
tree = DecisionTreeRegressor(max_depth=3) 

# y_train - sigmoid(базового предикта) - учим первое дерево на ошибках

tree.fit(X_train, y_train - GradientBoostingClassifier.sigmoid(np.full_like(y_train, base_predict, dtype=float)))

DecisionTreeRegressor(max_depth=3)

In [12]:
# после первого эстиматора имеем предикт  как сигмоиду от (суммы базового предикта с предиктом первого дерева * learning_rate)

predict_1 = GradientBoostingClassifier.sigmoid(base_predict + tree.predict(X_train) * 0.1) ; predict_1

array([0.47835279, 0.49787051, 0.47835279, 0.48427275, 0.47401215,
       0.48427275, 0.49341351, 0.49787051, 0.49341351, 0.49787051,
       0.47401215, 0.47401215, 0.47835279, 0.47401215, 0.47401215,
       0.49630806, 0.47401215, 0.49341351, 0.47401215, 0.49787051,
       0.49787051, 0.47401215, 0.47401215, 0.49341351, 0.49787051,
       0.49341351, 0.47835279, 0.49787051, 0.49787051, 0.47401215,
       0.47401215, 0.47835279, 0.47401215, 0.47401215, 0.47401215,
       0.47401215, 0.47401215, 0.47401215, 0.49341351, 0.49787051,
       0.47401215, 0.49341351, 0.47835279, 0.49787051, 0.49341351,
       0.47401215, 0.49341351, 0.47401215, 0.49787051, 0.47835279,
       0.49787051, 0.49787051, 0.48427275, 0.47401215, 0.47401215,
       0.49787051, 0.49787051, 0.49341351, 0.49787051, 0.47401215,
       0.49787051, 0.47835279, 0.49787051, 0.49341351, 0.47401215,
       0.47401215, 0.47835279, 0.49341351, 0.49341351, 0.47401215,
       0.49341351, 0.49787051, 0.47835279, 0.47401215, 0.48427

#### делаем так столько раз, сколько у нас n_estimators

---

In [13]:
# Обучение модели
gb = GradientBoostingClassifier(n_estimators=100, learning_rate=0.1, max_depth=3)
gb.fit(X_train, y_train)

In [18]:
# предикт проба 100 деревьев

gb.predict_proba(X_train)

array([0.22017284, 0.89689873, 0.2226186 , 0.54735117, 0.10945097,
       0.34030343, 0.74319287, 0.89689873, 0.89164519, 0.89362087,
       0.10780149, 0.14109452, 0.2326279 , 0.13342415, 0.10780149,
       0.72024001, 0.10945097, 0.89164519, 0.10780149, 0.85907359,
       0.89735264, 0.13934217, 0.13342415, 0.74319287, 0.89735264,
       0.8931744 , 0.16794295, 0.89362087, 0.89689873, 0.10780149,
       0.10945707, 0.19702561, 0.14109452, 0.19864169, 0.15788252,
       0.10780149, 0.14974301, 0.16374727, 0.8931744 , 0.89689873,
       0.14109452, 0.8931744 , 0.29045004, 0.89362087, 0.65104012,
       0.14109452, 0.89164519, 0.10780149, 0.89689873, 0.21379419,
       0.89689873, 0.85390371, 0.34030343, 0.13342415, 0.13342415,
       0.89689873, 0.89362087, 0.88097693, 0.89689873, 0.13342415,
       0.87847347, 0.3874996 , 0.89689873, 0.83057258, 0.13770207,
       0.13342415, 0.25010528, 0.89164519, 0.8931744 , 0.10945097,
       0.74319287, 0.89689873, 0.39179293, 0.13756956, 0.72908

In [19]:
# первое из деревьев

tree_1 = gb.trees[0]

In [26]:
# предсказание первого дерева

# это совпадает с predict_1 из ручного примера

gb.sigmoid(np.full_like(y_train, np.log(np.mean(y_train) / (1 - np.mean(y_train))), float) + tree_1.predict(X_train) * 0.1) # == predict_1

array([0.47835279, 0.49787051, 0.47835279, 0.48427275, 0.47401215,
       0.48427275, 0.49341351, 0.49787051, 0.49341351, 0.49787051,
       0.47401215, 0.47401215, 0.47835279, 0.47401215, 0.47401215,
       0.49630806, 0.47401215, 0.49341351, 0.47401215, 0.49787051,
       0.49787051, 0.47401215, 0.47401215, 0.49341351, 0.49787051,
       0.49341351, 0.47835279, 0.49787051, 0.49787051, 0.47401215,
       0.47401215, 0.47835279, 0.47401215, 0.47401215, 0.47401215,
       0.47401215, 0.47401215, 0.47401215, 0.49341351, 0.49787051,
       0.47401215, 0.49341351, 0.47835279, 0.49787051, 0.49341351,
       0.47401215, 0.49341351, 0.47401215, 0.49787051, 0.47835279,
       0.49787051, 0.49787051, 0.48427275, 0.47401215, 0.47401215,
       0.49787051, 0.49787051, 0.49341351, 0.49787051, 0.47401215,
       0.49787051, 0.47835279, 0.49787051, 0.49341351, 0.47401215,
       0.47401215, 0.47835279, 0.49341351, 0.49341351, 0.47401215,
       0.49341351, 0.49787051, 0.47835279, 0.47401215, 0.48427

---

In [25]:
# Предсказание
y_pred = gb.predict(X_test)
print("Accuracy:", accuracy_score(y_test, y_pred))

Accuracy: 0.905


![image.png](attachment:a73ac6d5-4fc7-4b21-8988-1b46474707fa.png)

![image.png](attachment:f2e0a853-294b-400a-9827-e08de86f2f12.png)