# Цель занятия
На этом занятии мы рассмотрим применение бэггинга.

Бэггинг (bagging) - это метод ансамблирования (англ. ensemble learning), который заключается в построении нескольких независимых моделей на основе случайно выбранных подмножеств обучающих данных с повторениями, и среднее их предсказаний используется как окончательный результат.

Бэггинг на деревьях (англ. bagging decision trees) - это применение метода бэггинга к решающим деревьям. Основная идея заключается в создании нескольких решающих деревьев на основе случайных подмножеств обучающих данных с повторениями. Каждое дерево обучается на своем подмножестве данных, используя критерии останова и разбиения, оптимальные для этого конкретного подмножества. Затем окончательный результат получается усреднением (для задач регрессии) или голосованием (для задач классификации) предсказаний всех деревьев.

Бэггинг на деревьях является эффективным методом ансамблирования, который обычно применяется для снижения дисперсии и уменьшения переобучения. Кроме того, этот метод позволяет использовать параллельные вычисления для ускорения обучения модели.

В sklearn есть возможность задать параметр "max_features", который определяет максимальное количество признаков, которые будут рассмотрены при построении каждого дерева в ансамбле. При задании этого параметра в значение, меньшее, чем общее количество признаков, будет использоваться случайное подмножество признаков для каждого дерева.

**Бэггинг для регрессии**

In [1]:
from sklearn.ensemble import BaggingRegressor
from sklearn.tree import DecisionTreeRegressor
from sklearn.datasets import load_diabetes
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error

In [3]:
# Загрузка датасета
diabetes = load_diabetes()
X, y = diabetes.data, diabetes.target

# Разделение набора данных на обучающий и тестовый наборы
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [4]:
# Определение базового оценщика (решающего дерева регрессии)
base_estimator = DecisionTreeRegressor(random_state=42)

# Определение бэггинг-регрессора
bagging = BaggingRegressor(base_estimator=base_estimator, n_estimators=10, random_state=42)

In [5]:
# Обучение бэггинг-регрессора на обучающем наборе
bagging.fit(X_train, y_train)



In [6]:
# Оценка производительности бэггинг-регрессора на тестовом наборе
y_pred = bagging.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
print("Mean squared error:", mse)

Mean squared error: 3256.961797752809
