In [1]:
# Импортируем необходимые библиотеки
import seaborn as sns
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder

# Загружаем датасет пингвинов
penguins = sns.load_dataset('penguins')

# Удаляем строки с отсутствующими значениями
penguins = penguins.dropna()

# Кодируем категориальные переменные
le_species = LabelEncoder()
penguins['species'] = le_species.fit_transform(penguins['species'])

# Выбираем признаки и целевую переменную
X = penguins.drop(columns=['species', 'island', 'sex'])
y = penguins['species']

# Разделяем данные на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Выводим пример данных
penguins.head()

Unnamed: 0,species,island,bill_length_mm,bill_depth_mm,flipper_length_mm,body_mass_g,sex
0,0,Torgersen,39.1,18.7,181.0,3750.0,Male
1,0,Torgersen,39.5,17.4,186.0,3800.0,Female
2,0,Torgersen,40.3,18.0,195.0,3250.0,Female
4,0,Torgersen,36.7,19.3,193.0,3450.0,Female
5,0,Torgersen,39.3,20.6,190.0,3650.0,Male


In [2]:
# Импортируем библиотеку для баггинга
from sklearn.ensemble import BaggingClassifier
from sklearn.metrics import accuracy_score
import time

# Баггинг
start_time_bagging = time.time()
bagging = BaggingClassifier(n_estimators=100, random_state=42)
bagging.fit(X_train, y_train)
y_pred_bagging = bagging.predict(X_test)
accuracy_bagging = accuracy_score(y_test, y_pred_bagging)
end_time_bagging = time.time()
bagging_time = end_time_bagging - start_time_bagging

# Выводим результаты баггинга
print(f"Баггинг: точность = {accuracy_bagging:.4f}, время работы = {bagging_time:.4f} сек")

Баггинг: точность = 0.9900, время работы = 0.1243 сек


In [3]:
# Импортируем библиотеку для бустинга
from sklearn.ensemble import GradientBoostingClassifier

# Бустинг
start_time_boosting = time.time()
boosting = GradientBoostingClassifier(n_estimators=100, random_state=42)
boosting.fit(X_train, y_train)
y_pred_boosting = boosting.predict(X_test)
accuracy_boosting = accuracy_score(y_test, y_pred_boosting)
end_time_boosting = time.time()
boosting_time = end_time_boosting - start_time_boosting

# Выводим результаты бустинга
print(f"Бустинг: точность = {accuracy_boosting:.4f}, время работы = {boosting_time:.4f} сек")

Бустинг: точность = 0.9900, время работы = 0.2471 сек


In [5]:
# Сравнение результатов по точности и времени
print(f"Баггинг: точность = {accuracy_bagging:.4f}, время работы = {bagging_time:.4f} сек")
print(f"Бустинг: точность = {accuracy_boosting:.4f}, время работы = {boosting_time:.4f} сек")

# Сравниваем по точности
if accuracy_bagging > accuracy_boosting:
    print(f"Баггинг показал лучшую точность: {accuracy_bagging:.4f} против {accuracy_boosting:.4f}")
elif accuracy_boosting > accuracy_bagging:
    print(f"Бустинг показал лучшую точность: {accuracy_boosting:.4f} против {accuracy_bagging:.4f}")
else:
    print(f"Точность моделей одинаковая: {accuracy_bagging:.4f}")

# Сравниваем по времени
if bagging_time < boosting_time:
    print(f"Баггинг быстрее: {bagging_time:.4f} сек против {boosting_time:.4f} сек")
else:
    print(f"Бустинг быстрее: {boosting_time:.4f} сек против {bagging_time:.4f} сек")

Баггинг: точность = 0.9900, время работы = 0.1243 сек
Бустинг: точность = 0.9900, время работы = 0.2471 сек
Точность моделей одинаковая: 0.9900
Баггинг быстрее: 0.1243 сек против 0.2471 сек
