### Introduction

Dans cette partie nous allons comparer une simple DecisionTree à un modèle combinant plusieurs modèles DecisionTree avec la méthode de bagging. Pour cela nous allons fixer tous les hyperparamètres et ne faire varier que n_estimators pour générer plusieurs modèles. Donc il ne sera pas nécessaire d'implémenter une cross_validation.

La n_estimators_list = [1, 5, 10, 20, 50, 100], sachant que n_estimators=1 est une DecisionTree simple.

### Importation des packages

In [1]:
import pandas as pd
import warnings
warnings.filterwarnings("ignore")

from scripts.prepdata import data_recovery
from scripts.cross_validation import decion_tree_bagging_fit
from scripts.convert_to_latex import inject_table_in_template, remove_pdf_if_exists

### Récupération des données

In [None]:
datasets_list = ['autompg', 'australian', 'balance', 'bupa', 'german', 'iono', 'pima', 'spambase', 'splice', 'vehicle', 'wdbc']

### Création du tableau de résultats

In [3]:
results_df = pd.DataFrame(index = datasets_list)

### Apprentissage des différents modèles avec n_estimators in [1, 5, 10, 20, 50, 100]

In [4]:
n_estimators_list = [1, 5, 10, 20, 50, 100]
for n_estimators in n_estimators_list: 
    n_estimators_list = []
    col_name = f" n = {n_estimators:.1f}"
    for dataset_name in datasets_list:
        dataset = data_recovery(dataset_name)
        x,y = dataset
        n_estimators_list.append(decion_tree_bagging_fit(x, y, n_estimators))
    results_df[col_name] = n_estimators_list


### Conversion du tableau de résultats en tableau latex

In [None]:
results_df.index.name = "Dataset"
results_df = results_df.reset_index()
results_df_latex = results_df.to_latex(
        index=False,
        escape=False,
        column_format="l" + "c"*(results_df.shape[1]-1),
        caption="Decision tree bagging comparison",
        label="tab:results", float_format="%.2f")
remove_pdf_if_exists("docs/decision_tree_combination_performance_results.pdf")
inject_table_in_template(results_df_latex, output_pdf="docs/decision_tree_combination_performance_results.pdf")

✅ Fichier supprimé : decision_tree_combination_performance_results.pdf
✅ Compilation réussie → decision_tree_combination_performance_results.pdf
