# Discrete Adaboost

Entrées:
- un jeu d'entrainement $(x_i,y_i)\in\big(\mathbb{R}^d\times\{-1,1\}\big)^{n}$
- un jeu de poids initial $w_{1,1},\ldots,w_{n,1}$
- Une fonction d'erreur $E(f(x),y_i)=e^{-y_if(x_i)}$
- Des apprenants faibles $h:x\rightarrow\{-1,1\}$

## L'algorithme Adaboost

- Pour $t$ allant de $1$ à $T$:

1. Trouver l'apprenant faible $h_t(x)$ qui minimise $\epsilon_t$, la somme des erreurs pondérées des points mal classés $\epsilon_t=\sum_{i=1,\,h_t(x_i)\neq{}y_i} w_i,t$
  
2. Mise à jour de l'ensemble:

$$F_t(x) = F_{t-1}(x) + \alpha_t\cdot{}h_t(x)$$
où $\alpha_t = \dfrac{1}{2}\cdot{}\mathrm{ln} \Big( \dfrac{1-\epsilon_t}{\epsilon_t} \Big)$

3. Mise à joue des poids

Pour tout $i$ allant de $1$ à $n$, le poids à l'itération suivante devient:

$$ w_{i,t+1} = w_i\cdot{}e^{-y_i\alpha_i{}h_t(x_i)} $$

Nous le renormalisons de sorte que la somme des poids pour une itération donnée vaille 1.

---


In [4]:
from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# 1. Generate synthetic binary classification data
X, y = make_classification(n_samples=1000, n_features=20, n_informative=15,
                           n_redundant=5, random_state=42)

# 2. Split into train and test sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 3. Create a weak learner (decision stump)
base_estimator = DecisionTreeClassifier(max_depth=1)

# 4. Create AdaBoost classifier using the decision stump
adaboost = AdaBoostClassifier(
    estimator=base_estimator,
    n_estimators=50,
    learning_rate=1.0
   # algorithm='SAMME'  # Discrete AdaBoost
)

# 5. Train the AdaBoost model
adaboost.fit(X_train, y_train)

# 6. Predict on test set
y_pred = adaboost.predict(X_test)

# 7. Evaluate
accuracy = accuracy_score(y_test, y_pred)
print(f"Test Accuracy: {accuracy:.2f}")


Test Accuracy: 0.84
