In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import make_moons, make_circles, make_blobs

In [None]:
# jeux de données
datasets = [
    make_moons(noise=0.3, random_state=0),
    make_circles(noise=0.2, factor=0.5, random_state=1),
    make_blobs(n_samples=100, centers=2, n_features=2, center_box=(0, 20), random_state=0)
]

In [None]:
# Classe pour l'arbre de décision
class ArbreDeDecision:
    def __init__(self, critere='gini'):
        self.critere = critere
        self.arbre = None

    def valider_entre(self, X, y):
        if X.size == 0 or y.size == 0:
            raise ValueError("Les données X ou y ne peuvent pas être vides.")
        if len(X) != len(y):
            raise ValueError("X et y doivent avoir la même longueur.")
        
    def calculer_impurete(self, comptages):
        total = sum(comptages)
        if self.critere == 'gini':
            impurete = 1 - sum((compte / total) ** 2 for compte in comptages)
        elif self.critere == 'entropie':
            impurete = -sum((compte / total) * np.log2(compte / total) if compte != 0 else 0 for compte in comptages)
        else:
            raise ValueError("Critère invalide. Choisissez 'gini' ou 'entropie'.")
        return impurete
    
    def diviser_jeu_de_donnees(self, X, y, indice_caracteristique, seuil):
        indices_gauche = np.where(X[:, indice_caracteristique] <= seuil)[0]
        indices_droite = np.where(X[:, indice_caracteristique] > seuil)[0]
        X_gauche, y_gauche = X[indices_gauche], y[indices_gauche]
        X_droite, y_droite = X[indices_droite], y[indices_droite]
        return X_gauche, y_gauche, X_droite, y_droite

