*Filière :* ING3 - Tronc commun

*Auteurs :*
**Michael KISUKA** et
**Nivethan SIVANESAN**

*Professeur référent :* 
**TAJINI Badr**

*Année :* 2024-2025

**ESIEE-IT**

# Projet : Classification de fruits avec un arbre de décision

## Phase 1 : Construction d'un classificateur de fruits basé sur des règles

### Objectif
L'objectif de cette phase est de se familiariser avec la construction d'un classificateur de fruits en utilisant des règles simples. Les étapes incluent :
- **Chargement des données** : Comprendre la structure des données de fruits.
- **Préparation des données** : Encodage des caractéristiques catégorielles en valeurs numériques.
- **Construction du modèle** : Instanciation d'un modèle d'arbre de décision et prédiction basée sur des règles.

---

### Étapes

#### 1. Chargement des données de fruits
Le dataset contient des fruits avec des caractéristiques telles que la couleur, la taille et la forme. Ces caractéristiques sont utilisées pour prédire le type de fruit.


In [None]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.preprocessing import LabelEncoder

# Données d'entraînement
attributs = [
    ["Rouge", "Moyenne", "Ronde"],
    ["Jaune", "Allongée", "Courbée"],
    ["Vert", "Moyenne", "Ronde"],
    ["Rouge", "Grande", "Courbée"],
    ["Jaune", "Moyenne", "Ronde"],
    ["Noir", "Allongée", "Courbée"],
    ["Orange", "Moyenne", "Ronde"],
    ["Violet", "Petite", "Ronde"]
]
etiquettes = ["Pomme", "Banane", "Pomme", "Poivron", "Citron", "Aubergine", "Orange", "Raisin"]

#### 2. Préparation des données
Pour améliorer l’apprentissage, on encode les valeurs catégorielles (couleur, taille, forme) en nombres à l'aide de LabelEncoder.

In [None]:
# Encodage des caractéristiques
encoder_couleur = LabelEncoder()
encoder_taille = LabelEncoder()
encoder_forme = LabelEncoder()

couleurs = [fruit[0] for fruit in attributs]
tailles = [fruit[1] for fruit in attributs]
formes = [fruit[2] for fruit in attributs]

couleurs_encode = encoder_couleur.fit_transform(couleurs)
tailles_encode = encoder_taille.fit_transform(tailles)
formes_encode = encoder_forme.fit_transform(formes)

# Transformation en une liste de tuples pour l'entraînement
X_train = list(zip(couleurs_encode, tailles_encode, formes_encode))

# Encodage des étiquettes
encoder_etiquettes = LabelEncoder()
y_train = encoder_etiquettes.fit_transform(etiquettes)

#### 3. Construction du modèle
Un modèle d'arbre de décision est instancié et entraîné sur les données encodées

In [None]:
# Créer et entraîner le modèle
modele = DecisionTreeClassifier()
modele.fit(X_train, y_train)

#### 4. Prédiction avec le modèle
Le modèle est utilisé pour prédire le type de fruit en fonction de nouvelles caractéristiques.

In [None]:
# Faire des prédictions pour de nouveaux fruits
nouveaux_fruits = [
    ["Rouge", "Moyenne", "Ronde"],
    ["Jaune", "Allongée", "Courbée"],
    ["Vert", "Moyenne", "Ronde"],
    ["Noir", "Allongée", "Courbée"],
    ["Violet", "Petite", "Ronde"],
    ["Jaune", "Moyenne", "Ronde"]
]

# Encodage des nouvelles entrées
nouvelles_couleurs = encoder_couleur.transform([fruit[0] for fruit in nouveaux_fruits])
nouvelles_tailles = encoder_taille.transform([fruit[1] for fruit in nouveaux_fruits])
nouvelles_formes = encoder_forme.transform([fruit[2] for fruit in nouveaux_fruits])
X_test = list(zip(nouvelles_couleurs, nouvelles_tailles, nouvelles_formes))

# Prédiction et décodage des résultats
predictions = modele.predict(X_test)
predictions_decode = encoder_etiquettes.inverse_transform(predictions)

# Affichage des résultats
for fruit, prediction in zip(nouveaux_fruits, predictions_decode):
    print(f"Fruit {fruit} -> Prédiction : {prediction}")

### Analyse des résultats
#### 1. Forme des données
attributs : Une liste de caractéristiques (couleur, taille, forme) pour chaque fruit.

etiquettes : Les types de fruits correspondants.

#### 2. Impact des règles
Le modèle est capable de prédire le type de fruit en fonction des caractéristiques fournies.

Les règles sont basées sur des combinaisons de couleur, taille et forme.

#### 3. Remarques
Le modèle peut être amélioré en ajoutant plus de données et en ajustant les hyperparamètres de l'arbre de décision.

L'encodage des caractéristiques catégorielles est essentiel pour que le modèle puisse les traiter.

### Proposition de code

Le code suivant fait en sorte que le code initial qui nous est proposé et qui est assez manuel, soit cette fois-ci plus dynamique.
Ici, au lieu de préntrer les données qui nous permettront de pouvoir deviner le fruit, on proposera à l'utilisateur de lui même entrer les valeurs qu'il souhaite mettre pour que la machine devine son fruit.

Il devra entrer, la couleur du fruit, puis sa forme et en fonction de ces informations, il sera possible ou non de deviner le fruit, s'il est au préalable entré dans la base de donnée avec les valeurs qui le correspondent.

Plus tard, il sera possible d'ajouter une valeur "taille" dans le but de pouvoir affiner un peu plus le code et d'être encore plus précis.
C'est la fonctionnalité que l'on ajoutera.

Il sera aussi possible d'ajouter d'autres fruits supplémentaires dans le but d'enreichir encore davantage notre code.


In [2]:
from sklearn.tree import DecisionTreeClassifier
from sklearn.preprocessing import LabelEncoder

# 📌 Données de fruits (plus de diversité pour un meilleur apprentissage)
attributs = [
    ["Rouge", "Ronde", "Moyenne"],   # Pomme
    ["Jaune", "Allongée", "Grande"], # Banane
    ["Orange", "Ronde", "Moyenne"],  # Orange
    ["Vert", "Ronde", "Petite"],    # Raisin
    ["Violet", "Allongée", "Grande"],  # Aubergine
    ["Jaune", "Ronde", "Moyenne"],   # Citron
    ["Rouge", "Allongée", "Moyenne"], # Poivron rouge
    ["Vert", "Allongée", "Grande"], # Concombre
    ["Noir", "Ronde", "Petite"],    # Mûre
    ["Jaune", "Petite", "Petite"]   # Mirabelle
]  

# 📌 Étiquettes associées aux données
etiquettes = ["Pomme", "Banane", "Orange", "Raisin", "Aubergine", "Citron", "Poivron", "Concombre", "Mûre", "Mirabelle"]

# 📌 Initialisation des encodeurs
encoder_couleur = LabelEncoder()
encoder_taille = LabelEncoder()
encoder_forme = LabelEncoder()
encoder_etiquettes = LabelEncoder()

# 📌 Encodage des attributs
couleurs = [fruit[0] for fruit in attributs]
formes = [fruit[1] for fruit in attributs]
tailles = [fruit[2] for fruit in attributs]

couleurs_encode = encoder_couleur.fit_transform(couleurs)
formes_encode = encoder_forme.fit_transform(formes)
tailles_encode = encoder_taille.fit_transform(tailles)

# 📌 Transformation des données pour l'entraînement
X_train = list(zip(couleurs_encode, formes_encode, tailles_encode))
y_train = encoder_etiquettes.fit_transform(etiquettes)

# 📌 Création et entraînement du modèle
modele = DecisionTreeClassifier()
modele.fit(X_train, y_train)

# ------------------- INTERACTION UTILISATEUR -------------------

print("\n🌟 Bienvenue dans le prédicteur de fruits ! 🌟")

# 📌 Liste des options disponibles
couleurs_possibles = list(encoder_couleur.classes_)
formes_possibles = list(encoder_forme.classes_)
tailles_possible = list(encoder_taille.classes_)

print("\nCouleurs possibles :", ", ".join(couleurs_possibles))
print("Formes possibles :", ", ".join(formes_possibles))
print("Taille possibles :", ", ".join(tailles_possible))

# 📌 Demande interactive à l'utilisateur
while True:
    input_couleur = input("\nEntrez une couleur : ").capitalize()
    input_forme = input("Entrez une forme : ").capitalize()
    input_taille = input("Entrez une taille : ").capitalize()

    # Vérifier si l'entrée est valide
    if input_couleur not in couleurs_possibles:
        print("❌ Couleur non reconnue. Essayez encore.")
        continue
    if input_forme not in formes_possibles:
        print("❌ Forme non reconnue. Essayez encore.")
    if input_taille not in tailles_possible :
        print("❌ Taille non reconnue. Essayez encore.")
        continue

    # 📌 Encoder les entrées utilisateur
    couleur_encode = encoder_couleur.transform([input_couleur])
    forme_encode = encoder_forme.transform([input_forme])
    taille_encode = encoder_taille.transform([input_taille])

    # 📌 Créer le dataset de test
    X_test = list(zip(couleur_encode, forme_encode, taille_encode))

    # 📌 Prédiction
    prediction = modele.predict(X_test)
    prediction_decode = encoder_etiquettes.inverse_transform(prediction)

    # 📌 Affichage du résultat
    print(f"\n🔍 Le fruit prédit est : {prediction_decode[0]} ")

    # 📌 Demander si l'utilisateur veut refaire une prédiction
    retry = input("\nVoulez-vous faire une autre prédiction ? (Oui/Non) : ").strip().lower()
    if retry != "oui":
        print("\nMerci d'avoir utilisé le prédicteur de fruits ! À bientôt 👋")
        break



🌟 Bienvenue dans le prédicteur de fruits ! 🌟

Couleurs possibles : Jaune, Noir, Orange, Rouge, Vert, Violet
Formes possibles : Allongée, Petite, Ronde
Taille possibles : Grande, Moyenne, Petite

🔍 Le fruit prédit est : Citron 

Merci d'avoir utilisé le prédicteur de fruits ! À bientôt 👋


### Explication du code

Ce code est un **classificateur de fruits** basé sur un **arbre de décision** entraîné avec Scikit-learn. Il commence par définir un ensemble de données d'entraînement contenant différentes couleurs, formes et tailles de fruits, associées à leur étiquette (exemple : "Rouge" "Ronde" et "Moyenne" pour "Pomme").  

Les caractéristiques sont ensuite encodées en valeurs numériques à l’aide de `LabelEncoder`, car les modèles de Scikit-learn ne fonctionnent qu’avec des nombres. Après l’encodage, les données sont converties en un format exploitable pour entraîner un `DecisionTreeClassifier`, qui apprend à associer chaque combinaison de couleur et de forme à un type de fruit spécifique.  

Une fois le modèle entraîné, le programme devient interactif. L'utilisateur est invité à entrer une couleur, une forme et une taille parmi une liste définie. Le programme vérifie si ces entrées sont valides, les encode de la même manière que les données d'entraînement, puis utilise le modèle pour prédire quel fruit correspond aux caractéristiques fournies.  

Enfin, la prédiction est affichée sous forme de texte lisible, et l'utilisateur peut choisir de tester une nouvelle combinaison ou de quitter le programme. Cela permet de simuler un système intelligent capable de reconnaître des fruits en fonction de leurs attributs visuels.


### Conclusion

Le début de notre phase nous a permis de comprendre comment construire un classificateur de fruits basé sur des règles simples. 
Après avoir compris notre code, nous avons fait en sorte de le dynamiser davantage pour qu'il soit encore plus efficace et utile. 
Finalement, nous avons pu créer un modèle qui permet de deviner chaque fruit qui est au préalable incorporer dans notre liste à partir de sa couleur, sa forme et sa taille.