In [3]:
import pandas as pd

def analyser_recettes():
    try:
        # Lecture du fichier CSV
        df = pd.read_csv('DATASET/recipes_data.csv')
        
        # Affichage des informations de base
        print("=== RÉSUMÉ DU DATASET DE RECETTES ===")
        print(f"Nombre total de recettes : {len(df)}")
        print("\nColonnes disponibles :")
        print(df.columns.tolist())
        
        # Aperçu des premières lignes
        print("\nAperçu des 5 premières recettes :")
        print(df.head())
        
        # Statistiques basiques
        print("\nStatistiques descriptives :")
        print(df.describe())
        
        # Valeurs manquantes
        print("\nValeurs manquantes par colonne :")
        print(df.isnull().sum())
        
    except FileNotFoundError:
        print("Erreur : Le fichier recipes_data.csv n'a pas été trouvé dans le dossier DATASET")
    except Exception as e:
        print(f"Erreur lors de l'analyse : {e}")

if __name__ == "__main__":
    analyser_recettes()


=== RÉSUMÉ DU DATASET DE RECETTES ===
Nombre total de recettes : 2231142

Colonnes disponibles :
['title', 'ingredients', 'directions', 'link', 'source', 'NER', 'site']

Aperçu des 5 premières recettes :
                   title                                        ingredients  \
0    No-Bake Nut Cookies  ["1 c. firmly packed brown sugar", "1/2 c. eva...   
1  Jewell Ball'S Chicken  ["1 small jar chipped beef, cut up", "4 boned ...   
2            Creamy Corn  ["2 (16 oz.) pkg. frozen corn", "1 (8 oz.) pkg...   
3          Chicken Funny  ["1 large whole chicken", "2 (10 1/2 oz.) cans...   
4   Reeses Cups(Candy)    ["1 c. peanut butter", "3/4 c. graham cracker ...   

                                          directions  \
0  ["In a heavy 2-quart saucepan, mix brown sugar...   
1  ["Place chipped beef on bottom of baking dish....   
2  ["In a slow cooker, combine all ingredients. C...   
3  ["Boil and debone chicken.", "Put bite size pi...   
4  ["Combine first four ingredients and p

In [6]:
import pandas as pd
import os
from typing import Dict, List, Optional

class RecipeAnalyzer:
    """
    Analyse des recettes
    """
    def __init__(self):
        self.recipes_db = pd.read_csv('DATASET/recipes_transformed.csv')
        
    def get_ingredients(self, meal_name: str) -> Optional[List[str]]:
        """
        Récupère les ingrédients d'un plat depuis le fichier local
        """
        # Recherche du plat (recherche insensible à la casse)
        meal_match = self.recipes_db[self.recipes_db['Plat'].str.lower() == meal_name.lower()]
        
        if not meal_match.empty:
            # Prendre la première correspondance
            ingredients_str = meal_match.iloc[0]['Ingrédients']
            if pd.notna(ingredients_str):
                # Les ingrédients sont déjà au format souhaité, séparés par |
                return ingredients_str.split(' | ')
        return None

    def analyser_dataset(self):
        """
        Analyse du dataset existant et enrichissement avec les ingrédients
        """
        try:
            # Lecture du dataset original des plats populaires
            df = pd.read_csv('DATASET/plats_populaires_mondial.csv')
            print(f"Dataset chargé : {len(df)} plats trouvés")
            
            # Création du dictionnaire des recettes
            recettes_detaillees = {}
            
            for index, row in df.iterrows():
                plat = row['Plat']
                pays = row['Pays']
                print(f"\nAnalyse de {plat} ({pays})")
                
                # Recherche des ingrédients dans notre base de données locale
                ingredients = self.get_ingredients(plat)
                if ingredients:
                    recettes_detaillees[plat] = {
                        'Pays': pays,
                        'Catégorie': row['Catégorie'],
                        'Ingrédients': ingredients,
                        'Nombre_Ingrédients': len(ingredients)
                    }
                else:
                    print(f"Aucun ingrédient trouvé pour {plat}")
            
            # Création du nouveau dataset enrichi
            resultats = []
            for plat, details in recettes_detaillees.items():
                resultats.append({
                    'Plat': plat,
                    'Pays': details['Pays'],
                    'Catégorie': details['Catégorie'],
                    'Ingrédients': ' | '.join(details['Ingrédients']),
                    'Nombre_Ingrédients': details['Nombre_Ingrédients']
                })
            
            # Création du nouveau DataFrame
            df_enrichi = pd.DataFrame(resultats)
            
            # Sauvegarde du nouveau dataset
            output_path = 'DATASET/plats_populaires_ingredients.csv'
            df_enrichi.to_csv(output_path, index=False, encoding='utf-8-sig')
            
            print(f"\nAnalyse terminée. Résultats sauvegardés dans {output_path}")
            print("\nAperçu des résultats :")
            print(df_enrichi[['Plat', 'Pays', 'Nombre_Ingrédients']].head())
            
            return df_enrichi
            
        except FileNotFoundError:
            print("Erreur : Un des fichiers n'a pas été trouvé dans le dossier DATASET")
            return None
        except Exception as e:
            print(f"Erreur lors de l'analyse : {e}")
            return None

# Exécution
if __name__ == "__main__":
    print("=== ANALYSE DES INGRÉDIENTS DES PLATS POPULAIRES ===")
    analyzer = RecipeAnalyzer()
    df_resultat = analyzer.analyser_dataset()





=== ANALYSE DES INGRÉDIENTS DES PLATS POPULAIRES ===
Dataset chargé : 100 plats trouvés

Analyse de Couscous (FRANCE)

Analyse de Pizza (FRANCE)

Analyse de Steak-frites (FRANCE)

Analyse de Magret de canard (FRANCE)
Aucun ingrédient trouvé pour Magret de canard

Analyse de Blanquette de veau (FRANCE)

Analyse de Boeuf bourguignon (FRANCE)

Analyse de Ratatouille (FRANCE)

Analyse de Cassoulet (FRANCE)

Analyse de Quiche Lorraine (FRANCE)

Analyse de Croque-monsieur (FRANCE)

Analyse de Sushi (JAPON)

Analyse de Ramen (JAPON)

Analyse de Tempura (JAPON)

Analyse de Udon (JAPON)
Aucun ingrédient trouvé pour Udon

Analyse de Tonkatsu (JAPON)

Analyse de Gyoza (JAPON)

Analyse de Okonomiyaki (JAPON)

Analyse de Miso soup (JAPON)

Analyse de Takoyaki (JAPON)

Analyse de Teriyaki (JAPON)

Analyse de Pizza Margherita (ITALIE)

Analyse de Pasta Carbonara (ITALIE)

Analyse de Lasagna (ITALIE)

Analyse de Risotto (ITALIE)

Analyse de Osso Buco (ITALIE)

Analyse de Tiramisu (ITALIE)

Analyse de 

CE QUE NOUS AVONS :

Une base de données complète sur la disponibilité des ingrédients par pays :
Échelle précise (1-10) pour chaque ingrédient
Couverture de 10 pays représentatifs
Prise en compte des variations culturelles et géographiques

Un système de catégorisation des ingrédients :
Légumes, viandes, céréales
Épices et condiments
Produits de base et transformés


SUGGESTIONS POUR LA SUITE :

Ajouter une dimension temporelle :
Évolution des disponibilités
Changements dans les préférences culinaires
Impact des tendances alimentaires modernes

Intégrer des facteurs externes :
Climat et saisonnalité
Facteurs économiques
Influences culturelles

Développer un système de recommandation :
Suggestions de substitutions d'ingrédients
Adaptations de recettes selon la disponibilité locale
Optimisation nutritionnelle des plats