Le classement de popularité par pays utilise (TasteAtlas) :

In [1]:
import os
import pandas as pd
import numpy as np
from typing import List, Dict

def creer_dataset_cuisine_complet():
    """
    Création d'un dataset enrichi des plats populaires pour 10 pays
    avec classement de 1 à 10 pour chaque plat
    """
    
    # Structure de données
    data = {
        'Pays': [],
        'Plat': [],
        'Classement': [],  # Classement de 1 à 10
        'Catégorie': []    # Type de plat
    }
    
    # Données complètes pour les 10 pays avec classement
    plats_par_pays = {
        "FRANCE": [
            ("Couscous", "Plat principal", 1),
            ("Pizza", "Fast-food", 2),
            ("Steak-frites", "Plat principal", 3),
            ("Magret de canard", "Viande", 4),
            ("Blanquette de veau", "Viande", 5),
            ("Boeuf bourguignon", "Viande", 6),
            ("Ratatouille", "Végétarien", 7),
            ("Cassoulet", "Plat principal", 8),
            ("Quiche Lorraine", "Tarte salée", 9),
            ("Croque-monsieur", "Sandwich", 10)
        ],
        "JAPON": [
            ("Sushi", "Poisson", 1),
            ("Ramen", "Nouilles", 2),
            ("Tempura", "Friture", 3),
            ("Udon", "Nouilles", 4),
            ("Tonkatsu", "Viande", 5),
            ("Gyoza", "Entrée", 6),
            ("Okonomiyaki", "Street-food", 7),
            ("Miso soup", "Soupe", 8),
            ("Takoyaki", "Street-food", 9),
            ("Teriyaki", "Sauce", 10)
        ],
        "ITALIE": [
            ("Pizza Margherita", "Pizza", 1),
            ("Pasta Carbonara", "Pâtes", 2),
            ("Lasagna", "Pâtes", 3),
            ("Risotto", "Riz", 4),
            ("Osso Buco", "Viande", 5),
            ("Tiramisu", "Dessert", 6),
            ("Gnocchi", "Pâtes", 7),
            ("Pesto alla Genovese", "Sauce", 8),
            ("Pasta all'Arrabbiata", "Pâtes", 9),
            ("Vitello Tonnato", "Viande", 10)
        ],
        "CHINE": [
            ("Dim Sum", "Entrée", 1),
            ("Canard laqué de Pékin", "Volaille", 2),
            ("Mapo Tofu", "Végétarien", 3),
            ("Soupe Won ton", "Soupe", 4),
            ("Poulet Kung Pao", "Volaille", 5),
            ("Nouilles Dan Dan", "Nouilles", 6),
            ("Riz frit Yangzhou", "Riz", 7),
            ("Porc au caramel", "Viande", 8),
            ("Boeuf aux oignons", "Viande", 9),
            ("Poulet Général Tso", "Volaille", 10)
        ],
        "MEXIQUE": [
            ("Tacos al Pastor", "Street-food", 1),
            ("Guacamole", "Sauce", 2),
            ("Enchiladas", "Plat principal", 3),
            ("Mole Poblano", "Sauce", 4),
            ("Chiles en Nogada", "Plat principal", 5),
            ("Pozole", "Soupe", 6),
            ("Tamales", "Street-food", 7),
            ("Cochinita Pibil", "Viande", 8),
            ("Quesadillas", "Street-food", 9),
            ("Ceviche", "Poisson", 10)
        ],
        "ESPAGNE": [
            ("Paella Valenciana", "Riz", 1),
            ("Jamón Ibérico", "Charcuterie", 2),
            ("Tortilla Española", "Omelette", 3),
            ("Gazpacho", "Soupe", 4),
            ("Patatas Bravas", "Tapas", 5),
            ("Churros", "Dessert", 6),
            ("Croquetas", "Tapas", 7),
            ("Pulpo a la Gallega", "Fruits de mer", 8),
            ("Albondigas", "Viande", 9),
            ("Calamares Fritos", "Fruits de mer", 10)
        ],
        "GRÈCE": [
            ("Moussaka", "Plat principal", 1),
            ("Souvlaki", "Viande", 2),
            ("Gyros", "Street-food", 3),
            ("Dolmades", "Entrée", 4),
            ("Tzatziki", "Sauce", 5),
            ("Spanakopita", "Tarte salée", 6),
            ("Saganaki", "Fromage", 7),
            ("Pastitsio", "Pâtes", 8),
            ("Baklava", "Dessert", 9),
            ("Greek Salad", "Salade", 10)
        ],
        "INDE": [
            ("Butter Chicken", "Volaille", 1),
            ("Biryani", "Riz", 2),
            ("Tikka Masala", "Curry", 3),
            ("Samosas", "Entrée", 4),
            ("Dal Makhani", "Végétarien", 5),
            ("Naan", "Pain", 6),
            ("Tandoori Chicken", "Volaille", 7),
            ("Palak Paneer", "Végétarien", 8),
            ("Vindaloo", "Curry", 9),
            ("Korma", "Curry", 10)
        ],
        "THAÏLANDE": [
            ("Pad Thai", "Nouilles", 1),
            ("Tom Yum Goong", "Soupe", 2),
            ("Green Curry", "Curry", 3),
            ("Som Tam", "Salade", 4),
            ("Massaman Curry", "Curry", 5),
            ("Pad Kra Pao", "Viande", 6),
            ("Tom Kha Gai", "Soupe", 7),
            ("Red Curry", "Curry", 8),
            ("Pad See Ew", "Nouilles", 9),
            ("Khao Pad", "Riz", 10)
        ],
        "ÉTATS-UNIS": [
            ("Hamburger", "Fast-food", 1),
            ("Hot Dog", "Street-food", 2),
            ("Mac and Cheese", "Comfort-food", 3),
            ("BBQ Ribs", "Viande", 4),
            ("Fried Chicken", "Volaille", 5),
            ("Apple Pie", "Dessert", 6),
            ("Cheeseburger", "Fast-food", 7),
            ("Buffalo Wings", "Entrée", 8),
            ("Clam Chowder", "Soupe", 9),
            ("Philly Cheesesteak", "Sandwich", 10)
        ]
    }
    
    # Génération des données
    for pays, plats in plats_par_pays.items():
        for plat, categorie, classement in plats:
            data['Pays'].append(pays)
            data['Plat'].append(plat)
            data['Classement'].append(classement)
            data['Catégorie'].append(categorie)
    
    # Création du DataFrame
    df = pd.DataFrame(data)
    
    # Vérification et création du dossier DATASET
    dataset_path = "DATASET"
    if not os.path.exists(dataset_path):
        os.makedirs(dataset_path)
        print(f"Dossier {dataset_path} créé")
    
    # Chemin complet du fichier
    nom_fichier = os.path.join(dataset_path, 'plats_populaires_mondial.csv')
    
    # Sauvegarde en CSV dans le dossier DATASET
    df.to_csv(nom_fichier, index=False, encoding='utf-8-sig')
    print(f"\nDataset sauvegardé dans {nom_fichier}")
    
    # Statistiques utiles pour analyse documentaire
    print("\nAperçu des tendances par catégorie :")
    cat_stats = df.groupby('Catégorie').agg({
        'Plat': 'count'
    }).round(2)
    print(cat_stats)
    
    # Statistiques par pays
    print("\nPlats les mieux classés par pays :")
    top_plats = df[df['Classement'] == 1][['Pays', 'Plat', 'Catégorie']]
    print(top_plats)
    
    print("\nDistribution des catégories par pays :")
    pays_cat = pd.crosstab(df['Pays'], df['Catégorie'])
    print(pays_cat)
    
    return df

# Exécution
if __name__ == "__main__":
    print("=== GÉNÉRATION DU DATASET CULINAIRE MONDIAL ===")
    df = creer_dataset_cuisine_complet()


=== GÉNÉRATION DU DATASET CULINAIRE MONDIAL ===

Dataset sauvegardé dans DATASET/plats_populaires_mondial.csv

Aperçu des tendances par catégorie :
                Plat
Catégorie           
Charcuterie        1
Comfort-food       1
Curry              6
Dessert            4
Entrée             5
Fast-food          3
Friture            1
Fromage            1
Fruits de mer      2
Nouilles           5
Omelette           1
Pain               1
Pizza              1
Plat principal     6
Poisson            2
Pâtes              5
Riz                5
Salade             2
Sandwich           2
Sauce              5
Soupe              7
Street-food        7
Tapas              2
Tarte salée        2
Viande            13
Volaille           6
Végétarien         4

Plats les mieux classés par pays :
          Pays               Plat       Catégorie
0       FRANCE           Couscous  Plat principal
10       JAPON              Sushi         Poisson
20      ITALIE   Pizza Margherita           Pizza
30     